03.09.2023, 14:35 | #1 |
F
Регистрация: 09.10.2014
Сообщений: 25,022
|
Картинка из аудио - хоть кто-то пробовал ?
Ну берём raw audio pcm8 ( 8 бит на сэмпл ).
И берём rgb пиксель без альфа-канала ( 8 бит на компоненту цвета RGB ). И из каждых трёх сэмплов аудио делаем один пиксель картинки. Размер картинки можно какой-нибудь условно реалитичный задать - хоть 640 на 480. Ну и заполняем матрицу цветами из сэмплов аудио по три сэмпла на пиксель хоть по строкам , хоть по столбцам.
__________________
Серебряная пуля - дура , а осиновый кол - молодец! Именем его императорского величества объявляю ревизию сему сумасшедшему дому! Нет, Воронов, ты меня не возьмешь! |
03.09.2023, 14:36 | #2 |
F
Регистрация: 09.10.2014
Сообщений: 25,022
|
Ну и получается визуализация аудио для глухих.
Хотя можно и обратный процесс - видео для слепых в виде аудиозаписи. В упор не понимаю зачем это нужно. Лично мне было надо - когда кормил модель нейросети в TensorFlow. Там в примере она была настроена обучаться на последовательности картинок , каждая картинка размером 240x240. Но ведь там "шизомилитаристкое" применение есть - рисунок или карту-схему или фотографию текста с листа бумаги можно передать как "аудиозапись" по "аудиоканалу". ( хоть через громкоговоритель ). И потом восстановить из аудиозаписи видео. - я так с фотографиями пробовал. Ну там можно интереснее химичить - пиксели можно ведь не обязательно "линейно" в матрице размещать , а можно и по кругу. Тогда внешне всё на грампластинку будет похоже.
__________________
Серебряная пуля - дура , а осиновый кол - молодец! Именем его императорского величества объявляю ревизию сему сумасшедшему дому! Нет, Воронов, ты меня не возьмешь! Последний раз редактировалось mumu-and-gerasim; 03.09.2023 в 14:47. |
03.09.2023, 15:03 | #4 | |
F
Регистрация: 09.10.2014
Сообщений: 25,022
|
Цитата:
Оцифрованое аудио с микрофона ( raw audio ) кодируется т.н. сэмплами. Простейший ( но очень низкокачественный ) вариант - 8 бит на сэмпл ( число от 0 до 255 ). Сэмплы идут подряд ( 1 канал - моно ). Такие мелочи как sample rate и т.д. - с этим не заморачиваемся , потому что будем их фиксировать для устройства записи аудио. Получается , что на аудиопоток можно смотреть ( будет похож на царапины на стене ), а фотография может по-настоящему "звучать". ( на музыку будет не очень похоже , а просто будет булькать-шелестеть-трещать-гудеть. В "Необыкновенном концерте" у Аркадия Обломова была фраза: "Человек - это звучит" ). Ну можно открыть графический редактор на компе - написать там внутри кисточкой "нецензурую брань" , сохранить картинку , а потом из картинки сделать "аудиоряд" и воспроизвести это аудио в плеере. ( формат wav с RIFF-заголовком , где указывается 8 bit per sample и задаётся sample rate )
__________________
Серебряная пуля - дура , а осиновый кол - молодец! Именем его императорского величества объявляю ревизию сему сумасшедшему дому! Нет, Воронов, ты меня не возьмешь! Последний раз редактировалось mumu-and-gerasim; 03.09.2023 в 15:10. |
|
03.09.2023, 15:11 | #5 |
F
Регистрация: 22.03.2014
Сообщений: 6,360
|
Со мной когдато учился парень который увликался не стандартной графикой. Он правдаделал картинку из звука, примерно по такой схеме он и работал.
Само по себе интересно и выглядит красиво но по виду картинки нельзя понять какой звук был изначально. Может быть если бы он делал из звука видио(у звука и видео есть протяжонность во времени) было бы более интересно |
03.09.2023, 16:36 | #6 | |
F
Регистрация: 25.03.2023
Сообщений: 4,908
|
Цитата:
В чем смысл??? Вот это я совершенно не могу понять. Похожие проги я видел и раньше, давным давно. Можно было текст или звук встроить в какую-нибудь графическую картинку, а потом с помощью той же проги извлечь всё в исходном виде. Стеганография называется. Правда, если вставлять в картинку звук, то картинка начинала весить подозрительно много. Последний раз редактировалось Бывший; 03.09.2023 в 16:40. |
|
03.09.2023, 16:44 | #8 |
F
Регистрация: 09.10.2014
Сообщений: 25,022
|
Нет - это совсем не аудиодорожка , а собственно изображение. Или "слой" в multi-layer image
__________________
Серебряная пуля - дура , а осиновый кол - молодец! Именем его императорского величества объявляю ревизию сему сумасшедшему дому! Нет, Воронов, ты меня не возьмешь! Последний раз редактировалось mumu-and-gerasim; 04.09.2023 в 17:37. |
03.09.2023, 16:47 | #9 | |
F
Регистрация: 09.10.2014
Сообщений: 25,022
|
Цитата:
Ну там приколы с подавлением помех ещё - в графическом редакторе просто "пиксели шума" убрать. Самое загадочное - передавать картинки ультразвуком под водой.
__________________
Серебряная пуля - дура , а осиновый кол - молодец! Именем его императорского величества объявляю ревизию сему сумасшедшему дому! Нет, Воронов, ты меня не возьмешь! Последний раз редактировалось mumu-and-gerasim; 04.09.2023 в 15:34. |
|
04.09.2023, 03:02 | #10 | |
F
Регистрация: 25.03.2023
Сообщений: 4,908
|
Цитата:
|
|
04.09.2023, 15:22 | #11 | |
F
Регистрация: 09.10.2014
Сообщений: 25,022
|
Цитата:
P.S. Кстати - протяжённость во времени как раз очень просто. Там sample rate на frame per second автоматически отображается. ( ну а программа ffmpeg из последовательности картинок позволяет делать видео. Хоть даже mpeg2 ts. Самое прикольное - делать это на смартфоне с Android. Правда там очень длинная программа получается - почти 24 мегабайта , если использовать ffmpeg toolkit )
__________________
Серебряная пуля - дура , а осиновый кол - молодец! Именем его императорского величества объявляю ревизию сему сумасшедшему дому! Нет, Воронов, ты меня не возьмешь! Последний раз редактировалось mumu-and-gerasim; 04.09.2023 в 15:41. |
|
04.09.2023, 15:26 | #13 |
F
Регистрация: 09.10.2014
Сообщений: 25,022
|
нейросети "хвастаются" , что кота от собаки по таким картинкам могут отличить. ( в учебном примере ). Раз могут отличить кота от собаки - пусть попробуют марш из оперетты от похоронного марша Шопена отличить , например.
( я не утрирую - есть вот задача обучения музыкантов и обнаруживать "фальшиво взятые ноты". В конце-концов ведь обычная задача классификации-кластеризации из AI. И на самом деле ничем не отличается от различения кота от собаки на рисунке. )
__________________
Серебряная пуля - дура , а осиновый кол - молодец! Именем его императорского величества объявляю ревизию сему сумасшедшему дому! Нет, Воронов, ты меня не возьмешь! |
04.09.2023, 15:38 | #14 | |
F
Регистрация: 09.10.2014
Сообщений: 25,022
|
Цитата:
Или даже такая постановка задачи - как понять , что "сигнальная система" является "языком" ( communication language ) ?
__________________
Серебряная пуля - дура , а осиновый кол - молодец! Именем его императорского величества объявляю ревизию сему сумасшедшему дому! Нет, Воронов, ты меня не возьмешь! |
|
04.09.2023, 17:05 | #15 | |
F
Регистрация: 25.03.2023
Сообщений: 4,908
|
Цитата:
|
|
04.09.2023, 17:28 | #16 | |
F
Регистрация: 09.10.2014
Сообщений: 25,022
|
Цитата:
__________________
Серебряная пуля - дура , а осиновый кол - молодец! Именем его императорского величества объявляю ревизию сему сумасшедшему дому! Нет, Воронов, ты меня не возьмешь! |
|
04.09.2023, 17:57 | #18 |
F
Регистрация: 09.10.2014
Сообщений: 25,022
|
просто там намного меньшая "вычислительная мощность" нужна - если картинки анализировать "не-радиотехническими методами". ( не нужно все эти синусы-косинусы и умножения с плавающей точкой ).
__________________
Серебряная пуля - дура , а осиновый кол - молодец! Именем его императорского величества объявляю ревизию сему сумасшедшему дому! Нет, Воронов, ты меня не возьмешь! |
05.09.2023, 01:35 | #21 |
F
Регистрация: 09.10.2014
Сообщений: 25,022
|
Нужна ведь не визуализация сама по себе была , а просто из аудио сделать входные данные для нейросети , которая обучается по последовательностям картинок. А у меня входные данные - звукозаписи. Ну вот и ...
__________________
Серебряная пуля - дура , а осиновый кол - молодец! Именем его императорского величества объявляю ревизию сему сумасшедшему дому! Нет, Воронов, ты меня не возьмешь! |
05.09.2023, 01:43 | #22 |
F
Регистрация: 09.10.2014
Сообщений: 25,022
|
Но данные ведь именно с осциллографа нужны ( хоть там и делается АЦП - ADC ).
Но оцифрованный звук - там как раз АЦП уже сделано. Но с рядами , свёртками , быстрым преобразованием Фурье и прочими радиотехническими радостями ничего делать не хочется , потому что рядом вот она - как бы работающая нейросеть ( к которой лезем через google API. Но там на входе рисунки со всякими пчёлами и прочими тараканами. Но для unsupervised ML ( это когда нет никаких образцов , а как раз нужно выделить то , из чего можно создавать образцы ) ведь всё равно , что там нарисовано. "Источник вдохновения" ведь где-то здесь - https://github.com/tensorflow/tensor...abelImage.java если бы ещё этот источник в... нормально собирался в новой версии TensorFlow ... Там строится т.н. "граф" в терминологии TensorFlow , но используется не Python3 , а Java 11 вместе с TensorFlow API для Java. В том примере ровно одна картинка скармливается модели.
__________________
Серебряная пуля - дура , а осиновый кол - молодец! Именем его императорского величества объявляю ревизию сему сумасшедшему дому! Нет, Воронов, ты меня не возьмешь! Последний раз редактировалось mumu-and-gerasim; 05.09.2023 в 12:29. |
05.09.2023, 17:56 | #24 |
F
Регистрация: 09.10.2014
Сообщений: 25,022
|
против костра февральским вечером я даже не возражаю.
Кое у кого несколько компов сгорело примерно месяц назад во время проведения ML Challenge с использованием TensorFlow и всяких идиотских GPU вместо NPU. Правда они к компам цепляли такие китайские хреновины с RISC-V через USB. По ходу ML сгорал не только порт USB но и какой-то там "южный мост".
__________________
Серебряная пуля - дура , а осиновый кол - молодец! Именем его императорского величества объявляю ревизию сему сумасшедшему дому! Нет, Воронов, ты меня не возьмешь! |
06.09.2023, 16:17 | #26 |
F
Регистрация: 09.10.2014
Сообщений: 25,022
|
те учебные из примеров у них картинки классифицируют в основном.
Вот эта зараза тоже ( примеры на python ) - https://sihamtabik.github.io/tutorial.html Для всяких там интерактивных карт актуальнее не "генерить картинку" , а раскрашивать картинку - в зависимости от того , сколько трупов похоронено на соответствующем участке кладбища , например. ( простейший вариант использования элементов AR/VR. AR - augmented reality ( изменённая реальность ) )
__________________
Серебряная пуля - дура , а осиновый кол - молодец! Именем его императорского величества объявляю ревизию сему сумасшедшему дому! Нет, Воронов, ты меня не возьмешь! Последний раз редактировалось mumu-and-gerasim; 06.09.2023 в 16:21. |
Здесь присутствуют: 1 (пользователей: 0 , гостей: 1) | |
|
|