SVOBODA-ON! - Форум свободного общения  

Вернуться   SVOBODA-ON! - Форум свободного общения > Свободное общение обо всем > Свободный

Важная информация

***
Ответ
 
Опции темы Опции просмотра
Старый 03.09.2023, 14:35   #1
mumu-and-gerasim
F
 
Аватар для mumu-and-gerasim
 
Регистрация: 09.10.2014
Сообщений: 25,022
mumu-and-gerasim 11mumu-and-gerasim 11mumu-and-gerasim 11mumu-and-gerasim 11mumu-and-gerasim 11mumu-and-gerasim 11mumu-and-gerasim 11mumu-and-gerasim 11mumu-and-gerasim 11mumu-and-gerasim 11mumu-and-gerasim 11
Smile Картинка из аудио - хоть кто-то пробовал ?

Ну берём raw audio pcm8 ( 8 бит на сэмпл ).
И берём rgb пиксель без альфа-канала ( 8 бит на компоненту цвета RGB ).
И из каждых трёх сэмплов аудио делаем один пиксель картинки. Размер картинки можно какой-нибудь условно реалитичный задать - хоть 640 на 480. Ну и заполняем матрицу цветами из сэмплов аудио по три сэмпла на пиксель хоть по строкам , хоть по столбцам.
__________________
Серебряная пуля - дура , а осиновый кол - молодец!
Именем его императорского величества объявляю ревизию сему сумасшедшему дому! Нет, Воронов, ты меня не возьмешь!
mumu-and-gerasim вне форума   Ответить с цитированием
Старый 03.09.2023, 14:36   #2
mumu-and-gerasim
F
 
Аватар для mumu-and-gerasim
 
Регистрация: 09.10.2014
Сообщений: 25,022
mumu-and-gerasim 11mumu-and-gerasim 11mumu-and-gerasim 11mumu-and-gerasim 11mumu-and-gerasim 11mumu-and-gerasim 11mumu-and-gerasim 11mumu-and-gerasim 11mumu-and-gerasim 11mumu-and-gerasim 11mumu-and-gerasim 11
По умолчанию

Ну и получается визуализация аудио для глухих.
Хотя можно и обратный процесс - видео для слепых в виде аудиозаписи.

В упор не понимаю зачем это нужно. Лично мне было надо - когда кормил модель нейросети в TensorFlow. Там в примере она была настроена обучаться на последовательности картинок , каждая картинка размером 240x240.

Но ведь там "шизомилитаристкое" применение есть - рисунок или карту-схему или фотографию текста с листа бумаги можно передать как "аудиозапись" по "аудиоканалу". ( хоть через громкоговоритель ). И потом восстановить из аудиозаписи видео. - я так с фотографиями пробовал.

Ну там можно интереснее химичить - пиксели можно ведь не обязательно "линейно" в матрице размещать , а можно и по кругу. Тогда внешне всё на грампластинку будет похоже.
__________________
Серебряная пуля - дура , а осиновый кол - молодец!
Именем его императорского величества объявляю ревизию сему сумасшедшему дому! Нет, Воронов, ты меня не возьмешь!

Последний раз редактировалось mumu-and-gerasim; 03.09.2023 в 14:47.
mumu-and-gerasim вне форума   Ответить с цитированием
Старый 03.09.2023, 14:50   #3
Бывший
F
 
Регистрация: 25.03.2023
Сообщений: 4,908
Бывший 11Бывший 11Бывший 11Бывший 11Бывший 11Бывший 11Бывший 11Бывший 11Бывший 11Бывший 11Бывший 11
По умолчанию

Сцылку! Или пример, как всё это работает. А то ничего не понятно, но очень интересно.
Бывший на форуме   Ответить с цитированием
Старый 03.09.2023, 15:03   #4
mumu-and-gerasim
F
 
Аватар для mumu-and-gerasim
 
Регистрация: 09.10.2014
Сообщений: 25,022
mumu-and-gerasim 11mumu-and-gerasim 11mumu-and-gerasim 11mumu-and-gerasim 11mumu-and-gerasim 11mumu-and-gerasim 11mumu-and-gerasim 11mumu-and-gerasim 11mumu-and-gerasim 11mumu-and-gerasim 11mumu-and-gerasim 11
По умолчанию

Цитата:
Сообщение от Бывший Посмотреть сообщение
Сцылку! Или пример, как всё это работает. А то ничего не понятно, но очень интересно.
ну что там непонятного ? Картинка "из фотоаппарата". 2D ( двумерная ) в виде матрицы. У каждой точки картинки есть цвет. Цвет кодируется "как в телевизоре" - компонента красного , компонента зелёного , компонента синего. Каждая компонента кодируется числом от 0 до 255 ( 8 бит ).
Оцифрованое аудио с микрофона ( raw audio ) кодируется т.н. сэмплами. Простейший ( но очень низкокачественный ) вариант - 8 бит на сэмпл ( число от 0 до 255 ). Сэмплы идут подряд ( 1 канал - моно ). Такие мелочи как sample rate и т.д. - с этим не заморачиваемся , потому что будем их фиксировать для устройства записи аудио.

Получается , что на аудиопоток можно смотреть ( будет похож на царапины на стене ),
а фотография может по-настоящему "звучать". ( на музыку будет не очень похоже , а просто будет булькать-шелестеть-трещать-гудеть. В "Необыкновенном концерте" у Аркадия Обломова была фраза: "Человек - это звучит" ).

Ну можно открыть графический редактор на компе - написать там внутри кисточкой "нецензурую брань" , сохранить картинку , а потом из картинки сделать "аудиоряд" и воспроизвести это аудио в плеере. ( формат wav с RIFF-заголовком , где указывается 8 bit per sample и задаётся sample rate )
__________________
Серебряная пуля - дура , а осиновый кол - молодец!
Именем его императорского величества объявляю ревизию сему сумасшедшему дому! Нет, Воронов, ты меня не возьмешь!

Последний раз редактировалось mumu-and-gerasim; 03.09.2023 в 15:10.
mumu-and-gerasim вне форума   Ответить с цитированием
Старый 03.09.2023, 15:11   #5
EvgeniyO
F
 
Аватар для EvgeniyO
 
Регистрация: 22.03.2014
Сообщений: 6,360
EvgeniyO 11EvgeniyO 11EvgeniyO 11EvgeniyO 11EvgeniyO 11EvgeniyO 11EvgeniyO 11EvgeniyO 11EvgeniyO 11EvgeniyO 11EvgeniyO 11
По умолчанию

Со мной когдато учился парень который увликался не стандартной графикой. Он правдаделал картинку из звука, примерно по такой схеме он и работал.
Само по себе интересно и выглядит красиво но по виду картинки нельзя понять какой звук был изначально. Может быть если бы он делал из звука видио(у звука и видео есть протяжонность во времени) было бы более интересно
EvgeniyO на форуме   Ответить с цитированием
Старый 03.09.2023, 16:36   #6
Бывший
F
 
Регистрация: 25.03.2023
Сообщений: 4,908
Бывший 11Бывший 11Бывший 11Бывший 11Бывший 11Бывший 11Бывший 11Бывший 11Бывший 11Бывший 11Бывший 11
По умолчанию

Цитата:
Сообщение от mumu-and-gerasim Посмотреть сообщение
ну что там непонятного ? Картинка "из фотоаппарата". 2D ( двумерная ) в виде матрицы. У каждой точки картинки есть цвет. Цвет кодируется "как в телевизоре" - компонента красного , компонента зелёного , компонента синего. Каждая компонента кодируется числом от 0 до 255 ( 8 бит ).
Оцифрованое аудио с микрофона ( raw audio ) кодируется т.н. сэмплами. Простейший ( но очень низкокачественный ) вариант - 8 бит на сэмпл ( число от 0 до 255 ). Сэмплы идут подряд ( 1 канал - моно ). Такие мелочи как sample rate и т.д. - с этим не заморачиваемся , потому что будем их фиксировать для устройства записи аудио.

Получается , что на аудиопоток можно смотреть ( будет похож на царапины на стене ),
а фотография может по-настоящему "звучать". ( на музыку будет не очень похоже , а просто будет булькать-шелестеть-трещать-гудеть. В "Необыкновенном концерте" у Аркадия Обломова была фраза: "Человек - это звучит" ).

Ну можно открыть графический редактор на компе - написать там внутри кисточкой "нецензурую брань" , сохранить картинку , а потом из картинки сделать "аудиоряд" и воспроизвести это аудио в плеере. ( формат wav с RIFF-заголовком , где указывается 8 bit per sample и задаётся sample rate )
Ну суть я уловил. Звук кодируется в низком битрейте, записывается в файл, а затем данные файла переводятся в формат, который можно прочитать какой-нибудь графической прогой. Или наоборот, графический файл перекодировать в формат для проигрывания аудиоплеером. Ну получается графическое, или звуковое непонятно-что.
В чем смысл??? Вот это я совершенно не могу понять.


Похожие проги я видел и раньше, давным давно. Можно было текст или звук встроить в какую-нибудь графическую картинку, а потом с помощью той же проги извлечь всё в исходном виде. Стеганография называется. Правда, если вставлять в картинку звук, то картинка начинала весить подозрительно много.

Последний раз редактировалось Бывший; 03.09.2023 в 16:40.
Бывший на форуме   Ответить с цитированием
Старый 03.09.2023, 16:39   #7
Бывший
F
 
Регистрация: 25.03.2023
Сообщений: 4,908
Бывший 11Бывший 11Бывший 11Бывший 11Бывший 11Бывший 11Бывший 11Бывший 11Бывший 11Бывший 11Бывший 11
По умолчанию

Кстати, некий своеобразный аналоговый аналог этой технологии использовался раньше в кинопленках, там идёт специальная аудиодорожка, на которой записан звук в оптическом формате.
Бывший на форуме   Ответить с цитированием
Старый 03.09.2023, 16:44   #8
mumu-and-gerasim
F
 
Аватар для mumu-and-gerasim
 
Регистрация: 09.10.2014
Сообщений: 25,022
mumu-and-gerasim 11mumu-and-gerasim 11mumu-and-gerasim 11mumu-and-gerasim 11mumu-and-gerasim 11mumu-and-gerasim 11mumu-and-gerasim 11mumu-and-gerasim 11mumu-and-gerasim 11mumu-and-gerasim 11mumu-and-gerasim 11
По умолчанию

Цитата:
Сообщение от Бывший Посмотреть сообщение
Кстати, некий своеобразный аналоговый аналог этой технологии использовался раньше в кинопленках, там идёт специальная аудиодорожка, на которой записан звук в оптическом формате.
Нет - это совсем не аудиодорожка , а собственно изображение. Или "слой" в multi-layer image
__________________
Серебряная пуля - дура , а осиновый кол - молодец!
Именем его императорского величества объявляю ревизию сему сумасшедшему дому! Нет, Воронов, ты меня не возьмешь!

Последний раз редактировалось mumu-and-gerasim; 04.09.2023 в 17:37.
mumu-and-gerasim вне форума   Ответить с цитированием
Старый 03.09.2023, 16:47   #9
mumu-and-gerasim
F
 
Аватар для mumu-and-gerasim
 
Регистрация: 09.10.2014
Сообщений: 25,022
mumu-and-gerasim 11mumu-and-gerasim 11mumu-and-gerasim 11mumu-and-gerasim 11mumu-and-gerasim 11mumu-and-gerasim 11mumu-and-gerasim 11mumu-and-gerasim 11mumu-and-gerasim 11mumu-and-gerasim 11mumu-and-gerasim 11
По умолчанию

Цитата:
Сообщение от Бывший Посмотреть сообщение
Ну суть я уловил. Звук кодируется в низком битрейте, записывается в файл, а затем данные файла переводятся в формат, который можно прочитать какой-нибудь графической прогой. Или наоборот, графический файл перекодировать в формат для проигрывания аудиоплеером. Ну получается графическое, или звуковое непонятно-что.
В чем смысл??? Вот это я совершенно не могу понять.


Похожие проги я видел и раньше, давным давно. Можно было текст или звук встроить в какую-нибудь графическую картинку, а потом с помощью той же проги извлечь всё в исходном виде. Стеганография называется. Правда, если вставлять в картинку звук, то картинка начинала весить подозрительно много.
Смысл в том , чтобы скормить аудио работающей нейросети , которая обрабатывает последовательности картинок и самообучается.
Ну там приколы с подавлением помех ещё - в графическом редакторе просто "пиксели шума" убрать.
Самое загадочное - передавать картинки ультразвуком под водой.
__________________
Серебряная пуля - дура , а осиновый кол - молодец!
Именем его императорского величества объявляю ревизию сему сумасшедшему дому! Нет, Воронов, ты меня не возьмешь!

Последний раз редактировалось mumu-and-gerasim; 04.09.2023 в 15:34.
mumu-and-gerasim вне форума   Ответить с цитированием
Старый 04.09.2023, 03:02   #10
Бывший
F
 
Регистрация: 25.03.2023
Сообщений: 4,908
Бывший 11Бывший 11Бывший 11Бывший 11Бывший 11Бывший 11Бывший 11Бывший 11Бывший 11Бывший 11Бывший 11
По умолчанию

Цитата:
Сообщение от mumu-and-gerasim Посмотреть сообщение
Смысл в том , чтобы скормить аудио работаюзнй нейросети , которая обрабатывает последовательности картинок и самообучается.
Ну там приколы с подавлением помех ещё - в графическом редакторе просто "пиксели шума" убрать.
Самое загадочное - передавать картинки ультразвуком под водой.
Зачем это нейросети, какой результат хотите получить?
Бывший на форуме   Ответить с цитированием
Старый 04.09.2023, 15:22   #11
mumu-and-gerasim
F
 
Аватар для mumu-and-gerasim
 
Регистрация: 09.10.2014
Сообщений: 25,022
mumu-and-gerasim 11mumu-and-gerasim 11mumu-and-gerasim 11mumu-and-gerasim 11mumu-and-gerasim 11mumu-and-gerasim 11mumu-and-gerasim 11mumu-and-gerasim 11mumu-and-gerasim 11mumu-and-gerasim 11mumu-and-gerasim 11
По умолчанию

Цитата:
Сообщение от EvgeniyO Посмотреть сообщение
Со мной когдато учился парень который увликался не стандартной графикой. Он правдаделал картинку из звука, примерно по такой схеме он и работал.
Само по себе интересно и выглядит красиво но по виду картинки нельзя понять какой звук был изначально. Может быть если бы он делал из звука видио(у звука и видео есть протяжонность во времени) было бы более интересно
но мне изначально это было нужно для работающей нейросети в TensorFlow - там на входе датасет из последовательности картинок. Но просто хоть куда-то ещё хочется присобачить - раз работает. ( там даже обычного Open JDK с Java 11 на всё хватает )

P.S. Кстати - протяжённость во времени как раз очень просто. Там sample rate на frame per second автоматически отображается. ( ну а программа ffmpeg из последовательности картинок позволяет делать видео. Хоть даже mpeg2 ts. Самое прикольное - делать это на смартфоне с Android. Правда там очень длинная программа получается - почти 24 мегабайта , если использовать ffmpeg toolkit )
__________________
Серебряная пуля - дура , а осиновый кол - молодец!
Именем его императорского величества объявляю ревизию сему сумасшедшему дому! Нет, Воронов, ты меня не возьмешь!

Последний раз редактировалось mumu-and-gerasim; 04.09.2023 в 15:41.
mumu-and-gerasim вне форума   Ответить с цитированием
Старый 04.09.2023, 15:25   #12
Бывший
F
 
Регистрация: 25.03.2023
Сообщений: 4,908
Бывший 11Бывший 11Бывший 11Бывший 11Бывший 11Бывший 11Бывший 11Бывший 11Бывший 11Бывший 11Бывший 11
По умолчанию

Чего добиться-то хотите? Что должно получиться? Для чего это?


А то мало ли что... сейчас занимаетесь с нейросетью непонятно чем, а потом бац! - восстание машин, терминатор-3.
Бывший на форуме   Ответить с цитированием
Старый 04.09.2023, 15:26   #13
mumu-and-gerasim
F
 
Аватар для mumu-and-gerasim
 
Регистрация: 09.10.2014
Сообщений: 25,022
mumu-and-gerasim 11mumu-and-gerasim 11mumu-and-gerasim 11mumu-and-gerasim 11mumu-and-gerasim 11mumu-and-gerasim 11mumu-and-gerasim 11mumu-and-gerasim 11mumu-and-gerasim 11mumu-and-gerasim 11mumu-and-gerasim 11
По умолчанию

Цитата:
Сообщение от Бывший Посмотреть сообщение
Зачем это нейросети, какой результат хотите получить?
нейросети "хвастаются" , что кота от собаки по таким картинкам могут отличить. ( в учебном примере ). Раз могут отличить кота от собаки - пусть попробуют марш из оперетты от похоронного марша Шопена отличить , например.
( я не утрирую - есть вот задача обучения музыкантов и обнаруживать "фальшиво взятые ноты". В конце-концов ведь обычная задача классификации-кластеризации из AI. И на самом деле ничем не отличается от различения кота от собаки на рисунке. )
__________________
Серебряная пуля - дура , а осиновый кол - молодец!
Именем его императорского величества объявляю ревизию сему сумасшедшему дому! Нет, Воронов, ты меня не возьмешь!
mumu-and-gerasim вне форума   Ответить с цитированием
Старый 04.09.2023, 15:38   #14
mumu-and-gerasim
F
 
Аватар для mumu-and-gerasim
 
Регистрация: 09.10.2014
Сообщений: 25,022
mumu-and-gerasim 11mumu-and-gerasim 11mumu-and-gerasim 11mumu-and-gerasim 11mumu-and-gerasim 11mumu-and-gerasim 11mumu-and-gerasim 11mumu-and-gerasim 11mumu-and-gerasim 11mumu-and-gerasim 11mumu-and-gerasim 11
По умолчанию

Цитата:
Сообщение от Бывший Посмотреть сообщение
А то мало ли что... сейчас занимаетесь с нейросетью непонятно чем, а потом бац! - восстание машин, терминатор-3.
ну там дело даже не в "восстании машин" - можно посмотреть на проблему в контексте SETI и CETI ( поиск сигналов от внеземного разума и контакт с внеземным разумом ).

Или даже такая постановка задачи - как понять , что "сигнальная система" является "языком" ( communication language ) ?
__________________
Серебряная пуля - дура , а осиновый кол - молодец!
Именем его императорского величества объявляю ревизию сему сумасшедшему дому! Нет, Воронов, ты меня не возьмешь!
mumu-and-gerasim вне форума   Ответить с цитированием
Старый 04.09.2023, 17:05   #15
Бывший
F
 
Регистрация: 25.03.2023
Сообщений: 4,908
Бывший 11Бывший 11Бывший 11Бывший 11Бывший 11Бывший 11Бывший 11Бывший 11Бывший 11Бывший 11Бывший 11
По умолчанию

Цитата:
Сообщение от mumu-and-gerasim Посмотреть сообщение
нейросети "хвастаются" , что кота от собаки по таким картинкам могут отличить. ( в учебном примере ). Раз могут отличить кота от собаки - пусть попробуют марш из оперетты от похоронного марша Шопена отличить , например.
( я не утрирую - есть вот задача обучения музыкантов и обнаруживать "фальшиво взятые ноты". В конце-концов ведь обычная задача классификации-кластеризации из AI. И на самом деле ничем не отличается от различения кота от собаки на рисунке. )
Для этого не нужно перекодировать аудиоформат в графику. или грфику в формат аудио. Машине вообще всё равно что с чем сравнивать, для нее всё это - лишь цифры. Загружаете в нейросеть картинки, и учите ее различать собак и кошек, хотя вроде нейросеть уже это умеет. Загружаете Шопена и Штрауса, и учите нейросеть различать и их. Всё, не надо ничего перекодировать.
Бывший на форуме   Ответить с цитированием
Старый 04.09.2023, 17:28   #16
mumu-and-gerasim
F
 
Аватар для mumu-and-gerasim
 
Регистрация: 09.10.2014
Сообщений: 25,022
mumu-and-gerasim 11mumu-and-gerasim 11mumu-and-gerasim 11mumu-and-gerasim 11mumu-and-gerasim 11mumu-and-gerasim 11mumu-and-gerasim 11mumu-and-gerasim 11mumu-and-gerasim 11mumu-and-gerasim 11mumu-and-gerasim 11
По умолчанию

Цитата:
Сообщение от Бывший Посмотреть сообщение
Для этого не нужно перекодировать аудиоформат в графику. или грфику в формат аудио. Машине вообще всё равно что с чем сравнивать, для нее всё это - лишь цифры. Загружаете в нейросеть картинки, и учите ее различать собак и кошек, хотя вроде нейросеть уже это умеет. Загружаете Шопена и Штрауса, и учите нейросеть различать и их. Всё, не надо ничего перекодировать.
Машине как раз не всё равно. Для анализа изображений в "системах технического зрения роботов" - свои собственные алгоритмы и методы нормализации данных. Никто с "фильтрами Каллмана" и прочей радостью из адуио ( и радиотехники ) не заморачивается особенно. И быстрым преобразованием Фурье при распознавании изоражений никто не злоупотребляет. Именно потому и хочется перевести аудио в видео - чтобы использовать совсем другие методы ( в т.ч. из теории формальных грамматик ).
__________________
Серебряная пуля - дура , а осиновый кол - молодец!
Именем его императорского величества объявляю ревизию сему сумасшедшему дому! Нет, Воронов, ты меня не возьмешь!
mumu-and-gerasim вне форума   Ответить с цитированием
Старый 04.09.2023, 17:46   #17
Бывший
F
 
Регистрация: 25.03.2023
Сообщений: 4,908
Бывший 11Бывший 11Бывший 11Бывший 11Бывший 11Бывший 11Бывший 11Бывший 11Бывший 11Бывший 11Бывший 11
По умолчанию

Ммм... дэээ...
Ладно.
Бывший на форуме   Ответить с цитированием
Старый 04.09.2023, 17:57   #18
mumu-and-gerasim
F
 
Аватар для mumu-and-gerasim
 
Регистрация: 09.10.2014
Сообщений: 25,022
mumu-and-gerasim 11mumu-and-gerasim 11mumu-and-gerasim 11mumu-and-gerasim 11mumu-and-gerasim 11mumu-and-gerasim 11mumu-and-gerasim 11mumu-and-gerasim 11mumu-and-gerasim 11mumu-and-gerasim 11mumu-and-gerasim 11
По умолчанию

Цитата:
Сообщение от Бывший Посмотреть сообщение
Ммм... дэээ...
Ладно.
просто там намного меньшая "вычислительная мощность" нужна - если картинки анализировать "не-радиотехническими методами". ( не нужно все эти синусы-косинусы и умножения с плавающей точкой ).
__________________
Серебряная пуля - дура , а осиновый кол - молодец!
Именем его императорского величества объявляю ревизию сему сумасшедшему дому! Нет, Воронов, ты меня не возьмешь!
mumu-and-gerasim вне форума   Ответить с цитированием
Старый 05.09.2023, 00:08   #19
pornocrat
F
 
Аватар для pornocrat
 
Регистрация: 03.11.2016
Сообщений: 18,091
pornocrat 11pornocrat 11pornocrat 11pornocrat 11pornocrat 11pornocrat 11pornocrat 11pornocrat 11pornocrat 11pornocrat 11pornocrat 11
По умолчанию

mumu-and-gerasim, я ничего не понял, но чем визуализация винамп не устраивает?
__________________
GuTTJonnDeerMar
В игноре
pornocrat на форуме   Ответить с цитированием
Старый 05.09.2023, 00:12   #20
pornocrat
F
 
Аватар для pornocrat
 
Регистрация: 03.11.2016
Сообщений: 18,091
pornocrat 11pornocrat 11pornocrat 11pornocrat 11pornocrat 11pornocrat 11pornocrat 11pornocrat 11pornocrat 11pornocrat 11pornocrat 11
По умолчанию

Грубо говоря - визуальный эквалайзер изобрели вместе с оциллографом.
__________________
GuTTJonnDeerMar
В игноре
pornocrat на форуме   Ответить с цитированием
Старый 05.09.2023, 01:35   #21
mumu-and-gerasim
F
 
Аватар для mumu-and-gerasim
 
Регистрация: 09.10.2014
Сообщений: 25,022
mumu-and-gerasim 11mumu-and-gerasim 11mumu-and-gerasim 11mumu-and-gerasim 11mumu-and-gerasim 11mumu-and-gerasim 11mumu-and-gerasim 11mumu-and-gerasim 11mumu-and-gerasim 11mumu-and-gerasim 11mumu-and-gerasim 11
По умолчанию

Цитата:
Сообщение от pornocrat Посмотреть сообщение
mumu-and-gerasim, я ничего не понял, но чем визуализация винамп не устраивает?
Нужна ведь не визуализация сама по себе была , а просто из аудио сделать входные данные для нейросети , которая обучается по последовательностям картинок. А у меня входные данные - звукозаписи. Ну вот и ...
__________________
Серебряная пуля - дура , а осиновый кол - молодец!
Именем его императорского величества объявляю ревизию сему сумасшедшему дому! Нет, Воронов, ты меня не возьмешь!
mumu-and-gerasim вне форума   Ответить с цитированием
Старый 05.09.2023, 01:43   #22
mumu-and-gerasim
F
 
Аватар для mumu-and-gerasim
 
Регистрация: 09.10.2014
Сообщений: 25,022
mumu-and-gerasim 11mumu-and-gerasim 11mumu-and-gerasim 11mumu-and-gerasim 11mumu-and-gerasim 11mumu-and-gerasim 11mumu-and-gerasim 11mumu-and-gerasim 11mumu-and-gerasim 11mumu-and-gerasim 11mumu-and-gerasim 11
По умолчанию

Цитата:
Сообщение от pornocrat Посмотреть сообщение
Грубо говоря - визуальный эквалайзер изобрели вместе с оциллографом.
Но данные ведь именно с осциллографа нужны ( хоть там и делается АЦП - ADC ).
Но оцифрованный звук - там как раз АЦП уже сделано. Но с рядами , свёртками , быстрым преобразованием Фурье и прочими радиотехническими радостями ничего делать не хочется , потому что рядом вот она - как бы работающая нейросеть ( к которой лезем через google API. Но там на входе рисунки со всякими пчёлами и прочими тараканами. Но для unsupervised ML ( это когда нет никаких образцов , а как раз нужно выделить то , из чего можно создавать образцы ) ведь всё равно , что там нарисовано.

"Источник вдохновения" ведь где-то здесь - https://github.com/tensorflow/tensor...abelImage.java

если бы ещё этот источник в... нормально собирался в новой версии TensorFlow ...

Там строится т.н. "граф" в терминологии TensorFlow , но используется не Python3 , а Java 11 вместе с TensorFlow API для Java. В том примере ровно одна картинка скармливается модели.
__________________
Серебряная пуля - дура , а осиновый кол - молодец!
Именем его императорского величества объявляю ревизию сему сумасшедшему дому! Нет, Воронов, ты меня не возьмешь!

Последний раз редактировалось mumu-and-gerasim; 05.09.2023 в 12:29.
mumu-and-gerasim вне форума   Ответить с цитированием
Старый 05.09.2023, 14:03   #23
Бывший
F
 
Регистрация: 25.03.2023
Сообщений: 4,908
Бывший 11Бывший 11Бывший 11Бывший 11Бывший 11Бывший 11Бывший 11Бывший 11Бывший 11Бывший 11Бывший 11
По умолчанию

mumu-and-gerasim

Несколько веков назад тебя бы казнили
Бывший на форуме   Ответить с цитированием
Старый 05.09.2023, 17:56   #24
mumu-and-gerasim
F
 
Аватар для mumu-and-gerasim
 
Регистрация: 09.10.2014
Сообщений: 25,022
mumu-and-gerasim 11mumu-and-gerasim 11mumu-and-gerasim 11mumu-and-gerasim 11mumu-and-gerasim 11mumu-and-gerasim 11mumu-and-gerasim 11mumu-and-gerasim 11mumu-and-gerasim 11mumu-and-gerasim 11mumu-and-gerasim 11
По умолчанию

Цитата:
Сообщение от Бывший Посмотреть сообщение
mumu-and-gerasim

Несколько веков назад тебя бы казнили
против костра февральским вечером я даже не возражаю.

Кое у кого несколько компов сгорело примерно месяц назад во время проведения ML Challenge с использованием TensorFlow и всяких идиотских GPU вместо NPU.
Правда они к компам цепляли такие китайские хреновины с RISC-V через USB. По ходу ML сгорал не только порт USB но и какой-то там "южный мост".
__________________
Серебряная пуля - дура , а осиновый кол - молодец!
Именем его императорского величества объявляю ревизию сему сумасшедшему дому! Нет, Воронов, ты меня не возьмешь!
mumu-and-gerasim вне форума   Ответить с цитированием
Старый 06.09.2023, 09:05   #25
Всеволод
Moderator
 
Аватар для Всеволод
 
Регистрация: 22.03.2014
Сообщений: 34,430
Всеволод 11Всеволод 11Всеволод 11Всеволод 11Всеволод 11Всеволод 11Всеволод 11Всеволод 11Всеволод 11Всеволод 11Всеволод 11
По умолчанию

А слабо нейросети самой сгенерить картинку по аудио?
__________________
Ребята, давайте жить дружно!
Всеволод на форуме   Ответить с цитированием
Старый 06.09.2023, 16:17   #26
mumu-and-gerasim
F
 
Аватар для mumu-and-gerasim
 
Регистрация: 09.10.2014
Сообщений: 25,022
mumu-and-gerasim 11mumu-and-gerasim 11mumu-and-gerasim 11mumu-and-gerasim 11mumu-and-gerasim 11mumu-and-gerasim 11mumu-and-gerasim 11mumu-and-gerasim 11mumu-and-gerasim 11mumu-and-gerasim 11mumu-and-gerasim 11
По умолчанию

Цитата:
Сообщение от Всеволод Посмотреть сообщение
А слабо нейросети самой сгенерить картинку по аудио?
те учебные из примеров у них картинки классифицируют в основном.
Вот эта зараза тоже ( примеры на python ) - https://sihamtabik.github.io/tutorial.html

Для всяких там интерактивных карт актуальнее не "генерить картинку" , а раскрашивать картинку - в зависимости от того , сколько трупов похоронено на соответствующем участке кладбища , например. ( простейший вариант использования элементов AR/VR. AR - augmented reality ( изменённая реальность ) )
__________________
Серебряная пуля - дура , а осиновый кол - молодец!
Именем его императорского величества объявляю ревизию сему сумасшедшему дому! Нет, Воронов, ты меня не возьмешь!

Последний раз редактировалось mumu-and-gerasim; 06.09.2023 в 16:21.
mumu-and-gerasim вне форума   Ответить с цитированием
Ответ


Здесь присутствуют: 1 (пользователей: 0 , гостей: 1)
 

Ваши права в разделе
Вы не можете создавать новые темы
Вы не можете отвечать в темах
Вы не можете прикреплять вложения
Вы не можете редактировать свои сообщения

BB коды Вкл.
Смайлы Вкл.
[IMG] код Вкл.
HTML код Вкл.

Быстрый переход





Текущее время: 04:17. Часовой пояс GMT +1.


Powered by vBulletin® Version 3.8.7
Copyright ©2000 - 2024, vBulletin Solutions, Inc. Перевод: zCarot
*******
Наша почта: svoboda.on.org@gmail.com
*******
Мнение Администрации форума может не совпадать с мнением авторов сообщений.
Форум находится под юрисдикцией United States of America, España и Bundesrepublik Deutschland.
счетчик посещений