Форум сайта python.su
Меня интересует, собственно, программа или модуль для преобразования звука в цифры. Надоело толочь каждый день клаву, хочу научиться разговаривать с компьютером на русском языке.
Если у кого есть информация на тему преобразования звука в цифры - поделитесь, пожалуйста
Офлайн
leonid_10Вы имеете в виду запись захват звука со звуковой карты? Под какую OS?
Меня интересует, собственно, программа или модуль для преобразования звука в цифры.
leonid_10Вы хотите написать систему распознавания речи?
Надоело толочь каждый день клаву, хочу научиться разговаривать с компьютером на русском языке.
Офлайн
igor.kaistЯ имею ввиду нечто навроде спектрографов осциллографов, работающих в режиме реального времени.
Вы имеете в виду запись захват звука со звуковой карты? Под какую OS?
igor.kaistДа. Сперва для своего компьютера и для своего голоса, а дальше будет видно.
Вы хотите написать систему распознавания речи?
Офлайн
Смотрите pyaudio, вот рецептик по захвату звука http://stackoverflow.com/questions/892199/detect-record-audio-in-python
Офлайн
igor.kaistСпасибо, буду смотреть, но мне бы хоть какой-нить кодик крохотный посмотреть , ну, хотя бы эквалайзера в плеере
Смотрите pyaudio
Офлайн
эм… работать со звуком realtime (анализ и пр.) не совсем подходящая для питона задача, в связи с меньшей производительность. А так, погуглите алгоритмы, и реализуйте на питоне, вряд ли что то готовое есть…
Офлайн
igor.kaistИгорь, сказать честно, я не вижу систем распознавания речи вообще в быту. Никто ещё не умудрился ни на скоростном С, ни на турбопаскале заставить компьютер понимать хотя бы одно единственное слово :выключиться. Я вряд ли стану учить другой язык программирования для того, чтобы попытаться научить компьютер распознавать сколько то там команд. Не будет успевать питон считать - будем помедленнее говорить, хотя, я думаю, что с голосом должно быть всё в порядке. Не такая уж у него высокая частота. Если есть плеер pykaraoke, который успевает читать миди и воспроизводить музыку без пауз, типа подождите, Питон не успевает, то и отдельное слово Питон сможет уловить и пересчитав понять, что за команду юзер отдаёт ни за час и ни за пят, а за долю секунды.
эм… работать со звуком realtime (анализ и пр.) не совсем подходящая для питона задача, в связи с меньшей производительность.
Офлайн
leonid_10над этой задачей бьются десятилетиями, и с переменным успехом ее решают. Не так все просто. Готовое уже есть (goolge:управление компьютером голосом)
Игорь, сказать честно, я не вижу систем распознавания речи вообще в быту.
leonid_10Тут все просто. Файл парсится, из него вычленияется midi, которое играется средствами синтезатора в OS (реализовывать с нуля синтезатор midi, это очень сложная задача). Остается только показать слова (закраску слов) в нужной последовательности, которая есть в этой же файле. Тут количество процессорного времени и объем данных достаточно низок.
Если есть плеер pykaraoke, который успевает читать миди и воспроизводить музыку без пауз, типа подождите, Питон не успевает, то и отдельное слово Питон сможет уловить и пересчитав понять, что за команду юзер отдаёт ни за час и ни за пят, а за долю секунды.
Офлайн