Найти - Пользователи
Полная версия: Голосовой ассистент.
Начало » Python для новичков » Голосовой ассистент.
1 2
S0MN1A
Помогите пожалуйста. Было решено создать виртуального голосового ассистента дворецкого. Да только вот сижу я уже проклятую неделю и пытаюсь как то со всем этим справиться. Но всё тщетно. Дело в том что у меня дома часто рубят интернет и онлайн распознавание это не вариант. Решил оффлайн. Но сколько не мучался я с pocketsphinxОМ рабо ать он категорически отказался. Да и если уж на чистоту я даже представить себе не могу что за модули ещё нужны и как с ними работать. Если кто крутился в этой сфере или даже делал что-то подобное помогите пожалуйста. А то я уже не знаю что мне делать.
py.user.next
Начни с простого: 1) поступающий звук преобразуй в график; 2) сравни полученный график с эталонным графиком; 3) сделай функцию для определения длины звука; 4) закодируй два длинных звука и один короткий на определённую реакцию со стороны программы.

Начни с того, что ты хлопнул и у тебя в результате появилось множество точек (x, y) в файле.
S0MN1A
попробую сделать вид что что-то понял. Я так понял в интернете есть статьи по этому поводу, верно? Если так- попытаюсь что-то понять, но сомневаюсь что получится)
py.user.next
Здесь сборник по работе с wav-файлом из питона
https://stackoverflow.com/questions/2060628/reading-wav-files-in-python

Не думаю, что справишься.

S0MN1A
Было решено создать виртуального голосового ассистента дворецкого.
Если бы это было так просто, мы бы сейчас наблюдали сотни таких дворецких в готовом виде.
Тут ещё вопрос: а как ты будешь отслеживать поступающие звуки? Должна быть какая-то система детекции.
В общем, взялся ты за непосильную ношу.
doza_and
Трудно делать вывод о непосильности или нет задачи по такому описанию.

Что собственно ассистент дворецкого должен делать? Может ему и не нужно распознавание речи?
S0MN1A
doza_and
Трудно делать вывод о непосильности или нет задачи по такому описанию.Что собственно ассистент дворецкого должен делать? Может ему и не нужно распознавание речи?
Делать он должен вполне обычные вещи- работать с программами-открывать закрывать сворачивать,искать запросы в браузере, выполнять некоторые заранее написанные скрипты. Но голосовое управление обязательно. Кж так задумалась для удобства. С словами активации вполне справляется pocketspinx. Я понимаю как это должно работать, но не знаю как это корректно записать. Точнее я знаю как записать я не знаю как правильно установить некоторые модули ибо они постоянно выдоют ошибки и отказываются работать.
Rodegast
> Дело в том что у меня дома часто рубят интернет и онлайн распознавание это не вариант. Решил оффлайн.

https://www.opennet.ru/opennews/art.shtml?num=48798
doza_and
S0MN1A
я не знаю как правильно установить некоторые модули
Это проще решить. Пишите какие модули и какие ошибки. Сразу предупрежу. Питон в сложных задачах часто использует компилируемые модули. Очень вероятно что они есть только под OS типа unix.
S0MN1A
doza_and
Pocketsphix. Пытался ставить на окна. Потом на Kali. Потом на raspberry pi. Встал только на raspberry. Я уж не помню на что он ругался уж простите но дела обстоят так. Встал лишь на малине а писать на ней что либо это то ещё извращение.
doza_and
S0MN1A
Я уж не помню на что он ругался уж простите но дела обстоят так
Ну и что вы хотите? Как мы узнаем в чем у вас проблема?
для винды
load sphinxbase.sln located in sphinxbase directory
compile all the projects in SphinxBase (from sphinxbase.sln)
load pocketsphinx.sln in pocketsphinx directory
compile all the projects in PocketSphinx

Я думаю трудно забыть как вы ставите msvc бегаете по папкам и все билдите.

Вы это делали?
This is a "lo-fi" version of our main content. To view the full version with more information, formatting and images, please click here.
Powered by DjangoBB