Распознавание речи

SQLite, Preferences, файлы, SD, Content Provider, XML, JSON
Ответить
Zammm
Сообщения: 69
Зарегистрирован: 05 окт 2014, 11:31

Распознавание речи

Сообщение Zammm » 25 авг 2015, 19:55

Доброго времени суток!

Есть некая задача, в которой необходимо получить данные в голосовом формате (речь), а затем полученные данные перевести в строки и сравнить побуквенно с определёнными иными строками. Начал копать на эту тему и обнаружил, что использование стандартных гугловских сервисов (методов createSpeechRecognizer и т.д.) подразумевает сравнение произнесённых слов и выдвижение наиболее похожих вариантов слов. В моём же случае это нежелательный путь, ибо мне нужно получить именно такие буквенные словосочетания, которые были произнесены (хотябы в приближении), потому что основным критерием является сравнение произнесённого с заданными данными. Необходимо получить именно данные, которые задаёт непосредственно человек, а не те данные, которые гугл предлагает путём обработки информации.
Подскажите пожалуйста, возможно ли это вообще? И если да, то в какую сторону копать. Посоветуйте пожалуйста литературу, источники.

mercuriy94
Сообщения: 16
Зарегистрирован: 02 апр 2013, 22:44

Re: Распознавание речи

Сообщение mercuriy94 » 26 авг 2015, 00:08

Честно говоря я не совсем уловил, в каком формате вы хотите получать результат?И с чем конкретно его сравнивать?
Пока могу предложить вам почитать про использование библиотеки pocketSphinx , там можно реализовать слушателя активационной фразы и слушателя ранее добавленных команд. То есть слушатель команд будет срабатывать именно в том случае , если вы произнесли команду, в противном весь остальной звук игнорируется.

Zammm
Сообщения: 69
Зарегистрирован: 05 окт 2014, 11:31

Re: Распознавание речи

Сообщение Zammm » 26 авг 2015, 07:29

Попытаюсь точнее:

Допустим у меня есть данные в строке в тексте - к примеру "Интеграция".
Человек по определённому запросу должен произнести слово. К примеру он не чётко произнёс фразу - "Интеррация" или же вообще произнёс не то слово. Google сервисы предлагают при этом всё-равно варианты ответа. В данном случае два варианта - "Интеграция" или "Итерация". Мне же надо принять данные так, как произнёс человек, т.е. "Интеррация" и сравнить эти данные с другим текстом на совпадение, побуквенно, т.е. в ответе необходимо будет получить, насколько точно было произнесено это слово.

Аватара пользователя
An-droid
Сообщения: 51
Зарегистрирован: 25 авг 2015, 10:54

Re: Распознавание речи

Сообщение An-droid » 26 авг 2015, 09:32

Вот статья про движки по распознаванию речи, возможно вам поможет - http://habrahabr.ru/post/231629/

Добавлю от себя - моё личное мнение, в обычном мобильном устройстве практически невозможно правильно организовать модуль шумоочистки и библиотеку акустических моделей, с которыми будет сравниваться слово. Это очень ресурсоёмко, мне кажется. Могу ошибаться.
Если вы вдруг найдёте автономное решение, то напишите тут тоже об этом варианте, будьте добры.
Изображение

mercuriy94
Сообщения: 16
Зарегистрирован: 02 апр 2013, 22:44

Re: Распознавание речи

Сообщение mercuriy94 » 26 авг 2015, 09:40

Так можно получить первый результат от гугла, по их мнению он максимально подходит для вас, но не факт , что он соответствует тому , что вы сказали. И далее уже начинайте побуквенную проверку.

Ответить