Доброго времени суток!
Есть некая задача, в которой необходимо получить данные в голосовом формате (речь), а затем полученные данные перевести в строки и сравнить побуквенно с определёнными иными строками. Начал копать на эту тему и обнаружил, что использование стандартных гугловских сервисов (методов createSpeechRecognizer и т.д.) подразумевает сравнение произнесённых слов и выдвижение наиболее похожих вариантов слов. В моём же случае это нежелательный путь, ибо мне нужно получить именно такие буквенные словосочетания, которые были произнесены (хотябы в приближении), потому что основным критерием является сравнение произнесённого с заданными данными. Необходимо получить именно данные, которые задаёт непосредственно человек, а не те данные, которые гугл предлагает путём обработки информации.
Подскажите пожалуйста, возможно ли это вообще? И если да, то в какую сторону копать. Посоветуйте пожалуйста литературу, источники.
Распознавание речи
-
- Сообщения: 16
- Зарегистрирован: 02 апр 2013, 22:44
Re: Распознавание речи
Честно говоря я не совсем уловил, в каком формате вы хотите получать результат?И с чем конкретно его сравнивать?
Пока могу предложить вам почитать про использование библиотеки pocketSphinx , там можно реализовать слушателя активационной фразы и слушателя ранее добавленных команд. То есть слушатель команд будет срабатывать именно в том случае , если вы произнесли команду, в противном весь остальной звук игнорируется.
Пока могу предложить вам почитать про использование библиотеки pocketSphinx , там можно реализовать слушателя активационной фразы и слушателя ранее добавленных команд. То есть слушатель команд будет срабатывать именно в том случае , если вы произнесли команду, в противном весь остальной звук игнорируется.
Re: Распознавание речи
Попытаюсь точнее:
Допустим у меня есть данные в строке в тексте - к примеру "Интеграция".
Человек по определённому запросу должен произнести слово. К примеру он не чётко произнёс фразу - "Интеррация" или же вообще произнёс не то слово. Google сервисы предлагают при этом всё-равно варианты ответа. В данном случае два варианта - "Интеграция" или "Итерация". Мне же надо принять данные так, как произнёс человек, т.е. "Интеррация" и сравнить эти данные с другим текстом на совпадение, побуквенно, т.е. в ответе необходимо будет получить, насколько точно было произнесено это слово.
Допустим у меня есть данные в строке в тексте - к примеру "Интеграция".
Человек по определённому запросу должен произнести слово. К примеру он не чётко произнёс фразу - "Интеррация" или же вообще произнёс не то слово. Google сервисы предлагают при этом всё-равно варианты ответа. В данном случае два варианта - "Интеграция" или "Итерация". Мне же надо принять данные так, как произнёс человек, т.е. "Интеррация" и сравнить эти данные с другим текстом на совпадение, побуквенно, т.е. в ответе необходимо будет получить, насколько точно было произнесено это слово.
Re: Распознавание речи
Вот статья про движки по распознаванию речи, возможно вам поможет - http://habrahabr.ru/post/231629/
Добавлю от себя - моё личное мнение, в обычном мобильном устройстве практически невозможно правильно организовать модуль шумоочистки и библиотеку акустических моделей, с которыми будет сравниваться слово. Это очень ресурсоёмко, мне кажется. Могу ошибаться.
Если вы вдруг найдёте автономное решение, то напишите тут тоже об этом варианте, будьте добры.
Добавлю от себя - моё личное мнение, в обычном мобильном устройстве практически невозможно правильно организовать модуль шумоочистки и библиотеку акустических моделей, с которыми будет сравниваться слово. Это очень ресурсоёмко, мне кажется. Могу ошибаться.
Если вы вдруг найдёте автономное решение, то напишите тут тоже об этом варианте, будьте добры.
-
- Сообщения: 16
- Зарегистрирован: 02 апр 2013, 22:44
Re: Распознавание речи
Так можно получить первый результат от гугла, по их мнению он максимально подходит для вас, но не факт , что он соответствует тому , что вы сказали. И далее уже начинайте побуквенную проверку.