По какому принципу работают программы распознавания голоса?

интернет компьютеры программы услуги связь

Я говорю именно про программы для управления компьютером (и не только)

Примечание:
Уточнение. Я говорю о том, как работают программы. То есть для начала я должен записать фразу "открой браузер" а потом произнести её и программа "вспоминая" смысл этой фразы открывает браузер. Или как - то подругому?
Ответы:
частотный спектр, только он дает цифровую картину тембра и как код является уникальным
смысл в том, чтобы запомнить не сам звуковой файл, а "образ" фразы или конкретного человека. То есть разбить наборы звуковых файлов не на привычные Герцы и миллисекунды, а на некие "образы", которые, к примеру, в нейросетевом подходе представлены в виде набора весовых коэффициентов (нейронов). Таким образом когда на вход анализатора поступает звуковой сигнал (речь человека), каким бы "зашумленным" он не был, его "образ" всегда примерно одинаков, так что машина способна "понимать" на какой звуковой файл из базы данных больше похож этот кусок и реагировать соответствующим образом.
Читай про нейросети и нечеткую логику! ;)


15 лет назад

RPI.su - самая большая русскоязычная база вопросов и ответов. Наш проект был реализован как продолжение популярного сервиса otvety.google.ru, который был закрыт и удален 30 апреля 2015 года. Мы решили воскресить полезный сервис Ответы Гугл, чтобы любой человек смог публично узнать ответ на свой вопрос у интернет сообщества.

Все вопросы, добавленные на сайт ответов Google, мы скопировали и сохранили здесь. Имена старых пользователей также отображены в том виде, в котором они существовали ранее. Только нужно заново пройти регистрацию, чтобы иметь возможность задавать вопросы, или отвечать другим.

Чтобы связаться с нами по любому вопросу О САЙТЕ (реклама, сотрудничество, отзыв о сервисе), пишите на почту [email protected]. Только все общие вопросы размещайте на сайте, на них ответ по почте не предоставляется.