Компания Intel представила программное обеспечение, которое позволит обычному ПК читать по губам, что является большим шагом вперед в разработке приложений распознавания речи.


10:04, 30  апреля  2003
Пакет Audio Visual Speech Recognition (AVSR) следит за мимикой говорящего человека – движениями лица и губ. После сопоставления полученных данных с речью, программа может предоставить компьютеру достаточно данных для распознавания речи, даже если запись голоса производилась в шумном помещении. Многие компьютерные компании уже давно занимаются проблемой распознавания голосовых команд, но все упиралось в несоответствии производительность большинства пользовательских ПК и выпускаемого ПО. Однако теперь, с выходом 3GHz процессоров ситуация начинает выправляться. Оптимальным, по мнению исследователей считается способ при котором визуальный сигнал синхронизируется с голосом, как это реализовал Intel. Для примера, Microsoft недавно разработала прототип программы под названием GWindows, с помощью которого пользователь может выполнять некоторые действия – скроллинг, закрытие окон – путем комбинации голосовых команд и жестов.

Читайте также

Комментарии

Загрузка комментариев...