Приложения

Что такое распознавание речи?

Распознавание речи — это технология, позволяющая вводить речь в системы. Вы говорите со своим компьютером, телефоном или устройством, и оно использует то, что вы сказали, как ввод, чтобы вызвать какое-то действие. Эта технология используется для замены других методов ввода, таких как ввод, нажатие или выбор другими способами. Это средство сделать устройства и программное обеспечение более удобными для пользователя и повысить производительность.

Существует множество приложений и областей, в которых распознавание речи используется, в том числе военное, в качестве помощи для людей с ограниченными возможностями (представьте себе человека с ограниченными возможностями или без рук или пальцев), в области медицины, робототехники и т. Д. В ближайшем будущем почти все будут подвергаться распознаванию речи из-за ее распространения среди распространенных устройств, таких как компьютеры и мобильные телефоны.

Некоторые смартфоны интересны в использовании распознавания речи. Устройства iPhone и Android являются тому примером. Через них вы можете инициировать вызов контакту, просто получив устные инструкции, такие как «Позвонить в офис». Также могут быть использованы другие команды, такие как «Включить Bluetooth». 

Проблемы с распознаванием речи

Распознавание речи в своей версии, известной как Speech to Text (STT), также долгое время использовалось для перевода произносимых слов в текст. «Вы говорите, это печатает», как сказал бы ViaVoice на своей коробке. Но есть одна проблема с STT, поскольку мы знаем это. ViaVoice является одним из лучших в отрасли, поэтому представьте себе все остальное. Технология выросла и улучшилась, но речь к тексту все еще заставляет людей задавать вопросы. Одна из основных трудностей — огромные различия в произношении людей.

Не все языки допускаются в распознавании речи, и те, которые это делают, часто не поддерживаются, а также английский. В результате большинство устройств, на которых установлено программное обеспечение для распознавания речи, работают разумно только на английском языке. 

Набор требований к оборудованию затрудняет развертывание распознавания речи в определенных случаях. Вам нужен достаточно интеллектуальный микрофон, чтобы отфильтровать фоновые шумы, но в то же время достаточно мощный, чтобы естественным образом улавливать голос. 

Говоря о фоновом шуме, это может привести к выходу из строя всей системы. В результате во многих случаях происходит сбой распознавания речи из-за помех, которые находятся вне контроля пользователя. 

Распознавание речи оказывается лучше в качестве метода ввода для новых телефонов и технологий связи, таких как VoIP, чем в качестве инструмента повышения  производительности для массового ввода текста.

Приложения распознавания речи 

Технология набирает популярность во многих областях и добилась успеха в следующих областях: 

Похожие посты
Приложения

34 лучших бесплатных программных инструмента для резервного копирования

Приложения

Лучшие онлайн-инструменты для встреч

Приложения

11 лучших бесплатных почтовых аккаунтов

Приложения

7 бесплатных языков программирования для обучения детей кодированию