Производительность

Как голосовой набор текста является новой лучшей функцией Google Docs

Как голосовой набор текста является новой лучшей функцией Google Docs

Распознавание голоса раньше было ужасно неточным. Это работало только для горстки людей. Но теперь это на самом деле довольно хорошо, благодаря совместным усилиям Nuance, Microsoft, Apple и Google, которые потратили бесчисленные ресурсы на его фактическое улучшение.

Из всех этих компаний лишь немногие достигли приверженности распознаванию голоса Google, который сделал ее фундаментальной стратегией в области мобильных устройств и услуг.

Одним из самых ранних набегов Google был недолговечный GOOG-411 (или локальный поиск Google Voice). Он был запущен в 2008 году и позволял людям искать деловые номера телефонов, используя свой голос. Технология распознавания голоса также была центральной частью Android, и с запуском JellyBean самые он наконец стал доступен в автономном режиме.

Ранее на этой неделе Google наконец-то ввел распознавание голоса в Google Docs.

Пользователи могут буквально диктовать свои документы (так же, как я делаю с этой статьей) без необходимости устанавливать дополнительное программное обеспечение или плагины. Это значительный скачок вперед для набора онлайн-офисов, но хорошо ли это?

Начиная

Прежде чем мы углубимся в его функции, я хочу коснуться того, как вы получаете Google Voice Typing. Если у вас есть учетная запись Google, у вас уже есть это. Просто откройте Google Docs и откройте новый или существующий документ. Затем появится окно, в котором вас спросят, хотите ли вы попробовать диктофон. Нажмите Попробуйте .

GoogleVoiceTypingTry

Затем вы должны дать Google Документам разрешение на использование вашего микрофона. Просто нажмите « Разрешить» во всплывающем окне.

MicrophonePermission

Затем вам нужно выбрать язык, который вы хотите использовать с Google Voice Typing. Диапазон предлагаемых языков и диалектов — от английского и испанского до африкаанс и арабский.

Снимок экрана 2016-02-25 в 10.14.12

Затем просто нажмите значок микрофона и начните говорить.

Насколько это точно?

Одно из самых больших препятствий на пути распознавания голоса в основной аудитории заключается в том, что зачастую оно недостаточно точное . Раньше считалось, что если вы используете распознавание голоса, вам придется потратить несколько часов на редактирование и исправление текста. Так как же Google предлагает тариф в этом отношении?

На самом деле довольно благоприятно . По большей части Google Voice Typing понял, что я сказал, хотя у меня есть региональный английский акцент ( мы поговорим об акцентах позже ).

GoogleVoiceOn

Я был особенно впечатлен тем, как распознавание голоса Google обрабатывает фоновые шумы. Когда я писал эту статью, в моей гостиной лаял йоркширский терьер, и мое окно было частично открыто. Я живу на оживленной дороге, где машины постоянно проезжают. Но, несмотря на это, Google удалось отфильтровать это и сосредоточиться только на том, что я говорил.

Самой большой проблемой была Google Voice Typing, часто боролась с пунктуацией. Я бы сказал «запятая», «точка» и «полная остановка», и это означало бы, что я хочу написать «запятая», «точка» и «полная остановка». Это было неприятно по двум причинам.

Полная остановка

Во-первых, потому что это дразнит меня, сначала используя правильную пунктуацию, прежде чем немедленно вернуться к изложенной версии слова. Не было никакого способа остановить это, и мне пришлось бы вручную редактировать документ, чтобы исправить это.

Но, может быть, хуже, я не мог предотвратить это. Там нет словаря, где вы могли бы переопределить правописание. Это просто случается, и вам приходится иметь дело с этим.

Я не хочу преуменьшать, как это расстраивает. Это серьезно раздражает . Но я уверен, что это также улучшится по мере того, как все больше и больше людей будут использовать эту функцию, а Google будет выделять больше ресурсов для улучшения распознавания голоса.

Помимо этого особого раздражения, я был очень доволен точностью распознавания голоса Google.

Как это обрабатывает ударения

Я был поражен тем, сколько языков и диалектов поддерживает Google Voice Typing. Только на английском языке он поддерживает новозеландский, австралийский, индийский, южноафриканский, американский и британский диалекты, и это лишь некоторые из них. Проблема в том, что на самом деле нет американского акцента, как нет британского акцента. Скорее, есть ряд акцентов и диалектов, которые отличаются от места к месту.

Это правда, что в Великобритании есть акцент для каждого почтового индекса. Команда может похвастаться различными акцентами среди британского персонала. Кристиан Коули говорит с широким акцентом в Мидлсбро. Роб Найтингейл , родом из Саутпорта, имеет более северный оттенок. В то время как у Марка О’Нила есть шотландский звон.

Я живу в Ливерпуле, поэтому у меня есть акцент Scouse, который слегка дрейфует в Атлантику, во многом благодаря моей американской невесте и времени, которое я провел в Швейцарии.

И справедливо сказать, что программы распознавания голоса часто пытаются понять региональные английские диалекты. Например, когда появилась Siri, ее неспособность понять шотландских пользователей стала настоящей шуткой.

Но предложение Google было исключительным. Поверьте мне, когда я скажу, что вам не придется практиковаться в разговоре с другим акцентом. Я говорил с несколькими друзьями, у которых также есть региональные английские акценты, и у них был такой же положительный опыт с этим. Хотя я признаю, что это небольшой и совершенно ненаучный образец, он, безусловно, многообещающий.

Скорость голосовой диктовки

Программы распознавания голоса традиционно страдают от неспособности идти в ногу со скоростью, с которой диктует пользователь. По общему признанию, я был немного обеспокоен тем, что предложение Google не будет отличаться, особенно если учесть, что это онлайн-сервис, а не программа, работающая на моем новом MacBook Pro.

Но я был впечатлен. Google был в состоянии не отставать от моего уровня речи с высоким содержанием кофеина и не выступал узким местом в моей продуктивности. Это была полная противоположность моему опыту с другими инструментами голосовой диктовки.

VoiceRecognitionSpeed

Я не знаю, было ли это потому, что у меня быстрый FTTC (оптоволокно для кабинета). В домашнее интернет-соединение или тот факт, что у Google есть неограниченное количество быстрых серверов в своем распоряжении. В любом случае, я смог сделать что-нибудь.

Примечание по микрофонам

Встроенные микрофоны, как правило, поражают воображение. По моему опыту, они либо превосходны, как на ноутбуках Apple, либо нет. Там очень редко какая-либо золотая середина.

Как правило, самые дешевые ноутбуки будет иметь худшие внутренние микрофоны. Это лишь одна из тех функций, которые обычно игнорируются производителями устройств.

Я начал диктовать эту статью, используя внутренний микрофон на моем MacBook Pro. Хотя Google Docs часто говорил, что у меня проблемы со слухом, это не переводило на более медленную или неточную диктовку. Все работало просто отлично.

Я также попробовал Google Voice Typing с дорогим внешним микрофоном Blue Yeti . Это микрофоны подкаст-качества, которые продаются на Amazon более чем за 100 долларов.

По общему признанию, я не заметил никаких различий, когда речь шла о точности или скорости диктовки. Однако самым большим преимуществом использования этого микрофона было то, что я смог вставить пару наушников AKG и использовать их в качестве монитора. Это позволило мне лучше осознавать фоновый шум и самонастраиваться, если я был слишком громким или слишком тихим.

Последние мысли

Распознавание голоса Google не идеально. Но это не удивительно, так как надежное распознавание голоса — довольно трудный подвиг. Я чувствовал, что многое можно улучшить.

В основном это связано с тем, как программное обеспечение работает с пунктуацией и структурой предложений. В идеальном мире Google автоматически вставляет знаки препинания в зависимости от ритма и частоты вашего голоса, но мы далеки от этого.

Также жаль, что это программное обеспечение еще не вошло в другие предложения Google, такие как Gmail. В идеале мне бы хотелось иметь возможность загружать Google Voice Typing в качестве приложения и использовать его с другими программными средствами, такими как «Страницы iWork. или редактор уценок IA Writer .

Но это два небольших неудобства, Google Voice Typing так же хорош, как он получает. Для контраста, я написал этот раздел статьи, используя встроенное распознавание голоса в OS X, и это было далеко не так точно и не так быстро.

Если это не убедит людей перейти на Google Drive, я не знаю, что будет.

Теперь к вам! Вас искушало распознавание речи на Google Диске? Вы уже попробовали это? Расскажите мне все об этом в комментариях ниже.

Похожие посты
Производительность

Excel против Google Sheets: какой из них лучше для вас?

Производительность

Как улучшить управление документами с помощью свойств в Microsoft Office

ИнтернетПроизводительность

5 инструментов для извлечения изображений из файлов PDF

AndroidПроизводительность

Adobe Reader X добавляет защищенный режим для пользователей Windows, Android получает новые функции [Новости]