Спросите экспертов

Какова лучшая бесплатная программа OCR или ICR для транскрипции рукописи?

Какова лучшая бесплатная программа OCR или ICR для транскрипции рукописи?

Хавьер спрашивает:

Я писатель рассказов и сказок. Я ищу бесплатную программу оптического распознавания символов (OCR) или интеллектуального распознавания символов (ICR) для сканирования моих старых рукописей из изображений или фотографий, чтобы я мог преобразовать их в файлы Microsoft Word.

Существуют ли бесплатные и точные программы, способные сделать это? К сожалению, у меня нет сканера, но у меня есть доступ к цифровой камере с разрешением 20 мегапикселей.

рукопись

Ответ Каннона:

Как вы уже упоминали, есть несколько видов технологий распознавания символов, которые могут автоматически преобразовывать рукописные или печатные надписи в цифровые символы. Уровень точности этих видов программного обеспечения сильно различается в разных реализациях. Некоторые конвертируют по буквам, а другие могут конвертировать целые слова. Существует три основных категории этого программного обеспечения:

Оптическое распознавание символов

По правде говоря, OCR — это общий термин, и часто все методы, описанные в этой статье, называются OCR — однако Википедия дает OCR свою собственную классификацию, но современные реализации, как правило, объединяют несколько методов. Так что же это делает? OCR преобразует отдельные печатные или рукописные буквы в цифровые символы. Таким образом, программа просматривает документ, а затем пытается преобразовать его в простой текст, угадывая, что представляет собой каждый символ.

Программное обеспечение не идеально. Программное обеспечение OCR может неправильно истолковывать отдельные символы с похожим внешним видом, что приводит к ошибочным словам и неточным выводам. В большинстве случаев пользователи могут копировать текст, сгенерированный программой OCR, в текстовый процессор и автоматически исправлять орфографические ошибки. Часто ошибки будут отображаться в виде похожих символов. Например, буква «d» может быть представлена ​​как «cl».

Но когда дело доходит до рукописных текстов, распознавание текста не очень хорошо. По крайней мере, большинство бесплатных реализаций трагически плохи. Есть некоторые коммерческие продукты, которые действительно могут записать рукописную транскрипцию, но их цена делает их полностью недоступными для широкой публики. Например, есть программное обеспечение Lexmark для чтения оптических дисков ReadSoft . Это корпоративное программное обеспечение стоит тысячи долларов.

аннотированный-текст

Интеллектуальное распознавание символов

ICR является подмножеством OCR, которое специализируется на преобразовании рукописного текста в отдельные цифровые символы. Учитывая, что ваши заметки и рукописи написаны от руки, программа ICR является наиболее полезной. Однако я не уверен, насколько точно они могут конвертировать тексты, написанные на иностранных языках, таких как испанский. Как и в случае с OCR, пользователи могут улучшить качество выводимых текстов, скопировав их в текстовый процессор с включенной корректировкой орфографии, а затем отредактировав вручную.

Тест персонажа: 10 шрифтов, которые доказывают, что типографика может быть интересной

Интеллектуальное распознавание слов

Последней эволюцией OCR и ICR является программное обеспечение Intelligent Word Recognition . Вместо того, чтобы распознавать отдельные символы, он пытается перевести все рукописные слова. Как и OCR и ICR, интеллектуальное распознавание слов часто неправильно переводит слова и требует, чтобы пользователь вручную исправлял любые допущенные ошибки.

Какое лучшее бесплатное программное обеспечение для распознавания текста?

Тессеракт

Есть много доступных вариантов. Тессеракт , вероятно, лучшее программное обеспечение для оптического распознавания текста с открытым исходным кодом. Насколько мне известно, он смотрит только на отдельных персонажей, а не на целые слова.

Потому что вы используете Microsoft Word (который имеет лучшую, наиболее настраиваемую проверку орфографии проверить на предприятиях), вы можете просто скопировать весь текст в Word, а затем запустить проверку орфографии, чтобы убрать орфографические ошибки.

Тессеракт на самом деле является механизмом OCR, который запускается из командной строки. Если вы не готовы справиться с трудностями владения инструментом командной строки, вы, вероятно, захотите установить что-то более удобное для пользователя. Есть загружаемый «интерфейс» (или графический интерфейс пользователя), который позволяет использовать Tesseract в качестве инструмента перетаскивания: PDF OCR X. Сначала установите пакет программного обеспечения, затем запустите его. Вы увидите окно:

PDF OCR интерфейс

Затем вы просто перетащите файл изображения в окно. Как только изображение загрузится, запустите программу транскрипции OCR. Это может занять минуту или около того.

К сожалению, он оказался совершенно неадекватным для обработки вашего текста. Вот как это выглядит после извлечения текста из документа:

OCR извлечение изображения с использованием тессеракта

Microsoft OneNote

Поскольку кажется, что вы уже используете Microsoft Office, лучший вариант, вероятно, также от Microsoft. Я собираюсь догадаться, что у вас есть копия Microsoft Office, в которую входит OneNote. Это оснащено довольно продвинутой технологией OCR.

Кроме того, как на iOS, так и на Android есть также совершенно бесплатный объектив Microsoft Office , который может конвертировать JPEG (и другие форматы изображений) непосредственно в текст. Что делает мобильные версии такими замечательными, так это то, что вы можете снимать изображения, загружать их в систему облачных вычислений Microsoft, а затем запускать извлечение текста из OneNote на рабочем столе.

Процесс довольно прост. Сначала сфотографируй свой текст . Если вы решили использовать приложение OneNote, вам нужно всего лишь сохранить файл в своей учетной записи OneDrive. В противном случае перенесите изображение на свой компьютер и поместите в OneNote.

Затем щелкните правой кнопкой мыши изображение и выберите « Копировать текст из рисунка» в контекстном меню.

onenote извлечение текста

Затем щелкните правой кнопкой мыши пустую часть OneNote (или в приложении для чтения текста) и вставьте текст в . Вывод текста из вашего документа выглядит следующим образом:

onenote OCR извлечение текста

К сожалению, результаты OneNote не имеют ничего общего с хорошей работой, производя полную чушь. Это может быть вызвано сочетанием таких факторов, как искаженное изображение или запись, которые не выполняются по прямой линии, или просто потому, что программное обеспечение недостаточно хорошо.

Google Keep

На данный момент лучшее решение для распознавания рукописных документов относится к машинному обучению: в частности, глубокому обучению. Глубокое обучение — это сложный метод обучения компьютера выполнению задач, в которых ранее только человек обладал превосходством, таких как распознавание лиц ( Picasa выполняет распознавание лиц , хотите верьте, хотите нет). Google недавно приобрела DeepMind, которая разрабатывает технологию глубокого обучения Это приобретение ключа имело большой эффект: Microsoft проигрывает Google в OCR Сейчас Google предлагает один из самых продвинутых (и бесплатных) методов: Google Keep .

Google Keep (который мы впервые рассмотрели в 2013 году « ) также предлагает мобильную версию своего приложения для Android . Как и в OneNote, вы можете снимать изображения и передавать их прямо в облако Google. Просто перетащите изображение в окно Google Keep. Затем нажмите кнопку меню (три вертикальные точки) и выберите « Захватить текст изображения» в контекстном меню.

Google Keep

Вот как это выглядит после извлечения текста:

2015-07-18_19h45_34

Google Keep Wins

Как видите, Google Keep доминирует в конкурентной борьбе. Результаты могут быть еще более улучшены с помощью инструмента редактирования изображений. инструментов чтобы увеличить контраст и выровнять изображение.

Надеюсь, эти варианты помогут. Если вам нужны дополнительные возможности распознавания текста, посмотрите 5 лучших инструментов распознавания текста 5 лучших инструментов , для получения дополнительной информации.

Похожие посты
WindowsСпросите экспертов

Как отключить автоматическое обновление приложений в Windows 10

БезопасностьСпросите экспертов

Как просто и эффективно справиться с троянами удаленного доступа

Спросите экспертов

Как мне разблокировать Sprint IPhone 6?

Спросите экспертов

Как писать запросы Microsoft Access SQL с нуля