• 1Софт - ваш навигатор в мире софта!
  • Электронная дистрибьюция — один из современных методов распространения легального программного обеспечения и контента без использования материальных носителей.

Выбор региона

Выбрать город

Выбор региона и города

Лицензии 1С и Microsoft в облаке. Готовые бизнес-решения в аренду

ABBYY FineReader 10.0 professional Edition - Как распознать документы

Если предыдущие версии программы были ориентированы в основном на работу с документами, оцифрованными сканером или сверстанными в PDF, то десятая версия программы умеет распознавать и фотографии, снятые на обычные фотоаппараты или даже мобильные телефоны с камерой. Рассмотрим основные особенности последней версии ABBYY FineReader.

Программа ABBYY Finereader наиболее известный и распространенный инструмент по сканированию и распознаванию документов. Благодаря успешному развитию технологии оптического распознавания текста в десятой версии продукта значительно улучшилось качество распознавания, и появились новые возможности по экспорту полученных результатов в различные электронные форматы. Если предыдущие версии программы были ориентированы в основном на работу с документами, оцифрованными сканером или сверстанными в PDF, то десятая версия программы умеет распознавать и фотографии, снятые на обычные фотоаппараты или даже мобильные телефоны с камерой. Рассмотрим основные особенности последней версии ABBYY FineReader.

Сканирование и распознавание фотографий

В ABBYY FineReader 10 функция распознавания фотографий в текст существенно ускоряет процесс перевода бумажного документа в электронный вид, так как фотографирование бумаг и документов осуществляется гораздо быстрее сканирования. Технология позволяет перевести в текст даже снятые на мобильный телефон фотографии с низким разрешением — от 2 мегапикселей. Кроме того, процесс ускоряется также за счет того, что пользователю необязательно копировать фотографии с фотоаппарата на жесткий диск ПК. Достаточно просто воспользоваться командой «Получить изображение и распознать» при подключенном фотоаппарате. При этом полученный текст сразу выводится в окне текстового редактора.

ABBYY FineReader 10 позволяет в ходе подготовки изображения к распознаванию провести обработку, повышающую качество результата работы OCR-движка. У обрабатываемой фотографии можно улучшить четкость, применить шумоподавление, исправить некоторые виды геометрических искажений, причем эти операции проходят в автоматическом режиме. В прошлых версиях FineReader условно можно было работать с отснятыми фотографическими изображениями, однако в целом, очень многое зависело от качества съемки. Так, отснятый разворот книги мог некорректно восприниматься OCR-механизмом, поэтому такие страницы содержали «мусор» ближе к сгибу. В новой версии подобные сложности преодолены — движок автоматически «исправит» неверный угол при съемки книги.

Если качество изображения фотографии совсем плохое, то графическим редактором ABBYY FineReader 10 можно пользоваться вручную — программа предоставляет возможность регулировать настройки устранения размытия, обрезать нужную часть изображения с точностью до пикселей. Можно редактировать цветовой спектр изображения благодаря опции «Инвертировать цвета», а также менять качество или удалять часть ненужного текста. Данные настройки изображения, выставляемые в графическом редакторе, можно применить автоматически ко всем изображениям, импортируемым в программу.

Интеллектуальное распознавание элементов и форм

В ABBYY Finereader 10, в отличие от предыдущих версий, улучшилась функция определения структуры сканируемого текста. Это осуществляется благодаря новейшей технологии адаптивного распознавания документов (ADRT — Adaptive Document Recognition Technology), предоставляемой теперь во второй версии (в ABBYY FineReader 9 была ADRT 1.0).

Текст распознается не постранично, как раньше, а сразу как единое целое. Благодаря этому происходит точное определение всех элементов текста, включая заголовки, сноски, подписи под картинками, таблицы, колонтитулы. Если сканирование проводится сразу в определенный формат, например MS Word, то итоговый текстовый документ будет содержать нужные элементы в виде соответствующих форм, а не просто как текст. Это очень существенно упрощает работу, потому что избавляет пользователя от выполнения дальнейших рутинных операций по форматированию в редакторе распознанного текста. В новой версии ADRT позволяет определять еще больше элементов форматирования текста, что позволяет на порядок облегчить процессы вычитки итогового документа в текстовом редакторе. ABBYY FineReader 10 помимо классических функций распознавания отсканированного текста в форматы Microsoft Word, Microsoft Excel, PDF, теперь предоставляет возможности сканирования в HTML, что позволяет создавать многостраничные сверстанные электронные книги с оглавлениям и разбивкой по главам в виде отдельных страниц. Получившийся результат можно скомпилировать, например, для создания файлов справки.

При процессе распознавания используется проверка орфографии для основных 39 языков, в том числе и для нескольких «мертвых». Сам же механизм распознавания приобрел в новой версии поддержку нескольких новых языков, доведя общее количество до 186. При этом качество «понимания» текстов на азиатских языках улучшилось на 30%, а на европейских — на 20%.

В десятой версии существенно расширились возможности работы с PDF. ABBYY FineReader и ранее позволяет осуществлять операции с распознаванием, позже с конвертацией в PDF и из PDF-файлов в популярные офисные форматы, однако реализация подобной функции в приложении имела недостаточно опций. В новой 10-й версии PDF-файл можно сжимать до нужного размера, а также переводить в архивный формат PDF/A, который является оптимальным для хранения PDF-документов. Кроме того, при загрузке приложения появляется интерактивный мастер с уже предустановленным сценарием автоматической переконвертации PDF в Word.

Дополнительные возможности

Для того чтобы упростить распознавание сложного и большого по объему текста, содержащего большое количество специальных символов или своеобразные шрифты, предназначена функция «Распознавание с обучением». Программа предлагает пользователю создать шаблон, содержащий эти нестандартные элементы. Благодаря такому «эталону» ABBYY FineReader 10 может ускорить и оптимизировать распознавание оставшегося объема текста.

Если документ содержит сразу несколько языков, то для упрощения работы можно воспользоваться функцией объединения языков в группы.

Кроме того, для оптимизации работы в ABBYY FineReader 10 можно настраивать менеджер сценариев в соответствии с поставленными целями. Он предполагает составление последовательности выполнения операций в программе и аналогичен макросам, например, в MS Word.

Большим плюсом ABBYY FineReader 10 является совместимость со всеми основными платформами, включая последнюю на сегодняшний день версию Microsoft Windows 7. По существу, среди OCR-продуктов на платформе Windows решение от компании ABBYY занимает уже длительное время лидирующие позиции. Условные «конкуренты» в лице популярных в 1990-х годах приложений для домашних пользователей, несмотря на периодический выпуск новых версий, серьезно отстают как по качеству распознавания, так и по функциональности. ABBYY FineReader, в свою очередь, в каждой новой версии упрощает работу пользования для перевода бумажных документов в электронные форматы, среди которых файлы MS Word, PDF и HTML. Особое отличие программы от предыдущих версий состоит в том, что пользователю больше не нужен сканер, а достаточно самого простого и дешевого фотоаппарата или телефона с камерой, фотографии с которого могут быть качественно распознаны. Кроме того, подобное решение работает быстрее предыдущих версий. Удобный интерфейс, поддерживающий Windows 7, возможность автоматической и ручной обработки изображений для сканирования, улучшенный механизм анализа структуры документа, позволяющий создавать электронные книги, — выгодно отличает новую версию OCR-приложения не только от предыдущих изданий ABBYY FineReader, но и от немногочисленных конкурентов.

Программа выпускается в двух редакциях — ABBYY FineReader 10 Professional Edition и ABBYY FineReader 10 Corporate Edition. Первый вариант предназначен для работы с документами в офисе, а также для личного использования. Второй вариант ориентирован на масштабный документооборот в крупных компаниях (поддержка сетевой установки, администрирование, корпоративная схема лицензирования). Приобрести приложение в России можно у партнеров 1Софт.

Романенко Людмила

Все права защищены. По вопросам использования статьи обращайтесь на 1csoft@1cnw.ru


ВКонтакт Facebook Google Plus Одноклассники Twitter Яндекс Livejournal Liveinternet Mail.Ru
Партнерам!
ПреимуществаПреимущества и условияусловия участия в проекте 1Софт!
Rambler's Top100