При работе с рисунками после сканирования следует сохранить изображение в графическом формате. Для этого выполните команду Файл → Сохранить пакет как и укажите имя и тип сохраняемого файла.
Создав графический файл, вы всегда сможете обработать его в графическом редакторе, например Paint или Photoshop: обрезать лишние блоки, добавить надписи, подкорректировать рисунок.
Если вы имеете дело с текстом, следующим этапом вашей работы будет распознавание. Задача распознавания состоит в том, чтобы превратить отсканированное изображение в текст, сохранив при этом оформление страницы.Примечание
Если при сканировании вы сохранили результат в виде графического файла, его можно открыть для последующей обработки, выполнив команду Файл → Открыть PDF/изображение.
По умолчанию в окне программы FineReader отображаются одновременно два окна – Изображение и Текст. Можно управлять их отображением на экране с помощью специальных кнопок панели инструментов FineReader: кнопка Показывать оба окна означает исходное состояние размещения окон, можно нажать кнопку Показывать окно Изображение или Показывать окно Текст и отобразить таким образом только необходимое. Кроме этого, в полях Масштаб каждого окна можно задать масштаб исходного изображения. Дополнительные настройки внешнего вида окна доступны в меню Вид.
Если ваша страница содержит только сплошной текст, вы можете смело переходить к распознаванию. Однако если на странице есть изображения, схемы или таблицы, перед запуском процедуры распознавания следует провести анализ макета страницы (сегментирование). Он позволяет разбить страницу на блоки, указав тем самым, какие именно участки полученного изображения следует распознать, а какие можно будет проигнорировать.
Анализ макета страницы можно проводить автоматически или вручную. Автоматическое сегментирование FineReader осуществляет, если сразу после сканирования запустить процесс распознавания. Для этого вам нужно нажать кнопку Распознать на панели инструментов. Вручную выделять блоки есть смысл, если вы хотите распознать не весь отсканированный документ, а лишь его часть либо если в результате автоматического сегментирования блоки были выделены неверно.
Для анализа макета страницы необходимо выполнить команду Процесс → Распознать → Анализ макета страницы. Программа произведет автоматическое разбиение страницы на блоки (рис. 9.3). Для выделения или редактирования блока следует воспользоваться командой Изображение → Изменить тип блока и в появившемся меню выбрать нужный тип. Например, если у вас в тексте встречаются иллюстрации, пометьте их с помощью типа блока Картинка – выбрав пункт меню, следует выделить в окне Изображение нужный фрагмент. Точно так же помечаются текст и таблица.
Рис. 9.3. Анализ макета страницы