Читаем Описание работы пакета OOoFBTools Создание книг FB2 полностью

3. Обрабатывать либо только маркированные абзацы, либо любые не маркированные абзацы, либо – и те и другие. Когда инструмент находит маркированный абзац, он удаляет из него маркер и его признак.

Очень часто после OCR, некоторые виды маркеров в тексте экспортируются в fb2-файл не корректно, что проявляется их «кривым» отображением в читалках. Данный инструмент решает эту проблему.

Экспорт теста с маркерами требует кодировки UTF-8, что влечет за собой увеличение размера результирующего fb2-файла. Используя данный инструмент можно заменить все маркеры на символ маркера, что позволит делать экспорт текста в кодировке Windows-1251 для уменьшения размера fb2-файла. Конечно, при условии, что в тексте отсутствуют Юникодные символы.


III.5. Замена простых пробелов на неразрывные


Инструмент вызывается либо из меню OOoFBTools. Либо на нажатию кнопки на панели инструментов.

Такая замена пробелов полезна, когда в документе простыми пробелами заданы структуры текста. В fb2-файле простые пробелы после конвертации сохраняются, но читалки и fb2-редакторы "воспринимают" множественные простые пробелы, как один. Тем самым структура текста нарушается. Данный инструмент просто заменяет все простые пробелы на неразрывные (сохраняя их число) либо в выделенных фрагментах текста, либо во всем документе.

Не рекомендуется производить замену во всем документе:

1. Замена происходит медленно – посимвольно. Этот алгоритм вполне достаточен для обработки небольших фрагментов текста. Поэтому для обработки большого объема текста потребуется много времени.

2. Часто множественные пробелы в тексте встречаются из-за неправильного форматирования (обработка текста из Интернета, после OCR и т. д.). Зачастую они не несут никакой смысловой нагрузки. Если же все простые пробелы заменить на неразрывные, то в читалке текст fb2-файла с множественными неразрывными пробелами будет выглядеть некрасиво. Поэтому все множественные простые пробелы лучше заменить на один простой пробел с помощью инструмента Корректор Текста. А потом уже можно задавать нужные вам структуры текста, отбивая уровни пробелами, которые легко и быстро заменяются данным инструментов в выделенном фрагменте текста.

IV. Виртуальные клавиатуры

IV.1. Виды виртуальных клавиатур


Иногда требуется в текст документа (корректура, правка после OCR) ввести Unicode символы. Удобнее для этого использовать соответствующие виртуальные клавиатуры:

1. Различные символы (стрелки, ноты…):

2. Математическая:

3. Цифровая:

4. Валютная:

5. Греческая виртуальная клавиатура:

6. Еврейская виртуальная клавиатура:

Для каждой кнопки виртуальных клавиатур (валютная, греческая и еврейская) заданы соответствующие всплывающие подсказки. Пользуйтесь ими, чтобы узнать название символов и (или) букв.

Для клавиатуры с разными символами цветами выделены символы одной логической группы.

Для греческой виртуальной клавиатуры цветами выделены три вида букв – без дополнительных знаков, с 2-мя дополнительными знаками и с 3-мя дополнительными знаками. Так легче искать то, что нужно.


IV.1. Это важно!


Если вы при корректуре документа использовали эти виртуальные клавиатуры, и хотите экспортировать его в fb2 формат, то для экспорта в конвертере выбирайте кодировку utf-8! Почему? Потому что символы виртуальных клавиатур – Unicode символы. И сохранение Unicode символов в другой кодировке (в нашем случае в windows-1251) все испортит – они просто не экспортируются нормально. Поэтому, в этом случае при конвертировании используйте utf-8!

V. Валидаторы

Валидатор предназначен для того, чтобы проверить, соответствует ли fb2-файл схеме FictionBook. Т. е. – есть ли в файле ошибки.

FB2 Валидатор позволяет выбрать нужный fb2-файл и проверить его. В случае его валидности выдается соответствующее сообщение. Если же файл не соответствует хоть в чем-то схеме – то выдается сообщение с указание номера строки и символа в файле, где найдена ошибка, а также краткое описание, что за ошибка.

Запускается Валидатор либо через кнопку fb2Validator на панели инструментов OOoFBTools, либо через меню OOoFBTools – › fb2Validator… (и панель инструментов, и меню создаются автоматически при установки пакета расширения OOoFBTools).

Пока Валидатор работает только для системы Windows.

Планы по развитию пакета OOoFBTools (TODO)

A. Конвертер ExportToFB21


1. Сделать то, что не реализовано (см. п.1.3.), по мере возможности и способности.

2. Оптимизация скорости парсинга.

3. Минивалидатор форматирования стилями текста – выдает сообщение о соответствии/не соответствии помеченного стилями документа схеме FictionBook2.2.

4. Редактор структуры уровней документа – изменения номера уровня и т. д.

5. Просмотрщик элементов структуры (поэмы, цитаты…) в виде дерева и списка элементов, с возможностью перехода на нужный элемент в документе.

6. Что-нибудь еще…


Б. «Ёфикация»


1. «Ёфикация», т. е. автоматический и ручной поиск и замена в соответствующих словах буквы «е» на «ё».


В. Импорт fb2-файлов


1. Как xml-код.

Перейти на страницу:

Похожие книги

C++: базовый курс
C++: базовый курс

В этой книге описаны все основные средства языка С++ - от элементарных понятий до супервозможностей. После рассмотрения основ программирования на C++ (переменных, операторов, инструкций управления, функций, классов и объектов) читатель освоит такие более сложные средства языка, как механизм обработки исключительных ситуаций (исключений), шаблоны, пространства имен, динамическая идентификация типов, стандартная библиотека шаблонов (STL), а также познакомится с расширенным набором ключевых слов, используемым в .NET-программировании. Автор справочника - общепризнанный авторитет в области программирования на языках C и C++, Java и C# - включил в текст своей книги и советы программистам, которые позволят повысить эффективность их работы. Книга рассчитана на широкий круг читателей, желающих изучить язык программирования С++.

Герберт Шилдт

Программирование, программы, базы данных
Разработка приложений в среде Linux. Второе издание
Разработка приложений в среде Linux. Второе издание

Книга известных профессионалов в области разработки коммерческих приложений в Linux представляет СЃРѕР±РѕР№ отличный справочник для широкого круга программистов в Linux, а также тех разработчиков на языке С, которые перешли в среду Linux из РґСЂСѓРіРёС… операционных систем. РџРѕРґСЂРѕР±но рассматриваются концепции, лежащие в основе процесса создания системных приложений, а также разнообразные доступные инструменты и библиотеки. Среди рассматриваемых в книге вопросов можно выделить анализ особенностей применения лицензий GNU, использование СЃРІРѕР±одно распространяемых компиляторов и библиотек, системное программирование для Linux, а также написание и отладка собственных переносимых библиотек. Р

Майкл К. Джонсон , Эрик В. Троан

Программирование, программы, базы данных
Adobe InDesign CS3
Adobe InDesign CS3

Книга посвящена верстке и макетированию в программе Adobe InDesign CS3. Помимо того что в ней описываются возможности программы, рассматриваются также принципы и традиции верстки, приводятся примеры решения типичных задач. Все это позволит читателю не только овладеть богатым инструментарием программы, но и грамотно применять его.Материал книги разделен на логические части: теоретические сведения, инструментарий программы, решение задач, – а также рассчитан на два уровня подготовки читателей – начинающих и опытных пользователей, что выгодно отличает книгу от других изданий. Это позволит применять ее как новичкам для знакомства с программой, так и пользователям со стажем для пополнения своих знаний.

Владимир Гавриилович Завгородний , Владимир Завгородний

Программирование, программы, базы данных / Программное обеспечение / Книги по IT