Читаем Книга 3.0 Слушайте! полностью

Помимо djvu и pdf книги, не имеющие больше количества картинок и с хорошо распознанным текстом лучше просто сохранять в формате вордовских документов (как обычный текст в ворде). Это наиболее удобный формат для редактирования и прослушивания текста. При экспорте с файнридера часто удается автоматический установить гиперссылки, из содержания в текст. Т.е. программа сама расставляет ссылки, и нажав на оглавление можно перейти на соответствующий раздел в тексте.

Зачастую распознанные книги мне приходиться сохранять даже в трех различных документах. 1 - pdf – Акробат ридер. 2 - docx – водр 3 - txt – обычный текстовый документ открывается блокнотом. Третий формат занимает пустяковый размер и очень удобен для прослушивания книг на смартфоне. Хотя его недостатком является полное отсутствие картинок и какого-либо форматирования.

П. с.

Помимо этих появляются много других перспективных форматов и программ. Например, .fb2, .mobi, .epub и др. Но мне не приходилось ими пользоваться. Максимум перекодировал с них книги в привычный мне docx или txt. Хотя, по-хорошему, это уже будет считаться не формат книги, а формат документа. Но это уже тонкости и формальности…

Выводы и советы.

Надеюсь, данная информация пойдет на пользу обществу. И книг в плохом пережатом качестве с перекошенными не распознанными страницами, засунутыми вместе с разворотом в djvu будет встречаться все меньше. В интернете есть масса статей, как правильно распознать и сохранить книгу файнридером или ClearScan в формат pdf – (текст под изображением с добавлением гиперссылок в содержании) или в ворд. Поэтому на данных моментах останавливаться пока не буду. Хотя стоит отметить, что даже самая лучшая на сегодняшний день программа распознавания текстов не всегда справляется к примеру, с сложными химическими формулами и громоздкими таблицами. Из-за чего и приходиться сохранять поверх текстов изначально сканированные картинки. Однако, данная программа отлично распознает простые тексты, которые можно сохранить в ворд. Сэкономив в дальнейшем и время, и место на диске. В общем, работать еще есть над чем. Книги, в любом случае, для полноценной работы нужно распознавать, даже если они плохо распознаются, и распознанный текст имеет много ошибок. Так что очень надеюсь на дальнейшие разработки в данном направлении.

ссылки11 опубликовал12

П.с.

Вот еще не плохая статейка по теме: «Зачем нужны программы распознавания текста?»

Некоторые

комментарии к вышеприведённой статье.

Олег Антонов

Аксакал 28 марта 2014 в 18:31

#

Ответить

0

+1

- «Рома Болгарчук, если судить по электронным библиотекам, то стандартом де-факто стал fb2»

Мой ответ:

«Да. Спасибо за дополнение, про него в статье не упоминал, как и к примеру odt (OpenDocumentText) xhtml, html chm и др... Это все довольно перспективные форматы. Но честно говоря тема подобных форматов и опенсорс в целом, выходит далеко за рамки данной статьи. Просто мне надо было, наверно, в статье оговориться, что речь пойдет о форматах более популярных в среде Windows. Хотя, опять же, конечно, все больше появляется программ, работающих с разными форматами вне зависимости от системы. Тем не менее, мне почему-то с ним приходилось сталкиваться реже. Но они так же довольно популярны особенно при работе с художественной и некоторой научно-популярной литературой. Так что конечно мое мнение возможно и субъективно. Может ситуация характерна только для меня и связана с рядом факторов. 1 - использование системы Windows. 2 – получение файлов не через электронные библиотеки, а через соц. сети, торренты, файлообменники. 3- специфика самой литературы (научная и малоизвестная). Может из-за данных факторов так сложилось что около 90 % книг, которые мне встречались (а проработал я не мало) были именно в формате djvu, pdf или в лучшем случае doc, а иногда, к сожалению, и тхт. Тем не менее, изредка встречался и fb2. Но из-за того, что он редко встречается. Практический не знаю, как с ним работать. Хотя мне хватает просто перегнать его в тхт. И все же и данный формат достоин внимания т.к. он довольно шустро развивается на разных платформах и совершенно различных устройствах. Но я бы не стал переоценивать данный формат. По крайней мере, пока. Т.к. опенсорс мне кажется все еще сыроват, и пусть меня закидают тухлыми яйцами линуксоиды, но все же… Хотя это опять же отдельная тема.»

Другой комментарий

:

«Если изображение черно-белое – то расположенных в определенной очередности черных и белых точек, которые и будут «рисунком» буквы. Причем на каждую нарисованную точку потребуются те же 8 сигналов."? Это, мягко говоря, совершенно неверно.»

Ответ:

Перейти на страницу:

Все книги серии СамИздат

Вредители по найму
Вредители по найму

Жизнь начинающего колдуна Кея непроста. Из родного села пришлось уехать. Начал работать в городе, но перепутал волшебное зелье и оказался в долгах. Конкурентов много, и в помощники никто не берет. Единственный заработок – уличные бои, за гроши драться с матерыми оборотнями, стихийными магами, боевыми големами… Но однажды повезло – по заказу сглазил известного дуэлянта и на гонорар открыл свое дело. Приворожить мечту всей жизни, наложить проклятие на сорняки в огороде… Но не успел Кей превратиться в магического поденщика, как неожиданно к нему обратилась одна знатная дама с просьбой найти компромат на слишком идеального мужа. Загвоздка в том, что муж не только безупречен, но и могуществен. И он – не человек. Он – вампир.

Иван Владимирович Магазинников , Иван Магазинников

Самиздат, сетевая литература / Детективная фантастика / Фэнтези

Похожие книги

Сердце дракона. Том 6
Сердце дракона. Том 6

Он пережил войну за трон родного государства. Он сражался с монстрами и врагами, от одного имени которых дрожали души целых поколений. Он прошел сквозь Море Песка, отыскал мифический город и стал свидетелем разрушения осколков древней цивилизации. Теперь же путь привел его в Даанатан, столицу Империи, в обитель сильнейших воинов. Здесь он ищет знания. Он ищет силу. Он ищет Страну Бессмертных.Ведь все это ради цели. Цели, достойной того, чтобы тысячи лет о ней пели барды, и веками слагали истории за вечерним костром. И чтобы достигнуть этой цели, он пойдет хоть против целого мира.Даже если против него выступит армия – его меч не дрогнет. Даже если император отправит легионы – его шаг не замедлится. Даже если демоны и боги, герои и враги, объединятся против него, то не согнут его железной воли.Его зовут Хаджар и он идет следом за зовом его драконьего сердца.

Кирилл Сергеевич Клеванский

Самиздат, сетевая литература
Купеческая дочь замуж не желает
Купеческая дочь замуж не желает

Нелепая, случайная гибель в моем мире привела меня к попаданию в другой мир. Добро бы, в тело принцессы или, на худой конец, графской дочери! Так нет же, попала в тело избалованной, капризной дочки в безмагический мир и без каких-либо магических плюшек для меня. Вроде бы. Зато тут меня замуж выдают! За плешивого аристократа. Ну уж нет! Замуж не пойду! Лучше уж разоренное поместье поеду поднимать. И уважение отца завоёвывать. Заодно и жениха для себя воспитаю! А насчёт магии — это мы ещё посмотрим! Это вы ещё земных женщин не встречали! Обложка Елены Орловой. Огромное, невыразимое спасибо моим самым лучшим бетам-Елене Дудиной и Валентине Измайловой!! Без их активной помощи мои книги потеряли бы значительную часть своего интереса со стороны читателей. Дамы-вы лучшие!!

Ольга Шах

Фантастика / Самиздат, сетевая литература / Попаданцы / Фэнтези / Любовное фэнтези, любовно-фантастические романы