Как перевести книгу в формат DJVU


Как перевести книгу в формат DJVUВо многих случаях формат DjVu оказывается более предпочтительным для хранения книг и документации, чем PDF, хотя некоторые моменты при создании документа у них являются общими. Давайте рассмотрим основные моменты подготовки DjVu на основе любой книги. Сразу настройтесь на то, что не получите полной инструкции в одном флаконе – это слишком обширная тема, поэтому придется читать и иные статьи, и, вообще, проникаться философией этого замечательного формата. Но с чего-то нужно начинать?

Формат DjVu славится тем, что позволяет создавать компактные документы на основе сканированных страниц. Сканировать книгу можно в виде монохромного изображения, серого или цветного. Это зависит от качества символов, наличия иллюстраций и ценности заднего фона (!). Дело в том, что некоторые книги являлись редкостью и могли сопровождаться пометками от руки от довольно известных людей. Это свойство хотелось бы сохранить.

Для сканирования нужен CCD сканер, причем сканировать можно как отдельные страницы, так и целые развороты. Не нужно портить ресурс сканера, пытаясь сделать изображение «прямым» – для его выпрямления служат специальные программы. Гораздо важнее на этом этапе задать достаточные параметры для создания сырого материала. Так, для ч/б сканирования нужно задавать разрешение до 600-800 dpi, для серых – до 400 dpi, для цветных столько же. Многое зависит от качества исходника. Ни в коем случае нельзя сохранять сырой материал в формате JPG, нужно выбирать TIF или иной формат кодирования без потерь.

Сырые страницы хранятся в отдельном каталоге и не меняются, вся работа должна производиться только с их копиями. А работы предстоит много. Во-первых, нужно открыть каждую страницу в специальном редакторе и настроить ее нормальную ориентацию. Этот процесс называется Deskew и поддерживается в любом графическом пакете. Во-вторых, из сканов нужно убрать точки и другие паразитные артефакты. К примеру, черные полосы с разворота листов. Действовать нужно аккуратно, не удалив важный материал. Этот процесс уже носит другое название – Despeckle, и служит для удаления отдельно стоящих точек в документе. Есть еще множество других фильтров, одни из которых убирают шумы, другие работают с цветом подложки и т.д. Хорошим тоном будет считаться отдельная операция распознавания символов, чтобы текст DjVu документа можно было копировать и проводить по нему поиск и составление оглавления. В этом случае текст попадает на специальный невидимый слой документа, привязанный к графике. Вы выделяете графическую область, а в буфер обмена попадает текст из скрытого слоя.

Основной задачей оптимизации слоев документа занимается компилятор, которые выбрасывает лишнюю информацию о цветах, оптимизирует палитры, сжимает текст, добавляет служебные поля для документа. Для компиляции в DJVU формат можно использовать программы:

  • DjVu Small
  • DjVu Imager
  • Scan Tailor
  •  DjVu Pal
  • Book Restorer

P.S. Если у вас возникли проблемы с техникой, обращайтесь в наш компьютерный сервис либо закажите выезд компьютерного мастера.