PDA

Просмотр полной версии : Djvu - подробно о формате.


invisible
03.02.2008, 23:59
Djvu - подробно о формате

Формат Djvu разрабатывался как методика сжатия и программная платформа для публикации сканированных и цифровых документов, а также высококачественного изображения в сети Интернет.

DjVu (произносится как "дэжа вю") это технология сжатия, файловый формат и универсальная платформа специально спроектированная для создания цифровых библиотек на основе печатного, сканированного или цифрового материала. Так например для сканированного документа, размер DjVu файла обычно в 3-10 раз меньше чем чёрно-белый TIFF или PDF и в 5-10 чем цветной JPEG.

Обычная страница из книги, журнала или древней рукописи отсканированная в цвете и 300dpi содержит порядка 8 миллионов пикселей и занимает 24MB в несжатом виде. Традиционные технологии сжатия такие как JPEG обладают следующими минусами:

Типичные размеры JPEG файла на страницу находятся в рамках между 400KB и 2MB в лучшем качестве, что является абсолютно непригодным для удалённого доступа.

Острые грани (в символьных структурах) - причина многочисленных потраченных впустую бит и/или неприятных артефактов.

Большие изображения очень медленно рендрятся, требуя объёмный буфер памяти для распаковки в клиенте, а ещё их проблематично увеличить или распечатать в существующих браузерах.

Текст обычно не отделяется от изображения и по этому не может быть подвергнут OCR, индексированию и поиску.

Ничего не сделано для многостраничных документов, потому приходиться формировать изображения в контейнерный формат типа PDF, ещё больше теряя в эффективности.

DjVu избавляет от этих проблем обрабатывая двутональные документы, низкоцветовые (индексированные) изображения, изображения с непрерывным спектром тонов (фотографии и т.д), сканированные цветные и чёрно-белые документы, цифровые документы (например в Postscript или формате PDF).

DjVu может рассматриваться как основная открытая платформа для обмена документами так как библиотека DjVu, включая многопоточный декодер/рендер, кодер IW44, кодер палеттизированного изображения, а также кодеры простых двутональных и цветных документов теперь являются свободным программным обеспечением доступным под GNU GPL и могут быть использованы как платформа для разработки новых кодеков, схем сегментации, механизмов передачи данных, интерфейсов просмотрщика и систем контент-анализа.

Бумаги, примеры, тесты и цели доступы на http://www.djvuzone.org/ (http://nash-forum.itaec.ru/redirector.php?url=http%3A%2F%2Fwww.djvuzone.org%2 F).

Исходные коды доступы на http://djvu.sourceforge.net/ (http://nash-forum.itaec.ru/redirector.php?url=http%3A%2F%2Fdjvu.sourceforge.n et%2F).

Plug-in'ы, компрессоры, SDK и коммерческое программное обеспечение может быть найдено на http://www.djvu.com/ (http://nash-forum.itaec.ru/redirector.php?url=http%3A%2F%2Fwww.djvu.com%2F).

Сервера которые способны конвертировать почти любой формат в DjVu доступы на http://openlib.djvuzone.org/ (http://nash-forum.itaec.ru/redirector.php?url=http%3A%2F%2Fopenlib.djvuzone.o rg%2F), http://bib2web.djvuzone.org/ (http://nash-forum.itaec.ru/redirector.php?url=http%3A%2F%2Fbib2web.djvuzone.o rg%2F) и http://any2djvu.djvuzone.org/ (http://nash-forum.itaec.ru/redirector.php?url=http%3A%2F%2Fany2djvu.djvuzone. org%2F).

Плагин для Windows в приложении. Просмотр, распечатка документа - все просто и наглядно. Поддерживает корректную работу с IE7 и другими браузерами.

http://djvu.sourceforge.net/ (http://nash-forum.itaec.ru/redirector.php?url=http%3A%2F%2Fdjvu.sourceforge.n et%2F) - для Linux (ссылка внешняя, т.к. для всех версий качать смысла нет: каждый скачает для себя)

Просмотрщик бесплатный.