Ayuda:Gestión de ficheros DjVu

Esta página de ayuda intenta dar soporte, pistas y consejos para manipular los ficheros DjVu utilizados en Wikisource.

¿Qué es un DjVu?

editar

Un fichero DjVu es un tipo de archivo que permite almacenar texto e imágenes de forma parecida a los ficheros PDF. Es un formato libre, y algo más ligero que el PDF. Más información en Wikipedia, en el artículo DjVu.

El DjVu es, junto con el pdf, el tipo de formato sobre el que se ha desarrollado la extensión Proofread que tiene activado Wikisource, que es la que permite tener el sistema de calidad de páginas de transcripción.

Consulte la ayuda de Wikipedia si desea saber cómo utilizarlos en otros proyectos de Wikimedia.

Dónde encontrarlos

editar

Una de las pocas organizaciones que proporciona libros en formato DjVu y de forma gratuita es Internet Archive, con el valor añadido de incorporar metadatos (como la capa de texto capturado por el sistema de Optical Character Recognition o OCR).

Aún así, se pueden encontrar libros en diferentes formatos especialmente pdf (que se pueden convertir a djvu como se explica más abajo) en Google Libros, o en bibliotecas como puede ser la Biblioteca Nacional Española. La mayoría de los programas para verlos, crearlos o manipular páginas es encuentran en enlaces de la página http://djvu.org/resources.

Cómo verlos

editar
  • Lo más recomendable es instalarse el programa GNU Djvuview.
  • El programa DjVuSolo a veces puede ser útil pero no sabe leer las nuevas versiones de DjVu.
  • Los disponibles en Commons sólo necesitan un navegador de Internet compatible, como por ejemplo Mozilla Firefox.
  • En Internet Archive se pueden ver en linea por un sistema desarrollado por LizardTech.

Convención de nombres

editar

Es recomendable nombrar los ficheros djvu de tal forma que tengan una información mínima del libro. Una forma útil sería: "Autor-Título.djvu" o "Autor-Título, Fecha, Tomo" o "Título (año).djvu" o "Autor - Título, Año, Tomo".djvu.

Cómo crearlos

editar

La mejor forma de crearlos es con el OCR incorporado, pero esto de momento sólo lo hacen los programas comerciales.

Any2DjVu

editar

La web http://any2djvu.djvuzone.org/ permite crear de forma online un DjVu, con OCR o no según lo especifiquemos, a partir de un fichero PDF o de ficheros de imagen.

Djvuview

editar

Es un visor libre de ficheros DjVu desarollado por Léon Bottou, de la comunidad DjVuLibre. Consulte http://djvu.sourceforge.net/doc/index.html

Permite crear un DjVu a partir de otro previamente abierto, mediante la opción del menú "File, Save as". Podemos guardarlo como un fichero único (bundled djvu document) o uno por cada página (unbundled). Podemos especificar un rango de páginas.

También podemos convertir un DjVu a PDF, JPG, TIFF y otros formatos de imagen, mediante la opción del menú "File, Export".

El programa "djvm" también tiene opciones para crear (...).

DjVuSolo

editar

Es otro visor libre de ficheros DjVu, desarrollado por LizardTech. Está un poco anticuado (versión 3.1), ya que no sabe leer las versiones más modernas de DjVu.

Es útil cuando queremos crear una página en blanco:

  1. Primero crearemos una imagen JPG, GIFF, BMP, etc. sin nada. Por ejemplo con el programa Paint de Windows.
  2. Después abrimos el programa, y abrimos la imagen (File, Open).
  3. Finalmente, lo guardamos como DjVu (File, Save as).

PDFtoDjVu

editar

Es un programa libre de comandos (sin las ventanas como las de Windows) desarrollado por Jakub Wilk. Permite convertir ficheros PDF a DjVu. No obstante, con muchísimos PDFs de Google Books da errores.

Internet Archive

editar

Los usuarios registrados en la web http://www.archive.org pueden subir libros por ejemplo en formato PDF, y al cabo de un tiempo se habrá generado un archivo DjVu con OCR. También se habrá generado en otros formatos como ePub, Kindle, Daisy y otros.

Cómo eliminar y añadir páginas

editar

A veces es recomendable eliminar y/o añadir páginas.

Las instrucciones que se explican a continuación están pensadas para el sistema operativo Windows y el conjunto de ejecutables de DjvuLibre [1].

Eliminar

editar

Puede ser pertinente eliminar las páginas de aviso que añade Google Books, cubiertas de biblioteca que también se han digitalizado, páginas repetidas por digitalizaciones defectuosas, publicidad, etc.

El Djvuview incorpora un conjunto de programas a parte del propio Djvuview, que acostumbran a instalarse en el mismo directorio. Para eliminar páginas necesitamos el djvm.exe.

  1. Hacer copia de seguridad del fichero DjVu del que borraremos páginas, quizás nos equivoquemos.
  2. Abrir la interficie de comandos (Inicio, Ejecutar..., teclear "cmd" y pulsar intro). Aparecera una pantalla de color negro.
  3. Situarnos en el directorio donde tenemos el programa djvm.exe mediante los comandos "cd" (change directory). Por ejemplo, si la ventana que se ha abierto pone "C:Documents and Settings\Admin" y tenemos el djvm.exe en "C:Djvulibre" hemos de teclejar "cd.." para subir al directorio "C:Documents and Settings", "cd.." para subir al directorio "C:", "cd djvulibre" para situarnos en el directorio de trabajo. Para saber si lo hemos hecho bien, podemos teclear "djvm help" y nos tendrá que aparecer la ayuda de dicho programa.
  4. Mover el DjVu al directorio donde tenemos el djvm.exe. Cerrarlo si lo tenemos abierto antes de comenzar a borrar.
  5. Teclear la orden de borrado con "djvm -d fichero_que_sea.djvu número_de_página". Por ejemplo, si quiero borrar las páginas 1 y 2, teclearé "djvm -d fichero.djvu 1" y después lo mismo "djvm -d fichero.djvu 1". Ojo: si lo que hago es "djvm -d fichero.djvu 1" y después "djvm -d fichero.djvu 2" habré borrado la página 1 y la 3, porque cada vez que se borra una página, tiene lugar una repaginación. Si quiero borrar las páginas 300 a 303 ambas incluidas, puedo teclear "djvm -d fichero.djvu 300" cuatro veces seguidas.
  6. Abrir el DjVu para comprobar cómo ha quedado.

Añadir

editar

A veces el proceso de digitalitzación se olvida de algunas páginas por la razón que sea. Puede ser pertinente en estos casos añadir una página en blanco para mantener la numeración de las páginas, y si alguna vez se consigue la página, al volver a cargar el libro entero en Commons no dañará la numeración que ya se esté utilizando en Wikisource.

  1. Hacer copia de seguridad del fichero DjVu del que borraremos páginas, quizás nos equivoquemos.
  2. Abrir la interficie de comandos (Inicio, Ejecutar..., teclear "cmd" y pulsar intro). Aparecera una pantalla de color negro.
  3. Situarnos en el directorio donde tenemos el programa djvm.exe mediante los comandos "cd" (change directory). Por ejemplo, si la ventana que se ha abierto pone "C:Documents and Settings\Admin" y tenemos el djvm.exe en "C:Djvulibre" hemos de teclejar "cd.." para subir al directorio "C:Documents and Settings", "cd.." para subir al directorio "C:", "cd djvulibre" para situarnos en el directorio de trabajo. Para saber si lo hemos hecho bien, podemos teclear "djvm help" y nos tendrá que aparecer la ayuda de dicho programa.
  4. Mover el DjVu al directorio donde tenemos el djvm.exe. Cerrarlo si lo tenemos abierto antes de comenzar a borrar.
  5. Teclear la orden de adición con "djvm -i fichero_destino.djvu fichero_origen.djvu número_de_página". El fichero_destino será nuestro DjVu; fichero_origen es la página en blanco que queremos intercalar; número_de_página es la página que queremos asignar. Ojo porque el número de página del fichero no siempre es el número de página del libro de papel. Por ejemple, el fichero tiene la página 20 como página 10, y la siguiente página 21 resulta que tiene la 12 en lugar de la 11, tendremos que añadir la página 11 como página 21. Haremos "djvm -i fichero.djvu página.djvu 21".
  6. Abrir el DjVu para comprobar cómo ha quedado.

Ordenar

editar

A veces hay páginas en orden incorrecto, fruto de una digitalización defectuosa. Habrá que exportar, eliminar y añadir páginas en formato DjVu en el lugar adecuado según los métodos descritos anteriormente.

Referencias

editar
  1. Existe un ejecutable para Windows llamada "DjVu Toy" que permite realizar estas operaciones fácilmente.