2. Producción editorial digital: objetos, formatos y herramientas

2.2. Libros digitales

2.2.2. EPUB

Este formato, desarrollado inicialmente por el International Publishing Forum (IDPF), se ha popularizado enormemente en los últimos años, hasta ocupar todo el espacio de la publicación de libros digitales fuera del ecosistema de Amazon.

EPUB es un formato totalmente accesible para los usuarios. Tenemos a disposición la especificación técnica y detallada del formato para ser capaces de trabajarlo y adaptarlo a nuestras necesidades. El hecho de que este formato esté basado en los estándares abiertos hace que su evolución y conservación no dependa de ninguna empresa privada, y que se garantice una continuidad del formato sumada a una evolución progresiva entre versiones que asegura su intercompatibilidad.

La definición oficial nos dice lo siguiente:

EPUB® is the distribution and interchange format standard for digital publications and documents based on Web Standards. EPUB defines a means of representing, packaging and encoding structured and semantically enhanced Web content —including XHTML, CSS, SVG, images, and other resources— for distribution in a single-file format.

W3C Digital Publishing

Una de las características más importantes del formato es el trabajo sobre el marcado semántico del contenido, gracias al uso de lenguajes basados en XML y en los estándares para la web. Este marcado semántico, que se refiere al hecho de dar información extra al sistema lector sobre el significado de los elementos que forman el libro, desde un título hasta un párrafo, pasando por todas las tipologías posibles de contenido, es la clave para la transición hacia la web semántica y un ecosistema digital capaz de interpretar contenidos, de entenderlos de alguna manera, para hacer búsquedas avanzadas, indexaciones, compendios, resúmenes, etc., y es la base para crear los nuevos modelos de negocio digital que hemos presentado y que trabajaremos con más detalle en el punto sobre modelos de negocio.

Más información en 1.5.3 «Posibles modelos de negocio asociados a los productos editoriales digitales».

Las características principales del formato EPUB son las siguientes:

  • Adaptable a cualquier tamaño de pantalla y dispositivo.
  • Ampliamente extendido como base para publicar en la mayoría de las plataformas de publicación en línea.
  • Separación técnica entre el contenido y el estilo de visualización, como en el entorno web, lo que permite aprovechar las ventajas de la modificación masiva de estilos, la uniformización de estilos de colecciones o la posibilidad de definir reglas de visualización diferentes en función de las variables del entorno (pantalla, orientación, zoom, etc.).
  • Incorporación al formato de los metadatos (información sobre el contenido que permite a los sistemas informáticos procesar su significado y papel en la publicación).
  • Edición del contenido en XHTML/HTML, lenguajes de marcación semántica (no de programación) muy sencillos de aprender.
  • Separación nativa entre el contenido y la estructura de este, y los estilos y las reglas de visualización. Separación fácil entre tareas sobre la edición y el marcado semántico del contenido y la definición del estilo de la publicación.
  • Fuentes incorporadas a la publicación para asegurar su visualización correcta.
  • Estructura modular que permite trabajar solo con las funcionalidades básicas del formato e ir implementando funciones extra si es necesario.
  • Alta consideración para la accesibilidad y las tecnologías adaptativas.
  • Incorporación de funcionalidades extra como el text-to-speech, media overlays, etc.
  • Desarrollo continuado de nuevas opciones para todo tipo de publicaciones digitales, con propuestas accesibles y adaptables para sustituir los formatos de impresión convencionales como PDF.

En primer lugar, encontraremos un conjunto de archivos estándar, que no varían, que indican al sistema la estructura del EPUB y lo identifican como tal. Encontraremos un archivo (package.opf en la última versión) que define cuál es estructura técnica del libro, qué recursos lo forman, en qué orden se tienen que visualizar, cuáles son los metadatos generales de la publicación, etc. Este archivo es el que permite al sistema lector construir la publicación con sentido y posicionando los elementos con el orden que corresponde.

Los archivos de contenido son archivos HTML (o XHTML) que recogen el texto y la estructura principal de este, así como las referencias a todo el contenido extra del libro, desde las imágenes hasta los enlaces a contenido externo. Además, encontraremos la hoja de estilos (lenguaje CSS) que nos permite definir cómo se deben mostrar al lector los diferentes elementos del libro (las fuentes, el tamaño del texto, el estilo del título, las imágenes, los márgenes, los efectos visuales, etc.).

Además, un EPUB contendrá un archivo que recoge la tabla de contenidos (TOC), que permite al software lector crear un índice interactivo para desplazarnos por la publicación.

La es esta:

EPUB2 EPUB3 (también 3.0.1)
CARPETA EPUB

/META-INF
    container.xml
mimetype
content.opf
toc.ncx
/STYLES
    estilos.css
/TEXT 
    contenido1.xhtml
    contenido2.xhtml 
/IMAGES 
    imagen1.png
    imagen2.png
CARPETA EPUB

mimetype

/META-INF
    container.xml
/EPUB 
/XHTML
    contenido1.xhtml (html)
    contenido2.xhtml (html)
nav.xhtml (Tabla de contenidos)
/CSS
    estils.css 
/IMG
    imagen1.png
    imagen2.png

package.opf

Veremos más en detalle el proceso de creación de un libro en formato EPUB en el apartado 3.4.2 «Creación de un archivo en formato EPUB», donde hablaremos de las diferentes opciones disponibles en cuanto al software editor y los procesos necesarios. Hay que tener en cuenta, sin embargo, que la amplitud del formato es enorme y que, si bien podemos editar un libro digital más o menos sencillo con pocos conocimientos, para implementar las funcionalidades avanzadas del formato (Media Overlays, Scripting, SVG, Fixed-Layout, etc.) habrá que dedicar un esfuerzo a aprender determinados procesos y lenguajes que son más técnicos.