2.2. Llibres digitals
2.2.2. EPUB
EPUB és l’estàndard obert per a les publicacions digitals, darrerament adoptat pel consorci de la World Wide Web (W3C) encarregat de la gestió i impulsió dels estàndards per a la web.
Aquest format, desenvolupat inicialment per l’International Publishing Forum (IDPF), s’ha popularitzat enormement els últims anys fins a ocupar tot l’espai de la publicació de llibres digitals fora de l’ecosistema d’Amazon.
EPUB és un format totalment accessible per als usuaris. Tenim a disposició l’especificació tècnica i detallada del format per a ser capaços de treballar-lo i adaptar-lo a les nostres necessitats. El fet que aquest format estigui basat en els estàndards oberts fa que la seva evolució i conservació no depengui de cap empresa privada, i que es garanteixi una continuïtat del format sumada a una evolució progressiva entre versions que n’assegura la intercompatibilitat.
La definició oficial ens diu el següent:
EPUB® is the distribution and interchange format standard for digital publications and documents based on Web Standards. EPUB defines a means of representing, packaging and encoding structured and semantically enhanced Web content —including XHTML, CSS, SVG, images, and other resources— for distribution in a single-file format.
Una de les característiques més importants del format és el treball sobre el marcatge semàntic del contingut, gràcies a l’ús de llenguatges basats en XML i en els estàndards per a la web. Aquest marcatge semàntic, que es refereix al fet de donar informació extra al sistema lector sobre el significat dels elements que formen el llibre, des d’un títol fins a un paràgraf, passant per totes les tipologies possibles de contingut, és la clau per a la transició cap a la web semàntica i un ecosistema digital capaç d’interpretar continguts, d’entendre’ls d’alguna manera, a fi i efecte de fer cerques avançades, indexacions, compendis, resums, etc., i és la base per a crear els nous models de negoci digital que hem presentat i que treballarem amb més detall al punt sobre models de negoci.
Més informació a 1.5.3 «Possibles models de negoci associats als productes editorials digitals».
Si bé no és aquest l’espai per a parlar detalladament de la web semàntica, és important entendre que el que s’anomena web semàntica planteja conceptes i innovacions que han de transformar la manera en què gestionem, classifiquem i accedim al continguts a la web. La web semàntica és un conjunt d’iniciatives plantejades perquè les dades i la informació que es publiquen a la xarxa siguin llegibles i interpretables per aplicacions informàtiques de manera molt més avançada i detallada que la que és possible actualment. Amb l’afegit de metadades semàntiques, que descriuen el contingut, el seu significat, etc., es permet que els continguts digitals siguin processats per sistemes informàtics «intel·ligents» per a indexar-los, transformar-los i mostrar-los a l’usuari en funció de determinades variables condicionants.
Vegem-ho en un exemple pràctic relacionat amb la indústria editorial. Si nosaltres hem identificat en una col·lecció de llibres digitals el contingut més important, o els paràgrafs més representatius de les obres, no amb vista al lector sinó internament, en el codi, mitjançant l’ús d’etiquetes de marcatge semàntic, el sistema podrà capturar aquesta tipologia concreta de continguts i manipular-los digitalment. És a dir, jo podré donar una instrucció a un sistema perquè capturi els paràgrafs més importants de les obres i creï una publicació nova amb la fusió d’aquesta informació. Si ampliem el marcatge semàntic a autors, temàtiques, parts d’un llibre, etc., ràpidament ens adonarem de les noves possibilitats que aquest tipus de tecnologies impliquen per a gestionar i publicar la informació. En parlarem amb una mica més d’atenció a la secció sobre els nous models de negoci associats a la producció editorial digital.
Les característiques principals del format EPUB són les següents:
- Adaptable a qualsevol mida de pantalla i dispositiu.
- Àmpliament estès com a base per a publicar en la majoria de plataformes de publicació en línia.
- Separació tècnica entre el contingut i l’estil de visualització, com en l’entorn web, cosa que permet aprofitar els avantatges de la modificació massiva d’estils, la uniformització d’estils de col·leccions o la possibilitat de definir regles de visualització diferents en funció de les variables de l’entorn (pantalla, orientació, zoom, etc.).
- Incorporació al format de les metadades (informació sobre el contingut que permet als sistemes informàtics processar-ne el significat i paper en la publicació).
- Edició del contingut en XHTML/HTML, llenguatges de marcació semàntica (no de programació) molt senzills d’aprendre.
- Separació nativa entre el contingut i l’estructura d’aquest, i els estils i les regles de visualització. Separació fàcil entre tasques sobre l’edició i el marcatge semàntic del contingut i la definició de l’estil de la publicació.
- Fonts incorporades a la publicació per a assegurar-ne la visualització correcta.
- Estructura modular que permet treballar només amb les funcionalitats bàsiques del format i anar implementant funcions extres si és necessari.
- Alta consideració per a l’accessibilitat i les tecnologies adaptatives.
- Incorporació de funcionalitats extres com el text-to-speech, media overlays, etc.
- Desenvolupament continuat de noves opcions per a tot tipus de publicacions digitals, amb propostes accessibles i adaptables per a substituir els formats d’impressió convencionals com PDF.
- Inclusió progressiva de la interactivitat mitjançant scripts, sempre amb una incorporació progressiva que exigeix que aquest contingut no sigui imprescindible per a la comprensió del missatge, per a garantir una màxima universalització i accessibilitat global.
Scripts
Petites porcions de codi que permeten al sistema incorporar funcionalitats de la programació per a generar animacions, interaccions amb l’usuari o modificacions in situ del contingut, etc.
Des del punt de vista tècnic, un arxiu EPUB és una carpeta empaquetada
en ZIP que conté, per una banda, els arxius de continguts i els recursos que formen el llibre (text, imatges, àudios, vídeos, etc.) i, per l’altra, un conjunt d’arxius tècnics que permeten als sistemes lectors crear l’estructura del llibre, entendre l’ordre de reproducció dels continguts i finalment mostrar-lo al lector.
En primer lloc trobarem un conjunt d’arxius estàndards, que no varien, que indiquen al sistema l’estructura de l’EPUB i l’identifiquen com a tal. Trobarem un arxiu (package.opf en la darrera versió) que defineix quina és estructura tècnica del llibre, quins recursos el formen, en quin ordre s’han de visualitzar, quines són les metadades generals de la publicació, etc. Aquest arxiu és el que permet al sistema lector construir la publicació amb sentit i posicionant els elements amb l’ordre que correspon.
Els arxius de contingut són arxius HTML (o XHTML) que recullen el text i l’estructura principal d’aquest, i les referències a tot el contingut extra del llibre, des de les imatges fins als enllaços a contingut extern. A més, trobarem el full d’estils (llenguatge CSS) que ens permet definir com s’han de mostrar al lector els diferents elements del llibre (les fonts, la mida del text, l’estil del títol, les imatges, els marges, els efectes visuals, etc.).
A més a més, un EPUB contindrà un arxiu que recull la taula de continguts (TOC), que permet al programari lector crear un índex interactiu per a desplaçar-nos per la publicació.
L’estructura d’un arxiu EPUB és aquesta:
EPUB2 | EPUB3 (també 3.0.1) |
---|---|
CARPETA EPUB
/META-INF container.xml mimetype content.opf toc.ncx /STYLES estils.css /TEXT contingut1.xhtml contingut2.xhtml /IMAGES imatge1.png imatge2.png |
CARPETA EPUB
mimetype /META-INF container.xml /EPUB /XHTML contingut1.xhtml (html) contingut2.xhtml (html) nav.xhtml (Taula de continguts) /CSS estils.css /IMG imatge1.png imatge2.png package.opf |
Veurem més detalladament el procés de creació d’un llibre en format EPUB en el punt 3.4.2 «Creació d’un arxiu en format EPUB», on parlarem de les diferents opcions disponibles quant al programari editor i els processos necessaris. Cal tenir en compte, no obstant això, que l’amplitud del format és enorme, i que, si bé podem editar un llibre digital més o menys senzill amb pocs coneixements, per a implementar les funcionalitats avançades del format (Media Overlays, Scripting, SVG, Fixed-Layout, etc.) caldrà dedicar un esforç a aprendre determinats processos i llenguatges que són més tècnics.