7.3.5. Models avançats (en implantació)

En l’apartat 2 «Producció editorial digital: objectes, formats i eines» hem parlat sobre la web semàntica i, en general, sobre la importància de les metadades per a crear nous models de classificació, accés i manipulació de la informació, que permeten desenvolupar nous models de negoci relacionats amb els continguts digitals.

Aquests models es basen a desmuntar els objectes digitals i classificar el seu contingut en funció d’informació extra (metadades) que el creador ha facilitat per identificar i donar valor semàntic al contingut que forma qualsevol publicació. Aquest procediment necessita un marcatge semàntic del contingut (identificació de les diferents parts de la publicació: títols, paràgrafs, imatges, cites, llistes, etc.) i un afegit d’informació que defineixi el valor de cada element en un llenguatge que els sistemes informàtics puguin entendre.

Així, si jo, amb l’ús de llenguatges de marcatge semàntic com HTML, defineixo l’estructura d’un document indicant els elements que el formen, a posteriori podré identificar i seleccionar aquests elements independentment de la resta de la publicació. Si he identificat tots els títols d’una publicació, donant al sistema informació que permeti destriar-los de la resta de contingut, serà senzill informàticament copiar, manipular i mostrar aquests elements. Si, al contrari, tot el contingut té el mateix valor, i no hem definit quin és el paper de cada element en el conjunt de la publicació, aquest procediment serà impossible.

Però què podem fer amb el contingut quan aquest té un bon sistema de metadades associat i hem definir el valor semàntic dels elements?

Les opcions són força àmplies, tot i que la majoria demanen encara una evolució de les eines i els llenguatges que usem en la publicació editorial digital. Principalment, giren a l’entorn de la classificació intel·ligent dels continguts, la creació de compendis en funció de determinats paràmetres i la personalització dels continguts en funció dels tòpics d’interès que ens faciliti un lector.

Vegem-ho amb una mica més de detall.

Si recordem l’estructura d’un EPUB, un dels formats que ens permetrà accedir a aquest tipus de noves funcionalitats, el contingut textual que el forma està marcat amb HTML. I diem marcat perquè HTML és un llenguatge que defineix l’estructura del document mitjançant marques, identificant els diferents elements que el formen i definint on comencen i on acaben, marques i identificadors que permeten destriar entre els diferents elements d’un text en funció del seu valor semàntic i el paper que ocupen en l’estructura del text.

És molt fàcil tècnicament identificar un tipus d’element del codi HTML i copiar-ne el contingut, manipular-lo, etc.

A més a més, gràcies a les aportacions d’EPUB i els llenguatges web, podem usar també característiques com l’atribut epub:type per a perfeccionar i afinar aquests processos. HTML, tot i que ens ofereix alguns elements semàntics, a voltes es queda curt per a abraçar la complexitat de les publicacions editorials. Epub:type ens permet definir, per a cada un dels elements que formen el codi HTML, el seu valor semàntic d’acord amb un vocabulari preestablert que els sistemes de lectura poden reconèixer.

Exemple d'ús de epub:type
Figura 33. Exemple d’ús de epub:type aplicat a l’element section d’HTML.
L’element section defineix seccions d’un document.

Així, definirem quina part del text és un preàmbul, identificarem capítols, portades, subcapítols, divisions, resums, pròlegs, introduccions, conclusions i un llarg etcètera d’opcions que ens permeten definir de manera molt acurada cada un dels elements que formen una publicació.

Aquest procés d’identificació semàntica dels elements, sumat a l’afegit de metadades avançades que donen informació extra sobre el contingut (EPUB usa el sistema DCcore), permet als sistemes informàtics manipular el contingut amb molt més coneixement de causa, i obre així la porta al tractament intel·ligent del contingut mitjançant algorismes.

Aquests models permeten, per exemple, identificar la part més important d’un conjunt d’articles, o d’una col·lecció, capturar-la i crear un nou document amb aquest nou contingut, de manera automàtica, o seleccionar, d’entre un catàleg en EPUB les novel·les en què el curs narratiu s’esdevé en una localització concreta. Les opcions són infinites.