En l’apartat 2 «Producció editorial digital: objectes, formats i eines» hem parlat sobre la web semàntica i, en general, sobre la importància de les metadades per a crear nous models de classificació, accés i manipulació de la informació, que permeten desenvolupar nous models de negoci relacionats amb els continguts digitals.
En aquest cas són models complexos, que demanen uns coneixements tècnics avançats per a poder-los implementar i que es basen en el processament tècnic de la informació, independentment de la forma que tingui aquesta o de l’objecte digital de què formi part.
Aquests models es basen a desmuntar els objectes digitals i classificar el seu contingut en funció d’informació extra (metadades) que el creador ha facilitat per identificar i donar valor semàntic al contingut que forma qualsevol publicació. Aquest procediment necessita un marcatge semàntic del contingut (identificació de les diferents parts de la publicació: títols, paràgrafs, imatges, cites, llistes, etc.) i un afegit d’informació que defineixi el valor de cada element en un llenguatge que els sistemes informàtics puguin entendre.
Així, si jo, amb l’ús de llenguatges de marcatge semàntic com HTML, defineixo l’estructura d’un document indicant els elements que el formen, a posteriori podré identificar i seleccionar aquests elements independentment de la resta de la publicació. Si he identificat tots els títols d’una publicació, donant al sistema informació que permeti destriar-los de la resta de contingut, serà senzill informàticament copiar, manipular i mostrar aquests elements. Si, al contrari, tot el contingut té el mateix valor, i no hem definit quin és el paper de cada element en el conjunt de la publicació, aquest procediment serà impossible.
L’entorn digital actual tendeix cap a un en què definir el valor semàntic dels elements que formen una publicació serà essencial per a poder accedir al nou conjunt d’eines i opcions que ens ofereixen les tecnologies digitals.
Però què podem fer amb el contingut quan aquest té un bon sistema de metadades associat i hem definir el valor semàntic dels elements?
Les opcions són força àmplies, tot i que la majoria demanen encara una evolució de les eines i els llenguatges que usem en la publicació editorial digital. Principalment, giren a l’entorn de la classificació intel·ligent dels continguts, la creació de compendis en funció de determinats paràmetres i la personalització dels continguts en funció dels tòpics d’interès que ens faciliti un lector.
Vegem-ho amb una mica més de detall.
Si recordem l’estructura d’un EPUB, un dels formats que ens permetrà accedir a aquest tipus de noves funcionalitats, el contingut textual que el forma està marcat amb HTML. I diem marcat perquè HTML és un llenguatge que defineix l’estructura del document mitjançant marques, identificant els diferents elements que el formen i definint on comencen i on acaben, marques i identificadors que permeten destriar entre els diferents elements d’un text en funció del seu valor semàntic i el paper que ocupen en l’estructura del text.
És molt fàcil tècnicament identificar un tipus d’element del codi HTML i copiar-ne el contingut, manipular-lo, etc.
Per exemple, si usem l’element strong, que marca aquella part del text que té més importància, per marcar determinades parts d’un text, a posteriori podrem seleccionar aquests elements, ajuntar-los i crear un resum automàtic. Aquesta és només una de les opcions possibles per a visualitzar el procés, però la podem estendre a qualsevol tipus d’element HTML: els títols, les parts importants, el contingut central, les seccions, etc.
A més a més, gràcies a les aportacions d’EPUB i els llenguatges web, podem usar també característiques com l’atribut epub:type per a perfeccionar i afinar aquests processos. HTML, tot i que ens ofereix alguns elements semàntics, a voltes es queda curt per a abraçar la complexitat de les publicacions editorials. Epub:type ens permet definir, per a cada un dels elements que formen el codi HTML, el seu valor semàntic d’acord amb un vocabulari preestablert que els sistemes de lectura poden reconèixer.
Així, definirem quina part del text és un preàmbul, identificarem capítols, portades, subcapítols, divisions, resums, pròlegs, introduccions, conclusions i un llarg etcètera d’opcions que ens permeten definir de manera molt acurada cada un dels elements que formen una publicació.
Aquest procés d’identificació semàntica dels elements, sumat a l’afegit de metadades avançades que donen informació extra sobre el contingut (EPUB usa el sistema DCcore), permet als sistemes informàtics manipular el contingut amb molt més coneixement de causa, i obre així la porta al tractament intel·ligent del contingut mitjançant algorismes.
Per tant, a mesura que tinguem el contingut processat segons aquestes directrius, serem capaços de generar models de negoci a l’entorn de la personalització del contingut i la creació de nous productes sobre la base de la manipulació d’altres productes existents.
Aquests models permeten, per exemple, identificar la part més important d’un conjunt d’articles, o d’una col·lecció, capturar-la i crear un nou document amb aquest nou contingut, de manera automàtica, o seleccionar, d’entre un catàleg en EPUB les novel·les en què el curs narratiu s’esdevé en una localització concreta. Les opcions són infinites.