Contenuti originali Metadati in editoria

Metadati in editoria: Dublin Core

Scritto da Sofia Giannozzi

Il profilo Dublin Core –  insieme a HighWire Press e altri di cui ci occuperemo in seguito – utilizza i tag meta per registrare i metadati. Nel caso in cui la risorsa descritta sia costituita da un  file XML che raggruppi sia il contenuto digitale che i metadati, allora questi ultimi solitamente, si trovano nell’header del file. Nel caso in cui la risorsa non sia digitale o comunque non sia nel formato XML, per la trasmissione dei metadati sarà comunque presente una pagina HTML  (solitamente la scheda web del sito internet) che espone dati e metadati relativi alla risorsa descritta; in questo caso i metadati sono incorporati, come tag aggiuntivi, nell’head del file HTML.

scheda web,xml,html

Dublin Core Metadata Initiative nasce in ambito OCLC (online computer library center) nel 1995 in Dublin, nell’Ohio e diventa standard ISO 15836 e NISO Z39.85. I partecipanti, per lo più bibliotecari, archivisti, editori, ricercatori e sviluppatori di software, concordarono sulla necessità di creare un insieme di strumenti condivisi per la descrizione e l’accesso alle risorse digitali. Per questo motivo Dublin Core può descrivere qualsiasi tipo di risorsa digitale, anche se in questo articolo ci soffermeremo solamente sulla descrizione di libri, articoli e fascicoli dell’editoria accademica digitale.

Esistono due forme dello standard Dublin Core: il simple Dublin Core e il qualified Dublin Core. La prima forma è costituita da 15 elementi: identifier, title, publisher, description, relation, source, date, coverage, subject, language, type, format, creator, contributors, rights. La seconda forma amplia con nuovi tag gli elementi base al fine di una descrizione più dettagliata del prodotto.

Le caratteristiche principali dello standard sono la semplicità di utilizzo in quanto il linguaggio è comprensibile sia da specialisti sia da neofiti; l’estendibilità che permette di aggiungere ai quindici elementi base nuovi elementi; l’utilizzo di una semantica chiara e universalmente accettata poiché creato da esperti di varie nazioni e teso a garantire l’interoperabilità con altri profili di metadati.

Nello schema a seguire, sono stati raggruppati i quindici elementi secondo le aree ideate nel secondo articolo: identificazione, descrizione, responsabilità e diritti. Ciascuna di queste aree raggruppa un solo o più elementi che, tendenzialmente, sono tutti ripetibili e non obbligatori. Per la descrizione della risorsa digitale libro abbiamo usato solo i quindici elementi di base ampliati con altri due elementi del Dublin Core qualified (figura tre) il PageNumber e il SourceURI.

fifteen elements

L’identifier rappresenta un riferimento inopinabile alla risorsa digitale come per esempio il DOI, l’ISBN, l’ISNN, o l’ e-ISBN. Il tag di riferimento è DC.Identifier.

Il title indica il nome con il quale la risorsa è generalmente conosciuta come per esempio il titolo del libro o dell’articolo. Il tag di riferimento è DC.Title. Nel caso in cui la risorsa presenti un sottotitolo è possibile ripetere il tag oppure usare un elemento dalla lista qualified, il DC.Alternative.Title.

Il publisher rappresenta l’entità responsabile della produzione della risorsa, più comunemente l’editore. Il tag di riferimento è DC.Publisher.

La description rappresenta il riassunto del contenuto della risorsa. Solitamente si tratta di un free text che spiega brevemente il contenuto della risorsa digitale. Il tag di riferimento è DC.Description.

La relation rappresenta la relazione tra la risorsa descritta e un’altra risorsa da cui deriva. Il tag di riferimento è DC.Relation. Solitamente questo campo rimane vuoto per la descrizione delle monografie a meno che la risorsa non faccia parte di una collana. Ma è indispensabile per la descrizione degli articoli e dei fascicoli. La source indica, invece, la fonte da cui è derivata la risorsa, qualora fosse presente. Il tag di riferimento è DC.Source.

La date indica un periodo di tempo associato al ciclo di vita della risorsa digitale. Nel caso del libro è importante indicare la data di pubblicazione di quella copia del libro secondo l’uso di codifiche standard che prevedono l’inserimento in ordine di anno, mese e giorno (YYYY-MM-DD). Qualora non fosse disponibile l’intera informazione basterà specificare l’anno di pubblicazione. Il tag di riferimento e DC.Date. Il coverage, invece, fornisce informazioni spaziali o temporali che riguardano il contenuto intellettuale della risorsa. Solitamente riporta il nome di un luogo di cui tratta la risorsa, le coordinate geografiche di un’area o l’indicazione di un periodo storico. Il tag di riferimento è DC.Coverage.

Il subject descrive l’argomento della risorsa espresso tramite keywords o codici classificatori, come quelli Miur o della Library of Congress. Il tag di riferimento è DC.Subject. Il language, invece, indica il linguaggio con il quale è stata scritta la risorsa. Anche in questo caso è consigliabile usare dei codici standard come ISO 639-2. Il tag di riferimento è DC.language.

Anche nel caso di type e format è consigliato usare degli standard: Il type definisce il genere della risorsa. Nel nostro caso può essere utilizzata la stringa fissa “text”, in altri casi è utile controllare la lista Dublin Core; Il format descrive il file secondo due parametri: peso (per esempio: 40KB) o supporto (per esempio: PDF).  I meta tag sono DC.Type e DC.Format.

Il creator è solitamente una persona, un’organizzazione o un servizio responsabile in primo luogo di aver creato la risorsa. Nel caso in cui vi siano più autori è buona norma elencarli separatamente, preferibilmente con lo stesso ordine con cui appaiono nella pubblicazione. I nomi dovrebbero seguire lo schema: cognome, nome e eventuale secondo nome. Nel caso in cui i creator fossero più istituzioni è buona norma indicare tutti i contribuenti partendo dall’istituzione più importante fino all’istituzione meno importante. Se creator e publisher corrispondono non è necessario ripetere nuovamente il tag di riferimento: DC.Creator.

I contributors rappresentano autori di contributo subordinato rispetto al creator come per esempio un illustratore, un curatore, un traduttore ma anche l’istituzione che ha contribuito alla realizzazione del contenuto intellettuale e artistico. Questo campo è molto ampio è capace di accogliere qualsiasi tipo di responsabilità artistica secondaria. Il tag di riferimento è DC.Contributors.

L’elemento rights è l’unico a non essere ripetibile poiché informa sui diritti intellettuali esercitati sulla risorsa digitale. Si differenzia dalla licenza in quanto quest’ultima rappresenta le condizioni di accesso alla risorsa digitale. Il tag di riferimento è DC.rights.

Il Page number, infine, indica il numero di pagine totali della risorsa digitale. Il tag di riferimento è DC.PageNumber, mentre il DC.Source.URI indica l’URL del sito in cui è contenuta la risorsa descritta.

Screenshot (91)Per la descrizione delle risorse digitali articolo e fascicolo sarà necessario inserire altri elementi del Dublin Core qualified, come il DC.Relation.IsPartOf per specificare la testata della rivista e il DC.Citation.Volume per indicare il numero del volume di appartenenza e il DC.Citation.Issue per indicare, nel caso dell’articolo, il nome del fascicolo in cui è contenuto l’articolo.

Altri elementi importanti sono le tre date che riguardano la valutazione scientifica della risorsa intellettuale da quando è stata spedita dall’autore alla casa editrice a quando viene validata da parte del comitato scientifico. Le tre date corrispondono ai tag DC.Submitted, la data in cui l’autore invia al comitato scientifico l’articolo, il DC.Accepted, la data in cui il comitato scientifico valida il contenuto intellettuale della risorsa e il DC.Issued, la data in cui è pubblicata la risorsa. Per completare la descrizione di articoli e fascicoli è opportuno inserire altri due tag: DC.Citation.Spage e il DC.Citation.Epage che indicano il numero di pagina iniziale e finale ma non sono considerati standard anche se l’utilizzo è consigliato (cfr., Google Scholar Help).

articolo

Per approfondire:
Dublin Core
Dublin Core – i quindici elementi
Dublin Core – elementi aggiuntivi
Lezione sui Metadati – Università di Pisa
Lezione sul profilo Dublin Core – Scuola normale superiore di Pisa
Articolo su Dublin Core
ICCU – Istituto centrale catalogo unico
Dublin Core – Metadati Descrittivi

Articolo precedente: il ciclo di vita dei metadati Articolo successivo: Highwire Press

Autore

Sofia Giannozzi

Vive a Firenze, si occupa di editoria accademica digitale e si sta specializzando nella diffusione e promozione della ricerca scientifica.