Con il termine metadati ci si riferisce all’insieme delle informazioni strutturate relative ai dati. I metadati sono legati al ciclo di vita di una risorsa digitale, per questo motivo il lemma è diffuso prevalentemente nell’ambito informatico. L’etimologia stessa della parola, che deriva dal greco e significa “oltre il dato”, pone l’accento sulla forte connessione tra dato, ovvero l’informazione principale di una risorsa, e metadato, le informazioni relative alla risorsa. In un convegno promosso da Convention Crossref 2016, Ian Calvert afferma provocatoriamente che i metadati sono i dati che non utilizziamo, individuando il confine labile che esiste tra dato e metadato. Per questo motivo, dare una definizione univoca di metadato può essere controproducente: dati e metadati non sono che diverse facce della stessa medaglia soggette a continui cambiamenti di ruolo, in base al nostro punto di vista sulla risorsa digitale.
I metadati possono essere associati a qualunque tipo di risorsa sia digitale, sia fisica o astratta. Per fare qualche esempio, i metadati possono descrivere i dati relativi a libri, a prodotti generici, a siti Web, a luoghi, istituzioni, opere astratte e altro ancora. Solitamente, si distinguono tre classi principali di metadati: descrittivi, strutturali, amministrativi.
I metadati descrittivi riguardano i dati fondamentali della risorsa. Nel caso della risorsa “libro” i metadati descrittivi sono rappresentati dai dati fondamentali dell’opera: titolo, autore, anno e luogo di pubblicazione. I metadati strutturali, così come suggerisce il nome, rappresentano la struttura della risorsa digitale e la relazione tra le parti che la compongono: indicano il numero di capitoli, la loro lunghezza, le eventuali sezioni, con la finalità di dare una panoramica strutturale della risorsa. I metadati amministrativi, infine, descrivono le informazioni relative alla possibilità di accesso all’oggetto digitale, le licenze e diritti esercitati nonché gli utenti proprietari.
Questa divisione avviene perché i metadati assolvono diverse funzioni in base alle aree a cui appartengono. I metadati descrittivi semplificano e migliorano la ricerca delle risorse da parte degli utenti, quelli strutturali permettono di localizzare la risorsa, di individuare le relazioni esistenti tra risorse di diversi autori o tra autore e eventuali altre risorse a lui legate, in più permettono di identificare una specifica risorsa nel caso in cui una o più risorse risultino simili tra loro. I metadati amministrativi, infine, identificano in maniera univoca la risorsa digitale e forniscono le condizioni e i diritti di accesso agli oggetti digitali da parte degli utenti.
L’insieme di dati e metadati associati ad una risorsa digitale migliorano la diffusione, la visibilità sui motori di ricerca e l’accessibilità all’oggetto digitale; inoltre permettono di monitorare il canale delle vendite della risorsa digitale, nel caso in cui quest’ultima sia associata ad una piattaforma e-commerce.
La trasmissione dei metadati può avvenire in due modi. Nel primo caso i metadati sono trasmessi in un file XML e possono presentare uno schema annidato. Fanno parte di questa categoria gli schemi Datacite e Onix mEDRA. Nel secondo caso i metadati vengono trasmessi e contenuti nell’HTML della scheda web. Fanno parte di questo secondo insieme i profili Dublin Core, Highwire Press e Og:
I principali record di metadati, il loro ciclo di vita e le loro aree di interesse saranno descritti nel prossimo articolo.
Per approfondire:
Definizione di metadati (fonte: Accademia della Crusca)
Approfondimento sui metadati e i vari schemi
Video su Dati e Metadati