Contenuti originali Metadati in editoria

Metadati in editoria: Highwire Press

Scritto da Sofia Giannozzi

Nell’articolo precedente abbiamo parlato dello standard Dublin Core, i cui metadati sono utilizzati dai principali aggregatori  e motori di ricerca e sono adeguati a descrivere qualsiasi tipo di risorsa digitale. Esiste un  motore di ricerca più specifico per l’editoria accademica: Google Scholar che utilizza, per l’indicizzazione, la tracciabilità, l’identificazione di un prodotto digitale, i metadati di Highwire Press, ideati dalla Stanford University Libraries nel 1995 in California, in vista del lancio del Journal of biological chemistry.

Per gestire i metadati previsti nel profilo Highwire Press valgono le stesse regole esposte nell’articolo precedente e usate per lo standard Dublin Core: i meta tag sono trasmessi nella pagina HTML – solitamente la scheda web del sito internet, nell’head del file – e presentano una struttura sequenziale, non annidata.

Screenshot (38)

Da un primo confronto tra i due schemi possiamo notare che il profilo della Stanford University, essendo interessato al contenuto della risorsa e non al supporto con cui è disponibile, non presenta i meta tag utili per la descrizione del prodotto digitale, come il DC.Type, il DC.Format, il DC.Contributors e il DC.Description, e soprattutto non informa sul detentore dei diritti sulla risorsa digitale. Tuttavia, presenta dei meta tag che non esistono nel profilo Dublin Core e sono esclusivi per i prodotti dell’editoria accademica utilizzati in particolare per citare gli articoli.

il citation_author_institution e il citation_author_email indicano l’email dell’autore e l’istituzione a cui è affiliato; Il citation_firstpage e il citation_lastpage sono utilizzati per indicare la pagina iniziale e finale della risorsa; Il citation_journal_title indica la testata della rivista di cui fa parte la risorsa e il citation_conference_title precisa il titolo della conferenza – o il titolo degli atti di convegno –  di cui fa parte la risorsa; Il citation_volume e il citation_issue specificano il numero del volume e il numero del fascicolo in cui è inglobata la risorsa, nel caso di un articolo. Il campo citation_issue, può essere ripetibile per indicare anche l’annata della rivista, solitamente in numero romano.

Come notiamo analizzando lo schema, alcuni di questi meta tag sono presenti anche nel profilo di Dublin Core tanto che potrebbe essere fraintesa la specificità del profilo Highwire Press nel contesto della editoria accademica. Infatti i tag di Highwire Press sono stati ideati per descrivere unicamente i prodotti dell’editoria accademica (in particolare gli articoli di Rivista a differenza di Dublin Core  dove i tag sono utilizzabili in ogni tipo di risorsa anche non digitale, e adattabili in seconda battuta per descrivere il prodotto editoriale secondo l’esigenza; ad esempio i tag DC.citation.spage e DC.citationepage non fanno parte degli standard ISO 15836 e NISO  Z39.85 e il tag DC.Relation.IsPartOf è generico per indicare la relazione tra due prodotti.

Applicando al profilo Highwire Press lo schema di organizzazione  dei metadati  presentato nel secondo articolo , possiamo notare che non sono trattate l’area dei diritti e la sotto area delle proprietà; nello stesso momento sono ampliate l’area della descrizione-contenuto con ulteriori meta tag.

Screenshot (35)Come detto in precedenza, questo profilo di metadati è utilizzato prevalentemente da Google Scholar; considerando le norme pratiche ufficiali per l’indicizzazione  troviamo indicato che la risrsa digitale, per essere correttamente indicizzata e tracciata nel motore di ricerca deve contenere necessariamente questi tre tag: il citation_title, il citation_author e il citation_pubblication_date. Sebbene tutti gli altri tag siano facoltativi, essi sono fortemente raccomandati poiché la loro presenza migliora la visibilità della risorsa nel motore di ricerca.

Il citation_title indica il titolo con cui comunemente è conosciuta la risorsa. Nel caso in cui vi sia un sottotitolo il campo può essere ripetuto. Lo stesso vale per il campo citation_author che indica l’autore della risorsa il cui nominativo va inserito seguendo uno dei due schemi: “nome cognome” o “cognome, nome”. Il citation_publication_date  precisa la data (o almeno l’anno) di pubblicazione della risorsa.

il citation_publisher contiene l’editore della risorsa mentre il citation_doi e citation_isbn identificano in maniera univoca il prodotto digitale o cartaceo – se presente una scheda web HTML di diffusione – secondo la stringa di riconoscimento con i quali sono stati registrati. Il citation_pdf_url indica l’indirizzo web del PDF della risorsa digitale, se disponibile.

Infine, Il citation_language che precisa il linguaggio con il quale è stata scritta la risorsa secondo l’utilizzo di una dicitura standard. Il citation_keywords ovvero le parole chiavi che indicano l’argomento della risorsa, sono separate tra loro tramite punto e virgola.
Di seguito un esempio dei metadati Highwire Press per la descrizione di un articolo scientifico:
Screenshot (28)Per approfondire:
Highwire Press
Highwire press Current
 Highwire Press tag – Google Scholar
The lancet Neurology

Articolo precedente: Dublin CoreArticolo successivo: Open Graph

Autore

Sofia Giannozzi

Vive a Firenze, si occupa di editoria accademica digitale e si sta specializzando nella diffusione e promozione della ricerca scientifica.