Il nuovo strumento appena rilasciato in versione beta è stato progettato e realizzato dal JSTORE-Labs, il laboratorio di ricerca, sviluppo e innovazione del gruppo ITAKA.
Si propone come un nuovo strumento di ricerca e di esplorazione dei contenuti all’interno delle monografie accademiche; si tratta di una piattaforma web costituita essenzialmente di due parti:
- il motore di indicizzazione del volume in PDF (che prende in carico, analizza e costruisce l’area semantica di riferimento del volume, individuando i cosiddetti Topic)
- l’interfaccia di consultazione del volume – la parte Graph dell’applicazione – che restituisce a sinistra la lista dei Topic con un sistema di navigazione tra le pagine evidenziando le parti del volume pertinenti a quel topic, mentre a destra si consultano le pagine del volume con evidenziate le parole collegate al topic selezionato.
Per quanto riguarda l’individuazione dei topic, affermano di utilizzare un sistema basato su un thesaurus costruito sulla propria banca dati delle pubblicazioni accademiche (JSTOR), e questo dovrebbe essere un punto di forza notevole. Il sistema come detto è ancora in fase di prototipo, in particolare il modello di individuazione dei topic. Ho effettuato un test caricando un volume di un trattato d’arte del ‘500 in lingua italiana, e il risultato è stato molto insoddisfacente: nessuno dei topic principali individuati dal sistema era pertinente al tema artistico. Inoltre, i topic estratti non sono stati neanche parole in lingua italiana, a indicare che il sistema ha attualmente anche dei problemi di tokenizzazione in lingue diverse dall’inglese.
Per quanto riguarda l’usabilità della interfaccia, interessante notare che accanto a ciascun topic si possono visualizzare le forme (lemmi?) che contribuiscono a quel topic, e una visualizzazione grafica della densità (e quindi pertinenza) del topic rispetto ai capitoli o parti del volume.
Sul sito del progetto si può trovare una discreta collezione di volumi, raggruppati per disciplina, consultabili per topic. Forse per migliorare ulteriormente l’usabilità sarebbe opportuno introdurre un motore di ricerca (o almeno una ricerca guidata per topic) che consentisse di individuare i volumi pertinenti e i relativi contesti; può essere che queste nuove funzionalità saranno rilasciate in seguito.
Per approfondire
sito web TopicGraph