Analisi ed elaborazioni con tecniche di visual analytics sul Carteggio Galileiano: il progetto

Obiettivi

Il progetto propone la sperimentazione di strategie di rappresentazione visuale dell’informazione applicate ad un corpus testuale formato da parte della corrispondenza contenuta nella biblioteca galileiana. L’idea è quella di produrre rappresentazioni visive interattive dei dati, in modo da permettere all’utente web di acquisire conoscenze sulla struttura interna dei dati e, in caso, individuare eventuali relazioni tra essi o parti di essi.

In particolare si è trattato di costruire un prototipo di sito web che realizzasse un’integrazione tra nuove tecniche di Visual Analytics e funzionalità classiche di Information Retrieval (IR), con l'obiettivo prefissato di provare a realizzare viste e rappresentazioni dei dati che potessero mettere in evidenza le caratteristiche salienti dei dati o suggerire analisi e studi. Trattandosi di corrispondenza di Galileo Galilei spunti interessanti possono essere:

  • Da quali e quanti personaggi è costituita la corrispondenza contenuta nel Carteggio galileiano:
    • Chi scrive con più frequenza a Galileo;
    • A chi Galileo ha scritto più lettere.
  • Quali sono le lingue più diffuse per la comunicazione internazionale;
  • Cercare possibili relazioni tra destinatari delle missive di Galileo ed eventi storici;
  • Individuare triangolazioni/gruppi di corrispondenze legate da una stretta temporalità => esistenza di possibili “temi scientifici di discussione”;
  • Analisi della lingua adottata per le missive:
    • Arcaismi evidenti nelle forme;
    • Presenza di uno stile comune utilizzato all’epoca per questa modalità di comunicazione.


Le fasi di lavoro

Prima fase

La prima parte del progetto è stata dedicata alla realizzazione di due diagrammi temporali riguardanti: il primo le sole lettere scritte da Galileo, un secondo dedicato invece all’intero “Carteggio” contenuto nel corpus di riferimento. Il semplice modello di scatterplot chart utilizzato è costituito da una pagina html che contiene al suo interno i dati da rappresentare e permette l'interattività con l'utente sia attraverso un tooltip attivabile al passaggio del mouse, sia grazie alla possibilità di invocare un’applicazione software server/client (ISAPI), che implementa alcune funzionalità di base del motore di analisi testuale, patrimonio del gruppo di ricerca.


Seconda fase

In una secondo momento sono state realizzate due risorse esterne, in cui i dati fossero organizzati in modo tabellare (i file mittenti.tsv e destinatari.tsv). Il modello di visualizzazione è in questo caso un barchart. La pagina html che lo realizza è creata da uno script che carica i dati dalla risorsa esterna, crea il grafico a barre e interagisce con l’applicazione ISAPI per la produzione dei contesti di ogni singola lettera indagata.


Terza fase

In una fase successiva del lavoro sono stati studiati e valutati esempi e rappresentazioni già implementate che potessero essere utilizzati nel particolare contesto del progetto:

  • estrazione di parti di script già implementati;
  • modifica/aggiunta funzioni a script esistenti;
  • sperimentazione di strategie di interazione con le applicazioni web ISAPI.

Con questo obiettivo sperimentale sono stati adattati script estratti da esempi funzionanti.In tutti i casi è stata mantenuta la lettura da risorsa esterna e l’interazione con l’applicazione ISAPI, che rappresenta un punto nodale di questa esperienza di progetto.