Digesto

Consultazione Digesto

Istituto di Linguistica Computazionale "Antonio Zampolli" ILC-CNR

Il contributo di ILC-CNR

Nell'ambito del programma di ricerca originario su iniziativa del Dipartimento di Storia e Teoria del Diritto dell'Università di Roma Tor Vergata, furono sperimentati alcuni software sviluppati dal Dr. Eugenio Picchi, dell'Istituto di Linguistica Computazionale del CNR di Pisa, per il sincronizzamento dei testi paralleli bilingui per la consultazione dei testi in latino e loro traduzione in italiano.

A partire dal 2011 Il progetto è stata condotto in collaborazione con l’Università degli Studi di Roma "La Sapienza" – Dipartimento di Scienze Giuridiche per i Libri 27-32, ed ha previsto l'aggiornamento di alcune delle funzionalità sviluppate per la sincronizzazione dei testi. Fu deciso anche di migrare su web il sistema di consultazione dei testi, con l'obiettivo di renderli facilmente consultabili ed interrogabili in internet, anche da parte di utenti non specialisti.


L'evoluzione delle tecnologie

La collaborazione dell'ILC al Progetto Nazionale "Il Latino del Diritto e la sua traduzione", iniziata nel 1994, si poneva l'obiettivo di fornire il supporto informatico e la consulenza linguistico computazionale all'unità di coordinamento del Progetto. Tale supporto si è concretizzato in un sistema di gestione di archivi testuali, che permette la consultazione delle versioni "sincronizzate". La consultazione dei testi bilingui già tradotti aveva l'intento di normalizzare l'opera e produrre una uniformità nei criteri di traduzione.

Nel corso degli anni sono stati messi a punto vari strumenti, che si sono evoluti con la tecnologia; i primi indici erano in versione cartacea, dal Quaderno 3, citato sotto, è tratta la seguente citazione: "Essi consentono altresì, nella traduzione di altri libri, a parità di condizioni d'uso, o di adottare le proposte di traduzione elaborate per il libro I che risultino valide, o di elaborare proposte di miglioramenti, così come la loro integrazione con altre proposte relative a condizioni d'uso diverse. Essi servono a facilitare progressivamente una certa uniformità delle traduzioni collegialmente messa a punto già ad opera dei traduttori stessi.".

I Corpora paralleli: strategie di allineamento e consultazione

Allineamento

I Corpora Paralleli sono costituiti da un testo e dalla sua traduzione che generalmente rappresenta una traduzione fedele all’originale e rispecchia quindi la struttura del testo. Gli algoritmi di allineamento di Corpora paralleli sfruttano questa corrispondenza tra unità testuali minime di un testo in lingua originale e della sua traduzione, quindi il rispetto dei paragrafi e periodi, cercando di individuare corrispondenze all'interno di tali regioni. Operando all'interno di queste regioni ed utilizzando motori morfologici e dizionari bilingui la procedura di allineamento cerca di individuare le traduzioni equivalenti e creare una rete di link tra parole corrispondenti nel testo originale e nella sua traduzione. Il testo in lingua originale viene esaminato sequenzialmente, ogni parola è ricondotta al lemma o ai lemmi di competenza, quindi sulla base del dizionario bilingue elettronico si individuano un insieme di possibili lemmi traducenti e le forme che ne derivano. Queste forme saranno ricercate in un area del testo tradotto. L'individuazione di tale area è un punto critico per il sistema di allineamento, infatti un area troppo piccola può far perdere link significativi, viceversa una porzione troppo grande di testo porterebbe ad individuare false corrispondenze. La rete di link individuata costituisce a sua volta l'informazione per la generazione dei contesti paralleli in fase di consultazione degli archivi.

Consultazione

Il sistema di consultazione di testi paralleli eredita il complesso delle funzioni di DBT. Partendo indifferentemente da una delle due lingue possiamo recuperare tutti i contesti di parole, parti di parole, o famiglie di parole combinate attraverso gli operatoti logici. I componenti morfologici permettono anche la ricerca di tutte le forme flesse di un lemma. I contesti della parole o di quelle co-occorrenti che soddisfano la ricerca impostata sono visualizzati fornendo per ciascuno il contesto contrastivo: se la parola recuperata possiede un link diretto, questo sarà il punto di partenza per la generazione del contesto nell'altra lingua diversamente tutti i link associati alle parole del contesto sono utilizzati per individuare un centro virtuale attorno a cui generare il contesto parallelo proponendo un intervallo in cui può trovarsi la traduzione dell'elemento desiderato o suggerendo addirittura una parola come ipotetica traduzione.


Prime pubblicazioni sul lavoro fatto

Il Latino del Diritto e la sua traduzione

Quaderno 1, Libro I, Testo e traduzione, STAR, Pisa, 1997;

Quaderno 2, Libro I, Index locorum, STAR, Pisa, 1997;

Quaderno 3, Libro I, Concordanze, STAR, Pisa, 1998.


© 2017 ILC-CNR, Istituto di Linguistica Computazionale "Antonio Zampolli", Area della ricerca di Pisa