Il corpus dei materiali raccolti
La Banca Dati dell’ALT (BD-ALT)
contiene l’intero corpus dei materiali lessicali raccolti
con le inchieste sul campo svolte in 224 località della
Toscana con un gruppo di 2193 informatori (considerando anche
le inchieste ripetute e le integrative) sulla base di un questionario di 745
domande.
In partenza si era previsto che sarebbero state
raccolte più di un milione e mezzo di risposte individuali
(calcolando almeno una risposta da parte di ogni informatore
per ogni domanda del questionario) oppure circa 170.000
risposte “areali” (calcolando una risposta ad ogni domanda
per ogni località di inchiesta). Alla resa dei conti, questa
previsione si è rivelata fortemente approssimata per difetto;
infatti, si è osservato che ogni domanda ha ricevuto, in
media, più di 2 risposte in ogni località di inchiesta; da
ciò consegue che la mole del corpus dei materiali raccolti è
più che duplicata rispetto alle previsioni iniziali.
L’insieme dei materiali reperiti in
risposta sono oggi codificati in più di 350.000 schede
ciascuna delle quali raccoglie, per la stessa domanda e punto
di inchiesta, una o più risposte con l’indicazione degli
informatori che l’hanno fornita. In questo insieme sono
anche inclusi materiali accessori quali contesti linguistici
tipici delle risposte alle domande del questionario ed
annotazioni di varia natura, che vanno dalla rilevazione di
differenziazioni di tipo semantico alla messa a fuoco di
variazioni di registro, stile, e così via.
I materiali “canonici” sono inoltre
affiancati da un corpus non indifferente di materiali
lessicali integrativi che pur non configurandosi come risposta
alle domande del questionario sono emersi in associazione con
queste; questi materiali integrativi sono quantificabili in
circa 30.000 schede che si vanno a sommare alle schede dei
materiali “canonici”. In tutto, la BD-ALT contiene dunque
circa 380.000 schede relative a materiali “canonici” ed
integrativi.
|