Accesso
ai materiali dialettali su base concettuale
Una delle chiavi
canoniche di accesso ai materiali di un atlante linguistico,
quando la rilevazione sia stata condotta sulla base di un
questionario, è per domanda: all’interno del corpus dei
materiali raccolti si ricercano tutte le attestazioni che sono
state reperite in risposta alla domanda prescelta, oppure che
sono emerse in relazione ad essa (nel caso di materiali
integrativi ad essa correlati). Una ricerca di questo tipo
presuppone però la conoscenza del questionario usato per le
inchieste, spesso articolato in centinaia di domande: nel caso
specifico dell’ALT, il questionario
di raccolta conteneva 745 domande.
Al fine di facilitare
ulteriormente il consultatore di ALT-Web
nell’identificazione della domanda o delle domande oggetto
del proprio interesse, abbiamo costruito un’ontologia che
organizza i concetti indagati dall’ALT in gerarchie e reti
semantiche articolate su diversi livelli. Il termine
“ontologia” è qui usato nell’accezione corrente
nell’ambito delle tecnologie dell’informazione per
denotare un repertorio strutturato di concetti rilevanti per
la descrizione e organizzazione di un certo dominio di
conoscenza.
In particolare, la
tipologia dei concetti indagati dall’ALT è stata
organizzata in 13 macro-classi derivate dall’originaria
strutturazione del questionario in settori, più una classe
miscellanea che raccoglie domande non immediatamente
riconducibili alle macro-classi identificate.
Al livello alto
dell’ontologia dell’ALT abbiamo le macro-classi listate
nella prima colonna della tabella che segue:
Macro-classe
|
N.
raggruppamenti semantici associati
|
N.
domande associate
|
agricoltura
|
40
|
378
|
alimentazione
|
31
|
331
|
allevamento
|
16
|
182
|
animali
selvatici
|
12
|
106
|
bosco
e raccolta della legna
|
24
|
233
|
casa
e attività domestiche
|
38
|
290
|
forme
del terreno
|
27
|
143
|
piante
e frutti
|
23
|
185
|
tempo
cronologico
|
8
|
40
|
tempo
meteorologico
|
17
|
107
|
uomo:
attività e relazioni sociali
|
32
|
178
|
uomo:
comportamento e sentimenti
|
73
|
464
|
uomo:
corpo e abbigliamento
|
55
|
407
|
varia
|
9
|
26
|
Per ciascuna
macro-classe (o “settore”) sono stati identificati un
insieme di classi intermedie o raggruppamenti concettuali più
specifici (la cui entità numerica relativamente a ciascun
settore è riportata nella seconda colonna della tabella), per
un totale di 405 associazioni: ciascuna macro-classe è
articolata, in media, in 29 classi concettuali di livello
intermedio. Scendendo nell’ontologia, a ciascuna classe
concettuale di livello medio sono associati: a) concetti
elementari espressi attraverso parole italiane singole o
espressioni polirematiche, oppure b) parole dialettali. I
nodi terminali dell’ontologia sono costituiti dalle domande
del questionario. Nella terza colonna della tabella sono
riportate il numero di domande ricondotte a ciascun settore,
per un totale di 3070 associazioni macro-classe >
raggruppamento concettuale intermedio > parola italiana o
dialettale > domanda.
I criteri di
associazione tra le domande del questionario ALT e le classi
concettuali dell’ontologia variano a seconda del tipo di
domanda. Le domande onomasiologiche sono ricollegate ai
concetti elementari da esse indagati, a loro volta associati a
raggruppamenti concettuali progressivamente più ampi fino a
raggiungere i nodi alti dell’ontologia. Nel caso delle
domande semasiologiche, ovvero le domande volte a indagare i
significati associati a uno o più termini dialettali, la
tipologia di associazioni al livello dei nodi terminali e
preterminali dell’ontologia varia in modo significativo
rispetto al caso delle domande onomasiologiche: le domande
semasiologiche sono collegate alla classe concettuale più
ampia attraverso la parola dialettale indagata. Queste
associazioni sono state stabilite sulla base dei risultati
ottenuti per quella domanda sul territorio toscano.
Nel caso delle
domande onomasiologiche una domanda viene classificata di
pertinenza di una sola macro-classe ed eventuali polisemie
sono catturate attraverso l’associazione della domanda a
diversi raggruppamenti semantici intermedi: ad esempio, la
domanda 2a “Al crepuscolo della mattina”, ricondotta alla
macro-classe di tempo cronologico, è al contempo associata a
diverse chiavi semantiche intermedie come 'luce', 'porzione_del_giorno',
'sole' che ne evidenziano diverse
sfaccettature di significato. Una stessa domanda semasiologica
può essere invece stata classificata come di pertinenza di
diverse macro-classi. Ad esempio, la domanda 11 volta a
verificare i significati assunti dal termine dolco è
stata ricondotta, in virtù dell’accentuata polisemia del
termine in ambito toscano, alle macro-classi alimentazione,
casa e attività domestiche, forme del terreno, tempo
meteorologico, uomo - comportamento e sentimenti, uomo - corpo
e abbigliamento.
Mostriamo ora l’utilità di quanto
illustrato con un esempio concreto. Supponiamo di essere
interessati alla terminologia alimentare della castagna. Dopo
aver selezionato la macro-classe alimentazione e
successivamente il raggruppamento concettuale di 'castagna',
si arriva al livello pre-terminale della gerarchia
(rappresentato nella Figura che segue) articolato in:
-
sei
concetti elementari (“castagnaccio”, “farina di
castagne”, “farinata di castagne”,
“caldarrosta”, “castagna bollita” e “polenta di
castagne”) indagati attraverso otto domande
onomasiologiche distinte (il concetto di castagna bollita
è indagato da tre domande distinte, incentrate su diverse
modalità di cottura e conservazione delle castagne);
-
quattro termini dialettali indagati
attraverso tre domande semasiologiche distinte.
Una tale
strutturazione del questionario risulta utile in quanto
permette il recupero dei materiali dialettali su base
concettuale: l’accesso su base concettuale può essere
attivato in entrambe le modalità di accesso ai materiali
dell’ALT, quella guidata e quella avanzata.
In prima istanza
all’utente viene sottoposta la lista di macro-classi
concettuali o settori; una volta selezionata la macro-classe
rilevante ai fini della propria ricerca, l’utente otterrà
una lista di parole chiave corrispondenti a raggruppamenti
concettuali più granulari, che esprimono concetti più
specifici. Con la selezione di un singolo concetto si arriva
all’identificazione dell’insieme delle domande
riconducibili al concetto selezionato, articolato in due
sottoinsiemi: quello delle domande onomasiologiche, volte a
indagare istanze più specifiche del concetto selezionato;
quello delle domande semasiologiche, le cui risposte possono
includere attestazioni rilevanti per la propria ricerca. Nel
caso delle domande semasiologiche, le associazioni attivate
tengono conto della tipologia di significati raccolti sul
campo per il termine indagato.
Il valore aggiunto derivante dall’uso dell’ontologia illustrata sopra
nell’interrogazione della base di dati dell’ALT (accesso
per domanda) pare evidente: si può pensare alla differenza
esistente tra la consultazione di un semplice elenco di parole
italiane e un dizionario concettuale. Il primo ci fornisce la
lista delle parole chiave per l’accesso alla base di dati,
il secondo fornisce un sostrato concettuale che lega le parole
tra loro, mostrandone le relazioni e facendone quindi emergere
il significato.
|