Recupero dei materiali dialettali in
ALT-WEB
I diversi
livelli di rappresentazione associati ai materiali
dialettali contenuti nella base di dati di ALT-WEB creano i
presupposti per ricerche che astraggono progressivamente da
dettagli della realizzazione fonetica del dato da parte del
parlante. Cerchiamo ora di mostrare attraverso lausilio di
esempi lutilitą di questo complesso e articolato schema di
codifica ai fini dellinterrogazione e del recupero dei
materiali dialettali dalla banca dati dellALT. Come
vedremo, la tipologia dei risultati della ricerca varia in modo
considerevole a seconda del livello di rappresentazione sul
quale viene proiettata linterrogazione.
Supponiamo
di voler recuperare le attestazioni diverse ottenute in
risposta alla domanda 331 del questionario ALT, finalizzata
alla raccolta dei termini designanti il caglio.
Proiettando questa richiesta sul livello della
rappresentazione fonetica, si ottiene quanto segue:
ovvero, 90
risposte diverse, con una frequenza di attestazione nelle
localitą indagate che oscilla tra 182 (nel caso della
risposta maggioritaria) e 1
(i casi di risposte con attestazione unica sono ben 56,
corrispondenti al 62% dellinsieme delle risposte). Vale la
pena notare che solo le prime 7 risposte della lista ordinata
per frequenza decrescente presentano pił di 4 attestazioni.
Situazione analoga si osserva
proiettando la stessa interrogazione sul livello della
traslitterazione in
ortografia italiana. In questo
caso, le forme diverse appaiono essere 85 (contrapposte alle
precedenti 90) con una distribuzione di frequenza alquanto
simile.
Passando
allinterrogazione del livello di rappresentazione
successivo,
ovvero quello dei materiali normalizzati, si constata invece
una differenza notevole nella tipologia dei risultati ottenuti.
Infatti, a partire dalla stessa richiesta, le risposte diverse
ottenute in relazione alla domanda 331, si riducono a poco pił
della metą di quelle registrate originariamente in
trascrizione fonetica, ovvero 51. Questo deriva
dallaccorpamento di risposte diverse che sono state
ricondotte alla stessa forma normalizzata secondo i criteri
illustrati nella pagina
sulla codifica dei materiali.
Nel passaggio
dalla traslitterazione in ortografia italiana alla
rappresentazione normalizzata,
ovvero il livello che astrae da tratti specifici della
realizzazione fonetica corrispondenti a variazioni fonetiche
produttive sul territorio toscano, abbiamo visto che la
tipologia delle risposte si č ridotta quasi alla metą.
Vediamo alcuni esempi: alla forma normalizzata cąglio
sono state ricondotte forme alquanto diverse come cąio,
cąiė, cągio, cąddiė, cąiio, cągghio,
cąiiu, cąi e cągliu; in relazione alla
forma normalizzata gąglio si osservano simili
neutralizzazioni in quanto essa sussume forme come gąi,
gąddio, gągghio. Rimangono tuttavia distinte a
questo livello attestazioni come presurąia, presąme,
presģna, presłra, presłri, presłria,
presłro, presóia, presóio, presóre,
presóro, presģna catterizzate da diverse
suffissazioni e tenute distinte da présa cosģ come da
parsłro e persłro.
Abbiamo visto limpatto dei diversi
livelli di rappresentazione del dato su una ricerca incentrata
sulla domanda dove abbiamo osservato la tipologia dei
risultati ridursi progressivamente nel passaggio da un livello
allaltro.
Passiamo ora a una ricerca di tipo diverso,
incentrata sulla forma dialettale raccolta sul campo, e
vediamo la progressione della produttivitą della ricerca
attraverso i diversi livelli.
Supponiamo
di voler recuperare al livello di rappresentazione in
trascrizione fonetica le attestazioni della forma .
Grazie
al tipo di codifica
semplificato adottato per l'interrogazione di materiali in trascrizione
fonetica, il sistema restituisce risposte diverse: la forma oggetto
dellinterrogazione e una sua variante spirantizzata
(precisamente con la fricativa dentale in sillaba finale),
ovvero
per
un totale di 60 occorrenze.
Lutente č a questo punto
chiamato a decidere se circoscrivere il recupero alle
attestazioni corrispondenti alla richiesta di partenza, con un
risultato di 33 occorrenze, oppure se concentrarsi su
unaltra delle alternative recuperate (ad esempio, le
attestazioni relative alla variante con fricativa dentale in
sillaba finale) oppure se valutare il risultato globale.
Passando
a interrogare il livello di rappresentazione successivo
(traslitterazione in ortografia italiana), si constata
uno scarto nella produttivitą della ricerca. Infatti, a
partire dalla richiesta schiacciata le forme diverse in
trascrizione fonetica recuperate sono numerose, tra cui:,
ecc.
Ovvero, le forme recuperate a questo livello presentano
diversi gradi di palatalizzazione del nesso e
della /s/
preconsonantica, combinati tra di loro e con la realizzazione
fricativa dellocclusiva dentale. Nel caso specifico, si
raggiungono 173 attestazioni, ampliando di ben tre volte il
risultato ottenuto tramite linterrogazione operante al
livello di rappresentazione precedente.
Procedendo
infine al livello delle rappresentazioni normalizzate, quello che
astrae da variazioni di tipo fonetico produttive sul
territorio della regione, la mole dei risultati della ricerca
effettuata a partire dalla forma normalizzata schiacciata
aumenta ulteriormente, passando a 310 attestazioni recuperate
(da confrontarsi con le 60 recuperate al livello della
trascrizione fonetica e le 173
recuperate al livello della traslitterazione ortografica). A questo livello, vengono
ricondotte allo stesso tipo astratto forme alquanto diverse
quali schiacciąta, schiacciąda, stiacciąta,
schiacciąha cosģ come s-ciasséda. Rimangono
invece distinte a questo livello attestazioni quali schiaccia,
schiaccina, schiaccetta, ecc.
Per quanto ulteriori livelli di
normalizzazione siano auspicabili, crediamo che la codifica
dei materiali dialettali in ALT-WEB sia gią allo stato
attuale funzionale sia al non addetto ai lavori, che
interrogherą la base di dati rendendo attraverso le
convenzioni dellortografia italiana la pronuncia locale,
sia al dialettologo e al linguista che troveranno in questa
codifica stratificata in livelli caratterizzati da astrazioni
incrementali un primo, sebbene elementare, livello di
tipizzazione dei materiali dellALT.
|