(Logo Regione Toscana)
HOME PERCHE' PROGETTO DOCUMENTAZIONE NAVIGAZIONE CREDITI LINKS UTILI CONTATTI

Recupero dei materiali dialettali in ALT-WEB

I diversi livelli di rappresentazione associati ai materiali dialettali contenuti nella base di dati di ALT-WEB creano i presupposti per ricerche che astraggono progressivamente da dettagli della realizzazione fonetica del dato da parte del parlante. Cerchiamo ora di mostrare attraverso l’ausilio di esempi l’utilitą di questo complesso e articolato schema di codifica ai fini dell’interrogazione e del recupero dei materiali dialettali dalla banca dati dell’ALT. Come vedremo, la tipologia dei risultati della ricerca varia in modo considerevole a seconda del livello di rappresentazione sul quale viene proiettata l’interrogazione.

Supponiamo di voler recuperare le attestazioni diverse ottenute in risposta alla domanda 331 del questionario ALT, finalizzata alla raccolta dei termini designanti il “caglio”. Proiettando questa richiesta sul livello della rappresentazione fonetica, si ottiene quanto segue:

ovvero, 90 risposte diverse, con una frequenza di attestazione nelle localitą indagate che oscilla tra 182 (nel caso della risposta maggioritaria) e 1 (i casi di risposte con attestazione unica sono ben 56, corrispondenti al 62% dell’insieme delle risposte). Vale la pena notare che solo le prime 7 risposte della lista ordinata per frequenza decrescente presentano pił di 4 attestazioni.

Situazione analoga si osserva proiettando la stessa interrogazione sul livello della traslitterazione in ortografia italiana. In questo caso, le forme diverse appaiono essere 85 (contrapposte alle precedenti 90) con una distribuzione di frequenza alquanto simile.

Passando all’interrogazione del livello di rappresentazione successivo, ovvero quello dei materiali normalizzati, si constata invece una differenza notevole nella tipologia dei risultati ottenuti. Infatti, a partire dalla stessa richiesta, le risposte diverse ottenute in relazione alla domanda 331, si riducono a poco pił della metą di quelle registrate originariamente in trascrizione fonetica, ovvero 51. Questo deriva dall’accorpamento di risposte diverse che sono state ricondotte alla stessa forma normalizzata secondo i criteri illustrati nella pagina sulla codifica dei materiali.

Nel passaggio dalla traslitterazione in ortografia italiana alla rappresentazione normalizzata, ovvero il livello che astrae da tratti specifici della realizzazione fonetica corrispondenti a variazioni fonetiche produttive sul territorio toscano, abbiamo visto che la tipologia delle risposte si č ridotta quasi alla metą. Vediamo alcuni esempi: alla forma normalizzata cąglio sono state ricondotte forme alquanto diverse come cąio, cąiė, cągio, cąddiė, cąiio, cągghio, cąiiu, cąi e cągliu; in relazione alla forma normalizzata gąglio si osservano simili neutralizzazioni in quanto essa sussume forme come gąi, gąddio, gągghio. Rimangono tuttavia distinte a questo livello attestazioni come presurąia, presąme, presģna, presłra, presłri, presłria, presłro, presóia, presóio, presóre, presóro, presģna catterizzate da diverse suffissazioni e tenute distinte da présa cosģ come da parsłro e persłro.

Abbiamo visto l’impatto dei diversi livelli di rappresentazione del dato su una ricerca incentrata sulla domanda dove abbiamo osservato la tipologia dei risultati ridursi progressivamente nel passaggio da un livello all’altro. 

Passiamo ora a una ricerca di tipo diverso, incentrata sulla forma dialettale raccolta sul campo, e vediamo la progressione della produttivitą della ricerca attraverso i diversi livelli.

Supponiamo di voler recuperare al livello di rappresentazione in trascrizione fonetica le attestazioni della forma

Grazie al tipo di codifica semplificato adottato per l'interrogazione di materiali in trascrizione fonetica, il sistema restituisce risposte diverse: la forma oggetto dell’interrogazione e una sua variante spirantizzata (precisamente con la fricativa dentale in sillaba finale), ovvero per un totale di 60 occorrenze. 

L’utente č a questo punto chiamato a decidere se circoscrivere il recupero alle attestazioni corrispondenti alla richiesta di partenza, con un risultato di 33 occorrenze, oppure se concentrarsi su un’altra delle alternative recuperate (ad esempio, le attestazioni relative alla variante con fricativa dentale in sillaba finale) oppure se valutare il risultato globale.

Passando a interrogare il livello di rappresentazione successivo (traslitterazione in ortografia italiana), si constata uno scarto nella produttivitą della ricerca. Infatti, a partire dalla richiesta schiacciata le forme diverse in trascrizione fonetica recuperate sono numerose, tra cui:, ecc.

Ovvero, le forme recuperate a questo livello presentano diversi gradi di palatalizzazione del nesso e della /s/ preconsonantica, combinati tra di loro e con la realizzazione fricativa dell’occlusiva dentale. Nel caso specifico, si raggiungono 173 attestazioni, ampliando di ben tre volte il risultato ottenuto tramite l’interrogazione operante al livello di rappresentazione precedente.

Procedendo infine al livello delle rappresentazioni normalizzate, quello che astrae da variazioni di tipo fonetico produttive sul territorio della regione, la mole dei risultati della ricerca effettuata a partire dalla forma normalizzata schiacciata aumenta ulteriormente, passando a 310 attestazioni recuperate (da confrontarsi con le 60 recuperate al livello della trascrizione fonetica e le 173 recuperate al livello della traslitterazione ortografica). A questo livello, vengono ricondotte allo stesso tipo astratto forme alquanto diverse quali schiacciąta, schiacciąda, stiacciąta, schiacciąha cosģ come s-ciasséda. Rimangono invece distinte a questo livello attestazioni quali schiaccia, schiaccina, schiaccetta, ecc.

Per quanto ulteriori livelli di normalizzazione siano auspicabili, crediamo che la codifica dei materiali dialettali in ALT-WEB sia gią allo stato attuale funzionale sia al non addetto ai lavori, che interrogherą la base di dati rendendo attraverso le convenzioni dell’ortografia italiana la pronuncia locale, sia al dialettologo e al linguista che troveranno in questa codifica stratificata in livelli caratterizzati da astrazioni incrementali un primo, sebbene elementare, livello di tipizzazione dei materiali dell’ALT.

 
Parole di Toscana


HOME PERCHE' PROGETTO DOCUMENTAZIONE NAVIGAZIONE CREDITI LINKS UTILI CONTATTI