rassegna stampa personalizzata

Le procedure di lemmatizzazione del sistema DBT2000 permettono la lemmatizzazione di testi con procedure semi automatiche, dove č possibile intervenire sui risultati della lemmatizzazione automatica e correggere anche per classi di errori. Per quel che riguarda i testi in lingua italiana sono comunemente utilizzate procedure automatiche che restituiscono una lemmatizzazione strettamente legata alla Treebank utilizzata dal sistema.
Le procedure di lemmatizzazione utilizzano alcuni componenti della galassia PiSystem sviluppati da Eugenio Picchi presso l'Istituto di Linguistica Computazionale "Antonio Zampolli" del C.N.R.:

  • PiMorfo -motori morfologici per alcune lingue (italiana, inglese, spagnolo, francese, latino, arabo);

  • PiTagger -sistema di disambiguazione automatica per la lemmatizzazione di testi in lingua italiana;

  • MorfologiaStorica -per l'utilizzazione di precedenti operazioni di lemmatizzazione su altri testi nella stessa lingua.

 

Testi in lingua spagnola da interrogare

                  
 
 
crediti: Manuela Sassi, Eva Sassolini, Sebastiana Cucurullo, Alessandra Cinini