Composizione del corpus PRIN 2012 e consultazione dei singoli testi
Il Corpus
L'attuale versione del corpus testuale comprende 21 categorie:
- Arte (ART)
- Bollettini (BOL) *
- Canzone (CAN) *
- Cucina (CUC)
- Diritto Giurisprudenza (DIR GIU) *
- Diritto Legislazione (DIR LEG)
- Economia Trattatistica (ECO) *
- Filosofia (FIL)
- Giornali (PGI)
- Linguistica (LIN) *
- Diritto Letteratura (DIR LET)
- Parletteratura Divulgazione (PAR DIV) *
- Parletteratura Galatei (PAR GAL)
- Paraletteratura Ragazzi (PAR RAG)
- Paraletteratura Romanzi (PAR ROM) *
- Politica Discorsi (POL DIS) *
- Politica Sedute Parlamentari (POL SDP) *
- Politica Trattatistica (POL TRT)
- Scienza e Tecnica (SCI TEC)
- Storia(STO) *
- Verismo(VER)
I risultati di ogni ricerca visualizzano i contesti che soddisfano i criteri impostati tra tutti i documenti del Corpus. Per quanto possibile il riferimento, nome dell'unità cui appartiene il contesto, contiene l'indicazione della categoria e del nome del file così da risalire al documento xml originario:"(POL DIS)La nostra politica"; "(CUC)Manuale di cucina".
Alcune categorie sono ancora in fase di elaborazione perchè presentano problematiche specifiche, per altre siamo in attesa dell'inserimento di ulteriori materiali testuali.
I singoli testi
La maggior parte delle categorie è consultabile anche come testo singolo, sono state escluse al momento alcune tematiche di dimensione ridotta:
- Bollettini
- Canzone
- Diritto Giurisprudenza
- Economia Trattatistica
- Linguistica
- Paraletteratura Divulgazione
- Paraletteratura Romanzi
- Storia
altre sono in fase di valutazione:
- Politica Sedute Parlamentari
E' tuttavia possibile abilitare o disabilitare la consultazione di una singola categoria già presente nel corpus. La consultazione dei singoli testi potrà quindi variare dinamicamente in accordo alle esigenze e le scelte dei partner del progetto.
* Non consultabili come singoli testi, vedi sezione "I singoli testi"