Web-based Textual Corpus of Central-Italian Dialects / Corpus testuale dell'Italia mediana- PRIN 2022
Il CorTIM consiste nella realizzazione di un corpus informatizzato basato su tutti i testi provenienti dall’Italia linguistica mediana e perimediana dalle Origini al Seicento. L’area sconta infatti ancora oggi la mancanza di un grande corpus testuale di riferimento. Il CorTiM si propone di colmare questo vuoto, valorizzare la cospicua documentazione dell’Italia linguistica mediana e perimediana e mettere gli studiosi in condizione di usufruire liberamente dell’abbondante patrimonio di dati linguistici da essa ricavabili. Il CorTiM, consultabile online in modalità open access, metterà a disposizione della ricerca storico-linguistica, lessicografica, filologica e letteraria un riferimento univoco e ben definito per lo studio degli antichi volgari dell’area mediana e della transizione tra volgari antichi e dialetti moderni, in particolare entro questi confini geografici: Marche meridionali; Umbria; Tuscia viterbese; Roma e castelli romani; Valle dell’Aniene; Lazio sabino; Abruzzo aquilano; Lazio meridionale dell’entroterra e Lazio meridionale costiero, fino a Cassino e a Gaeta. L’individuazione degli estremi cronologici consentirà di inserire nel progetto la documentazione attestante lo spartiacque segnato dalla “svolta” del romanesco tra I e II fase, e al tempo stesso di includere diverse tipologie di testi, dai glossari latino-volgari agli statuti, dai diari ai libri di conti, dai volgarizzamenti ai testi di dialettalità riflessa, permettendo agli studiosi di ottenere dati rilevanti sulla transizione tra i vernacoli antichi e i dialetti moderni. Nella fase di realizzazione del corpus, tutti i documenti considerati, sia ricavati da altri corpus esistenti sia digitalizzati per la prima volta, saranno oggetto di una valutazione dell’affidabilità filologica, che potrà portare alla produzione di revisioni o nuove edizioni; saranno inclusi, inoltre, testi inediti in corso di studio da parte dei gruppi di lavoro a cui afferiscono le tre unità coinvolte nel progetto. La documentazione, una volta valutata, sarà sottoposta a una marcatura con la quale verrà inserito un set di metadati su collocazione cronologica, collocazione areale generica, collocazione areale specifica, tipologia di testo. La marcatura verrà condotta secondo i parametri necessari per l’inserimento delle forme nel software GattoWeb. Il corpus sarà conservato e reso accessibile online alla comunità nazionale e internazionale: per questo ci si avvarrà della consulenza esterna dell’Opera del Vocabolario Italiano, che gestisce e rende disponibili sul proprio portale numerose banche dati a libero accesso prodotte da gruppi di ricerca esterni dell’Istituto. Inoltre, Il CorTIM potrà essere inserito in un’infrastruttura digitale come il CLARIN (Common Language Resources and Technology Infrastructure), che facilita il reperimento, l’uso e la diffusione di banche dati e strumenti digitali per la ricerca in campo linguistico. |