Sulla falsariga seguita dall’OVI per il TLIO (Tesoro della Lingua Italiana delle Origini) e del DWDS (Digitales Wörterbuch der deutschen Sprache) della Brandeburgische Akademie der Wissenschaften, nonché del Vo.Dim (Vocabolario dell’italiano Moderno e Contemporaneo, progettato dall’Accademia della Crusca oggi consultabile presso la “Stazione Lessicografica”), la Fondazione Verga sta realizzando dal 2017 il VIVer (Vocabolario dell’Italiano Veristico) basato su un corpus multigenere rappresentativo dell’esperienza verista in tutti i suoi aspetti.
Lo spoglio linguistico si sta svolgendo secondo le più attuali tendenze della lessicografia informatizzata e fornirà uno strumento essenziale per accertare il testo delle opere, qualificare e datare l’ingresso nella lingua nazionale di un patrimonio lessicale e fraseologico ancora in gran parte ignorato o sottovalutato. L’unico precedente in questa direzione è costituito dalle concordanze de I Malavoglia elaborate nei primi anni Ottanta dall’Accademia della Crusca e generosamente donate in forma di tabulati alla Fondazione Verga. Un analogo tentativo sperimentale fu svolto nello stesso periodo in collaborazione tra la Fondazione Verga e la Scuola Normale Superiore di Pisa per scrutinare sul piano della microsintassi il romanzo Eva. Questi tentativi pionieristici stanno trovando ora sistematica attuazione nel progetto in corso e in continua evoluzione, che riguarda attualmente il corpus narrativo e teatrale di Verga, Capuana, De Roberto e di autori rappresentativi del verismo italiano, come Renato Fucini, Matilde Serao e Neera. Per l’attuazione del progetto ci si avvale del metodo di marcatura e predisposizione lessicografica dei testi secondo il sistema TEI, collaudato per molti prestigiosi corpora. Seminari annuali saranno tenuti per divulgare i risultati del progetto a Catania o a Firenze.
Attualmente il progetto può contare sulla costante attività dell’assegnista di ricerca Dott.ssa Stephanie Cerruto, che, insieme a una tecnica di ricerca (Dott.ssa Valentina Puglisi), sta coordinando un gruppo di giovani contrattisti addetti alla correzione dell’OCR e alla marcatura dei testi. Si sta predisponendo una batteria di testi di autori e autrici veristi che testimonieranno l’avanzamento dei lavori del progetto e saranno presto consultabili in un’apposita “sala di lettura” accessibile nel portale dedicato al VIVer. Allo stato attuale sono stati predisposti in OCR e sono pronti per la marcatura trenta testi rappresentativi dei vari generi che rientrano nel VIVer. Questi testi saranno riversati nella “sala di lettura” in doppio formato: PDF e txt. La lettura sinottica in doppio formato consentirà di verificare l’importante lavoro di correzione delle scansioni in PDF attraverso il programma OmniPage, correzione preliminare e necessaria per la lemmatizzazione di testi filologicamente affidabili.
Sarà presto aperto un apposito portale che illustrerà e aggiornerà sistematicamente tutte le attività del progetto.
Per assicurare un avanzamento costante del progetto, a partire dal 2023 si sta costituendo una rete di università e centri di ricerca che si coordineranno per procedere alla marcatura e alla lemmatizzazione dei testi a seconda dell’area di appartenenza degli autori e delle autrici.