LiITA: la rivoluzione linguistica italiana tra AI e innovazione

Il progetto LiITA dell’Università Cattolica e dell’Università di Torino collega risorse linguistiche italiane, creando una Knowledge Base per l’Intelligenza Artificiale e l’analisi del linguaggio.
L’italiano entra nella rivoluzione tecnologica con LiITA (Linking Italian), un progetto che mira a costruire una banca della conoscenza linguistica italiana. Questa sarà la base per sviluppare nuove tecnologie e applicazioni avanzate nell’ambito dell’Intelligenza Artificiale (AI). Il progetto, frutto della collaborazione tra l’Università Cattolica del Sacro Cuore, campus di Milano, e l’Università di Torino, sarà presentato a “CLiC-it 2024 – Tenth Italian Conference on Computational Linguistics”, che si terrà a Pisa dal 4 al 6 dicembre 2024.
LiITA, supportato dal Ministero dell’Università e della Ricerca con un finanziamento PRIN-2022 PNRR di 237.695 euro, punta alla creazione di una Knowledge Base interoperabile per le risorse linguistiche italiane, dai testi antichi ai moderni, utilizzando i principi del Web Semantico e dei Linked Data. «Il cuore del progetto è una grande raccolta di lemmi, forme canoniche di citazione delle parole», spiega il professor Marco Passarotti, ordinario di Linguistica Computazionale presso l’Università Cattolica. Ogni lemma sarà collegato alle sue occorrenze nei corpora testuali, così come alle sue definizioni nei dizionari e lessici, creando un grafo di conoscenza che permetterà di estrarre informazioni e affinare modelli di AI per l’analisi linguistica avanzata.
«LiITA rappresenta una svolta nella linguistica, che sta vivendo una rivoluzione industriale-tecnologica grazie all’AI, un processo che coinvolge il linguaggio, l’oggetto più umanistico di sempre», sottolinea Passarotti. Il progetto offre nuove opportunità per settori come la ricerca, l’editoria, la medicina e il web, integrando dati linguistici in modo innovativo per supportare applicazioni mirate.
LiITA non è un caso isolato: il suo predecessore, LiLa (Linking Latin), coordinato anch’esso da Passarotti e finanziato dal Consiglio Europeo della Ricerca con 2 milioni di euro, ha creato una Knowledge Base per il latino con oltre 200.000 lemmi e numerose risorse linguistiche interoperabili. L’architettura di LiLa, come quella di LiITA, è trasferibile a qualsiasi lingua, grazie alla sua struttura basata su triple: soggetto, oggetto e relazione.
Oltre a innovare nella linguistica, il progetto si propone di invertire il calo di iscritti nei corsi di laurea in discipline umanistiche. Dati recenti mostrano una riduzione del 9,4% tra il 2022 e il 2023 nei corsi di Mediazione linguistica e Scienze linguistiche, con impatti simili su Lingue e letterature moderne. «Il momento per innovare è adesso, per far fronte a questa tendenza pericolosa», conclude Passarotti.