Aeneas è open source e in continuo sviluppo
Presentato Aeneas, il primo modello di Intelligenza Artificiale progettato per la contestualizzazione di iscrizioni antiche. Lo scopo di Enea è aiutare le studiose e gli studiosi di storia antica a interpretare, attribuire e restaurare frammenti testuali con maggiore precisione.
Il team di sviluppo
Enea è stato sviluppato da Google DeepMind, in collaborazione con l’Università di Nottingham e in partnership con ricercatori delle Università di Warwick, Oxford e dell’Università di Economia e Commercio di Atene (AUEB). Questo lavoro faceva parte di un progetto più ampio volto a esplorare come l’Intelligenza Artificiale generativa possa aiutare gli storici a identificare e interpretare meglio i parallelismi su larga scala. Aeneas è accessibile in maniera gratuita. È stato anche pubblicato un articolo su Nature dal titolo ‘Contestualizzare testi antichi con reti neurali generative’.
La sfida degli studiosi
In una nota ufficiale, scrive il team di Aeneas: “La scrittura permeava ogni aspetto del mondo romano, dalle imponenti opere imperiali agli oggetti più comuni. Graffiti politici, poesie d’amore, epitaffi, ma anche transazioni commerciali, inviti di compleanno e formule magiche: le iscrizioni offrono agli storici moderni una prospettiva inestimabile sulla diversità della vita quotidiana nell’antica Roma. Tuttavia, questi testi sono spesso frammentari, logorati dal tempo o intenzionalmente danneggiati. Restaurarli, datarli e collocarli geograficamente risulta quasi impossibile senza un contesto adeguato, specialmente quando si confrontano iscrizioni simili”.
L’IA che analizza migliaia di iscrizioni latine
Prosegue la nota del team: “Tradizionalmente, le studiose/i che lavorano con iscrizioni antiche si affidano alla propria esperienza e a risorse specializzate per identificare ‘paralleli’, ovvero testi che presentano somiglianze in termini di formulazione, sintassi, formule standardizzate o provenienza. Questo processo, sebbene fondamentale, è notoriamente complesso e dispendioso in termini di tempo. Aeneas, invece, accelera notevolmente tale attività: è in grado di analizzare migliaia di iscrizioni latine, recuperando in pochi secondi confronti e paralleli testuali e contestuali. Questo permette agli storici non solo di interpretare, ma anche di approfondire i risultati ottenuti dal modello. Aeneas può anche essere adattato ad altre lingue, scritture e supporti antichi, dai papiri alle monete.
Open source
È disponibile una versione interattiva di Aeneas sul sito predictingthepast.com. In questo modo, ricercatori, studenti, educatori, professionisti museali e altri utenti possono sperimentare le funzionalità di Enea. Per sostenere ulteriori ricerche sono disponibili open source anche il codice e il set di dati.
Da Ithaca a Aeneas
Prendendo il nome dall’eroe errante della mitologia greco-romana, Aeneas rappresenta un’evoluzione di Ithaca, il precedente lavoro che impiegava l’IA per restaurare, datare e localizzare iscrizioni greche antiche. “Aeneas compie un passo ulteriore, supportando gli storici nell’interpretazione e contestualizzazione dei testi, conferendo significato a frammenti isolati, facilitando l’estrazione di conclusioni più ricche e contribuendo a una migliore comprensione della storia antica”.
Le funzionalità di Aeneas
Tante le funzionalità di Aeneas. In primo luogo, la ricerca di parallelismi nelle iscrizioni latine. “Trasformando ogni testo in una sorta di impronta digitale storica, Aeneas identifica connessioni profonde che possono aiutare gli storici a collocare le iscrizioni nel loro contesto storico più ampio”. Aeneas è il primo modello in grado di determinare la provenienza geografica di un testo utilizzando input multimodali. Analizza dunque sia il testo sia le informazioni visive, come le immagini di un’iscrizione. Aeneas può restaurare lacune in testi anche quando la lunghezza del testo mancante è ignota. Questa capacità lo rende uno strumento versatile per gli storici, che si confrontano con materiale gravemente danneggiato.
Come funziona Aeneas
Aeneas è una rete neurale generativa multimodale che utilizza come input il testo e l’immagine di un’iscrizione. Per addestrare Aeneas, è stato curato un ampio e affidabile set di dati, attingendo da decenni di lavoro svolto dagli storici per creare collezioni digitali, in particolare l’Epigraphic Database Roma (EDR), l’Epigraphic Database Heidelberg (EDH) e l’Epigraphic Database Clauss Slaby (EDCS-ELT). Dice il team: “Abbiamo pulito, armonizzato e collegato questi record in un unico set di dati leggibile dalla macchina che chiamiamo Latin Epigraphic Dataset (LED), comprendente oltre 176.000 iscrizioni latine provenienti da tutto il mondo romano antico”.
Il modello impiega un decoder basato su trasformatore per elaborare l’input testuale dell’iscrizione. Reti specializzate si occupano del ripristino dei caratteri e della datazione utilizzando il testo, mentre per l’attribuzione geografica vengono utilizzate anche le immagini delle iscrizioni come input. Il decoder recupera iscrizioni simili dal LED, classificate in base alla rilevanza. Per ogni iscrizione, il meccanismo di contestualizzazione di Aeneas recupera un elenco di parallelismi utilizzando una tecnica chiamata ‘embedding’, che codifica le informazioni testuali e contestuali di ciascuna iscrizione in una sorta di impronta digitale storica contenente dettagli sul contenuto del testo, la sua lingua, la data e il luogo di provenienza e il suo rapporto con altre iscrizioni.
L’IA ripristina le iscrizioni danneggiate
Aeneas raggruppa le iscrizioni in base alla data di scrittura. Inoltre, ripristina le iscrizioni danneggiate con una precisione Top-20 del 73% in lacune fino a dieci caratteri. Questa percentuale scende al 58% quando la lunghezza del testo mancante è sconosciuta. Il modello mostra inoltre il proprio ragionamento in modo interpretabile, fornendo mappe di salienza che evidenziano le parti degli input che hanno maggiormente influenzato le sue previsioni. Grazie all’utilizzo di dati visivi, Aeneas può attribuire un’iscrizione a una delle 62 province romane antiche con una precisione del 72%. Per la datazione, il modello colloca un testo entro 13 anni dagli intervalli di date forniti dagli storici.
Aeneas testato su Augusto
Per testare le capacità di Aeneas su un dibattito di ricerca attuale, gli studiosi hanno fornito una delle iscrizioni romane più famose: la Res Gestae Divi Augusti, il resoconto in prima persona dell’imperatore Augusto delle sue imprese. Gli storici hanno a lungo discusso sulla datazione di questa iscrizione. Anziché prevedere una data fissa specifica, Aeneas ha prodotto una distribuzione dettagliata delle date possibili, mostrando due picchi distinti, uno più piccolo intorno al 10-1 a.C. e uno più grande e più sicuro tra il 10 e il 20 d.C. Questi risultati hanno catturato entrambe le ipotesi di datazione prevalenti in modo quantitativo. Aeneas ha basato le sue previsioni su sottili caratteristiche linguistiche e indicatori storici quali titoli ufficiali e monumenti citati nel testo. Sottolinea il team: “Trasformando la questione della datazione in una stima probabilistica fondata su dati linguistici e contestuali, il nostro modello offre un nuovo approccio quantitativo per affrontare dibattiti storici di lunga data. Ma soprattutto, Enea ha anche individuato molti parallelismi rilevanti nei testi giuridici imperiali legati all’eredità di Augusto, sottolineando come l’ideologia dell’impero fosse riprodotta attraverso l’intero mondo romano”.
Uno studio collaborativo per valutare l’impatto di Aeneas come strumento di ricerca
Per valutare l’impatto di Aeneas come strumento di ricerca, è stato condotto uno studio collaborativo su larga scala tra storici e IA. Sono stati invitati ventitré storici che lavorano regolarmente con le iscrizioni a restaurare, datare e collocare una serie di testi utilizzando Aeneas. La valutazione mostra come i risultati più efficaci siano stati ottenuti quando gli storici hanno utilizzato le informazioni contestuali di Aeneas insieme alle loro previsioni per il restauro e l’attribuzione delle iscrizioni romane. Sono stati tre i compiti epigrafici: restauro, attribuzione geografica, datazione. Sono state utilizzate 60 iscrizioni dal set di test del database. I compiti sono stati prima eseguiti in modo indipendente, poi con le informazioni parallele di Enea o con le informazioni parallele e le previsioni insieme. “Enea ha aiutato gli storici del nostro studio a identificare nuovi parallelismi e ha aumentato la loro sicurezza nell’affrontare complessi compiti epigrafici. Gli storici hanno costantemente sottolineato il valore di Enea nell’accelerare il loro lavoro e nell’ampliare la gamma delle iscrizioni parallele e confronti più rilevanti”.
Nuovo programma di studi
Il team di sviluppo sta aggiornando Ithaca per renderlo compatibile con Aeneas e includere la funzione di contestualizzazione, il restauro di lacune di lunghezza sconosciuta e prestazioni complessive migliori. Inoltre, “Abbiamo co-progettato un nuovo programma di studi per connettere competenze tecniche e pensiero storico nell’ambiente didattico. Questo programma è allineato con diverse iniziative di alfabetizzazione sull’IA, tra cui il Digital Competences Framework for Citizens (DigComp 2.2) della Commissione Europea, l’AI Competency Framework for Students dell’UNESCO e l’anteprima dell’European Commission and the Organization for Economic Cooperation and Development (OECD) AILit Framework. Viene evidenziato nella nota: “Il team di Aeneas prosegue la sua collaborazione con diversi esperti del settore, utilizzando Aeneas per far luce sulla storia antica, con ulteriori sviluppi in programma”.
Un processo collaborativo
Sottolineano i membri del team: “Aeneas è progettato per integrarsi nei flussi di lavoro di ricerca esistenti degli storici. Combinando le conoscenze degli esperti con l’IA, si apre un processo collaborativo, offrendo suggerimenti interpretabili che costituiscono preziosi punti di partenza per l’indagine storica”.







