«Non siamo usciti dal nulla: è un lavoro che facciamo da oltre dieci anni. Sviluppiamo modelli proprietari dal 2010. Con LARA puntiamo a raggiungere la singolarità linguistica nel 2025: significa raggiungere la qualità dell’1% dei traduttori più bravi al mondo. Quelli che commettono un errore ogni mille parole su un testo generico». Marco Trombetti, imprenditore e investitore, è il Ceo e co-founder di Translated, azienda innovativa con sede a Roma fondata nel 1999 insieme alla linguista Isabelle Andrieu.
Su StartupItalia ci ha già raccontato la sua storia: un’azienda italiana che si occupa di Intelligenza artificiale, traduzioni e software che spazio ha in un mercato sempre più competitivo? Siamo tornati a sentirlo in occasione del lancio di LARA, software di AI verticale nel segmento delle traduzioni. «Se ci ritroveremo con OpenAI e pochi altri player sarà un problema».
Il percorso di LARA, la nuova AI di Translated
«Da quando abbiamo iniziato a sviluppare modelli proprietari abbiamo lavorato su machine learning, reti neurali e dal 2017 su Transformer». Di cosa stiamo parlando? Si tratta di un paper presentato in quell’anno da Google dal titolo “Attention is All You Need”: è un tipo di rete neurale utilizzata per compiti come la traduzione automatica, il riassunto di testi o la risposta a domande. La caratteristica chiave del Transformer è il meccanismo di attenzione, che permette al modello di focalizzarsi sulle parti più rilevanti dell’input quando genera l’output. Di fronte a una frase complessa da tradurre il sistema non legge parola per parola, ma osserva l’intera frase per capire quali sono i termini più rilevanti.
«Dal Trasformer in poi – ha ripreso la parola Trombetti – abbiamo costantemente aumentato la dimensione dei modelli senza cambiare l’architettura al di sotto. Con LARA, di nuovo, l’abbiamo modificata». Il Ceo di Translated ha spiegato come: «Combiniamo la fluency e la capacità di gestire gli ampi contesti degli LLM con le architetture di traduzione. Il tutto serve per andare più a fondo».
Da appassionato di quello che ci aveva presentato come il «problema della lingua», Trombetti ha un’idea chiara su cosa distingua il suo prodotto da altri competitor. «Con altre soluzioni c’è il rischio allucinazioni. Sono inaccettabili se devi preservare il significato». Tra i target dell’azienda italiana ci sono i traduttori e i professionisti del settore, che tra l’altro hanno contribuito attivamente al lavoro su LARA.
«Dal 2010 lo avevamo chiarito. I tool di traduzione costavano parecchio e noi lo abbiamo reso disponibile in open source gratuito. Loro (i traduttori, ndr) in cambio ci segnalavano dove la tecnologia sbagliava. Il framework legale risale a quasi 15 anni fa». Come ha comunicato la società romana, il software di LARA utilizza un set di dati di 25 milioni di traduzioni reali eseguite da traduttori professionisti, che include traduzioni automatiche riviste e perfezionate dai traduttori, raccogliendo errori, feedback correttivi e ragionamenti su eventuali disaccordi. «Non sapevamo che sarebbe arrivata la capacità di gestire tutti questi dati».
L’AI che corregge se stessa
Nel corso dello sviluppo il team si è poi confrontato con situazioni inaspettate. «Abbiamo scoperto che un modello, superata una certa intelligenza, è più bravo a criticare se stesso. Questo modello critica se stesso e chiede come avrebbe potuto fare meglio, disambiguando il significato». Translated ha potuto lavorare su LARA a fronte dell’aumento di capitale da 30 milioni di dollari guidato da Ardian nel 2021. «Avevamo comunque cassa, ma grazie a quelle risorse extra abbiamo potuto accelerare, permettendoci di correre rischi più grandi per fare un modello più grande».
La piazza è comunque affollata: Google, DeepL e pure OpenAI offrono servizi di traduzione gratuita. «Sul verticale delle traduzioni siamo i più forti. Gli americani non intendono la lingua come un problema. Non hanno le caratteristiche per affrontarlo». C’è poi il rischio oligopolio, così come spesso succede sul fronte digitale? «Dobbiamo avere almeno più di cinque modelli di AI di successo, che generino una diversificazione sul mercato. Meta, forse per fare uno sgambetto a OpenAI, ha lanciato Llama in open source: ha creato un ecosistema di persone che sviluppano modelli ed è quello che vogliamo».
Il lavoro sui uno dei supercomputer più potenti
In parallelo, sul fronte open source, Translated e Cineca, uno dei più grandi centri di calcolo al mondo, hanno annunciato di recente un progetto di ricerca per creare un’intelligenza artificiale in grado di tradurre come i migliori traduttori professionisti. Sarà possibile grazie a Leonardo, il settimo supercomputer più potente al mondo (terzo in Europa) presso il Tecnopolo di Bologna. «La traduzione è la mamma dei problemi dell’AI. Con questo accordo rilasceremo un traduttore italiano-inglese e inglese-italiano con licenza open source simile a quella di Meta».
Nel corso dell’intervista Trombetti ci ha anche spiegato che LARA è stata allenata sulla piattaforma di NVIDIA con 1,2 milioni di ore di lavoro di GPU. «Allo stato attuale è la soluzione migliore. Sul mercato sono interessanti le proposte che fanno altre realtà come AMD e Cerebras». Il software è disponibile e rivolto a un target preciso, i traduttori. «Possono consegnare il lavoro nella metà del tempo, con qualità più alta, dedicandosi alla parte più creativa. Non sarà mai un nostro obiettivo sostituire il contributo umano, la macchina deve risolvere task con utilità».
Lo scenario internazionale vede i principali player correre, mentre i regolatori – Bruxelles in testa – sembrano inseguire. «La tecnologia è monopolizzante. Si tendono a creare monopoli, che le autorità antitrust non hanno capito. Questo fa malissimo all’innovazione e alla concorrenza», tema cardine anche di un’altra riflessione che Trombetti ha fatto in merito alla proposta di web tax al 3% per le startup contenuta nella bozza della manovra. Nel momento in cui si raggiungerà la singolarità linguistica ci saranno comunque conseguenze. «Quando la macchina arriverà a quel punto cambierà l’industria: cambia il modo in cui si traducono le lingue».