Parlare con Donald Trump o fargli pronunciare praticamente qualsiasi cosa potrebbe non essere più un problema. Una startup canadese ha trovato il modo di riprodurre le caratteristiche vocali di qualsiasi persona con l’analisi di un solo minuto di parlato
Riprodurre la voce, l’intonazione e la pronuncia di un personaggio famoso è stato finora un divertente passatempo di imitatori e comici. La tecnologia potrebbe, però, portare questa attività su un altro piano e rendere l’audio riprodotto in tutto assimilabile all’originale. Basta solo un minuto di registrazione per poter ottenere una chiave in grado di far pronunciare a una persona praticamente qualsiasi cosa, senza che ci si possa accorgere della manipolazione.
Come parlare con Donald Trump
Il progetto è della startup canadese Lyrebird che ha elaborato un algoritmo in grado di rendere naturale una voce sintetizzata dalla sua applicazione, dopo appena pochi secondi di analisi di un registrazione. Lo slogan dell’azienda è: «Copia la voce di chiunque». Nella sua estremizzazione, l’utilizzo di Lyrebird potrebbe di fatto attribuire a presidenti o capi stato affermazioni mai pronunciate nella realtà. Con tanto di incidenti diplomatici che potrebbero derivare. Grazie all’intelligenza artificiale gli utenti potranno quindi ottenere dialoghi con Donald Trump, Hillary Clinton o Barack Obama che sono anche i personaggi scelti per dare dimostrazione del funzionamento dell’applicazione. Sul sito dell’azienda è possibile ascoltare alcuni esempi. Per ogni traccia audio ci sono diverse versioni delle possibili intonazioni che contribuiscono a rendere ancora più difficile l’individuazione delle voci sintetizzate.
Tutti le applicazioni di Lyrebird
I possibili impieghi di Lyrebird vanno dagli audiolibri, agli assistenti vocali, al sostegno alle persone disabili che non sono in grado di parlare. Ma si potrebbero utilizzare le voci riprodotte anche per doppiare i cartoni animati o i videogiochi. Un progetto simile era stato lanciato da Adobe VoCo, ma in quel caso era necessario registrare venti minuti di parlato per ottenere un risultato credibile. La tecnologia di Lyrebird è stata sviluppata nel Mila Lab dell’università di Montreal dove i suoi tre fondatori, Alexandre de Brébisson, Jose Sotelo e Kundan Kumar, sono studenti di dottorato. Allo sviluppo dell’azienda hanno collaborato anche importanti professori come Pascal Vincent, Aaron Courville e Yoshua Bengio che hanno messo a disposizione le loro competenze riguardo all’intelligenza artificiale.
La questione etica della manipolazione della voce
La possibilità di manipolare la voce altrui pone comunque un problema etico che l’azienda ha deciso di affrontare direttamente. Sulla sua pagina etica scrive: «Diffondendo questa tecnologia pubblicamente, rendendola disponibile a tutti vogliamo assicurarci che non esistano rischi riguardo alla possibilità di frodi o furto di identità. Speriamo che presto tutti si rendano conto che questa tecnologia esiste e che copiare la voce di qualcuno è possibile. Più in generale, vogliamo attirare l’attenzione sul fatto che in futuro una registrazione audio possa non essere più una prova». Il principio che viene evocato, quindi, è lo stesso che vale per le fotografie: le persone sono ormai consapevoli che le immagini possono esere state modificate e mettono in dubbio sempre la loro veridicità.