Disponibile da oggi in beta negli Stati Uniti e nel Regno Unito, Claude 2 offre la possibilità di cercare nei documenti, riassumere, scrivere codice e rispondere a domande su qualsiasi tipo di argomento
Anthropic, startup fondata dagli italoamericani Dario e Daniela Amodei (ex dirigenti di OpenAI), e che lo scorso maggio ha chiuso un round da 450 milioni di dollari guidato da Google, ha ufficializzato l’arrivo di Claude 2, la seconda versione del chatbot alimentato dall’intelligenza artificiale generativa. Disponibile da oggi in beta sul web e tramite API negli Stati Uniti e nel Regno Unito, questo bot promette prestazioni maggiori e possibilità più limitate di generare contenuti falsi o dannosi. «Abbiamo lavorato per migliorare il ragionamento e il senso di consapevolezza del modello di linguaggio, in modo da consentirgli di seguire meglio le indicazioni prestando attenzione alle limitazioni», ha dichiarato Sandy Banerjee di Anthropic.
Quali sono le caratteristiche di Claude 2
Disponibile da oggi in beta negli Stati Uniti e nel Regno Unito, Claude 2 offre la possibilità di cercare nei documenti, riassumere, scrivere codice e rispondere a domande su qualsiasi tipo di argomento. Rispetto alla versione 1.3, secondo Anthropic, questo nuovo chatbot è più potente in quasi tutti i settori.
In particolare l’azienda sostiene che Claude 2 dimostra avanzamenti in tre aree chiave: codifica, matematica e ragionamento. “Il nostro ultimo modello ha ottenuto il 76,5% nella sezione a scelta multipla dell’esame da avvocato, rispetto al 73,0% con Claude 1.3”, scrivono. “Quando confrontato con gli studenti universitari che si candidano per la scuola di specializzazione, Claude 2 ottiene punteggi sopra il 90° percentile negli esami di lettura e scrittura del GRE, e simili all’applicante mediano nel ragionamento quantitativo”.
La seconda versione di Claude ha ottenuto un punteggio superiore nella sezione a risposta multipla dell’esame BAR: 76.5% contro il 73% della versione 1.3. Il bot è anche riuscito a superare la sezione a risposta multipla dell’esame U.S. Medical Licensing ed ha ottenuto un punteggio del 71.2% nel test di programmazione Codex Human Level Python (dove la versione 1.3 aveva raggiunto solo il 56%).
La startup, inoltre, ha tenuto a precisare che Claude 2 è “due volte migliore” rispetto alla versione 1.3 nel fornire risposte “non pericolose“, ma non sono state date altre informazioni sulle metriche utilizzate in questo caso. Dal whitepaper del progetto si evidenzia che la nuova versione è meno incline a fuggire dagli schemi e che quindi risulta più sicura per gli utenti.
Il rilascio di Claude 2 arriva a poca distanza dall’inizio della perdita di traffico per ChatGPT: potrebbe quindi essere questa un’occasione d’oro per proporsi come reale alternativa a quella che è l’AI più famosa del web al momento.