05/03/2024La (nuova) migliore AI europea

Mistral è davvero una minaccia per OpenAI?

La settimana scorsa Mistral, la startup AI francese di cui parlo spesso, ha annunciato “Au Large” un nuovo modello AI di frontiera e un assistente AI simile a ChatGPT, Le Chat.

Il blog dice:

  • Il modello si chiama “Mistral Large”
  • È competitivo con GPT4
  • Batte Claude 2 di Anthropic, ma non Claude 3 (di cui
  • Parla inglese, francese, spagnolo, tedesco e italiano
  • Può “chiamare funzioni”

Quindi…

Abbiamo un modello che è competitivo con la migliore AI al mondo (GPT4), è nato in Europa, e soprattutto è stato realizzato da una startup di 20 persone che è nata meno di un anno fa!

Ora, è vero che i benchmark classici come MMLU, anche se indicativi delle performance, di un modello, non ci dicono poi molto sull’effettiva “utilità” per gli utenti.

Inoltre bisogna anche osservare come il modello non sia più “open” ma venga offerto solo tramite pagamento di API, in modo diverso quindi dai precedenti modelli di Mistral, 7B e 54B MoE.

Interessante osservare che proprio questa settimana Mistral ha annunciato una “partnership strategica” con Microsoft, cedendo oltre alle quote anche un po’ di “credibilità”…

Sorge spontanea la domanda: “Mistral è davvero il Campione Europeo AI?”

E’ anche noto come Mistral sia coinvolta nelle negoziazioni sull’AI Act, e **c’è chi si sente addirittura “tradito”.**

Onestamente non ho una forte opnione al riguardo, addestrare e servire i modelli ha costi proibitivi, e sicuramente Microsoft può offrire potenza di calcolo a un prezzo fortemente competitivo.

Diaicmo che posso comprendere la mossa di Mistral.

Infine vorrei fare una riflessione…

Come è possibile che una startup nata a Luglio 2023 abbia raggiunto così in fretta performance simili a quelle di OpenAI?

Secondo me la risposta è… che partono con zero “debito tecnico”.

Proprio ieri Greg Brockman (OpenAI) ha fatto un tweet del tipo “quando inizi il design di qualcosa è meglio spendere più tempo a pensare alle assunzioni base, perchè poi diventa difficile cambiarle”.

Ecco penso che le “lezioni” apprese dagli ex-Meta e Google che hanno creato Mistral gli abbiano permesso di fare in costruire buoni modelli in mesi anzichè anni.

Cose imparate sul campo come:

  • la composizione ottimale del dataset
  • le strategie di training e distribuzione
  • valutazione, tuning e allineamento
  • tecniche avanzate come “Mixture of Experts”

Sono tutti temi per cui Mistral alla sua nascita ha potuto già “azzeccare il 99%” di quello che andava fatto per costruire una startup che creasse modelli “di frontiera”.

Vediamo come si evolve e seguiremo tutti gli aggiornamenti, sicuramente ne parleremo ancora!

Cosa ne pensi di Mistral? Hai già provato i modelli?

Vieni a parlarne sul nostro Discord, trovi tutti i membri del team e migliaia di professionisti e appassionati di Tech, Data Science e AI! 🍕

Entra nel Discord!


By Giacomo Ciarlini - Head of Content & Education - Datapizza


Altre news interessanti

  • Annunciato Evo, un modelli AI “genetico” dell'Arc Institute, che impara attraverso i linguaggi fondamentali della biologia: DNA, RNA e proteine.
  • Rilasciato Emo del gruppo Alibaba, che prende un'immagine statica di una persona e un audio di parlato o canto, e genera un video di quella persona (con l'audio).
  • Microsoft annuncia “Copilot for Finance” per rivoluzionare l’uso dei file Excel per calcoli finanziari e di accounting.

🍕 Datapizza Selection 🍕

Il paper da salvare

Abbiamo parlato di debito tecnico, nello specifico per modelli AI, quindi voglio lasciarti una risorsa SUPER sul “debito tecnico nel Machine Learning”.

E’ un paper di Google che affronta tutti i problemi di creare e mantenere sistemi AI scalabili e sicuri, e spiega come risolvere queste sfide e a cosa stare attenti.

Un must have per ogni persona tecnica che ha che fare con sistemi ML di qualunque tipo.

https://proceedings.neurips.cc/paper_files/paper/2015/file/86df7dcfd896fcaf2674f757a2463eba-Paper.pdf

Una lettura consigliata

Leggi questo articolo che esplora l'esperienza di Gemini Pro 1.5.

In sostanza:

  • modello eccelle nell'elaborare grandi quantità di testo, audio e video (!)
  • supera i limiti precedenti in termini di finestra di contesto e gestione di prompt complessi.

Nell’articolo di sono vari esempi concreti di come il modello possa leggere interi romanzi o codici sorgente e fornire risposte dettagliate e contestualizzate, aprendo nuove possibilità per l'uso dell’AI.

Che idee di startup ti vengono in mente? 👀

https://every.to/chain-of-thought/i-spent-a-week-with-gemini-pro-1-5-it-s-fantastic?