Nell’ultimo mese, a sorpresa, DeepSeek ha annunciato due nuovi modelli. 💡
DeepSeek è una società cinese di AI che sviluppa modelli linguistici open source e di alta qualità. 🔥
*Ma perché ultimamente si parla solo di questo?* 👀
In pratica DeepSeek ha rilasciato due modelli 👇
*E raga sono incredibili 😅*
Andiamo a vedere più nel dettaglio... 🔍
📌 DeepSeek V3
Il 26 dicembre DeepSeek ha rilasciato V3, un modello con 671 miliardi di parametri che:
Vediamo un secondo i benchmark 👇
Come puoi vedere, le performance sono simili (in certi casi anche superiori) ai giganti del settore ad una frazione del costo. 🚀
In pratica, un modello open source (in realtà open weights) sta raggiungendo performance che sono ai livelli dei modelli di punta dei Big Lab AI. 🙌
Se vuoi approfondire la *differenza tra open source e open weights* ne ho parlato in questo post LinkedIn. ✍️
DeepSeek ha raggiunto questi risultati anche grazie alla *Model Distillation*, basata sulla conoscenza di GPT-4o. 📈
La model distillation è il processo di trasferimento della conoscenza da un modello di grandi dimensioni a uno più piccolo.
Ma questo ha fatto inca***re qualcuno… 😂

In breve, la distillazione *viola i termini di servizio di OpenAI*, che però a sua volta ha addestrato i suoi modelli su dati presi da Internet, senza permessi…
*E ok, questo è un breve riassunto di V3.*
La vera bomba arriva con R1 💣
📌 DeepSeek R1: la risposta open source a o1
R1 è un nuovo modello che simula il ragionamento, come o1. 👀
È un modello “*Chain of Thought*” che utilizza il Reinforcement Learning per risolvere problemi complessi in modo autonomo. 💡
Perché ne stanno parlando tutti? 🗣️
I motivi sono tanti👇
*Parliamo un attimo delle performance…*


Insomma, la Cina ha lanciato questi modelli dal nulla, senza alcun preavviso 😂
Tra l’altro, ieri, le azioni di Nvidia hanno perso il 10,7%. Si pensa che questo e altri titoli tech siano precipitati proprio a causa dei rilasci di DeepSeek. 📉
Se ci pensi, è ironico pensare come i *modelli Occidentali* siano *closed source* mentre un modello Cinese di questa portata sia open source. 🌍
*Ok, ma cosa significa tutto questo per il mondo AI?*
In primis, il divario tra modelli open e closed source non è mai stato così piccolo. 👀
E per quanto riguarda invece i costi dell’AI, questi potrebbero diminuire drasticamente. 📉
Al momento R1 sembra veramente aprire nuovi scenari nel mondo dell'AI, soprattutto considerando il rapporto qualità-prezzo. 🔥
A breve dovrebbe essere rilasciato *o3-mini di OpenAI* e nei prossimi mesi o3. 🙌
Vedremo chi avrà la meglio nel breve periodo. 💪
Sempre che la Cina non sganci altre notizie dal nulla nel giro di poche settimane (o giorni) 😂
Ah tra l’altro, proprio questo giovedì, faremo una live su LinkedIn e YouTube in cui approfondiamo i modelli di DeepSeek a livello tecnico. 💡
Fidati, ne vale la pena approfondire questa notizia 👈
Ti lascio qui il link per iscriverti alla live! ✌️
Il link lo metto non appena creiamo l’evento domani mattina
***
By Giacomo Ciarlini - Head of Content & Education - Datapizza