20/02/2024📹 La più incredibile settimana dell’AI

Venerdì sera OpenAI ha deciso che era nuovamente il momento di cambiare il mondo.

Sam Altman ha annunciato Sora su X, il nuovo modello text-to-video sviluppato da OpenAI.

Guarda, è incredibile.

La qualità, la coerenza tra le scene e la risoluzione sono un “salto quantico” rispetto a quello a cui eravamo abituati.

Ad esempio questo è uno screenshot della differenza (usando lo stesso prompt) tra Sora e Runway.

[ l’immagine non rende, guarda il video ]

Inoltre Sora non è solo in grado di creare video estremamente realistici, ma può modificare video esistenti con un prompt, unire e interpolare video, descrivere cosa accade nei video (video captioning) e altro ancora!

Insomma all’interno di un unico modello sono contenute svariate funzionalità e tutte queste creano un netto SOTA (“State Of The Art”) rispetto ai competitor.

Il CEO di Runway, che era considerata l’AI text-to-video più avanzata fino a Venerdì…

Si è vero, Sora non è ancora perfetto, c’è qualche sbavatura, e se ti concentri 10 secondi a guardare il video puoi capire che è generato con AI…

Ma nel tempo in cui ce ne rendiamo conto probabilmente saranno già usciti 3 nuovi modelli che risolvono quei problemi. 👌

Chi può usarlo?

Ad oggi Sora non è ancora disponibile al pubblico ma è probabile che presto lo sarà, e non vediamo l’ora di provarlo!

Nel frattempo proviamo a fare una riflessione più ampia…

Poche ore prima di Sora, Google ha rilasciato una vera e propria bomba AI: Gemini 1.5.

Questo modello è fenomenale e batte quasi tutte le altre AI in quasi qualsiasi cosa!

  • Prestazioni notevolmente migliorate e una svolta nella comprensione di contesti mooolto lunghi.
  • Architettura efficiente con una nuova configurazione Mixture-of-Experts (MoE).
  • Capacità di elaborare fino a 1 milione di token, estendendo significativamente la finestra di contesto.
  • Miglioramenti nella capacità di ragionamento complesso e nel problem solving attraverso diverse modalità, inclusi testo, codice, immagini, audio e video.

Qua l’approfondimento tecnico → Gemini 1.5 Technical Report

Ora la domanda è…

Ne avevi sentito parlare?

Se la risposta è “no”, non preoccuparti… è normale.

Il lancio di Sora ha spiazzato tutti e ha molto più effetto “wow”, anche se Gemini Pro 1.5 è un avanzamento enorme tecnologico.

Sai cosa penso?

Che questo potrebbe far parte della strategia PR di OpenAI…

Come se Sam Altman avesse una cartella sul pc titolata “Comunicazioni bomba da rilasciare per oscurare i competitor” 😂

Vero, potrebbe benissimo essere una coincidenza, ma è stato davvero un timing curioso!

Anche perchè Gemini 1.5 sembra essere anche più capace di GPT4 a una varietà di task…

Ma quindi cosa voglio dire?

Beh, secondo me oltre che alla battaglia tecnologica (ho parlato più volte di “corsa alle armi”…) è in atto una vera e propria battaglia per l’attenzione degli utenti e del mondo!

Oltre a questo, mi sorgono anche tantissimi interrogativi su come questa velocità di progresso (che spesso è esponenziale) impatta il mondo del lavoro.

Chi sarà in grado di sfruttare questi strumenti, come registi, fotografi o creativi, probabilmente saranno molto più veloci e produttivi, ma chi invece è tagliato fuori da questo genere di progresso?

Che costi avrà poter usare questi strumenti?

Sono domande a cui chiaramente non ho risposta, ma mi farebbe piacere parlarne assieme nel nostro canale Discord se ti va 🙂

Entra, taggami e parliamone!

Entra nel Discord! 🍕


By Giacomo Ciarlini - Head of Content & Education - Datapizza


Altre news interessanti

🍕 Datapizza Selection 🍕

Il primo evento Datapizza x Microsoft

Il 14 Febbraio si è tenuto AI for Builders, il primo evento in collaborazione con Microsoft!

Perchè Datapizza e Microsoft? 💘

Beh l’obiettivo è chiaro e comune: aiutare l’Italia a fare il “salto tecnologico” di cui ha bisogno per essere competitiva nel settore dell’Intelligenza Artificiale.

L’evento è stato tenuto un po’ “nascosto” e sono stati invitati i presenti al nostro primo community event 👀

Per i prossimi, l’invito lo metteremo qua in Commit, quindi assicurati di iscriverti per non perderteli!

Io ho parlato di come costruire applicazioni basate su Large Language Models, quali opportunità ci sono e a cosa stare attenti, mentre Andrea D’Onofrio, Data & AI Lead di Microsoft, ci ha parlato di come le aziende stanno approcciando l’AI nel mondo reale.

Ti lascio il deck di slides da scaricare, sono piene di materiale utile!

Cloud computing: cos’è e come funziona?

In un nuovo video realizzato in collaborazione con BIP xTech abbiamo esplorato le basi del funzionamento del Cloud Computing.

Dentro il video troverai:

  • Cos’è il Cloud e come funziona
  • Perché il mondo moderno si basa sul Cloud Computing
  • Quali sono gli elementi base del Cloud
  • Perché è un ambito super richiesto dalle aziende!

Questo è il primo video di una playlist sul Cloud e AI, pensata per portarti “da zero a uno” in questo settore.

Facci sapere nei commenti che ne pensi 🙂

LINK AL VIDEO

Una nuova AI per le immagini

Google ha appena annunciato ImageFX, un nuovo generatore di immagini.

Sfruttando le capacità di Imagen 2 di Google e incorporando SynthID, una nuova tecnologia di watermarking di Google DeepMind, ImageFX introduce un watermark digitale nei suoi output.

Quindi saremo in grado di dire se l’immagine è generata… ma ovviamente vale solo per quelle realizzate con questo tool AI.

Per ora è disponibile solo in US, ma siamo super curiosi di provarlo, sembra molto semplice da usare e molto “controllabile”.