Video indistinguibili dalla realtà: Ecco Veo 3 di Google

Hai presente quando un mese fa c'è stato il rilascio della funzionalità di generazione immagini con GPT-4o?

Se ti ricordi bene, ogni social network fu sommerso da immagini in stile Ghibli. 🙌

Ora sta succedendo qualcosa di simile con i video generati con Veo 3, il nuovo modello di generazione video di Google.💡

Ma prima di capire cosa sta succedendo oggi, torniamo un attimo a fine 2024, quando Google annunciò Veo 2.

Veo 2 fu il nuovo modello text-to-video di Google e venne lanciato come seria risposta a Sora di OpenAI.

Ti lascio a questo il link un nostro post vecchio in cui puoi vedere alcuni esempi di video generati con Veo 2.

Già allora erano super realistici.

Ricordi il video di Will Smith che mangia spaghetti?

Era diventato una sorta di benchmark per mostrare le performance dei modelli di generazione video.

Ecco, Veo 2 faceva già un ottimo lavoro rispetto ad altri modelli più vecchi (es. qui sotto👇).

Ma oggi, dopo solamente 6 mesi, abbiamo Veo 3, e siamo arrivati a un livello completamente nuovo.

Parliamo di video con audio generati da AI, ormai indistinguibili da quelli reali. 🤯

Demis Hassabis, CEO di Google DeepMind, ha dichiarato che nell’ultima settimana sono stati generati “milioni di video" grazie all’espansione del servizio in oltre 71 nuovi paesi.

Ma torniamo a noi, perché volevo approfondire l’effetto che sta avendo tutto questo sui social 🙌

Non so tu, ma io aprendo X, Instagram o TikTok nell’ultima settimana, mi sono trovato un sacco di video generati con Veo 3.

E questo ha dato vita a un trend particolare, quasi distopico: personaggi generati dall’AI che si interrogano sulla loro stessa esistenza.

Ti spiego meglio cosa intendo…

Tra tutti i video che avrai visto, ti saranno capitati anche video dove spesso i protagonisti arrivano a domandarsi:

“E se fossimo solo personaggi generati da prompt digitati da qualcuno al computer?”

È la cosiddetta “Prompt Theory”, una teoria diffusa all’interno di questi video dove i personaggi rifiutano l’ipotesi secondo la quale sono “solo creazioni da prompt”.

Qui vedi un altro esempio in cui un personaggio “si accorge di essere consapevole che vive in una simulazione.”

Il fatto che questi video siano estremamente realistici ci suscita un senso di inquietudine (almeno in me).

E leggendo qualche commento nei vari video ne ho avuto la conferma.

Commenti come:

👉 “Ho una brutta sensazione”

👉 “Aiuto, mi fa paura”

E ci sta, i video sono talmente realistici che ci suscitano emozioni come inquietudine e ansia essendo un qualcosa di nuovo, a cui siamo ancora poco abituati.

Ma è importante ricordare che ogni comportamento e parola dei personaggi di questi video sono il risultato di semplici prompt scritti da utenti.

Veo 3 sta avendo un boom simile alle immagini Ghibli, ma questa volta la barriera economica rende tutto più complesso.

💸 Veo 3 è molto costoso: circa $21 al minuto per video senza audio e ben $45 al minuto con audio.

Non esattamente alla portata di tutti, specialmente perché spesso il risultato non è quello desiderato e quindi bisogna rifarlo.

Ma ci sono anche alternative più economiche…come i modelli open-weights.

Esistono già modelli che puoi usare sul tuo computer e che stanno rapidamente raggiungendo il livello delle tecnologie più avanzate.

Dunque, stiamo arrivando a un punto in cui distinguere contenuti reali da quelli generati sarà difficile, se non impossibile, con conseguenze importanti per la nostra fiducia verso ciò che vediamo.

Per questo diventa importante trovare strategie di fact-checking “real-time” per spot e clip (sopratutto in ambiti come quello politico con i deepfake).

Ma anche per la disinformazione in generale.

Comunque se ci pensi è assurdo tutto questo…

Solamente a fine 2022 veniva annunciato il rilascio di ChatGPT.

E oggi, dopo solamente 3 anni, riusciamo a generare video che non si distinguono dalla realtà.

Dalla generazione di immagini e video alla scrittura di codice, la crescita è costante e veloce.

E se oggi siamo qui, secondo te dove saremo tra 2 / 3 anni? 🤔

Giacomo Ciarlini - Head of Content & Education - Datapizza

Alexandru Cublesan - Media Manager & Creator - Datapizza

03/06/2025Video indistinguibili dalla realtà: Ecco Veo 3 di Google