In questo articolo cerchiamo di fare chiarezza su tutte le terminologie legate all’Intelligenza artificiale, capendo il ruolo del machine learning e del deep learning, che sono alla base di tutte le rivoluzioni di AI generativa. Partiremo dalla base di cos’è l’AI e come si definisce, capendo poi come siamo arrivati fino qua, partendo dai primi esperimenti degli anni 50 fino a modelli estremamente avanzati come ChatGPT.
🤔 Cos’è l’Intelligenza Artificiale?
📜 Le prime AI progettate
👀 L’arrivo del Machine Learning
🧠 Il Deep Learning
🤖 La Generative AI (GenAI)
🗾 Una mappa per orientarti
📚 Risorse gratuite per approfondire
Partiamo dalle basi, secondo Wikipedia:
L'intelligenza artificiale è una disciplina che studia come realizzare sistemi informatici in grado di simulare il pensiero umano.
Ok, quindi di base parliamo di programmi (software) che compiono alcune funzioni, simili a quelle che gli umani riescono a compiere.
Queste funzioni sono di qualsiasi tipo:
In generale, quindi ci riferiamo al (vastissimo) campo dell’AI come tutti i software che emulano in qualche modo una capacità umana.
Il primo sistema intelligente mai progettato su ELIZA, un chatbot pensato per fare conversazione con gli umani.
Ovviamente non aveva nulla di “veramente intelligente” dentro, ma un enorme numero di frasi e pattern pre-impostati che dava la parvenza di stare parlando con un software che capisse quello che dicevi.
In realtà non capiva proprio nulla.
Con lo stesso principio, alla fine degli anni 90 viene progettato Deep Blue, il famoso software che sconfisse il campione mondiale di scacchi.
Anche qua, non c’era una vera e propria intelligenza, ma una serie enorme di “mosse preimpostate” e strategie codificate a mano da esperti di scacchi.
Non era molto diverso da un gigantesco database con tutte le possibili configurazioni della scacchiera e le “migliori mosse successive” associate.
Di nuovo, no intelligenza.
Questo tipo di AI è detta deterministica, e puoi trovare riferimenti ad essa anche come “sistemi a regole” o “sistemi esperti”.
Ma quindi quando sono nati i primi software davvero “intelligenti”, nel senso che apprendono dall’esperienza e non hanno bisogno di una “guida” per le azioni che devono fare?
Per avere software davvero “intelligenti” dobbiamo arrivare alla metà degli anni 2010, quando il nascente campo del Machine Learning ha preso il posto di quella che era l’approccio precedente all’AI.
L’intuizione del Machine Learning è:
💡 Ma invece che scrivere noi le regole e i pattern dentro il software… perchè non glieli facciamo imparare da una enorme quantità di esempi?
E questo si è rivelato… beh super efficace!
Nel 2012 per la prima volta un programma di Machine Learning (ML) batte un umano nel riconoscere il contenuto delle immagini, e da quel momento in poi sono stati creati innumerevoli sistemi di ML.
In realtà i sistemi di Machine Learning sono presenti ovunque nella nostra vita quotidiana.
Usi un sistema di Machine Learning:
Ora, questi sistemi hanno le forme più disparate, ma sono tutti accomunati da alcuni principi:
Qual è la differenza tra l’AI “storica” e l’AI “moderna” Le prime AI progettate erano deterministiche, ovvero a uno stesso input corrispondeva sempre uno stesso output. D’altra parte erano solo sistemi di regole statiche “se → allora”.
Invece il Machine Learning introduce modelli statistici, dove a uno stesso input possono anche corrispondere output diversi. Questi modelli sono i più usati oggi nell’industria.
I sistemi di ML non “guardano nel database” per fare le scelte, ma usano la conoscenza compressa all’interno dei parametri del modello statistico, che è stata appresa dai dati.
Anche se esistono decine di famiglie di modelli di ML, quelli che negli ultimi anni sono diventati più popolari sono proprio le reti neurali.
Questi modelli sono ispirati al funzionamento del cervello umano, e sono configurati come strati di “neuroni” artificiali.
Questi neuroni non sono altro che dei numeri, configurati in strati consecutivi, e collegati tra loro tramite “sinapsi”, che non sono altro che funzioni di moltiplicazione, detta “funzione di attivazione”.
Grazie al fatto che sono fatti “a strati” e sono così grandi, riescono a comprendere in profondità i pattern presenti anche in dati complessi come lunghe sequenze di testo, immagini, video, audio…
Da qua il nome di questa sotto branca del Machine Learning, detta Deep Learning.
Il Deep Learning è alla base di tutte le rivoluzioni AI a cui stiamo assistendo.
I modelli statistici che vengono addestrati su basi dati (dataset) per apprendere diversi tipi di capacità di classificazione o di previsione apprendono unicamente dagli esempi che vedono e non sono programmati esplicitamente.
I casi d’uso del Deep Learning si classificano spesso con il tipo di dato trattato dalla rete:
Quando si parla di Generative AI ci si riferisce a un particolare sotto insieme dei modelli di Deep Learning, che sono appunto “generativi”.
Il Deep Learning tradizionale non genera nuovi dati, ma li etichetta e li classifica, oppure fa una previsione numerica (tutti gli esempi che abbiamo visto prima).
Invece il Deep Learning Generativo (chiamato GenAI) è pensato per generare nuovi dati, grazie a tutto quello che ha imparato.
I modelli di GenAI sono preaddestrati da grandi aziende tecnologiche che li distribuiscono tramite le loro piattaforme cloud o applicazioni web come ChatGPT.
Questi modelli AI di grandi dimensioni sono molto adatti a costruire dei chatbot, che sono una comoda interfaccia per renderli utili usabili da chiunque.
Ok, abbiamo quindi capito che quello che chiamiamo AI è un vastissimo campo, che include metodi deterministici (pre-programmati) e statistici (che apprendono dai dati).
I metodi più usati sono quelli statistici però, dove i modelli apprendono dai dati (Machine Learning).
Dentro il Machine Learning, la famiglia più importante di modelli è quella del Deep Learning, che usa modelli detti reti neurali per apprendere in profondità le relazioni dentro dataset enormi e con formati complessi come immagini o video.
Con Generative AI si intende un particolare sotto insieme dei modelli di Deep Learning, che si concentrano sul generare nuovi dati.
I più popolari sono i GPT, alla base di applicazioni come ChatGPT.
Machine Learning
Deep Learning
Scritto da Giacomo Ciarlini