🗺️ Roadmap per diventare GenAI Engineer

La settimana scorsa ho pubblicato un post LinkedIn dove spiegavo la nascita del lavoro del GenAI Engineer, e avevo promesso una roadmap gratuita per diventarlo.

Beh ci siamo!

In questo numero di Commit troverai tutti i link utili e le risorse rilevanti per diventare capace di costruire prodotti GenAI di ultima generazione.

Ah, e tutte le risorse sono gratuite o opensource!

Ma aspetta un attimo, cos’è un GenAI Engineer?

Secondo me è una specializzazione del cosiddetto AI Engineer, nome reso popolare da questo articolo di Latent Space, assolutamente consigliato (leggilo!)

Ma nella pratica cosa fa un GenAI Engineer?

Sviluppa progetti che integrino e combinino modelli di AI generativa di diversa natura (es: text-to-text, text-to-image)
Testa modelli di AI generativa sia proprietari che open source
Sviluppa progetti basati su tecniche di RAG (Retrieval di informazioni da documenti)
Effettua il fine-tuning di modelli di AI generativa preesistenti
Crea Agenti AI che usano i vari modelli

E tanto altro in realtà, ma questi sono i compiti più importanti.

Ma quindi veniamo alla domanda: come divento GenAI Engineer?

Ho cercato di riassumere in alcuni punti chiave le risorse utili per sviluppare le competenze che ti servono:

Basi di GenAI moderna:
- The Illustrated Transformer (e tutto il blog)
- LLM Bootcamp (ottima playlist)
- Building LLM for Production
- What are Embedding
Uso dei modelli
- Impara a usare i modelli tramite API, i migliori sono quelli di OpenAI e Anthropic, ma anche Cohere e Mistral sono validi
- Impara bene come costruire le chiamate, come i vari parametri influenzano i risultati
- In particolare concentrati su context window, *****few shot learning*, costi e latenza
Prompting
- Impara le tecniche di prompting avanzate, sopratutto quelle per “spremere” al massimo le capacità dei modelli di ragionare, come Tree of Thoughts e la Self Reflection
- Ti basta consultare la guida di Dair.ai e hai tutto quello che ti serve
- Impara quali sono i design pattern emergenti per LLM Engineering
- E i pattern per creare workflow avanzati con i prompt
RAG e Vector DBs
- Impara a usare i vector Database per archiviare i vettori che rappresentano la “memoria” dei modelli, i cosiddetti embeddings
- Impara a costruire sistemi RAG per dare contesto rilevanti ai modelli quando rispondono, partendo dalle implementazioni più semplici a quelle più complesse
- Capisci quando ha senso una ricerca tradizionale, quando il RAG, o quando una architettura ibrida
- Le guide di Llama Index sono fenomenali per questo
- Segui Jerry Liu su X per rimanere aggiornato sul tema dei vector DB
Finetuning
- Impara le basi del finetuning (una buona intro, una più approfondita)
- Capisci quando ha senso fare finetuning di un modello oppure no
- Tutorial per fare il finetuning di un modello (LLama)
Tool, Framework e Siti utili
- Huggingface (trovi migliaia di modelli open source)
- LlamaIndex (la base per fareil RAG)
- Qdrant (alternativa validissima per il RAG)
- DSPy (un nuovo approccio al “LLM programming”)
- Langchain (non usarlo, ma sfruttalo per vedere le implementazioni dei vari paper)
- Cheshire Cat (framework italiano per la costruzione di app con LLM)
Repository dove c’è altra roba utile
Newsletter e blog tecnici per rimanere sul pezzo
- Interconnects
- AI Snake Oil
- Import AI
- Latent Space
- Eugene Yan Blog
- Lilian Blog
Le ricerche più importanti
Articoli di blog super di valore

Bene, buoni prossimi 6 mesi di studio e sperimentazione 😂

Detto questo, è un ruolo difficile da inquadrare, che richiede di essere sempre aggiornati e che probabilmente si evolverà molto nei prossimi anni…

Ma che pagherà molto bene chi saprà costruire applicazioni usando i Foundation Models 🙂

Ah altra cosa:

Se qualcuno ti dice che devi conoscere complessi algoritmi di ottimizzazione o matematica avanzata per diventare AI Engineer, tu chiedigli: “ah quindi devo sapere come funziona la teoria dei segnali per fare l’elettricista?”

Scherzi a parte, questi nuovi modelli AI permettono di costruire cose super fighe a un livello di astrazione piuttosto alto, e non serve per forza una laurea STEM o un background matematico per lavorare con questi modelli.

Ah, se sei già esperto in questi temi, contattami assolutamente, potrei avere qualcosa per te 👀

Vieni a parlarne anche sul nostro Discord, trovi tutti i membri del team e migliaia di professionisti e appassionati di Tech, Data Science e AI! 🍕

Entra nel Discord!

By Giacomo Ciarlini - Head of Content & Education - Datapizza

Altre news interessanti

X.ai annuncia l’imminente rilascio di Grok 1.5
Microsoft Copilot potrebbe presto girare in locale sui nostri PC
New York sta testando dei detector per armi che usano l’AI
OpenAI racconta il lavoro fatto su Voice Engine, il loro motore Text to Speech

🍕 Datapizza Selection 🍕

Dai un occhiata a questo framework

Settimana scorsa è stato annunciato Agent Lumos, un Agent framework molto interessante.

È molto utile per impostare l'addestramento di agenti open-source basati su LLM (Large Language Model).

Nella partica consiste in un'architettura modulare con un modulo di pianificazione che può apprendere la generazione di sotto-obiettivi + un modulo specifico per tradurli in azioni con l'utilizzo di strumenti esterni (a cui l’agente può accedere).

Molto interessante, dacci un occhio!

02/04/2024🗺️ Roadmap per diventare GenAI Engineer

Altre news interessanti

🍕 Datapizza Selection 🍕

Dai un occhiata a questo framework