02/04/2024🗺️ Roadmap per diventare GenAI Engineer
La settimana scorsa ho pubblicato un post LinkedIn dove spiegavo la nascita del lavoro del GenAI Engineer, e avevo promesso una roadmap gratuita per diventarlo.
Beh ci siamo!
In questo numero di Commit troverai tutti i link utili e le risorse rilevanti per diventare capace di costruire prodotti GenAI di ultima generazione.
Ah, e tutte le risorse sono gratuite o opensource!
Ma aspetta un attimo, cos’è un GenAI Engineer?
Secondo me è una specializzazione del cosiddetto AI Engineer, nome reso popolare da questo articolo di Latent Space, assolutamente consigliato (leggilo!)

Ma nella pratica cosa fa un GenAI Engineer?
- Sviluppa progetti che integrino e combinino modelli di AI generativa di diversa natura (es: text-to-text, text-to-image)
- Testa modelli di AI generativa sia proprietari che open source
- Sviluppa progetti basati su tecniche di RAG (Retrieval di informazioni da documenti)
- Effettua il fine-tuning di modelli di AI generativa preesistenti
- Crea Agenti AI che usano i vari modelli
E tanto altro in realtà, ma questi sono i compiti più importanti.
Ma quindi veniamo alla domanda: come divento GenAI Engineer?
Ho cercato di riassumere in alcuni punti chiave le risorse utili per sviluppare le competenze che ti servono:
- Basi di GenAI moderna:
- The Illustrated Transformer (e tutto il blog)
- LLM Bootcamp (ottima playlist)
- Building LLM for Production
- What are Embedding
- Uso dei modelli
- Impara a usare i modelli tramite API, i migliori sono quelli di OpenAI e Anthropic, ma anche Cohere e Mistral sono validi
- Impara bene come costruire le chiamate, come i vari parametri influenzano i risultati
- In particolare concentrati su context window, *****few shot learning*, costi e latenza
- Prompting
- Impara le tecniche di prompting avanzate, sopratutto quelle per “spremere” al massimo le capacità dei modelli di ragionare, come Tree of Thoughts e la Self Reflection
- Ti basta consultare la guida di Dair.ai e hai tutto quello che ti serve
- Impara quali sono i design pattern emergenti per LLM Engineering
- E i pattern per creare workflow avanzati con i prompt
- RAG e Vector DBs
- Impara a usare i vector Database per archiviare i vettori che rappresentano la “memoria” dei modelli, i cosiddetti embeddings
- Impara a costruire sistemi RAG per dare contesto rilevanti ai modelli quando rispondono, partendo dalle implementazioni più semplici a quelle più complesse
- Capisci quando ha senso una ricerca tradizionale, quando il RAG, o quando una architettura ibrida
- Le guide di Llama Index sono fenomenali per questo
- Segui Jerry Liu su X per rimanere aggiornato sul tema dei vector DB
- Finetuning
- Impara le basi del finetuning (una buona intro, una più approfondita)
- Capisci quando ha senso fare finetuning di un modello oppure no
- Tutorial per fare il finetuning di un modello (LLama)
- Tool, Framework e Siti utili
- Huggingface (trovi migliaia di modelli open source)
- LlamaIndex (la base per fareil RAG)
- Qdrant (alternativa validissima per il RAG)
- DSPy (un nuovo approccio al “LLM programming”)
- Langchain (non usarlo, ma sfruttalo per vedere le implementazioni dei vari paper)
- Cheshire Cat (framework italiano per la costruzione di app con LLM)
- Repository dove c’è altra roba utile
- Newsletter e blog tecnici per rimanere sul pezzo
- Le ricerche più importanti
- Articoli di blog super di valore
Bene, buoni prossimi 6 mesi di studio e sperimentazione 😂
Detto questo, è un ruolo difficile da inquadrare, che richiede di essere sempre aggiornati e che probabilmente si evolverà molto nei prossimi anni…
Ma che pagherà molto bene chi saprà costruire applicazioni usando i Foundation Models 🙂
Ah altra cosa:
Se qualcuno ti dice che devi conoscere complessi algoritmi di ottimizzazione o matematica avanzata per diventare AI Engineer, tu chiedigli: “ah quindi devo sapere come funziona la teoria dei segnali per fare l’elettricista?”
Scherzi a parte, questi nuovi modelli AI permettono di costruire cose super fighe a un livello di astrazione piuttosto alto, e non serve per forza una laurea STEM o un background matematico per lavorare con questi modelli.
Ah, se sei già esperto in questi temi, contattami assolutamente, potrei avere qualcosa per te 👀
Vieni a parlarne anche sul nostro Discord, trovi tutti i membri del team e migliaia di professionisti e appassionati di Tech, Data Science e AI! 🍕
By Giacomo Ciarlini - Head of Content & Education - Datapizza
Altre news interessanti
- X.ai annuncia l’imminente rilascio di Grok 1.5
- Microsoft Copilot potrebbe presto girare in locale sui nostri PC
- New York sta testando dei detector per armi che usano l’AI
- OpenAI racconta il lavoro fatto su Voice Engine, il loro motore Text to Speech
🍕 Datapizza Selection 🍕
Dai un occhiata a questo framework
Settimana scorsa è stato annunciato Agent Lumos, un Agent framework molto interessante.
È molto utile per impostare l'addestramento di agenti open-source basati su LLM (Large Language Model).
Nella partica consiste in un'architettura modulare con un modulo di pianificazione che può apprendere la generazione di sotto-obiettivi + un modulo specifico per tradurli in azioni con l'utilizzo di strumenti esterni (a cui l’agente può accedere).
Molto interessante, dacci un occhio!