Benvenuto/a nel primo numero di Commit del 2024!
Tra l’altro mi sono reso conto che siamo ormai al 25esimo numero di questo appuntamento, che potrà sembrare poco ma è quasi mezzo anno che ci sentiamo qua ogni settimana!
Questa settimana ti voglio parlare del RAG, che è stata forse la tematica più calda del 2023 nel settore AI.
Con RAG si intende Retrieval Augmented Generation, ed è una tecnica per estendere le capacità dei modelli di linguaggio come GPT, LLama, o tutte le altre forme derivate di modelli che stanno proliferando.
Ma a cosa serve?
I modelli di linguaggio come GPT hanno vari…. problemi:
Ecco il RAG risolve questi problemi!
In pratica si creano delle sorte di "cassetti di memoria" (rappresentati come vettori numerici) ai quali il modello di linguaggio ha accesso e può usare per rispondere correttamente alle domande.
Ma come funziona?
Questi non sono altro che vettori di numeri che “catturano” il significato del contenuto e costituiscono un “Vector Store”.
Il Retriever prende la domanda dell’utente, capisce dove si trovano le informazioni per la risposta (dal VectorStore), e passa i risultati all’LLM.
Se vuoi approfondire ti lascio un paper che raccoglie tutte le tecniche del 2023, è aggiornato a un paio di giorni fa!
→ Retrieval-Augmented Generation for Large Language Models: A Survey
Inoltre ti lascio un comodo cheatsheet con varie modalitĂ avanzate per impostare una pipeline di RAG đź‘Ť
By Giacomo Ciarlini - Head of Content & Education - Datapizza
A proposito di RAG, ti consiglio di seguire Jerry Liu, il fondatore di Llama Index.
Llama Index è la più popolare libreria Python per il RAG, e offre tutta una serie di comode funzioni per caricare i tuoi documenti, collegare i modelli di linguaggio a database esistenti, e tanto altro ancora!
LlamaIndex - Data Framework for LLM Applications
Abbiamo trovato questa risorsa fighissima. In pratica è un intero libro pensato per aiutarti a superare i colloqui per posizioni di Machine Learning Engineer.
Il libro si compone di due parti:
E’ veramente una bomba, salvati il link!
Introduction to Machine Learning Interviews Book · MLIB
Uscito circa una settimana fa, questa ricerca suggerisce 26 tecniche per migliorare l'output dei modelli di linguaggio come i vari GPT, Bard, Llama.
Più che scoperte innovative è un buon aggregato di tutti i "tricks" che sono venuti fuori in questi mesi.
Il loro uso in certi casi RADDOPPIA le performance, e in generale rende piĂą robuste e prevedibili le risposte.
Dai un’occhiata!