DatapizzaDatapizza logoDatapizza logo
  • AI Framework
  • Contatti
DatapizzaDatapizza

Iscriviti a Commit per rimanere aggiornato sul panorama tech

Iscrivendoti, accetti la nostra Informativa sulla privacy e acconsenti a ricevere gli aggiornamenti.

Pagine

  • AI Framework
  • Dual Intelligence
  • AI Adoption
  • Tech Recruiting
  • Accessibilità

Azienda

  • Contatti
  • Blog

Canali

Sede Legale: Via Giuseppe Ripamonti 190, Milano (MI) 20141

Numero REA: MI-2674097

Camera di commercio di Milano, Monza Brianza e Lodi

DPO: Antonio Sannino, antonio.sannino@studiosannino.it

Accessibilità: accessibilita@datapizza.tech

Ragione sociale: Datapizza S.r.l.

Partita IVA: 12629020962

PEC: datapizza@pec.net

Codice SDI: JI3TXCE

Capitale sociale: €25.000

Viale Sarca 222, 20126 - Milano

Termini e condizioniPrivacyCookieAggiorna preferenze cookies

Blog

RAG Evaluation: Using Claude Skills to craft a truly challenging Q&A set
R&D
#Coding
#LLM
#Tutorial

RAG Evaluation: Using Claude Skills to craft a truly challenging Q&A set

To truly evaluate a RAG system, public benchmarks aren’t enough—you need datasets that reflect real-world difficulty, including multi-hop questions, wide reasoning, and heterogeneous knowledge bases. In this article, we show how we designed a char-based, chunk-agnostic framework with easy/medium difficulty levels and human validation, leveraging Claude Skills and LLM retrievers to generate questions, answers, and evidence spans. The result is a public dataset based on D&D SRD 5.2.1 (plus two internal datasets), built for reproducible and comparable RAG pipeline testing.

13/11/2025
Evaluation per RAG: usare Claude Skills per progettare un dataset Q&A di livello avanzato
R&D
#Coding
#LLM
#Tutorial

Evaluation per RAG: usare Claude Skills per progettare un dataset Q&A di livello avanzato

Per valutare davvero una RAG non bastano i benchmark pubblici: servono dataset che riflettano difficoltà reali come domande multi-hop, wide e knowledge base eterogenee. In questo articolo mostriamo come abbiamo progettato un framework char-based, chunk-agnostic, con livelli easy/medium e controllo umano, e come usiamo Claude Skills e LLM retriever per generare domande, risposte e passaggi. Il risultato è un dataset pubblico basato su D&D SRD 5.2.1 (più due dataset interni) pensato per testing riproducibile e comparabile di diverse pipeline di RAG.

13/11/2025
La strada verso l'AGI: a che punto siamo?
Adoption
#News
#LLM

La strada verso l'AGI: a che punto siamo?

In questi giorni è uscito un paper molto figo (e molto serio) sull’AGI e volevo parlartene.

12/11/2025
Rifiutiamo l'AI per motivi di performance o principio? Cosa dice Harvard
Adoption
#News
#LLM

Rifiutiamo l'AI per motivi di performance o principio? Cosa dice Harvard

Uno studio di Harvard si è chiesto quali siano le principali resistenze all'AI nel proprio lavoro e sono uscite cose molto interessanti.

05/11/2025
10 anni per gli agenti AI avanzati: Karpathy ha ragione?
Commit
#News
#LLM

10 anni per gli agenti AI avanzati: Karpathy ha ragione?

Questo weekend ho ascoltato un'intervista a Andrej Karpathy, in cui ha raccontato la sua visione sugli agenti AI e sul futuro dell'intelligenza artificiale.

29/10/2025
Ottobre 2025: a che punto siamo con l’AI?
Adoption
#News
#LLM

Ottobre 2025: a che punto siamo con l’AI?

Un po’ di giorni fa, è stato rilasciato il report “State of AI 2025”. Si tratta di un report rilasciato ogni anno a Ottobre, che è diventato un riferimento importante per avere un punto della situazione sull’evoluzione dell’AI. 🙌

22/10/2025
Tre grandi novità da OpenAI, ma in Europa dovremo aspettare
Commit
#News
#LLM

Tre grandi novità da OpenAI, ma in Europa dovremo aspettare

Lunedì si è tenuto il DevDay, il momento annuale in cui OpenAI annuncia le novità per gli sviluppatori.

08/10/2025
Meta colpisce ancora: ecco i nuovi occhiali
Commit
#News
#LLM

Meta colpisce ancora: ecco i nuovi occhiali

Pochi giorni fa c’è stato il Meta Connect 2025, l’evento annuale dove l’azienda annuncia diverse novità legate a realtà virtuale, realtà aumentata e AI.

24/09/2025
Come usiamo (davvero) l’AI? Ecco cosa dicono i dati
Adoption
#News
#LLM

Come usiamo (davvero) l’AI? Ecco cosa dicono i dati

Ti sei mai chiesto come le persone utilizzino l’AI? 🤔

18/09/2025
  • 1
  • 2
  • 3
  • 4
  • More pages
  • 10