DatapizzaDatapizza logoDatapizza logo
  • AI Framework
  • Contatti
DatapizzaDatapizza

Iscriviti a Commit per rimanere aggiornato sul panorama tech

Cliccando il pulsante "Iscriviti" acconsenti al trattamento dei tuoi dati personali ai fini dell'invio della newsletter, come meglio specificato nell'informativa privacy.

Iscrivendoti, accetti la nostra Informativa sulla privacy e acconsenti a ricevere gli aggiornamenti.

Pagine

  • AI Framework
  • Dual Intelligence
  • AI Adoption
  • Tech Recruiting
  • Accessibilità

Azienda

  • Contatti
  • Blog

Canali

Sede Legale: Viale Sarca 222, Milano (MI) 20126

Numero REA: MI-2674097

Camera di commercio di Milano, Monza Brianza e Lodi

DPO: Antonio Sannino, privacy@datapizza.tech

Accessibilità: accessibilita@datapizza.tech

Ragione sociale: Datapizza S.r.l.

Partita IVA: 12629020962

PEC: datapizza@pec.net

Codice SDI: JI3TXCE

Capitale sociale: €25.000

Viale Sarca 222, 20126 - Milano

Termini e condizioniPrivacyCookie

Blog

RAG Evaluation: Using Claude Skills to craft a truly challenging Q&A set
R&D
#Coding
#LLM
#Tutorial

RAG Evaluation: Using Claude Skills to craft a truly challenging Q&A set

To truly evaluate a RAG system, public benchmarks aren’t enough—you need datasets that reflect real-world difficulty, including multi-hop questions, wide reasoning, and heterogeneous knowledge bases. In this article, we show how we designed a char-based, chunk-agnostic framework with easy/medium difficulty levels and human validation, leveraging Claude Skills and LLM retrievers to generate questions, answers, and evidence spans. The result is a public dataset based on D&D SRD 5.2.1 (plus two internal datasets), built for reproducible and comparable RAG pipeline testing.

13/11/2025
Evaluation per RAG: usare Claude Skills per progettare un dataset Q&A di livello avanzato
R&D
#Coding
#LLM
#Tutorial

Evaluation per RAG: usare Claude Skills per progettare un dataset Q&A di livello avanzato

Per valutare davvero una RAG non bastano i benchmark pubblici: servono dataset che riflettano difficoltà reali come domande multi-hop, wide e knowledge base eterogenee. In questo articolo mostriamo come abbiamo progettato un framework char-based, chunk-agnostic, con livelli easy/medium e controllo umano, e come usiamo Claude Skills e LLM retriever per generare domande, risposte e passaggi. Il risultato è un dataset pubblico basato su D&D SRD 5.2.1 (più due dataset interni) pensato per testing riproducibile e comparabile di diverse pipeline di RAG.

13/11/2025
La strada verso l'AGI: a che punto siamo?
Adoption
#News
#LLM

La strada verso l'AGI: a che punto siamo?

In questi giorni è uscito un paper molto figo (e molto serio) sull’AGI e volevo parlartene.

12/11/2025
Rifiutiamo l'AI per motivi di performance o principio? Cosa dice Harvard
Adoption
#News
#LLM

Rifiutiamo l'AI per motivi di performance o principio? Cosa dice Harvard

Uno studio di Harvard si è chiesto quali siano le principali resistenze all'AI nel proprio lavoro e sono uscite cose molto interessanti.

05/11/2025
10 anni per gli agenti AI avanzati: Karpathy ha ragione?
Commit
#News
#LLM

10 anni per gli agenti AI avanzati: Karpathy ha ragione?

Questo weekend ho ascoltato un'intervista a Andrej Karpathy, in cui ha raccontato la sua visione sugli agenti AI e sul futuro dell'intelligenza artificiale.

29/10/2025
Ottobre 2025: a che punto siamo con l’AI?
Adoption
#News
#LLM

Ottobre 2025: a che punto siamo con l’AI?

Un po’ di giorni fa, è stato rilasciato il report “State of AI 2025”. Si tratta di un report rilasciato ogni anno a Ottobre, che è diventato un riferimento importante per avere un punto della situazione sull’evoluzione dell’AI. 🙌

22/10/2025
Tre grandi novità da OpenAI, ma in Europa dovremo aspettare
Commit
#News
#LLM

Tre grandi novità da OpenAI, ma in Europa dovremo aspettare

Lunedì si è tenuto il DevDay, il momento annuale in cui OpenAI annuncia le novità per gli sviluppatori.

08/10/2025
Meta colpisce ancora: ecco i nuovi occhiali
Commit
#News
#LLM

Meta colpisce ancora: ecco i nuovi occhiali

Pochi giorni fa c’è stato il Meta Connect 2025, l’evento annuale dove l’azienda annuncia diverse novità legate a realtà virtuale, realtà aumentata e AI.

24/09/2025
Come usiamo (davvero) l’AI? Ecco cosa dicono i dati
Adoption
#News
#LLM

Come usiamo (davvero) l’AI? Ecco cosa dicono i dati

Ti sei mai chiesto come le persone utilizzino l’AI? 🤔

18/09/2025
  • 1
  • 2
  • 3
  • 4
  • More pages
  • 11