Datapizza Blog

Blog

Lessons from Testing Contextual Retrieval on Multiple Datasets

We tested Contextual Retrieval across multiple datasets to understand whether it still improves RAG systems in 2026, compared to base retrieval and modern rerankers. Here's what we found

15/01/2026

Cosa abbiamo imparato testando la Contextual Retrieval su diversi dataset

Cosa abbiamo imparato testando la Contextual Retrieval su diversi dataset

Abbiamo testato la Contextual Retrieval su diversi dataset per capire se nel 2026 migliora davvero i sistemi RAG, confrontandola con il retrieval base e con l’aggiunta di reranker moderni. Ecco cosa abbiamo scoperto

RAG Evaluation: Using Claude Skills to craft a truly challenging Q&A set

To truly evaluate a RAG system, public benchmarks aren’t enough—you need datasets that reflect real-world difficulty, including multi-hop questions, wide reasoning, and heterogeneous knowledge bases. In this article, we show how we designed a char-based, chunk-agnostic framework with easy/medium difficulty levels and human validation, leveraging Claude Skills and LLM retrievers to generate questions, answers, and evidence spans. The result is a public dataset based on D&D SRD 5.2.1 (plus two internal datasets), built for reproducible and comparable RAG pipeline testing.

Evaluation per RAG: usare Claude Skills per progettare un dataset Q&A di livello avanzato

Per valutare davvero una RAG non bastano i benchmark pubblici: servono dataset che riflettano difficoltà reali come domande multi-hop, wide e knowledge base eterogenee. In questo articolo mostriamo come abbiamo progettato un framework char-based, chunk-agnostic, con livelli easy/medium e controllo umano, e come usiamo Claude Skills e LLM retriever per generare domande, risposte e passaggi. Il risultato è un dataset pubblico basato su D&D SRD 5.2.1 (più due dataset interni) pensato per testing riproducibile e comparabile di diverse pipeline di RAG.

Assumere con l'AI: La Guida Pratica per Startup Senza un Team HR

Sei in una startup o una scale-up. Il prodotto cresce, i clienti aumentano e arriva il momento di allargare il team. Devi assumere, ma non hai ancora un reparto HR o un Talent Acquisition specialist interno. Ti ritrovi così a gestire un processo di hiring complesso, che ti porta via tempo prezioso che dovresti dedicare al business.

Come costruire la tua Web App - Le tecnologie fondamentali nel 2025

Scopri le tecnologie fondamentali per costruire applicazioni web moderne nel 2025: TypeScript, Next.js, tRPC, Prisma e Tailwind. Una guida completa alla Tech Stack ottimale.

Come creare immagini con ChatGPT-4o

Scopri come utilizzare ChatGPT-4o per generare immagini con la nuova funzionalità Image Generator: La guida completa alla rivoluzione multimodale di OpenAI.

4 Corsi di Programmazione GRATUITI di Harvard

Scopri i migliori corsi di programmazione gratuiti offerti da Harvard! Da CS50 a sviluppo web, AI e cybersecurity.

Hugging Face: Che cos'è e come ha reso l'Intelligenza Artificiale accessibile a tutti

Scopri come Hugging Face ha rivoluzionato l'accesso all'intelligenza artificiale, rendendo i modelli AI accessibili a tutti. Tutorial, storia e guida pratica all'uso della piattaforma.

09/04/2025