Evaluation

ragway includes built-in evaluation modules to benchmark pipeline quality.

Metrics

rag evaluate --dataset eval.json --config rag.yaml

from ragway.evaluation.faithfulness import FaithfulnessEval
 
# Evaluate generated answer and retrieved context against a question.

Use the same dataset across pipeline variants to compare quality and cost trade-offs.