Resumen
Usa Experiments cuando quieras comparar prompts o agentes contra el mismo conjunto de entradas. Un experimento te permite:- subir o seleccionar un conjunto de datos
- agregar candidatos de prompt y agente
- ejecutar cada fila del conjunto de datos contra cada candidato
- revisar salidas, uso, costo y fallos en un solo lugar
Qué encontrarás aquí
- Conjuntos de datos — Sube archivos CSV, mapea columnas y comprende el formato del conjunto de datos
- Agregar candidatos — Agrega prompts del panel, prompts desplegados y agentes
- Construir un experimento — Crea un experimento y prepáralo para una ejecución
- Ejecutar un experimento — Inicia, monitorea y cancela ejecuciones de experimentos
- Revisar resultados — Compara salidas, abre detalles de solicitudes e inspecciona fallos
- Análisis de ejecuciones — Compara el costo, tokens, latencia y tasa de éxito de las ejecuciones
- Evaluadores — Entiende el estado actual de los evaluadores y los tipos planeados

