Saltar al contenido principal

Construir un experimento

Crea un experimento cuando quieras comparar uno o más candidatos contra el mismo conjunto de datos.

¿Cómo creo un experimento?

Abre Experiments. Haz clic en Add Experiment. Ingresa un nombre y una descripción opcional. Elige un conjunto de datos si ya tienes uno. Haz clic en Add Experiment. También puedes crear primero el experimento y adjuntar o cambiar el conjunto de datos antes de ejecutarlo.

¿Qué debo agregar antes de ejecutar?

Antes de iniciar una ejecución, asegúrate de que el experimento tenga:
  • una versión del conjunto de datos
  • al menos un candidato activo
  • columnas de entrada que coincidan con las entradas del prompt o agente que esperas usar
Para prompts, asegúrate de que los nombres de las columnas de entrada del conjunto de datos coincidan con las variables del prompt cuando sea posible. Para agentes, usa columnas que dejen clara la intención de la fila, como question, task, context o customer_message.

¿Cómo debo nombrar los experimentos?

Usa nombres que expliquen la comparación. Buenos ejemplos:
  • Support FAQ prompt model comparison
  • Invoice extraction agent regression
  • Refund policy prompt v3 vs deployed
Evita nombres genéricos como Test o Experiment 1.

Editar un experimento

Abre el experimento. Usa el menú desplegable en las migas de pan para editar el nombre o la descripción del experimento. Usa Archive desde el mismo menú cuando ya no necesites el experimento en la lista principal. Los experimentos archivados se ocultan de la lista de experimentos predeterminada.

Reproducibilidad

Los experimentos están diseñados para ser repetibles. Las versiones de los conjuntos de datos son inmutables. Los candidatos se capturan como instantáneas. Esto significa que una ejecución pasada sigue apuntando a las filas del conjunto de datos y a la configuración del candidato usadas en ese momento. Si cambias un prompt o agente después, agrégalo como un nuevo candidato o inicia un nuevo experimento para que la comparación siga siendo clara. Consulta también: Conjuntos de datos, Agregar candidatos y Ejecutar un experimento