Conjuntos de datos de experimentos
Usa Datasets para almacenar casos de prueba reutilizables para experimentos. Cada conjunto de datos puede tener una o más versiones inmutables. Cuando ejecutas un experimento, Fetch Hive usa una versión específica del conjunto de datos para que la ejecución sea repetible.¿Cómo creo un conjunto de datos?
Abre Experiments y luego elige Datasets en la navegación secundaria. Haz clic en Add Dataset. Ingresa un nombre y una descripción opcional. Sube un archivo CSV. Puedes hacer clic en el área de carga o arrastrar el CSV hacia ella. Revisa el mapeo de columnas. Fetch Hive mapea automáticamente:- columnas normales a valores de entrada
expected_outputa la salida esperada- columnas
metadata.*a metadatos de fila
¿Cómo veo las versiones del conjunto de datos?
Abre Experiments y luego elige Datasets. Haz clic en una fila de conjunto de datos para abrir la página de detalle. Usa el selector de versión en el encabezado de la página para cambiar entre versiones. Las versiones se muestran como etiquetas comov1, v2 o v4.
La URL de la página incluye la versión seleccionada:
Formato de archivo CSV
La primera fila debe contener los encabezados de columna. El importador de CSV soporta valores entre comillas, comas dentro de valores entre comillas, comillas escapadas, valores entre comillas multilínea y celdas vacías. Límites de carga:| Límite | Valor |
|---|---|
| Tipo de archivo | CSV |
| Tamaño máximo de archivo | 5 MB |
| Filas máximas | 10,000 |
| Filas de vista previa mostradas en el diálogo | 50 |
Columnas del CSV
Un conjunto de datos de experimento tiene tres tipos de columnas:- columnas de entrada
- una columna opcional de salida esperada
- columnas opcionales de metadatos
Columnas de entrada
Las columnas de entrada son los valores que Fetch Hive pasa al prompt o agente para esa fila. No tienen nombres fijos para experimentos de prompt.question, context y customer_message son solo ejemplos. No son nombres de columna obligatorios.
Usa nombres de columna que coincidan con el candidato que estás probando.
| Tipo de candidato | Con qué deben coincidir las columnas de entrada del CSV | Columnas de ejemplo |
|---|---|---|
| Dashboard Prompt | Las variables del prompt en el editor de prompts | question, context, input_url, input_scrape |
| Deployed Prompt | Las variables del prompt capturadas en la versión del despliegue seleccionada | question, context, input_url, input_scrape |
| Agent | La entrada de mensaje de usuario del agente | message |
{{question}} y {{context}}, tu CSV debe incluir question y context.
Si tu prompt tiene {{input_url}} y {{input_scrape}}, tu CSV debe incluir input_url y input_scrape en su lugar.
Para experimentos de agente, usa message como la columna de entrada principal. Los agentes comienzan con un mensaje de usuario, por lo que message es la forma más clara para el conjunto de datos.
Columna de salida esperada
Usaexpected_output cuando tengas una respuesta de referencia para la fila.
| Nombre de columna | Requerido | Almacenado como | Notas |
|---|---|---|---|
expected_output | No | expected_output.value | Usado para revisión manual hoy y para puntuación futura de evaluadores. |
expected_output actualmente no marca un resultado como correcto o incorrecto automáticamente.
Columnas de metadatos
Usa columnasmetadata.* para etiquetas opcionales de fila.
Las columnas de metadatos no activan ningún comportamiento integrado actualmente. No cambian el orden de ejecución, los ajustes del modelo, la configuración regional, el enrutamiento ni la ejecución del candidato. Fetch Hive las almacena con la fila para que puedas identificar casos, filtrar resultados, comparar grupos o conectar los resultados de vuelta a tus propios sistemas.
| Patrón de columna | Requerido | Almacenado como | Ejemplo |
|---|---|---|---|
metadata.case_id | No | metadata.case_id se convierte en case_id | geo-001 |
metadata.topic | No | metadata.topic se convierte en topic | geography |
metadata.priority | No | metadata.priority se convierte en priority | high |
metadata.source | No | metadata.source se convierte en source | support_faq |
metadata.language | No | metadata.language se convierte en language | en |
metadata.* que ayude a tu equipo a revisar los resultados.
No uses prefijos meta_ para conjuntos de datos nuevos. Usa metadata.* para que el mapeo sea claro.
Formas comunes de CSV
Prompt con{{question}}:
{{question}} y {{context}}:
{{input_url}} y {{input_scrape}}:
CSV de ejemplo
Puedes descargar el CSV de ejemplo desde el diálogo Add Dataset.Versiones del conjunto de datos
Las versiones del conjunto de datos son inmutables. Si necesitas cambiar filas más adelante, crea una nueva versión del conjunto de datos en lugar de editar una versión ya usada por una ejecución. Esto mantiene las ejecuciones de experimentos antiguas reproducibles.Importar filas
Usa Import en la página de detalle del conjunto de datos para agregar filas a un conjunto de datos. Importar filas no edita la versión actual. Fetch Hive crea una nueva versión inmutable que contiene:- todas las filas de la última versión del conjunto de datos
- cualquier fila nueva del CSV subido
- la cantidad de filas importadas
- la cantidad de duplicados omitidos
- la nueva versión más reciente del conjunto de datos
v3 tiene 100 filas e importas un CSV con 20 filas donde 5 son duplicados, Fetch Hive crea v4 con 115 filas.
Las ejecuciones creadas antes de la importación siguen apuntando a su versión original del conjunto de datos. Las nuevas ejecuciones pueden usar la versión más reciente.
Consulta también: Construir un experimento y Revisar resultados
