概述
当你想在同一组输入上比较提示词或智能体时,使用 Experiments。 实验允许你:- 上传或选择数据集
- 添加提示词和智能体候选项
- 让每个数据集行对每个候选项运行
- 在一处查看输出、用量、成本和失败情况
你将在此找到
- 数据集 — 上传 CSV 文件、映射列并理解数据集格式
- 添加候选项 — 添加控制台提示词、已部署提示词和智能体
- 构建实验 — 创建实验并为运行做好准备
- 运行实验 — 启动、跟踪和取消实验运行
- 查看结果 — 比较输出、打开请求详情并检查失败
- 运行分析 — 比较运行的成本、token、延迟和成功率
- 评估器 — 了解当前评估器状态和规划中的评估器类型

