外观
LangSmith 评估 (Evaluations)
约 295 字小于 1 分钟
2025-11-26
以下部分将帮助您创建数据集、运行评估和分析结果:
| 标题 | 描述 | 链接 |
|---|---|---|
| 评估概念 | 回顾核心术语和概念,以了解 LangSmith 中评估的工作原理。 | 评估概念 |
| 管理数据集 | 通过用户界面 (UI) 或 SDK 创建和管理用于评估的数据集。 | 管理数据集 |
| 运行评估 | 使用不同的评估器和技术来评估您的应用程序,以衡量质量。 | 运行评估 |
| 分析结果 | 查看和分析评估结果,比较实验,过滤数据,并导出研究发现。 | 分析结果 |
| 收集反馈 | 通过对输出的注释队列和内联注释来收集人工反馈。 | 收集反馈 |
| 遵循教程 | 通过分步教程进行学习,从简单的聊天机器人到复杂的代理评估。 | 遵循教程 |
注意: 要设置 LangSmith 实例,请访问 平台设置部分 以选择云、混合或自托管。所有选项都包括可观测性、评估、提示工程和部署。