v1.21.0 版本发布
· 阅读需 4 分钟
本次版本更新聚焦于「LLM 可观测」模块,以下若无特殊说明,均为「LLM 可观测」相关功能。
新增特性(Feature)
- 「数据集 - 实验」模块,新增多个实验对比功能:
- 对比多个实验,同一个评估维度的平均分,进行整体评估。
- 对比同一范例不同实验的 Output 内容、自动评估结果对比。
- 「Prompt 管理」:同一个 Prompt 的不同版本,可以一键对比 Prompt 内容的差异。
- 「应用分析」模块:新增「关联功能」页面,快速展示当前应用的数据都被哪些功能所使用。
- 「人工评估」、「自动评估」、和「Prompt 管理」模块的列表,新增与之相关的“关联应用”或“关联数据集”。使得不同模块之间的数据关联更加清晰。