跳到主要内容

v1.21.0 版本发布

· 阅读需 4 分钟

本次版本更新聚焦于「LLM 可观测」模块,以下若无特殊说明,均为「LLM 可观测」相关功能。

新增特性(Feature)

  1. 「数据集 - 实验」模块,新增多个实验对比功能:
    1. 对比多个实验,同一个评估维度的平均分,进行整体评估。
    2. 对比同一范例不同实验的 Output 内容、自动评估结果对比。
  2. 「Prompt 管理」:同一个 Prompt 的不同版本,可以一键对比 Prompt 内容的差异。
  3. 「应用分析」模块:新增「关联功能」页面,快速展示当前应用的数据都被哪些功能所使用。
  4. 「人工评估」、「自动评估」、和「Prompt 管理」模块的列表,新增与之相关的“关联应用”或“关联数据集”。使得不同模块之间的数据关联更加清晰。

优化(Improvement)

  1. 人工评估结果与自动评估结果通过后缀 [Human][Auto]区分,减少疑惑。
  2. 展示评估器、自动评估维度、自动评估结果的地方,可以直接直接查看对应详情页。
  3. 「应用分析 - 会话分析」:
    1. Session 、Trace 、Span 详情页,新增关联的 应用Prompt信息,单击即可查看对应详情页。
    2. Session 、Trace 、Span 列表页的自定义列功能,新增分组管理,优化拖拽跳转排列顺序的交互。
  4. 列表数据批量选择的复选框不再默认显示,优化交互。
  5. 所有页面的快捷筛选且可以展开或收起。
  6. 展示 Dify 上报的工作流节点名称。

缺陷修复(Bugfix)

  1. 修复 LLM 偶发已完成的实验状态变为错误的问题。
  2. 修复 LLM 自动评估时,若使用的模型欠费导致的数据问题。
  3. 修复 LLM 评估 Trace 详情记录,偶发模型识别错误的问题。
  4. 修复 LLM Prompt 管理,创建之前删除 Prompt 相同名称提示已存在的问题。
  5. 修复 LLM 克隆评估器后,列表没有自动刷新展示新的评估器的问题。
  6. 修复 LLM 评估队列,列表仅显示 100 条数据的问题。
  7. 修复 LLM 删除 Prompt, 新建同名的 Prompt 关联数据还存在的问题。
  8. 修复 LLM 人工队列,查询报错的问题。
  9. 修复 LLM 无法删除已经创建的模型 API 的问题。
  10. 修复告警详情显示时间异常的问题。
  11. 修复 License 导入过大的日志资源量报错的问题。
  12. 修复 License 显示单位 B 的问题。
  13. 修复服务详情数据库错误率显示 100% 的问题。