数据集
在 Lighthouse 平台的 LLM 可观测模块,「数据集」指的是一组用于评估大模型在特定任务上的输出表现,这些数据集通常包含一系列的输入内容(Input)和输出参考答案(Reference Output)。
基于数据集,便可以进行实验。实验是指,通过组合数据集、Prompt、模型设置、评估 器(可选),实现在给定的 Prompt 下,对模型输入范例的 Input 内容,得到模型返回的 Output 内容。若配置了评估器,还会对每条数据进行评估,并给出评分值。
通过分析实验结果,可以找到优化 LLM 应用效果的方向,获得有助于业务决策的信息。
快速开始
准备工作: 开始实验前,需要提前准备的有:可选用的 Prompt 、模型 API、数据集范例、目标数据为数据集的评估器(可选)。
步骤 1️⃣ : 进入「数据集列表」页,单击右上角「+ 新建数据集」,填写数据集名称即可完成创建。
步骤 2️⃣ : 单击刚刚创建的数据集,默认进入该数据集的「范例列表」页。有三种方式可以添加范例,可选择您合适的方式添加范例。
步骤 3️⃣ : 进入该数据集的「范例列表」页,单击「+ 新建实验」后,按提示填写必要信息,即可完成创建。
成功创建后,等待实验状态为“已完成”,则说明实验执行完毕。便可进入该实验详情页查看数据结果。
数据集列表
进入「数据集」模块,默认展示数据集的列表页。
⬆️ 上方搜索框,可以通过数据集名称快速筛选出目标数据。
⬇️ 下方数据列表,默认展示数据集的名称、描述、实验数、范例数、创建时间。拥有权限的成 员,可以对其进行删除的操作。
↗️ 单击右上角「+ 新建数据集」,填写数据集名称即可完成创建。
目前,数据集名称暂不可重复。
范例
范例列表
在「数据集列表页」单击某个数据集名称,即可进入对应详情页。默认展示该数据集的范例列表。
范例,主要包括 Input、Reference Output、Metadata 三项内容。
- Input:输入内容,即模型需要处理的输入内容。
- Reference Output:输出参考答案,评估模型实际输出内容是,可作为参考标准(可选填)。
- Metadata:元数据(可选填)。
范例详情
行点击「范例列表」中的某条数据,即可查看对应详情页。
新建范例
目前,支持三种方式新建范例: