跳到主要内容

🤖 LLM 可观测

LLM (Large Language Model,大语言模型)可观测性不仅能够提高模型的透明度,还能够及时发现并纠正潜在的问题,确保模型的安全及准确性,减少错误,提高用户信任,从而推动人工智能技术走上安全且可持续发展的道路。

📄️ 自动评估

Lighthouse 的 LLM 可观测模块的自动评估功能,是基于评估器(Evaluator)实现的。通过评估器,可以配置评估的目标数据、评估模型、评估维度,按照设定的规则,对目标数据进行自动给出合适的评分值。有效解决了人工评估效率低、准确性不足的问题。帮助企业在开发和优化 LLM 应用过程中精准定位需求,快速调整策略,从而加速产品迭代,确保应用的性能和功能符合业务目标。