当前标签

基准测试

大模型基准测试有了 ITU 国际标准,中国信通院牵头制定

本次发布的国际标准基于当前产学研界 500 余项基准测试系统性研究,一方面确立了大模型基准测试的 4 项核心要素,包括测试维度(测试场景、测试能力、测试任务和测试指标)、测试数据集、测试方法和测试工具。另一方面,针对通用场景的基础模型,提供了标准化的测试用例和范例流程,以支持企业规范开展大模型能力评估。

微信扫一扫

微信扫一扫
返回顶部

显示

忘记密码?

显示

显示

获取验证码

Close