OpenAI 开源 SimpleQA 新基准，专治大模型“胡言乱语”

IT之家 10 月 31 日消息，当地时间 30 日，OpenAI 宣布，为了衡量语言模型的准确性，将开源一个名为 SimpleQA 的新基准，可衡量语言模型回答简短的事实寻求（fact-seeking）问题的能力。 OpenAI 开源 SimpleQA 新基准，专治大模型“胡言乱语”休闲区蓝鸢梦想 - Www.slyday.coM OpenAI 表示，目标是使用 SimpleQA 创建一个具备以下特点的数据集：SimpleQA 将是一个简单但具有挑战性的基准，用于评估前沿模型的事实准确性。SimpleQA 的主要限制在于其范围 —— 尽管 SimpleQA 准确，但它只在短查询的受限设置中测量事实准确性，这些查询是事实导向的，并且有一个可验证的答案。OpenAI 表示，模型在短回答中表现出的事实性是否与其在长篇、多事实内容中的表现相关，这仍是个悬而未决的研究课题。其希望 SimpleQA 的开源能够进一步推动 AI 研究的发展，使模型更加可信并富有可靠性。IT之家附有关地址：
广告声明：文内含有的对外跳转链接（包括不限于超链接、二维码、口令等形式），用于传递更多信息，节省甄选时间，结果仅供参考，蓝鸢梦想所有文章均包含本声明。

相关文章

中国汽车工业协会：不认同欧盟对华电动汽车反补贴调查终裁结果

高通骁龙 8 至尊版芯片模拟运行《荒野大镖客：救赎》游戏：峰值帧率 200 FPS，稳定 120 FPS

相关文章

中国汽车工业协会：不认同欧盟对华电动汽车反补贴调查终裁结果

高通骁龙 8 至尊版芯片模拟运行《荒野大镖客：救赎》游戏：峰值帧率 200 FPS，稳定 120 FPS

相关推荐

微信扫一扫