休闲区 中国联通业界首次提出大模型能力边界量化基准,避免“高射炮打蚊子”情况 相关研究成果以 <What is the Best Model? Application-Driven Evaluation for Large Language Models> 为题发表在自然语言处理权威会议 NLPCC 2024 上,相应的评估基准已向业界开源。 0 160 0 Share