各大模型在高考中表现如何？科大讯飞星火数学题正确率50% 排名第一-麦子文章

6月9日消息，科大讯飞于今日举办讯飞星火认知大模型V1.5 升级发布会，正式发布讯飞星火认知大模型V1.5，该模型的开放式问答能力取得突破，多轮对话和数学能力再升级，文本生成、语言理解、逻辑推理能力持续提升。

发布会上，科大讯飞展示了大模型在今年高考中的答题能力，科大讯飞星火力压群雄，成为了解题正确率最高、“最聪明”的AI大模型。

数学题目测试中，媒体选择了数学高考试卷前10道填空题，让百度文心一言、阿里通义千问、科大讯飞星火认知大模型、360智脑、ChatGPT进行回答。

测试结果显示，这五款大模型在答数学题的能力上差异显著。

最“聪明”的讯飞星火答对了5题，正确率50％，大模型数学能力排名第一。百度文心一言和ChatGPT“紧跟其后”，答对了4题，正确率为40％。

而在语文主观作答中，ChatGPT高考作文得分最高，文心一言、讯飞星火得分稍低，但跟ChatGPT处于同一水平。至于英语考试，讯飞星火、ChatGPT显著领先其它各家。

此外，值得关注的是，在今日讯飞星火大模型V1.5迭代升级后，其数学能力将会再上一个台阶。