各大模型在高考中表现如何?科大讯飞星火数学题正确率50% 排名第一

6月9日消息,科大讯飞于今日举办讯飞星火认知大模型V1.5 升级发布会,正式发布讯飞星火认知大模型V1.5,该模型的开放式问答能力取得突破,多轮对话和数学能力再升级,文本生成、语言理解、逻辑推理能力持续提升。

发布会上,科大讯飞展示了大模型在今年高考中的答题能力,科大讯飞星火力压群雄,成为了解题正确率最高、“最聪明”的AI大模型。

数学题目测试中,媒体选择了数学高考试卷前10道填空题,让百度文心一言、阿里通义千问、科大讯飞星火认知大模型、360智脑、ChatGPT进行回答。

测试结果显示,这五款大模型在答数学题的能力上差异显著。

最“聪明”的讯飞星火答对了5题,正确率50%,大模型数学能力排名第一。百度文心一言和ChatGPT“紧跟其后”,答对了4题,正确率为40%。

而在语文主观作答中,ChatGPT高考作文得分最高,文心一言、讯飞星火得分稍低,但跟ChatGPT处于同一水平。至于英语考试,讯飞星火、ChatGPT显著领先其它各家。

此外,值得关注的是,在今日讯飞星火大模型V1.5迭代升级后,其数学能力将会再上一个台阶。

返回顶部