近日,复旦大学NLP(自然语言处理)实验室发布的2024年高考数学大模型评测结果显示,在Latex格式中,阿里千问和讯飞星火分别获得了2024高考数学新I卷的第一名和第二名,以及高考数学新II卷的第二名和第一名。两份考卷的评测中,GPT-4o均列第三名。
复旦NLP团队介绍实盘配资公司配资 ,全新出炉的高考试题具备高度的独创性和保密性,是用来评测大模型的绝好评测集合。基于Latex格式,在新Ⅰ卷中,阿里千问和讯飞星火对14道数学客观题的准确率达到70%以上。而在新Ⅱ卷的评测中,讯飞星火、阿里千问、GPT-4o准确率均超过60%。