上海人工智能实验室发布首个 AI 高考评测结果:语数英总分最高 303 分,数学全部不及格
阅读提醒: 感谢网友 佳宜 的线索投递! 6 月 20 日消息,上海人工智能实验室 19 日公布了首个 AI 高考全卷评测结果。据介绍,2024 年全国高考甫一结束,该实验室旗下司南评测体系 OpenCompass 选取 6 个开源模型及 GPT-4o 进行高考“语数外”全卷能力测试。评测采用全国新课标 I 卷,参与评测的所有开源模型开源时间均早于高考,确保评测“闭卷”性。同时,成绩由具有高考评卷经验的教师人
【2024澳门今晚开什么码】 【新澳六开彩开奖号码记录】 【新澳2024年精准资料32期】 【澳门一肖一码100%准确彩】 【7777788888精准新传】 【2024年澳门版资料】 【2004新澳门天天开好彩大全】 【2024新澳免费资料三头67期】
感谢网友 佳宜 的线索投递!

6 月 20 日消息,上海人工智能实验室 19 日公布了首个 AI 高考全卷评测结果。据介绍,2024 年全国高考甫一结束,该实验室旗下司南评测体系 OpenCompass 选取 6 个开源模型及 GPT-4o 进行高考“语数外”全卷能力测试。

评测采用全国新课标 I 卷,参与评测的所有开源模型开源时间均早于高考,确保评测“闭卷”性。同时,成绩由具有高考评卷经验的教师人工评判,更加接近真实阅卷标准。

该机构表示,Qwen2-72B、GPT-4o 及书生・浦语 2.0 文曲星(InternLM2-20B-WQX)成为本次大模型高考的前三甲,得分率均超过 70%。大部分模型“考生”语文、英语科目表现良好,但数学方面仍有很大提升空间。

具体来看,InternLM2-20B-WQX 取得了数学单科的最高分,超越包括 GPT-4o 在内的所有模型。

注:此次参与“大模型高考”评测的产品包含 GPT-4o 及其他 6 个模型。为公平起见,此次评测没有纳入商用闭源模型。

  • Mixtral 8x22B:法国 AI 创业公司 Mistral 于 2024 年 4 月 17 日开源的对话模型。

  • Yi-1.5-34B:零一万物公司于 2024 年 5 月 12 日开源的 Yi-1.5 系列最大的模型。

  • GLM-4-9B:智谱 AI 于 2024 年 6 月 4 日推出的最新一代预训练模型 GLM-4 系列的开源版本。

  • InternLM2-20B-WQX:上海人工智能实验室于 2024 年 6 月 4 日开源的书生・浦语 2.0 系列文曲星大语言模型。

  • Qwen2-57B:阿里巴巴于 2024 年 6 月 6 日开源的 Qwen2 系列 MoE 对话模型。

  • Qwen2-72B:阿里巴巴于 2024 年 6 月 6 日开源的 72B 稠密模型。

语数外三科加起来的满分为 420 分,此次高考测试结果显示,阿里通义千问 2-72B 排名第一,为 303 分,OpenAI 的 GPT-4o 排名第二,得分 296 分,上海人工智能实验室的书生・浦语 2.0 排名第三,三个大模型的得分率均超过 70%。来自法国大模型初创公司的 Mistral 排名末尾,仅拿下 185 分。

数学是所有大模型的短板,平均得分率仅有 36%,参与测试的大模型无一及格

此外,阅卷教师也对大模型表现进行了整体分析,为模型能力提升策略提供参考。

语文

模型的现代文阅读理解能力普遍较强,但是不同模型的文言文阅读理解能力差距较大。

大模型作文更像问答题,虽然有针对性但缺乏修饰,几乎不存在人类考生都会使用举例论证、引用论证、名人名言和人物素材等手法。

多数模型无法理解“本体”“喻体”“暗喻”等语文概念。语言中的一些“潜台词”,大模型尚无法完全理解。

数学

大模型的主观题回答相对凌乱,且过程具有迷惑性,甚至出现过程错误但得到正确答案的情况。

大模型的公式记忆能力较强,但是无法在解题过程中灵活引用。

英语

英语整体表现良好,但部分模型由于不适应题型,在七选五、完形填空等题型得分率较低。

大模型英语作文普遍存在因超出字数限制而扣分的情况,而人类考生多因为字数不够扣分。

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,所有文章均包含本声明。

【正版澳门管家婆资料大全】 香港开奖结果香港开奖现场 【演澳门资料大全】 女人长期跑步的好处 【澳门传真~澳门传真】 2023澳门资料正版全年免费 【高手资料免费公开大全】 2024澳门特马今晚开奖网站 【一肖一码100准王中王香港】

1、打一个耳洞代表可以戴漂亮耳饰打耳洞即在耳垂的特定部位生成一可佩戴耳饰的永久性孔隙耳垂一般可分为小耳垂型普通型和大耳垂型打耳洞的关键之一是要选对部位孔隙的最佳位置是在耳屏切迹底部作一水平线,在此水平。

2、打耳洞没有区别说法,也没有特定意义,有些人打耳洞只是为了可以戴漂亮耳饰,有些人打耳洞可能对个人有特殊意义,比如纪念某件事或为了某个人等等耳洞 由来相传古代有一位害眼病的姑娘,不久双目失明了后来,她幸遇一。

3、男的打耳洞只打一个,那么必须打左耳朵,打右耳朵代表同性恋的意思,还有如果打的多且不对称,左耳朵的的数量一定要比右耳朵的数量多,否则也代表同性恋。

4、区别在于左耳洞象征情感状况,右耳洞象征象征个性如果一个男生他没有女朋友的话,他在左耳朵上佩戴耳钉,那就说明这个男生处于单身情况,或者是正在疗养内心的伤害如果一个男生有女朋友的话,他选择在左耳朵上佩戴耳钉那。

5、听说,女生左耳的耳洞代表友情,右耳的耳洞代表爱情耳洞不是轻易就打的,因为它是自己身体留的某种纪念,也是心灵的一种寄托它会使你在穿过的那一瞬间,去忘记那些伤心的事情,用身体上的伤痛去掩饰内心深处的伤痛所以。

6、男人打左耳洞,男性扮酷的一种表现,普通的人穿是一种时尚,很多艺人也会打耳洞,代表一种性格的东西,与众不同,一种潮流,一种最普通的艺术行为的表现有时会人感觉得到一种原始的男性的魅力,雄性的力量他们是男人。

7、女生打耳洞只打右边代表爱情最盛行的传说,女孩子左面的耳洞代表友情,右面的耳洞代表爱情都说耳洞是感情的缺口,连着心脏的神经,有最温柔的脆弱,说穿过耳洞的红颜,下一个轮回还能遇上前世的爱打耳洞是为了纪念一个。

8、男的单打右耳代表同性恋,女的单打左耳代表同性恋 不过也没什么,在于个人怎么看如果喜欢打那只耳朵,就打呗,也没有太多人会注意啦, 经常碰水不弄干就会感染发炎,有的人说不要弄金霉素眼膏,怕粘住灰,但我觉得。

9、传说三穿耳洞时,你若是想着一个男人,下辈子就还是女人,而且是他的女人传说四在遇见你真正爱的人的时候,你就去打耳洞,穿过一世的光阴,让你们在一起传说五女孩子左面的耳洞代表友情,右面的耳洞代表爱情耳洞。