小米 AI 大模型首次曝光 同参数量级排名第一

荷科箱包网

虽然小米并未宣布过会加入 AI 大模型赛道,但是在最近,小米的 AI 大模型 MiLM-6B 悄然出现在了 C-Eval 和 CMMLU 大模型评测榜单上,并在 C-Eval 总榜单排名第 10、同参数量级排名第 1 的好成绩,小米似乎一直以来都在人工智能领域进行积极的探索。

MiLM-6B 是一个由小米公司开发的大规模预训练语言模型,其参数规模达到了 64 亿。这个模型已经在 C-Eval 总榜单上排名第 10,并且在同参数量级上排名第 1,展示出了小米在 AI 大模型领域的实力。

在具体的测试科目中,MiLM-6B 表现出了相当出色的能力,尤其是在 STEM ( 科学、技术、工程和数学教育 ) 的多个科目中,例如计量师、物理、化学、生物等,获得了较高的准确率。

然而,MiLM-6B 在一些文科科目中表现出了相对良好的准确度,但在涉及 抽象思维 的科目,例如法学、数学、编程、概率论、离散数学等科目中,还有一定的进步空间。

在 10 个 社会科学 测试科目中,除 教育学和地理 外,该模型在其他 8 个科目中都获得了较为理想的准确率。而在人文科学领域,MiLM-6B 在 历史与法律 基础上有着不错的准确率表现。

这个全新的 AI 大模型 MiLM-6B 虽然是首次曝光,但已经达到了较高的完成度。未来,这个模型可能会被用于小米旗下小爱同学等虚拟助理服务中。