封面新闻记者 欧阳宏宇
6月27日凌晨,AI模型领先平台“抱抱脸”(HuggingFace)公布全球开源模型排行榜,多款中国造开源模型上榜。其中,阿里的Qwen2-72B超越社交巨头Meta的Llama-3、法国大模型平台Mistralai的Mixtral等产品,成为开源模型排行榜第一名。李开复AI大模型公司零一万物的Yi-1.5也榜上有名。
据介绍,本次模型评估旨在抛开评估集数据的基础上,加大对开源模型的评估标题,以修正评估的效度。为此,此次评估使用了300块H100对目前全球100多个主流开源大模型,在BBH、MUSR、MMLU-PRO、GPQA等基准测试集上进行了全新评估。
评估结果显示,阿里最新开源的Qwen2-72B指令微调版本、Meta开源的Llama-3-70B指令微调版本,以及阿里的Qwen2-72B基础版本排名前三。
Mistralai的Mixtral-8x22B指令微调版本排名第4;微软最新开源的小参数模型Phi-3-Medium-4K 14B排名第五;零一万物最新开源的Yi-1.5-34B-Chat版本排在了第六名。此外,大模型平台Cohere开源带RAG功能的Command R+ 104B,曾经排名第一的英伟达开源的Smaug-72B-v0.1,在新的排行榜中位列第8名。
在分析人士看来,中国开源大模型在全球范围处于领导者地位。Stability AI研究总监他尼什克表示,中国在开源大模型领域非常有竞争力,除了此次上榜的大模型,InternLM、Deepsseek等很多知名的开源模型,在同OpenAI、Anthropic等旗下著名闭源大模型平台比拼时也不落下风。
UEADADYQHKQEHKQHEQ