0310-3111082 3047798688@qq.com

又創新高,阿里通義開源模型Qwen2.5進入大模型盲測全球前十

來源:中原新聞網發布時間:2024-09-30 16:07:29

  文 丨 陳清

  出品丨鰲頭財經

  9月29日消息,基準測試平臺Chatbot Arena日前公布最新大模型盲測榜單,近日發布的阿里通義千問開源模型Qwen2.5再次闖入全球十強,其大語言模型Qwen2.5-72B-Instruct排名LLM榜單第十,是前十中唯一的中國大模型;Qwen系列視覺語言模型Qwen2-VL-72B-Instruct排名Vision榜單第九,是得分最高的開源大模型。

  同一時間,全球開源社區基于Qwen系列二次開發的衍生模型數量突破7.43萬,超越Llama系列衍生模型的7.28萬。通義千問Qwen成長為世界最大的生成式語言模型族群,在Hugging Face社區的開源模型權威榜單Open LLM Leaderboard上,Qwen系列及其衍生模型包攬了前十全部座次。

  不論是模型性能還是生態影響力,Qwen都創造了中國開源大模型的歷史。

  Qwen2.5-72B-Instruct排名Chatbot Arena大語言模型榜單第十

  Chatbot Arena是由開放研究機構LMSYS Org推出的大模型性能測試平臺,自2023年5月推出以來,一直是世界頂級大模型的最重要競技場。平臺目前集成了全球70多個大模型,采用匿名方式將大模型兩兩組隊,交給用戶進行盲測,用戶根據真實對話體驗對模型能力進行投票。

  9月19日發布的Qwen2.5迅速進榜,旗艦模型Qwen2.5-72B-Instruct得分位列LLM榜單第十,居于OpenAI的o1、GPT-4o等模型之后,是得分最高的中國大模型;同天,開源的視覺語言模型Qwen2-VL-72B-Instruct闖入Vision榜單第九,略遜于GPT-4o、Gemini-1.5-Pro等閉源模型,是成績最好的開源模型。此前,Qwen系列已有多款開源模型闖入Chatbot Arena榜單。

  Chatbot Arena官方發文,Qwen2-VL-72B-Instruct是排名最高的開源視覺語言模型

  Qwen2.5的發布在海內外開源社區引發一場狂歡,這套開源模型涵蓋多個尺寸的大語言模型、多模態模型、數學模型和代碼模型,幾乎所有尺寸的模型都實現了同等規模業界最佳性能,發布10天下載量超過150萬。有國外開發者稱贊通義千問稱得上是真正的“開放AI”,有用戶測評發現Qwen2.5從0.5B到72B都是SOTA水平,于是發起話題:“大家都用Qwen2.5替換了哪些常用模型?”

?2018中原新聞網站版權所有

亚洲美女网站一区二区三区,国产亚洲欧美日韩综合一区在线观看,久久tv免费国产高清,国产日韩AV免费元码一区二区
一本一久本久a久久精品 | 日本系列有码字幕中文字幕 | 伊人精品青青草原 | 一区国产亚洲欧美日韩在线一区 | 久久国产精品国产精品 | 日韩精品不卡在线高清 |