DeepSeek後,阿里又出重磅!

來源:Wind綜合財聯社、證券時報、華爾街見聞
2025年1月29日凌晨,阿里雲通義千問旗艦版模型Qwen2.5Max正式釋出。新模型展現出極強勁的綜合性能,在多項公開主流模型評測基準上錄得高分,全面超越了目前全球領先的開源MoE模型以及最大的開源稠密模型。與此同時,阿里巴巴美股股價在當天收盤前半小時出現顯著上漲,漲幅1%快速拉昇至6.7%。
// 阿里除夕夜丟擲重磅新模型// 
1月29日凌晨,阿里雲通義千問旗艦版模型Qwen2.5Max正式釋出。據微信公眾號“阿里雲”訊息,Qwen2.5-Max模型是阿里雲通義團隊對MoE模型的最新成果,預訓練資料超過20萬億tokens。新模型展現出極強勁的綜合性能,在多項公開主流模型評測基準上錄得高分,全面超越了目前全球領先的開源MoE模型以及最大的開源稠密模型。
在測試大學水平知識的MMLU-Pro、評估程式設計能力的LiveCodeBench、綜合能力評估的LiveBench,以及近似人類偏好的Arena-Hard等多個權威評測中,該模型均展現出與DeepSeek V3、GPT-4和Claude-3.5-Sonnet比肩,甚至領先的效能。
(圖片來自:阿里雲微信公眾號)
由於無法訪問GPT-4o和Claude-3.5-Sonnet等閉源模型的基座模型,通義團隊將Qwen2.5-Max與目前領先的開源MoE模型 DeepSeek V3、最大的開源稠密模型Llama-3.1-405B,以及同樣位列開源稠密模型前列的Qwen2.5-72B進行了對比。在所有11項基準測試中,Qwen2.5-Max全部超越了對比模型。
圖片來自阿里雲微信公眾號)

// 或引發中國AI資產新一輪重估// 
當天,阿里巴巴美股股價在收盤前半小時出現顯著上漲,漲幅由1%快速拉昇至6.7%。按市值計算,阿里巴巴市值單日市值增長143.62億美元
而行情異動背後,是否意味著中國AI資產的重估時機已至?
日前,中國人工智慧企業深度求索(DeepSeek)釋出其最新開源模型DeepSeek-R1,用較低的成本達到了接近於美國開放人工智慧研究中心(OpenAI)開發的GPT-o1的效能。這一進展破解了全球人工智慧產業長期以來“堆算力”的路徑依賴,其影響波及了資本市場。就中國A股市場來看,1月27日,WindDeepSeek合作商指數大漲了10.96%,多隻成分個股漲幅超過10%。
當下,國內外廠商在開閉源路線上各有側重。比如OpenAI的GPT-4模型採用閉源模式,而Meta選擇完全開源。而DeepSeek和阿里雲通義團隊都是開源路線的堅持者。
DeepSeek的成功也被認為是開源模型的勝利。圖靈獎得主、Meta 首席人工智慧科學家 Yann LeCun此前表示,對於DeepSeek的成功,其正確的理解應該是:開源模型正在超越專有模型。
LeCun 表示,DeepSeek 之所以這次一鳴驚人,是因為他們從開放研究和開源(如 Meta 的 PyTorch 和 Llama)中獲益。DeepSeek 提出了新想法,並在他人工作的基礎上構建。因為他們的工作是公開發布和開源的,每個人都可以從中受益,這就是開放研究和開源的力量。
阿里集團CEO吳泳銘也曾表示,“通義的開源模型在中文世界的開發者使用廣泛,當開發者使用阿里雲的開源模型,需要把應用部署到線上的時候,就會自然而然地選用阿里雲的服務。”
而繼DeepSeek之後,Qwen2.5-Max的釋出無疑是中國AI陣營在高效能、低成本技術路線上的又一重要突破。有市場人士分析稱,此前過度聚焦DeepSeek,卻忽視了包括阿里通義在內的中國AI整體性追趕。
值得一提的是,就阿里雲而言,其還有"強大模型+充足算力+完整雲平臺"的組合優勢,或有望引發DeepSeek之後的中國AI資產新一輪重估。
(Wind綜合財聯社、證券時報、華爾街見聞
對此,您怎麼看?
期待您在留言區理性發布高見,留言點贊最高的朋友,掃碼文末投行君微信,可以獲得投行圈子商務揹包一個
投行圈子已組建多個私域社群,根據會員職業及愛好,進入(投行業務交流、專業學習、股權投資、資管、業務推廣、上市公司高管、銀行、海外資產配置、單身脫單、摜蛋等等)相關社群。目前已超過6000位精英會員,歡迎加入。
 ↓點選關注投行精英,對話視窗回覆“乾貨”,獲得投行乾貨大禮包

商務合作、投稿、約稿以及金融同仁資源對接、入群請新增管理員投行-滌生微信。

我正在「投行圈子」和朋友們討論有趣的話題,你⼀起來吧?點選閱讀原文,加入投行圈子知識星球。

相關文章