昨夜3件事,加強中國AI科技敘事?

昨晚到今天,AI圈有3個重磅訊息,中國科技的敘事持續加強。

阿里通義開源RL新模型

阿里通義沒有食言,說這周再開源一個RL新模型,昨晚放出來了。最厲害的是32B效能比肩滿血DeepSeek R1,在測試數學能力的AIME24評測集上,以及評估程式碼能力的LiveCodeBench中,千問QwQ-32B表現與DeepSeek-R1相當,遠勝於o1-mini及相同尺寸的R1蒸餾模型,現在已經可以在通義APP和網頁端體驗了。
而且看起來,這個RL訓練並沒有花費太長時間,阿里的朋友反饋,與以往獎傳統勵模型不同的是,說這次是透過校驗生成答案的正確性來為數學問題提供反饋。
高效能大模型本地化部署門檻進一步降低,現在一個4090就可以了,極限一點大於24G記憶體(蘋果的架構記憶體GPU可以共享)的Mac mini就可以部署,國補下,4位數內搞定。
影響就是RL的潛力又被放大了,智慧硬體的能力的提升可能很快會到來?應用的需求又會爆發,又利好了Agent的發展。

Mac studio可以本地滿血DS-R1

蘋果釋出Mac studio 7w多的價格可以本地滿血DS-R1,預計20token/s;(R1滿血本地化門檻大幅降低,從70多萬到7w多)

Manus AI刷屏

Manus AI這個Monica團隊打造的Agent刷屏(雖然很明顯是軟文廣子),但市場對Agent能力有了更多認識和期待,應用端期待更高了。(算力、算力、算力);

這三條,又要改變一些市場對AI的敘事,但可以預見,RL的大規模強化學習的scaling law已經出現,以阿里為代表的中國科技公司將會迎來持續的重估。
⭐星標華爾街見聞,好內容不錯過

本文不構成個人投資建議,不代表平臺觀點,市場有風險,投資需謹慎,請獨立判斷和決策。
覺得好看,請點“在看”


相關文章