全球通吃,阿里真的是低調不了一點

昨天刷手機找選題的時候看到了一條新聞,實實在在重新整理了我的認知,我覺得這篇內容有必要分享給大家,確實挺提氣的,這是日經中文網的報道:《阿里通義千問成日本 AI 開發基礎》。
不知道大家是怎麼看待日本的IT行業的,過年的時候,在知乎上刷到一篇帖子:
日本 IT 落後到什麼程度?在沒有看過知乎這篇帖子的時候,可能大部分人想不到竟然如此離譜:
打那之後,我才瞭解到日本IT行業的水平,所以看到日經新聞網的這篇新聞,就多留意了一下。
新聞裡提到,阿里千問現在在日經的AI模型評分榜排第6,前5都是閉源的。翻譯一下:阿里就是開源界的卷王,沒人打得過。
這個榜單可不是隨便哪家媒體編的,是日經數字治理與美國機器學習工具公司 Weights & Biases 合作推出的,對全球 100 多個主流 AI 模型進行了15項指標的全面評測。
特別值得一提的是,排名日本企業最高的模型 ABEJA-Qwen2.5-32B,就是基於阿里的 Qwen 開發的。
ABEJA 可不是小公司,日本數字平臺大廠。他們的技術部落格上毫不掩飾對千問的推崇,稱其在 50B 以下尺寸中擁有日語頂級效能。
X 上日本網友更是誇張,@docto_rin 直言:「千問 3 是開放式模型中最強的。」
另一位@masahirochaen則表示:「千問 3 的日語能力優異,足以媲美 GPT-4o 」
甚至有日本開發者專門給千問 3 做日語微調,這不是真愛是什麼?
其實在日本發生的事情,只是冰山一角,同樣的故事還在全球多個國家上演。
這裡插一句,當時阿里千問釋出時說支援 119 種語言的時候,說實話我對它支援那麼多語言其實是無感的,畢竟咱們只要中文用的爽就行了。
但這就是格局啊,地球上那麼多國家,有幾個有能力開發 AI 模型的,所以只能乖乖去用 ChatGPT,可這事你不能總指望著閉源模型吧。
咱們換個角度,如果咱們是個不知名的小國家,也想用 AI,又要顧及資料安全,咋辦?
所以這就是開源模型存在的意義,所以這就是阿里千問支援 119 種語言的格局啊,這裡不得不服,就這一點,就能讓多少外國使用者從此路轉粉。
就拿東南亞來說, 2024 年 12 月開源的 Sailor 2模型是專門面向東南亞地區的小語種大語言模型,20B 引數,就是在基於 Qwen 2.5 開發的。
這個模型覆蓋了緬甸語、菲律賓宿務語、伊羅戈語、印尼多印尼語和爪哇語、泰語、越南語等15種東南亞語言。
東南亞的Sailor 2模型,20B引數,覆蓋15種東南亞語言,不就是基於Qwen 2.5開發的嗎?
越南的 Arcee-VyLinh , 3 億引數小模型, 32K 上下文,NLP任務表現優異,不也是基於 Qwen2.5-3B 架構的嗎?
粵語有stvlynn/Qwen-7B-Chat-Cantonese,阿拉伯語區有HeshamHaroon/arabic_Qwen_chat_llamafile…
多少國家在吃千問的飯!
從 2023 年到現在,阿里通義團隊開源了 200 多個模型,從文字到視覺、語音、影片全都有,引數從 0.5B 到 235B 全覆蓋。
千問衍生模型已經突破 10 萬個,超越 Meta 的 Llama ,真·全球第一開源模型。下載量超 3 億次,在 HuggingFace 社群 2024 年全球下載量佔比超 30% ,穩坐第一把交椅。
更離譜的是, 2025 年 2 月 Huggingface 全球開源大模型榜單前十名,全是基於千問二次開發的。這是什麼概念?問就是開源界被千問承包了!
上週,阿里釋出了新一代 Qwen 3 系列模型,推出包括235B 旗艦版在內的 8 款不同引數規模的模型,全部採用寬鬆的 Apache 2.0 協議開源。
難怪國內外開發者蜂擁而至,下載、測試、部署…不到 3 小時,GitHub 狂攬 17k 星。
那麼為什麼全球都對通義千問翹首以盼呢?
這得從當下的 AI 格局說起。從 GPT-4到 Claude,從 Gemini 到 Anthropic,頂級模型幾乎都選擇了封閉商業化,而能用的開源模型又往往效能不足。
尤其最近 DeepSeek 爆火後,義大利直接以「伺服器設在中國,資料存在風險」為由下架了 APP,美國白宮顧問更是直言不諱地指責其「竊取美國智慧財產權」。
多眼熟的套路啊…
而千問 3 卻是完全不同的路線—— 不僅開源,而且允許任何人免費商用。
效能、部署成本雙最佳化,簡直是送給全球開發者的大禮包:
旗艦版 Qwen3-235B-A22B,總引數 235B ,啟用引數只需 22B 。啥意思? 4 張 H20 顯示卡就能跑,成本直接砍掉 DeepSeek R1 的 65%-75% 。效能還不打折,在榜單測試中全面超越 R1 ,開源界無敵。
還有,真正讓我舒服的是千問 3 的「混合推理」能力
啥是混合推理?簡單說就是同一個模型能同時做到「快思考」和「慢思考」。回答簡單問題時像人類一樣靠直覺秒回,遇到複雜問題時又能像科學家一樣分步推理、驗證再得出結論。
問題在於,你不能問個啥都讓AI 深度思考半天,問個一加一等於幾,也要等它內心戲琢磨半天,這小子為啥問我這麼簡單的問題,是不是玩我呢?其實完全就是想多了。
我覺得這才是AI 回答問題的正確節奏。
據說目前全球也就 Claude 3.7和 Gemini 2.5 Flash 能做到這一點。
而此次千問 3系列模型的開源,無疑是一場技術盛宴。從小到0.6B 適合手機終端,到中型8B/14B 適合企業應用,再到旗艦 235B 適合超大規模部署,幾乎覆蓋了所有應用場景。
而千問 3 的 Agent 能力也相當亮眼,在伯克利函式呼叫 BFCL 評測榜中創下新高,大大降低了智慧體開發的門檻。
說到這裡,不得不感嘆:拔劍吧,全球 AI 決鬥的時刻真的來了。
但跟 DeepSeek 引發的那場風波不同,通義千問以開源的方式進行技術輸出,反而贏得了更多國際認可。
當國內 AI 企業摩拳擦掌,各顯神通之際,通義千問憑藉紮實的技術、開放的生態和全球化視野,悄無聲息地完成了彎道超車。
據阿里的朋友說,春節後通義千問展廳參觀量激增,每月接到預約需求超過400場,是年前的四五倍。連阿里云云谷園區都成了杭州的熱門「景區」,連週末都在接待。
訪客還包括從海外政府部門到國際企業的各類機構, 90% 的客戶都在關注大模型及其應用。
我想到當年去參觀阿里園區,正是阿里上市後不久,那時候是電商巨頭,而現在又轉身成了AI開源卷王,要知道大象的轉身該有多難啊,得服氣。
結語
其實,我始終相信——
AI 的未來屬於開放而不是封閉,屬於合作而不是對抗。
當西方巨頭忙著築起技術壁壘時,阿里的通義千問選擇了擁抱全球開發者,這或許才是真正的技術自信。
看來,這場全球 AI 的角逐,中國不僅沒有掉隊,反而已經悄然領跑了。那些在阿里巴巴股價上用腳投票的資本市場,或許比任何人都更清楚這一點。


相關文章