
作者
|
薛良Neil
郵箱
|
看來開源的力量勢不可擋。
8月3日,通義千問70億引數通用模型和對話模型(簡稱Qwen-7B和Qwen-7B-Chat)出現在AI模型社群魔搭ModelScope上,兩款模型均開源、免費、可商用。
由此,阿里雲成為國內大廠中第一個開源大模型的企業。
Qwen-7B是支援中、英等多種語言的基座模型,Qwen-7B-Chat是基於基座模型的中英文對話模型,在許多測基準,比如MMLU、C-Eval 中,Qwen-7B在70億引數規模領域上都取得了良好的表現,阿里雲表示其部分能力甚至可以趕超一些120億引數大模型。
使用者目前已經可以從魔搭社群直接下載模型,也可透過阿里雲靈積平臺訪問和呼叫這些模型,而透過開原始碼,使用者可以很方便地在消費級顯示卡上部署和執行模型。阿里雲基於大模型的服務,包括訓練、推理、部署和精調都可以應用在上述兩個模型上。
這不是國內第一個免費、可商用的大模型。就在半個月前,智譜 AI 宣佈 ChatGLM-6B 和 ChatGLM2-6B 允許免費商業使用,百川智慧的Baichuan 13B模型在釋出的同時就開源允許免費商用。
但通義千問是成為了第一個科技大廠的開源大模型,它的開源將被視為國內“百模大戰”進入新階段的一個標誌——現在無論中美,也無論巨頭還是中小初創公司,有關大模型開源的看法正在趨近於一致。

在Meta宣佈開源LLaMA 2 的時候,Meta 首席科學家、圖靈獎獲得者 Yann LeCun就宣稱,大模型行業的競爭格局將會改變。這是因為閉源依靠大力出奇跡的方式證明了大模型路線的可效能和極限,而開源則會透過繁榮的生態,讓大模型變得真正可用、易用。
換而言之,大模型本身的神秘光環正在逐漸消褪。當技術不再難以逾越,繁榮的開源生態以及由此帶來的群策群力的技術迭代和突破就成為了新的護城河。在7月舉辦的世界人工智慧大會上,阿里雲將促進中國大模型生態的繁榮作為自己的首要目標。
為此,阿里雲打出了一套組合拳。
比如阿里雲的靈積模型服務平臺,它提供了一系列自動化的模型上雲工具鏈路,讓模型不僅能透過推理API被整合,也能透過訓練微調API實現模型定製化。另外,去年推出的AI模型社群魔搭,已經聚集了20多家頂尖人工智慧機構貢獻的1000多款開源模型。它們彼此的部署鏈路是打通的,也就是說來自社群的模型可以透過靈積實現服務化——這看上去就像是個起步階段的模型自由市場,它能夠實現,當然是開源的功勞。
而任何市場都需要充分的競爭,歸根結底,阿里雲想要透過降低門檻來讓開源大模型生態繁榮起來,就需要提供足夠豐富、足夠高質量的開源大模型參與其中。
通義千問的開源勢在必行。
由此,千帆競渡的百模大戰,現在已經進入到了真刀真槍貼身肉搏環節——模型究竟好不好,不是靠吹出來的,開源到社群裡,群眾自會檢驗。
歡迎來到自由的大模型開放世界。


