報告聚焦 AI 大模型領域,對過去一年的技術演進動態、技術趨勢、以及開源開發者生態資料進行多方位的總結和梳理。
在第二章《TOP 101-2024大模型觀點》中,資深開發者社群運營專家顧鈞直言,開源策略是大模型最好的競爭策略,並分享了諸多思考。
全文如下:
開源模型未必更先進,但會更長久
“開源”是指採用符合 OSI 官方認可的軟體許可證進行軟體釋出的行為。目前大模型的“開源”與傳統的開源定義並不相同。
我所說的開源策略是指以開源釋出軟體為起點,使用者/開發者運營為途徑的軟體產品推廣策略。
-
大模型是一項相對較新的技術。儘管 OpenAI 早在 2019 年就釋出了第一個重要的模型 GPT-2,但大模型的廣受關注實際始於 2022 年 11 月釋出的 ChatGPT。8 個月以後 Meta 就與微軟合作釋出了開源大模型 LLaMA-2。這個賽道的主要玩家在技術和商業化上有差距,但沒有到翻盤無望的程度。
-
大模型賽道不但包括模型的訓練,也包括模型服務。訓練是軟體的製作成本,而服務是軟體的長期執行成本。
-
大模型賽道的市場化程度非常高。演算法、算力、資料、人才,這些構建大模型的基礎要素並不為權力機構壟斷,大多要從市場上獲得。
-
大模型作為一項令人激動的技術,商業化場景覆蓋了對企業 (2B) 與對個人 (2C) 兩個大方向。
-
大模型賽道在海外是 “一超多強”,在國內則是 “多頭並舉”,兩種典型的競爭格局都全了。
以上,大模型賽道的元素非常豐富,各種商業化方法的排列組合都不缺,為我們的分析與推演提供了可貴的素材。對軟體商業化問題感興趣的朋友一定要長期關注這個賽道。只有這樣的物件才能更有力地說明開源策略的重要性。
其次,我們得明確一點 —— 大模型競爭的賽點是什麼?常用的判斷依據包括:技術的先進性,C 端使用者基數,依賴這個軟體的生態系統大小等等。其中哪個更關鍵一點?
技術先進是好事,但大模型領域的先進技術遠沒有達到能為大模型企業帶來可觀收入的程度。整個大模型賽道還處在商業化的摸索階段。這個時間點上的“技術先進性”更多是用於公關宣傳的素材。考慮到資料獲取、加工的成本,模型訓練的成本,這是一種相當昂貴的宣傳方式。
C 端使用者指那些把大模型當成智慧個人助理來使用的普通個人使用者。OpenAI 在 ChatGPT 上一個重要且成功的操作就是把大模型從學術界、工業界直接推向了普通個體,讓 C 端使用者切實感受到了大模型的可能性與魅力。這一點被國內的大模型廠商廣泛學習。在 B 站刷影片,國內知名的那幾個大模型廠商的廣告,你一個也不會落下。
受到大家的認可與喜愛固然重要,但對於 C 端使用者,有兩個需要時刻牢記的問題:一是 C 端使用者是沒有忠誠度的,誰免費就用誰,誰給補貼就用誰;二是某一個大模型對 C 端使用者比較難產生獨特的粘性。
第一個問題的例證太多了,百團大戰、滴滴快的、社群團購、pdd。大模型廠商維繫 C 端流量的成本可能是個無底洞。
第二個問題則涉及兩個方面,一是大模型賽道本身的極度內卷,技術上拉不開差距;二是普通使用者的使用隨意性很強,準確性要求也不高,最終各家大模型的基礎能力都足以應付。
一個大模型的生態系統的大小,也就是指有多少開發者在基於這個大模型構建應用。我認為這是一個更靠譜的評價指標,是某個大模型最終能勝出的關鍵所在。
構建開發者生態通常有兩種做法,一種是提供 API 雲服務,對註冊開發者進行一定的雲資源補貼;另一種是“開源”的方法,提供大模型免費下載,免費商用(一定條件下)。
兩種方法各有支持者。閉源大模型一般會採用第一種方法,其中的代表有 OpenAI、Anthropic 等(為避免麻煩,國內廠商的名字就不提了)。能用第二種方法的,必然是某種程度上的“開源”模型,以 Meta 的 Llama 2、Llama 3 模型為首。
前段時間李彥宏在 Create 2024 百度 AI 開發者大會上放言“開源模型會越來越落後”。前文我有提到,此時此刻的技術先進性並不重要。甚至在計算機發展史上,很多領域中笑到最後的產品,並不是技術上最先進的。拋開成本和易用性,空談技術先進性是最常見的錯誤。
那麼具體到大模型領域,閉源與開源,兩種方法孰優孰劣?我的回答是採取什麼方法因人而異,但開源會更有優勢。
大模型賽道的核心制約條件是成本太高 —— 訓練成本高,執行成本高。如何儘可能降低成本,比對手堅持得更久一些是確保長期成功的必要條件。現在的宏觀環境下,一味靠融資來支撐自己的高成本支出不是長久之計。
閉源大模型廠商必須維持一定的雲資源,工程師資源來支撐小額的開發者除錯需求。投入產出上恐怕是算不過來的。即便閉源廠商願意持續地補貼開發者,他們最終會發現大模型對開發者的粘性也非常有限,沒比在 C 端使用者那邊好到哪裡去。
大模型這一產品形態實在是太特殊了 —— 大多以自然語言為互動方式。因此大模型 API 雲服務的介面是非常簡單的,高度一致的。在這種情況下,如果開發者構建的大模型應用只是呼叫大模型的 API,那麼大模型應用與某個具體的大模型之間很難形成強繫結。也就是說,面對各種大模型雲服務,主動權在開發者這裡。
與之相對,開源的方法至少可以相當程度地省去為了拓展開發者生態而付出的大模型執行成本。開發者免費下載大模型以後,會在自己的計算機資源上進行大模型應用的開發和除錯。大模型廠商提供一些技術支援即可。同時因為大模型執行在本地,開發者在構建大模型應用時,為了物理部署上的便利,很可能會在應用與模型之間創造出物理部署上的耦合性。
當然這種“開源策略” 不是進攻的方法,而是“先為不可勝,以待敵之可勝”。目標是以最小的代價,儘可能多地消耗閉源對手的資源與心氣。
最後一個思考題:如果大家都是開源大模型要怎麼做呢?
顧鈞
資深開發者社群運營專家,目前擔任杭州映雲科技 (EMQ) 市場 & 開發者社群總監一職。2004 年,顧鈞從北京大學計算機系本科畢業,其後在工商銀行、IBM、摩根士丹利、華為和 Zilliz 等多家知名企業工作。曾聯合發起全球首個開源向量資料庫專案 Milvus,並幫助 Milvus 社群在兩年間迅速拓展到兩千家企業使用者。
閱讀完整報告:https://talk.gitee.com/report/china-open-source-2024-annual-report.pdf