報告聚焦 AI 大模型領域,對過去一年的技術演進動態、技術趨勢、以及開源開發者生態資料進行多方位的總結和梳理。
在第二章《TOP 101-2024 大模型觀點》中,AI 創業者、前華為計算機網路與協議實驗室助理科學家、首屆“天才少年”李博傑提出,大模型開始往專業(Professional)模型和個人(Personal)模型兩個方向分化。專業模型是通向 AGI 的必經之路。但 AGI 能否實現,最大的不確定性在於技術和資金。未來,個人模型將百花齊放,AI 公司很難單靠模型本身建立護城河,產品的重要性將高於模型能力。
全文如下:
AI 的三岔路口:專業模型和個人模型
文 / 李博傑
2024 年大模型真正開始落地,大多數科技工作者在工作中至少使用一款大模型提升效率,很多國民級應用和手機廠商也接入了大模型。大模型開始往專業(Professional)模型和個人(Personal)模型兩個方向分化。
專業模型是旨在提升生產力的模型,例如 AI 輔助程式設計、寫作、設計、諮詢、教育等。一旦模型能力達到門檻,專業模型將帶來很高的附加值。
2024 年,專業模型已經在很多領域落地。例如,AI 輔助程式設計可以提升開發效率一倍以上,僅用每月數十美元的 API 呼叫成本,就相當於每月上萬美元的工程師。AI 生成圖片、播客、直播等,可以上百倍提升畫師、配音員、主播的工作效率。AI 在心理、法律、醫療等領域的諮詢服務可達到初級專業人士水平,每小時收費相比模型成本也高上百倍。AI 虛擬外教已經可以媲美真人外教,由於發音標準,效果甚至超過大多數國內英語老師。
專業模型是通用大模型和垂直領域資料、工作流的結合。這裡通用大模型的基礎能力是關鍵,一個世界領先的通用大模型加上 RAG(搜尋增強生成)行業知識庫,做出的專業模型效果往往超過開源模型加上一些垂直領域資料微調得到的行業模型。因此,專業模型雖然訓練、推理成本都較高,但考慮到較高的溢價空間,投入是值得的。
由於通用大模型的通用性,難以建立差異化壁壘,也難以形成網路效應,因此基礎模型公司的競爭將非常激烈,算力將成為長期競爭力的關鍵。
對於大公司而言,能否集中算力、資料和人才,保持組織高效很關鍵。創業公司需要更多的資金支援,或者與雲計算平臺或晶片廠商深度合作,才能競爭專業模型的最高水平。一個例外是圖片、影片等基於擴散模型的生成模型,在創作需求簡單的情況下,未必需要通用語言模型這麼大,是一個差異化競爭的機會。
隨著專業模型程式設計能力的提升和 AI Agent 工作流進一步成熟,低程式碼程式設計將成為可能,很多人心中的想法將可以快速轉化成應用,應用創業的試錯成本已經大幅降低,未來甚至可能出現 Sam Altman 所說的“僅有一個人的 10 億美金公司”。
由於定製化開發、知識收集整理的成本降低,大量現實世界中的工作流和行業知識將轉化為行業應用和行業資料,傳統行業數字化轉型中的定製化開發難題有望解決。
對程式設計師而言,需求表達能力、溝通能力等軟技能和系統架構設計等硬核能力將越來越重要,因為 AI 就像今天的基層程式設計師,需要人表達清楚需求才能做好,複雜系統的架構設計和問題解決也還是要靠人。
專業模型是通向 AGI 的必經之路。Anthropic CEO 預測,未來 5 年專業模型將達到人類頂尖專家水平,將人類科研進展加速 10 倍,15 年後人類壽命有望達到 150 歲。但 AGI 能否實現,最大的不確定性在於技術和資金。
技術方面,一些頭部大模型公司已經發現 Transformer 能力“撞牆”,現有高質量語料基本都被用過了,進一步提升模型智力需要強化學習等新方法。資金方面,一些智庫預測,AGI 將需要上萬億美元的投資,晶片的能耗也將使人類的能源消耗增加一倍。如果 AGI 達成,將顯著改變國際競爭格局和人類生活方式。
相比更類似“阿波羅計劃”的專業模型,個人模型不需要那麼大訓練投入,也更容易變現。個人模型旨在幫助普通人提升生活質量,例如生活助手、旅行助手、電話助手等,把《Her》等科幻電影中的場景變為現實。
一般認為,同時具備 GPT-4o 多模態能力和 o1 推理能力的模型就可以滿足個人模型的需求,目前國內的頭部 AI 公司也已接近個人模型的技術目標。但目前端到端多模態模型和推理模型的成本仍然較高,且在一些場景下還不夠穩定。
但 2023 年以來,模型知識密度有每 8 個月提升一倍的“類摩爾定律”趨勢,加上硬體的摩爾定律和推理框架的最佳化,一到兩年後,個人模型的成本將達到可以讓使用者隨時使用的水平,就像網際網路應用一樣,透過廣告和少數訂閱即可盈利。類似 o1 的強推理能力模型也不一定需要很大,未來將成為個人模型的標配,經常算錯數的模型將被淘汰。
手機、PC 和空間計算裝置的端側個人模型將足夠滿足大多數日常需求,智慧汽車可能成為家庭計算中心。雲端模型將作為端側模型的補充,用於處理較複雜的任務和處理大量資料。模型的多模態能力將使 AR/VR 等空間計算裝置成為更自然的人機互動入口。推理能力將使得模型可以可靠處理複雜任務,真正節約使用者時間,甚至做到人力不能及的資訊採集和分析。多模態和推理能力也將使具身智慧真正具備通用的感知、規劃、控制能力。
頂級的專業模型公司有最高質量的資料,因此可以蒸餾出知識密度最高的個人模型。但由於個人模型的推理成本較低,知識密度稍低的模型未必沒有市場。由於訓練成本較低,未來個人模型將百花齊放,AI 公司很難單靠模型本身建立護城河,產品的重要性將高於模型能力。
面向個人生活和娛樂的 AI 產品關鍵是使用者互動,目前優秀的 AI 應用已經不簡單是生成文字。在 Claude Artifacts 之後,AI 生成程式碼,再執行程式碼,生成圖文並茂的回答,直觀的圖表,多模態帶講解的播客,甚至帶互動的小遊戲、小應用,已經成為 AI 應用的新正規化。
在個人模型成本尚未降低到可以隨意使用時,商業上成功的應用可能將有更高的“讀寫比”,也就是每次模型生成的內容可以被使用者多次使用,一種模式是內容社群,創作者利用 AI 生成內容,大量的使用者訪問這些內容;另一種模式是使用者的問題有很高比例是重複的,例如拍照搜題、生成調研報告等。
總體來說,目前 AI 應用尚處於“iPhone 1”時代,模型能力、應用生態、使用者習慣都在快速進化中。
所謂“AI 一天,人間一年”,即使是 AI 專家,也很難跟上所有最新的科研進展。大模型的時代才剛剛開始,預測未來的最好方式就是持續學習、探索、利用 AI 能力,創造未來。
李博傑
李博傑是 AI 創業者,研究方向為高效能資料中心繫統。曾任華為計算機網路與協議實驗室助理科學家、首屆“天才少年”。2019 年,在中國科學技術大學與微軟亞洲研究院的聯合培養專案中取得博士學位。在 SIGCOMM、SOSP、NSDI、PLDI 等頂級會議上發表多篇論文,曾獲 ACM 中國優秀博士學位論文獎和“微軟學者”獎學金。
閱讀完整報告:https://talk.gitee.com/report/china-open-source-2024-annual-report.pdf