2024年中國開源模型:崛起與變革

OSCHINA
↑點選藍字 關注我們
最近,開源中國 OSCHINA、Gitee 與 Gitee AI 聯合釋出了《2024 中國開源開發者報告》
報告聚焦 AI 大模型領域,對過去一年的技術演進動態、技術趨勢、以及開源開發者生態資料進行多方位的總結和梳理。
在第二章《TOP 101-2024 大模型觀點》中,Hugging Face 工程師 Tiezhen、Hugging Face 中文社群專案經理 Adina 以及 Hugging Face Fellow Lu Cheng,從崛起與變革兩個維度,探討中國開源模型在這一年取得的重大成就和未來展望。

全文如下:

2024 年中國開源模型:崛起與變革

文 / Tiezhen、Adina、Lu Cheng
2024 年,中國在開源人工智慧模型領域的崛起和變革成為全球矚目的焦點:從學術到產業,從技術到生態,中國透過自主研發和協同創新,逐步完成了從 “追隨者” 到 “引領者” 的轉變。
這種轉變不僅是技術實力的體現,更是中國人工智慧生態系統快速完善的真實寫照。以下,我們將從崛起與變革兩個維度,探討中國開源模型在這一年取得的重大成就和未來展望。

崛起

從 “追隨者” 到 “引領者”
2024 年,中國學術界和產業界大力推進自主研發,在技術創新和模型能力上實現了顯著飛躍,並在全球範圍內取得了顯著成就。Hugging Face Open LLM 排行榜資料顯示,從智譜的 GLM 系列、阿里巴巴的 Qwen 系列到深度求索的 DeepSeek 系列,這些自主研發的模型在國內外各項評測中表現卓越。

每個月來自中國主要研究機構和公司的開源模型 / 資料集數量。
圖片源自 Hugging Face 中文社群模型社群:

https://huggingface.co/spaces/zh-ai-community/zh-model-release-heatmap

其中,Qwen 系列憑藉靈活的多尺寸選項,強大的多語言支援以及友好的模型授權功能,贏得了社群開發者的高度評價。DeepSeek 透過引入多頭潛在注意力(Multi-head Latent Attention, MLA)技術,在效能和成本上實現了革命性突破,開創高性價比的 AI 新紀元。
智譜的 CogVideoX 系列文生影片模型,成為全球首批開源的文生影片模型之一,不僅在技術方面讓中國影片生成模型列入領先梯隊,強化了中國模型在全球範圍的競爭力,也為國際開源生態的發展產生了積極的影響,為全球開發者提供了更多創新和應用的可能。
中國開源模型從最初的質疑中崛起,逐步贏得了廣泛認可。這不僅彰顯了中國開源模型從追隨者到行業引領者的跨越式成長,也為全球人工智慧發展注入了新的活力與動力。中國開源模型的成功並非偶然。在政府對人工智慧產業的持續支援以及國內人工智慧行業對模型研發的鉅額投入下,從基礎演算法到行業應用、從算力基礎設施到資料資源整合,中國人工智慧生態體系正在迅速完善。這一趨勢表明,未來中國有可能在全球人工智慧領域佔據更為核心的地位。
開源生態的繁榮與協作
隨著開源模型影響力的提高,中國開源社群的活躍度也明顯提升。無論是企業、研究機構還是個體開發者都更加積極地參與到開源工作中。
以阿里巴巴的通義千問 Qwen 為例,據不完全統計,截止 2024 年 9 月,全球已有近 8 萬基於 Qwen 的衍生模型,超越了 Meta 的 Llama。該系列模型已被整合到 Hugging Face Transformers、Hugging Chat 和阿里自家的百鍊平臺中,極大促進了全球開發者的交流和協作,形成了國際化開源生態。
北京智源研究院和上海人工智慧實驗室等研究機構,透過與企業和高校合作及開源平臺的建設,建立了更完善的協作機制,從而在開源模型 (如 InternLM) 和資料集 (如 Infinity-MM) 領域貢獻了大量有影響力的基礎工作和資源。
2024 年,中國開源社群湧現出眾多高質量的自發研究成果。其中,MAP 團隊推出的全開源模型 Map Neo 引人矚目。該模型在訓練資料、指令碼以及模型對齊工作上實現了全面公開,成為國內少有的真正意義上完全開源的專案。
而 InstantX 團隊的 InstantID 則作為中國模型在國際開源社群的 2024 年首秀,一經發布便獲得了廣泛關注,為中國模型在全球開源生態中贏得了更多認可。
平衡發展與合規創新
中國在推動人工智慧技術發展的同時,也在監管層面努力建立了完善、透明的治理機制。這種監管創新為開源模型的發展提供了穩定的政策環境,同時確保技術應用符合社會價值導向。比如 《人工智慧示範法 2.0(專家建議稿)》對於免費且已開源方式提供人工智慧研發的個人和組織給予減輕或免承擔法律責任;《生成式人工智慧服務管理暫行辦法》 則明確了人工智慧技術的使用和合規要求,促進了開源模型在合規框架下良性發展。

變革

端上模型的興起與隱私保護
隨著小型模型的效能逐步增強,更多高階 AI 正轉向在個人裝置上執行。這一趨勢不僅顯著降低了雲端推理成本,還提升了使用者隱私控制。
中國 AI 社群在這一領域也做了重要貢獻,推出瞭如 Qwen2-1.5B、MiniCPM 系列和 DeepSeek Janus 等多款移動友好型模型。其中,最新發布的 GLM Edge 1.5B 模型透過與高通 GenAI 擴充套件的聯合最佳化,在搭載驍龍 8 Gen 4 處理器的手機上實現了每秒 65 個 tokens 的推理速度,接近人類語音的平均輸出速率。儘管存在電池續航和記憶體佔用過大等挑戰,端上模型代表了 AI 技術隱私保護和成本最佳化的未來方向。中國在這一領域的探索,為行業提供了寶貴經驗。
推理擴充套件法則的潛力釋放
透過推理擴充套件法則,模型效能可透過延長 “思考時間” 而進一步最佳化。這一技術模擬了人類 “深思熟慮” 的過程,顯著提升了模型在邏輯推理和複雜任務中的表現。
中國開源社群在邏輯推理領域推出了許多創新專案,包括阿里巴巴國際的 Macro-o1、通義千問團隊的 QwQ、上海人工智慧實驗室的 LLaMA-O1 和清華大學的 Llama-3.2V-11B-cot。這些模型不僅在技術上各具特色,還透過開源策略分享了大量研究細節,為整個開源社群提供了豐富的資源,在這一過程中,小模型不僅在推理能力上有了顯著提升,也推動了行業整體技術水平的進步。
結合當前人工智慧產業界的 “人工智慧 +” 計劃,小模型在特定任務最佳化上的優勢愈發突出,預計將在金融、醫療和工業自動化等熱門領域發揮引領作用,以更高效、更精準的方式滿足多樣化需求,幫助人工智慧在實際應用場景中落地。
開源多元化與應用細分
中國開源模型的發展不僅體現在技術突破上,還在生態建設中展現出巨大的活力。中國開源模型從競爭激烈的 “百模大戰” 逐步邁向多元化和深度細分,國內社群在今年釋出了大量高質量開源模型,尤其是多模態理解與生成模型:
多模態理解:Qwen2-VL、Ovis、InternVL2、DeepSeek JanusFlow、GOT-OCR2_0;
圖片生成:PixArt、Lumina、Kolors、Hunyuan-DiT、VAR、Meissonic;
影片生成:AnimateDiff-lightning、Latte、OpenSora、open-sora-plan、Pyramid Flow、CogVideoX;
TTS:GPT-SoVITS、ChatTTS、CosyVoice、FishAudio、MaskGCT、F5-TTS 。
這一趨勢表明,模型的競爭已經從單純的規模比拼轉向應用場景細化。為了更好地展現這一演進路徑,我們在 Hugging Face 的中文模型社群(https://huggingface.co/zh-ai-community)中對各個領域的開源模型進行了系統整理。

展望

2024 年,中國開源模型的發展展現了技術、生態和社會價值之間的深度協同。無論是從技術創新到社群建設,還是從行業實踐到合規探索,中國開源生態體系的完善正在為全球人工智慧發展注入源源不斷的動力。
在 Hugging Face,我們堅信開源是推動人工智慧技術進步和生態繁榮的核心力量。開源不僅能夠打破技術壁壘,促進全球開發者之間的協作與創新,還能推動技術的普惠化,讓更多的人能夠平等地享受人工智慧帶來的便利與機遇。
在未來,中國開源模型有望繼續為全人類的智慧化生活提供更豐富的解決方案與可能性。我們希望看到更多來自中國的開源 AI 團隊透過開放協作推動技術邊界的不斷拓展,共同構建一個更加包容、多元與可持續發展的人工智慧的未來。

作者簡介
Tiezhen
現任 Hugging Face 工程師,曾在 Google Brain 任職。兼具實幹精神與夢想追求,堅信開源是連線全球的紐帶,讓 AI 的益處普惠大眾。他秉持 "高手在民間" 的理念,渴望激勵更多的開源模型從業者成為行業的關鍵意見領袖,挖掘群體的智慧與潛能,促進社群的成長和影響力的擴大。
Adina
Hugging Face 中文社群專案經理。擁有 10 年以上國際化工作經驗,足跡遍及亞洲、非洲和歐洲。從社會科學研究員到科技公司專案專員,積累了豐富的跨領域與跨文化經驗。專注推動人工智慧在中文開源社群的應用與發展,為開發者和企業帶來更多價值,助力知識共享與技術協作。
Lu Cheng
Hugging Face Fellow,致力於推動 AI 和開源軟體的採納和開發者體驗。擁有超過十年的開發者關係、產品營銷和開源生態構建的經驗,曾在 Google 負責多個開發技術的深度推廣和社群建設,包括 Android、Flutter 和 TensorFlow 等。他堅信開源是推動技術進步和開發者成長的關鍵步驟,希望有更多人參與開源和社群共建。
閱讀完整報告https://talk.gitee.com/report/china-open-source-2024-annual-report.pdf

🔗《2024 中國開源開發者報告》正式釋出
分享在看點贊~Orz

相關文章