微信聊天框內建元寶，超級App又一輪進化開始

AI 技術正在從獨立功能向基礎設施轉變。

作者｜連冉

編輯｜鄭玄

微信終於在聊天框放了個 AI 助手。

雖然名稱上還是「元寶紅包封面助手」，但在介紹裡可以看到其是依託於騰訊混元大模型的 AI 服務，可以提供陪聊、答題、作圖以及定製紅包封面等功能。

微信作為國內最大的社交平臺，這次內建 AI 助手元寶或許意味著 AI 技術正在從獨立功能向基礎設施轉變，騰訊正在將微信的生態優勢轉化到 AI 領域。

這會是騰訊重回 AI 牌桌的絕殺開端嗎？

圖片來源：極客公園

實測，用 AI 更絲滑了

極客公園做了一番簡單實測。先是問了一下它和元寶 app 的異同有哪些：

圖片來源：極客公園

然後我丟入一篇極客公園昨天釋出的公眾號文章連結，內容是關於 DeepSeek 釋出 V3 模型更新，「元寶紅包封面助手」回覆說「收到，我問問元寶～」，這個回覆有點人性化的。

隨後它也沒問我是否需要開啟深度思考，就直接進行了 21 秒的深度思考：

元寶的深度思考過程｜圖片來源：極客公園

然後給出了我一份分析：

DeepSeek 公司於 2024 年 3 月 24 日釋出了 V3 模型的重要更新，該版本雖非預期的 V4 或 R2 迭代，但在效能表現和開源政策上實現了顯著突破。以下是本次更新的核心要點：

技術規格與釋出資訊

模型引數規模達 6850 億，屬於小版本升級（V3-0324）
基於全新 32K GPU 叢集進行後訓練最佳化
已透過官網、App 及小程式等多渠道開放使用
開源版本同步上線，延續初代 V3「557.6 萬美元成本比肩 Claude3.5」的高性價位元性

核心能力提升

程式設計能力跨越式突破

前端開發能力接近 Claude3.7 專家級水平，使用者測試顯示：

能生成包含 CSS 動畫與 JavaScript 互動的完整 HTML 檔案（如天氣卡片動態效果）
程式碼質量顯著優於舊版 R1 模型（對比案例顯示視覺效果與功能實現差距明顯）
在網站搭建測試中生成效果與 Claude3.7 Sonnet 相當

支援複雜指令解析（如透過函式/按鈕組實現多天氣動畫切換）

多模態理解增強

上下文理解能力提升，尤其在多輪對話場景
可精準處理跨語言混合程式設計需求（示例未展示但文中暗示）

開源生態建設

採用更寬鬆的開源協議，降低商業應用限制
延續初代 V3 作為首個衝入 Chatbot Arena 榜單前十開源模型的優勢
釋出 1 小時內即吸引全球開發者參與測試驗證

行業影響與使用者反饋

被專業使用者評價為「相當於 Claude Sonnet3.5 到 3.6 的升級幅度」
在無官方基準測試情況下，使用者實測資料成為主要驗證依據
開發者社群高度關注其開源協議調整帶來的商業化可能性

未來展望

官方未透露 V4/R2 研發進展，但使用者期待值持續升溫
當前版本已確立開源大模型領域新標杆，可能加劇行業競爭

該更新標誌著 DeepSeek 在保持成本優勢的同時，透過技術迭代縮小了與頂尖閉源模型的差距，特別是在程式設計領域展現出顛覆性潛力，其開源策略調整或將重塑大模型生態格局。

眼看清明節就要到了，我也問了問它「清明節做點什麼好」，對這個問題它倒是沒回復「收到，去問元寶」，也沒開啟深度思考模式，而是很快就輸出了答案：

清明節，作為中國傳統節日之一，不僅是緬懷先人、寄託哀思的時刻，也是親近自然、感受春天氣息的好機會。以下是一些清明節期間可以進行的活動建議：

祭掃祖先：前往祖墳或陵園，清掃墓地，獻上鮮花、紙錢等，表達對逝去親人的懷念和敬意。
踏青賞春：利用清明假期，與家人朋友一同外出踏青，欣賞春天的美景，呼吸新鮮空氣，放鬆心情。
植樹造林：參與植樹活動，為大地增添一抹新綠，既是對自然的回饋，也是對生命的禮讚。
品嚐清明食品：製作或購買清明節特有的食品，如青團、清明果等，體驗傳統節日的風味。
文化體驗：參觀博物館、文化遺址，瞭解清明節的歷史文化背景，增長知識。
家庭聚會：利用假期與家人團聚，共敘親情，享受家庭的溫馨。
靜思冥想：在寧靜的環境中，進行冥想或靜思，反思生活，規劃未來。
公益活動：參與社群或慈善機構組織的公益活動，幫助需要幫助的人，傳遞正能量。
戶外運動：進行徒步、騎行、野餐等戶外活動，鍛鍊身體，享受戶外的樂趣。
攝影創作：帶上相機，捕捉春天的美麗瞬間，進行攝影創作，記錄生活的美好。

無論選擇哪種方式，重要的是要用心感受節日的意義，珍惜與家人朋友相處的時光，同時也要注意安全和環保，讓清明節成為一個有意義且愉快的假期。

還有分析檔案的功能我也試了一下，之前如果看到比較複雜的檔案想讓 AI 先幫忙概括總結一下要點再去細讀的話，得先去開啟 AI 產品或者去相應的網頁，但現在可以直接在微信裡丟給這個助手，使用體驗更絲滑了一些。

這次「元寶紅包封面助手」也自行開啟了深度思考模式：

圖片來源：極客公園

在 21 秒的深度思考後，助手給出了出一份分析：

對文件內容的技術分析與行業洞察

一、語言模型技術演進

核心突破：

從 N-gram 到 Transformer 的正規化轉變，語言模型引數量級從百萬級（GPT-1）躍升至萬億級（GPT-4）
自監督學習（MLM/NSP）解決了海量資料標註難題，預訓練+微調模式成為行業標準
詞嵌入維度從 768（BERT）擴充套件到 12888（GPT-3），語義表徵能力呈指數級提升

關鍵技術指標：

訓練資料量：GPT-3 使用 45TB 資料（約 1 萬億詞），相當於 1351 萬本牛津詞典
算力成本：ChatGPT 訓練需 1 萬張 V100 GPU ，成本超 10 億人民幣
模型效率：DeepSeek 透過稀疏注意力等技術，將訓練成本降低至同規模模型的 1/3

二、Transformer 架構創新

技術革命性：

自注意力機制實現 O(n²) 的全域性關聯建模，相比 RNN 的序列依賴突破顯著
多頭注意力層數從 12 層（BERT）增至 96 層（GPT-3），上下文視窗從 512 擴充套件到 32K（Llama2）
位置編碼從絕對位置（Sinusoidal）發展到相對位置（RoPE），更好處理長序列

工程實踐突破：

混合精度訓練（FP16/FP32）節省 40% 視訊記憶體消耗
梯度檢查點技術（Gradient Checkpointing）實現百倍序列長度擴充套件
張量並行+流水線並行將千億引數模型訓練效率提升 80%

三、DeepSeek 的技術突破

開源生態貢獻：

模型架構：提出動態稀疏注意力機制，推理速度較 Llama 提升 2.3 倍
訓練效率：MoE 架構實現萬億引數模型在千卡叢集上的可行訓練
中文最佳化：構建包含 2.6 萬億 token 的中英雙語預訓練語料庫

效能指標對比：

數學推理：DeepSeek-Math-7B 在 GSM8K 達到 83.5% 準確率（GPT-4 為 92%）
程式碼生成：HumanEval 得分 68.9%（CodeLlama-34B 為53.7%）
多模態理解：ViT-22B 在 ImageNet-21K 上 top-1 準確率達 88.7%

四、行業發展趨勢

技術前沿方向：

多模態融合：GPT-4o 實現 200ms 級跨模態響應延遲（人類平均反應時間 250ms）
推理能力突破：DeepSeek-V3 在定理證明任務上達到 IMO 金牌選手水平
能源效率：新型混合架構（如DeepSeek-R1）實現每瓦特算力提升 5 倍

中美競爭格局：

開源模型差距從 12 個月縮短至 3 個月（Llama3 vs DeepSeek-v2）
算力基建：中國在建智算中心規劃算力達 2000EFLOPS（美國當前運營 1200EFLOPS）
行業應用滲透率：中國製造業 AI 質檢部署率達 37%，超越美國 29%

五、關鍵資料啟示

經濟學視角：

大模型訓練邊際成本曲線：引數規模每提升 10 倍，單位 token 訓練成本下降 28%
ROI 週期：頭部企業模型商業化回報週期從 36 個月縮短至 18 個月
人才密度：頂尖 AI 研究員中美薪資差距從 50% 收窄至 15%

技術倫理考量：

安全對齊：最新 RLHF 技術將有害輸出機率從 3.2% 降至 0.07%
能耗最佳化：液冷叢集 PUE 值從 1.5 最佳化至 1.08，碳排放減少 40%
可解釋性：因果歸因演算法實現 85% 的決策路徑視覺化

注：文中涉及企業及技術引數均來自公開資料，分析基於技術演進規律推導，具體實施需結合行業動態調整。建議關注浙江大學CCAI中心官網獲取最新研究成果。

看來關於是否開啟深度思考模式，「元寶紅包封面助手」有自己的判斷，如果任務很簡單，就不開啟，反之自動開啟。

加速 AI 佈局

過去一個月，騰訊在 AI 應用領域加速佈局。

2 月起，騰訊旗下多個核心產品，如微信、元寶、QQ 瀏覽器、QQ 音樂、ima（騰訊智慧工作臺）、騰訊文件、騰訊地圖等，均接入了 DeepSeek 模型，並同步支援自研的混元大模型；元寶走向日更級迭代，35 天版本更新 30 次；混元大模型推出騰訊首個自研推理模型混元深度思考模型 Thinker(T1)、釋出新一代快思考模型 TurboS、推出 5 個全新 3D 生成模型並全部開源……

業務線也作出整合，為了更好地發揮 AI 技術的協同效應，2 月，騰訊將 QQ 瀏覽器、搜狗輸入法、ima 等十餘款 AI 產品及團隊從 PCG（平臺與內容事業群）劃歸 CSIG（雲與智慧產業事業群），形成以「元寶」為核心的「C 端工具+B 端服務」矩陣。

在資金投入上，騰訊也展現了其在 AI 基礎設施建設上的決心。在 1 月的 2024 年度員工大會上，馬化騰提到騰訊會持續投入資源進行算力的儲備。據報道，騰訊計劃在 2025 年加大算力基礎設施的投資，投資金額或達 1000 億，其中計算約 580 億（GPU 約 400 億、伺服器約 110 億、儲存裝置約 55 億、網路裝置將近 58 億），IDC 部分，自建及相關費用加起來將近 131 億，租用部分將近要花 200 億。3 月 19 日，騰訊總裁劉熾平在財報後的電話會議上稱，資本支出佔收入的百分比將上升到十幾個百分點，人工智慧將成為戰略投資的重點。

微信這次將大模型產品「元寶」內嵌於聊天介面，看似是功能升級，實則是騰訊對 AI 時代的戰略卡位。

透過將大模型產品以「AI 版檔案傳輸助手」形態嵌入高頻聊天場景，微信將使用者的工作流、資訊流統一收束，透過總結公眾號文章、解析檔案、圖片等剛需功能，微信在原有的功能之外，新增了一個可以持續產生價值的 AI 助手角色，這可能會讓使用者在微信的停留時長和開啟頻次迎來結構性增長。

微信作為國內最大的社交平臺，這次內建 AI 助手元寶或許意味著中國網際網路正式進入「AI 原生應用」時代，AI 技術正在從獨立功能向基礎設施轉變。

而隨著開源日漸成為行業趨勢，單純的大模型技術能力越來越難以成為產品和市場競爭的絕對壁壘。當微信這樣的龐大生態，帶著海量使用者接入 AI 功能，對於所有的 AI 創業者來說可能都要思考：到底什麼樣的功能和創新，可以讓小公司與微信這樣的生態競爭使用者接觸 AI 的入口；到底什麼樣的壁壘，才能不被現有的超級產品生態，以接入新功能的方式吞噬。

DeepSeek 重塑了 AI 行業的格局，技術公司、大廠和 AI 原生創業者，都要重新思考自己的生態位。

*頭圖來源：視覺中國

本文為極客公園原創文章，轉載請聯絡極客君微信 geekparkGO

極客一問

你如何看待微信內建元寶？