
作者|連冉
微信終於在聊天框放了個 AI 助手。
雖然名稱上還是「元寶紅包封面助手」,但在介紹裡可以看到其是依託於騰訊混元大模型的 AI 服務,可以提供陪聊、答題、作圖以及定製紅包封面等功能。
微信作為國內最大的社交平臺,這次內建 AI 助手元寶或許意味著 AI 技術正在從獨立功能向基礎設施轉變,騰訊正在將微信的生態優勢轉化到 AI 領域。
這會是騰訊重回 AI 牌桌的絕殺開端嗎?

圖片來源:極客公園
01
實測,用 AI 更絲滑了
極客公園做了一番簡單實測。先是問了一下它和元寶 app 的異同有哪些:

圖片來源:極客公園
然後我丟入一篇極客公園昨天釋出的公眾號文章連結,內容是關於 DeepSeek 釋出 V3 模型更新,「元寶紅包封面助手」回覆說「收到,我問問元寶~」,這個回覆有點人性化的。
隨後它也沒問我是否需要開啟深度思考,就直接進行了 21 秒的深度思考:

元寶的深度思考過程|圖片來源:極客公園
然後給出了我一份分析:
DeepSeek 公司於 2024 年 3 月 24 日釋出了 V3 模型的重要更新,該版本雖非預期的 V4 或 R2 迭代,但在效能表現和開源政策上實現了顯著突破。以下是本次更新的核心要點:
-
技術規格與釋出資訊
-
模型引數規模達 6850 億,屬於小版本升級(V3-0324)
-
基於全新 32K GPU 叢集進行後訓練最佳化
-
已透過官網、App 及小程式等多渠道開放使用
-
開源版本同步上線,延續初代 V3「557.6 萬美元成本比肩 Claude3.5」的高性價位元性
-
核心能力提升
-
前端開發能力接近 Claude3.7 專家級水平,使用者測試顯示:
-
能生成包含 CSS 動畫與 JavaScript 互動的完整 HTML 檔案(如天氣卡片動態效果)
-
程式碼質量顯著優於舊版 R1 模型(對比案例顯示視覺效果與功能實現差距明顯)
-
在網站搭建測試中生成效果與 Claude3.7 Sonnet 相當
-
支援複雜指令解析(如透過函式/按鈕組實現多天氣動畫切換)
-
上下文理解能力提升,尤其在多輪對話場景
-
可精準處理跨語言混合程式設計需求(示例未展示但文中暗示)
-
開源生態建設
-
採用更寬鬆的開源協議,降低商業應用限制
-
延續初代 V3 作為首個衝入 Chatbot Arena 榜單前十開源模型的優勢
-
釋出 1 小時內即吸引全球開發者參與測試驗證
-
行業影響與使用者反饋
-
被專業使用者評價為「相當於 Claude Sonnet3.5 到 3.6 的升級幅度」
-
在無官方基準測試情況下,使用者實測資料成為主要驗證依據
-
開發者社群高度關注其開源協議調整帶來的商業化可能性
-
未來展望
-
官方未透露 V4/R2 研發進展,但使用者期待值持續升溫
-
當前版本已確立開源大模型領域新標杆,可能加劇行業競爭
程式設計能力跨越式突破
多模態理解增強
該更新標誌著 DeepSeek 在保持成本優勢的同時,透過技術迭代縮小了與頂尖閉源模型的差距,特別是在程式設計領域展現出顛覆性潛力,其開源策略調整或將重塑大模型生態格局。
眼看清明節就要到了,我也問了問它「清明節做點什麼好」,對這個問題它倒是沒回復「收到,去問元寶」,也沒開啟深度思考模式,而是很快就輸出了答案:
清明節,作為中國傳統節日之一,不僅是緬懷先人、寄託哀思的時刻,也是親近自然、感受春天氣息的好機會。以下是一些清明節期間可以進行的活動建議:
-
祭掃祖先:前往祖墳或陵園,清掃墓地,獻上鮮花、紙錢等,表達對逝去親人的懷念和敬意。
-
踏青賞春:利用清明假期,與家人朋友一同外出踏青,欣賞春天的美景,呼吸新鮮空氣,放鬆心情。
-
植樹造林:參與植樹活動,為大地增添一抹新綠,既是對自然的回饋,也是對生命的禮讚。
-
品嚐清明食品:製作或購買清明節特有的食品,如青團、清明果等,體驗傳統節日的風味。
-
文化體驗:參觀博物館、文化遺址,瞭解清明節的歷史文化背景,增長知識。
-
家庭聚會:利用假期與家人團聚,共敘親情,享受家庭的溫馨。
-
靜思冥想:在寧靜的環境中,進行冥想或靜思,反思生活,規劃未來。
-
公益活動:參與社群或慈善機構組織的公益活動,幫助需要幫助的人,傳遞正能量。
-
戶外運動:進行徒步、騎行、野餐等戶外活動,鍛鍊身體,享受戶外的樂趣。
-
攝影創作:帶上相機,捕捉春天的美麗瞬間,進行攝影創作,記錄生活的美好。
無論選擇哪種方式,重要的是要用心感受節日的意義,珍惜與家人朋友相處的時光,同時也要注意安全和環保,讓清明節成為一個有意義且愉快的假期。
還有分析檔案的功能我也試了一下,之前如果看到比較複雜的檔案想讓 AI 先幫忙概括總結一下要點再去細讀的話,得先去開啟 AI 產品或者去相應的網頁,但現在可以直接在微信裡丟給這個助手,使用體驗更絲滑了一些。
這次「元寶紅包封面助手」也自行開啟了深度思考模式:

圖片來源:極客公園
在 21 秒的深度思考後,助手給出了出一份分析:
對文件內容的技術分析與行業洞察
一、語言模型技術演進
核心突破:
-
從 N-gram 到 Transformer 的正規化轉變,語言模型引數量級從百萬級(GPT-1)躍升至萬億級(GPT-4)
-
自監督學習(MLM/NSP)解決了海量資料標註難題,預訓練+微調模式成為行業標準
-
詞嵌入維度從 768(BERT)擴充套件到 12888(GPT-3),語義表徵能力呈指數級提升
關鍵技術指標:
-
訓練資料量:GPT-3 使用 45TB 資料(約 1 萬億詞),相當於 1351 萬本牛津詞典
-
算力成本:ChatGPT 訓練需 1 萬張 V100 GPU ,成本超 10 億人民幣
-
模型效率:DeepSeek 透過稀疏注意力等技術,將訓練成本降低至同規模模型的 1/3
二、Transformer 架構創新
技術革命性:
-
自注意力機制實現 O(n²) 的全域性關聯建模,相比 RNN 的序列依賴突破顯著
-
多頭注意力層數從 12 層(BERT)增至 96 層(GPT-3),上下文視窗從 512 擴充套件到 32K(Llama2)
-
位置編碼從絕對位置(Sinusoidal)發展到相對位置(RoPE),更好處理長序列
工程實踐突破:
-
混合精度訓練(FP16/FP32)節省 40% 視訊記憶體消耗
-
梯度檢查點技術(Gradient Checkpointing)實現百倍序列長度擴充套件
-
張量並行+流水線並行將千億引數模型訓練效率提升 80%
三、DeepSeek 的技術突破
開源生態貢獻:
-
模型架構:提出動態稀疏注意力機制,推理速度較 Llama 提升 2.3 倍
-
訓練效率:MoE 架構實現萬億引數模型在千卡叢集上的可行訓練
-
中文最佳化:構建包含 2.6 萬億 token 的中英雙語預訓練語料庫
效能指標對比:
-
數學推理:DeepSeek-Math-7B 在 GSM8K 達到 83.5% 準確率(GPT-4 為 92%)
-
程式碼生成:HumanEval 得分 68.9%(CodeLlama-34B 為53.7%)
-
多模態理解:ViT-22B 在 ImageNet-21K 上 top-1 準確率達 88.7%
四、行業發展趨勢
技術前沿方向:
-
多模態融合:GPT-4o 實現 200ms 級跨模態響應延遲(人類平均反應時間 250ms)
-
推理能力突破:DeepSeek-V3 在定理證明任務上達到 IMO 金牌選手水平
-
能源效率:新型混合架構(如DeepSeek-R1)實現每瓦特算力提升 5 倍
中美競爭格局:
-
開源模型差距從 12 個月縮短至 3 個月(Llama3 vs DeepSeek-v2)
-
算力基建:中國在建智算中心規劃算力達 2000EFLOPS(美國當前運營 1200EFLOPS)
-
行業應用滲透率:中國製造業 AI 質檢部署率達 37%,超越美國 29%
五、關鍵資料啟示
經濟學視角:
-
大模型訓練邊際成本曲線:引數規模每提升 10 倍,單位 token 訓練成本下降 28%
-
ROI 週期:頭部企業模型商業化回報週期從 36 個月縮短至 18 個月
-
人才密度:頂尖 AI 研究員中美薪資差距從 50% 收窄至 15%
技術倫理考量:
-
安全對齊:最新 RLHF 技術將有害輸出機率從 3.2% 降至 0.07%
-
能耗最佳化:液冷叢集 PUE 值從 1.5 最佳化至 1.08,碳排放減少 40%
-
可解釋性:因果歸因演算法實現 85% 的決策路徑視覺化
注:文中涉及企業及技術引數均來自公開資料,分析基於技術演進規律推導,具體實施需結合行業動態調整。建議關注浙江大學CCAI中心官網獲取最新研究成果。
看來關於是否開啟深度思考模式,「元寶紅包封面助手」有自己的判斷,如果任務很簡單,就不開啟,反之自動開啟。
02
加速 AI 佈局
過去一個月,騰訊在 AI 應用領域加速佈局。
2 月起,騰訊旗下多個核心產品,如微信、元寶、QQ 瀏覽器、QQ 音樂、ima(騰訊智慧工作臺)、騰訊文件、騰訊地圖等,均接入了 DeepSeek 模型,並同步支援自研的混元大模型;元寶走向日更級迭代,35 天版本更新 30 次;混元大模型推出騰訊首個自研推理模型混元深度思考模型 Thinker(T1)、釋出新一代快思考模型 TurboS、推出 5 個全新 3D 生成模型並全部開源……
業務線也作出整合,為了更好地發揮 AI 技術的協同效應,2 月,騰訊將 QQ 瀏覽器、搜狗輸入法、ima 等十餘款 AI 產品及團隊從 PCG(平臺與內容事業群)劃歸 CSIG(雲與智慧產業事業群),形成以「元寶」為核心的「C 端工具+B 端服務」矩陣。
在資金投入上,騰訊也展現了其在 AI 基礎設施建設上的決心。在 1 月的 2024 年度員工大會上,馬化騰提到騰訊會持續投入資源進行算力的儲備。據報道,騰訊計劃在 2025 年加大算力基礎設施的投資,投資金額或達 1000 億,其中計算約 580 億(GPU 約 400 億、伺服器約 110 億、儲存裝置約 55 億、網路裝置將近 58 億),IDC 部分,自建及相關費用加起來將近 131 億,租用部分將近要花 200 億。3 月 19 日,騰訊總裁劉熾平在財報後的電話會議上稱,資本支出佔收入的百分比將上升到十幾個百分點,人工智慧將成為戰略投資的重點。
微信這次將大模型產品「元寶」內嵌於聊天介面,看似是功能升級,實則是騰訊對 AI 時代的戰略卡位。
透過將大模型產品以「AI 版檔案傳輸助手」形態嵌入高頻聊天場景,微信將使用者的工作流、資訊流統一收束,透過總結公眾號文章、解析檔案、圖片等剛需功能,微信在原有的功能之外,新增了一個可以持續產生價值的 AI 助手角色,這可能會讓使用者在微信的停留時長和開啟頻次迎來結構性增長。
微信作為國內最大的社交平臺,這次內建 AI 助手元寶或許意味著中國網際網路正式進入「AI 原生應用」時代,AI 技術正在從獨立功能向基礎設施轉變。
而隨著開源日漸成為行業趨勢,單純的大模型技術能力越來越難以成為產品和市場競爭的絕對壁壘。當微信這樣的龐大生態,帶著海量使用者接入 AI 功能,對於所有的 AI 創業者來說可能都要思考:到底什麼樣的功能和創新,可以讓小公司與微信這樣的生態競爭使用者接觸 AI 的入口;到底什麼樣的壁壘,才能不被現有的超級產品生態,以接入新功能的方式吞噬。
DeepSeek 重塑了 AI 行業的格局,技術公司、大廠和 AI 原生創業者,都要重新思考自己的生態位。