
本文整理自 InfoQ 策劃的 DeepSeek 系列直播第 10 期節目。在直播中,極客邦科技創始人 &CEO 霍太穩對話騰訊雲開發者 AI 產品首席架構師林強,解讀了 DeepSeek 成功背後的市場影響、技術優勢與創新,以及 AI 將改變什麼,我們又該如何為 AI 時代的到來做好準備。
林強認為,AI 始終會作為一種工具存在,主要服務於提高效率和便利性,原創性和創造性的東西仍然會來自人類。但 AI 的能力可能會導致人與人之間的分化,未來智力崗位會越來越多,整體社會的智力水平也會被抬高。
下文為直播部分內容精選,完整直播回放 & 最新直播預約可關注“AI 前線影片號”檢視
以下為林強的分享實錄部分(經編輯):
DeepSeek 在國內的熱度非常高,甚至街邊的大爺和樓下的保安都在找我幫忙安裝,但其實早在一年多前,ChatGPT 在美國就已經火到這種程度了。國內沒有達到這種熱度,主要是因為訪問受限,介面是英文的,以及國內模型在預訓練和超級對齊方面做得不夠好。超級對齊是讓模型像人一樣運用知識,而不是僅僅記住知識。以前的模型雖然知識儲備豐富,但不會運用,所以給人的感覺並不智慧。
DeepSeek 的的成功可以歸結為天時、地利、人和。技術方面,DeepSeek 確實非常出色,DeepSeek 一直堅持自己的技術理想,包括在國內很多人還沒搞懂 o1 的時候,科普了推理模型,並且效果炸裂。此外,很多大佬對 DeepSeek 的認可也起到了關鍵作用,他們不僅支援 DeepSeek 這家公司,更是看好整個領域的發展。
DeepSeek 在論文中提到的 500 萬美元訓練成本,雖然我們不確定是否準確,但它確實成為了傳播中的一個噱頭。如果在經濟低迷的時期,這種說法可能會受到很多理性聲音的反對,但在當前的中美關係背景下,它迅速傳播開來。從技術角度看,DeepSeek 極致地應用了強化學習,這在國內很少見。比如,國內的千問 2.5、騰訊開源的混元 MoE 等,大多采用預訓練加 SFT,很少強化學習。這種技術上的突破也為其傳播助力。傳播過程中,DeepSeek 的破圈效應非常關鍵。對於業內人來說,DeepSeek 只是國內在對齊技術上追趕美國的一個代表,但對普通使用者來說,它是一個從 0 到 1 的突破。對業內來說,很多人並不開發模型,但本地化部署讓很多人覺得可以自己嘗試。
為什麼是 CoT(Chain of Thought,思維鏈)引爆了這一波,而不是 Agent 呢? 儘管 OpenAI 和矽谷在 DeepSeek 火起來之前一直強調 Agent 的重要性,甚至說今年是應用年,但為什麼最終是 CoT 火了呢?我們可以從一個具體的例子來看,這個例子非常極端,是一個標準的 CoT 測試題:
在地面上方垂直於太陽光的入射方向,放置一半徑 R=0.10m、焦距 f=0.50m 的薄凸透鏡,在薄透鏡下方的焦面上放置一黑色薄圓盤 (圓盤中心與透鏡焦點重合),於是可以在黑色圓盤上形成太陽的像,已知黑色圓盤的半徑是太陽像的半徑的兩倍. 圓盤的導熱性極好, 圓盤與地面之間的距離較大, 設太陽向外輻射的能量遵從斯特藩一玻爾茲曼定律;在單位時間內在其單位表面積上向外輻射的能量為 W。T,式中 o 為斯特藩一玻爾茲曼常量,T 為輻射體表面的的絕對溫度,對太而言,取其溫度 t5.50X10’℃, 大氣對太陽能的吸收率為 a=0.40. 又設黑色圓盤對射到其上的太陽能全部吸收,同時圓盤也按斯特藻一玻爾茲曼定律向外輻射能量, 如果不考慮空氣的對流,也不考慮雜散光的影響,試問薄圓盤到達穩定狀態時可能達到的最高溫度為多少攝氏度?
對於普通人來說,這類題目包含很多概念和推導過程,解答起來非常痛苦。Agent 在處理這類問題時也面臨挑戰,因為如果沒有強大的推理能力,它很難完成複雜的推導。但 CoT 的出現改變了這一點。它透過思維鏈的方式,讓大模型能夠更好地組織知識並進行推理。
以前,大模型很難深入特定領域。領域專家的頭腦中已經固化了很多知識,可以直接運用而無需查閱資料。但大模型之前做不到這一點。CoT 的出現讓大模型能夠更好地組織和推理這些知識,從而在特定領域表現出色。此外,CoT 還與指令跟隨能力密切相關。以前,國內的大模型在執行任務時,比如為 200 行程式碼寫註釋,往往會在中途停止,無法完整完成任務。但 CoT 能力強的模型可以完整、認真地完成任務。這種能力對於實際應用非常重要,比如在開發中為程式碼寫註釋或進行邏輯抽象。
DeepSeek 的出現重新定義了 CoT,並在國內普及了這一概念。這種普及有兩層含義:一是 CoT 在國內出圈了,讓更多人瞭解和使用;二是國內的大模型也開始具備這種能力,比如騰訊在過年期間加班開發了 T1。這說明國內已經具備了與矽谷相媲美的技術能力,不再依賴 OpenAI 的壟斷。
DeepSeek 目前只有 V3 和 R1 兩個正式的產品模型,但最早引起關注的卻是幾個蒸餾模型。這背後其實有一個“正本清源”的問題。現在,很多政府機構甚至要求公務員至少安裝 DeepSeek APP。這股熱度在政府內部興起後,很多公安局等機構也紛紛跟進,但很多時候無法全面部署,於是開始嘗試從 74B 蒸餾出的 13B 等模型。
DeepSeek 的 V3 是一個預訓練模型,透過 80 萬條資料進行強化學習,最終得到了 R1 版本。這 80 萬條資料其實是非常少的。通常,我們自己做模型時,即使是 6B 或 7B 的模型,訓練資料量也至少是 80 萬的 100 倍甚至更多。但 DeepSeek 的 V3 只需要 80 萬條資料就能透過強化學習得到 R1,這才是它真正用心打磨的核心產品。這 80 萬條資料並不是簡單的資料量,而是經過精心篩選和最佳化的。DeepSeek 透過這種方式,證明了即使在資料量有限的情況下,也能讓模型具備強大的推理能力。“超級對齊”的能力一直是矽谷領先於國內的關鍵,甚至被視為一種技術壁壘。DeepSeek 只需要 80 萬條資料就能訓練出強大的模型,這讓矽谷和 OpenAI 都感到震驚。OpenAI 甚至專門發論文論證 DeepSeek 的方法是否真的有效,但最終結果表明,DeepSeek 確實透過 80 萬條資料訓練出了強大的模型。
開源也是 DeepSeek 火爆的核心原因之一。現在,你可以透過搜尋引擎找到很多關於 DeepSeek R1 的訓練過程和程式碼,甚至有人開始還原其訓練過程併發布相關資料集。
在 DeepSeek 的發展過程中,其訓練方式和推理能力的演變值得關注。最初,DeepSeek 透過少量的“冷啟動”資料進行預訓練,並嘗試進行 CoT 推理。然而,早期的推理非常簡短且效果有限。隨著時間的推移,模型的推理步數不斷增加,思維鏈的長度和深度也在逐步擴充套件。這種從簡短到長鏈的推理能力提升,類似於人類在思考複雜問題時的逐步深入。機器不會疲勞,可以持續最佳化推理能力,甚至在某些問題上超越人類的深度思考。DeepSeek 的這種能力不僅提升了模型的效能,還為使用者提供了學習思維方法的機會,幫助人們提升自身的思考能力。

從技術創新角度看,DeepSeek 的多項技術值得關注。例如,DeepSeek 是全球大力推廣 MoE(Mixture of Experts,多專家混合模型)技術的公司。儘管 Meta 等公司也在研究 MoE,但 DeepSeek 在這一領域的技術細節披露最多,對行業影響深遠。此外,DeepSeek 的多 Token 預測技術和 GRPO 技術也在強化學習領域具有重要意義。這些技術的發展不僅提升了模型效能,也為行業樹立了新的標杆。
2024 年是 AI 應用的元年,真正走向應用的核心在於商業化的邏輯。只有當 AI 應用的產出價值超過成本時,才能實現大規模的商業化落地。目前,大廠對 AI 的補貼使得開發者能夠以較低的成本接入 API,構建自己的應用。未來,隨著技術的成熟和成本的降低,AI 應用將更加普及,甚至可能像在手機、筆記型電腦上執行。開源的 DeepSeek 為小公司提供了自主開發類似產品的可能性,進一步推動了行業的創新和發展。

4 篇必看論文:
DeepSeek-R1: Incentivizing Reasoning Capability in LLMs viaReinforcementLearning(https://arxiv.org/abs/2501.12948)
DeepSeek-V3 Technical Report(https://arxiv.org/abs/2412.19437)
DeepSeek LLM: Scaling Open-Source Language Models with Longtermism(https://arxiv.org/abs/2401.02954)
DeepSeek-V2: A Strong, Economical, and Efficient Mixture-of-ExpertsLanguageModel(https://arxiv.org/abs/2405.04434)
以下是交流環節實錄,經編輯。
林強: 我認為未來的結合形態並不是簡單地在微信裡多一個入口,而是微信的許多功能細節會融入相應的能力。比如,當有人給你發了很長的語音訊息,你不想花時間逐條聽,未來微信可能會有一個功能,讓 AI 幫你總結對方到底說了什麼,用 10 個字或 20 個字說清楚,這就是一種融合。再比如,微信現在有很多功能入口,比如支付、設定等,藏得很深,你可能記不住怎麼進入。未來,你可以直接發一條訊息,讓 AI 幫你一鍵完成操作,比如備份聊天記錄。甚至在工作中,你需要給同事或老闆發總結,AI 也可以根據你的引導幫你完成。這些可能性都可能出現在微信中,未來的想象空間非常大。
目前,業界對微信作為超級 APP 的潛力感到興奮,因為它的所有環節都可以透過 AI 得到增強。所以,最終的形態不是產品的簡單融合,而是能力的融合。AI 應用將深入到騰訊的所有產品中,不僅僅是微信。比如,現在騰訊的一些遊戲已經接入了 DeepSeek,角色對話等功能已經可以體驗到,但目前這種接入還比較生硬。未來,隨著業態的發展,AI 會與產品融合得更加緊密。
林強: 嚴格來說,像 GPT-5、GPT-6 這些未來的模型,我覺得比較懸。如果你用過國外的 Claude 和 GPT-o1,就會覺得現有的能力已經夠用了。現在核心命題是降低成本,應該進入應用階段了。 畢竟,直奔 AGI(通用人工智慧)並不是大家的終極目標。大家真正想要的是一種新業態和新的產品機會,這才是我們真正能立足的領域。從技術上講,我覺得 GPT-5 可能很難產。
林強: 答案是肯定的。早在前年,騰訊總辦就有一個大膽的預測,他們不知道未來的使用者互動介面會是什麼樣的,但一定不會是像微信這樣的傳統介面。現在,我們可以明確地說,未來的互動介面一定會帶有 AI 屬性。
林強: 我覺得這個問題可以從成本和開源的角度來看。之前提到 DeepSeek 開源的價值,開源意味著你可以擁有完全自主的智慧財產權,能夠自主掌控。隨著成本的下降,未來企業完全可以自主地使用這些技術,就像 Kubernetes 統治開源領域一樣,AI 的未來也一定是開源的。騰訊也會積極擁抱開源,透過開源實現完全自閉環,從而更好地保護智慧財產權。
但同時,企業還需要做好知識品控,防止別人暴力挖掘或透過技術手段提取你們的核心知識。我相信隨著 AI 產業鏈的發展,相關的安全工具也會逐漸完善。騰訊雲的安全部門已經在開發相應的工具,當安全真正成為核心問題時,這些工具會以很低廉的價格提供給大家。所以,大家可以放心暢想未來如何開發應用,安全問題會有相應的工具和產品來兜底,不用擔心。
林強: 現在 Google 和 AI 搜尋幾乎各佔我一半的時間。以前我主要用 Google 搜尋,然後憑藉自己的總結能力去篩選和過濾資訊。現在,AI 搜尋在很大程度上輔助了我的工作,其質量並不遜色於 Google。
在寫程式碼方面,AI 程式碼助手的體驗也在逐步提升。至少,你應該嘗試一下像 Cursor 這樣的工具,它真的會徹底改變你的開發方式。簡單拓展一下,以前“AI 程式設計師”聽起來還很遙遠,但目前可以實現的兩個功能確實能幫到你。
第一是程式碼補全。 我們平均一天的程式碼產出可能有 200 行,但如果有 AI 幫助補全,你寫了一行,它能接著寫出後面的幾行,這會極大地加速你的開發效率。我們在騰訊內部做過實驗,AI 補全能 讓程式設計師每天的編碼時間從 2 小時縮短到 20-30 分鐘,效率提升非常明顯。
第二是基於當前檔案的編輯。你可以要求 AI 對當前檔案進行修改,比如生成一個新版本,然後你可以選擇接受其中一部分修改。這種基於上下文的補全和編輯功能準確率很高,它將極大地改變開發者的工作方式。
再往後看,AI 程式設計師可能會根據你的命令建立一二十個檔案,並在這些檔案中進行各種調整和編輯。但目前這還不是很實用,因為如果你需要審查幾百行程式碼,可能會花費大量時間,甚至不得不放棄這些修改。不過,基於當前檔案上下文的控制和變數編輯,這種業態一定會改變程式設計師的未來工作方式,對你的開發效率提升會非常顯著。
林強: 我們正在開展軟體測試工作,老闆常提到,如果 AI 程式碼助手能夠出色完成單元測試和 API 測試,我們是否就能在競爭激烈的市場中脫穎而出?過去,模型的能力還不足以支援這些複雜的測試任務。但隨著 DeepSeek 自研模型的推出,我們已經能夠達到與 Claude 相當的思維鏈水平。測試編寫通常包含明確的背景資訊和較長的推理邏輯,而被測程式碼本身的邏輯也較為複雜。如今,藉助鏈式推理(CoT)和指令加強技術,我們有望快速提升測試能力。
許多團隊此前一直難以有效推進單元測試。但如果 AI 能夠完成 80% 的單元測試工作,開發者只需進行少量編輯即可完善,那麼單元測試的推廣或許將變得更加容易。同樣,API 測試的覆蓋率一直難以在低成本下有效提升,但有了 AI 的助力,這一局面可能會得到改觀。我可以明確地告訴你,測試領域的生態將在一年內發生顯著變化。
林強: 只要你學好 Prompt Engineering(提示工程),就能做出各種花裡胡哨的 APP。未來,Apple 的 iOS 和安卓系統會越來越深入地在系統級接入 AI 應用,提供 AI 能力。
現在,爆款 APP 越來越少了,客戶端工程師的崗位需求可能會受到嚴重壓縮,大家更多地轉向做 H5,而不是專注於客戶端開發。相反,AI 領域的開發機會可能會越來越多。就像移動網際網路對網頁的替代一樣,AI 移動應用對傳統應用的替代將成為新的戰場。
但要抓住這個機會,你需要做好幾個關鍵點 :一是掌握 Prompt Engineering;二是解決大模型的延遲和端到端耗時問題,這需要你進行深入研究和了解。你不僅要熟悉各種 API,比如百度的 API、Claude 的 API,還要深入瞭解其中的技術細節,比如 Tokens per Second(每秒生成的 Token 數)和首次響應時間等概念。
除了技術和工程能力,業務理解也很重要。未來的應用開發,尤其是客戶端開發,需要真正結合行業業務,比如能源、光伏等產業。你可能現在對這些領域不瞭解,但有人正在做這些領域的工作,他們結合客戶端知識和大模型,就能創造出新的業態,這就是你的機會。如果你能在公司裡做好某個賽道,年薪可能達到 50 萬到 100 萬,雖然不算特別刺激,但也是一個很好的崗位。
林強: 我覺得大家其實根本不用焦慮,有了 AI 之後,它可以幫助程式設計師減少搬磚的時間,加速實現已知的程式碼編寫過程,從而讓程式設計師有更多時間去思考和發揮創造性。這對程式設計師來說是好事,但同時也對計算機專業的學生提出了更高的要求。
以前,計算機專業的學生剛進大學時,需要學習指標、棧等概念,這些內容一開始都很難理解,需要跨過一個門檻。而現在,合格的程式設計師不僅要跨過計算機體系架構理解的門檻,還要跨過工程能力的門檻,學會如何組織程式碼和專案來解決問題。如果你沒有這種工程能力,AI 雖然能幫你做事,但你得告訴它怎麼做。如果沒有這種能力,你很難成為未來的合格程式設計師。這就要求學生連跨兩個臺階,但其實不用焦慮。因為雖然臺階更高了,但路線卻更清晰了,未來的工作會更注重智力創造。
林強:AI 是為醫生賦能的,而不是替代醫生。醫生的工作不僅僅是掌握書本上的知識,這些知識我們都可以透過查閱獲得。但真正的醫生是透過接觸大量病例,憑藉經驗在大腦中完成強化學習和總結,從而理解書本知識在真實患者身上的細微差別。因此,AI 只能賦能醫生,而不可能替代醫生,這是我個人的判斷。
對於律師行業,AI 確實帶來了很大的挑戰,但我們對律師行業的理解往往是抽象的,而非真實的行業全貌。實際上,律師對法律的熟悉和應用只佔其工作技能的 5%。律師的核心價值在於處理法院流程、與不同社會階層的人溝通,以及與高階人士建立信任關係。這些能力才是律師行業的核心價值所在。AI 的出現肯定會帶來行業工具的變革,但律師行業的本質是與人打交道,這種社會網路的建立是 AI 無法替代的。
林強: 我覺得我的技術背景不足以給出確切答案。就像 2000 年的人幻想 2025 年的手機會是什麼樣子一樣,我當年也很難想象出觸控螢幕手機會如何改變生活。所以,我只能基於我的理解來談談看法。
我認為 AI 始終會作為一種工具存在,主要服務於提高效率和便利性。原創性和創造性的東西仍然會來自人類。但 AI 的能力可能會導致人與人之間的分化。比如,就像美國副總統萬斯寫的《鄉村的悲歌》中描述的那樣,許多美國人滿足於一種簡單的生活方式:體面的工作、穩定的收入和安穩的生活。這種現象可能會加劇社會分化,就是智力形式的階級分化可能會變得更加嚴重。然而,這種分化也會對社會產生導向作用。
未來,智力崗位會越來越多,整體社會的智力水平也會被抬高。人們將更多地依賴智力勞動,智力能力也會得到加強。但這裡的關鍵在於 AI 的發展速度和人口替代的節奏。如果 AI 替代人類工作崗位的速度過快,可能會導致社會失調,因為前一代人可能還來不及適應智力創造的要求,他們仍然需要收入和體面的生活。但如果這個替代過程足夠長,比如延續一兩百年,每一代人都會逐漸適應更高的智力要求,那麼社會將更自然地迴歸創造力,人們也會更快樂。作為 38 歲的我,已經有一些固化的觀念。如果變革來得太快,比如明年工程師的工作都被取代了,我可能也很難跟上節奏。這其實是一個國家層面需要考慮的問題,但這種向前發展的趨勢是無法阻擋的。
