AI時代生存法則:你的職場護城河正在失效

本文整理自 InfoQ 策劃的 DeepSeek 系列直播第 10 期節目。在直播中,極客邦科技創始人 &CEO 霍太穩對話騰訊雲開發者 AI 產品首席架構師林強,解讀了 DeepSeek 成功背後的市場影響、技術優勢與創新,以及 AI 將改變什麼,我們又該如何為 AI 時代的到來做好準備。
林強認為,AI 始終會作為一種工具存在,主要服務於提高效率和便利性,原創性和創造性的東西仍然會來自人類。但 AI 的能力可能會導致人與人之間的分化,未來智力崗位會越來越多,整體社會的智力水平也會被抬高。  
下文為直播部分內容精選,完整直播回放 & 最新直播預約可關注“AI 前線影片號”檢視
以下為林強的分享實錄部分(經編輯):
DeepSeek 的市場影響
DeepSeek 在國內的熱度非常高,甚至街邊的大爺和樓下的保安都在找我幫忙安裝,但其實早在一年多前,ChatGPT 在美國就已經火到這種程度了。國內沒有達到這種熱度,主要是因為訪問受限,介面是英文的,以及國內模型在預訓練和超級對齊方面做得不夠好。超級對齊是讓模型像人一樣運用知識,而不是僅僅記住知識。以前的模型雖然知識儲備豐富,但不會運用,所以給人的感覺並不智慧。
DeepSeek 的的成功可以歸結為天時、地利、人和。技術方面,DeepSeek 確實非常出色,DeepSeek 一直堅持自己的技術理想,包括在國內很多人還沒搞懂 o1 的時候,科普了推理模型,並且效果炸裂。此外,很多大佬對 DeepSeek 的認可也起到了關鍵作用,他們不僅支援 DeepSeek 這家公司,更是看好整個領域的發展。
DeepSeek 在論文中提到的 500 萬美元訓練成本,雖然我們不確定是否準確,但它確實成為了傳播中的一個噱頭。如果在經濟低迷的時期,這種說法可能會受到很多理性聲音的反對,但在當前的中美關係背景下,它迅速傳播開來。從技術角度看,DeepSeek 極致地應用了強化學習,這在國內很少見。比如,國內的千問 2.5、騰訊開源的混元 MoE 等,大多采用預訓練加 SFT,很少強化學習。這種技術上的突破也為其傳播助力。傳播過程中,DeepSeek 的破圈效應非常關鍵。對於業內人來說,DeepSeek 只是國內在對齊技術上追趕美國的一個代表,但對普通使用者來說,它是一個從 0 到 1 的突破。對業內來說,很多人並不開發模型,但本地化部署讓很多人覺得可以自己嘗試。
為什麼是 CoT(Chain of Thought,思維鏈)引爆了這一波,而不是 Agent 呢? 儘管 OpenAI 和矽谷在 DeepSeek 火起來之前一直強調 Agent 的重要性,甚至說今年是應用年,但為什麼最終是 CoT 火了呢?我們可以從一個具體的例子來看,這個例子非常極端,是一個標準的 CoT 測試題:
在地面上方垂直於太陽光的入射方向,放置一半徑 R=0.10m、焦距 f=0.50m 的薄凸透鏡,在薄透鏡下方的焦面上放置一黑色薄圓盤 (圓盤中心與透鏡焦點重合),於是可以在黑色圓盤上形成太陽的像,已知黑色圓盤的半徑是太陽像的半徑的兩倍. 圓盤的導熱性極好, 圓盤與地面之間的距離較大, 設太陽向外輻射的能量遵從斯特藩一玻爾茲曼定律;在單位時間內在其單位表面積上向外輻射的能量為 W。T,式中 o 為斯特藩一玻爾茲曼常量,T 為輻射體表面的的絕對溫度,對太而言,取其溫度 t5.50X10’℃, 大氣對太陽能的吸收率為 a=0.40. 又設黑色圓盤對射到其上的太陽能全部吸收,同時圓盤也按斯特藻一玻爾茲曼定律向外輻射能量, 如果不考慮空氣的對流,也不考慮雜散光的影響,試問薄圓盤到達穩定狀態時可能達到的最高溫度為多少攝氏度?
對於普通人來說,這類題目包含很多概念和推導過程,解答起來非常痛苦。Agent 在處理這類問題時也面臨挑戰,因為如果沒有強大的推理能力,它很難完成複雜的推導。但 CoT 的出現改變了這一點。它透過思維鏈的方式,讓大模型能夠更好地組織知識並進行推理。
以前,大模型很難深入特定領域。領域專家的頭腦中已經固化了很多知識,可以直接運用而無需查閱資料。但大模型之前做不到這一點。CoT 的出現讓大模型能夠更好地組織和推理這些知識,從而在特定領域表現出色。此外,CoT 還與指令跟隨能力密切相關。以前,國內的大模型在執行任務時,比如為 200 行程式碼寫註釋,往往會在中途停止,無法完整完成任務。但 CoT 能力強的模型可以完整、認真地完成任務。這種能力對於實際應用非常重要,比如在開發中為程式碼寫註釋或進行邏輯抽象。
DeepSeek 的出現重新定義了 CoT,並在國內普及了這一概念。這種普及有兩層含義:一是 CoT 在國內出圈了,讓更多人瞭解和使用;二是國內的大模型也開始具備這種能力,比如騰訊在過年期間加班開發了 T1。這說明國內已經具備了與矽谷相媲美的技術能力,不再依賴 OpenAI 的壟斷。
DeepSeek 的技術優勢與創新
DeepSeek 目前只有 V3 和 R1 兩個正式的產品模型,但最早引起關注的卻是幾個蒸餾模型。這背後其實有一個“正本清源”的問題。現在,很多政府機構甚至要求公務員至少安裝 DeepSeek APP。這股熱度在政府內部興起後,很多公安局等機構也紛紛跟進,但很多時候無法全面部署,於是開始嘗試從 74B 蒸餾出的 13B 等模型。
技術特點與優勢
DeepSeek 的 V3 是一個預訓練模型,透過 80 萬條資料進行強化學習,最終得到了 R1 版本。這 80 萬條資料其實是非常少的。通常,我們自己做模型時,即使是 6B 或 7B 的模型,訓練資料量也至少是 80 萬的 100 倍甚至更多。但 DeepSeek 的 V3 只需要 80 萬條資料就能透過強化學習得到 R1,這才是它真正用心打磨的核心產品。這 80 萬條資料並不是簡單的資料量,而是經過精心篩選和最佳化的。DeepSeek 透過這種方式,證明了即使在資料量有限的情況下,也能讓模型具備強大的推理能力。“超級對齊”的能力一直是矽谷領先於國內的關鍵,甚至被視為一種技術壁壘。DeepSeek 只需要 80 萬條資料就能訓練出強大的模型,這讓矽谷和 OpenAI 都感到震驚。OpenAI 甚至專門發論文論證 DeepSeek 的方法是否真的有效,但最終結果表明,DeepSeek 確實透過 80 萬條資料訓練出了強大的模型。
開源也是 DeepSeek 火爆的核心原因之一。現在,你可以透過搜尋引擎找到很多關於 DeepSeek R1 的訓練過程和程式碼,甚至有人開始還原其訓練過程併發布相關資料集。
技術創新與模型架構
在 DeepSeek 的發展過程中,其訓練方式和推理能力的演變值得關注。最初,DeepSeek 透過少量的“冷啟動”資料進行預訓練,並嘗試進行 CoT 推理。然而,早期的推理非常簡短且效果有限。隨著時間的推移,模型的推理步數不斷增加,思維鏈的長度和深度也在逐步擴充套件。這種從簡短到長鏈的推理能力提升,類似於人類在思考複雜問題時的逐步深入。機器不會疲勞,可以持續最佳化推理能力,甚至在某些問題上超越人類的深度思考。DeepSeek 的這種能力不僅提升了模型的效能,還為使用者提供了學習思維方法的機會,幫助人們提升自身的思考能力。
從技術創新角度看,DeepSeek 的多項技術值得關注。例如,DeepSeek 是全球大力推廣 MoE(Mixture of Experts,多專家混合模型)技術的公司。儘管 Meta 等公司也在研究 MoE,但 DeepSeek 在這一領域的技術細節披露最多,對行業影響深遠。此外,DeepSeek 的多 Token 預測技術和 GRPO 技術也在強化學習領域具有重要意義。這些技術的發展不僅提升了模型效能,也為行業樹立了新的標杆。
未來展望與行業影響
2024 年是 AI 應用的元年,真正走向應用的核心在於商業化的邏輯。只有當 AI 應用的產出價值超過成本時,才能實現大規模的商業化落地。目前,大廠對 AI 的補貼使得開發者能夠以較低的成本接入 API,構建自己的應用。未來,隨著技術的成熟和成本的降低,AI 應用將更加普及,甚至可能像在手機、筆記型電腦上執行。開源的 DeepSeek 為小公司提供了自主開發類似產品的可能性,進一步推動了行業的創新和發展。
附錄
4 篇必看論文:
DeepSeek-R1: Incentivizing Reasoning Capability in LLMs viaReinforcementLearning(https://arxiv.org/abs/2501.12948)
DeepSeek-V3 Technical Report(https://arxiv.org/abs/2412.19437)
DeepSeek LLM: Scaling Open-Source Language Models with Longtermism(https://arxiv.org/abs/2401.02954)
DeepSeek-V2: A Strong, Economical, and Efficient Mixture-of-ExpertsLanguageModel(https://arxiv.org/abs/2405.04434)
以下是交流環節實錄,經編輯。
InfoQ:對騰訊來說,微信和元寶未來會如何做融合?
林強: 我認為未來的結合形態並不是簡單地在微信裡多一個入口,而是微信的許多功能細節會融入相應的能力。比如,當有人給你發了很長的語音訊息,你不想花時間逐條聽,未來微信可能會有一個功能,讓 AI 幫你總結對方到底說了什麼,用 10 個字或 20 個字說清楚,這就是一種融合。再比如,微信現在有很多功能入口,比如支付、設定等,藏得很深,你可能記不住怎麼進入。未來,你可以直接發一條訊息,讓 AI 幫你一鍵完成操作,比如備份聊天記錄。甚至在工作中,你需要給同事或老闆發總結,AI 也可以根據你的引導幫你完成。這些可能性都可能出現在微信中,未來的想象空間非常大。
目前,業界對微信作為超級 APP 的潛力感到興奮,因為它的所有環節都可以透過 AI 得到增強。所以,最終的形態不是產品的簡單融合,而是能力的融合。AI 應用將深入到騰訊的所有產品中,不僅僅是微信。比如,現在騰訊的一些遊戲已經接入了 DeepSeek,角色對話等功能已經可以體驗到,但目前這種接入還比較生硬。未來,隨著業態的發展,AI 會與產品融合得更加緊密。
InfoQ:未來 Scaling Law 是否還會繼續有效?
林強: 嚴格來說,像 GPT-5、GPT-6 這些未來的模型,我覺得比較懸。如果你用過國外的 Claude 和 GPT-o1,就會覺得現有的能力已經夠用了。現在核心命題是降低成本,應該進入應用階段了。 畢竟,直奔 AGI(通用人工智慧)並不是大家的終極目標。大家真正想要的是一種新業態和新的產品機會,這才是我們真正能立足的領域。從技術上講,我覺得 GPT-5 可能很難產。
InfoQ:未來大模型介面是否會成為新的超級入口?
林強: 答案是肯定的。早在前年,騰訊總辦就有一個大膽的預測,他們不知道未來的使用者互動介面會是什麼樣的,但一定不會是像微信這樣的傳統介面。現在,我們可以明確地說,未來的互動介面一定會帶有 AI 屬性。
InfoQ:雖然大模型現在很好用,很多企業也在用它來構建自己的知識庫或進行預訓練,但資訊安全確實是一個非常重要的問題。如何在使用大模型的同時,確保資料的相對安全呢?
林強: 我覺得這個問題可以從成本和開源的角度來看。之前提到 DeepSeek 開源的價值,開源意味著你可以擁有完全自主的智慧財產權,能夠自主掌控。隨著成本的下降,未來企業完全可以自主地使用這些技術,就像 Kubernetes 統治開源領域一樣,AI 的未來也一定是開源的。騰訊也會積極擁抱開源,透過開源實現完全自閉環,從而更好地保護智慧財產權。
但同時,企業還需要做好知識品控,防止別人暴力挖掘或透過技術手段提取你們的核心知識。我相信隨著 AI 產業鏈的發展,相關的安全工具也會逐漸完善。騰訊雲的安全部門已經在開發相應的工具,當安全真正成為核心問題時,這些工具會以很低廉的價格提供給大家。所以,大家可以放心暢想未來如何開發應用,安全問題會有相應的工具和產品來兜底,不用擔心。
InfoQ:您個人是如何將 AI 應用到日常工作中的?
林強: 現在 Google 和 AI 搜尋幾乎各佔我一半的時間。以前我主要用 Google 搜尋,然後憑藉自己的總結能力去篩選和過濾資訊。現在,AI 搜尋在很大程度上輔助了我的工作,其質量並不遜色於 Google。
在寫程式碼方面,AI 程式碼助手的體驗也在逐步提升。至少,你應該嘗試一下像 Cursor 這樣的工具,它真的會徹底改變你的開發方式。簡單拓展一下,以前“AI 程式設計師”聽起來還很遙遠,但目前可以實現的兩個功能確實能幫到你。
第一是程式碼補全。 我們平均一天的程式碼產出可能有 200 行,但如果有 AI 幫助補全,你寫了一行,它能接著寫出後面的幾行,這會極大地加速你的開發效率。我們在騰訊內部做過實驗,AI 補全能 讓程式設計師每天的編碼時間從 2 小時縮短到 20-30 分鐘,效率提升非常明顯。
第二是基於當前檔案的編輯。你可以要求 AI 對當前檔案進行修改,比如生成一個新版本,然後你可以選擇接受其中一部分修改。這種基於上下文的補全和編輯功能準確率很高,它將極大地改變開發者的工作方式。
再往後看,AI 程式設計師可能會根據你的命令建立一二十個檔案,並在這些檔案中進行各種調整和編輯。但目前這還不是很實用,因為如果你需要審查幾百行程式碼,可能會花費大量時間,甚至不得不放棄這些修改。不過,基於當前檔案上下文的控制和變數編輯,這種業態一定會改變程式設計師的未來工作方式,對你的開發效率提升會非常顯著。
InfoQ:DeepSeek 如何賦能測試相關的工作?
林強: 我們正在開展軟體測試工作,老闆常提到,如果 AI 程式碼助手能夠出色完成單元測試和 API 測試,我們是否就能在競爭激烈的市場中脫穎而出?過去,模型的能力還不足以支援這些複雜的測試任務。但隨著 DeepSeek 自研模型的推出,我們已經能夠達到與 Claude 相當的思維鏈水平。測試編寫通常包含明確的背景資訊和較長的推理邏輯,而被測程式碼本身的邏輯也較為複雜。如今,藉助鏈式推理(CoT)和指令加強技術,我們有望快速提升測試能力。
許多團隊此前一直難以有效推進單元測試。但如果 AI 能夠完成 80% 的單元測試工作,開發者只需進行少量編輯即可完善,那麼單元測試的推廣或許將變得更加容易。同樣,API 測試的覆蓋率一直難以在低成本下有效提升,但有了 AI 的助力,這一局面可能會得到改觀。我可以明確地告訴你,測試領域的生態將在一年內發生顯著變化。
InfoQ:客戶端工程師除了利用 AI 提升編碼效率外,該如何進一步提升自身價值?是否需要轉向 AI 開發呢?
林強: 只要你學好 Prompt Engineering(提示工程),就能做出各種花裡胡哨的 APP。未來,Apple 的 iOS 和安卓系統會越來越深入地在系統級接入 AI 應用,提供 AI 能力。
現在,爆款 APP 越來越少了,客戶端工程師的崗位需求可能會受到嚴重壓縮,大家更多地轉向做 H5,而不是專注於客戶端開發。相反,AI 領域的開發機會可能會越來越多。就像移動網際網路對網頁的替代一樣,AI 移動應用對傳統應用的替代將成為新的戰場。
但要抓住這個機會,你需要做好幾個關鍵點 :一是掌握 Prompt Engineering;二是解決大模型的延遲和端到端耗時問題,這需要你進行深入研究和了解。你不僅要熟悉各種 API,比如百度的 API、Claude 的 API,還要深入瞭解其中的技術細節,比如 Tokens per Second(每秒生成的 Token 數)和首次響應時間等概念。
除了技術和工程能力,業務理解也很重要。未來的應用開發,尤其是客戶端開發,需要真正結合行業業務,比如能源、光伏等產業。你可能現在對這些領域不瞭解,但有人正在做這些領域的工作,他們結合客戶端知識和大模型,就能創造出新的業態,這就是你的機會。如果你能在公司裡做好某個賽道,年薪可能達到 50 萬到 100 萬,雖然不算特別刺激,但也是一個很好的崗位。
InfoQ:對於學生來說,現在有了 AI 和 DeepSeek 之後,計算機專業的學生該如何學習,以及未來專業該如何發展呢?
林強: 我覺得大家其實根本不用焦慮,有了 AI 之後,它可以幫助程式設計師減少搬磚的時間,加速實現已知的程式碼編寫過程,從而讓程式設計師有更多時間去思考和發揮創造性。這對程式設計師來說是好事,但同時也對計算機專業的學生提出了更高的要求。
以前,計算機專業的學生剛進大學時,需要學習指標、棧等概念,這些內容一開始都很難理解,需要跨過一個門檻。而現在,合格的程式設計師不僅要跨過計算機體系架構理解的門檻,還要跨過工程能力的門檻,學會如何組織程式碼和專案來解決問題。如果你沒有這種工程能力,AI 雖然能幫你做事,但你得告訴它怎麼做。如果沒有這種能力,你很難成為未來的合格程式設計師。這就要求學生連跨兩個臺階,但其實不用焦慮。因為雖然臺階更高了,但路線卻更清晰了,未來的工作會更注重智力創造
InfoQ:AI 對醫生、律師等職業的影響有多大?是否會替代他們的工作?
林強:AI 是為醫生賦能的,而不是替代醫生。醫生的工作不僅僅是掌握書本上的知識,這些知識我們都可以透過查閱獲得。但真正的醫生是透過接觸大量病例,憑藉經驗在大腦中完成強化學習和總結,從而理解書本知識在真實患者身上的細微差別。因此,AI 只能賦能醫生,而不可能替代醫生,這是我個人的判斷。
對於律師行業,AI 確實帶來了很大的挑戰,但我們對律師行業的理解往往是抽象的,而非真實的行業全貌。實際上,律師對法律的熟悉和應用只佔其工作技能的 5%。律師的核心價值在於處理法院流程、與不同社會階層的人溝通,以及與高階人士建立信任關係。這些能力才是律師行業的核心價值所在。AI 的出現肯定會帶來行業工具的變革,但律師行業的本質是與人打交道,這種社會網路的建立是 AI 無法替代的。
InfoQ:未來人與 AI 將會是一個怎樣的關係?
林強: 我覺得我的技術背景不足以給出確切答案。就像 2000 年的人幻想 2025 年的手機會是什麼樣子一樣,我當年也很難想象出觸控螢幕手機會如何改變生活。所以,我只能基於我的理解來談談看法。
我認為 AI 始終會作為一種工具存在,主要服務於提高效率和便利性。原創性和創造性的東西仍然會來自人類。但 AI 的能力可能會導致人與人之間的分化。比如,就像美國副總統萬斯寫的《鄉村的悲歌》中描述的那樣,許多美國人滿足於一種簡單的生活方式:體面的工作、穩定的收入和安穩的生活。這種現象可能會加劇社會分化,就是智力形式的階級分化可能會變得更加嚴重。然而,這種分化也會對社會產生導向作用。
未來,智力崗位會越來越多,整體社會的智力水平也會被抬高。人們將更多地依賴智力勞動,智力能力也會得到加強。但這裡的關鍵在於 AI 的發展速度和人口替代的節奏。如果 AI 替代人類工作崗位的速度過快,可能會導致社會失調,因為前一代人可能還來不及適應智力創造的要求,他們仍然需要收入和體面的生活。但如果這個替代過程足夠長,比如延續一兩百年,每一代人都會逐漸適應更高的智力要求,那麼社會將更自然地迴歸創造力,人們也會更快樂。作為 38 歲的我,已經有一些固化的觀念。如果變革來得太快,比如明年工程師的工作都被取代了,我可能也很難跟上節奏。這其實是一個國家層面需要考慮的問題,但這種向前發展的趨勢是無法阻擋的。
今日好文推薦
“抄襲”程式碼,到底是 CTO 的鍋還是創始人的鍋?!這事兒已經撕3天了
分散式系統程式設計已停滯?!
Curl 之父:我是如何枕著18萬行C程式碼還能安穩入睡的
剛剛,DeepSeek 突然公佈成本利潤率高達545%!做 AI Infra 的該慌了?!

相關文章