別再捧殺DeepSeek!它不該被神化

 防走失,電梯直達安全島報人劉亞東A 


來源:HR日智
作者:梓 陳

引子:我們總是對從 0 到 1 的創新滿懷期待,渴望見證石破天驚的突破。但客觀來講,邁出第一步和邁出第一萬步,在本質上並沒有區別,每一步都同樣重要。

新年伊始,本該沉浸在休息放鬆的愜意時光裡,可面對讀者們熱情滿滿的催更,實在讓我難以招架,尤其是關於 DeepSeek 的討論呼聲,熱度簡直居高不下。本以為只有科技圈對它格外關注,結果在一個搞笑博主的評論區裡,都能看到網友焦急地發問:“你怎麼還不講 DeepSeek?它血洗美國股市,把美國人的幻想都幹碎了,那些歐美科技公司都坐不住啦!” 這關注度,著實超乎想象!
這股 “DeepSeek 熱” 不僅沒有降溫,反而愈演愈烈。各種誇張的言論甚囂塵上:
  • “科技巨頭全報廢了”
  • “AGI 馬上實現”
  • “普通人再不學 DeepSeek 就晚了”
彷彿一夜之間,DeepSeek 成了改寫科技史的超級英雄。更離譜的是,還有人編造出 DeepSeek 遭受境外大規模網路攻擊,中國紅客高手隱跡江湖出手相救的熱血爽文劇情,這想象力,不去寫小說都可惜了。
輿論的走向愈發失控,我們似乎只要一談到 DeepSeek,就會陷入一種盲目狂熱的情緒之中。不可否認,DeepSeek 自身實力確實出色,加上這幾年 AI 行業本就火爆,這些因素都為它的熱度添了一把柴。但其中地緣因素的推動作用也不容忽視,很多人內心深處渴望聽到一個 “歪果仁怕了、服了” 的科技故事,DeepSeek 的出現,就像是一場及時雨,滿足了大家這種心理需求。
媒體和公眾人物也紛紛下場,為這種情緒推波助瀾,把對 DeepSeek 的討論上升到哲學、國運、歷史走向的高度。這些討論在流量的放大鏡下,被不斷放大、斷章取義,讓一款 AI 模型揹負了遠超它本身的地位、責任和期待,硬生生地被推上了神壇。
可神壇之上,真的是一片坦途嗎?回顧過往,我們不難發現,被捧得越高,往往摔得就越慘,“傷仲永”“泡沫破裂” 的輿論反噬屢見不鮮。對於剛剛嶄露頭角的 DeepSeek 和它的研發團隊來說,這種過度追捧帶來的負面影響,很可能遠遠超過正面意義。
所以,是時候冷靜下來,拆掉這座輿論堆砌的神壇,還 DeepSeek 一個真實、樸素的面貌,基於客觀的共識,重新審視它。

一、它並非從 0 到 1 的開創性突破

先丟擲一個可能會讓不少人驚訝的觀點:與社交媒體上那些誇張的說法不同,DeepSeek 其實並沒有實現從 0 到 1 的核心技術突破。
DeepSeek 爆火之後,研發團隊和科技產業的相關人士都在強調中國 AI 不能只是亦步亦趨,必須要完成從 0 到 1 的蛻變。這個觀點無疑是正確的,可就目前的情況來看,DeepSeek 還難以成為這個觀點的有力例證。
所謂的核心技術突破,要麼是主要技術路徑發生根本性變化,要麼是達成的效果有質的飛躍。DeepSeek 目前最引人注目的技術能力,一個是 R1 模型帶火的思維鏈推理過程,另一個是其聯網檢索的 RAG 效果表現出色。
但這兩條技術路線都不是 DeepSeek 的首創。思維鏈的興起,一般認為是 OpenAI 釋出的 o1 模型引發的。去年 9 月 o1 模型公佈後,全球主流大模型紛紛跟進,推出了類似的思維鏈、推理大模型等能力,雖然各家的名稱可能不太一樣,但整體技術路線高度一致。DeepSeek 確實把思維鏈的過程展示得更加完整、詳細,可仔細觀察就會發現,其中大模型幻覺的問題依然十分嚴重。
在聯網檢索方面,其他廠商也早就開始佈局,也就是所謂的 RAG 檢索-增強-生成機制。這項技術最初是為了解決大模型缺乏即時資訊的問題,同時幫助矯正大模型幻覺。早在 2023 年,百度釋出文心一言時,RAG 就已經是其核心能力的重要組成部分。
不過,沒有從 0 到 1 的創新,並不代表沒有創新。DeepSeek 在模型能力的最佳化上付出了諸多努力,做了大量開拓性工作,比如透過 GRPO 演算法讓模型執行更加高效。可以說,DeepSeek 集成了業界主流且經過驗證的技術路線,並在此基礎上實現了模型最佳化、能力提升和使用者體驗升級。
我們總是對從 0 到 1 的創新滿懷期待,渴望見證石破天驚的突破。但客觀來講,邁出第一步和邁出第一萬步,在本質上並沒有區別,每一步都同樣重要。
二、真正的價值在於降低 AI 算力成本
那麼,DeepSeek 究竟憑什麼能引發全球關注呢?在經過一個春節的瘋狂發酵後,很多人可能都快忘記了它最初出圈的原因 —— 透過軟體和架構創新,以極低的算力成本完成了 DeepSeek – V3 模型的訓練。
DeepSeek – V3 是我們現在使用的 R1 模型的基礎模型。從研發團隊發表的論文中可以瞭解到,他們僅僅花費了 550 萬美元的算力訓練成本,就完成了 6710 億引數大模型的訓練。即便這個統計只涵蓋了基礎模型訓練的算力成本,不包括後續應用模型的強化學習、模型推理,以及人才成本、綜合成本等專案,但這已經足以顛覆大模型訓練的主流成本模型。
最終,DeepSeek 實現的效果基本達到了以 o1 為代表的主流大模型水平。雖然在模型效果上很難說全面超越了其他模型,但它確實憑藉軟體演算法的革新,實現了硬體成本的大幅下降,讓低成本模型的效果不遜色於高成本模型,也讓開源模型的效果逐漸追趕閉源模型。
而 DeepSeek “降低 AI 算力成本” 的這一突破,恰好發生在全球主流 AI 玩家瘋狂囤積高階 GPU,以此構築產業護城河,以及美國對中國禁售高階 AI 晶片,企圖打壓中國 AI 發展的關鍵節點上。這就使得 DeepSeek 被賦予了實現 AI 民主化,甚至助力打破地緣科技壟斷的特殊意義,於是就有了中國 AI 大模型讓美國股市遭遇震盪的戲劇性一幕。
DeepSeek 實現的訓練效率提升與訓練成本下降,在特殊的產業環境和國際環境下引發了連鎖反應。但問題是,很多平時不太關注 AI 的朋友,可能根本不知道 AI 大模型算力越大效果越好的 Scaling Laws,也不瞭解算力壟斷和禁售的背景資訊,只知道短影片裡說 DeepSeek 橫空出世,把外國人都嚇得不輕。這種缺乏前因後果的片面認知,給 DeepSeek 憑空塑造了一座不屬於它的神壇。
推而廣之,我們很多人都熱衷於追捧那些天才式、戲劇化的創新。但在現實世界裡,往往只有透過不斷地工程化實踐,持續調優、降本、提效,技術創新才有可能得到廣泛應用和普及。就像我們都知道愛迪生髮明瞭電燈,卻容易忽略大規模電網建設對降低電力成本的巨大作用。要是每家都得自己發電,那世界恐怕真的會陷入一片黑暗。
“我們把成本打下來了。” 這句看似荒誕、俗套,甚至帶點反諷意味的話,恰恰是中國產業化能力的真實寫照。我們不妨大大方方地承認,包括 DeepSeek 在內的中國 AI,在未來很長一段時間裡,最擅長的就是把成本狠狠降下來。

三、成功背後,人文能力至關重要

DeepSeek 爆火之後,很多人都將其歸功於技術的巨大勝利,甚至有人預言 AI 的崛起會讓人文學科和人文工作失去價值,“DeepSeek 來了,學文科還有意義嗎?” 這樣的話題還登上了熱搜。
但只要我們多使用 DeepSeek,仔細分析它與其他模型的差異,就會發現一個截然不同的觀點:DeepSeek 恰恰證明了文科與人文能力,在 AI 時代有著不可替代的重要性。
隨機詢問一些人對 DeepSeek 的使用體驗,他們大多會說跟 DeepSeek 對話感覺更有人情味。但這種人味,並非源於理解、推理等 AI 技術層面,而是模型在對話過程中展現出了豐富的幽默感、網感,以及更符合年輕群體的對話習慣。此外,DeepSeek 還具有相對精妙的修辭能力、優美的文筆和不錯的綜合人文素養。
這些能力,讓 DeepSeek 更契合年輕使用者的對話習慣和審美需求,能夠給出更具話題度和傳播度的回答。可關鍵在於,這些能力與技術的關聯不大,更多地與訓練語料的選取等人文能力密切相關。
比如,讓 DeepSeek 寫首詩,它能寫出文藝青年喜愛的語調與修辭;而其他主流國內大模型,雖然也能寫得平仄工整、辭藻華麗,卻總給人一種打油詩般的 “老幹體” 感覺。再比如,讓 DeepSeek 預測未來趨勢等問題,它的回答就像網路科幻小說,雖然經不起仔細推敲,但就是能讓年輕人覺得特別厲害、特別燃。
這些優點的背後,是研發團隊的年輕化、高審美,以及對模型訓練過程中人文要素的重視。反觀很多主流大模型,由於最終聽取彙報的領導層普遍是 45 歲以上、缺乏人文學科背景的中年男士,導致大模型對話充滿 “官腔”,讓人提不起興趣。與其說是年輕人在支援 DeepSeek,不如說是年輕人在支援自己的話語權和審美權。
順便提一句,DeepSeek 目前還有些 “百無禁忌”,但監管遲早會介入,大家也不必對 AI 的犀利和大膽抱有過多幻想。
DeepSeek 以一種巧妙的方式,實現了更好的使用者對話體驗和更優秀的傳播效果。這或許能促使 AI 公司反思產品體驗,重視人文能力的培養。如果我們只一味地吹噓 DeepSeek 的技術,而忽略了它在人文體驗方面的優勢,那可就太可惜了。
四、客觀看待,穩步前行
綜合以上這些方面,我們可以勾勒出一個完整、真實的 DeepSeek,它不再被神聖的光暈籠罩:
它是一次綜合性的突破,融合了技術創新、人文素養、開源和低成本策略等要素,並且在特殊的產業週期和國際環境背景下被不斷放大。
DeepSeek 不是石破天驚的技術革命,但它足夠成熟,也足夠有新意。這也在一定程度上解釋了,為什麼歐美的 AI 大佬與專家,對它的評價比較一致:令人印象深刻。
DeepSeek 沒有一步登天,我們也不必幻想一步登天。它只是前進了一大步,我們完全可以為這一步的邁出而感到自信和驕傲。
我堅決反對 “中國只有 DeepSeek”
這種片面的言論。事實上,中國有著清晰的 AI 產業格局,堅實的自主化 AI 軟硬體體系,數十萬 AI 開發者,以及積極的 AI 政策導向。這些都是孕育更多優秀 AI 成果的肥沃土壤。有了這些因素的支撐,我堅信會有更多像 DeepSeek 這樣的優秀成果不斷湧現,直到 AI 工業革命全面開啟,直到 AGI 的曙光真正降臨。
所以,何不把 DeepSeek 帶下神壇?理性、從容地看待它,用好它,用好中國 AI 事業的一切成果,這才是 AI 在中國真正成熟的標誌。
王陽明說:“山高萬仞,只登一步。”DeepSeek 這一步,有著它獨特的意義。邁出這一步後,我們不妨停下來,聽聽山風,享受一下階段性的成果。但同時也要清醒地認識到,我們還在攀登的路上。休息好了,高興夠了,我們唯一要做的,就是堅定地邁出下一步。


相關文章