這兩天，各大社媒都被中國初創公司DeepSeek屠版了！

DeepSeek應用登頂蘋果美國地區應用商店免費APP下載排行榜，在美區下載榜上超越了ChatGPT。

▎DeepSeek是啥？

DeepSeek，全稱杭州深度求索人工智慧基礎技術研究有限公司。

成立於2023年7月17日，是一家創新型科技公司，專注於開發先進的大語言模型（LLM）和相關技術。

去年12月DeepSeek-V3釋出後，AI資料服務公司Scale AI創始人Alexander Wang就發帖稱，DeepSeek-V3是中國科技界帶給美國的苦澀教訓。

“當美國休息時，中國（科技界）在工作，以更低的成本、更快的速度和更強的實力趕上。”

不到一個月之後，今年1月20日，DeepSeek正式開源R1推理模型。

據DeepSeek介紹，其最新發布的模型DeepSeek-R1在後訓練階段大規模使用了強化學習技術，在僅有極少標註資料的情況下，極大提升了模型推理能力。在數學、程式碼、自然語言推理等任務上，效能比肩OpenAI o1正式版。

這一模型釋出後，引發了海外AI圈眾多科技大佬的討論。例如，英偉達高階研究科學家Jim Fan就在個人社交平臺上公開發表推文表示：“我們正身處這樣一個歷史時刻：一家非美國公司正在延續OpenAI最初的使命——透過真正開放的前沿研究賦能全人類。看似不合常理，但最有趣的結局往往最可能成真。”

為什麼DeepSeek能出圈？

在矽谷，DeepSeek很早就被稱作“來自東方的神秘力量”，也是網上熱議的“杭州六小龍”之一。

真正讓DeepSeek火出圈的是2024年12月26日，這家公司宣佈上線並同步開源的 DeepSeek-V3模型，並公佈了長達53頁的訓練和技術細節。

它以1/11的算力、僅2000個GPU晶片訓練出效能超越GPT-4o的大模型。其總訓練成本只有557.6萬美元，而GPT-4o的約為1億美元，使用25000個GPU晶片。雙方的成本至少是10倍的差距。

在效能上，DeepSeek-V3在數學、程式碼能力和中文知識問答方面還超過了ChatGPT-4o。

國外獨立測評機構Artificial Analysis測試後，發出了“超越了迄今為止所有開源模型”的驚歎；Meta科學家田淵棟感慨：“這是非常偉大的工作。”

“價效比”是商業社會中的制勝法寶之一，DeepSeek也因創新的模型架構和史無前例的價效比被稱為“大模型界的拼多多”，引發位元組、阿里、百度等大廠的大模型價格大戰。

與DeepSeek-V3低成本訓練一樣令人驚歎的是DeepSeek的員工規模。

在團隊配置上， DeepSeek團隊只有139名研發人員，相比OpenAI擁有1200名研究人員，團隊規模是DeepSeek的近乎9倍之多。

其中，運算元、推理框架、多模態等研發工程師以及深度學習方面的研究人員共有約70人。比如前段時間的熱門話題“雷軍千萬年薪挖95後天才AI少女”，這位“95後AI天才少女”羅福莉，就是DeepSeek開源大模型DeepSeek-V2的關鍵開發者之一。

OpenAI前政策主管、Anthropic聯合創始人Jack Clark曾這樣評價DeepSeek：“僱用了一批高深莫測的奇才”，還認為中國製造的大模型，“將和無人機、電動汽車一樣，成為不容忽視的力量。”

▎中國網友：新春佳節思路開啟

DeepSeek的熱度在國內居高不下，從昨晚到現在多個熱搜登上了微博。

網友更是思路開啟，用它來做奧數寫作文是基本款：

春節到來，今年春節檔票房廝殺的這麼激烈，很多小夥伴直接用它來預測結果：

由於使用者爭相下載太過火爆，DeepSeek幾度服務中斷註冊困難。而據報道深藏功與名的DeepSeek創始人梁文鋒已經回廣東過年了，be like 外界紛紛擾擾，我等歲月靜好…

最後，在這喜迎新春、闔家團圓的時刻，小北祝大家新春快樂！！

無論你正身處何地，別忘了給家人送祝福哦~

-END-

不是謠言？明年1月20日後留學生無法返美？美國高校警告：最好在川普就職日返回美國本土！

震驚! 用假學歷上大學，4名學生被捕！20人已逃離..

可怕！北美29歲華人投行女精英被伴侶殺害！行兇前剛因涉嫌死亡威脅罪被保釋

dignews.cc