它把AI價格打下去了，效能卻比肩4o！DeepSeek-V3來了！

▲點選圖片報名，抓住風口（iOS使用者請用電腦端開啟小程式）

本期要點：AI時代的歷史韻腳

你好，我是王煜全，這裡是王煜全要聞評論。

2024年12月26日，平時並不為人所知的幻方量化正式釋出並開源了AI大模型DeepSeek-V3，一時間在網際網路上引起了不小的轟動。據說這個模型總共包含了6710億個引數，在程式碼和數學領域表現卓越，在多個基準測試中展現出與GPT-4o和Claude-3.5-Sonnet相匹敵的效能，被譽為當前最強開源模型。

尤為值得一提的是，DeepSeek-V3有極具競爭力的成本優勢，其總訓練成本僅為500多萬美元。要知道，如ChatGPT-4等大模型的訓練費用常常動輒數千萬乃至上億美元。

而DeepSeek-V3的推理成本更是低得讓人吃驚，只需1美元就能執行5個小時，相比之下，同樣的金額在Claude上只能執行十分鐘。

就如Kimi曾經橫空出世時一般，網友們紛紛驚呼國產大模型的希望居然在這兒，甚至認為國產的“o1模型”也指日可待了。DeepSeek大模型背後的母公司幻方量化也隨之衝上了熱搜。

當然，也有人指出，DeepSeek-V3仍然有較大侷限性，主要依賴已知技術組合最佳化，缺乏底層原理創新，雖然注重價效比，體現了降成本方面的巨大潛力，但探索不足，也缺乏多模態、邏輯推理等新功能，有典型的“中國特色”。

對此，我持有不同的看法。

首先，DeepSeek-V3在降成本方面的做法，毫無疑問具有重大意義。對於AI大模型來說，效能調優至關重要，將直接決定AI的應用廣度和深度。

自工業革命以來，所有的科學技術要進入產業、變成產品和服務、進而對社會產生深刻影響，都離不開對技術所進行的效能調優、引數調整以及結構上的小改動。這不僅僅侷限於核心技術本身，還包括與之配套的各項技術。也只有當這些技術的效能足夠好、成本足夠低時，相關產品和服務才能得以推向市場，並被使用者廣泛接受。

就像火車的核心技術雖然是蒸汽機，但要讓火車真正跑起來，要對蒸汽機進行最佳化，還需要鐵軌的配合，而且直到火車票的價格低至大眾能承受的範圍時，火車的使用才會全面鋪開，並進而對整個社會產生深遠影響。

因此，從瓦特蒸汽機被髮明，到第一列火車的出現，隔了30多年的時間，而火車得到廣泛使用，則更是用了近百年時間。

同樣，AI大模型的最佳化，也不能只停留在模型本身，還需要考慮如何更好地利用資料、如何設計更高效的演算法，並且要將價格“打下去”，讓使用者能負擔得起。

例如DeepSeek-V3採用了混合專家架構（MoE，Mixture-of-Experts），因此在推理過程中，其6000多億個引數中只有300多億個引數會被啟用。這無疑大幅提高了效率，降低了運營成本。

低成本，卻保持了不俗的效能，再加上DeepSeek-V3的開源屬性，以及極具競爭力的API定價，使得開發者和研究人員無需支付高昂的費用，也能參與到AI大模型的前沿創新之中。這不僅會極大提升DeepSeek相關產業生態的活力，加快AI技術的發展和應用，還將讓AI飛入尋常百姓家，成為人們觸手可及的高科技。

所以，DeepSeek確實和其他中國製造有相似之處，那就是，他們在產業化上作出的貢獻同樣是技術的進步，但卻被低估了。

其次，雖然說DeepSeek-V3並沒有顛覆性的架構創新，只是對現有技術的最佳化和組合，但我們不妨反問一句，OpenAI的o1模型在底層技術上真的有什麼特別顛覆性的突破嗎？

O1模型依靠內部構建出的詳盡“思維鏈”，一步步拆解複雜問題，再結合強化學習機制，不斷糾正錯誤，直至找到最優解。這一過程，不僅提升了模型的準確性，更賦予了它類似人類慢思考的能力，使得它在處理數學、程式設計乃至科學難題時，展現出了超乎想象的智慧。但話說回來，這一做法似乎也談不上有什麼底層原理的創新。

而且，為了保證o1和o3等模型的效能，OpenAI還採用了更為複雜的訓練演算法和定製化的資料集，從而大幅增加了開發成本與執行費用。因此，o1模型的輸入和輸出費用是GPT-4o的數倍，而未對公眾推出的o3模型，解決單個任務的費用更是可能高達數千美元。

然而，這並不妨礙大家普遍認為o1模型是一個很大的進步。

所以，在先進技術從實驗室走向市場的過程中，其實並沒有必要過於強調底層原理的創新，各種功能的組合和最佳化同樣重要，而追求價效比也是一個有利於科技產業和經濟社會發展的正確選擇。

其實這是個普遍存在的規律，就像特斯拉的貢獻並不是發明了鋰電池，而是透過效能調優，使電動車變成價格最親民的車型之一。大模型領域不過也是在做同樣的事情。

回顧過去兩年，我們認為，AI大模型的發展確實發生了一個重大轉型，從底層架構轉向應用效能的突破，這也意味著AI技術的相關應用將隨之蓬勃發展起來。

對於中國的企業和創業者來說，現在是一個不容錯過的時間點。我們不能等到別人已經完成了技術的效能調優後再跟進，而是要在基本原理得到突破後就第一時間介入，發揮我們降本增效方面的特長，再透過大量資料和資金的投入，實現模型效能的提升，助力AI技術的應用和普及。這其實正是中國製造對技術進步的獨特貢獻。

可以說，DeepSeek-V3正是這一思路的體現。透過精細的效能調優和成本控制，它也能在強者如林、競爭激烈的AI大模型市場上佔據一席之地。希望有更多的中國大模型藉助中國優勢，在AI領域實現反超。

對我們每個人也是如此，本次AI技術革命將帶領人類進入服務規模化的時代，整個社會都將發生巨大變革。我們每個人，只有保持對新技術、新趨勢的敏銳洞察，並結合自身優勢，適時地參與到科技浪潮之中，才能在激烈的競爭中脫穎而出，為社會產生實實在在價值的同時，也為自己獲得商業上的成功。DeepSeek的成功說明，到了中國的企業家、創業者們下場開發AI應用的時候了。

科技是這個時代最大的紅利。所以，做個硬廣，向你推薦前哨AI少年冬令營，為孩子解鎖AI新技能，開啟接入未來世界的大門。

冬令營將在2月初開課，為了保證課程和答疑質量，冬令營席位有限，快快報名吧！歷屆特訓營會員以及AI小課學員還有專屬優惠！點選報名→前哨AI少年冬令營2025開啟報名！

↓前哨AI冬令營，解鎖AI未來（掃碼加入）