▲點選圖片報名,抓住風口(iOS使用者請用電腦端開啟小程式)
本期要點:AI時代的歷史韻腳
你好,我是王煜全,這裡是王煜全要聞評論。
2024年12月26日,平時並不為人所知的幻方量化正式釋出並開源了AI大模型DeepSeek-V3,一時間在網際網路上引起了不小的轟動。據說這個模型總共包含了6710億個引數,在程式碼和數學領域表現卓越,在多個基準測試中展現出與GPT-4o和Claude-3.5-Sonnet相匹敵的效能,被譽為當前最強開源模型。

尤為值得一提的是,DeepSeek-V3有極具競爭力的成本優勢,其總訓練成本僅為500多萬美元。要知道,如ChatGPT-4等大模型的訓練費用常常動輒數千萬乃至上億美元。
而DeepSeek-V3的推理成本更是低得讓人吃驚,只需1美元就能執行5個小時,相比之下,同樣的金額在Claude上只能執行十分鐘。
就如Kimi曾經橫空出世時一般,網友們紛紛驚呼國產大模型的希望居然在這兒,甚至認為國產的“o1模型”也指日可待了。DeepSeek大模型背後的母公司幻方量化也隨之衝上了熱搜。
當然,也有人指出,DeepSeek-V3仍然有較大侷限性,主要依賴已知技術組合最佳化,缺乏底層原理創新,雖然注重價效比,體現了降成本方面的巨大潛力,但探索不足,也缺乏多模態、邏輯推理等新功能,有典型的“中國特色”。

對此,我持有不同的看法。
首先,DeepSeek-V3在降成本方面的做法,毫無疑問具有重大意義。對於AI大模型來說,效能調優至關重要,將直接決定AI的應用廣度和深度。
自工業革命以來,所有的科學技術要進入產業、變成產品和服務、進而對社會產生深刻影響,都離不開對技術所進行的效能調優、引數調整以及結構上的小改動。這不僅僅侷限於核心技術本身,還包括與之配套的各項技術。也只有當這些技術的效能足夠好、成本足夠低時,相關產品和服務才能得以推向市場,並被使用者廣泛接受。
就像火車的核心技術雖然是蒸汽機,但要讓火車真正跑起來,要對蒸汽機進行最佳化,還需要鐵軌的配合,而且直到火車票的價格低至大眾能承受的範圍時,火車的使用才會全面鋪開,並進而對整個社會產生深遠影響。
因此,從瓦特蒸汽機被髮明,到第一列火車的出現,隔了30多年的時間,而火車得到廣泛使用,則更是用了近百年時間。
同樣,AI大模型的最佳化,也不能只停留在模型本身,還需要考慮如何更好地利用資料、如何設計更高效的演算法,並且要將價格“打下去”,讓使用者能負擔得起。
例如DeepSeek-V3採用了混合專家架構(MoE,Mixture-of-Experts),因此在推理過程中,其6000多億個引數中只有300多億個引數會被啟用。這無疑大幅提高了效率,降低了運營成本。
低成本,卻保持了不俗的效能,再加上DeepSeek-V3的開源屬性,以及極具競爭力的API定價,使得開發者和研究人員無需支付高昂的費用,也能參與到AI大模型的前沿創新之中。這不僅會極大提升DeepSeek相關產業生態的活力,加快AI技術的發展和應用,還將讓AI飛入尋常百姓家,成為人們觸手可及的高科技。
所以,DeepSeek確實和其他中國製造有相似之處,那就是,他們在產業化上作出的貢獻同樣是技術的進步,但卻被低估了。

其次,雖然說DeepSeek-V3並沒有顛覆性的架構創新,只是對現有技術的最佳化和組合,但我們不妨反問一句,OpenAI的o1模型在底層技術上真的有什麼特別顛覆性的突破嗎?
O1模型依靠內部構建出的詳盡“思維鏈”,一步步拆解複雜問題,再結合強化學習機制,不斷糾正錯誤,直至找到最優解。這一過程,不僅提升了模型的準確性,更賦予了它類似人類慢思考的能力,使得它在處理數學、程式設計乃至科學難題時,展現出了超乎想象的智慧。但話說回來,這一做法似乎也談不上有什麼底層原理的創新。
而且,為了保證o1和o3等模型的效能,OpenAI還採用了更為複雜的訓練演算法和定製化的資料集,從而大幅增加了開發成本與執行費用。因此,o1模型的輸入和輸出費用是GPT-4o的數倍,而未對公眾推出的o3模型,解決單個任務的費用更是可能高達數千美元。
然而,這並不妨礙大家普遍認為o1模型是一個很大的進步。
所以,在先進技術從實驗室走向市場的過程中,其實並沒有必要過於強調底層原理的創新,各種功能的組合和最佳化同樣重要,而追求價效比也是一個有利於科技產業和經濟社會發展的正確選擇。
其實這是個普遍存在的規律,就像特斯拉的貢獻並不是發明了鋰電池,而是透過效能調優,使電動車變成價格最親民的車型之一。大模型領域不過也是在做同樣的事情。
回顧過去兩年,我們認為,AI大模型的發展確實發生了一個重大轉型,從底層架構轉向應用效能的突破,這也意味著AI技術的相關應用將隨之蓬勃發展起來。
對於中國的企業和創業者來說,現在是一個不容錯過的時間點。我們不能等到別人已經完成了技術的效能調優後再跟進,而是要在基本原理得到突破後就第一時間介入,發揮我們降本增效方面的特長,再透過大量資料和資金的投入,實現模型效能的提升,助力AI技術的應用和普及。這其實正是中國製造對技術進步的獨特貢獻。
可以說,DeepSeek-V3正是這一思路的體現。透過精細的效能調優和成本控制,它也能在強者如林、競爭激烈的AI大模型市場上佔據一席之地。希望有更多的中國大模型藉助中國優勢,在AI領域實現反超。
對我們每個人也是如此,本次AI技術革命將帶領人類進入服務規模化的時代,整個社會都將發生巨大變革。我們每個人,只有保持對新技術、新趨勢的敏銳洞察,並結合自身優勢,適時地參與到科技浪潮之中,才能在激烈的競爭中脫穎而出,為社會產生實實在在價值的同時,也為自己獲得商業上的成功。DeepSeek的成功說明,到了中國的企業家、創業者們下場開發AI應用的時候了。
科技是這個時代最大的紅利。所以,做個硬廣,向你推薦前哨AI少年冬令營,為孩子解鎖AI新技能,開啟接入未來世界的大門。
↓前哨AI冬令營,解鎖AI未來(掃碼加入)

以上就是今天的內容,更多詳細的產業分析和底層邏輯,我會在科技特訓營裡分享,歡迎關注全球風口微訊號,報名加入。
王煜全要聞評論,我們明天見。
推薦閱讀:

【科技特訓營】看懂科技產業,離不開長期觀察。線上書院模式,與王老師深度連結!為未來五年做好準備,先人一步,看清未來!
↓長按圖片掃碼報名,先人一步,看清未來

↓¥399,掌握王煜全AI產業預測精華(iOS使用者請在電腦端開啟)
↓點選加入,學會用AI為你工作(iOS使用者請在電腦端開啟)
此外,我們還為您準備了一份清單
“全球AI獨角獸TOP10”
