DeepSeek+華為晶片!“卷王”矽基流動交出DeepSeek推理國產方案,持平英偉達們

作者

週一笑

郵箱

[email protected]

過去一個月,DeepSeek以驚人之勢席捲全球AI市場。據Sensor Tower統計,其移動應用上線僅18天便斬獲1600萬次下載,幾乎是ChatGPT同期資料的兩倍,目前已在140個市場成為下載量最高的移動應用,在國內掀起的熱潮,遠遠超過了當年ChatGPT橫空出世時的熱度。
作為業內首個支援聯網功能的開源推理模型,DeepSeek以完全免費的策略迅速俘獲全球使用者,然而,“潑天的流量”加上大規模DDOS攻擊,也讓DeepSeek也面臨了嚴峻挑戰。出現包括無法註冊、“當前操作暫時無法完成”提示和API服務中斷等問題,使用者體驗大打折扣。
1
國產模型+國產算力+國產雲服務,國產AI閉環了?
面對DeepSeek官方服務頻頻宕機的現狀,國內開發者和企業使用者迫切需要更穩定、更可靠的推理服務。
2月1日,以快速上線最新模型,甚至有時候比官方服務還要快而著稱的“卷王”矽基流動,終於上線了期待已久的R1服務。
矽基流動創始人、CEO 袁進輝在社交媒體也透露了合作開發過程。
顯然,這次最令人興奮的是,這是一個與華為雲合作推出的,基於昇騰雲的DeepSeek R1&V3推理服務。
而根據多方訊息,它也是業內首個基於國產昇騰910B晶片提供推理服務的R1模型產品。
根據矽基流動介紹:透過雙方聯合創新,並藉助自研推理加速引擎,矽基流動團隊基於華為雲昇騰雲服務部署的DeepSeek模型,已達全球高階GPU部署模型的同等效果。API定價與DeepSeek官方優惠期價格保持一致。
在此之前,英偉達和亞馬遜等頭部算力平臺也已經快速提供DeepSeek的模型服務,矽基流動在此提到的“全球高階GPU”直指英偉達。
一箇中國自己的頂級模型,一箇中國廠商的推理晶片,在中國的新一代AI雲技術平臺推動下,有了放在全球範圍都屬一流的全過程部署方案。這顯然是中國AI生態又一個歷史時刻。
一直在關注DeepSeek的 a16z 知名投資人 Marc Andreessen在推特上也轉發了這個資訊,併發了一個側目的表情。
矽基流動與華為雲此次合作,重新部署了完整的R1和V3模型,並提供便捷的API呼叫方式,不僅有效緩解了DeepSeek官方伺服器的壓力,避免了頻繁掉線的問題,更滿足了企業級業務的商用部署需求。透過API與本地客戶端結合,企業和開發者還可以進行個人知識庫配置等更多自定義操作,靈活度更高。
DeepSeekR1使用英偉達H800 GPU 進行訓練,此前有分析師Alexander Doria推測,DeepSeek在推理階段主要依賴華為自研的Ascend AI加速器,以降低成本並減少對西方硬體的依賴,這次也算是某種程度上的“官宣”了。
在DeepSeek全球爆火引發算力緊張之際,矽基流動與華為雲聯手推出的國產化解決方案的意義,或許超出了緩解算力壓力的初衷,更是為國產AI算力在大模型部署中開闢新賽道,同時也為更多企業提供了一個可借鑑的國產化落地思路。
這也是開源的魅力所在,基於開源的策略,DeepSeek不是在分割一個固定的蛋糕。雲服務商可以自主部署獲得收益。應用開發商能以更低成本接入服務。全球各地的技術團隊都能基於開源模型搭建本地化服務。還削弱了閉源AI模型公司依靠技術壁壘獨佔市場的做法,促使產業鏈利潤向兩端流動,從而撬動了更大的市場空間。這也解釋了為何包括微軟、亞馬遜和NVIDIA在內的科技巨頭,也紛紛選擇接入DeepSeek的模型。
1
一邊“質疑”DeepSeek,一邊搶著接入的巨頭們
DeepSeek 的橫空出世,憑藉創新技術路線和開源策略,以較低成本開發出具有競爭力的AI模型,迅速引發全球矚目,也在美國政界和科技界激起了複雜的情緒。部分美國官員表達了擔憂,一些議員甚至建議限制使用。Anthropic CEO Dario Amode更是釋出萬字長文,向白宮隔空喊話,呼籲加強AI監管,矛頭直指DeepSeek。
OpenAI在正式上線o3-mini之時,Sam Altman攜一眾高管參加reddit的AMA,罕見的承認OpenAI 過去在開源方面“一直站在歷史錯誤的一邊”。不過這也並不妨礙釋出o3-mini還要陰陽怪氣一下DeepSeek(配圖:用五歲孩子能懂的方式解釋一下AI蒸餾):
然而,與“質疑”聲浪形成鮮明對比的是,英偉達、微軟、亞馬遜等美國科技巨頭卻紛紛選擇將DeepSeek模型整合至自身服務體系。
1月31日,受DeepSeek影響一度單日蒸發近6000億美元市值的英偉達,官宣在其NIM微服務平臺上線DeepSeekR1模型。英偉達表示,該模型在邏輯推理、數學運算、程式設計和語言理解等任務上具備“領先準確性”,推理能力一流,運算效率極高。

“最先進的高效大型語言模型,在推理、數學和程式設計方面表現卓越”

而OpenAI的最大投資方微軟,也於本週早些時候在Azure雲計算平臺和GitHub上宣佈支援R1,並計劃未來在Copilot+PC裝置上整合R1的精簡版本。
Anthropic的最大投資方亞馬遜,其旗下的AWS也緊隨其後,舉辦了一場關於部署DeepSeek模型的線上直播,並宣佈R1模型已全面上線Amazon Bedrock和Amazon SageMaker AI平臺。
至此,美股“七巨頭”中已有三家接入DeepSeek。而Perplexity、Cursor、Windsurf等明星創業公司早已第一時間宣佈接入DeepSeek R1, “真香定律”在全球科技圈持續上演。
前英特爾CEO Pat Gelsinger也在X上對DeepSeek讚賞有加,並從中提煉出計算機發展史上的三個重要經驗:其一,計算領域遵循“氣體定律”,成本的顯著降低必然帶來市場擴張,而市場低估了這一點;其二,中國工程師在資源受限的情況下找到創造性解決方案,印證了工程的本質即解決約束;其三,開放策略終將勝出,DeepSeek的做法將有助於重塑日益封閉的AI基礎模型領域。Gelsinger對DeepSeek團隊表達了感謝,認為他們的實踐將對整個AI行業產生深遠影響。
根據 Tom's Hardware的報道,在將DeepSeek R1 與 OpenAI 的 o1 模型進行比較後,Pat Gelsinger因其卓越效能和明顯的成本效益,選擇了R1用於他的新創業公司Gloo。
全球開發社群對DeepSeek展示的狂熱之下,事實上國產AI生態的發展有一點已變得明確——開源戰略與技術創新的成功正在重塑全球AI產業的競爭格局,而中國公司在其中已經有了扛大旗的味道,並因此正在扭轉著過往三年ChatGPT以降的格局。更多的中國AI生態歷史時刻也會因此到來。

點個愛心,再走吧


相關文章