DeepSeek上線國家超算平臺!671B滿血版,三大運營商接入,平頭哥晶片適配

夢晨 發自 凹非寺

量子位 | 公眾號 QbitAI
DeepSeek的含金量還在上升,一個半個週末過去發生這些大事:
  • 國家超算網際網路平臺上線DeepSeek-R1,最高支援671B的滿血版。
  • 達摩院玄鐵晶片成功適配DeepSeek-R1系列蒸餾模型,在RISC-V架構CPU和端側平臺開啟新的應用空間。
再加上春節期間的三大運營商全面接入DeepSeek等訊息它的影響力已不僅限於AI和網際網路,正在往產業更深層進發。
總之,對於使用者和開發者來說不用再看“伺服器繁忙”的臉色,可以多換幾個地方再試了。
隨著官方伺服器不堪重負,以及DeepSeek-V3 API優惠結束恢復原價,各大雲服務商也抓住機會捲了起來。

雲服務卷價格,新式晶片卷速度

騰訊雲率先上線支援聯網搜尋的DeepSeek,結合自家旗下搜狗搜尋提供搜尋增強API。
同時支援整合私域知識庫,一鍵整合RAG。
商湯和阿里直接捲起了價格。
商湯大裝置平臺上3個月內可限時免費使用1000萬tokens,同時支援128K最大上下文長度限制。
阿里云為新使用者提供100萬免費tokens,同時蒸餾版模型價格也比較低。
與此同時,各類晶片正在輸出速度上展開激烈競爭。
通用GPU方面,AMD員工透露MI300X上的DeepSeek-R1滿血版速度比剛釋出時已經快了3倍,併發布官方Docker Image映象。
在英偉達與CUDA生態之外,提供AMD與ROCm的另一種選擇。
三大新型AI推理晶片Groq、Cerebras、Sambanova已經把DeepSeek-R1-Distill Llama-70B搞到了每秒500-1500tokens。
快到你都看不清發生了什麼,推理思維鏈完成了、程式碼寫完了,一眨眼直接運行了。
groq晶片執行DeepSeek-R1-Distill Llama-70B

One More Thing

還有一條有意思的訊息,ai.com域名現在已定向到DeepSeek官網。
甚至有傳言稱是DeepSeek重金拿下了該域名。
不過一直關注大模型的朋友可能還記得,這個域名曾先後定位到ChatGPT和xAI。
大機率是域名所有人個人行為~

國家超算網際網路平臺

https://www.scnet.cn/

騰訊雲DeepSeek專題

https://cloud.tencent.com/developer/special/deepseek

阿里雲DeepSeek解決方案

https://www.aliyun.com/solution/tech-solution/deepseek-r1-for-platforms

商湯大裝置

https://www.sensecore.cn

參考連結:

[1]

https://x.com/AnushElangovan/status/1888006978959741390
[2]https://x.com/Dev__Digest/status/1887337604267332022

評選報名2025年值得關注的AIGC企業&產品
下一個AI“國產之光”將會是誰?
本次評選結果將於4月中國AIGC產業峰會上公佈,歡迎參與!
一鍵關注 👇 點亮星標
科技前沿進展每日見
一鍵三連「點贊」「轉發」「小心心」
歡迎在評論區留下你的想法!

相關文章