DeepSeek引爆國產適配的前夜,「矽基流動」已完成億元融資|36氪首發

過去一年,矽基流動經歷了十倍的市場增長。
鄧詠儀
編輯蘇建勳
封面來源AI製圖
有人預料到DeepSeek能引爆全球嗎?至少,DeepSeek-V3釋出前,在大模型戰場前線“賣鏟子”的袁進輝心裡也是打鼓的。
1月28日,他在社交媒體上回憶起一個故事:DeepSeek爆火前一個月,梁文鋒曾建議矽基流動部署DeepSeek-V3,至少準備20臺H800,80臺最好。袁進輝迅速算了算賬,一個月80臺H800伺服器就要支出五六百萬的算力成本,這些機器還不一定能用滿。“風險太大了,就沒下注。” 
隨後DeepSeek火爆全球,洶湧的流量讓其官網和App很快崩潰,熱情的使用者急於找到能正常使用DeepSeek的渠道。袁進輝感慨:“現在DeepSeek這麼火,決策失誤,欲哭無淚。”
很快,這種懊悔轉變成強大的行動力。苦於算力不足的矽基流動找到華為,全力完成DeepSeek-R1 & V3在昇騰晶片上的適配工作。整個春節期間,矽基流動團隊沒有休息過一天。
他們的動作夠快,承接住了第一波流量。2月1日,矽基流動首發了基於華為昇騰算力的滿血版DeepSeek-R1 & V3,迅速吸引了大批開發者和個人使用者。

圖源:SimilarWeb

這是一次巧妙的合作,一舉掃清市場對於國產晶片效能瓶頸的疑慮,證明了在國產晶片上部署DeepSeek,也可以獲得持平全球高階GPU部署模型的效果。同時,這次合作無意間觸發了一場國產替代的狂歡。
矽基流動也藉此證明了自己的AI Infra實力。“尤其這次上線DeepSeek R1 & V3之後,湧過來的合作線索,暫時都看不過來。”袁進輝說。
就在矽基流動爆火之前,智慧湧現”獲悉,矽基流動(SiliconFlow)在2024年底就已完成億元人民幣Pre-A輪融資,由華創資本領投,普華資本跟投,老股東耀途資本繼續超額跟投,華興資本擔任獨家財務顧問。
值得注意的是,本輪融資之前,矽基流動已引入美團作為戰略股東。
2024年8月,“智慧湧現”曾採訪過創始人袁進輝,當時矽基流動正好成立一週年,剛釋出MaaS平臺SiliconCloud。
你可以將SiliconCloud想象為一個“大模型API超市”,開發者只需要註冊賬號,選擇自己想要的模型,就可以開發應用,免去購買伺服器的負擔。甚至,經過矽基流動適配和最佳化後的模型,還能做到比原廠模型響應更快、推理成本更低。
在這一年間,矽基流動經歷了起碼十倍的市場增長。SiliconCloud已經獲得了超三百萬的使用者,日均呼叫上千億Token——去年剛上線時,這個數字還是日均百億。

圖源:矽基流動

在開發者圈子中,矽基流動有著良好的口碑,因提供親民價格和優異效能的模型服務被稱為“賽博菩薩”。現在,SiliconCloud已經上線了包括滿血版DeepSeek-R1 & V3、Qwen、FLUX.1、CosyVoice等在內的上百款主流模型,也提供模型訓練、微調、託管到部署的全套工具,滿足開發者及企業客戶的不同應用場景需求。
2024年7月,矽基流動也推出了一款新產品:基於ComfyUI的雲節點外掛BizyAir。
BizyAir是一款影像生成工具,能夠讓AI開發者與創作者無需考慮顯示卡和環境限制,即可直接使用雲計算資源完成生圖任務。截至目前,BizyAir支援數十種模型,支援ComfyUI本地節點混跑,已經獲得了近萬名使用者。 
矽基流動在這一年間也開始了To B商業化擴充套件,與華為、亞馬遜雲科技、英偉達等頂級雲廠商、晶片廠商、大模型公司及應用公司建立了合作伙伴關係。
企業服務方面,矽基流動已經在大語言模型、文生圖、影片生成等多個場景,有標杆客戶案例的落地。矽基流動目前提供四種服務模式,包括專屬例項、算力納管、私有版 MaaS、基於華為昇騰910系列NPU的一體機。
毫無疑問,DeepSeek已經一掃2024年大模型領域的陰霾,一場宏大征程的序幕已經展開。2024年,袁進輝曾對“智慧湧現”表示,在GPT-4o出來後,大模型的語言能力、知識能力方面的限制都解決得比較好了,除了邏輯推理能力。
OpenAI o1、DeepSeek R1的出現,意味著大模型在“邏輯能力”這個問題上前進了一大步,這對應用市場是巨大利好。
“可以預期,國內外基於DeepSeek的應用將爆發,這一天終於要到來了。”袁進輝說。
以下為“智慧湧現”與創始人袁進輝的問答:
“智慧湧現”:上一輪融資之後,矽基流動在產品方面有什麼節點性的進展?關鍵效能提升的程度如何?
袁進輝:主要是適配了華為昇騰晶片、開源了ComfyUI雲節點 BizyAir,以及持續上線最新模型,並且上線了模型微調、託管等功能。
底層推理框架的效能依然保持業內領先,效能最佳化是一項需要長期、持續性投入的工作。
“智慧湧現”:推出相關產品後,市場都有怎樣的反饋?商業落地上有什麼關鍵性進展?
袁進輝:SiliconCloud獲得了爆發式增長,目前平臺有超三百萬使用者,日均呼叫超千億 Token;BizyAir在沒做什麼推廣的情況下獲得了近萬名使用者。
商業落地方面,尤其這次上線DeepSeek R1 & V3之後,湧過來的合作線索暫時都看不過來。
“智慧湧現”:去年7月矽基流動上線了 BizyAir,為什麼會推出這個產品?戰略定位是什麼?
袁進輝:BizyAir 是一個意外驚喜。起初,這是一個試驗性專案,其實還是幫助使用者用高性價比的推理服務資源,更方便地進行生圖。在BizyAir之前,我們開源的圖片/影片生成推理加速元件OneDiff,由於效能好、靈活、支援模型豐富,已經有較好的口碑。在做OneDiff的過程中,我們瞭解到生圖使用者的常見痛點,包括出圖慢、工作流組合繁瑣、上手門檻高等,所以我們嘗試開發了 BizyAir,釋出後受到了不少使用者的喜愛以及自發傳播。
“智慧湧現”:去年你說,大模型的語言能力、知識能力方面的限制都解決得比較好了,除了邏輯。Deepseek V3之後,是不是邏輯能力也做得足夠好了,2025年會迎來現象級的應用嗎?
袁進輝:那時還沒有OpenAI o1、DeepSeek-R1。它們的釋出已經展示出模型的強大邏輯推理能力,並且DeepSeek-R1把思考過程完整地展示了出來,看上去更像是一個有思辨能力的人在思考。
現在,開發者基於標準API可以做很多很酷的應用了,可以預期,國內外基於DeepSeek這樣的開源模型的應用將爆發,這一天終於要到來了。
“智慧湧現”:最近矽基流動迅速基於昇騰上線了DeepSeek,春節期間也有大量開發者湧入,你們在前線看到的情況是怎麼樣的?
袁進輝:我原本以為我們能接住這波使用者,但市場對DeepSeek-R1 & V3的需求量太大了,目前不得不對免費使用者進行限流,當然,我們也在積極擴充套件資源,希望能讓使用者敞開用。
我們作為一個面向開發者與企業客戶的API平臺,但是光官網的Playground就有幾十萬日活,可見DeepSeek需求量之大。
“智慧湧現”:很多第三方企業宣佈接入DeepSeek-R1 & V3 ,但為什麼實際能提供滿血版的企業很少?
袁進輝:一方面,部署滿血版DeepSeek R1 & V3需要的算力資源非常大,用80臺H800來部署,每月需要五六百萬的算力成本,一般企業與其自己本地部署,顯然接入矽基流動SiliconCloud這樣的雲服務 API 更划算;
另一方面,要部署DeepSeek R1 & V3這樣的MoE模型技術挑戰很大,需要專業的AI Infra團隊才能部署成功且把效能最佳化得很好,矽基流動SiliconCloud曾是國內最早部署上線 DeepSeek 模型的第三方平臺,也是首個在國產晶片上適配部署DeepSeek-R1 & V3的AI Infra公司。

深度、敏銳、前瞻,為1%的人捕捉商業先機
36氪旗下精選公眾號
👇 真誠推薦你來關注 👇

相關文章