用DeepSeek創收的“小公司”,痛並快樂著

無論是各大模型廠商還是AI產業鏈上下游的公司,都在興奮地等待通往未來AI世界的關鍵路徑。
|《中國企業家》記者 孔月昕
編輯馬吉英
頭圖來源|視覺中國
AI Infra公司在宣佈接入DeepSeek-R1後,會有很多中小企業前來聯絡,希望獲得部署了R1模型的產品,清程極智就遇到了類似情形。
“你們的DeepSeek是不是‘滿血版’?”清程極智CEO湯雄超曾被客戶這麼問。
注:DeepSeek滿血版即DeepSeek-R1模型的頂級版本,模型引數達671B(6710億),是普通版(14B/32B)的20倍以上,滿血版支援本地/API部署及複雜科研計算,能力上限更高,且對硬體要求也更高。
收到太多此類問詢後,清程極智團隊決定用工程解決這個問題——在官網上線一個“滿血版”鑑別小程式,並精心挑選了幾道比較有區分度的題目,使用者可以用這些題目去提問,如果系統回答得對,基本上就是“滿血版”;如果回答不出來,可能就不是“滿血版”。
該小程式上線後,其訪問量超出了清程極智的預期。
實際上,清程極智的經歷只是近期AI行業的一個縮影。“整個AI行業這一個多月應該都過得很充實。”有業內人士表示。DeepSeek的火爆,讓整個AI賽道的從業人員處於一種“痛並快樂著”的狀態。
一方面,DeepSeek的出現激發了普通使用者使用AI工具的意識和需求,推動了AI的普及。DeepSeek也成為有史以來增速最快的AI應用,據AI產品榜統計,DeepSeek 2月份活躍使用者1.57億,已接近ChatGPT 7.49億的20%。過多使用者的湧入,也讓DeepSeek對話機器人常常陷入“伺服器繁忙”的狀態。
另一方面,DeepSeek的快速迭代和開源,讓本來就“卷”的AI行業進入了新一輪的“軍備競賽”,從模型層至應用層的很多公司,在今年春節期間幾乎沒有休息。眾多企業宣佈接入DeepSeek,既有云服務提供商、晶片製造商等B端公司,也有各類C端應用公司。據正和島統計,已有超200家企業完成DeepSeek技術介面的整合部署。
接入的企業也迎來了一波“潑天流量”——騰訊元寶APP在接入DeepSeek之後,下載量迅速攀升,並在3月3日登頂中國區蘋果應用商店免費APP下載排行榜TOP1;作為AI基礎設施公司,矽基流動在全網最快接入DeepSeek-R1,訪問量激增40倍,2月訪問量高達1719萬人次。
DeepSeek-R1的出現,也進一步提高了各方對AIGC應用加速發展的期待。當3月6日Monica.im釋出AI智慧體產品Manus時,再次引發了一場“邀請碼搶購”狂潮。
無論是各大模型廠商還是AI產業鏈上下游的公司,都在興奮地等待通往未來AI世界的關鍵路徑。

如何接入DeepSeek

早在2024年DeepSeek-V2模型釋出時,業內已經關注到這家公司及旗下的開源模型。
美圖設計室技術負責人郭晨暉表示,為了在美圖的AI應用場景中給使用者更好的效果體驗,在自研的基礎上,美圖也一直對國內外優秀的大模型保持關注。DeepSeek-V2釋出時,美圖的外採AI團隊就關注到了該模型,與DeepSeek團隊接觸嘗試合作。不過為了尋求穩定性,美圖當時主要透過第三方AI Infra服務商呼叫DeepSeek模型API。2024年9月,美圖設計室接入了V2模型,輔助文案擴寫,V3、R1模型釋出後,他們也陸續進行了更新。“我們產品和業務團隊看到一些適合結合的模型,就會去做效果評估,合適的可能就會引入到我們自己的應用場景裡。”郭晨暉說。
郭晨暉  來源:受訪者
DeepSeek官方提供了兩個接入方法,一是模型跑起來後,透過一些程式設計方式去呼叫它的API介面;二是使用者在手機上裝一個APP或開啟官網的聊天視窗,直接跟它對話,聊天視窗的背後就在呼叫API。
不過,由於目前DeepSeek的流量過高,又存在伺服器、人手不足等情況,導致DeepSeek自己的API會出現超時等問題。郭晨暉表示,美圖旗下產品有著大體量的使用者基數,一些功能推廣開來後流量可能會激增數十倍、上百倍,這種情況下,公有云的服務保障能力相對更強。
不僅如此,DeepSeek的模型比較大,尤其是“滿血版”模型對硬體有一定要求;基於價效比層面的考慮,美圖的業務場景存在很顯著的(使用)高峰、低峰效應,雲廠商可以抹平各家呼叫API高低峰期的差異。“如果我們自己進行部署,低峰期資源利用率可能比較低,會有比較大的資源浪費。”郭晨暉說。
因此,美圖目前接入DeepSeek-R1模型的方式,主要是呼叫雲廠商的API,在此基礎上進行一定的私有化部署。
與美圖類似,部署端側晶片的此芯科技,也一直對新發布的各種大模型保持關注,尤其是比較適合在端側進行本地化部署的模型。此芯科技生態戰略總經理周杰表示,對於一些開源的大模型,尤其是SOTA模型(State of the Art,在某一領域或任務中表現最佳的模型),他們會第一時間投入資源進行相應的異構適配。因此在DeepSeek去年釋出V2以及今年釋出R1後,此芯科技都第一時間嘗試適配這些模型。
在周杰看來,DeepSeek-V2模型的主要創新點有兩個,一是透過MLA(多頭潛在注意力)架構有效地降低了KV快取(Transformer模型在自迴歸解碼過程中使用的一種最佳化技術)的開銷,因為大語言模型對於記憶體頻寬和容量的要求很高,一旦能夠降低KV快取,可以給算力平臺帶來很大幫助;二是DeepSeek釋出的MoE(混合專家)模型,對傳統MoE架構進行了最佳化改造,這個架構可以讓一個(引數)更大的模型在資源有限的情況下被使用。
當時,此芯科技很快適配了V2模型的light版本,即16B大小的模型。“雖然16B引數看起來也很大,但實際執行時,它只會啟用2.4B引數。我們覺得這樣的模型非常適合在端側執行,此芯科技的P1晶片也可以給2.4B引數規模的模型提供比較好的支援。”周杰告訴《中國企業家》。
周杰  來源:受訪者
對於此芯科技如何“接入”DeepSeek,周杰解釋道:“使用者現在使用DeepSeek等應用,很多需要呼叫雲端的算力,相當於DeepSeek自己的資料中心或雲廠商,提供了一些API給終端側應用呼叫,使用者使用DeepSeek APP時,就可以呼叫雲端的AI能力。但是部分端側場景可能對資料隱私等方面有很高的要求,這種情況下就需要在本地進行運算,在端側部署後,使用者可以在斷網的情況下執行DeepSeek等模型。”
從算力和系統層面滿足了執行一個大語言模型的基本要求後,此芯科技就可以結合客戶專案的實際需求,跟DeepSeek等模型廠商進行商業化合作,對模型進行微調最佳化,把具體專案落地。
V2推出後,清程極智內部也嘗試接入該模型,但當時的市場需求較少,他們就沒有推廣使用。今年R1出來後,他們覺得這是一個非常好的機會,決定接入DeepSeek並大規模向客戶推廣。
清程極智是做系統軟體的對外基於系統軟體提供推理服務,因此不是像部分應用公司那樣直接接入DeepSeek的API,而是為客戶提供一套專屬的DeepSeek的API用於應用服務。“我們接入的方式是把DeepSeek的開源模型下載下來,在我們的算力系統上用系統軟體把服務部署起來。”湯雄超說。
通俗來講,R1模型是一個幾百G大小的檔案,但下載後無法直接使用。“它只是一個檔案,不是一個可用的服務,我們要做的是把這個模型執行起來,讓它去對外提供服務的介面。透過API的服務介面,使用者就可以跟模型進行對話了。”湯雄超解釋道。
基於前期技術積累,清程極智在把模型檔案下載下來後,一天內就迭代出了第一個版本,隨後針對R1模型結構進行了最佳化,正式“滿血版”官宣上線只用了一週。
在湯雄超看來,技術環節的工作都比較順利,接入DeepSeek後,更多的挑戰來自於商務側或市場側。具體來說,DeepSeek的流量給公司帶來了非常多來諮詢的客戶,但每個客戶的需求都不太一樣。“包括算力平臺、晶片型號、伺服器規格等都不一樣,我們需要針對不同的算力等基礎,做針對性的調優。”湯雄超說。

API成本降低推動大模型普及

在2024年5月釋出V2模型後,因其極致價效比,DeepSeek獲得“AI界拼多多”的稱號,並帶動國內大廠打起了大模型價格戰。
價格戰降低了API費用。以美圖“AI商品圖”為例,在郭晨暉看來,一方面,美圖在AI影像處理上擁有強大技術優勢,而DeepSeek模型的接入帶來了使用者體驗和轉化的正向反饋,且大語言模型API的呼叫成本佔比很低,這與美圖的業務場景形成了很好的優勢互補,因此美圖也會加大對大語言模型應用的關注。
2月9日,DeepSeek停止了V3模型為期45天的優惠價格體驗期,API恢復原價,每百萬輸入tokens 0.5元(快取命中)/2元(快取未命中),每百萬輸出tokens 8元。R1的百萬tokens輸入價格(快取命中)為1元,百萬tokens輸入價格(快取未命中)為4元,輸出價格為16元。
但OpenAI官網顯示,GPT-4o的2.5美元/百萬輸入tokens,10美元/百萬輸出tokens;最新發布的GPT-4.5的百萬輸入/輸出tokens更是高達75美元/150美元,僅較GPT-4o就上漲了15~30倍。
在郭晨暉看來,一方面DeepSeek模型呼叫費用在美圖AI研投的整體成本佔比不高;另一方面,DeepSeek恢復原價後依然處於比較便宜的價格區間,且美圖接入DeepSeek後,在使用者轉化及反饋上是正向的,因此他們會加大在大語言模型方面的投入。
周杰也認為,DeepSeek的API價格比OpenAI低了很多倍,對於企業和使用者而言,買token的費用大大降低。在端側模型層面,現在一個3B的模型可能就能做到以前7B以上規模的模型效果,記憶體等成本也相對降低了。
“這是個軟硬體協同的過程。同樣的硬體條件下,現在相當於能實現以前更大引數規模的模型效果,或者要達到同樣的模型效果,對硬體的要求變低了。”周杰說。
3月初,持續五天的“DeepSeek開源周”結束後,DeepSeek團隊首次對外公佈了模型的最佳化技術細節、成本利潤率等關鍵資訊。按DeepSeek測算,其成本利潤率理論上能達到545%。
大模型成本的快速降低以及能力的提升,也帶來了to B和to C領域使用者的高速增長。湯雄超透露,現在有很多的中小企業會主動聯絡到他們,希望獲得基於R1模型的產品。

AI應用將加速爆發

百度創始人、董事長兼CEO李彥宏在《緊抓AI智慧體爆發元年機遇,推動新質生產力加快發展》一文中寫道,大模型的推理成本,每12個月就降低90%以上,遠超“摩爾定律”。隨著大模型技術的迭代和成本的直線下降,人工智慧應用將大爆發。
目前,AI市場處於高速增長階段,湯雄超認為,DeepSeek的理論利潤率高達545%,對於整個行業的意義和影響非常積極,給市場科普了算力系統軟體的重要性。
湯雄超  來源:受訪者
“過去大家並不是非常重視軟體的能力,DeepSeek讓大家認識到,花錢買軟體不是浪費錢,而是為了更好地省錢。”湯雄超表示,在受過教育的市場環境下,核心系統軟體的優勢能被更大地發揮出來;短期來看,DeepSeek的開源也能讓各方降低產品交付的商業成本。
隨著越來越多企業接入DeepSeek,在其開源生態上做“建設”反饋,DeepSeek的發展程序也在加速。
郭晨暉認為,這也是DeepSeek的開源生態最大的優勢——接入的企業在各自應用場景上打造差異化能力產品的同時,應用場景也能推動DeepSeek等基座大模型的發展。“各家公司在開源生態的差異化部署不僅能加速AI的創新,大模型的低成本化也有助於大模型在垂直細分領域的可用性,給AI的應用帶來更大的想象空間。”郭晨暉說。
在周杰看來,除了雲端應用爆發外,在DeepSeek的推動下,端側AI應用也會在2025年實現井噴式發展。
“未來的AI其實是一個混合式的人工智慧,不是所有的東西都在雲端跑,也不是所有東西都在端側跑,因為各有各的優勢。如端側只能跑相對小規模引數的模型,但對於某些任務來說,對精度有更高要求,還是要用雲端算力;而為了保證資料安全和隱私,就需要使用端側能力實現以前更大引數規模的模型效果,這就形成一個混合式的部署方案。”周杰說,此芯科技也在跟雲廠商進行這方面的應用探索。
“AI應用元年”已經不是一個新概念,但截至目前,AI行業從業者以及投資人,還在尋找更適合AI應用的落地場景。在周杰看來,這只是時間問題,“一個新生態的發展肯定需要一定時間,所有的東西不會突然完善,需要軟體和硬體不斷迭代。目前來看,晶片側、模型側等已經為AI的大規模應用打下了堅實的基礎,後面需要更多的開發者來開發AI應用,滿足實際的場景需求。”
新聞熱線&投稿郵箱:[email protected]
END
值班編輯:王怡潔審校:張格格  製作:袁茂麗
關注“中國企業家”影片號
看更多大佬觀點和幕後故事
[ 推薦閱讀 ]


相關文章