DeepSeek成了熱門概念,握住它,彷彿就掌握了財富之門的金鑰。
騰訊、百度等大公司目前都已接入了DeepSeek的R1模型。2月中旬,得益於DeepSeek概念,騰訊股價一度漲超6%,達到506港元,創下近三年的新高。另一些伺服器和初創公司也藉此造勢,或出售一體機,或售賣token,發了一筆熱財。
一時間,追隨者如過江之鯽,DeepSeek成了“寬門”,人人都希望透過它來掘金。但偏偏有人例外,要過“窄門”,不跟著DeepSeek的節奏走。
3月1日,一家名為潞晨科技的AI Infra初創公司釋出公告,“潞晨雲將在一週後停止提供DeepSeek API服務,請儘快用完您的餘額。如果沒用完,我們全額退款。”這個公告距離它在2月4日上線這項業務還不足一個月。
快速接入,而後快速停止,根源是售賣DeepSeek等開源模型API token的MaaS業務模式帶來了虧損。
2月9日,潞晨科技創始人尤洋在微博上“掰指頭”算賬,阿里雲、百度雲、騰訊雲等內卷低價或免費提供服務,滿血版的DeepSeek-R1每百萬token官方也只能收到16元,如果滿血版的DeepSeek-R1每日輸出1000億token,每月收入約為4500萬元,但每月的機器成本是4.5億元,虧損4億元!使用者越多,虧損越多,尤洋得出結論,MaaS(Model as a Service)在中國短時間內可能是最差的商業模式。
這種觀點引發了熱議。在知乎上,尤洋給出自己的算賬過程,但一部分網友認為他將問題無限拔高,直言其否定了DeepSeek。
3月1日中午,DeepSeek在知乎發表的一篇名為《DeepSeek-V3/R1推理系統概覽》的文章提到,理論上一天的總收入為56萬美元,成本利潤率 545%。
但尤洋仍堅持自己的觀點,並列舉了三大理由:1.測試速度和實際場景的差距;2.機器利用率峰值和波谷的巨大差距;3.機器的不穩定性。他感嘆,有點不太想深入討論,因為很多人甚至想當然地把“DeepSeek不虧錢”當成一種不能撼動的真理。
3月1日下午,潞晨科技宣佈暫停DeepSeek API服務。
3月底和4月底,《中國企業家》兩次採訪尤洋。他是一位90後,戴著眼鏡,身材瘦削,不善言談,與他在網路上“火力全出”的形象截然不同。
事實上,尤洋要穿過三重“窄門”,一個是大家都在擁抱售賣DeepSeek等開源模型的API服務,但尤洋拒絕;另一個則是他堅定選擇與華為昇騰等國產算力廠商合作,大部分人還在等待美國政府對英偉達H20晶片的寬限令;最後,他押注影片大模型,這與文字模型的熱鬧形成了反差。
“影片大模型是AI時代的相機。”尤洋說,潞晨開源的影片模型Open-Sora 2.0,近期榮登GitHub Trending全球開源熱度榜單第一,以此為基礎的AI影片生成平臺Video Ocean,僅需使用者提供一句話描述,即可線上生成高質量動態影片,釋出後登上Product Hunt全球產品熱度榜單第一。
尤洋履歷頗豐,本科畢業後,他先在清華大學攻讀碩士研究生,後赴美國加州大學伯克利分校深造,獲得博士學位後,任新加坡國立大學高效能人工智慧實驗室主任、校長青年教授;2021年,尤洋受投資人邀請,在北京創立了潞晨科技,迄今已獲得創新工場、真格基金、紅杉中國、藍馳創投、北京市AI產業投資基金等投資機構的數輪融資。
目前,潞晨科技在北京和新加坡等地有近80人的團隊,根據2024年披露的資料,該公司合同營收7700萬元人民幣,賬面上有能滿足30個月開支的現金流。
放棄DeepSeek API服務,最主要原因是虧損
《中國企業家》:你們在2月和3月遭遇的網路風波,現在已經過去了嗎?
尤洋:對我們來說,其實一直沒有什麼影響,我個人也沒有去與DeepSeek對立的想法。
《中國企業家》:現在外界對技術與商業模式的討論,各種各樣的說法都有。
尤洋:在知乎上或者其他地方攻擊我的那些人,我敢負責任地說,這些人裡99%從來沒有用300多張卡去真正部署過DeepSeek,甚至沒用100張卡部署過。僅去跟風想象一件事情,和實際動手驗證,得到的觀察是截然不同的。
我確實親手驗證過這件事情,如果是業界專家看,我的觀點跟DeepSeek釋出的資料,是沒有任何衝突的。
《中國企業家》:但DeepSeek說自己的成本利潤率是545%,而你在微博上說MaaS模式下,毛利率是-700%。
尤洋:首先,DeepSeek原文中說了,這是理論數字。沒有考慮使用者的體驗和商業服務的可用性保障,並且他把那些APP以及網頁和MaaS上的token都加在一起計算了收入,但顯然很多是大家可以免費使用的。
春節的時候,我感覺DeepSeek的熱度有點過於瘋狂了。它還在非理性市場,一旦變得市場化,需求側變得不穩定和高要求,那麼它的測算還會有非常大的波動。
《中國企業家》:您微博上所說的資料,比方說收入4500萬元,機器成本3.6億元,毛利率-700%,這個結論是你們自己跑出來的?
尤洋:根據微博上另一位博主在AMD機器上的實測換算得到。補充一個例子,Hugging Face中國區的一位資深專家在朋友圈發圖,他把卡的效能發揮到極致,燒了一下午的token,也沒有燒夠100萬個,當然他用的卡可能是低配版。考慮到服務全國使用者,可能全國有5000萬人在用,大多數人每天可能就用一兩個小時。但因為我們不能準確預測哪些使用者要用多少,什麼時候用,同時為了容納高峰保障MaaS服務的商業穩定,機器要能容納最高峰,低谷還是得放著,成本還是高峰那麼多。
我的算力不管是租還是自建,算力成本都是隨時間穩定產生的,推理與訓練需求的伺服器也不一樣,這得放多少伺服器,可能需要數萬臺H20等推理伺服器時刻運轉。比如大家不能接受微信在高峰時段不可用和三天兩頭崩掉。類似的,作為MaaS供應商,下游商業應用和C端使用者也需要有體驗和服務的可用性保障。
尤洋:賺還是虧,核心的指標就是一臺GPU每秒能出多少token,以及對應的成本。比如它究竟是一秒鐘輸出了1000個token還是10000個token,因為它最終是按照token的價格去賣的。
來源:AI生成
《中國企業家》:公司在2月初上線了DeepSeek的API服務,但經過一個月的嘗試,決定不做這個業務,這是為什麼?
尤洋:如果不嘗試的話,我感覺沒有發言權的。其他初創公司可能會覺得,前幾個月我燒一下,然後過幾個月再堅持一下,跑不通了,我再把它砍掉,但是我們可能就直接過了不到一個月的時間就把它砍掉了。
尤洋:有兩個原因,第一,我們海外的潞晨雲業務增長比較快,我們應該把資金投入到非常難得的增長機會里;第二,MaaS的商業模式還不太成熟就已陷入內卷,現在中國至少有50個雲廠商都在提供開源的DeepSeek模型API服務,它已經不是一個稀缺的東西了,現在部署起來也比較成熟,利潤空間非常有限。
根據IDC資料,TOP3公有云已佔據MaaS 85%市場份額,截至2024年底,MaaS全國用量10000億token/天。以較貴的DeepSeek-V3刊例價計算,該業務全國全年市場總計營收期望值為:10000億token/天×8元/百萬token×365天=29.2億元。但實際上,為搶佔市場,有大量免費和低價token,不計成本惡性競爭,遠達不到上述營收期望。
《中國企業家》:公司公告裡也說了“暫停”,你也說MaaS暫時是中國最差的商業模式,什麼時候會再次嘗試?
尤洋:我們非常靈活,只要它符合市場,並且能產生一定的利潤,不管用何種方式,只要它能產生健康的利潤,我覺得應該去做。
《中國企業家》:初創公司很少提利潤,一般都是先做規模,擴大市場份額。
尤洋:可能不一定公司需要盈利,但是至少這個生意邏輯應該是跑得通的,我的單位經濟模型到底是什麼?長期來看,它如何產生價值,我覺得產生利潤就是一個企業應該追求的東西。
《中國企業家》:作為一個創業者,你怎麼看Kimi和DeepSeek這樣的明星公司?
尤洋:我感覺都有點可遇而不可求。根據楊植麟的自述,在2023年但凡晚個幾周,他可能就達不到他今天的壯舉,他的融資視窗只有一個月,當然,他本身也有張予彤(前金沙江創投主管合夥人)的加持,這種機會難得,可遇而不可求,DeepSeek背後的幻方量化資金非常雄厚,較早就有萬卡叢集了。
這兩者的情況其實不像是創業,他們本身就已經家大業大了,更像在運營一個阿里或者谷歌的研發中心,而不是一般創業者的模式。
《中國企業家》:MaaS模式之下,就沒有獲益的公司?
尤洋:MaaS對OpenAI來說是一個很好的商業模式。我始終覺得AI最終應該形成兩三家企業,兩三家有絕對實力的企業進行必然(適度)的壟斷,而不是一家。比如中國有三家,這三家的模型非常好,它可以像OpenAI那樣去閉源,做成MaaS並獲得合理收益。
現在MaaS商業模式之所以不好,是因為大都使用開源模型或者沒有拉開差距的閉源模型,各家沒有本質不同,為了搶佔市場,只能打價格戰和免費惡性競爭,但成本是根據GPU固定產生的。
《中國企業家》:你在微博上引用紅杉資本合夥人周逵的話,尋找“難而正確的事”並沉下心來去做,什麼是正確的事?
尤洋:但凡是高價值的東西,肯定會有很多人想去做。因為它有高價值,肯定也不會那麼簡單,首先每個人都選一個自己相信的點,比如我相信未來就是算力平臺,加上影片大模型,這兩個生意是有光明前景的。
《中國企業家》:潞晨的商業模式是什麼?
尤洋:第一,幫助企業去做自己的AI大模型,比如企業自有模型、行業模型,我們面向一些中小型客戶以及傳統客戶,在海外就是潞晨雲,國內就是一體機,這是我們一直在做的事情;第二,我們最近特別關注影片大模型,影片大模型未來就是AI的相機。
《中國企業家》:影片大模型為什麼是未來的機會?
尤洋:影片大模型是未來三年少有的持續增長的市場,關鍵是影片大模型它有兩點,第一,它對算力的需求最佳化極高,一個很小的影片可能都有幾百萬token,影片大模型未來的三五年核心就是算力最佳化,這是最重要的事情。
來源:AI生成
第二,影片大模型產品形態很有可能會變成一個算力最佳化的工作,它跟大語言模型的核心區別是,大語言模型是需要即時互動的,比如說我用ChatGPT或者DeepSeek,如果我問它一個問題,它過兩三分鐘才回復,甚至超過20秒回覆,我就沒有耐心了。
但影片大模型我提交一個任務,比如,我讓它生成一個電影,生成一個短影片,我是可以等的。
《中國企業家》:影片模型的生意本質還是MaaS模式。
尤洋:對,但它的MaaS商業上比較友好,即便使用者同時擠過來,可以佇列式處理請求。
《中國企業家》:在雲上,訓練一箇中小企業自己專屬的模型的話,大概成本是多少錢?
尤洋:大概是3萬元/月,當然有的可能需求高一點也可以,也有些企業花了幾百萬。在海外,我們大概每月有100萬美元的收入。
《中國企業家》:有廠商已經把一體機的價格賣到了14萬元左右,你們的一體機價格在數百萬元,差別是什麼?
尤洋:如果只是買10萬元的一體機的話,它跑DeepSeek-R1-671B引數效率不是最高的,也不會有太好的實際意義。其實他們很多是套殼KTransformers這個開源專案。簡單做個性價比核算:硬體10萬元,Q4量化(一種壓縮模型的技術)的殘血DeepSeek-R1/V3模型輸出能力10token/s,只能供1個使用者使用,每月滿載理論輸出能力26M token;而從雲廠買等量未閹割滿血模型的API token價值一兩百塊,還有免費額度和按量折扣。100多萬元的一體機可以服務高精度高併發的商業需求和簡單私有模型微調開發,顯然實用很多。
我們還做了Colossal-AI開源,這是全亞洲最大的大模型訓練推理的平臺系統,僅就開發工具而言,我們在最佳化方面積累還是非常深的,收穫了5個世界500強客戶。
華為是個大機會
《中國企業家》:現在你們焦慮嗎?畢竟H20受限了。
尤洋:還好,國內沒有H20的話,我們就做國產晶片,華為昇騰等國產算力發展得很快。
《中國企業家》:我看到國外媒體說華為要發新的晶片910C,你們會覺得有差別嗎?會對你們的成本結構有什麼影響?
尤洋:差別不大,我們就是想選一個市場上能買到的最好和最受歡迎的機器,基於它去做最佳化。其實我覺得對我們是更有利的。因為假定國產晶片可能暫時落後英偉達晶片的話,我們其實有更多最佳化空間可以做。
《中國企業家》:你在微博上也說,華為的晶片最佳化不可能靠1~2家小公司搞定。
尤洋:華為有幾千人的團隊與晶片業務相關,華為的晶片肯定是有中流砥柱的作用。我覺得再配合幾十家、上百家公司去協同華為生態,這樣比較靠譜,肯定不能靠一兩家小公司去把這個事情做好。
《中國企業家》:目前,國產晶片相較於英偉達晶片,主要差距在哪裡?
尤洋:一張英偉達晶片賣多少錢,一張國產晶片賣多少錢,受限於生產晶片的成本和暫時的技術限制,所以(國內)生產同樣效能的晶片成本就高很多,導致必須得這樣定價,定價又導致研發速度跟不上英偉達。
來源:AI生成
比如說同樣花了1萬塊錢,英偉達能每分鐘出10萬個token,國產晶片只能出3萬或者2萬個token。我覺得華為等已經做得很好了,只不過英偉達積累的時間更長,做了20多年了,飯得一口一口吃。
《中國企業家》:在國產晶片上做最佳化和加速的難點是什麼?
尤洋:大模型層,首先DeepSeek的難點是,國產晶片沒那麼穩定,它的周邊配套也不是特別好,國產晶片很多運算元缺失,精度、編譯器、叢集等又經常出bug,導致使用它開發比較困難,總體上,肯定不是一個晶片本身跑分高低的問題。
這相當於我有一個賽車,它的設計理論速度,比如說250公里每小時,但是我可能要精心嘗試跑100次才能跑出一個這樣的速度,它還沒那麼穩定。
《中國企業家》:對於AI Infra企業來說,是模型進化更重要還是加速更重要?
尤洋:其實兩者並不矛盾,模型的進化能帶動需求的旺盛,進一步帶動對開發、應用模型的信心和投入,提升對訓推加速、算力的需求,進而加速模型進化。
《中國企業家》:如果你有機會去見到DeepSeek的梁文鋒,你會和他討論什麼問題?
尤洋:其實我最關心的是,他到底是想做一個成功的商業化公司,還是想透過一些其他手段做一些非盈利的事情?想知道一下,他的目標到底是什麼,因為兩者肯定差距是非常大的。比如說OpenAI可能還是想做一個Google那樣非常高價值的商業化公司,我不知道梁文鋒是不是想做中國AI版的谷歌。
。END。
值班編輯:王怡潔 審校:張格格 製作:姜辰雨