2月27日,DeepSeek一次性開源了兩個工具和一個數據集,分別是DualPipe、EPLB(專家並行負載均衡器)以及訓練和推理框架的效能分析資料。此外,DeepSeek還在Github上詳細講解了DeepSeek-V3和R1模型背後的平行計算最佳化技術。

圖片來源:X
據介紹,DualPipe是一種用於V3和R1訓練中計算與通訊重疊的雙向流水線並行演算法。DeepSeek-V3就首次使用了該方法。與傳統的1F1B(交替執行前向和後向傳播)和ZB1P(零氣泡單向流水線)方法相比,DualPipe大幅減少了流水線氣泡,同時僅增加了1倍的啟用記憶體峰值。

圖片來源:Github
值得一提的是,在GitHub網站上的DualPipe專案介紹中,DeepSeek創始人梁文鋒在開發者之列。
EPLB是為V3和R1打造的專家並行負載平衡器,針對混合專家(MoE)模型的分散式訓練和推理設計。在傳統的MoE模型中,專家負載的不平衡會導致計算資源的浪費,尤其是在專家並行(EP)的場景下,這種不平衡會進一步加劇通訊開銷。而EPLB透過動態調整每個專家的負載,確保在訓練過程中專家之間的負載保持平衡。
而公佈訓練和推理框架的分析資料是為了幫助社群更好地瞭解通訊計算重疊策略和底層實現細節。
不過,對於非專業人士,這些密密麻麻的專業術語,著實讓人頭疼。每經小編也忍不住想說,“聽君一席話,如聽一席話。”
還好我們有DeepSeek!
每經小編現在就讓DeepSeek-R1模型用生活場景中的示例,把此次開源的三個專案講得明明白白、清清楚楚、透透徹徹!

美東時間週三(北京時間2月27日凌晨)美股盤後,“宇宙最重要財報”來襲。這份財報也是今年1月末DeepSeek橫空出世後,英偉達公佈的首份財報。
英偉達披露的最新財報顯示,2025財年第四財季實現營收393.31億美元,同比大幅增長78%,高於市場預期的380.5億美元。在業績指引方面,英偉達預期2026財年第一財季的營收將達到430億美元,上下浮動2%,高於市場預期的417.8億美元。
英偉達CEO黃仁勳在財報中表示,市場對Blackwell晶片的需求令人驚歎,因為推理AI增加了另一種擴充套件法則——增加訓練的計算能力使模型更智慧,而長時間思考的額外算力使答案更智慧。
稍後,黃仁勳在分析師電話會議上表示,“像OpenAI的o3、DeepSeek-R1、Grok 3等模型正是採用了推理時擴充套件方法的推理模型,其計算資源消耗是(普通模型的)百倍甚至更多。未來,推理模型的計算需求將會更高。”
黃仁勳還不忘點贊DeepSeek,稱其是一項出色的創新,點燃了全球的熱情。更重要的是,DeepSeek開源了世界級的AI推理模型。
有評論稱,儘管英偉達的這份財報在一定程度上緩解了市場擔憂情緒,但投資者還是覺得英偉達業績帶來的驚喜不夠大。
那麼,我們要如何解讀英偉達的最新財報呢?英偉達的業績又面臨著哪些壓力?
針對上述問題,我們讓一直努力“榨乾”英偉達GPU的“源神”DeepSeek親自來回答一下。

不得不說
DeepSeek解讀得相當專業
要是再分析分析“黃仁勳皮衣銷量是否同步增長”
那不妥妥“財報界單口相聲”!
But!
“伺服器繁忙,請稍後再試”
真的很讓人頭大!
還好每日經濟新聞App火速前來“救場”
最近,每經App接入了DeepSeek
響應速度快到飛起,使用起來非常絲滑!
不管是問公司、問投資、問基金,還是自由對話,都輕鬆拿捏!
目前使用量已經超15萬次了!
咋用呢?超簡單!
先下載每日經濟新聞App
再往下看
↓
一、在每日經濟新聞App首頁,點選“DeepSeek”圖示或首頁輪播圖“自由問+問公司問投資問基金免費使用DeepSeek、Kimi、豆包等六款大模型”。

二、進入“每經大模型平臺”頁面,即可使用DeepSeek、Kimi、豆包、智譜清言、文心一言和通義千問6款大模型中任意一款。

最近,每經“136計劃”還增加了新功能:
大模型解讀投資熱榜。

只需點選投資熱榜中的任意新聞
立即就能得到大模型的全面分析
還能一鍵生成圖片分享給朋友。


告別“伺服器繁忙”
快用每日經濟新聞App吧!
免責宣告:本文內容與資料僅供參考,不構成投資建議,使用前請核實。據此操作,風險自擔。
記者|宋欣悅
編輯|陳柯名 蘭素英 王嘉琦
校對|金冥羽

|每日經濟新聞 nbdnews 原創文章|
未經許可禁止轉載、摘編、複製及映象等使用
如需轉載請向本公眾號後臺申請並獲得授權
推薦閱讀↓
