1.【DeepSeek知乎發文,首次披露理論利潤率達545%】3月1日訊息,DeepSeek於知乎開設官方賬號,釋出《DeepSeek-V3/R1推理系統概覽》技術文章,首次公佈模型推理系統最佳化細節,並披露成本利潤率關鍵資訊。文章寫道:“DeepSeek-V3/R1推理系統的最佳化目標是:更大的吞吐,更低的延遲。”為實現這兩個目標,DeepSeek的方案是使用大規模跨節點專家並行(EP),但該方案也增加了系統複雜性。文章的主要內容就是關於如何使用EP增長批次大小(batch size)、隱藏傳輸耗時以及進行負載均衡。文章還率先披露了DeepSeek的理論成本和利潤率等關鍵資訊。“假定GPU租賃成本為2美金/小時,總成本為$87,072/天。……如果所有 tokens全部按照DeepSeek R1的定價計算,理論上一天的總收入為$562,027,成本利潤率545%。”(介面新聞)
2.【OpenAI擬將影片生成工具Sora整合進ChatGPT,並推出更強大Sora Turbo】3月1日訊息,OpenAI產品負責人Rohan Sahai昨日表示,計劃最終將其AI影片生成工具Sora直接整合進聊天機器人ChatGPT中。Sahai在會議中提到,OpenAI(此前)之所以將Sora作為獨立的網頁應用推出,是為了保持ChatGPT的簡潔性。Sahai透露,OpenAI“非常希望”能推出Sora的獨立移動應用,並表示Sora團隊正在尋找移動開發工程師。Sahai確認,OpenAI正在開發由Sora驅動的AI影像生成器,還補充道,正在研發Sora的升級版——Sora Turbo。(新浪財經)
3.【騰訊元寶釋出電腦版:支援“DeepSeek+混元”雙模型多端協同】3月1日下午訊息,騰訊AI助手“騰訊元寶”正式釋出電腦版,支援Windows和macOS系統。此次釋出的騰訊元寶電腦版面向工作和學習場景打造,旨在幫助使用者減輕負擔、提升效率。除具備與移動端和網頁版一致的核心功能外,電腦版後續還將推出更多便捷功能,如劃詞搜尋與翻譯、截圖提問等,進一步提升使用者體驗。在電腦版,使用者可以體驗到與手機端、網頁端相同的智慧對話能力。不僅能透過DeepSeek-R1滿血版和推理模型混元T1進行深度思考,也可以透過DeepSeek-V3和騰訊混元Turbo S快速獲得答案,滿足不同場景下的需求。結合公眾號等騰訊內容源與權威網際網路資訊,確保提供的答案時效性更強、可信度更高。(證券時報
)
4.【OpenAI GPT-6訓練規模將創歷史新高:預估10萬張H100 GPU,AI訓練成本達天文數字】3月1日訊息,OpenAI在GPT-4.5模型介紹影片的2分26秒處,OpenAI展示GPT 4.5功能的聊天記錄中,出現了“Num GPUs for GPT 6 Training”(訓練GPT-6所需的GPU數量)的字樣。雖然影片中未對此進行任何解釋,但“Num”可能暗示了一個前所未有的數字,該媒體推測高達10萬塊GPU。(IT之家)
更多AIGC資訊……
掃碼訂閱AIGC產業日報,
精選行業新聞,幫你省時間!👇

