DeepSeek公開成本利潤率545%/中國兩AI公司CEO互撕抄襲/AI.com域名要價7億|HuntGood週報

歡迎收看最新一期的 Hunt Good 週報!
在本期內容你會看到:
8 條新鮮

資訊

4 個有用

工具

1 個有趣

案例

3 個鮮明

觀點

閱讀週報之前 ,APPSO 想先分享一首歌,希望大家在音樂的陪伴中享受閱讀 🎶
無論 AI 如何強大,有些美好的回憶只有人才能創造。
Hunt for News|先進頭條
✊ 成本利潤率 545%,DeepSeek 首次公開
當人們以為 DeepSeek 開源周已經結束,昨日 DeepSeek 又掏出了 One More Thing ,首次披露了其模型推理系統的成本利潤率:545%。
據悉,DeepSeek 在保證服務質量的同時,實現了極高的成本效益:
硬體配置:所有服務使用 H800 GPU,保持與訓練一致的 FP8/BF16 精度
動態資源排程:根據白天/夜間負載差異動態調整節點數量,最大化資源利用率
成本資料:24 小時內平均使用 226.75 個節點(每節點 8 個 H800),成本約 $87,072/天
吞吐能力:每臺 H800 的 prefill 吞吐約 73.7k tokens/s,decode 吞吐約 14.8k tokens/s
官方表示,以上統計包括了網頁、APP 和 API 的所有負載。
如果所有 tokens 全部按照 DeepSeek R1 的定價計算,理論上一天的總收入為 $562,027,成本利潤率 545%。
當然我們實際上沒有這麼多收入,因為 V3 的定價更低,同時收費服務只佔了一部分,另外夜間還會有折扣。
🔗 

https://mp.weixin.qq.com/s/dEEfMQgDK7y17yVjh6zblA

✊ 矽基流動和潞晨科技兩家創始人公開互懟
近日,潞晨科技 CEO 尤洋表示,滿血版 DeepSeek-R1 每百萬 token(輸出)定價 16 元,如果每日輸出 1000 億 token,需要約 4000 臺搭載 H800 的機器,以目前 H800 的市價或者折舊來計算,每月僅機器成本就達 4.5 億元,因此企業方可能面臨每月 4 億元的虧損。「使用者越多,虧損越多。」
而在昨日,DeepSeek 首次在知乎公開了相關營收和利潤資料,稱在所有負載情況下,如果按照 DeepSeek R1 的定價計算,理論上一天總收入為 56.2 萬美元,成本利潤率高達 545%。
對此,尤洋發文回應 DeepSeek 公佈的理論成本利潤率。
隨後,他也在知乎發文《坑人的矽基流動》,直指矽基流動創始人袁進輝「頻繁在朋友圈陰陽他」,並稱「矽基流動疑似組織水軍長期黑我」。
尤洋在文中分析了矽基流動網站訪問量大增的原因,認為主要得益於春節期間綁上國產晶片的宣傳效果和邀請碼送代金券的拉人頭傳播。他質疑矽基流動的代金券承諾與實際現金流之間存在巨大缺口,並對其 API 效能表示懷疑。
袁進輝迅速在朋友圈回應,為自家團隊春節期間的努力辯護,強調「提供穩定服務」無可厚非,並反擊稱矽基流動曾被潞晨科技抄襲。
針對抄襲指控,尤洋回應稱,實施抄襲的是潞晨科技前 CTO,該人士已離職並加入了袁進輝的公司。隨後袁進輝轉發了去年橘皮優團隊對潞晨科技的指控文章,稱潞晨科技「不是一次抄襲,而是多次發生」。
爭論進一步擴大,被指為抄襲總負責人的潞晨科技前 CTO 方佳瑞也加入論戰,稱自己是被尤洋「甩鍋」,抄襲的程式碼與他無關,並透露自己是因質疑「詐騙式期權協議」而被趕走。
並且,袁進輝回應稱,「(潞晨)CTO 沒加入我們公司,之前加入的是光年之外,後來加入其他大公司了。而且都是他自己犯錯甩鍋給別人,不是別人的問題。」
到了今天凌晨,尤洋發文致歉稱:
本人昨天情緒太沖動,說了一些讓人誤解 deepseek infrastructure 團隊的話。deepseek infrastructure 團隊技術一流並給開源社群做出巨大貢獻。本人誠摯道歉,已經刪除不當表述,感謝大家提醒。
💰 AI.com 域名出售,要價 1 億美元
據 The Information 報道,資深域名經紀人拉里·菲舍爾正在幫僱主尋求出售備受矚目的域名 AI.com,報價高達 1 億美元(摺合人民幣 7 億元)。
據悉,62 歲的菲舍爾已有近 30 年域名交易經驗,曾促成多筆高價域名交易,包括將 Messenger.com 賣給Facebook、Skincare.com 賣給歐萊雅、Teams.com 賣給微軟以及將 Chat.com 賣給 HubSpot 聯合創始人達梅什·沙阿(後者隨即將其轉售給 OpenAI)。
「如果有人想出售頂級域名,他們會找我,」菲舍爾在紐約一家義大利餐廳接受採訪時表示,「我有獲取最好價格的聲譽。」目前 AI.com 域名的所有者保持匿名,僅透露當初購買該域名是因為與自己的縮寫相符,而非看好 AI 的發展。
菲舍爾認為 OpenAI、微軟、Google 和 Meta 等科技巨頭或加密貨幣富豪都可能是潛在買家。值得注意的是,目前已知最高域名交易記錄為 MicroStrategy 公司 2019 年以 3000 萬美元出售的 Voice.com。
菲舍爾表示,他將從本週末開始接受 AI.com 的報價。
🔗 https://www.theinformation.com/articles/ai-com-is-for-sale-asking-price-100-million?rc=a4cwro
👏 DeepSeek 開源五連發
過去一週,DeepSeek 上演了「開源五連擊」。
覆蓋計算、通訊、儲存、演算法與模型的協同創新,中國 AI 力量正在用開源精神,把曾經需要天價算力的技術,變得人人可用。👇🏻
DeepSeek 開源周 APPSO 系列專題連結直達:
Day 1️⃣:搞懂 FlashMLA,這些細節要注意
Day 2️⃣:降本增效神器,榨乾每一塊 GPU
Day 3️⃣:300 行程式碼揭示 V3/R1 推理效率
Day 4️⃣:梁文鋒親自寫的程式碼長什麼樣?
Day 5️⃣:開源周最後一天,重塑 AI 訓練底層邏輯
另外,2 月 25 日,據路透社援引三位知情人士的訊息稱,DeepSeek 正在加速推出 1 月釋出的 R1 模型升級版—DeepSeek R2。
其中兩位知情人士表示,DeepSeek 原計劃在 5 月初發布 R2,但現在希望儘早推出,具體時間尚未透露。該公司表示,希望新模型在程式設計能力上表現更佳,並能夠支援英語以外的多種語言進行推理。
🔗 https://www.reuters.com/technology/artificial-intelligence/deepseek-rushes-launch-new-ai-model-china-goes-all-2025-02-25/
🗓️ 文心大模型 4.5 官宣 3 月中上線
百度發文宣佈,旗下文心大模型 4.5 將在 3 月 16 日正式上線。
百度表示,文心大模型 4.5 不僅在基礎模型能力上有大幅提升,且具備原生多模態、深度思考等能力。本月早些時候,百度曾發文稱,文心大模型 4.5 將在今年 6 月 30 日起正式開源;同時其還宣佈,文心一言將於 4 月 1 日 0 時起,全面免費,所有 PC 端和 APP 端使用者均可體驗文心繫列最新模型。
此外,百度 CEO 李彥宏也在近期的一次財報電話會議中透露,文心大模型 4.5 將會是百度最好的模型,並且其也轉變了「模型發展應該保持閉源」的態度,表示從 DeepSeek 的成功中知道了開源的優勢。
🔗 https://mp.weixin.qq.com/s/fErfpPI5opivfBQpj-151Q
♟️ 圍棋手因比賽使用 AI 作弊被撤銷段位並禁賽
近日,據中國圍棋協會發布通報顯示,2024 年 12 月 15 日,職業棋手秦思玥在參加全國圍棋錦標賽(個人)女子組第九輪比賽時,被裁判賽中例行抽檢發現攜帶手機,並在手機上使用人工智慧程式。
通報稱,經檢視當日賽場影片,聽取現場裁判、棋手、工作人員證言,證實秦思玥當天凌晨進入賽場藏匿手機與在比賽過程中作弊,藐視賽場紀律,被詢問有關事即時存在隱瞞行為,情節嚴重。
中國圍棋協會表示,根據《中國圍棋協會紀律準則和處罰規定》等相關規定,綜合考慮違規事實情節及本人態度,經協會紀律與道德工作委員會研究決定,對秦思玥處以撤銷職業段位、取消 2024 年全國圍棋錦標賽(個人)成績的處罰,禁止其參加中國圍棋協會及會員單位組織或授權組織的所有圍棋賽事和活動 8 年。
據悉,秦思玥出生於 2006 年,目前 19 週歲,其在 2020 年透過全國圍棋定段賽晉級為職業圍棋初段,此後在 2024 年升級為職業圍棋二段。
🔗 https://mp.weixin.qq.com/s/a0T8–8q6z89LZGiwZtzhA
📹 OpenAI 計劃將 Sora 整合進 ChatGPT
據 TechCrunch 報道,OpenAI 計劃將 Sora 直接整合到 ChatGPT 中。
目前,Sora 僅透過單獨網頁提供服務。Sora 產品負責人 Rohan Sahai 表示,OpenAI 正積極研究如何在 ChatGPT 中引入 Sora功 能,將兩款產品結合起來,但未提供具體時間表。
他指出,最終整合到 ChatGPT 中的 Sora 版本可能不會提供與獨立網頁應用相同的編輯和拼接功能。
此外,OpenAI 還在擴充套件 Sora 的功能範圍。自推出以來,公司已經增強了 Sora 的網路體驗,建立了更多方式讓使用者瀏覽社群生成的影片。Sahai 表示,OpenAI 有意為 Sora 開發獨立的移動應用,目前團隊正在積極招募移動開發工程師。
值得注意的是,OpenAI 還計劃將 Sora 的生成能力擴充套件到影像領域。
雖然 ChatGPT 已經支援由 DALL-E 3 模型提供的影像生成功能,但 Sora 驅動的影像生成器有望建立更加逼真的照片。另外,Sahai 透露 OpenAI 正在開發新版本的 Sora Turbo。
🔗 https://techcrunch.com/2025/02/28/openai-plans-to-bring-soras-video-generator-to-chatgpt/
💵 2000 億美元豪賭!Meta 正在商討建設 AI 資料中心
據 The Information 報道,Meta 正在籌劃建造一座 AI 資料中心園區,預計投資金額可能超過 2000 億美元,這將成為該公司迄今為止最大規模的專案,也將躋身全球最大資料中心之列。
這座尚未公開報道的新資料中心園區,其規模將是扎克伯格上個月提到的路易斯安那州 AI 資料中心的數倍之巨。雖然 Meta 曾表示路易斯安那州專案將耗資 100 億美元,但具體包含哪些元件尚不明確。
據瞭解,Meta 高管已向資料中心開發商表示,公司計劃在路易斯安那州、懷俄明州或德克薩斯州等地建設這一大型園區。本月,高階管理人員已前往考察潛在場地。
目前尚不清楚 Meta 是自行建設設施,還是與外部開發商簽約,或是與 Oracle 或 CoreWeave 等雲計算提供商合作建設和運營。Meta 既使用自己的資料中心,也從亞馬遜 AWS 和 Oracle 等雲提供商租用 AI 伺服器。
一位參與談判的人士透露,如果扎克伯格在未來改變主意,Meta 不一定需要全額承擔建設成本。大型資料中心交易通常分階段進行,所以 Meta 的協議可能給予其獨家權利,但並不強制繼續擴大專案規模。
Meta 可能需要簽署長期資料中心租約以確保園區使用權,但不需要承諾購買特定數量的 AI 晶片,而晶片採購是此類專案中最昂貴的部分。
儘管投入巨大,Meta 內部對於需要多少 AI 晶片來訓練和執行其 AI 尚未明確。
Instagram 負責人 Adam Mosseri 在本月給員工的一份備忘錄中表示:「我們可能需要比原先想象的多得多或少得多的計算能力來構建前沿模型。」
🔗 https://www.theinformation.com/articles/meta-discusses-200-billion-ai-data-center-project?rc=a4cwro
Hunt for Tools|先進工具
🤯 OpenAI 最大最貴的模型,GPT-4.5 釋出
近日,OpenAI 正式釋出旗下 GPT-4.5 模型。
API 價格方面,因 GPT-4.5 計算量極大,成本高昂,相較於 GPT-4o 價格有了較高上漲。
GPT-4.5 支援聯網搜尋,並能夠處理檔案和圖片上傳,還可以使用 Canvas 來進行寫作和程式設計。不過,目前 GPT-4.5 還不支援多模態功能,如語音模式、影片和螢幕共享。GPT-4.5 主要透過「無監督學習」(就是自己從大量資料中學習)變得更聰明,而不是像 OpenAI o1 或者 DeepSeek R1 那樣專注於推理能力。
簡單說,GPT-4.5 知道的更多,而 o1 系列更會思考。
API 價格方面,因 GPT-4.5 計算量極大,成本高昂,價格漲到了75 美元 / 百萬 tokens,是 GPT-4o 的 30 倍,更是 DeepSeek 的 280 倍。
Sam Altman 提到,GPT-4.5 不是推理型模型,不會在基準測試中碾壓其他模型。在目前曝出的實測中,效能的提升遠沒有價格大。
ChatGPT Pro 使用者已經可以用上 GPT-4.5(研究預覽版)了。下週,將會逐步開放給 Plus 和 Team 使用者;再下一週則是 Enterprise 和 Edu 使用者。
🔗 https://x.com/OpenAI/status/1895219591070261266
🏆 Kimi 新模型 k1.6 曝光,程式碼生成能力超越 o3-mini
月之暗面旗下 Kimi 的最新模型 k1.6 曝光。據全球動態基準測試平臺 LiveCodeBench 顯示,k1.6 登上測試榜榜首。
具體顯示,k1.6-high 在多項程式碼生成基準測試中超越 OpenAI o3-mini、o1 和通義 QwQ-Max 等多款模型。成績公佈後,月之暗面研究員 Flood Sung 在其個人社交賬號表示,榜單中的 k1.6 是一個基於 k1.5 持續訓練程式碼能力的特定版本,目前 k1.6 還在不斷訓練並提升效能。
此外,月之暗面創始人張予彤也在朋友圈表示,k1.6 還沒有釋出,但看到 LiveCodeBench 的成績感到開心,期待智慧模型的持續進化。
🔗 https://x.com/test\_tm7873/status/1895039852762013996
🔹 微軟 Phi-4 家族成員上新
微軟近日推出了兩款全新的小型語言模型(SLM)—— Phi-4-multimodal 和 Phi-4-mini。
Phi-4-multimodal 是一個擁有 56 億引數的多模態模型,其最大特點是採用了「混合 LoRAs 技術」(Low-Rank Adaptations,低秩適應),能夠同時處理語音、視覺和文字資訊。
使用者可以在智慧手機、汽車等本地裝置上執行該模型,或者開發輕量級企業應用,如多語言金融服務應用等。
另一款新模型 Phi-4-mini 擁有 38 億引數,基於密集解碼器架構,支援處理長達 12.8 萬個標記的序列。
微軟表示,儘管體積小巧,該模型在文字任務方面的表現依然優於許多更大的模型,包括推理、數學、程式設計、指令跟隨和函式呼叫等能力。
在基準測試方面,Phi-4-multimodal 在語音問答任務上與 Gemini-2.0-Flash 和 GPT-4o-realtime-preview 相比存在一定差距。
不過,在數學和科學推理、光學字元識別(OCR)以及視覺科學推理方面,該模型的表現已超過了包括 Gemini-2.0-Flash Lite 和 Claude-3.5-Sonnet 在內的多款大模型。
🔗 https://azure.microsoft.com/en-us/blog/empowering-innovation-the-next-generation-of-the-phi-family/
👏 Claude 3.7 Sonnet 重磅釋出
近日,全球首個「混合 AI 推理模型」Claude 3.7 Sonnet 重磅釋出。
據瞭解,Claude 3.7 Sonnet 的獨特之處在於它將即時回答和深度思考的能力整合在同一個模型中。使用者可以自主選擇「推理」功能,讓 AI 進行短時間或長時間的深度思考。
一個模型,兩種思考。
Claude 3.7 Sonnet 已經向所有使用者和開發者推出,但只有付費購買 Anthropic 高階服務的使用者才能獲得完整的推理功能。免費使用者則可使用標準版 Claude 3.7 Sonnet。
在定價方面,Claude 3.7 Sonnet 每百萬輸入 token 收費 3 美元(約相當於處理 75 萬個單詞,比《指環王》全系列還多),每百萬輸出令牌收費 15 美元。
據《華爾街日報》最新報道,Anthropic 即將敲定一輪高達 35 億美元的融資,估值將達到 615 億美元。
多家知名投資機構正在洽談參與此輪融資,包括 Lightspeed Venture Partners、General Catalyst、Bessemer Venture Partners 以及來自阿布扎比的投資公司 MGX。
🔗 https://techcrunch.com/2025/02/24/anthropic-launches-a-new-ai-model-that-thinks-as-long-as-you-want/
Hunt for Fun | 先玩
🤯 不說人話,AI 有自己的通訊協議
隨著 AI 技術的普及,越來越多的 AI 開始執行撥打和接聽電話的任務。
在這種情況下,AI 之間不可避免地需要透過電話進行交流。然而,傳統的人類語言通訊方式在 AI 之間的對話中存在明顯缺陷,比如時間效率低下、語音生成的計算成本高昂,且容易出錯。
針對這些問題,由軟體工程師 Boris Starkov 和 Anton Pidkuiko 開發的 Gibberlink 提出了一種新思路——讓 AI 從語音級別轉移到聲音級別協議來相互通訊。
雖然人類可以聽到兩個 AI 開始使用人類聽不懂的「語言」進行溝通,但沒有專門裝置或軟體則無法理解其中包含的資訊。
這段影片也一度衝上各大平臺熱搜
Gibberlink 的核心工作原理建立在一套智慧識別機制上。
具體來說,當 AI 與人類交談時,它會堅持使用常規語音。當檢測到另一方也是 AI 代理時,會主動建議切換到聲音級協議,如果對方接受這一建議,雙方將切換到基於 GGWave 庫的聲音級協議進行通訊。
整個協議設計有標準化訊息格式和嚴格的資料交換結構,以最大程度降低誤解風險和潛在安全漏洞。
Gibberlink 帶來的好處有很多,比如透過避免語音生成環節,Gibberlink 減少了 90% 以上的計算成本,這對於大規模 AI 部署具有重要意義,以及相同資訊的傳遞時間最多可縮短 80 %,大大加快 AI 間的互動速度。
🔗 https://github.com/PennyroyalTea/gibberlink
Hunt for Insight|先知
🔍 Anthropic CEO:Claude 網頁搜尋即將到來
近日,Anthropic 公司 CEO Dario Amodei 接受《紐約時報》科技播客《Hard Fork》專訪,深入探討了該公司最新發布的 Claude 3.7 Sonnet 模型等話題。
「市場上許多其他推理模型主要是在數學和競賽程式設計上訓練的,但它們與現實世界或經濟中的任務相關性較低,」Amodei 解釋道,「我們訓練 Claude 3.7 更多地關注這些現實世界任務。」
在談到新模型的具體優勢時,Amodei 表示,Claude 3.7 Sonnet 在程式設計方面比之前的版本有了顯著提升,尤其在處理複雜指令和理解文件方面表現更為出色。
不過,目前 Claude 尚未具備訪問網際網路的能力,但 Amodei 透露「網頁搜尋即將到來」。
並且,他表示 Anthropic 目前正在開發「更大的基礎模型」,這些模型「需要更長的時間,有時需要很長時間才能做好」,暗示可能會有 Claude 4 系列在不久的將來推出。
Amodei 還預測有 70% 到 80% 的可能性,人類將在本十年結束前(可能是 2026 年或 2027 年)獲得「大量比人類在幾乎所有方面都聰明得多的 AI 系統」。
對於 AI 對就業市場的影響,Amodei 預計,短期內 AI 將提高程式設計師的生產力,但在 18 至 24 個月內,可能會開始替代一些低層次工作。
🔗 https://www.nytimes.com/2025/02/28/podcasts/hardfork-anthropic-dario-amodei.html
👀 微軟 CEO:我們過度炒作了AGI
近日,微軟 CEO 薩提亞·納德拉在一次播客採訪中,就最近問世的微軟 Majorana 1 量子晶片以及公司的未來技術發展方向,分享了一系列觀點。
納德拉表示,量子計算對探索密集型任務具有獨特優勢,它只需少量資料就能產出豐富成果。而「如果將量子技術與人工智慧結合,用量子計算來生成或合成數據,就能訓練出更優秀的AI模型,兩者應該結合使用。」
他認為超大規模市場不會出現贏家通吃的局面,因為企業級買家足夠聰明,會需要多個供應商。從微軟進入雲計算市場的經驗看,即使亞馬遜已佔據市場優勢,他們仍然成功打入了這個領域。
在談到備受關注的 AGI 話題時,納德拉表示:「我認為我們現在對 AGI 的概念過度炒作了。」他認為衡量 AGI 真正實現的標準——世界經濟能以 10% 的速度快速增長。
「如果將 AI 革命類比之前的工業革命,那也應該從生產力進步的角度評判結果。技術發展最大的贏家不會是科技公司,而是使用這些技術和資源突破生產力瓶頸的各行各業。」
對於微軟最新推出的 Majorana 1 量子晶片,納德拉解釋道,這是微軟 30 年研究歷程的重大突破。
他將其比作「電晶體時刻」,認為這款晶片將是第一款能容納一百萬量子位元的物理晶片。「這意味著我們現在甚至可以可靠地隱藏量子資訊,測量它,並且可以製造它。」
納德拉預計,到 2027 年或 2028 年,微軟可能製造出第一臺容錯量子計算機。
🔗 https://www.youtube.com/watch?v=4GLSzuYXh6w
🤯 OpenAI 首席研究官:未來的 GPT-5 可能會是「許多成果的集大成」。
近日,OpenAI 首席研究官 Mark Chen 接受專訪,詳細解讀了 GPT-4.5。
對於外界關注的命名問題,Mark Chen 表示,GPT-4.5 符合公司對「可預測擴充套件正規化」的命名規律。
從 GPT-3 到 GPT-3.5,再到 GPT-4,我們可以預測出訓練模型所需的計算量和效率提升能帶來什麼。這個新模型符合我們對「4.5」版本的預期。
他暗示,未來的 GPT-5 可能會是「許多成果的集大成」。
談及從 GPT-4 到 GPT-4.5 釋出間隔較長的原因,Chen 解釋道,這主要是因為 OpenAI 在過去一年半到兩年裡大力專注於開發推理正規化。「我們現在有兩個不同的擴充套件軸:一個是無監督學習,GPT-4.5 是這個軸上的最新實驗;另一個是推理。」
當被問及在當前規模下增加算力和資料是否仍能帶來同樣的回報時,Chen 堅定地表示:
「不,我們仍然看到同樣的回報。GPT-4.5 是無監督學習正規化的下一個點。我們根據之前訓練的所有模型預測效能,在這個案例中,整合了擴充套件機制,達到了下一個數量級的點。」
在談到與 DeepSeek 等競爭對手的差異時,Chen 表示,OpenAI 同樣重視模型效率最佳化。
讓模型高效服務與開發核心能力是相對獨立的。我們在推理堆疊上做了很多工作,也很重視以低成本服務使用者。自從推出 GPT-4 以來,成本已經下降了好幾個數量級。
他透露,OpenAI 在 GPT-4.5 中也探索了專家混合模型及其他架構改進,這些最佳化適用於 GPT-4、GPT-4.5 和推理模型的效率提升。
🔗 https://www.youtube.com/watch?v=pdfI9MuxWq8&t=591s&ab\_channel=AlexKantrowitz
彩蛋時間
作者:@gizakdag
工具:Midjourney
連結:https://x.com/gizakdag/status/1894821238314283240

我們正在招募夥伴
📮 簡歷投遞郵箱[email protected]
✉️ 郵件標題「姓名+崗位名稱」(請隨簡歷附上專案/作品或相關連結)

相關文章