Meta超級智慧團隊名單曝光,一半來自中國/OpenAI神秘模型上大分,GPT-5即將釋出|HuntGood週報

歡迎收看最新一期的 Hunt Good 週報
在本期內容你會看到:
10 條新鮮資訊3 個有用工具1 個有趣案例3 個鮮明觀點
Hunt for News|先進頭條
🧑‍💻 Meta 超級智慧團隊成員曝光,來自中國的 AI 人才佔一半
今天凌晨,風投公司 Menlo Ventures 的投資人、博主 @deedydas(Deedy)在社交媒體平臺公佈了 Meta 超級智慧團隊 44 名成員的詳細資料,該資訊據稱來自匿名 Meta 內部員工,並迅速引來了百萬網友的圍觀。

Deedy 透露:
50% 團隊成員為華人背景;
75% 擁有博士學位,70% 為研究人員;
人才來源高度集中於三家頂級 AI 實驗室:40% 來自 OpenAI,20% 來自 DeepMind,15% 來自 Scale AI;
20% 達到 Meta 內部 L8+ 級別(資深總監及以上);
75% 為第一代移民。
上下滑動檢視更多內容
Deedy 推測每位成員的年薪可能在 1000 萬至 1 億美元之間,涵蓋薪資、股票期權與長期激勵計劃。在 Deedy 釋出推文後,有網友戲稱應該將這份人事資訊整理成表格,納入 RL 訓練資料。
🔗 https://x.com/deedydas/status/1946597162068091177
💥 OpenAI o3-alpha 曝光,前端能力大提升,神秘新模型斬獲 IMO 2025 金牌
7 月 19 日,有網友曝出,OpenAI 正在內部測試名為「o3-alpha-responses-2025-07-17」的新模型。儘管該模型尚未正式釋出,但其驚人的前端程式碼生成能力已經引發廣泛熱議,甚至被不少開發者稱為目前「最強 AI 程式設計模型」。
該模型以「Anonymous-Chatbot」的身份在 WebDev Arena(一個前端開發測試競技場)首次現身。

不少網友透過關鍵詞提示發現,o3-alpha 在生成網頁、互動邏輯和動畫效果方面遠勝於現有頂尖模型,包括 OpenAI 自家的 o3、Anthropic 的 Claude Sonnet、Gemini 2.5 Pro 以及 xAI 的 Grok 4。
其中一位開發者 Peter Gostev 使用提示詞「用 Three.js 建立一個程式生成的星球」測試該模型,o3-alpha 給出的渲染質量與互動能力遠超其他模型。目前該模型疑似已下線,官方未回應其具體用途或釋出時間。

就在同一時間,OpenAI 官方宣佈,其全新推理模型在今年的國際數學奧林匹克競賽(IMO 2025)中取得重大突破:成功解出 6 道題中的 5 道,以 35 分拿下金牌成績,遠超以往任何 AI 模型。
OpenAI 聯合創始人 Greg Brockman、研究員 Alexander Wei 以及 Sam Altman 均發文慶祝,Altman 公開表示:「這是我們首次以通用語言模型參與 IMO,而不是形式化數學系統。這標誌著我們在通用智慧道路上的一次重大飛躍。」
Alexander Wei 透露,這款模型在與人類選手完全一致的考試條件下完成挑戰——兩場 4.5 小時的閉卷測試、無聯網、無輔助工具,僅憑自然語言寫出完整證明過程,並由三位 IMO 獎牌得主評審評分。
不過,這款模型不是 GPT-5,而是尚未公開命名的實驗性推理系統。
OpenAI 強調,IMO 所需的思維時間遠超現有評測基準,從 GSM8K(約 0.1 分鐘)、MATH(約 1 分鐘)、AIME(約 10 分鐘)逐級攀升至 IMO 的 100 分鐘級別。這種深度推理與持續創造性思維,過去被認為是語言模型難以跨越的障礙。
Altman 特別指出:「這是我們從建立 OpenAI 起的夢想之一,但那時我們並未認為它現實。它是 AI 在過去十年中取得進步的重要標誌。」Altman 表示,雖然 GPT-5 將在近期釋出,但這次奪得 IMO 金牌的模型是新研究技術的實驗成果,不會被立刻公開。
OpenAI 已在 GitHub 上放出該模型完整解答前五題的證明過程,供學術界研究和驗證。倉庫連結:https://github.com/aw31/openai-imo-2025-proofs
🔗 https://x.com/sama/status/1946569252296929727
🧍🏻‍♂️馬斯克預告 Grok 將推出 AI 男友
近日, xAI 的 AI 聊天機器人 Grok 上線了 AI 伴侶功能。而在昨日,馬斯克發文稱,將在該 AI 伴侶功能中新增第三個角色——AI 男友。
據馬斯克介紹,該名角色設定憂鬱、黑髮,其性格靈感源自《暮光之城》的愛德華・卡倫和《五十度灰》的克里斯蒂安・格雷。
目前,Grok 已上架了兩名角色:一位是哥特風的二次元少女 Ani,另一位是皮笑肉不笑的「壞男孩」Bad Rudi,均為完全 3D 的動畫角色,主要透過語音與使用者互動。目前這項服務僅向 SuperGrok 訂閱使用者(30 美元/月)開放。
在 AI 伴侶功能中,使用者可以獲得一種遊戲化、擬人化的情感陪伴體驗:可以和他們對話,養成式的升級,解鎖更多的互動內容。有網友分享,等級越高,Ani 越敢聊,甚至可以探入 NSFW 的邊界。
但 OpenAI 安全研究員 Boaz Barak 日前指出,Grok 的 AI 伴侶功能無疑放大了使用者的感情依賴問題。其表示,近年來不少情緒不穩定的人因與 AI 聊天機器人聊天而產生了令人擔憂的關係,甚至因為 AI 過於順從而導致他們走向精神崩潰的邊緣。
🔗 相關閱讀:馬斯克上新 「AI 女友」還能解鎖成人內容,我和她聊了一天發現這是危險的「養成遊戲」
🔗 https://x.com/elonmusk/status/1946270660486963582
🧑‍💻 OpenAI 表示將使用 Google Cloud 支援 ChatGPT
當地時間週三,OpenAI 宣佈,ChatGPT 將使用 Google Cloud 提供的基礎設施服務。這標誌著 OpenAI 正式將 Google 納入其雲服務供應商名單,結束了此前幾乎完全依賴微軟 Azure 的狀態。
這一決定背後,是 OpenAI 對計算資源日益增長的迫切需求。OpenAI CEO Sam Altman 曾在 4 月公開發帖求援:「如果有人能立刻提供 10 萬張 GPU 的算力,請立刻聯絡我們!」彼時他已坦言,OpenAI 正遭遇容量瓶頸。

根據 OpenAI 公佈的最新架構,其產品 ChatGPT 及相關 API 將同時運行於四大雲平臺:Microsoft Azure、Google Cloud、CoreWeave 以及 Oracle Cloud。這也是 Google 首次正式加入 ChatGPT 的雲服務陣營。
微軟方面仍保有部分獨佔權。儘管在今年 1 月已與 OpenAI 重籤合作模式,從獨家雲服務商轉變為優先合作方,即在 OpenAI 有新增算力需求時享有優先報價權。但微軟依舊獨佔 OpenAI 的 API 銷售渠道。
為了擺脫單一供應商的限制,除了微軟和 Google,OpenAI 也在去年與 Oracle 達成合作,共同將 Azure AI 平臺擴充套件至 Oracle 雲基礎設施;而在今年 3 月,OpenAI 則與 CoreWeave 簽訂了一份為期五年、總值近 120 億美元的重磅合同,進一步增強其多方算力佈局。
🔗 https://www.cnbc.com/2025/07/16/openai-googles-cloud-chatgpt.html
⚙️ 英偉達確認 H20 晶片恢復對華銷售
本週,英偉達發文宣佈,將恢復 H20 AI 晶片在中國市場的銷售,並計劃面向中國推出一款全新、完全相容的 GPU。
據 The Information 今天最新訊息,英偉達目前 H20 晶片庫存緊張,且暫不計劃重新啟動生產線,且恢復 H20 的生產流程至少需要九個月。
英偉達當前的 H20 庫存包含已封裝完畢、即將出貨的晶片,以及尚在流片階段的晶圓。按照流程,這些晶圓在被切割成數百至數千顆晶片後,還需一到兩個月完成封裝,再由伺服器廠商組裝至整機系統,整體週期可能長達四個月。
此外,據央視新聞 7 月 16 日報道,黃仁勳出席了第三屆鏈博會並發表演講。
隨後,據新浪科技報道,黃仁勳在當日下午就大家關切的多個問題進行了詳細解答。談到中國 AI 走向時,黃仁勳表示「在人工智慧領域,各國都有十分優秀的人才」,他提到,中國有很好的人才基礎,因為有著重視科學和數學的文化傳統,而且中國已經具備了紮實的計算機科學根基。

對此,黃仁勳認為,上述條件加上當下技術發展的時機正好,中國在人工智慧領域已經做好了充分準備,同時在人工智慧領域也一定會非常成功。
另據第一財經訊息,黃仁勳在被問及 AI 訓練時華為 AI 晶片能否取代英偉達,他稱這只是時間問題。
「我們已經做了 30 年,他們(華為)已經做了幾年,而華為已經能告訴大家他們有多強大了。現在沒有一個人比我付出更多精力來建造(AI 生態),我已經在極高的水平、以難以執行的規模(在做這件事),而華為已經能和我們相提並論。」
黃仁勳直言「任何輕視華為、輕視中國製造能力的人,都極其天真。這是一家實力強勁的公司。」他還強調,自己也會盡最大努力向華為學習。
🔗 https://mp.weixin.qq.com/s/8quBDstpmKD9JIs980vuvg
🍎 Meta 再挖走兩位蘋果 AI 關鍵人物
Meta 挖人計劃持續了一個月依然不停息,OpenAI 又一次被撬了牆腳。
據《Wired》(連線)報道,曾參與 OpenAI o3 和深度研究模型工作的研究員 Jason Wei 將加入 Meta 的超級智慧實驗室,他的同事 Hyung Won Chung 也將加入 Meta。據悉,Jason Wei 在 2023年加入OpenAI,2020 年從達特茅斯學院本科畢業,進入 Google 工作,專注于思維鏈研究、指令微調和湧現現象。

值得一提的是,日前 Meta CEO 扎克伯格在最新採訪中說,「我希望向我彙報的人數最少,而 GPU 數量最多。」而這也側面點出了 Meta 目前正在全力打造的 AI 人才戰打法。採訪中,扎克伯格也進一步提到了這三件事來解釋 Meta 到底「圖什麼」:
將計算能力與人才密集型團隊結合,Meta 將成為擁有最多計算能力的公司;
吸引人才的花費,其實比我們在計算能力上的總體投入要小得多;
搭建個人超級智慧,不做「中央 AI 大腦」,而是做「你的 AI 搭子」。
此外,據彭博社報道,兩名蘋果 AI 團隊的關鍵研究員同樣跳槽到了 Meta。
據知情人士透露, 本次出走的兩名研究員分別為 Mark Lee 和 Tom Gunter,其中 Lee 目前已在 Meta 進行工作,而 Gunter 也將在未來不久後開始在 Meta 工作。
而在本月初,蘋果基礎模型團隊的負責人、核心 AI 高管 Ruoming Pang 也被報道跳槽加入 Meta 旗下的超級智慧團隊。報道稱,Meta 為了挖來 Pang,甚至開出了每年數千萬美元的薪酬大禮包。
而上面提到的 Gunter 為 Pang 的得力助手,並且也是在 Pang 被爆出跳槽 Meta 的同時,被提到已於上月離職。
近日,扎克伯格宣佈,為推進超級智慧研發,將計劃投資 1000 億美元進行算力建設,並打造行業最精英、人才密度超高的團隊,其中部分算力建設叢集的能耗已經逼近「供 90 萬戶家庭一年用電」的等級。
🔗 https://www.bloomberg.com/news/articles/2025-07-17/meta-hires-two-key-apple-ai-experts-after-poaching-their-boss?srnd=phx-technology
Manus「刪博跑路」後,創始人首次深度覆盤:公開產品細節,總結教訓
在爆火僅四個月後,Manus AI 突然幾乎全面撤出中國市場,不僅清空全部社交賬號內容,而且國行版本的 Manus 也疑似暫停推進。
早在上個月,Manus 聯合創始人張濤便曾宣佈,公司已將全球總部遷至新加坡,並在東京和加州設有辦公室。儘管官方未正面回應,只稱是「基於經營效率的調整」,但出海所引發裁員等一連串爭議問題,也讓外界普遍猜測其是否正在「跑路」。
風波之中,昨天凌晨,Manus 聯合創始人季逸超釋出了一篇技術部落格,試圖將外界關注點重新拉回產品技術本身。
經過四次重構和數百萬真實互動,他在文中坦誠地總結了團隊在構建 Manus 過程中積累的經驗教訓。內容既有實操乾貨,也不乏反思,對業內同行與普通使用者來說,都不失為一份值得一讀的參考材料。
技術部落格地址:https://manus.im/blog/Context-Engineering-for-AI-Agents-Lessons-from-Building-Manus
省流版:
1. 押注上下文,不再訓練模型與其耗時訓練,不如圍繞大模型構造「記憶」和流程。上下文工程讓你在幾小時而不是幾周內釋出產品更新。
2. KV-Cache 命中率至關重要輸入越穩定,快取命中率越高,成本和延遲越低。三條實戰建議:– 避擴音示中使用時間戳;– 只追加上下文,避免修改歷史記錄;– 手動標記快取斷點,保障字首一致性。
3. 工具不要動態新增,而是用「遮蔽」法控制選擇動態修改工具列表會讓快取失效、模型混亂。Manus 使用「遮蔽 token logits」的方法,讓模型「看不見」不應呼叫的工具。
4. 用檔案系統承載持久上下文大模型上下文再長也會被打滿。Manus 讓模型把長期記憶寫入虛擬檔案系統,按需讀寫,實現「外部記憶」,規避資訊丟失。
5. 重寫 ToDo 清單,是操控注意力的重要方法模型容易「中途忘記目標」。Manus 會不斷用自然語言更新並重述 todo.md 檔案,把全域性目標拉回注意力焦點,防止任務跑偏。
6. 錯誤不是要掩蓋,而是要保留失敗是構建 Agent 過程中的一部分。保留錯誤日誌(如失敗的操作、堆疊資訊),能幫助模型更新內部信念,減少重複錯誤。
7. 少樣本提示不是靈丹妙藥,要防「同質化陷阱」模型會盲目模仿上下文中的行為模式。Manus 透過引入結構化變化(如不同措辭或順序),避免模型在長任務中陷入複製貼上式幻覺。
🔗 更多內容可點選:Manus「刪博跑路」後,創始人首次深度覆盤:公開產品細節,總結教訓
💰 Anthropic 估值超千億美元,Claude Code 上大分,核心團隊反覆「橫跳」
據 The Information 報道,多位投資人正推動一筆可能將 Anthropic 估值抬至 1000 億美元以上的融資交易,而這距離上一次宣佈的 580 億估值融資,才過去 4 個月。
報道指出,Anthropic 盈利能力雖不及 OpenAI,但增長更猛。據悉,2025 上半年,Anthropic 年化收入已突破 40 億美元,是去年同期的 4 倍;公司預計 2026 年收入將達到 120 億美元。

而 Anthropic 旗下的智慧程式設計工具 Claude Code 正在成為 Anthropic 重要收入來源 :「自從五月份推出 Claude 4 模型,Claude Code 每週下載量暴增 6 倍,達到 300 萬次;活躍使用者規模增長了 300%,收入增長率超過 5.5 倍。」
目前 Claude 模型直接售賣的毛利率約為 60%,正朝 70% 靠近。不過透過 AWS、Google Cloud 渠道的 Claude 模型銷售,曾出現 -30% 的負毛利率;整體毛利率可能在 50%-55% 之間。Anthropic 向投資人透露,Claude Code 目前年化收入已超過 2 億美元,或每月超過 1670 萬美元歸功於 Claude Code。
不過,日前,據多方資訊顯示,AI 程式設計軟體巨頭 Cursor 在中國大陸地區停止供應 Anthropic、OpenAI 和 Google 的多款 AI 模型。據悉,當用戶選擇上述三家的模型後,Cursor 會彈出「模型供應商不為您所在的地區提供服務」的相關提示。
而本次斷供的具體模型包含了 Anthropic 旗下的 Claude Sonnet 家族等程式設計效能優異的模型。後續,Cursor 官方更新了使用文件,回應了上述情況。其表示,Cursor 內部分模型的供應商有基於地理位置的限制,模型是否可用取決於使用者是否處在模型供應商支援的 API 位置。
未來,若還出現上述的地區限制問題,Cursor 將不會顯示相關模型。Cursor 也給出了一部分解決方案:使用者若近期支付了訂閱費用,但因模型供應商不支援服務而失去對模型的訪問許可權,可以在 Cursor 中申請按比例退款。
另外, 兩位原先跳槽至競爭對手 Anysphere 的關鍵人物——Boris Cherny 和 Cat Wu——已重新回到原公司 Anthropic。據悉,這兩人曾是 Anthropic 程式設計產品 Claude Code 的核心負責人,7 月初離職後在 Cursor(由 Anysphere 開發)擔任更高職位,分別為工程負責人和產品負責人。
🔗 https://www.theinformation.com/briefings/anthropic-hires-back-two-coding-ai-leaders-cursor-developer-anysphere?rc=qmzset
🤯 OpenAI 前 CTO 自曝首個開源多模態 AI 專案
本週,OpenAI 前 CTO Mira Murati 發文公佈了其創企 Thinking Machines Lab(TML)最新進展:
TML 目前已籌集了 20 億美元資金,由風投公司 a16z 領投,英偉達、AMD、Accel、ServiceNow 等公司參與投資;
TML 正在構建一種多模態 AI,能夠與使用者、與世界進行自然互動,並透過對話、視覺、協作等多方式融合,進行多方匹配。
Mira 透露,TML 首個產品將會在未來幾個月內公佈,產品中還包含了一個重要的開源元件,能夠幫助研究人員和初創公司開發定製模型。
據 6 月 The Information 報道,TML 目前在沒有任何產品面世的階段,其估值已破百億美元。同時據報道透露,TML 目前正開發面向企業的定製 AI,同時正在計劃為消費級市場開發產品——與 OpenAI ChatGPT 類似的聊天 AI 機器人。
🔗 https://x.com/miramurati/status/1945166365834535247
🏆 超過 DeepSeek R1,Kimi K2 拿下開源模型第一
本週,權威大模型排行榜 LMArena 公佈了最新排名結果,近期釋出的 Kimi K2 超越 DeepSeek R1,拿下了開源模型第一名。
LMArena 表示,Kimi K2 憑藉自身效能以及 3000 的社群投票,在 LMArena 總排行榜上獲得第五名的位置。值得一提的是,Kimi K2 和 DeepSeek R1 為 LMArena 排行榜前十中,兩個來自中國的模型;但在全球前 20 名中,來自中國的模型擴充套件到 7 個,MiniMax M1、Qwen3-235b 等模型均有上榜。Kimi-K2 於上週釋出並開源,號稱「具備超強程式碼和 Agent 能力的 MoE 架構基礎模型」。
官方介紹,K2 總引數達到 1T,啟用引數為 32B,上下文長度為 128k,並且支援 ToolCalls、聯網搜尋功能等。據悉,在 SWE Bench Verified、Tau2、AceBench 等基準效能測試中,Kimi K2 均取得開源模型中的 SOTA 成績,展現出在程式碼、Agent、數學推理任務上的領先能力。
另外,針對「Kimi K2 採用了 DeepSeek V3 架構」的質疑,Kimi K2 開發成員劉少偉日前在社交媒體進行了回答。其表示「確實繼承了 DeepSeek V3 的結構,但調整適合 Kimi 模型的結構引數」。並且其透露,V3 架構符合開發相關成本預算,因此選擇了完全繼承 V3 架構。
🔗 https://mp.weixin.qq.com/s/2RPmHf\_8KqIjXbY5jLdztQ
Hunt for Tools|先進工具
📺 首個直播 AI 影片大模型亮相,前 AI 大神 Karpathy 投資
Decart AI 最近公佈了全球首個直播 AI 大模型「MirageLSD」。官方表示,輸入任何影片流,無論相機直播畫面還是電腦螢幕裡的遊戲直播畫面,都能透過使用者想法,將畫面轉換為使用者所想要的,並且畫面延遲可做到 40ms 以下。
從公佈的演示樣片來看,使用者打個響指就直接置身動畫虛擬場景,木棍一揮就立刻變為炫酷的光劍。
據悉,這是 Decart 基於 Live Stream Diffusion 開發的新技術,擁有兩大黑科技:Diffusion Forcing,讓 AI 記住每一幀的重點;History Augmentation,讓 AI 即時糾錯,畫面減少穿幫。
值得一提的是,使用 MirageLSD,理論上可以無限制開播,並且能做到全場景適配。
而支撐 MirageLSD 的基礎,是針對模型架構定製的 CUDA 巨型核心,再配上快捷蒸餾和模型修剪技術,達到了 24fps/s 的即時生成畫面和效率直接提升 100 倍。目前 MirageLSD 已上架 decart.ai,下週將推出 iOS 版和 Android 版。
前特斯拉 AI 總監、OpenAI 聯創 Andrej Karpathy 也是 Decart 的小額天使投資人,他在社交平臺發文稱:「Veo 等影片擴散模型很神奇,但它們需要花費數秒/數分鐘才能生成,MirageLSD 是即時的魔法。」在他看來,這項技術會很快變得非常好,感覺它很通用、很強大,但技術難度也很高。
🔗 https://x.com/DecartAI/status/1945947692871692667
👌 OpenAI 釋出 ChatGPT Agent
本週,OpenAI 正式釋出 ChatGPT Agent 功能。
據悉,透過整合 Operator + Deep Research + ChatGPT 本體,使用者只需描述任務,ChatGPT Agent 就能自主判斷所需工具,自動訪問網頁、提取資訊、執行程式碼、生成 PPT 或表格等,並可在執行過程中即時展示相應步驟、接受臨時中斷和修改指令。
凌晨釋出會結束後,OpenAI CEO Sam Altman 在社交媒體上寫道:「觀看 ChatGPT Agent 使用計算機完成複雜任務,對我來說是一個真正的「感受 AGI」時刻;看到計算機思考、計劃和執行,有種與眾不同的感覺。」

而 ChatGPT Agent 的亮點如下:
內建圖形/文字瀏覽器、終端和 API 呼叫器等工具,支援手機端使用,任務完成後可自動推送結果;
可連線 Gmail、GitHub 等第三方應用,深度嵌入使用者真實工作流;
在多項基準測試中表現領先,綜合性能位居行業前列,多個測試結果超越了 OpenAI 此前的模型;
Pro 使用者每月享有 400 條呼叫額度,其他付費使用者為 40 條,並支援按需擴充套件配額;
值得一提的是,使用者不僅可以在桌面端啟動 ChatGPT 的 Agent 模式,在手機端也同樣適用。
🔗 更多內容可點選:剛剛,OpenAI 釋出 ChatGPT 版 Manus!奧特曼:感受 AGI 時刻
🎶 Adobe Firefly 現在可以為影片生成 AI 音效了
Adobe 宣佈為旗下生成式 AI 工具 Firefly 增添多項重磅影片功能更新,包括 AI 音效生成、「文字轉頭像」影片、「關鍵幀裁剪」、樣式預設、運動保真度最佳化等。
在此次更新中,最引人注目的新功能之一是「生成音效(Generate Sound Effects)」的測試版上線。使用者可透過文字描述自定義生成所需的音效,例如「獅子咆哮」或「玻璃碎裂」。不僅如此,Adobe 還引入了語音輸入輔助功能,允許使用者錄製音訊節奏作為提示,提升生成音效的匹配度與真實感。
另一大亮點是「Text to Avatar」(文字轉頭像)功能的測試版推出。該功能支援使用者將劇本快速轉換為由虛擬形象朗讀的影片內容,適用於課程講解、短影片創作、營銷宣傳等多類場景。使用者可從頭像庫中選擇虛擬形象,定製背景、口音等細節,Firefly 便可自動生成看似真人出演的影片。

除音效與頭像功能外,Adobe Firefly 還推出多項提升影片生成體驗的工具:
合成參考(Composition Reference):允許使用者上傳一個參考影片,並將其結構遷移到新生成的影片上,讓生成結果更貼近原始構想。
樣式預設(Style Presets):一鍵應用視覺風格,包括黏土動畫、動漫、線條藝術、向量圖、黑白風等。
增強提示(Enhance Prompt):Firefly 可自動補全使用者提示詞,提升文字提示的表達力與意圖匹配度。
關鍵幀裁剪(Keyframe Cropping):支援使用者上傳第一幀和最後一幀畫面,設定裁剪規則和場景描述,系統自動生成符合結構的影片片段。
運動保真(Motion Fidelity)最佳化:改進模型對動作的模擬能力,使生成的影片運動更自然流暢,適用於動物、人類、自然場景等。
在模型整合方面,Adobe Firefly 也持續擴充生態。目前已引入 Topaz、Moonvalley Marey,以及 Luma AI 的 Ray 2 和 Pika 2.2 等模型。這些模型將分別加入 Firefly Boards 與影片生成模組中,為使用者提供更豐富的風格與輸出效果。
🔗 https://www.zdnet.com/article/adobe-firefly-can-now-generate-ai-sound-effects-for-videos-and-im-seriously-impressed/
Hunt for Fun | 先玩
👍 大讚!DuckDuckGo 推出 AI 影像遮蔽功能
如果你對網上氾濫的 AI 圖片感到厭煩,那不妨嘗試體驗國外這款搜尋引擎 DuckDuckGo。
最近,DuckDuckGo 宣佈上線一項新功能:使用者現在可以在搜尋結果中主動遮蔽由 AI 生成的影像內容。據介紹,使用者只需在完成搜尋後點擊「圖片」標籤頁,即可看到新增的「AI 圖片」下拉選單。

使用者可在此選擇「顯示」或「隱藏」AI 生成內容。同時,也可以在搜尋設定中啟用「隱藏 AI 生成的影像」選項,實現全域性遮蔽。值得注意的是,該過濾功能依賴於社群手動整理的開源黑名單,包括知名外掛 uBlockOrigin 和 uBlacklist 提供的「nuclear」級 AI 遮蔽列表。
DuckDuckGo 在社交平臺發文表示:「雖然這一過濾機制無法做到 100% 捕捉所有 AI 生成影像,但能顯著減少使用者搜尋中遇到的相關內容。」
目前,該功能仍處於初步階段。DuckDuckGo 也表示未來將繼續擴充套件過濾器選項,但暫未公佈更詳細的路線圖。
🔗 https://techcrunch.com/2025/07/18/duckduckgo-now-lets-you-hide-ai-generated-images-in-search-results/
Hunt for Insight|先知
👀 孫正義: 1000 名 AI Agent 取代 1 個工作崗位
7 月 16 日晚,軟銀創始人兼 CEO 孫正義在軟銀主辦的客戶閉門會中高調宣佈:「在我們集團,人類程式設計的時代即將終結。」他表示,軟銀正全面推進由 AI Agent 取代程式設計師與部分崗位的計劃,並預言今年將部署多達 10 億個 AI Agent,未來數量甚至將達到數萬億級別。
孫正義估算,要想完全替代一名人類員工,平均需要部署 1000 個 AI Agent。這一換算標準背後的原因,是「人類員工擁有複雜的思維過程」,而 AI Agent 則需協同執行、分散式協作,才能實現等效產出。

孫正義對未來的願景,是讓 AI Agent「全年無休、全天線上」,自主運作,取代現有的大量人力流程。他強調,這不僅是程式碼工作者的末日,也是整個組織結構自動化的起點。
如果按其估算,每個 AI Agent 的運營成本約為每月 40 日元(摺合約 0.23 歐元),那麼 1000 個 Agent 的總成本也僅為每人每月 230 歐元,遠低於傳統僱傭一名人類員工所需的薪資開支。
孫正義稱,這將極大提升企業效率與規模彈性。
對於 AI Agent 當前存在的「幻覺」問題,他並不擔憂,認為這是「暫時的小問題」。他更關心的是:如何構建支援這一 AI 群體執行的基礎設施,包括建立和管理海量 Agent 的軟體、作業系統,以及維持其執行的資料中心與發電設施。
🔗 https://www.lightreading.com/ai-machine-learning/softbank-aims-for-1-billion-ai-agents-this-year?
💡 OpenAI o1 核心貢獻者:AI 將成為第四種槓桿
近期,前 OpenAI 研究員 Hyung Won Chung 在離職訊息曝光後,首次系統性地分享了他對 AI 的長期思考,塑造了一個新的想法:「AI 槓桿機制」。
在 Chung 看來,人工智慧並不僅僅是一種工具,而是一種史無前例的「槓桿機制」——可以以極低的輸入,撬動巨大的價值輸出,從個人到文明層面,全面重塑創造力的來源。

Chung 將 AI 定義為繼人力、資本、程式碼之後的「第四種槓桿」。這四種槓桿的共同點,是都能讓有限的資源撬動無限的可能。但不同於前三者,AI 槓桿具有前所未有的組合性、可擴充套件性和自治性,甚至可以「自我複製」,這也讓它成為歷史上最強大、最不可預測的一種槓桿形式。
Chung 對 Agent(智慧體)尤為關注。他認為,Agent 正是 AI 槓桿的原子單位,像細胞一樣可繁殖、可互聯,並天然具備複合槓桿的能力。一個 Agent 可以完成一名員工的任務,但十個 Agent,並不需要十份薪水,也不增加十倍協調成本。
另外,Chung 還提出了一個設問:「如果把整個人類文明看作一個系統,它的目標是什麼?」他的答案是:持續發現新知識,也就是科學進步。
在他構想中,AI 不僅是個工具,更是連線人類知識尖峰的殼層。今天的科學知識被分佈在不同領域、不同學者之間,彼此割裂,合作成本極高。而 AI 能將這些高維孤島串聯起來,像細菌的質粒一樣,進行「知識的水平基因轉移」。
🔗 影片連結:https://x.com/hwchung27/status/1945355238187393257
🔍 Perplexity CEO:AI 的殺手級應用不是聊天機器人,而是瀏覽器
近日,Perplexity 聯合創始人兼 CEO Aravind Srinivas 在 The Verge 的專訪中表示:AI 的殺手級應用不是聊天機器人,而是瀏覽器。
Srinivas 認為,AI AGent 真正的價值在於能夠代替使用者完成一系列具體操作,從任務理解到自動執行,並適時請求使用者接管。而在現有技術環境中,瀏覽器是唯一能提供這一完整語境的平臺。

他強調,瀏覽器的「登入狀態」和「前端透明性」是 Agent 運作的最佳載體,它讓使用者既能監控代理的行為,又能隨時接管操作,避免黑箱風險。面對 OpenAI、Anthropic 等公司正在推動的 MCP(模型上下文協議)代理架構,Srinivas 保持開放態度。
他指出,MCP 面臨的安全問題、遠端鑑權複雜度尚未解決。而瀏覽器模式則能直接利用本地登入環境、DOM 結構與使用者操作上下文,「無需再建一套虛擬世界」。他同時透露,未來會採納部分 MCP 介面,如 Linear、Notion、GitHub,但優先考慮易部署、低成本、高可靠的 Agent 路徑。
Srinivas 還證實,蘋果高管 Eddy Cue 曾在 Google 反壟斷案中公開稱讚 Perplexity,並與他有過接觸。他也承認 Meta CEO 扎克伯格曾試圖邀請其加入。對於是否出售公司,他表示仍以獨立 IPO 為目標,預計在 2028 或 2029 年上市,前提是達到 10 億美元營收與盈利能力。
🔗 https://www.theverge.com/decoder-podcast-with-nilay-patel/708256/perplexity-ceo-decoder-aravind-srinivas-comet-browser-ai-search
彩蛋時間

作者:@azed_ai
Prompt:A neon wireframe visualization of a [subject], traced in glowing [color1] and [color2] vector lines. Suspended in a digital void, the figure is surrounded by speed trails, motion blur, and shifting geometric shadows, evoking a sense of kinetic energy and futuristic momentum.
連結:https://x.com/azed_ai/status/1936741480972079563
歡迎加入 APPSO AI 社群,一起暢聊 AI 產品,獲取#AI有用功,解鎖更多 AI 新知👇
我們正在招募夥伴
📮 簡歷投遞郵箱[email protected]
✉️ 郵件標題「姓名+崗位名稱」(請隨簡歷附上專案/作品或相關連結)
更多崗位資訊請點選這裡🔗

相關文章