
來源 | 新智元
整場2小時釋出會,Agent成為了高頻詞。
昨晚,微軟Build 2025大會開幕式上,納德拉再次向全世界宣告——我們正式進入AI智慧體時代。

五項重大發布,四個全與智慧體有關:
-
Coding Agent:GitHub Copilot成為全能程式設計AI助手,修復bug、程式碼維護,皆可自主完成。
-
Microsoft Discovery:發現未知材料AI智慧體,可生成想法、模擬結果、自主學習。
-
NLWeb:全新開源專案,用自然語言即可與任何網站互動。
-
AI Foundry:應用程式平臺Foundry專為構建智慧體打造,並將支援Grok、HF等更多模型。
-
Copilot Tuning:可學習企業資料中獨特語氣/語言的智慧體。
會上,納德拉連線奧特曼,話題同樣是AI智慧體,以及AI編碼的未來。
奧特曼更是直言,「我們一直在談論何時才是實現真正的智慧程式設計助手,如今它真的來了,這感覺太不可思議」。

此外,微軟和xAI同樣官宣了合作:Grok系列模型,將正式接入微軟Azure。
同時,馬斯克還順便劇透了一把Grok 3.5,表示它會從第一性原理進行推理,將物理學工具應用於思考。
Computex上的老黃,也出現在了大會現場。他透露說,英偉達GB200已大規模量產,將在Azure AI基礎設施中大規模部署,實現比Hopper架構40倍的效能提升!
可以看到,如今Open Agentic Web已成為微軟的願景,讓AI智慧體像網際網路一樣,自由連線、自主運作。
Build大會上,重磅推出的50+新品和服務,正重塑計算堆疊的每一層。

Coding Agent:全自動程式設計助手
在程式設計的世界中,時間就是效率。
GitHub Copilot最新上線的Coding Agent,核心就是讓程式設計師解放雙手。
從功能開發到修復bug,Coding Agent全能勝任。大會現場,納德拉親自上陣演示。
他展示了程式碼庫中,需要修復的所有bug,比如第一個「在社群頁面新增使用者群組規模的篩選功能」。

納德拉將任務分配給Copilot後,AI很快拉取一個PR。

當你將一個/多個問題分配給Copilot時,它也會迅速做出反應,並使用GitHub Actions啟動一個安全沙盒。
它會自動克隆倉庫,配置環境,並用GitHub程式碼搜尋支援的RAG分析程式碼庫。
與此同時,Coding Agent還會利用本地配置的工具和MCP伺服器去完成任務。

Coding Agent與GitHub無縫整合,只需簡單操作即可啟動,具體做到:
-
分配任務:自動將GitHub Issue分配給Copilot,或在VS Code中透過提示啟動智慧體。
-
自主執行:Copilot會在後臺透過GitHub Actions建立一個安全、可定製的開發環境,自動處理任務。
-
PR提交:智慧體會將程式碼提交到草稿Pull Request,開發者可隨時透過會話日誌追蹤進展。
除此之外,Coding Agent還能夠做到功能開發、修復bug、測試擴充套件、程式碼重構、文件改進等任務。
如下演示中,若發現程式碼庫中存在容易混淆的命名,或不一致問題,直接交給Copilot,讓其建立一個PR全面檢查程式碼庫,並提出更清晰統一命名的規範建議。
Copilot查詢了41項參考之後,仔細分析了問題(FindBookingForm和FindYourTripForm同時存在),並給出一些建議。

在這個過程中,它會自動發起一個PR,並把查詢生成器重構為獨立類。

不僅如此,AI助手在工作中,會持續將程式碼改動提交到一個草稿PR中,並即時更新PR描述。
它的操作許可權非常明確:智慧推送到自己的專屬分支,而且現有的分支保護策略依然生效。
最重要的是——所有改動都必須經過人工稽核才能合併。

畢竟,真正的掌控權始終在開發者手中。
令人興奮的是,微軟今天宣佈,即將開源其底層架構,與開發者們一起構建開放的智慧體協作程式設計生態系統。

Microsoft Discovery:科研智慧體平臺
微軟在Build 2025大會上推出的另一重磅,就是Microsoft Discovery平臺了。
微軟希望,能透過這個智慧體平臺,直接變革科學發現過程!
Microsoft Discovery的原理,是讓研究人員與一組專業的AI智慧體和一個基於圖的知識引擎協同工作,從而快速、大規模、精準地加速科研產出。
平臺效果如何?微軟內部實測後發現,非常令人驚喜。
研究者利用其中的先進AI模型和高效能計算(HPC)模擬工具,僅在200小時內,就發現了一種新型冷卻劑原型,可直接用於資料中心,應用前景巨大。
而如果用傳統方法,這個過程需要耗時數月,甚至數年。

此外,微軟還跟美國能源部的太平洋西北國家實驗室合作,發現了一種新型的固態電解質候選材料,直接讓鋰用量減少了70%。
AI智慧體賦能科學
因為面臨著以下艱鉅的挑戰,科學研發的過程往往並不容易:
-
科學知識浩瀚、錯綜複雜且分散。
-
發現過程多樣化、動態,涉及多種高度專業化的方法和任務,很難讓不同領域融匯貫通。
-
研發是迭代的,很少現成的簡單明確的答案。只有在證據、研討和進步中,科學知識才能不斷演化。
因此,如果想用AI做好科研,就需要建立一種新正規化。目的並不在於更快地做同樣的實驗,而是從根本上革新科研模式。
微軟給出的設想是,讓每個研究者都能和一個不知疲倦的AI智慧體團隊合作。
在持續迭代的發現迴圈中,人類和智慧體就能即時提煉知識、最佳化實現。
為此,做科研的AI智慧體必須能夠做到——
-
對連線所有知識源、上下文相關的複雜圖進行推理
-
跨越不同領域和任務
-
從結果中學習,調整整個研究計劃
基於圖的科學協同推理
要做到上述第一點,並不容易,因為如今的LLM往往缺乏必要的上下文理解能力。
這種情況下,如何能讓它們對微妙、時常相互矛盾的分散科學資料,進行深度推理呢?
為此,微軟提出了一種基於圖的知識引擎。這樣,就能透過知識圖譜的構建,呈現出專有資料和外部科學研究之間錯綜複雜的關係。
由此,AI能深入理解相互衝突的理論、多樣化的實驗結果,乃至跨學科的潛在假設。

而且,這種基於上下文的推理過程,並非輸出單一固化的答案,而是能透過詳盡的來源追溯和推理過程,確保專家始終參與其中。

讓智慧體更專業
透過Microsoft Discovery,研究者就可以指揮一支專業的AI智慧體團隊了!
它們不僅能推理,還能親自開展科研。
不用寫程式碼,只用自然語言,研究者就可以把自己的專業知識和方法論編碼到智慧體中。
比起數字模擬工具的硬編碼行為,這要靈活得多,研究者不再需要計算專業知識,就能發現關鍵成果了。

科研人員可以自定義智慧體,比如「分子特性模擬專家」或「文獻綜述專家」。
這就顛覆性地改變了科研:智慧體不僅為人類工作,還與他們協同,讓人類的獨創能力大大增強,能夠既見樹木,又見森林。
NLWeb:自然語言互動網站
此外,微軟大會上還發布了一個全新開源專案NLWeb,可將任何網站變成智慧體應用程式。

不用編碼,僅透過對話,即可與網頁內容直接問答互動。
每一個NLWeb端點都是MCP伺服器,因此網站可以選擇是否讓其內容更容易被AI智慧體發現和訪問。

AI Foundry: AI智慧體工廠
與此同時,微軟還全面上線AI智慧體工廠Foundry。
-
Windows AI Foundry覆蓋了AI開發全週期的訓練和推理;
-
Azure AI Foundry專為開發者設計、定製與管理AI應用及智慧體的統一平臺。目前,Grok 3等模型已在平臺上線。

還有Copilot Tuning智慧體允許企業使用自家資料、工作流和專業知識對Microsoft 365 Copilot進行微調,無需編碼。

總之,Build大會上,除了智慧體,還是智慧體。
奧特曼、馬斯克、黃仁勳線上“打Call”
在每個產品釋出之間,納德拉與奧特曼、馬斯克遠端連線,分別談論了AI編碼智慧體未來,Grok 3.5第一性原理的推理效能。
01 奧特曼:AI智慧體編碼,就是現在
與幾天前OpenAI Codex類似,微軟Coding Agent同樣用AI去革新程式設計工作流,提升開發者的編碼效率。
現場,奧特曼分享了自己對軟體工程未來發展方向,以及開發者如何整合運用不同工具形態的願景。

2021年在GitHub上提交Codex後,OpenAI團隊一直在討論,我們將如何實現真正的AI智慧體式編碼體驗。
「如今,它終於實現了,這對我來說有點不可思議」。
奧特曼著重強調,「這是我所見過程式設計領域最大的變革之一」。
這就相當於,每個人現在擁有一個真正的虛擬隊友,可以為它分配工作,即便是複雜的任務也能拿下。
甚至,你可發出多個並行請求,讓AI修復bug、實現新功能、回答關於程式碼的問題。
這種智慧式編碼體驗,讓開發者將繁瑣的實現細節交給AI,並專注更高層次的創造性工作。
最重要的是,它還能讓開發者保持「心流狀態」,與AI智慧體、其他程式設計師,以及團隊無縫協作,加速整個開發生命週期。
而且,奧特曼還指出,AI模型已變得更加智慧、可靠,也更加易用。
人們不再需要從眾多模型中挑選合適的工具,AI會自動做出正確的判斷和操作,帶來真正的「開箱即用」的體驗。
兩年前的AI與今天相比,功能已不可同日而語,未來一兩年的技術飛躍更是難以想象。
對於所有人來說,擁抱這種變革至關重要。
奧特曼驚歎道,那些早期採用Codex的開發者,能快速轉變工作流,完成遠超以往的驚人工作量。
02 馬斯克:劇透Grok 3.5
與此同時,微軟與xAI聯手,在Azure正式上線Grok模型,以及即將釋出的Grok 3.5模型。

對談中,馬斯克提前劇透了Grok 3.5:
它試圖從第一性原理進行推理,也就是將物理學的工具應用於思考。
Grok 3.5的核心理念是,植根於物理學基礎,將物理學工具應用於所有的推理領域,力求在最大限度減少錯誤的前提下探尋真理。
當然,它也會犯錯,但會在不斷承認和糾正錯誤的過程中,逐步逼近真理。

在AI安全問題上,馬斯克直言——誠實為上策。這也算是對最近Grok各種問題做出了回應。
他表示,「錯誤不可避免,但xAI會以最快速度糾正錯誤,並期待更多來自開發者社群的反饋」。
03 黃仁勳:關於效能、協同與算力地基
黃仁勳剛在大洋彼岸的Computex上參加活動,也被納德拉遠端拉到了Build大會的現場。
他在連線中提到,英偉達最新的GB200系統已進入大規模生產,並在微軟Azure平臺的AI基礎設施中完成大部分部署。
黃仁勳表示Hopper架構過去兩年效能提升了40倍,而所有這些都不是硬體單打獨鬥的勝利,而是軟硬協同的成果。
黃仁勳說,“從 Pascal 到 Ampere,從 Hopper 到 Blackwell,再到下一代架構,我們的軟體架構始終保持相容。這促使開發者深入最佳化模型、演算法,這些工作將幫助到整個叢集,現有叢集能夠受益於全棧的軟體升級。”
參考資料:
https://azure.microsoft.com/en-us/blog/transforming-rd-with-agentic-ai-introducing-microsoft-discovery/
https://github.blog/news-insights/product-news/github-copilot-meet-the-new-coding-agent/
技術交流群邀請函
△長按新增小助手
掃描二維碼新增小助手微信
請備註:姓名-學校/公司-研究方向
(如:小張-哈工大-對話系統)
即可申請加入自然語言處理/Pytorch等技術交流群
關於我們
MLNLP 社群是由國內外機器學習與自然語言處理學者聯合構建的民間學術社群,目前已經發展為國內外知名的機器學習與自然語言處理社群,旨在促進機器學習,自然語言處理學術界、產業界和廣大愛好者之間的進步。
社群可以為相關從業者的深造、就業及研究等方面提供開放交流平臺。歡迎大家關注和加入我們。

掃描二維碼新增小助手微信
關於我們
