

AI Agent 也能做量子物理實驗了!
近日,英國牛津大學曹舒翔博士使用基於大模型的 AI Agent,成功地讓真人實驗人員告別了繁瑣重複的實驗工作。具體來說,曹舒翔博士和合作者所搭建的 Agent 能夠理解科研人員使用自然語言所描述的實驗過程和實驗目標,結合它自帶的知識庫,自行完成量子物理實驗的設計、執行和資料分析。

圖 | 曹舒翔(來源:曹舒翔)
他們把這套系統部署在了自己的超導量子計算實驗平臺上,成功實現了單位元和兩位元量子門的自動校準。而且,Agent 可以根據科研需要在量子計算機上生成量子態並進行分析。在這個案例展示之中,最複雜的部分是兩位元門的自動校準。而本次設計的 Agent 在沒有人為干預的情況下,進行了大約 3 個小時的自動實驗,併成功找到多組可以實現兩位元門的引數組合。

(來源:arXiv)
相比其他的工作,曹舒翔博士和合作者所搭建的 Agent 針對實驗物理學研究場景實現了三個功能:
第一,Agent 能夠根據科研人員提出的實驗描述和實驗目標,設計出全部的實驗步驟,並把實驗步驟轉換為一個“狀態機”,即無論是實驗成功還是實驗失敗,Agent 都能知道下一步該做什麼。在這種情況下,Agent 自動規劃的工作流程更加可靠,要麼能夠工作到實驗成功完成,要麼會在進入無法恢復的不得已狀態下向科研人員求助。
第二,Agent 能夠動態分析並理解已經存在的操作儀裝置的程式碼庫,將每一步實驗透過這些程式碼庫實現出來。實驗人員可以隨時向程式碼庫中修改或新增新的儀器操作介面增強 Agent 的實驗能力。
第三,在每一個實驗完成之後,Agent 能夠自行分析實驗資料,藉此判斷這次實驗是否成功達到預期目的。如果不成功,它會先判斷是否需要重新調整引數;如果需要,它將自行調整引數。與此同時,在這一步的結果會返回給“狀態機”並驅動“狀態機”的執行。
要實現以上的功能,需要讓大模型掌握整個實驗所需的知識。曹舒翔和所在團隊設計的 Agent,相比此前已有系統有著三個重要改進。
首先,Agent 能夠根據知識把實驗步驟轉化為“狀態機”,並讓大模型來決定狀態的更新和跳轉。曹舒翔表示透過本次研究,他們證明使用“狀態機”可以成功穩定的實現複雜實驗流程的自動化。
其次,Agent 能將知識同時從程式碼和文件裡提取出來,並能進行結構化的整理和儲存。在進行實驗設計或程式碼生成時,Agent 可以進行高效快速的查詢,並能翻譯成實驗指令碼程式碼。相比直接生成大段的程式碼,這一方案更加符合自動化實驗的場景,且具有較好的穩定性。
再次,在曹舒翔等人所打造的知識庫之中,包含了圖片的多模態資料,他們還透過引入小樣本學習,並使用多模態大模型針對實驗資料進行解讀。藉此發現,很多實驗很難僅僅透過自然語言來對實驗成功與否進行精確描述。而該團隊先給模型展示一些成功和失敗的案例圖片,再把採集到的資料轉化為圖片並讓模型進行分析,藉此極大提升了模型準確率。
總的來說,Agent 可以極大降低超導量子計算平臺的實驗成本,並能把科研人員從技術細節和工程細節中解放出來。同時,曹舒翔認為本次解決方案的適用範圍非常廣泛,不僅能用於量子計算,也能用於其他型別的科學研究,甚至能用於工業和服務業的複雜自動化場景中。

(來源:arXiv)
據瞭解,曹舒翔本科畢業於浙江大學竺可楨學院,並在畢業後到牛津大學攻讀博士。在此期間,由他聯合創立的量子人工智慧公司 Rahko 於 2022 年被美國生物技術公司 Odyssey Therapeutics 收購。曹舒翔目前在牛津大學從事博士後研究,主要研究 AI 在科研領域可能的運用場景。該研究的共同一作張子健來自加拿大多倫多大學的 Alan Aspuru-Guzik 課題組,他的研究專注於 AI Agent 的知識表示和人機互動。
曹舒翔表示,本次研究受到了早期 GPT Agent 工作 AutoGPT 的啟發。最早的 AutoGPT 能在給定一個任務目標之後,一步一步地實現目標,並能使用搜索引擎和檔案建立等簡單的工具。
在本次研究之中,曹舒翔等人先是開展了一些預實驗,比如讓一些早期 Agent 直接控制量子計算裝置。但是,實驗效果卻是差強人意,主要是因為模型無法瞭解他們的實驗要求,只能照貓畫虎地進行“看似有用實則無用”的操作。在曹舒翔等人看來,這其實就是模型在沒有知識儲備的情況下進行的“敷衍”。
後來,領域內的其他團隊開始使用更復雜的檢索增強生成(RAG,Retrieval-Augmented Generation)方法,來將具體場景的知識提供給模型,藉此來增強模型的能力。
後來,曹舒翔等人調研了很多其他 Agent 的實現方法,藉此提出一種適合該團隊研究場景的解決方案。與此同時,他們提出一個針對實驗知識進行整理和儲存的方案,即透過撰寫結構化文件的方式,不僅能讓大模型進行快速索引並查詢到相關內容,還能為人類進行分析和閱讀。
透過以上方案,讓模型擁有了使用量子實驗裝置的能力。在接下來的研究中 Agent 首先在模擬構建的量子計算裝置測試環境中進行了進行互動,驗證了準確性後在真實量子計算裝置上進行了驗證。
期間,該團隊測試了很多方案。例如,在最早的方案之中他們並沒有引入“狀態機”,而是讓模型直接生成長指令碼並完成實驗,但是他們發現,目前的模型還不足以直接完成這類複雜任務。
於是,他們透過引入更多的 Agent 並把任務加以細分,藉此找到了每個功能的最佳實現方法,並將它們進行整合,進而在真實量子計算機上成功完成測試。
但是,測試中他們發現此前構建的系統穩定性欠佳,原因是大模型很難去解讀實驗資料。由於這些資料是模型完全沒有見過的,因此透過語言描述很難進行準確區分。
為此,他們嘗試了很多方法,包括直接分析文字資料、讓模型自己寫程式碼進行資料分析並解讀分析結果等。最後,他們發現最穩定和最實用的方案是:使用小樣本學習配合多模態的方式,來教會模型卻解讀資料。
完成以上步驟之後,他們使用大模型針對量子計算機進行自動校準的複雜實驗,成功校準了單位元門和兩位元門,同時展示了模型根據真人科研人員指令快速構建新實驗的能力。

(來源:arXiv)
日前,相關論文以《應用於量子計算的自動化實驗室智慧體》(Agents for self-driving laboratories applied to quantum computing)為題發表在預印本網站 arXiv 上 [1]。同時,曹舒翔博士在 2025 年美國物理學會全球峰會上(APS Global Summit 2025)以《利用基於知識的 AI 智慧體實現實驗自動化:超導量子處理器案例研究》(Automating Experiments with Knowledge-Based AI Agents: A Case Study in Superconducting Quantum Processors)對相關工作進行了彙報 [2]。
圖 | 相關論文(來源:arXiv)
未來,曹舒翔等人將研究如何讓引數更小的模型來驅動他們所搭建的Agent。該團隊目前的 Agent 框架尚未涉及到針對模型的微調,這就要求驅動這個框架的模型的本身能力必須足夠好。比如,目前得使用 GPT-4、Claude-3-Opus 等模型才能產生比較穩定的效果。所以,未來他們將透過微調方式或蒸餾方式來使用引數更小的模型,以及降低框架所需要的推理開銷。

圖 | 美國物理學會全球峰會(來源:曹舒翔)
同時,他們還將增強模型對於科學資料的理解。目前,該團隊將掃描到的結果生成為一張帶有座標系的二維圖片,儘管模型可以識別出圖片中科研人員感興趣,並希望更進一步進行精細掃描研究的部分,但卻不能準確指出具體的引數範圍。因此,他們將進一步研究能夠處理科學任務的多模態模型。
最後,他們將透過尋找合適的最佳化方法,來讓模型更高效地部署到邊緣計算裝置上,從而讓本次案能夠適用於更多應用場景。
參考資料:
1.https://arxiv.org/pdf/2412.07978
2.https://summit.aps.org/events/MAR-G18/4
運營/排版:何晨龍



