谷歌釋出最強「科研輔助神器」!能幫你提新idea,三大真實場景實證


新智元報道  

編輯:LRS
【新智元導讀】AI co-scientist系統基於Gemini 2.0開發,能夠協助科研人員生成新的研究假設、制定實驗方案,並透過自我改進提升結果質量。在生物醫學應用中,AI co-scientist成功預測了藥物再利用方向、提出新的治療靶點,並解釋了抗菌耐藥機制。
在科學探索的過程中,研究人員需要對以往發表的文獻進行觀察總結,提出一些新穎、可行的研究方向,最後透過全面的實驗進行idea驗證。
科研人員需要對探索的寬度和深度進行平衡,由於精力有限,不能探索過多的研究方向,同時還要保證對目標主題的研究深度。
最近,谷歌、斯坦福大學等機構的研究人員開發了一個多智慧體、基於Gemini 2.0的AI協同科研(AI co-scientist)系統,具備跨複雜主題的綜合能力和進行長期規劃、推理的能力,除了傳統的文獻綜述、總結功能之外,還可以輔助科研人員提出新的、原創知識,或是基於先前的成果制定研究假設(hypotheses)和計劃(proposal)。
論文連結:https://storage.googleapis.com/coscientist_paper/ai_coscientist.pdf
AI co-scientist系統的輸入為一段用自然語言描述的研究目標,輸出為全新的研究假設、詳細的研究概述和實驗方案。
根據科研活動本身的特性,開發者設計了多個專用智慧體用來「生成、反思、排名、進化、鄰近性檢查、元審查(meta review)」,使用自動反饋訊號來迭代生成、評估和改進假設,構成了一個自我修正、改進的迴圈機制,逐步生成質量更高、創新性更好的假設。
系統的核心思路就是「協助科研」,所以開發者設計了多種方式讓研究人員與系統進行互動,比如「直接提供種子想法」進行探索或是對生成的結果提供「自然語言反饋」。
系統還用到了外部工具,如網路搜尋和專用AI模型,以增強生成假設的依據和質量。
AI co-scientist將分配的目標解析為研究計劃配置,由監督智慧體(supervisor agent)負責將專用智慧體分配到工作佇列並分配資源,使得系統能夠靈活擴充套件計算能力,並迭代地提高其科學推理能力,以實現指定的研究目標。
測試時計算(test-time compute)
AI co-scientist使用「測試時計算」技術來迭代推理、進化和改進輸出,如進行自我對弈(self-play)科學辯論以生成新假設,對所有假設進行質量排名對比,或是不斷進化假設等,可以讓智慧體不斷進行自我批評,使用工具進行反饋以細化假設和提案。
論文連結:https://arxiv.org/abs/2408.03314
系統的自我提升能力主要依賴於Elo自動評估指標,透過對模型的輸出進行對比競賽,最終可以得到一個Elo值,研究人員分析了Elo自動評級與GPQA中diamond set(有難度的問題集合)準確率的匹配度,結果發現Elo評級與輸出質量呈正相關。
AI co-scientist(藍色線)和Gemini 2.0(紅色線)的平均準確率對比,按Elo評級分組
七位領域專家在其專業領域內精心挑選了15個開放研究目標和最佳解決方案,使用自動化的Elo指標,結果發現AI co-scientist在複雜問題上的表現優於其他最先進的智慧體和推理模型。
隨著系統在推理和改進上花費更多時間,結果的自我評估質量提高,並超越了模型和無助的人類專家。
結果也驗證了「使用從科學方法中歸納出的先驗知識」進行「測試時計算」擴充套件的優勢:系統在推理和改進上花費的時間越多,結果的自我評估質量越高,最終超越了其他模型和人類專家。
AI co-scientist的效能會隨著系統在計算上花費時間更多而逐步提高
在11個研究目標的小子集上,專家們評估了AI co-scientist生成結果相對於其他基線模型在新穎性(novelty)和影響潛力(impact)的總體偏好,雖然樣本量較小,但專家們普遍認為AI co-scientist更受歡迎,與之前引入的Elo自動評估指標一致。
真實場景應用

藥物再利用治療急性髓系白血病

藥物研發是一個耗時且昂貴的流程,新的治療方法需要重新啟動發現和開發流程,以治療不同的適應症或疾病。
藥物再利用(drug repurposing)透過發現現有藥物超出其原始預期用途的新治療應用來克服該難題,但由於任務複雜,需要廣泛的跨學科專業知識。
研究人員使用AI co-scientist來輔助預測潛在的藥物再利用研究方向,模型提出了針對急性髓系白血病(AML)全新的、可再利用的候選藥物,隨後與合作團隊透過計算生物學、專家臨床醫生反饋和體外實驗驗證了模型的預測結果,證實該藥物在多個AML細胞系中,在臨床相關濃度下能夠抑制腫瘤活力。
三種新型AI合科學家預測的 AML 再利用藥物之一的有效劑量反應曲線;KIRA6在臨床相關濃度下抑制KG-1(AML細胞系)的存活,能夠在較低藥物濃度下降低癌細胞存活,減少了脫靶副作用的可能性

推進肝纖維化目標發現

識別新型治療靶點比藥物再利用更復雜,通常會導致假設選擇效率低下、體外及體內實驗優先順序排序不當。人工智慧輔助靶點發現有助於簡化實驗驗證過程,降低開發時間成本。
AI co-scientist透過識別基於臨床前證據並具有顯著抗纖維化活性的表觀遺傳學靶點(3D、多細胞組織培養,由人類細胞衍生並設計來模擬人類肝臟的結構和功能),展現了其在提出、排序和生成針對發現假設的假設和實驗方案方面的潛力,相關報告即將與合作者斯坦福大學共同釋出。
AI co-scientist建議的治療方案與纖維化誘導劑(陰性對照)和抑制劑(陽性對照)的治療效果對比

解釋抗菌藥物耐藥機制

研究人員指示AI co-scientist探索小組內已經進行過新穎發現但尚未公開的課題,解釋囊膜形成噬菌體誘導的染色體島(cf-PICIs)如何在多種細菌物種中存在?
「微生物進化出的抵抗感染治療藥物的機制」涉及到理解基因轉移(接合、轉導和轉化)的分子機制,以及推動抗菌藥物耐藥性(AMR)基因傳播的生態和進化壓力。
AI co-scientist系統獨立提出,cf-PICIs 與多種噬菌體尾部相互作用以擴大宿主範圍,在之前進行的實驗中得到了驗證,進一步說明AI co-scientist作為輔助技術的價值,能夠利用數十年前的研究結果。
AI co-scientist重新發現新型基因轉移機制的時間線。藍色:cf-PICI發現實驗研究流程時間線。紅色:AI co-scientist在沒有先驗知識的情況下發展和重現這些關鍵發現
參考資料:
https://research.google/blog/accelerating-scientific-breakthroughs-with-an-ai-co-scientist/

相關文章