
現在製藥這事,人類要靠邊站了。
座標蘇州,這是一個1600平的製藥實驗室,它的“開啟方式”是這樣的:
門口,沒有人。

走廊,沒有人。

實驗室,也沒有人。

相比以往充斥著科學家、研究員的實驗室,它更多的是把機械臂和AI系統塞了進去,主打的就是一個全自動化。
或許好奇的小夥伴就要問,這樣的實驗室能幹嘛?就是為了自動化而自動化嘛?
事情當然沒有那麼簡單,你瞧見的只是無人的操作,但在背後,AI做的可遠遠不只是替代人工的實驗室操作那麼簡單,而是:
14天內完成靶點發現和驗證,還是全自動化乾溼實驗閉環的那種。
要知道,這個過程要放以前,可是需要足足2-3年才能完成……

而且更為精細化的工作,例如樣本處理、細胞培養、化合物管理、高通量篩選、新一代測序、高內涵成像等等,不論是單一任務還是“聯動”任務,機器都可以在AI的控制下輕鬆接手。

▲ 用Echo 650T製備檢測板

▲ 用NovaSeq 6000測序
這便是來自全球AI製藥第一梯隊的“選手”——英矽智慧(Insilico Medicine)的第六代智慧機器人實驗室,也是全球首個用AI參與決策的生物學實驗室。
而在它背後驅動這一切的AI大腦,則是一個叫做PandaOmics的平臺,可以根據實驗的程序自主做決策、下達指令。
若是把這個AI平臺單拎出來,它更是囊括了20多種預測模型和生成生物學模型,還包含遺傳學、蛋白質組學、甲基化資料、文字文獻和科研基金等海量資料,用以支援專業的靶點識別、分析和排序、適應症探索等生物學研究。
甚至已經有高中生用PandaOmics發現了藥物新靶點,並且研究成果還登上了國際學術期刊!

而且除了PandaOmics之外,英矽智慧在人工智慧製藥領域擁有端到端的藥物發現平臺Pharma.AI,其中專注於化學領域的Chemistry42,還可以針對給定靶點從頭設計具有特定屬性藥物理化性質的新型小分子。
這一切都可以在幾小時到幾十小時內完成,且支援並行執行多個任務。


以及英矽智慧還將科技圈最潮的大模型也融入進來,在Pharma.AI的架構上推出Copilot系統,讓你只要會對話就能使用專業的AI製藥平臺。

由此可見,現在AI不僅是把製藥這件事變成了“自動駕駛”模式,更是狠狠地把門檻打下去、效率提上來。

AI製藥的流程和工作是方便了,但隨之而來的一個問題便是:如此大的工作量,算力,又是如何解決的呢?

科學計算與AI,CPU都在發力
對於上述的問題,包括英矽智慧在內的AI製藥頭部力量們不約而同的選擇了相似的解決辦法:
充分利用所有可以用、值得用的科學計算與AI算力平臺。這種平臺可不是你想象的那樣被GPU制霸,相反,其中的CPU用量更大,尤其是英特爾的CPU。
為什麼要選擇英特爾?
首要的一個原因,就是英特爾供企業計算及科學計算使用的主力CPU,即至強® 可擴充套件處理器系列產品,一直都是物理計算——無論是昔日計算機輔助製藥,還是今天AI輔助製藥都非常依賴的科學計算應用的關鍵承載平臺。
另一方面,就算是把應用的主題從相對傳統的製藥相關的科學計算任務,切換到更偏AI的應用上,英特爾也算是頗有建樹,這一點從它對以AlphaFold2為代表的開源蛋白質預測模型的支援上就可見一斑。

▲ AlphaFold2基本架構
⾸先,AlphaFold2整個端到端的處理過程,涉及⼤量複雜多樣的計算型別。從早期的資料收集、特徵提取等預處理階段,到基於深度學習的蛋⽩質結構預測,再到後續的結果分析,這是⼀個⾼度異構的⼯作負載。
⽽英特爾® ⾄強® 可擴充套件處理器可以輕鬆勝任這一系列多樣化的任務。以⾄強® CPU Max系列處理器為例,它採⽤全新微架構、更多核心(最⾼達56個),能以更⾼頻率和更⼤快取,去應對⾼通量的預處理和後處理⼯作。
它在記憶體和輸入/輸出(I/O)子系統效能上有著顯著的增強,還結合大容量末級快取使AlphaFold2推理過程中關鍵的張量吞吐獲得了大幅提升。

▲ 英特爾® 至強® CPU Max 系列處理器
其次,由於AlphaFold2所採⽤的深度學習模型規模巨⼤,推理過程中的張量運算不僅量⼤,且維度極⾼。這就要求承載平臺具備強⼤的AI運算加速能⼒。
在這⼀點上,新款⾄強® 系列處理器內建的英特爾® AMX(⾼級矩陣擴充套件)技術,可以顯著加速⼤規模矩陣乘法運算。
在FP32/BF16混合精度計算下,其理論峰值可達每時鐘週期1024次乘加操作。針對AlphaFold2推理任務中所需的大量矩陣運算操作,AMX_BF16能在保持較高精度的同時,提高計算速度並減少儲存空間。

▲ AMX_BF16推理最佳化帶來更低記憶體佔用和更大輸入長度
另⼀⽅⾯,AlphaFold2因其⾼維張量運算和⻓序列並⾏計算,在推理過程中常⾯臨超⼤記憶體需求,不光影響推理速度,還會限制更⻓蛋⽩質序列的預測。
為此英特爾從軟硬協同的方式給出完整解決方案。
一面是提升記憶體容量和頻寬。解決方案中,英特爾® ⾄強® CPU Max系列處理器除支援DDR5記憶體外,還集成了HBM(⾼頻寬記憶體)。單顆處理器的HBM容量⾼達64GB,且具有高達460GB/s頻寬。
另一面是提供了多種降低記憶體的軟體最佳化方法。如面向PyTorch對張量計算原語(Tensor Processing Primitives,TPP)技術進行擴充套件,以及切分Attention模組和運算元融合的推理最佳化方案,幫助AlphaFold2在通用矩陣乘法計算中所需的記憶體峰值大幅降低。

▲ 熱點運算元與融合效果
經過一系列加強和最佳化後,最終效果如何呢?
如圖所示,在基於至強® CPU Max系列處理器的最佳化流程中,每個最佳化步驟獲得的提升累積後,獲得了相對於基線效能(對比組1,基於第三代至強® 可擴充套件處理器,未實施最佳化)高達33.97倍的通量提升。
根據測算,效能提升中的74%源自預處理階段的高通量最佳化,26%要歸功於對推理過程的最佳化。
此外,在同樣開啟IPEX(面向PyTorch的英特爾® 擴充套件最佳化框架)的情況下,相比對比組2(基於第三代至強® 可擴充套件處理器,但實施過最佳化),方案在升級使用至強® CPU Max 系列處理器後,其內建的HBM記憶體、英特爾® AMX的加成,則帶來了48.3%的效能提升。

▲ 切分Attention模組和運算元融合的推理最佳化方案
而且值得一提的是,在一項基於某公有云服務的測試中,基於至強® CPU平臺構建的AlphaFold2解決方案還在效能上獲得了遠優於某高階GPU平臺的表現,同時也優於由CPU+GPU混合構建的方案。
這可是一個非常難得的成績——畢竟過去在很多AI應用的測試或實戰中,CPU能有接近或媲美GPU的表現就已經算是成功,而AlphaFold2上至強® 平臺則實現了效能+蛋白質預測序列長度的全面反超。
現在還剩下最後一個問題,多個蛋白結果的解析模型AlphaFold2 Multimer。
也就是從預測單個蛋白質三維結構,發展到了對多個蛋白質分子之間的相互作用及所形成的複合體結構進行預測。
CPU在這一演變過程中的支援力度如何呢?
答案是不用擔心!
基於英特爾® 架構的AlphaFold2解決方案同樣也面向AlphaFold2 Multimer的管線結構進行了最佳化與驗證。
雖然後者的管線結構已根據蛋白質複合體結構預測的需求進行了調整,但英特爾AlphaFold2上的最佳化方案,在被用於AlphaFold2 Multimer時同樣有效。

▲ 面向AlphaFold2 Multimer模式的方案實現

CPU加速新藥發現不是夢
回顧以往,研發⼀種新藥動輒需要10年時間,投⼊20億美元才能起步。

⽽在AI的助⼒下,這⼀成本正⼤幅降低。以英矽智慧為例,它們進展最快的專案僅⽤18個⽉就找到了治療特發性肺纖維化(IPF)的潛在全球首創候選藥物並透過實驗驗證,總成本約為280萬美元。
展望未來,隨著AI技術的進⼀步發展滲透,它必將重塑製藥業的創新模式,讓新藥研發變得更加⾼效、精準、經濟。而在這一程序中,相關的科學計算及AI應用任務,依然需要有強大的算力支撐。
從英矽智慧等公司的實踐來看,以⾄強® 處理器為代表的CPU平臺,正憑藉其在效能、成本、⽣態等⽅⾯的獨特優勢,成為推動AI時代製藥創新的重要“引擎”。
這也預⽰著,在AI改變眾多⾏業的當下,CPU加速AI應用落地,幫助使用者節支增效以及推進其技術和業務創新的腳步從未停止。
AI讓新藥研發進⼊“⾃動駕駛”模式,⽽英特爾® ⾄強® 處理器則提供了它所需的源源不斷的動⼒。
在這種合作模式下,AI+製藥還將擦出怎樣的⽕花,就很值得期待了。
更多關於基於英特爾® 架構的AlphaFold2解決方案,可點選文末閱讀原文進一步瞭解。
🔍
現在,在「知乎」也能找到我們了
進入知乎首頁搜尋「PaperWeekly」
點選「關注」訂閱我們的專欄吧
·
·
·
·
