


文|《中國企業家》記者 閆俊文
編輯|張曉迪
AI技術正在催生越來越多的“愛因斯坦”式大腦,它們在科研、製藥、生物等領域不斷施展魔法。
2024年,諾貝爾化學獎授予了三個人,一半授予華盛頓大學教授戴維·貝克;另一半授予谷歌旗下DeepMind公司的聯合創始人兼CEO傑米斯·哈薩比斯和高階科學家約翰·江珀。
2018年,DeepMind推出了AlphaFold,它可以用來預測蛋白質結構。比AlphaFold更為知名的是它的“孿生兄弟”AlphaGo,它在2016年擊敗了圍棋世界冠軍李世石,成為第一個擊敗人類職業圍棋冠軍的人工智慧機器人。
作為兩家透過深度學習進化AI技術的頭部公司,DeepMind的技術路徑是讓AI依靠學習知識、規則來進化,它適用於非結構資料領域,比如生物、化學等科學領域;而OpenAI則是靠引數量極大的預訓練提升模型能力,主要落地在生成內容領域,比如ChatGPT等對話類產品。
當前,OpenAI備受資本市場關注,今年3月,它宣佈籌集400億美元的新融資,軟銀提供75%的資金,其餘資金來自微軟 、Coatue Management等機構,最新估值達到3000億美元。
科學家和學者則更重視DeepMind,AI for Science(科學智慧)正成為驅動新知識發現與科研正規化升級的重要抓手。
今年3月,DeepMind的分拆公司Isomorphic Labs宣佈完成6億美元融資,他們還拿下了禮來(Eli Lilly)和諾華(Novartis)兩家制藥巨頭將近30億美元的合作訂單。
上海科學智慧研究院副院長程遠告訴《中國企業家》:文科的世界模型很像通用語言模型、通用多模態模型;但AI for Science的世界模型,應該擴充套件到人類感覺之外,理解真正的、完整的世界。
程遠曾於2013~2022年期間,在螞蟻集團人工智慧部工作,曾任視覺認知團隊負責人,2023年他加入上海科學智慧研究院(以下簡稱上智院)。
今年6月中旬,程遠接受了《中國企業家》的專訪。
以下是內容要點:
以下是訪談的內容詳情(有刪減):

測一切之可測,才能建模世界
《中國企業家》:上智院的定位很明確,選擇做氣象大模型和生命大模型——“伏羲”“女媧”,包括後來做醫療大模型。
程遠:最早我們就選三個方向,它們覆蓋了AI for Science的大多數場景,第一,生命科學,第二,地球科學,第三,物質科學,比如材料、化學、製藥等領域。
《中國企業家》:語言通用大模型可以解決文科的問題,但解決不了像醫療這樣垂直場景的問題。
程遠:文科的世界模型很像通用語言模型、通用多模態模型的世界模型。文科是人類理解和寫出來的東西,它一定是基於人類的感知,能聽的、能看的、能說得出來的文字或者其他內容。
AI for Science的世界模型可能涵蓋更多,人類感知不了世界上發生的一切,比如我們肉眼看不到蛋白質結構,需要用冷凍電鏡來看;分子結構也需要透過特殊手段去觀察,甚至一個人的血糖、血壓,都需要特殊儀器來測量。
所以,AI for Science的世界模型,應該擴充套件到人類感覺之外,多模態模型要超過通用的大語言模型,它要從不同的尺度、不同的觀測手段感知世界,理解真正的、完整的世界。
《中國企業家》:世界是可以被理解的嗎?
程遠:感知才能理解,感知之後成了資料,有了資料,做大模型才能理解它,資料從哪裡來?從感知裡來,感知是什麼?比如冷凍電鏡、質譜儀、顯微鏡、CT儀,這些都是感知的技術,它可以測得更多。
首先,做科學的世界模型,要“測一切之可測”,才能建模這個世界,這裡有幾件事情要做,第一,做好資料,把資料儲存下來,做好它的“血緣”,從哪裡來的,誰加工的,誰又給它做了進一步的補充、校對,所有的記錄要做好。
第二,做好針對科學問題的加工,讓它變成語料,去建模相關領域的世界模型,從資料到語料的過程需要大量相應領域的科學家,加上資料工程的技術語言去提高效率。
《中國企業家》:大模型可以發現新知識嗎?
程遠:2023年,我們在想,AI for Science能幹什麼?第一,提升科學實驗的效率。第二,發現未知的東西,但基於資料驅動的技術暫時看不到太大的希望。當前,在資料充裕的地方,技術探索很多。資料稀疏的地方,技術能生成一個猜想,但有多靠譜?還不一定。
AlphaGo Zero為什麼能擊敗人類棋手,它不是科學問題,它不需要跟真實世界做任何接觸,它在一個可以閉環的純數字世界進化能力。但在科學的研究中,一定要透過科學實驗去驗證。
《中國企業家》:AlphaGo Zero是人把下圍棋規則教給它,它可以自我演化出能力,而不是去學習棋譜。
程遠:棋譜會是AlphaGo Zero學習的語料之一,但是它更多的學習在於自己跟自己下了十萬盤棋,以前人類沒有做過的事情,它做了,它探索了這個空間,而且能給它準確的反饋。
在物理、化學這些需要實驗驗證的場景,現在的技術暫時很難做,但數學的對錯是可以判斷的,所以很多AI for Science圍繞數學來做探索。
AlphaFold不是一個大語言模型,它被認為是一個深度學習的模型。
大語言模型的理解,來自大量的預訓練,基於predicting the next token(預測下一個單詞),但AlphaFold是根據每一個蛋白質最小單元之間的連線距離甚至是角度這樣的維度,去還原結構,它不是一個個出來的,而是一起出來的。

來源:視覺中國
《中國企業家》:人與機器之間的溝通依靠資料,行業資料怎麼讓機器理解?
程遠:打個比方,比如你講日語我講中文,需要先找到一個翻譯,後來,兩個人可以說共同的語言。我們現在更關心的是,不需要翻譯兩人能直接對話。
在解決生命科學科研的問題上,首先要找到一個共同點,沒有一個特別信任、互信的基礎,兩三次之後,我說的你聽不懂,你說的我也聽不懂,就很難形成緊密的合作,第一步,要找到這樣的翻譯,才能促成大家收到一個共同的資訊。
第二,無論AI for Science還是AI for 產業,做AI的人跟這個領域的人要有共同的利益,你感興趣,我也想做。
《中國企業家》:2025年3月,谷歌DeepMind的分拆公司Isomorphic Labs宣佈完成6億美元融資,他們還拿下了禮來(Eli Lilly)和諾華(Novartis)兩家制藥巨頭將近30億美元的合作訂單。
程遠:首先這個模式非常創新,DeepMind是谷歌的子公司,然後Isomorphic Labs把成果孵化出來,實現產業化,我們也很想複製這種模式。
《中國企業家》:AI製藥有可能嗎?
程遠:目前來看,AI製藥還沒有成功,沒有人為干預,AI不可能直接做出來新藥,最起碼5年內是不可能的。但AI提升藥物研發效率,這是肯定的,就跟我們說AI看病一樣,醫生給病人看病,現實裡,AI不替代醫生,但AI可以幫助醫生提升效率。
《中國企業家》:具體是怎麼提升效率的?
程遠:DeepMind去做這個事情,其實有大量的AI工具,也有製藥的科學家、藥物化學家,還有一些工具幫助科學家提效。大語言模型可以幫助科學家做FAP(靶向成纖維細胞活化蛋白)或者是一些科學計算。
AI有可能發現一個新的分子結構,但發現只是提出一個新的假設,大量驗證工作、藥物研發工作都在後面。一個科學家可能一天可以提出30、50個新假設,最終經過一輪輪的篩選,才能驗證出來。
長期來說,10年、20年之後,經過谷歌等公司的探索,可能人和AI能協同完成某一個新藥的發現,成功後,再把這個發現的過程固定下來,供後續新藥研發模仿參考,可能會節省大量的人力工作。
點選封面訂閱全年雜誌

區塊鏈與Agent
《中國企業家》:Agent流行之後,對AI for Science有什麼幫助?
程遠:現在有很多科學計算軟體,更多是以單機或者是相互隔離的形態存在,可能也有以一個小的軟體叢集的形式去完成計算。現在,Agent就是解決一個個小問題的工具、模型或者計算軟體,不能聯動和互動。
所以,想要做Agent AI,第一步,找到那些相對成熟的場景,或者是我們能夠觸達到的場景,它有足夠多的工具,有足夠多的Agent可以用。類似MCP這些協議出來之後,呼叫Agent的方式變得更加標準化,有可能性了。
第二,做好Agent AI,還需要學習。Agent AI的核心是針對一個任務,然後拆解出小的任務,知道要呼叫哪個工具,呼叫哪一類工具能更好地完成這個任務。這個事需要有一些前期的資料儲備。
《中國企業家》:原來也做不到。
程遠:AI for Science興起之後,會出現大量的模型和工具能解決一個個的問題,有了解決單個問題的能力,才有可能去做Agent AI。
我們非常希望能形成一個模型共享的生態。你研發的模型可以被我呼叫,我研發的模型也可以被你呼叫,像MCP,但這還是不夠。在科學領域裡,還有一個協同的問題,好不容易研發一個模型被我用來解決一個重大科學問題,結果,我發個論文根本沒你的份兒。
《中國企業家》:這是個很現實的問題。
程遠:我們現在正在嘗試一件事情,將區塊鏈的技術用在科研領域,Agent之間可能互相都不認識,區塊鏈能記住誰用了我的Agent,我用了誰的工具去完成科學任務,它能釐清生產關係。
在科研協作的場景,區塊鏈是一個非常好的解決方案,科研場景沒有那麼標準化,每個科研場景,它需要的人不一樣。在Agent AI時代,我們需要協同非常多Agent時,就必須要做好協議、做好區塊鏈。

攝影:鄧攀
《中國企業家》:Agent落地應用,你有什麼看法?
程遠:現在常見的Agent功能是做了簡歷、統計報表,比較淺,這些任務規劃其實不需要特別強的規劃能力,真正體現AI能力還是要到專業的領域裡去。
《中國企業家》:扎進行業裡。
程遠:AI如果變成一個物理學家,它要學很多,比如物理學家怎麼去驗證新的科學假說,怎麼去完成論證,你得有這樣大量的案例給AI。
《中國企業家》:有的人覺得自己原來AI能力不足的時候,覺得買一體機就能解決很大的問題,但也有人說,一體機解決不了太多的問題。
程遠:看解決哪方面問題,解決AI研發能力不足的問題,一體機解決不了。解決應用場景的問題,我覺得一體機是很有戲的。如果一體機只完成一個模型的部署,它完成的就是大語言模型的推理服務成本和部署便捷性的問題。
《中國企業家》:一體機解決不了什麼問題?
程遠:模型不是價值,模型一定要變成一個產品,結合業務應用場景,解決需求問題。如果是醫院,一體機要植入到診療的流程當中,在銀行,要植入到信用風控或者是客戶服務的業務裡面去,這才是一體機的價值。

Agent落地醫療
《中國企業家》:我們看到Agent在醫療行業落地比較多。
程遠:我們跟復旦大學附屬中山醫院心內科主任葛均波院士做了心內科的模型,叫“觀心大模型”,只做心內科。葛均波團隊積累的資料,還有他的專家團隊,以及我們這邊的AI人員已經具備能力,能完成這個垂直科室的模型開發。
但醫院很多疑難雜症經常需要會診,最終會碰到病人的資料隱私問題,病人隱私資料不可能出當地醫院。那麼,未來,能做的事情是什麼?
如果我用一家醫院的資料構建出這個科室最好的Agent,幾十家醫院的每一個科室都有最好的Agent,醫生面對一個複雜病例的時候,就可以呼叫這些Agent。
《中國企業家》:相當於把病人的資訊脫敏了,最後成為一種知識沉澱。
程遠:傳統的解決資料隱私,是把智慧從資料裡面剝離出來,注入模型,常常應用多方安全計算這套技術。不管怎麼去保護,始終就是一個攻防成本的問題。資料不管是以什麼形式過來,對於隱私計算而言,它還有一定的機率能還原出來,不能百分之百保證這個資料是安全的。
Agent尤其是多智慧體體系,很有可能解決這個事情,我在本地建模、本地完成(部署),給外部提供的是智慧服務,而不是病人的資料。
《中國企業家》:距離完全落地應用,大概需要多少年?
程遠:我覺得頂級的Agent出來,可能需要兩三年。尤其DeepSeek出來之後,大量的醫院都在部署DeepSeek,做推理,但很快科室就發現,模型的能力還不夠,他們就會去最佳化這個模型,這時候,科室最強的Agent就會出現。
《中國企業家》:你們所做的“觀心大模型”有哪些量化的能力指標。
程遠:就心內科的疑難雜症,我們的topic case(主題案例)準確率是92%,現在千問、DeepSeek、Cloude都相對差一點。
“觀心大模型”底座的大模型還是DeepSeek和千問,我們不做預訓練,而是針對垂直領域,加上我們後期足夠的資料進行除錯,它可以超過通用模型的水平。
其實是回到一個概念,垂直模型能力提升來自哪裡,我覺得來自資料和專業醫生的積累。Scale AI的CEO Alexander Wang說,原來通用的、開放的資料已經用完了,未來的AI,一定是專業領域、垂直領域的資料。

攝影:鄧攀
《中國企業家》:各個醫院的Agent做出來之後,它跟病人、醫生之間的三角關係是怎麼協調的?
程遠:最後還是要找醫生。在可見的時間內,Agent都是一個輔助工具,輔助聽起來好像價值不大,但事實上,它的價值非常大。
我這幾天在想一個事情,復旦大學附屬中山醫院心內科就一個葛均波院士,他可能一天只能看100個病人,大模型給他提效20%,相當於就有了1.2個院士。
《中國企業家》:AI延伸了個體能力。
程遠:假如,院士的能力可能是99分,基層醫院的普通醫生可能是70分,第一,我這個院士Agent可以幫助基層醫生從70分提升到80分,輔助決策,給醫生第二個意見,有一個討論的人,讓決策就更穩定、更靠譜。
第二,有普惠的價值,可能一個院士一週只能安排兩天門診,只能看200個病人,但如果賦能到基層醫院的醫生,可能就能看20萬個病人。
《中國企業家》:跨醫院合作的問題怎麼解決?
程遠:多個系統之間要完成對接,一定要有一套Protocol(協議),讓大家說同樣的語言,比如Anthropic做的MCP,國內可能也會推出一個類似的協議。
《中國企業家》:目前,部署一個科室Agent大概需要多少錢?
程遠:還沒有商業化,我們正在做商業化的規劃。市場上類似的Agent,低到30萬,高到兩三百萬,Agent還沒有特別收斂到大家認可的水平,你能賣多少錢,其實是你給客戶帶來多少價值。
《中國企業家》:這個事情由大公司來做還是創業公司來做?
程遠:我們做“觀心大模型”也有顧慮,我們不是大廠,做這樣一個垂類,它是否具備可複製性,投入這個產品,可能需要幾個工程師、幾個月的工作量,一算也是幾十萬、上百萬的成本進去了。
每一家醫院可能要同樣做一遍,因為每家的系統都是不一樣的。模型訓練的上下游都需要非常強的定製化成本。
上游是什麼?我要把這個科室的資料整合出來,要跟科室的醫生聯合完成資料的加工標註,這都是非常定製化的。
下游應用方面,大模型出來之後,接入到這個科室的系統,它的能力就強了,但各個醫院流程不是一套標準的東西,需要定製,適配它的場景,投入成本比較高。
《中國企業家》:各個醫院之間的Agent,資料開放問題怎麼解決?
程遠:有法可依,首先要有規範,對場景要有特定的資料安全規範;有器可用,就是要有一套資料安全的軟體或者工具的體系;有跡可循,訪問日誌等資料儲存。
《中國企業家》:一些醫院或者企業的數字化做得不好,有可能直接進入AI化嗎?
程遠:它可以AI化,用別人的東西而不是它自己的。沒有資料怎麼做AI?這是一個根本的東西。
通用模型植入產品並投入執行後,會產生資料迴流,根據場景反饋,再提升模型能力。多智慧體系統,要做真實場景的強化學習,在分散式場景裡,支撐場景,這可能是人工智慧發展的下一幕。
《中國企業家》:Agent能力是自我增長的嗎?
程遠:Agent在應用中增長,類似於一個實習醫生的成長,在醫院查房時,老師會問那些實習醫生的想法,其實就是在這個情境裡面去學習,通用模型不會觸達到這個場景,那麼Agent就要在環境裡去學習。
新聞熱線&投稿郵箱:[email protected]

。END。
值班編輯:王怡潔 審校:張格格 製作:王儀琪
關注“中國企業家”影片號
清華教授張亞勤邀您一起讀
《中國企業家》↓↓↓
掃描下方二維碼,訂閱2025全年雜誌
