當AI效能狂飆,類腦之路卻“南轅北轍”?科學家的交叉研究帶來認知顛覆

深度神經網路(DNN,Deep Neural Network)作為 AI 領域的重要突破,在視覺感知任務中展現出卓越的效能表現,其識別準確率等關鍵指標甚至已在特定場景下超越人類水平。這使人們普遍認為,人工智慧技術的快速發展將促進對生物智慧的深入理解。
然而,由美國布朗大學和美國哥倫比亞大學聯合團隊最近開展的一項研究卻提出了不同的觀點:隨著 AI 模型在物體識別任務上的表現越來越強,其在神經表徵(如下顳葉皮層活動模式)和行為反應(如注意力分配策略)兩個關鍵維度上,與靈長類動物視覺系統的差異反而越來越大。
這提示人們,高效能的 AI 模型並不等於類腦模型,也就是說,模型如果只是為了提升任務準確率,未必會更接近大腦的運算機制。這對神經科學、認知科學與 AI 交叉研究敲響警鐘:不能再假設“AI 表現越好,就越接近人腦”。這一發現挑戰了人們長期以來的假設,即 AI 的進步將自然而然地推動腦與認知科學的發展。
該論文第二作者、哥倫比亞大學在讀博士生馮品源對 DeepTech 表示:“未來的 AI 研究需要明確目標——是構建功能性工具,還是理解大腦機制。如果是後者,我們需要反過來用腦與認知科學的發現來約束模型的設計,而不是僅依賴工程最佳化。
圖丨論文主要作者從左至右分別為:德魯·林斯利(Drew Linsley)、馮品源和托馬斯·瑟爾(Thomas Serre)(來源:資料圖)
日前,相關論文以《更強大的人工智慧並不意味著更好的生物模型》(Better artificial intelligence does not mean better models of biology)為題發表在預印本網站 arXiv[1]。布朗大學德魯·林斯利(Drew Linsley)研究助理教授是第一作者,馮品源是第二作者,布朗大學托馬斯·瑟爾(Thomas Serre)教授擔任通訊作者。
圖丨相關論文(來源:arXiv
從歷史維度來看,人工智慧的發展起源於對人腦機制的探索,這一淵源在專業術語中仍有體現——諸如“神經網路”“表徵”等核心概念都直接借鑑自神經科學與心理學等領域。典型如諾貝爾物理學獎得主傑弗裡·辛頓(Geoffrey Hinton)的學術軌跡,其早期認知心理學研究對人腦的探索為後續 AI 突破奠定了理論基礎。
然而,隨著計算硬體的迭代升級和技術正規化的革新,AI 發展的主導力量已從神經科學、心理學轉向計算機科學,這一轉變帶來了研究正規化的根本性重構。過去人們相信,透過最佳化任務表現(比如 ImageNet 分類 [2]),模型就能自發學到類似人腦的表徵,但是從 AI 目前的發展來看,這套邏輯正在失效。
圖丨隨著深度神經網路在物體識別方面的效能提升,它們作為生物視覺模型的適用性反而降低了(來源:arXiv
在這一研究背景下,團隊提出了“和諧化”方法,嘗試在模型最佳化中引入人類視覺的注意機制。透過調整訓練資料和目標函式,使模型決策時更關注與人類視覺系統一致的關鍵區域,初步驗證了提升模型生物合理性的可行性。
然而,該方法仍面臨核心挑戰:高質量人類行為資料的匱乏使得最佳化過程本質上仍未完全脫離監督學習的框架。儘管如此,這一研究方向具有雙重價值——既增強了模型可解釋性,又為理解人類視覺機制提供了新視角。
圖丨隨著深度神經網路開發策略在過去十年間的演變,驅動其生物視覺預測的模型因素也發生了相應變化(來源:arXiv
基於這些發現,該研究強調視覺科學需要建立獨立於工程 AI 的方法論體系,同時選擇性吸收神經科學的啟示來最佳化 DNN 的能效、泛化和魯棒性。
重點突破方向包括:時間編碼機制、動態稀疏連線(模擬神經節能)、反饋/橫向結構(實現類皮層的注意調控)、突觸可塑性(支援持續學習)以及多模態整合(借鑑海馬記憶機制)。這些探索需要在生物合理性與計算效率間尋求平衡,優先實現工程可行的關鍵特性,而非完全模擬生物細節。
研究指出,當前工程最佳化的 AI 模型存在系統性偏差,視覺科學研究需審慎使用。未來的突破有賴於生物資料與大規模訓練的深度結合,這需要神經科學、認知科學和 AI 領域在實驗平臺、訓練流程和評估標準上建立協同機制。
需要了解的是,大腦不是為靜態單一模態任務進化的,而是在一個不斷變化、充滿多感官輸入的世界中發展出來的。因此,傳統監督學習的原理和大腦的學習機制之間存在本質差異。正是這一認知推動了自監督學習的興起,該方法透過從原始資料中自主發掘潛在規律,有效減少了對人工標註的依賴,展現出更強的生物合理性。
另外,如果希望模型學到類似生物的視覺策略,訓練環境也應該是多模態、動態、互動式的。例如,可以設計一個虛擬環境,模型需要不斷與環境互動、預測未來、聚焦目標以及躲避風險。
馮品源解釋說道:“這樣的環境將促使模型發展出更強的注意機制、時序整合機制和多模態融合能力。隨著具身智慧概念的火爆,越來越多的人也關注這一方向——從讓 AI 靜態感知到真實世界的物體進行互動,從中獲得有用的多維度資訊。”
圖丨深度神經網路能夠透過訓練來模擬類人的視覺策略(來源:arXiv
目前,馮品源在哥倫比亞大學祖克曼研究所(Zuckerman Institute)下屬的“視覺推理”實驗室(Visual Inference Lab)研究人與 AI 的視覺機制,他的導師是尼古拉斯·克里格斯科特(Nikolaus Kriegeskorte)教授。
他正在努力將認知科學和神經科學的見解推動 AI 發展,同時利用 AI 促進對人類智慧的理解。在加入哥倫比亞大學之前,他在布朗大學獲得碩士學位,師從托馬斯·瑟爾(Thomas Serre)教授,主要研究人類與機器在表徵對齊方面的關係。
托馬斯·瑟爾團隊的前期研究為這一領域奠定了重要基礎。在視覺行為層面,他們開發的新型對齊機制首次實現了 AI 在複雜場景中與人類認知策略的高度一致;在神經表徵層面,他們發現工程最佳化的 AI 模型與生物視覺的神經活動模式存在系統性偏離。這些發現為構建新一代神經可解釋的感知模型提供了理論框架和方法學指導。
未來,該團隊將聚焦兩個方向繼續研究:圍繞 AI 模型展開深度探索,從動態資料(如影片)中學習,使模型的視覺能力更靠近人類;繼續構建橫跨認知科學、神經科學與計算機科學領域的大規模資料平臺,推動跨學科研究標準的建立與互認。這些方向有助於為 AI 與生物智慧研究提供更豐富的視角。
參考資料:
1.https://arxiv.org/pdf/2504.16940
2.https://ieeexplore.ieee.org/document/5206848
運營/排版:何晨龍
03/ 大模型深度思考竟與物理相變“異曲同工”:科學家揭示“臨界學習”奧秘,助力80億引數模型攻克量子場論核心計算
04/ DNA“密語”被初步破譯:北大校友研發活細胞DNA成像技術,實現基於CRISPR的動態DNA成像
05世界首顆超高並行光計算晶片問世:科學家在光晶片上實現超100並行度光計算,算力呈數量級提升


相關文章