海歸學者發起的公益學術平臺
分享資訊,整合資源
交流學術,偶爾風月
臨江仙·東岸逍遙

引子
Ising 曾經在科普小文《窺探vdW磁性之真容》中提及二進位制是數學的偉大發明。二進位制被近現代資訊科技廣泛使用,也對理性思維邏輯的構建做出重要貢獻,巨大功用難以評估。簡而言之,現代資訊科技對二進位制情有獨鍾,原因很多,至少其中一個原因是二進位制的物理實現直接而確定。就如 Ising 模型、兩態物理、雙勢阱這些概念,已經成為物理人日常生活的耳提面命、家常便飯,深入我們的骨髓。
不過,讀者一定會有疑問:人類在日常生活中並不會太多理睬二進位制,更多使用的是十進位制。這是為何?箇中蹊蹺,未必每個讀者都能馬上回答出來。筆者自然亦人云亦云,並不知其所以然。除了二進位制因為進製為 2 而在衡量大數時佔位太多而很不方便外,其實一個重要的、可能是更本質的原因,就是人類大腦結構決定的運算模式。現在的物理人,如果一個月不提及所謂的“神經形態計算”、或更粗淺名詞“類腦計算”模式,就顯得有點 low。當然,按照人腦計算模式的理想化推演,我們研究的神經形態計算還可運用更大的進位制,如“百進位制 (一百個字元)”或“萬進位制 (一萬個字元)”。作為簡化示例,用讀者聽說過的十六進位制來表示:0123456789abcdef,共計十六個字元。這裡 6 + 7 = d、a + b = 15,以此類推。可見,這樣的表示,一旦被使用者熟悉,會比二進位制和十進位制更為便利與高效。
這裡,觸及到兩個不同的概念:二進位制對應兩態,十進位制對應十態。前者,於物質世界一路享通;後者,於人類日常代數計算中成為規範。一小一大,相映成趣。日常生活中,我們在腦海裡默算 3 + 5 = 8,對十進位制這是個位數,但二進位制就成為 1000 四位數了。這樣的十進位制運算,對兩歲的小孩都易於反掌,對機器硬體實現就要複雜很多。其中緣由,無非是人腦有更好的、利於訓練記憶的運算模式。注意到,人腦的這種推演計算,物質世界的 CPU 和晶片目前還不大會做。計算機的一個 CPU 一次只能做一件事情,人腦卻可一心多用、朝秦暮楚,顯示出它們之間的巨大差別。
那好,現在從硬體角度,或者更專業一些從量子材料角度,去梳理這種差別,是本文的宗旨。雖然筆者知道一篇短文很難說得很清楚、很透徹,但試試看、看看能到達哪裡,還是可以的!

圖 1. 凝聚態體系中熱力學勢能面的物理內涵。
(A) 一個物理自由度 (如自旋、極化等) 具有熱力學單勢阱 (a)、雙勢阱二進位制 (b)、外場作用下雙勢阱發生形變而實現二進位制讀寫 (c)。在這裡,雙勢阱二進位制意味著狀態轉換讀寫路徑是唯一的、讀寫始末態是確定的。(B) 一個六勢阱的熱力學勢能面 (假定這六個勢阱簡併),勢阱之間的轉換,即狀態讀寫,就變成有隨機性了:系統從一個勢阱出發,到底選擇另外五個勢阱中的哪一個?這是一種超越二進位制、不成功的多型。(C) 不同溫度下,系統在 (B) 所示中六個勢阱間進行切換操作的示意圖。物理人需要一個機制能調控這六個勢阱,使得它們滿足六進位制的讀寫運算。(D) 物理人自以為與類腦計算最接近的熱力學勢能面:其中兩個勢阱之間的轉變具有一定漲落和隨機性。這勢阱數目眾多,也就是態的數目眾多,需要經過記憶訓練才能實現類腦功能。
(A) https://blog.csdn.net/econe_wei/article/details/103544271。(B) & (C) S. H. Skjærvø et
al, Phys. Rev. X 9, 031001 (2019),
https://journals.aps.org/prx/abstract/10.1103/PhysRevX.9.031001。(D)
https://www.ipam.ucla.edu/programs/long-programs/complex-high-dimensional-energy-landscapes/。
al, Phys. Rev. X 9, 031001 (2019),
https://journals.aps.org/prx/abstract/10.1103/PhysRevX.9.031001。(D)
https://www.ipam.ucla.edu/programs/long-programs/complex-high-dimensional-energy-landscapes/。
勢阱與狀態
物質或材料世界的二進位制,對應的物理影像是雙勢阱。說明之,可用圖 1(A) 所示的熱力學自由能形貌演化來描繪,具體語言則是大學物理知識,在此不再詳細描述其硬體過程。半導體中的 p – n 結或場效電晶體 FET 等功能單元,加上磁性、鐵電等所謂鐵性序參量,都能提供這樣的雙勢阱二進位制 (0 / 1) 物態,如圖 1(A) – (b) 所示。透過擦寫,在這兩態之間實現轉換,即資訊存算,如圖 1(A) – (c) 所示從 0 寫到 1 [1 的勢阱比 0 的勢阱深,因此最後的儲存態就是 1],成就了微電子及資訊儲存之諾大產業群,每年數萬億美元產值不算高估。
這種二進位制運算,在其半個多世紀的發展歷程中,遵照馮 • 諾伊曼架構和摩爾定律,不斷革新進步,包括記憶體 RAM 從易失到非易失儲存的轉變。到了今天,這種模式已登峰造極,算得上是“電子”這個穩定而風光無限的基本粒子展示其非凡卓越量子效應的最佳表現了,但在此不論。
雙勢阱的兩態儲存運算,一個最強特徵,是其極好的穩定性與確定性,亦或說因為太過確定而缺乏了更多變化。正如《窺探vdW磁性之真容》一文所提及的,每個儲存運算單元,就 0 / 1 兩個態,無法呈現更多額外特徵。透過測量兩個物態的電學性質 (如縱向電導或橫向霍爾) 或其它物理性質的差別,來設定 0 / 1 兩態。實際應用中,要進行大數計算,就得將這些單元一個個串起來 (整合組合成為 CPU 記憶體條) 並透過讀取一個個單元狀態後傳輸回給 CPU 及程式指令,來實現十進位制存算。今天的計算機所做的,大多就是這種運算。如果資料量太大,這些記憶體不夠了,還得將這些單元狀態資訊轉移到晶片系統外的、更大的資料庫 (磁碟或快閃記憶體) 中。這一過程,必然帶來存算速度慢、容量受限和功耗高等問題。這些問題曾經被產業界不屑一顧,因此摩爾定律一路高歌猛進。到了今天,這些問題,卻無一不成為必須克服的瓶頸“卡脖子”,也是導致摩爾定律實際失效的原因之一。
要克服瓶頸,最直接簡單的思路,就是在二進位制上直接動手:能否在一個存算單元內將這兩態拓展到多型?擴充套件到“人間百態”?從而省去二進位制帶來的大量低效存算和緩慢資料交換的過程?產業界將此稱呼為“打破儲存牆”、“非易失存算”等。
回答這個問題,先要釐清一些令人狐疑不明之處:物質世界中,具有良好二進位制兩態的體系並不多,目前好用的,也就是半導體電晶體 / 場效電晶體,還有快閃記憶體、磁性和鐵電儲存等。然而,物理人偏偏挑選了二進位制來承載資料的存算,其中一個道理是:自然科學講究嚴謹、精確和穩定可靠,眼裡容不得一點沙子。於世俗看,就是有點“一根筋”,或者說為求一隅而錯失大好江山。
如果適當放鬆這個“嚴謹、精確、穩定可靠,容不得沙子”的限制,正如人腦亦被允許“一時”出錯和“經常”糊塗一般,問題就能被大部分解決。超越兩態而奔赴多型、奔赴“人間百態”,就不再是一件難事。其中一個方案,就是阻變效應:讓一個體系的狀態依賴於流過這一體系的某種刺激之累計 (如注入電荷的總和、積分電荷),就可引入時間維度,達到很多 (甚至是無限數目) 狀態。舉個例子:給體系一個電脈衝,以注入一定電荷,體系電導 (電阻) 狀態就發生一點變化。跟進再發一個電脈衝,就得到一個新阻態,以此類推。這是一種對過去狀態的累積記憶能力,即所謂“憶阻 (memristor)”,與生物學展示的人腦存算有類似之處。注意到,從這樣的一系列狀態中挑選兩個差別大的態作為 0 / 1,就等於回到了二進位制。
不過,雖然電子作為基本粒子其電荷量毫無疑問是無比精確的,但電脈衝注入電荷多少卻存在漲落,特別是當下的電荷量還是前一段時間累計起來的效應,存在很大累計誤差就不足為奇。這就是為什麼憶阻效應總給物理人一種“誤差很大、漲落不菲”的印象。這一印象很不受待見:物理人天生品質就是,嚴謹確定!

圖 2. 神經形態類腦存算的一些原理示意。
(A) 生物學揭示出的、實現人腦存算的神經形態器件單元,主要是神經元 (neuron) 與它們之間的突觸 (synapse)組合起來,構造出存算功能。每一次神經電脈衝,都導致膠質神經元透過 Ca2+離子通道穿越 pre – 突觸 (pre-synapse) 和 post – 突觸 (post-synapse) 之間,形成不斷積累的資訊傳導記憶。(B) 早期用石墨烯構造的神經形態器件單元。(C) 被關注最多的、所謂導電絲阻變效應的原理,單元之間的“通斷”透過電脈衝來操控。(D) 常見的兩端阻變器件原理,注意到 (d) 乃鐵電阻變原理,與本文主題有關。其中縮寫字元:ECM = electrochemical
metallization mechanism, VCM = valence change mechanism, PCM = phase change
mechanism, FeM = ferroelectric mechanism。(E) 常見的三端阻變器件原理,注意到 (c) 乃鐵電場效應電晶體阻變原理,與本文主題有關。其中縮寫字元:FGTs = floating-gate
transistors, EGTs = electrolyte-gate transistors, FeFETs = ferroelectric
field-effect transistors, OSTs = optoelectronic synaptic transistors。
metallization mechanism, VCM = valence change mechanism, PCM = phase change
mechanism, FeM = ferroelectric mechanism。(E) 常見的三端阻變器件原理,注意到 (c) 乃鐵電場效應電晶體阻變原理,與本文主題有關。其中縮寫字元:FGTs = floating-gate
transistors, EGTs = electrolyte-gate transistors, FeFETs = ferroelectric
field-effect transistors, OSTs = optoelectronic synaptic transistors。
(A) X. Luo et al, Front. Neurosci 16, 1016026 (2022),
https://www.frontiersin.org/journals/neuroscience/articles/10.3389/fnins.2022.1016026/full。(B) Physics World,
https://physicsworld.com/a/graphene-based-memristor-is-ideal-for-artificial-neural-networks-say-researchers/,T. F. Schranghamer et al, NC 11,
5474 (2020), https://www.nature.com/articles/s41467-020-19203-z。(C) C. Mahata et al,
Nanomaterials 10(10), 2069 (2020), https://www.mdpi.com/2079-4991/10/10/2069。(D) & (E) W. Wen et al,
Multifunctional neurosynaptic devices for human perception systems, J.
Semicond. 43, 051201 (2022),
https://www.jos.ac.cn/en/article/doi/10.1088/1674-4926/43/5/051201。
https://www.frontiersin.org/journals/neuroscience/articles/10.3389/fnins.2022.1016026/full。(B) Physics World,
https://physicsworld.com/a/graphene-based-memristor-is-ideal-for-artificial-neural-networks-say-researchers/,T. F. Schranghamer et al, NC 11,
5474 (2020), https://www.nature.com/articles/s41467-020-19203-z。(C) C. Mahata et al,
Nanomaterials 10(10), 2069 (2020), https://www.mdpi.com/2079-4991/10/10/2069。(D) & (E) W. Wen et al,
Multifunctional neurosynaptic devices for human perception systems, J.
Semicond. 43, 051201 (2022),
https://www.jos.ac.cn/en/article/doi/10.1088/1674-4926/43/5/051201。
有關憶阻效應的專著及科普文很多,讀者可自行御覽。筆者這裡給出另外一番說辭,以賦予憶阻效應一種粗淺的物理支撐:
(1) 從資訊存算角度看,物理人推崇雙勢阱系統,並如獲至寶一般善加利用,成就了現代物質科技。但是,自然界中更多的,反而是那些看起來具有多個熱力學穩定態、或介穩態的體系,從而給多型運算和儲存提供可能。以圖 1(B) 所示為例,來加以說明:這一體系,在相空間中存在六個簡併能谷點 (勢阱)。藉助合適外場激勵,體系有可能從其中一個能谷轉換到某個近鄰能谷。既然這裡是六個勢阱,那就可以定義一個“六進位制”運算模式,如圖 1(C) 中紅綠點所示處。與雙勢阱不同,六勢阱之間的轉換是否具有確定性路徑,很大程度上決定勢阱周圍局域形態。至少在圖 1(B) 這樣的簡併圖景中,隨機性不可避免,相變路徑不再唯一。因此,這樣的體系所展現的,要麼是六重混合結構 (如六重疇),要麼是六重隨機運算模式,不合適六進位制。
(2) 與圖 1(B) 展示的不同,物質世界中更多的材料,其相空間的勢能形貌呈現出更為複雜的特徵,最典型的、被藝術化了的圖景,如圖 1(D) 所示:在相空間中,存在許許多多勢阱。它們形態複雜、對稱性各異,但大致上都很淺,很容易被激發。可以想象,一方面,在合適環境和外場刺激下,體系會在這些勢阱中躍遷,躍遷幅度和方位依賴於刺激場的大小 / 方向 / 時間長短。另一方面,因為勢阱很淺,體系在這些勢阱中停留時間不會很長。這兩個方面結合起來,決定了外場驅動下體系必然會展現漲落與不確定。這一圖景就是“憶阻”之物理。當然,有些應用需要體系在勢阱停留時間足夠長、穩定性足夠高,有些應用需要對外場刺激足夠敏感,視具體要求而定。
(3) 需要特別指出,所謂憶阻,作為基態是“不存在”的,因為任何體系嚴格意義上只有一個基態及其簡併態。對基態注入電荷,必然是一種刺激,必然將體系推向一個亞穩態。這個亞穩態還是會弛豫回到基態去。這是前提,也就是說,有限溫度下,憶阻效應是會弛豫的,無非快慢而已。這個快慢,使得當下憶阻研究都採用脈衝場模式 (脈衝寬度遠小於體系特徵弛豫時間),以避免與弛豫過程交疊混雜、帶來複雜性。也正因為如此,利用憶阻進行存算,要達到如雙勢阱那般長壽命、永久儲存的可能性不高,正如人腦一般,“健忘”、“失憶”不是難事。
(4) 憶阻過程與生物醫學揭示出的人腦存算過程太像了,因此易於被物理人拿來類比。圖 2(A) 所示,即為人腦細胞單元結構及其存算原理。讀者可隨意搜尋網路及 AI 指導,得到一些基本知識:電脈衝刺激,驅動神經元輸運,越過突觸,實現資訊讀取與記憶的訓練。還要提到,要人腦永久清晰記憶本身,就是不現實的,亦即所謂“貴人健忘”。這一程序與憶阻物理如出一轍,使得從憶阻到類腦、從存算一體到類腦計算的研究推演,看起來很自然。
物理人終於開啟了面向類腦計算的艱難探索,並導致今天風靡一時的“存算一體”新模式。

圖 3. 鐵電阻變隧道結原理圖。
(a) 以“上電極 Au / 鐵電層 FE layer / 下電極Nb – doped
SrTiO3 (NSTO)”三明治結構組成的鐵電隧道結為例。(b) 不同電壓翻轉鐵電層極化後得到的疇結構,顯示宏觀鐵電極化大小可被電壓連續調控、可靠性高,其中綠色粗箭頭長短表示宏觀極化大小。(c) 隧道結介面能帶結構彎曲程度與鐵電層鐵電極化大小的關係。如果鐵電極化指向左側 (圖下部),則鐵電右側介面處束縛極化電荷,會導致右側 NSTO 電極介面側富集空穴 (正電荷),則形成肖特基勢壘 (介面處導帶能 EC高於費米能 EF),隧道結處於高電阻態 (RH)。極化如果被翻轉過來指向右側 (圖上部),情況相反,隧道結處於低阻態 (RL)。RH / RL大小依賴於極化絕對值大小。
SrTiO3 (NSTO)”三明治結構組成的鐵電隧道結為例。(b) 不同電壓翻轉鐵電層極化後得到的疇結構,顯示宏觀鐵電極化大小可被電壓連續調控、可靠性高,其中綠色粗箭頭長短表示宏觀極化大小。(c) 隧道結介面能帶結構彎曲程度與鐵電層鐵電極化大小的關係。如果鐵電極化指向左側 (圖下部),則鐵電右側介面處束縛極化電荷,會導致右側 NSTO 電極介面側富集空穴 (正電荷),則形成肖特基勢壘 (介面處導帶能 EC高於費米能 EF),隧道結處於高電阻態 (RH)。極化如果被翻轉過來指向右側 (圖上部),情況相反,隧道結處於低阻態 (RL)。RH / RL大小依賴於極化絕對值大小。
From S. Majumdar et al, Adv. Electronic Mater. 5, 1800795
(2019), https://onlinelibrary.wiley.com/doi/full/10.1002/aelm.201800795。
(2019), https://onlinelibrary.wiley.com/doi/full/10.1002/aelm.201800795。
存算一體憶阻效應
需要指出,人腦神經元組成的網路結構混亂而糾纏、複雜而不堪,竟然可用於儲存資訊和資料計算,實在令人驚奇。物理人歷經幾個世紀,終於在把玩二進位制到極其熟練的程度時,不得不去發現二進位制之外的世界、並想起來要學習人腦。
這種思維轉換,並非沒有徵兆。筆者粗陋,但也可以列舉幾個關鍵詞,秀一下感想:
(1) 混沌物理。一個數學方程迴圈迭代 (含時過程),其實就是一個存算過程的簡化版,就如這憶阻一般。數學和物理人說這種迭代可以收斂、發散,但混沌研究說還可以在一個局域相空間中發生混沌而形成分叉 (bifurcation)、奇異吸引點 (strange attractors)、極限環 (limit-cycle) 等。因為無非給出這一類現象確定性的描述,分形維數 (fractal
dimensionality) 就作為一個最成功的概念被加以廣泛研究。然而,“分形維”能夠給物理人什麼有用的 emergent phenomena呢?
dimensionality) 就作為一個最成功的概念被加以廣泛研究。然而,“分形維”能夠給物理人什麼有用的 emergent phenomena呢?
(2) 高分子標度。長鏈有機分子集合而凝聚,所形成的高分子固態微結構具有很強的製程依賴性 (含時),這是眾所周知的事實。歷經許多年,Pierre – Gilles
de Gennes 先生的高分子標度理論得到公認,給出了結構表徵最好的描述。但是,高分子的製備 – 結構 – 效能關係的準確構建,到今天也是難題,無非是因為其中有太強的含時依賴因素。
de Gennes 先生的高分子標度理論得到公認,給出了結構表徵最好的描述。但是,高分子的製備 – 結構 – 效能關係的準確構建,到今天也是難題,無非是因為其中有太強的含時依賴因素。
(3) 自旋玻璃。自旋玻璃結構目前最重要的物理結果之一,大概要算獲得諾獎的“複本對稱性破缺 (replica symmetry
breaking)”了。這種破缺,意味著各態歷經或遍歷性的破缺,因此出現了多個基態之間存在某種優先路徑,不再是原本物理人認為的那種完全無序了。這種“複本對稱破缺”,就是憶阻效應的某種前端類比。事實上,對自旋玻璃進行脈衝磁場甚至電場刺激,就能得到破缺的複本複製,從而呈現“memristor”效應。
breaking)”了。這種破缺,意味著各態歷經或遍歷性的破缺,因此出現了多個基態之間存在某種優先路徑,不再是原本物理人認為的那種完全無序了。這種“複本對稱破缺”,就是憶阻效應的某種前端類比。事實上,對自旋玻璃進行脈衝磁場甚至電場刺激,就能得到破缺的複本複製,從而呈現“memristor”效應。
(4) 憶阻效應。這裡,無需再囉嗦這一概念,但示例性說明憶阻效應還是有必要的。圖 2(C) 繪出了典型的電容器結構中阻變的機制。電脈衝序列,導致電容器從絕緣態演進到導電絲導通,形成低阻態。接下來的脈衝,又可熔斷導電絲,形成高阻態。適當脈衝配置,可以實現很多阻態,與圖 2(A) 的大腦過程如出一轍。所謂“存算一體”,終於有了一個“前車之轍”可以效仿。
(5) 類腦器件 (提煉自網路)。所謂類腦存算,正是源於圖 2(C) 所示三明治結構的憶阻或阻變過程,以其模擬神經模型單元。在此基礎上,大量單元組成神經網路,模擬大腦神經連線,實現學習記憶訓練功能。更大尺度,透過軟硬體與模擬,構建大量神經元與突觸互動,實現新的存算一體,模仿大腦的高效能低能耗。有關這一部分的詳細內涵,讀者可尋求網路上的科普資料進行學習,在此不論。
注意到,這裡的存算一體,是眾所周知的計算機機器語音:將 CPU 運算存取一體化,類似於人腦運作,卻比人腦存算快千萬倍。圖 2(D) 和 2(E) 所示,就是當前架構下憶阻單元的主要類別:兩端型器件 ECM、VCM、PCM、FeM,三端型器件 FGTs、EGTs、FeFETs、OSTs。雖然還可列舉很多,但在此不再一一描述,感興趣讀者可移步相關文獻連結以求詳細。

圖 4. 感存算一體的一些理念表達。
(A) 影像拍攝、識別與數字化資訊提取,並與神經形態類腦存算組合,就構成感存算整合系統。這裡,影像感知部分與類腦存算部分是分開的。(B) 左圖是影像識別 + 存算一體類腦計算 (near – sensor computing),右圖才是感存算一體化模式 (in – sensor computing)。(C) 感存算一體化的應用:汽車智慧駕駛的兩種模式,與 (B) 的兩種模式對應。很顯然,右側的感存算一體 (nerromorphic visual system) 具有無可替代的優勢。
(A) A. S. Sokolov et al, Towards engineering in memristors
for emerging memory and neuromorphic computing: A review, J. Semicond. 42,
013101 (2021), https://iopscience.iop.org/article/10.1088/1674-4926/42/1/013101。(B) & (C) B. Cui et al,
Nature Comm. 13, 1707 (2022),
https://www.nature.com/articles/s41467-022-29364-8。
for emerging memory and neuromorphic computing: A review, J. Semicond. 42,
013101 (2021), https://iopscience.iop.org/article/10.1088/1674-4926/42/1/013101。(B) & (C) B. Cui et al,
Nature Comm. 13, 1707 (2022),
https://www.nature.com/articles/s41467-022-29364-8。
鐵電感存算一體
在圖 2 所示的幾種憶阻存算方案中,鐵電阻變方案 (FeM、FeFETs) 顯得較為特別。特別是 FeM 方案,優點很突出,雖然也存在材料選擇和製備技術上的挑戰。這類方案,利用鐵電隧道結的隧穿電阻與鐵電極化大小之間的一一對應關係,來實現憶阻存算功能。其操控穩定性高、誤差和漲落小。這一鐵電阻變的原理,顯示於圖3及其圖題中。
與另外幾種立足於金屬– 絕緣體轉變 MIT 的阻變模式比較,鐵電隧道結阻變不存在 MIT 模式,因此電阻態更穩定、可靠。其次,對當下的鐵電薄膜而言,電壓脈衝操控鐵電極化可以準連續,因此高低阻態 RH / RL可以很高精度調控,實現足夠多的憶阻狀態,便利於更高效的存算一體化。再次,鐵電極化的翻轉時間,可以短至皮秒量級,也是一項優異效能指標。
將鐵電隧道結用於阻態操控、及至後來的鐵電神經形態類腦器件研究,在國內外較長曆史。國內高水平高校、科研機構都有開展探索。舉兩個例子:多年前,南京大學吳迪課題組就在鐵電隧道阻態調控上取得進展,中科大李曉光團隊在鐵電神經形態類腦器件研製上成績卓著。這些成果都見諸科普媒介,在此不再細述,其中主要的物理機制依然如圖 3 所示。換言之,基於憶阻效應的鐵電存算一體研究,已取得豐厚成果。諸多高水平團隊正將這一方案推向實際應用層面,也給後來者繼續深層次探索以鋪墊。
事實上,基於圖3 所示原理而研發的存算一體化晶片方案,在很多實際應用時依然需要與外部進行資料交換。例如,在處理一幅實物圖景時,當前的資訊處理技術需要外部裝置先將圖片襯度離散化成資料訊號,然後輸入資料到晶片中進行任務處理,正如圖 4(A) 所示。這一過程,就可能成為遏制執行任務效率的瓶頸,也會是未來人工智慧機器學習計算技術的核心遏制環節:外部資料交換,需要很多很多感測器去獲取資料和轉換,並傳輸到存算一體晶片中,太耗時和麻煩了!
這一環節,最好是能夠被直接整合到存算一體晶片中,無需額外的感測轉換外部裝置,即所謂的“感存算一體”方案!圖 4(B) & (C) 很好地展示了這一理念及其應用場景,令人印象深刻。
看起來,在 AI 技術突飛猛進的今天,這一方案顯然具有號召力和驅動力。能引得無數學人投入其中,並不奇怪!

圖 5. IAM 樊貞教授所領導的課題組探索鐵電感存算一體器件及其應用示例。
(A) 實現感存算一體器件的鐵電 PZT 薄膜及其鐵電性質,包括脈衝電場操控鐵電極化 P 大小及其對阻變特徵 (I – V 曲線) 的影響。(B) 感存算一體類腦計算操控模型小車無人駕駛系統。
華南師範大學先進材料研究所 IAM,過去一些年一直致力於鐵電阻變和類腦器件研發,正好碰上了這一發展機遇。該團隊年輕的 PI 樊貞教授,帶領其課題組就一直浸淫其中。這位乍一看瘦弱精幹、卻總是靦腆羞澀小夥子,身軀單薄卻蘊藏了巨大創新張力和探索意願。他的課題組與同行們合作,這幾年在鐵電薄膜類腦計算功能探索上取得不錯的進展:
(1) 壓電神經元
眾所周知,人工神經網路的硬體實現依賴於人工神經元和人工突觸兩類器件,其中人工神經元負責資訊處理,其重要性不言而喻,構建出結構簡單且效能優異的人工神經元是目前的研究熱點。樊貞課題組設計了一種基於逆壓電效應的新型壓電神經元。它結構簡單、製備容易,能夠實現完整的洩露、積分、點火、復位等神經元功能,還表現出高可靠性 (迴圈間差異性低至 ~ 1.9 %,迴圈次數高達 1010)。
這一原型演示器件的運算速度已達到微秒量級、能耗則低至納焦水平。最佳化完善後,這些效能還可顯著提升。在此基礎上,他們構建出基於壓電神經元的脈衝神經網路,演示了其無監督學習和監督學習功能,令人印象深刻 [W. J. Li et al, Journal of Materiomics 11, 101013 (2025),
https://www.sciencedirect.com/science/article/pii/S2352847825000036]。
https://www.sciencedirect.com/science/article/pii/S2352847825000036]。
(2) 鐵電光伏感測
未來的 AI 技術中,機器視覺毫無疑問是最重要的技術之一。而承載這一技術的器件,必須是可高度整合、高能效和高度可靠的。四年前,樊貞課題組就開始利用鐵電薄膜來實現機器視覺探測感測。
眾所周知,帶隙相對不是那麼大的鐵電體 (寬頻隙鐵電半導體),如其它半導體一般,都具有一定的光伏效應,因此是潛在的影像光感測 (ferroelectric
photosensing) 的不錯載體。樊貞他們利用鐵電 Pb(Zr0.2Ti0.8)O3 (PZT) 薄膜實現了高品質鐵電光感測網路 (ferroelectric photosensor network, FE-PS-NET)。這一神經形態網路,具有如下特徵與優點:(a) 高魯棒性、光伏自供電的即時處理功能 (robust and
self-powered in-sensor computing);(2) 可實現即時影像抓取與處理、軟硬體整合重構;(3) 影像識別與歸類功能。這一工作 2022 年發表後很快就引起同行高度關注,引用資料不菲 [B. Cui et al, Ferroelectric photosensor network: an
advanced hardware solution to real-time machine vision, Nature Comm. 13, 1707
(2022), https://www.nature.com/articles/s41467-022-29364-8]。
photosensing) 的不錯載體。樊貞他們利用鐵電 Pb(Zr0.2Ti0.8)O3 (PZT) 薄膜實現了高品質鐵電光感測網路 (ferroelectric photosensor network, FE-PS-NET)。這一神經形態網路,具有如下特徵與優點:(a) 高魯棒性、光伏自供電的即時處理功能 (robust and
self-powered in-sensor computing);(2) 可實現即時影像抓取與處理、軟硬體整合重構;(3) 影像識別與歸類功能。這一工作 2022 年發表後很快就引起同行高度關注,引用資料不菲 [B. Cui et al, Ferroelectric photosensor network: an
advanced hardware solution to real-time machine vision, Nature Comm. 13, 1707
(2022), https://www.nature.com/articles/s41467-022-29364-8]。
(3) 感存算一體化
近年來,感存算一體智慧視覺系統,備受關注。它能在感測端儲存神經網路權重,並進行原位計算,有效減少資料冗餘傳輸,降低系統延時與能耗。但該系統的線上訓練,仍面臨挑戰,需要高效能器件和合適的權重更新策略進行協同。此外,線上即時訓練的必要性日益凸顯。比如,未來智慧駕駛發展趨勢之一是使用者能隨時根據自身駕駛習慣來訓練模型,而且訓練過程就在車端完成。這樣的任務目標,既快又安全,顯得很有必要。
立足於這一理念,樊貞他們實現了感存算一體鐵電光伏感測器網路的線上訓練,並進行了簡單的智慧駕駛應用演示,展示了“感存算一體”理念和實踐的優勢,包括高寫入速度 (100 ns)、高耐久性 (109) 和長保持時間 (50 days) 等。他們還開發了一種雙向閉環權重更新方法,在權重精度和更新速度兩方面取得較好均衡。利用該方法對感存算一體鐵電光伏感測器網路進行線上訓練,實現了很好收斂性。部分結果被集成於圖 5 中。
更有意思的是,他們將感測器網路安裝在智慧小車模型上,實現無人駕駛控制。其中,感測器網路負責即時感知與識別指示圖案,識別結果直接輸出至電機以控制小車運動,其速度比傳統的“攝像頭 + 處理器”快 50 倍以上。模型小車駕駛動畫放在文尾,讀者可點選觀看。
當然,樊貞他們的探索,只是沿著“鐵電感存算一體化”之路邁出一小步而已。最近幾年,感存算方向的高水平研究層出不窮,樊貞他們還有長路要走,尤其是大規模陣列整合走向實際應用還需要有更多探索嘗試。不過,能夠證明並演示這一卓越理念的可行性,是難能可貴的。假以強力支援和時日,這一概念的 scaling – up 應不再是科學上的關隘或天塹。
雷打不動的結尾:Ising 乃屬外行,描述不到之處,敬請諒解。各位有興趣,還請前往御覽原文。原文連結資訊如下:

In situ
training of an in-sensor artificial neural network based on ferroelectric photosensors
training of an in-sensor artificial neural network based on ferroelectric photosensors
Haipeng Lin, Jiali Ou, Zhen Fan(樊貞), Xiaobing
Yan, Wenjie Hu, Boyuan Cui, Jikang Xu, Wenjie Li, Zhiwei Chen, Biao Yang, Kun
Liu, Linyuan Mo, Meixia Li, Xubing Lu, Guofu Zhou, Xingsen Gao & Jun-Ming
Liu
Yan, Wenjie Hu, Boyuan Cui, Jikang Xu, Wenjie Li, Zhiwei Chen, Biao Yang, Kun
Liu, Linyuan Mo, Meixia Li, Xubing Lu, Guofu Zhou, Xingsen Gao & Jun-Ming
Liu
Nature Communications 16, 421 (2025)
https://www.nature.com/articles/s41467-024-55508-z

備註:
(1) 筆者 Ising,任職南京大學物理學院,兼職《npj Quantum Materials》編輯。本文撰寫過程中得到樊貞博士的指點,筆者謹致謝意!
(2) 小文標題“鐵電笑納感存算”乃宣傳式的言辭,不是物理上嚴謹的說法。這裡用來渲染樊貞教授如何捧出鐵電作為未來高階資訊處理與感存算一體化這一優選物件。在這一嘗試中,鐵電 PZT 陣列的確展示了一種原來以為不大可能 (impossible) 的可能 (possible)。
(3) 文底影片來自樊貞,展示了他們研製的鐵電感存算一體器件應用於小車模型無人駕駛的結果。小詞 (20241123) 原本寫小雪節氣第二天的暖陽燦爛東岸。這裡略加修訂,送給瘦小帥哥樊貞教授。
(4) 封面圖片取自樊貞 NC 文章的圖 1 (https://www.nature.com/articles/s41467-024-55508-z/figures/1),展示了感 – 存算分離和感存算一體化兩種模式。
媒體轉載聯絡授權請看下方
