李德毅院士:認知機器的結構和啟用

摘要:從物理學的角度理解人類認知已經成為當今人工智慧面臨的核心挑戰。本文分析了計算機通用結構中,孤立計算、忽視記憶和孤立思維、忽視具身的侷限性。以駕駛認知為例,提出了包括感知、思維、行為在內的認知機器的通用結構組成。它區別於計算機的架構,也區別於楊立昆的“世界模型”和李飛飛的“空間模型”,增加了記憶組塊,用人工智痕元胞作為神經元細胞的映象,用智痕元胞網路構成思維軟構體,實現記憶智慧的生成、調控和提取。物質硬構體可採用CPU、DPU、GPU、TPU、FPGA、SSD、搜尋引擎等並行處理單元,其系統是分佈的、並行的、異構的。一旦加電獲得能量,機器就不再是死物質,認知核中的思維軟構體和物質硬構體經過一番糾纏,機器被啟用。啟用後的機器賴負熵為生,進入和物理世界具身互動的認知狀態。機器認知像人又不像人,宕機後可再啟用,能自主感知、思維、決策和行為,可互動,會學習,自糾錯,自成長。該結構既可用於構造數字虛擬機器人,也可用於構造替代人類勞動崗位的、千姿百態具身的機器人,使得人類能夠迅速進入人機共生的智慧時代。

文章來源:智慧系統學報
認知機器的結構和啟用
李德毅1 ,張天雷2 ,韓威3 ,海丹3 ,鮑泓4 ,高洪波5
1. 清華大學 資訊科學技術學院
2. 北京主線科技有限公司
3. 北京中科原動力科技有限公司
4. 北京聯合大學 機器人學院
 5. 中國科學技術大學 資訊科學技術學院
1
計算機體系結構的侷限性
1.1  從計算機器的結構談起
隨著類腦計算的蓬勃發展,從物理學的角度理解人類認知已經成為當今人工智慧面臨的核心難題當今的計算機本質上實現的是機械的、電子的、非生命的計算裝置。它是能實證的、可化的,可以用邏輯學的方法證明或者計算,如數值計算、最佳化計算、符號邏輯、謂詞演算、定理證明、機率計算等。早期的馮·諾依曼計算機由CPU(控制單元和運算單元)、記憶體、外存和輸入、輸出組成。計算機體系結構更強調構成計算機系統的各個元件的內部結構及其相互關係,以及計算機系統軟硬體之間的介面關係。它包括指令集體系結構和微體系結構兩個層面,指令集體系結構是思維軟構體和物質硬構體之間的介面,定義了處理器可以執行的指令集合(複雜指令集或者精簡指令集)、資料型別、暫存器、記憶體訪問方式、輸入輸出機制等。微體系結構是處理器內部的物理實現,即物質硬構體,它得益於固體物理學的研究成果,尤其是半導體晶片和積體電路技術,包括CPU內部的暫存器、資料路徑、控制單元、快取等元件。計算機體系結構還涉及支援多核處理、眾核處理、包括GPU在內的異構處理單元等。這樣的物理裝置究竟怎麼完成人的計算和思維的呢?
圖靈和馮·諾依曼都是數學家和物理學家,他們發明的計算機器的結構,可以實現人的計算智慧,甚至能夠思維,但他們並不是生命科學家。同樣,獲得諾貝爾獎的著名物理學家薛定諤也不是生命科學家,但他的著作《生命是什麼−活細胞的物理學觀》,對生物學領域產生了重要影響。生命科學中發現DNA雙螺旋結構的科學家,仍然不是生物學家,而是物理學家克拉克、沃森等,他們因此獲得諾貝爾生理和醫學獎。這就說明物理學對生物學的基礎性作用,並誕生出一個十分有價值的交叉研究學科−生物物理學。
本文試圖以人類認知為突破口,用“賴負熵為生”的生命觀,來解釋機器是如何被啟用的,以及機器是如何思維和認知的,即認知物理學。用認知來彌合生物學和物理學之間的鴻溝,填補生物認知和機器認知之間、人的智慧和人工智慧之間“缺失的連線”。
1.2 計算機架構中缺失記憶的形成、調控和提取
機器認知和人的認知一樣,存在4種基本模式:記憶驅動的經驗模式、知識驅動的推理模式、聯想驅動的創造模式以及假說驅動的發現模式。認知依賴記憶,記憶是難以計算的智慧,它先於計算、約束計算,無需解釋。記憶在這4種基本模式中都發揮著不可或缺的作用。當前情境下發生的動態的、不確定性的記憶提取,常常體現了選擇性注意。但是,受圖靈“智慧的本質就是計算”的侷限,傳統人工智慧只能是計算機智慧,體系結構中只有簡單的儲存,缺失記憶的生成、調控和提取的組織結構。馮·諾依曼架構的計算機,核心是算力和演算法,透過程式實現演算法,利用算力完成運算,它不可能執行任何未預先程式設計的活動。而機器認知主要是依靠記憶,計算機中的儲存遠遠不能覆蓋記憶的豐富內涵,認知機器需要模擬人腦數百億神經元和數百萬億突觸組成的記憶網路才行。網際網路協議的偉大之處在於將應用程式和內容服務環境與底層傳輸結構的特徵分開,網際網路搜尋技術歷經的30多年發展演化和ChatGPT大模型的成功,都證明了一個事實:可以把網際網路看成是一個超級記憶網路,無論是根據語法、語義、語境或者語用進行搜尋,雲計算或者生成式人工智慧,是一個類似超級人腦的、動態的、不確定性的記憶網路修剪和提取過程,不同粒度的記憶就是不同尺度抽象了的網路拓撲和表達,是複雜網路的資料探勘而已。所以,一定要把記憶的形成、調控和提取機制引入到認知機器的架構中去。
1.3 計算機架構中缺失具身互動認知
曾經的計算機是一種開環設計,它根據特定的輸入,透過程式執行完成計算,給出輸出結果。今年計算、明年計算,在這裡計算、在那裡計算,結果都一樣,不具有空間定位在內的感知能力,不具有時空智慧,也沒有具身行為動作的存在,只有啟動狀態和目標狀態。要達到目標狀態,其解決方案就是一個行動序列,確保機器能夠從啟動狀態最終達到目標狀態,只要知道了問題答案就認為是解決了問題。如果在解決計算問題的過程中使用者需要干預,則可以透過預設的人機互動介面,用滑鼠、鍵盤、甚至語音等手段“填入”預設規格的相關內容。當然,這類互動技術進步很快,越來越趨於自然。因此,在計算機科學和技術領域,輸入輸出司空見慣,人機互動耳熟能詳,但把持久地和外界環境互動作為一種認知手段,作為智慧體的具身智慧,卻不多見。然而,實體機器一旦具身有了感知、認知和行為能力,能夠學習、創作、成長的時候,越來越多的個性化虛擬數字人、千姿百態的實體機器人就可以作為我們的智慧代理,替代我們的工作崗位。這時候,思考人和機器關係中的基本問題−具身互動認知,就被提上議事日程了。機器在物理空間表現出的具身互動智慧,完全應該也完全可以和認知空間的計算智慧媲美,成為新一代認知機器體系結構組成的重要部分,一定不能再缺失了。
2
認知機器的體系架構
在分析了計算機體系結構的上述兩大侷限性之後,我們從介觀切入來研究認知機器的體系架構。介觀指介於宏觀與微觀之間的一種體系。我們不從化學的原子水平或者物理學的分子水平的微觀角度,也不從腦組織功能分割槽的宏觀角度,而是在神經元細胞與神經元網路水平的尺度上研究腦認知及其模擬,在介觀上認知機器由感知、記憶、互動和計算等部件組成,其中的感知、認知與行為都是雙向互動的。互動系統裡常常有定時定位定姿、語音文字、圖形影像等多種感測器部件,它們承擔與外界環境的互動,而具身行為互動常常是一個反饋自調節的過程。記憶是智慧之母,是認知機器的核心。記憶系統裡有瞬時記憶、工作記憶和長期記憶3類組塊。區別於馮·諾依曼架構,也區別於楊立昆的“世界模型”和李飛飛的“空間模型”,人腦神經元細胞是記憶的基本單元,是物質硬構體它會發生持久的物理、化學變化,在細胞水平上留下記憶的印跡、痕跡、殘跡,智痕可深可淺,連線有強有弱,體現神經元細胞和突觸的可塑性。
我們提出用“智痕元胞”作為寄生在神經元細胞之上的思維軟構體,它是物質硬構體−腦神經元細胞的映象或指代。記憶智慧是智痕元胞網路的一種整體具象,不是哪一個智痕元胞單獨決定的。這個整體具象會隨著知識的增長不斷地演化,類似人的認知在生命過程中的二次擴張和持久重塑能力。它存在有用於檢索記憶的多索引並行機制,從與時俱進的、不同抽象尺度的記憶網路中挖掘出網路節點的抱團特性和層次結構,挖掘出相互關聯的諸多概念、認知地圖、概念樹、知識點和知識圖,還有這些知識圖隨著時間變化的知識譜。認知機器的架構充分利用自學習,形成、修飾、並鞏固記憶。當然,記憶智慧也需要計算智慧來幫忙,提高認知的可解釋性。
2.1 典型案例:駕駛認知和駕駛腦
機器認知的範疇多種多樣,具身千姿百態。其中,駕駛認知在全社會最備受關注。以交通為例,無論是飛機、船舶還是車輛,已經並正在完成著無人駕駛的三部曲。第一步:人主駕,機器輔助駕駛。20世紀50年代的先進駕駛輔助系統(advanced driving assistance system, ADAS),被認為是現代巡航控制系統的前身。第二步:機器自動駕駛,人隨時干預。美國汽車工程師協會(SAE)把自動駕駛分成5個等級,利用自動控制技術,實現對汽車執行狀態的感知、規劃和控制,至今如火如荼。第三步:機器自駕駛,自糾錯,自成長。它比經驗駕駛員更安全。2000年以來,我們擺脫了純自動化的技術路線,強呼叫“機器駕駛腦”代替駕駛員開車,讓車輛成為一個有感知、有認知、有行為、可互動、會學習、自成長的輪式機器人,成為移動的認知平臺。學習和記憶互相依賴,互相促進,已有的記憶是學習的基礎,新的記憶又是學習的結果,反映了記憶的重塑和駕駛認知的自成長過程。駕駛腦的結構圖如圖1所示。安裝有駕駛腦的載體或平臺的結構常常各不相同,如陸地行駛的車輛、空中飛行的無人機、水上航行的無人艦艇,它們的具身,包括機械、電氣及結構差異大,各不相同,導致動力學與運動學特性各不相同,不同駕駛平臺的感測器型別、特性、數量、安裝位置也各不相同,導致感測器處理模組各不相同,由此構成的智慧駕駛系統模組的數量、介面各不相同。作為移動認知平臺的無人駕駛車中,異構晶片數量少則上百個,多則上千甚至幾千個,異構晶片種類也從40種上升至150多種,它們都是物質硬構體。
圖1  機器駕駛腦結構
駕駛腦可分為三大組成塊:物理空間的感測器資訊處理模組,完成跨模態感知融合,特別是雷達、相機和車輛所在位置地圖的融合;認知空間的思維決策模組,完成駕駛態勢認知並形成決策,特別要關注車輛即時擁有的路權;物理空間對機器具身的運動控制模組,透過對車底盤的控制,給出對方向盤轉角、油門(電機的轉速和扭矩)和制動的控制量。和瞬時記憶相關的定位感測器,特別是北斗等空間定位裝置,要求能夠達到釐米級導航;車姿感測器包括感知車身的加速度和速度;視覺感測器看影像、看語義,雷達感測器看距離、看路權。對這些資訊進行跨模態的互動融合形成當前的駕駛態勢圖,送入工作記憶。在長期記憶裡,有駕駛地圖、交通規則、各類典型場景記憶棒和事故記憶棒等。除此以外,還要有人機互動,完成路徑規劃,要透過學習、思維完成自主決策,最後透過汽車的控制平臺中的互動匯流排、決策匯流排和控制匯流排來完成汽車具身的運動學和動力學行為。駕駛腦中的思維決策模組,可以在不同感測器配置和各類異構平臺上方便地移植。感知、思維、決策、控制形成反饋迴路,構成再感知、再決策、再控制的認知迴圈。
2.2基於智痕元胞的瞬時記憶、工作記憶和長期記憶網路
從機器駕駛腦這個典型案例可以看出,記憶是真實世界不同尺度的摘要或者抽象,而非複本,也不是無失真壓縮。回溯過往是一種認知的逆時間旅行,得以擺脫時間總是向著未來的束縛,能夠將過去和現在連線到一起,為認知提供了連續性,成為機器當前認知能力的基礎它由瞬時感知記憶組塊、短時工作記憶組塊、長期經驗記憶組塊構成,瞬時感知記憶組塊和長期經驗記憶組塊中的深度神經元胞網路,其結構相似,最大的區別是反應時間不同。組塊之間協同工作,確保記憶的形成、調控和提取,其工作原理和結構關係見圖2。

圖2  認知機器中記憶的形成、調控和提取
瞬時記憶組塊中的智痕元胞網路,完成對感知覺資訊的儲存,其記憶時間短,資訊量豐富。選擇性注意機制將抽取與當前任務相關的內容,實現感知覺保持,傳遞給短時工作記憶。短時記憶組塊是根據認知任務對當前態勢分析的結果,這時,要從長期的、已有的記憶中提取相關概念、知識,感知覺資訊和長期形成的先驗知識關聯,分析、最佳化,以形成決策。當然,透過一次又一次的再認知,也會對長期記憶組塊中的知識、場景與經驗進行些許修剪,實現認知的自成長。在短時工作記憶組塊區,包含大量的計算和推理,透過理解與決策實現機器具身智慧的控制方案,最終反映到物理空間具身行為的操作。長時記憶區組塊中的智痕元胞網路,積累了短時記憶經過複用、抽象、編碼建立的豐富而牢固的、重要的概念、經驗與知識,記憶時間長。智痕元胞節點與節點相互連線的邊的強度和變化,模擬突觸的可塑性,可以單向也可以雙向。機器的智痕元胞網路雖然從初始認知核帶來的元胞的總數量沒有太大的變化,但隨著認知的自成長可以重塑,即自我組織能力。有的智痕元胞逐漸對外有太多的連線,是記憶網路中的重要路由節點。而更多智痕元胞對外只有不太多的連線,是記憶網路中的平凡路由節點。更多的節點表現為網路的邊緣節點。還有些節點在網路拓撲中體現騎牆,介於兩個或者多個抱團節點叢集之間,可稱為騎牆節點。總體上,邊的連線度大致服從冪律分佈。相互連線的智痕元胞叢集透過外界刺激或者透過學習被啟用,重要節點和平凡節點的區分不是一成不變的,而是由外界刺激動態啟用的。記憶提取的是智痕元胞整體水平狀態,是記憶網路的整體具象,有時甚至是湧現。拓撲狀態數幾乎是無限的,因此概念或知識的表達幾乎是無限的。認知機器中PB級規模的神經元胞網路,如同網際網路搜尋用的網路架構,被稱為人工神經元胞網路。用智痕元胞模擬神經元記憶的殘痕,用智痕元胞之間的連線強度和變化模擬突觸的作用,用大規模人工神經元胞網路構成記憶網路。記憶網路在學習和進化過程中不斷地微重構,完成記憶的調整與控制,用當前記憶網路在不同側面、不同尺度上的整體拓撲狀態,表達並實現當前注意力對過去記憶的提取。在長期記憶中的許多智痕元胞常處於休眠狀態,某一時刻被覺醒的那一小小部分是依靠注意力——當前待解決的問題來啟用的,帶有不確定性,長期記憶的提取方式是再認知和回憶,這是與長時記憶中被喚醒的一個非常區域性的網路的聯想搜尋問題。記憶中可以有相互衝突的知識,不斷拉扯,形成決策。人工智痕元胞網路構造清楚了,機器的記憶智慧也就基本清楚了。它隨著認知的自成長,不斷地修剪權重,改變連線,成為一個具有小世界特徵的、無標度的複雜網路,具有抱團特徵、層次結構、自相似性和長尾分佈,可以用它來實現當前認知中不同尺度抽象記憶的形成、調整、控制和提取,成為記憶智慧。記憶智慧確保了多元認知,成為認知機器中多領域、多情境中計算智慧的邊界和約束。它是非單調的、進化發展的,在不同時刻、不同情境會有不同應對,不完全收斂,不完全自洽,不整體統一。
在認知的機器中,深度學習是基於記憶的經驗認知模式。它打破了演算法被困在程式裡面的窘境,開闢了用資料生成或者修改演算法中的引數,生成知識的一條道路,成為人工智慧歷史上的一個新的里程碑。但是深度學習不應該僅僅是預訓練、預程式設計,最好不把訓練和使用截然分開,要在即時的互動和迭代中進行深度學習,邊指導、邊學習、邊使用,自學習,自糾錯,微調記憶。概念由學習而產生,是新形成的記憶關聯的基礎,知識則是概念和概念之間的關係。記憶留存在大腦中被記憶網路動態重構並使用,這樣的記憶網路是疊層、多側面、多尺度的複雜網路,可能抽象成語言網路、情境網路、程式網路,語言網路又有多個側面,如語義網路、語用網路、語境或者語法網路。透過這些網路在不同尺度上的表現和狀態,生成概念、泛概念樹或者知識圖譜,其中概念或者泛概念樹是支援記憶認知的關鍵組成部分。它透過隨後在學習經歷中出現的刺激而被一次次啟用,所有這些同時發生的啟用形成了相互連線的記憶網路的整體具象,構成一次次記憶知識的提取。
不同的記憶認知任務,使用不同的標記和索引方法,最終可以在多個腦的記憶區得到相互印證的結果。首先,標記的智痕元胞僅透過相應的條件刺激而被啟用,而不會被與訓練經歷無關的刺激而啟用。其次,僅僅智痕元胞叢集的一小部分的再活化,理論上會導致整個叢集的再活化。此外,如果因為遺忘而淡化了一小部分智痕元胞或叢集元胞,並不一定會導致整個記憶表徵的破壞,可能只是適當地降低了記憶能力而已。相反,如果因為相同情境的頻繁感知和刺激,有可能會加深印跡,或者導致新的連線。還有,在沒有感知刺激的情況下,透過經驗的回憶也可啟用智痕元胞誘導記憶的提取,成為常識或者本能。最後,如果啟用機制缺失,即使智痕元胞存在,也會阻擋隨後的記憶提取,表現為記憶丟失。
2.3 機器具身行為的多重巢狀控制
機器具身智慧是所有人工智慧研究的出發點和歸宿。機器具身行為是思維、決策與控制的結果。認知機器中多重巢狀的互動迴路設計確保機器具身智慧的穩定性和可成長性,完成機器的使命,機器具身行為控制原理如圖3所示。這裡有三重巢狀迴路:最外層是當前位置環境變化的互動迴路,體現任務使命的對齊;中間層是當前注意力選擇的互動迴路,聚焦即時態勢;最內層是具身行為的運動學與動力學的互動迴路,體現自動反饋。三重巢狀控制涉及認知空間與物理空間。在認知空間中,進行情境感知、跨模態融合,形成瞬時記憶,在工作記憶中,它們通過當前態勢的“判斷黑板”,在記憶約束下進行計算,進而在當前環境下進行態勢判斷和推理,產生決策,同時在長期記憶裡進行記憶提取,用過去的經驗反饋當前態勢下的應對,用注意力選擇來聚焦當前態勢中的主要矛盾,用再認知的結果對知識、場景與經驗進行修飾,微調長期記憶。在物理空間中,它們實現運動學與動力學控制,完成機器具身行為動作,再由運動姿態感測器進行狀態反饋。透過多重巢狀的互動控制迴路,認知機器逐漸地理解人設定的任務目標,完成使命。
智慧機器與外部世界發生互動,在物理環境裡做出行為動作,並接收機器承載的感測器感知得到的反饋。感知和行為是機器具身智慧這枚“硬幣”的兩個面。這種互動是讓機器獲得認知動機和意圖,感知和預測外部世界時的正常途徑,也是強化學習、深度學習中正常的感知方式。互動才能與外部世界溝通,例如獎勵代表著人的意圖和目標,智慧機器總是希望能夠獲得最大化獎勵。實際上,認知機器始終都是在和環境的連續互動中體現認知行為的試探和反饋,互動認知不僅是馮·諾依曼架構中的輸入和輸出,也不僅是友好使用者介面設計、圖形互動介面設計、擬人化互動服務的方法學問題,它更是機器認知的自學習、自糾錯、自成長、知行合一、人機共生的問題。人工智慧過去十年中的標誌性成就——深度學習——要求海量的人工標註就可以看作是一種互動的過程。認知機器的最基本特徵是能夠在與環境的互動過程中學習和成長。無論是指導學習(Supervised Leaning,有人把它譯為監督學習,不很確切),或者半指導學習,或者自主學習,都需要不停地互動。認知機器的組成中,可能有定時定位定姿、語音文字、圖形影像等多類子部件,如各種雷達、攝像頭、語音文字通訊、衛星定位接收機等感知裝置。連線思維和物理世界最好的橋樑就是人體或者機器具身。認知機器的具身,可能是車輛、飛機、船舶、盾構機、多自由度機器人等,承擔與外界環境的感知和互動。互動感知是雙方無法單獨產生的,感知中有試探,有模仿,有反饋,是不確定性認知的重要來源,是機器進行決策的重要前提和實現手段。

圖3  機器具身行為的多重控制原理
2.4 可互動、會學習、自成長的認知機器的通用架構
認知機器已經越過了算力、演算法和資料3個硬核的階段。機器中的瞬時記憶組塊和短時記憶組塊,除了CPU,還可根據需求採用DPU、GPU、TPU、FPGA、SSD、搜尋引擎等並行處理單元,而計算組塊則可採用CPU和GPU等處理器實現,也有可能採用處理效率更高的3D存算一體化。有的組塊裡,DPU為核心,CPU圍繞DPU轉;有的組塊裡,GPU為核心,CPU圍繞GPU轉。總之,新架構中的系統架構一定是分散式的、並行的、異構的,甚至是超異構的,只要它們能夠和機器的時序整體上合拍,能即時地進行資料互動即可,認知機器的時間精度越高,並行效率越高。
可互動、會學習、自成長這三方面成為認知機器的新硬核,其最基本的特徵是能夠在與環境的互動過程中學習、糾錯和成長,可以接受指導學習和強化學習,也可以自主學習,增強記憶。認知機器的學習和作業,包括先入為主、賦予任務、引導、釋疑、解惑、互動認知、監督等有指導的學習。自主學習是把指導學習的結果轉為長期記憶的重要環節,例如複習、消化理解、自己糾錯。如果簡單地把指導學習稱為有監督學習,自主學習稱為無監督學習,就過於簡單化了。一次性學習之後常是短期記憶,間隔性地重複學習有利於形成和鞏固長期記憶,重複學習的時間間隔非常重要,充滿不確定性,體現自糾錯和長期記憶的自成長能力。ChatGPT在訓練過程中高薪聘請了“提示工程師”。同理,在認知機器中也需要“指導工程師”。人與機器能有效溝通完成預設任務,人教機器學,機器自主學,機器逐漸地理解人設定的任務目標,其統一的過程可稱為使命對齊,精準完成作業,具身體現智慧。機器會學習包括3個環節:專家操作,機器學習;機器自動執行,人干預;機器自操控、自學習、自糾錯、自成長。這3個環節迴圈迭代,實現有指導學習、半/弱指導學習、自主學習。可互動、會學習、自成長的認知機器的通用架構如圖4所示。

圖4 認知機器的通用架構
注意力機制觸發長期記憶,進行相關知識提取;短時記憶透過學習,形成並鞏固記憶智慧;記憶與計算協同,記憶約束計算,計算更新記憶,並利用計算智慧提高記憶智慧的可解釋性。
記憶、互動和計算三部分之間的資訊傳遞機制複雜並螺旋發展。每個記憶系統依然嵌有互動與計算子系統,但整體表現為記憶。認知機器通用架構可在結構上體現人腦不同記憶區不同記憶留存的認知網路,體現已有的人工神經元胞記憶網路節點中的印跡、概念、概念樹、知識圖譜中的不確定性和多索引機制,體現情境驅動的記憶智慧,實現了情境資料和知識模型雙驅動。而計算智慧作為認知機器通用架構中的一個重要組成,多種計算模型可以分別是已有的記憶對當前計算的多元約束和指導監督。
3
機器中的認知核和宕機後的再啟用
3.1 啟用機器的鑰匙:時鐘、時序和遞迴
機器中的軟構體是承載或者寄生在硬構體上的,如同人的精神寄生在硬構體之上一樣。當然,它也可以寄生在已有的其他軟構體上。機器裡一定要有一個最基本的時鐘,而時鐘賴能量為生,時間寄生在時鐘上,形成時序。啟用機器的鑰匙是時鐘、時序和遞迴。認知核中的物質硬構體和思維軟構體在加電後的糾纏,表現在時鐘、晶片、機器主機板、BIOS(basic input output system)和OS在自舉狀態的遞迴複用,才讓機器“活”起來。作為工具的機器,結構寄生在物質上。要啟用機器,需要能量,能量啟用時鐘,時鐘產生節律。如同生命有節律一樣,機器利用時鐘形成時間和節律,可以在當前的週期內為下一個週期提供一個更新的輸入,總是存在下一個週期能夠保持思維的連續性,機器思維才能活動起來。創造機器智慧這樣的人造物擴充套件人類智慧,這是圖靈的劃時代貢獻,堪與牛頓、愛因斯坦媲美,可惜很多人對此認識不足。正是圖靈和馮·諾依曼的計算機體系結構設計中的CPU,保證了指令和資料一樣儲存,指令和資料形式上並無區別。將程式指令儲存器和資料儲存器合併在一起,順序執行程式,讓機器能夠自舉。依靠只讀儲存器中的基本輸入輸出系統(ROM-BIOS)引導。基本輸入輸出系統BIOS是一組固化到只讀儲存器ROM晶片上的程式。在BIOS引導下,機器啟動時載入的第一批控制指令,所有後續的物質硬構體和思維軟構體,類似於承載生命基因編碼的DNA,被稱之為機器初始的認知核。這個只讀儲存器是把結構和時間完全寄生到物質和能量上的客觀存在,規定了機器基本的輸入輸出次序,包括開機後自檢程式和系統自啟動程式,為機器提供最底層的、最直接的硬體設定和控制,體現了硬構體和軟構體之間的糾纏,然後啟用作業系統。整個過程是認知核中的硬構體和軟構體糾纏的正反饋過程,導致湧現。物質、能量、結構和時間之間的這種糾纏狀態,可類比為“薛定諤的貓”,導致新的宏觀有序狀態,認知就緒,機器從原先的“死物質”變“活”了。
3.2 宕機後的再啟用
生命不能重來,機器可以關閉後重啟。認知核包含機器具身物質硬構體,如時鐘、積體電路晶片、主機板等,也包含思維軟構體,如機器指令、BIOS和OS等。機器如果沒有了能量供給,如斷電,便會停止工作;恢復供電後機器又可以再次自舉,透過啟用作業系統,重新進入認知的工作狀態。但是,矽基機器中的物質硬構體不能自繁衍、自成長、自修復,只能被組裝、被生產、被修復。硬構體老化了、失靈了,被修復之後可以重啟,死活多次。如果有新的硬構體、軟構體加進來,只要適配,升級之後,可以提高機器認知的效能。矽基機器可透過認知核更新,完成升級換代。
4
總結和展望
針對“生命是什麼?”“資訊是什麼?”“智慧是什麼?”“機器如何認知?”等當前全人類最為關注的基礎科學問題。本文在人類完全弄清楚非生命和生命之間的雙向轉變機理之前,試圖能夠弄清楚機器如何思維?如何像人又不像人?這就找到了從生命轉變到非生命的一個重要突破口,就找到了從碳基生命智慧轉變到矽基機器智慧的物理通道。
對於人來說,思維具有連續性、隨機性和模糊性,缺少形式上的精確性。如果將“翻譯”和“查重”這樣的認知任務擴大到檢查全球範圍的學術論文抄襲,這幾乎是不可能完成的事,但對於機器而言卻無太多困難。基於時序的機器認知,可以做到納秒、皮秒、甚至飛秒級的反應速度。倘若機器以飛秒計算,人以秒計算,一飛秒與一秒的比例是1∶1015,相當於一秒和3200萬年的比例。機器可以用皮秒和飛秒模擬人的思維活動週期。思維軟構體透過抽象和聯想,自我複製,自我拓展,引發類比,使得認知具有一般性和普遍性。機器可以用足夠多逼近無窮多,用足夠大逼近無窮大,用足夠小逼近無窮小,用足夠精確量替代連續量,模擬重演物理、化學、生物、材料等學科中大多數快速變化的過程,例如,透過虛擬現實展示單分子的振動和轉動、化學鍵的斷裂和形成等,可見機器暴力思維的威力。機器能透過暴力計算和暴力模擬,完成蛋白質摺疊的三維結構預測,並不奇怪。物質硬構體很難約束想象的範圍和思維的內容,思維如果不和物理世界即時溝通驗證,處理得不好,機器也可能過度幻想,陷入思維的死迴圈,難以自拔。
機器學習的結果是去微調機器裡的長期記憶,即微調人工智痕元胞的網路拓撲,實現認知的自成長。可喜的是,認知機器可以大批次複製,而且機器自身又可以持續學習。不久的將來,人與機器互動,人教機器,機器教人,協同創新。認知機器會越來越多地發明出新材料的配方,編寫出最新的樂曲,創作出更美的圖片和影片,自動證明新的數學猜想,製造列印各種複雜3D結構的形狀,提出新的學科假設,驅動產生新的科學發現。認知機器成為人類思維的超強加速器和智慧行為的超強放大器,人機互動協同創新,機器可以和科學家、工程師一同做出發現、發明和創造。至於是不是機器做出的創造,已經不再重要。人類需要認知機器,認知機器需要人類,互相激勵。人類依然是主宰,機器越智慧,人類也越智慧。
(參考文獻略)
引用格式:

李德毅,張天雷,韓威,等.認知機器的結構和啟用[J].智慧系統學報,2024,19(6):1613-1622.

LI Deyi,ZHANG Tianlei,HAN Wei,et al.Structure and activation of cognitive machinesJ].CAAI transactions on intelligent systems,2024,19(6):1613-1622.
全文下載連結:
作者介紹:

李德毅
清華大學博士生導師,中國工程院院士,歐亞科學院院士。中國人工智慧學會和中國指揮控制學會名譽理事長。主要研究方向為不確定性人工智慧、資料探勘、複雜網路、自駕駛和認知物理學。E-mail:[email protected]
更多內容,點選下方關注:

相關文章