

最近微信改版,容易找不到尹哥的文章,大家記得把尹哥設為星標⭐️ 哦~
尹哥贈書福利
各位小夥伴
又到福利大放送時間啦!
你知道哪些和大腦演化相關的知識?
歡迎留言分享
我們將從
回答互動問題+轉發本文至朋友圈
的小夥伴中
隨機抽取3名幸運讀者
分別贈送

《智慧簡史》
各1本
福利活動常有
關注尹哥不迷路
活動截止時間:6月26日
(將會在6月28日的推文裡公佈獲獎名單)
活動解釋權歸「尹哥聊基因」所有
如果你能暫時擺脫忙碌的日常生活和勾心鬥角的地緣政治,有時間想一點兒更大的事兒,我先給你講個故事。
地球上一切哺乳動物的祖先叫犬齒獸(cynodont),大約最早出現在距今2.6億年前。它的身體就像今天的老鼠一樣小,力量和速度都一般,不可能跟當時地球的主宰恐龍爭鋒,所以生活很低調,平時只能躲在洞穴裡。

但犬齒獸也有自身的優勢:它是溫血動物。這意味著晚上氣溫比較低的時候,它仍然可以靈活行動。對比之下,恐龍作為爬行動物,體溫會和氣溫一起降低,身體隨之變得僵硬而難以活動。所以犬齒獸擁有夜晚。
但溫血的缺點也很明顯,那就是需要更多熱量,為此必須得吃很多東西才行。犬齒獸一般吃昆蟲和一些小動物,為了躲避恐龍,基本上只在晚上出來活動,可晚上又沒那麼容易找到食物,生存相當艱難。
到了距今大約1億年前,犬齒獸的某一個分支的後代,演化成了哺乳動物。其他都不論,它有個最新的特點是大腦中長出了新皮質。這給它帶來了“超能力”。
你現在待在洞穴裡,外面視線可及的範圍內有個獵物,你很想出擊。
爬行動物面對這種局面都是感覺不錯就出手,萬一中間遇到什麼事兒就臨時見招拆招,但我們的哺乳動物祖先不會如此。它的“超能力”是想象和短期計劃。
等會兒我衝刺,獵物會往哪個方向跑?我追過去會不會遭遇恐龍?如果恐龍來了我該往哪跑?我逃生的機會大不大?
它會把這一切都想好再行動。謀定而後動,一擊不中全身而退。
我們的身體素質不如恐龍,但我們是專業殺手,恐龍不過是街頭混混。
我們的祖先就這樣在恐龍的世界中默默地獲得了一個小小的生存優勢。但我們並沒有擊敗恐龍。我們能夠接管世界完全是因為6600萬年前,一顆小行星撞擊地球把恐龍給滅絕了……而我們的祖先因為體形小且藏身在洞穴中躲過了那一劫。
我認為這個故事告訴我們兩個道理。一是你需要智慧,智慧的優勢能彌補其他條件的不足。二是你有多大智慧、你的智慧有多大發揮,並不完全取決於你,而是更多地取決於歷史的程序。
麥克斯·班尼特(Max Bennett)的《智慧簡史》,說的就是在生物演化的大歷史程序中,我們的大腦如何獲得一項項新能力。這些能力在當時都是能顛覆世界的超能力。

班尼特是個年輕的人工智慧(AI)領域創業者和研究者。他寫這本書,是因為他想讀這本書——因為他想知道大腦智慧的演化對人工智慧有什麼啟示。啟示很多。班尼特將生物大腦的演化分為五次突破,這些突破都能與AI聯絡起來。
第一次突破是轉向。這是5.5億年前生物界最初的大腦擁有的功能。這個功能並不簡單,它能透過條件反射區分好壞刺激,簡單地權衡利弊,比如判斷利大於弊就行動,還能知道自身的狀態,比如現在自己餓不餓,還有了情感,而大腦只需要數百個神經元就做到了這些。
第二次突破是脊椎動物的強化學習。這是大腦對多巴胺的高階運用:條件反射只能讓你對“好事將近”做出反應,而強化學習則允許你量化感知那個好東西存在的可能性有多大、你距離得到它的時間有多近……這讓脊椎動物能透過一些複雜動作達成目標,並且有了“好奇心”。
強化學習大大提高了AI的能力,因為它的思路是“獎勵過程,而非只獎勵結果”。比如AI下棋,可以從每一步中學習好棋和壞棋,而不是等到漫長的棋局結束後才知道這一盤該不該學。強化學習還提升了AI的格局,因為有時候,哪怕沒有明顯的收穫,只是探索了一個新地方,這種新奇感也是獎勵。

第三次突破,哺乳動物長出了新皮質。正如我們前面所說,新皮質帶來了想象力,哺乳動物在做什麼事情之前可以先在頭腦中想象這件事,進行一番內部模擬,從而做出計劃。如果說反射和強化學習都是快思考,那麼新皮質則讓哺乳動物有了慢思考的能力,也就是對幾個想象的結果進行權衡比較。這相當於丹尼爾·卡尼曼在《思考,快與慢》一書中說的系統2思維。
對AI來說,大語言模型每一次“生成”什麼作品,都相當於一次想象;而以OpenAI的o1、DeepSeek的R1為代表的最新推理模型,則相當於對各種想象做一番評估再走下一步,這是系統2思維。這也是AlphaZero下圍棋時針對每一步先快速生成幾個選項,然後對每個選項做深度評估,再決定怎麼走的路數。
第四次突破是靈長類有了心智理論,能模擬他人的意圖、想法、知識和情緒。這讓靈長類成為動物世界唯一會操控政治的物種,我們能猜測誰是敵人、誰是盟友。心智理論能力又附帶了兩項新能力:一是模仿學習,現在我們能知道別人做某個動作的意圖是什麼,所以我們能模仿他,達成同樣的目的;二是把自己的心智也放入模擬之中,從而能夠對未來做一番長遠計劃,比如在秋天為冬天儲備物資。
截至2025年初,AI在心智理論方面還有待突破。大語言模型有時候能猜到你在想什麼,但很不穩定,而且這不是它的正式用法。我們期待AI智慧體(agent)有一定的自我計劃能力,但目前還不成熟。
第五次突破是人類的語言。語言不是天生的,而是一種後天學習的、社會化的符號系統。沒有任何理由要求這個聲音代表這個意思,這只是我們的約定。而有了這個約定,我們就可以直接傳遞想象或模型,而不必再依賴動作示範。語言允許我們傳承複雜的知識。語言讓人類爆發了文明。
對大語言模型的一系列研究表明,AI似乎已經“理解”了我們的語言,而不只是背誦它學過的語料。現在AI已經不僅能生成文字,還能編碼和解碼人類的大量抽象規則與資訊。這是神奇的突破。
類比AI,我們可以想象——沒錯,我們會想象——一個家用機器人的故事,它最初的名字叫K1。
K1只有一個功能——打掃衛生,只有反射反應,遇到汙漬就擦拭,技能十分簡單。
K1升級到K2,獲得了強化學習能力。在每次完成清掃或者幫助主人做飯時,它會收到“好”或“不好”的評價。好就加1分,下次還這麼做;不好就減1分,下次改正。它逐漸學會了試錯:在哪些情況下可以提高工作效率,如何擺放廚具能讓主人更滿意……它可以做些複雜動作了。
K3直接獲得一個新硬體,一個新皮質運算晶片,這讓它有了先模擬再行動的能力,用時髦的說法叫“數字孿生”。有一次小主人半夜起床找牛奶,K3模擬出他的路線是通往冰箱,並且有可能被冰箱前方的椅子腿絆倒,就趕緊走過去給小主人引路。
K4不但能預測人的物理狀態,而且能推斷人的想法和意圖。它開始關注家庭成員的情感交流!小主人把牛奶灑在了地板上,以前K1肯定會直接去打掃,現在K4卻想到,也許小主人這麼做只是為了引起媽媽的注意?啊,畢竟媽媽太忙,已經很久沒有抱過他了。K4選擇了站在一旁播放背景音樂。
也許K5在那種情況下會直接開口說話,因為它通曉人類的語言,非常善於溝通,而且能理解任何抽象知識。
現實世界中AI並不是按照這個順序演化的。我們的AI已經在相當程度上有了語言功能,但它還不是一個很強的機器人,它在物理世界的動作很笨拙。沒想到實現第五次突破比實現輕鬆做飯還要容易一些。
班尼特推測,大腦的第六次突破,也許是人和AI的某種結合。不過我認為AI應該會比人類先迎來下一次突破,因為它們的演化速度比我們快多了。那會是什麼突破呢?

也許是同時模擬有著不同規則的多個世界。也許是跳出因果框架,用全新的方法總結世界的規律。也許是跨模態感知,比如隨時附身在任何感測裝置上,用各種訊號全面瞭解正在發生什麼,實現無所不在的全知。也許是自己訓練自己,自己迭代自己……
我們無法預測下一次突破是什麼,但是這本書中的歷史一再告訴我們,小小的突變也會給世界帶來天大的改變。
藍細菌(也稱藍藻)學會光合作用,給地球帶來大氧化事件,這個事件的高潮是生物史上第一次大規模滅絕,因此又被稱為“氧氣大屠殺”。
微生物進化出有氧呼吸,讓地球生態進入吃與被吃的軍備競賽。
陸地植物的繁盛迅速消耗了大氣中的二氧化碳,導致全球變冷,海洋結冰。
海洋結冰讓動物向陸地發展,這才有了爬行動物和哺乳動物的恩怨……
歷史還告訴我們,大腦的突破,也是偶然事件的結果。比如小行星撞地球滅絕了恐龍,才給了哺乳動物大發展的機會;非洲突然多了個大裂谷,東部森林變成草原,人類祖先才開始直立行走;不斷發生的氣候變動,讓我們的祖先必須成立高水平的狩獵組織,必須加強群體協作,大腦的體積才越來越大……

簡單地說,世界是可以被突破顛覆的,突破是不需要特殊理由的。你所以為的正常生活,只不過是地球歷史中的一個短暫狀況。
給世界帶來深遠影響的,往往不是穩妥漸進的改良,而是危險的、曾經冗餘的、不合常理的突變。
而下一次突變就在眼前。也許這本書能給你一點歷史定力,到時候不至於只是反射式地大驚小怪、手忙腳亂,也許你能有點強化學習能力,有點想象和計劃,有點心智理論,有點抽象能力。
你會少一分被動,多一分主動。
萬維鋼,科學作家,得到App精英日課專欄作者
— END —




