文章轉載於新智元
本週一,人工智慧行動峰會正在巴黎舉行。
為了給這次的AI行動峰會造勢,法國總統馬克龍用上了人工智慧生成的偽造影片。
在社交媒體上釋出的一段影片中,馬克龍在他的偽造影片下面回應道:「做得好」。這些影片在幾個月前就已經開始在法國社交媒體上流傳。
馬克龍承認他的偽造影片在一些社交媒體圈子中變得流行了起來。
「更是重要的是,藉助人工智慧,我們可以做一些非常重大的事情:改變醫療保健、能源及我們社會的生活」,這位47歲的總統說。
他補充道:「法國和歐洲必須處於這場革命的中心,以抓住每一個機會,並推廣我們的原則。」
馬克龍這次為了AI峰會真的是拼了!足以看出法國對AI的重視。
在這次峰會的開幕式上,斯坦福教授,人稱「AI教母」的李飛飛博士受邀發表開幕演講。
李飛飛從五億年前生命感知能力的進化講起,一路講到圖靈時代,為人們展現了AI發展的宏大歷史脈絡。
接著,李飛飛講到了今年非常熱門的「智慧體」,與她目前的主要研究領域「空間智慧」與「具身智慧」。
同時,李飛飛也再次強調了她在多年探索中一以貫之的主張:「AI以人為本」(Human-Centered AI),展現了她在科學探索中濃郁的人文關懷。

1
從5億年前說起
李飛飛從五億年前那個連視覺的概念都還不存在的遙遠時代開始講起。
隨著時間的推移,簡單生物開始能夠感知周圍的世界,並做出反應。最初,感知是被動的,只是讓光線進入,而這一過程很快變得更加豐富和主動。
神經系統開始進化,視覺從「看」變成了「理解」,理解進而導致行動,而所有這一切最終催生了智慧,並永遠改變了地球上生命的本質。
到了20世紀中葉,艾倫·圖靈,這位偉大的英國數學家,在計算機尚未真正誕生之前,就已經在思考如何賦予機器可與人類比肩的認知能力。
「對我來說,他的寫作總是鼓勵人類大膽地想象思維機器」,李飛飛說,「正是這種好奇心和雄心,驅使了美國早期的計算機科學家們,他們不僅組織了第一個研究專案,探討思維機器的可能性,還創造了人工智慧這一術語。」
在1956年那個炎熱的夏天,這群早期的計算機科學家們,在達特茅斯的人工智慧夏季研討會上討論了這一問題,甚至提出兩個月內就能解決大部分問題,從而揭開智慧的神秘面紗。
不得不說,現在看來他們可能有些過於樂觀,但不得不佩服他們的膽略。今天,距離這個「兩個月」的專案已經過去了幾十年。
「但我們確實取得了一些實質性的進展。」

1
演算法、資料與算力
李飛飛表示,工智慧一直以來都是一個跨學科、充滿活力的領域。
「我們今天所處的現代人工智慧時代,正是三項極其重要但各具特色的技術和科學進展交匯的結果。」,她說。
首先是感知演算法的研究,研究生物如何感知世界,並逐漸形成數學模型,這些模型使我們能夠創造出更強大的機器。
繼艾倫·圖靈的假設之後,神經生理學家們為我們揭示了視覺皮層的神經處理結構,獲得了諾貝爾獎,並徹底改變了我們對視覺處理的理解。
與此同時,認知科學家們深入研究地我們的大腦,揭示了我們感知周圍世界的深度與複雜性。
科學的結論是,大腦與我們所處的環境是密不可分的,它是不斷在從環境中學習的。
「對我個人而言,作為在21世紀初成長起來的科學家,當時感知演算法幾乎是我所在領域的唯一關注點」,李飛飛表示。
而認知科學帶給她的啟示在於「規模」。演化與發育能如此有效地塑造人類智慧,是因為它們能利用大量資料來驅動我們的學習。
李飛飛和她的合作者、學生們推測,同樣的規律也適用於機器,只不過這一次,資料來自現代數字裝置和網際網路,而不再是依靠生物感官。
由此李飛飛所在的實驗室發起了ImageNet專案——它是第一個針對人工智慧的大規模網際網路訓練與評測資料集。
他們提出了一個關鍵假設:資料是讓神經網路等高容量演算法真正「活起來」的關鍵。
這個理念讓神經網路煥發新生,開啟了利用海量資料來推動AI進步的全球趨勢,也成為如今所說的AI「規模定律」(scaling law)的一部分。
然而,所有這些成就都離不開強大的計算能力。
最初的里程碑包括馮·諾依曼(Von Neumann)在上世紀40年代提出的計算機體系結構理論,它一直沿用至今,並在70年代初催生了第一批微處理器。
而令人感到有趣的是,正是電子遊戲推動了矽晶片處理速度的突破。1990年代初,隨著遊戲圖形需求的增加,圖形處理單元(GPU)在短短幾十年內爆發式增長,這最終成了人工智慧網路演算法能夠利用網際網路大資料的最後拼圖。
「如果你是遊戲愛好者,那我們要感謝你。」,李飛飛現場表示。
1
AI的飛躍
「接下來的發展就不僅僅是歷史,它是構建未來的配方。」
2012年,李飛飛的實驗室在ImageNet挑戰賽上首次實現了這三種技術的結合——演算法、資料和計算,規模足夠大到幾乎一夜之間改變了AI領域。

如今,十多年過去了,探索仍在繼續,依然看不到盡頭。
毫無疑問,歷史學家今後一定會把這段時間稱作「真正的第一個AI時代」,李飛飛表示。
「從任何一個你能想到的指標來看——無論是計算機專業中人工智慧方向的學生人數、投資金額、新創企業數量,還是其他方面——AI都是一場在深度和廣度上不斷擴大的革命。」她說。
現在,大型語言模型把AI所依賴的三大要素——演算法、資料和計算力——都推向了更極致的規模。它們採用了一種名為「Transformer」的新型模型架構,訓練資料幾乎覆蓋了整個網際網路,並在數量驚人的最新、最強大晶片上執行。
結果是,機器的能力比過去十年來的任何一次突破都更為迅猛。
現在我們幾乎將「AI可以用自然語言流暢地跟我們對話」視為理所當然,AI能回答我們提出的幾乎任何領域的問題,甚至能夠生成各種複雜形式的內容——從影像、聲音、音樂到影片,無所不包。
不僅如此,在一些難度極高、對人類來說具有挑戰性的任務上,AI的成績也像坐火箭一樣往上躥,幾乎呈現出垂直上升的趨勢。
1
從「被動感知」到「主動行動」
不僅能夠流暢使用語言,大型語言模型現在朝著更具「主動性」的方向發展——它們學會了將複雜任務分解成若干步驟,並逐步規劃如何實現目標。
人們目前將具備這種能力的AI稱作「智慧體」。
我們目前所討論的還大多停留在「語言智慧」層面,但人類之所以為人,是因為我們擁有更全面、更完整的智慧。
李飛飛表示,從「被動感知」到「主動行動」的新階段正在到來。
在李飛飛自己的研究領域——涉及攝像頭和機器人,她看到AI正逐漸具備「創造、理解、推理和互動」這些維度,進而在數字或物理的三維空間裡與人和環境相互作用。
李飛飛稱其為「空間智慧(spatial intelligence)」和「具身智慧(embodied intelligence)」。
在現場,李飛飛舉了一個例子,假設你看到下面這樣一張圖片,視覺智慧很容易讓我們識別出裡面的所有物品:那隻貓、那盆植物、那張桌子,以及那杯牛奶。
但是,這就代表我們感知系統的全部功能了嗎?
顯然會有不少人不僅僅「看懂了」那張圖,還會產生「哎呀,快伸手把那杯牛奶抓住,別讓它掉到地上打碎了!」這樣的衝動。這個小例子清楚展示了「從觀察到行動」之間有多麼巨大的差別。

「這也說明了我認為我們如今所處的拐點:AI正從觀察者變成與我們並肩行動的執行者。」李飛飛說。
如果AI真的不再只是「會思考的機器」,而是同時成為「會行動的機器」,那麼我們整個社會在引導這項技術發展方向時,就承擔著更加緊迫而重大的責任。
「我認為毫不誇張地說,這一切正將我們帶到一個對整個人類文明至關重要的歷史關頭。」李飛飛強調,「我們要如何應對?」
1
AI以人為本
李飛飛表示,有一個主線在她的多年探索中始終貫穿,那就是「以人為本的AI(Human-Centered AI)」,並且它包含三個核心價值:尊嚴(dignity)、能動性(agency)和社群(community)。
首先是尊嚴。當面對越來越強大的技術時,我們人類常常會反思:到底是什麼在定義「我們是誰」?
如果把我們能做的所有事情都一一剝離,剩下的、那份能夠自主決策並親自行動的尊嚴感,依然是我們作為人的本質之一。
李飛飛在現場舉了一個例子:如何讓機器人和AI技術幫助那些嚴重癱瘓患者重新獲得自主行動的可能。
在這項斯坦福大學的研究中,李飛飛的學生利用完全「非侵入式」腦電圖(EEG)記錄獲取使用者的思維訊號,透過AI演算法對這些訊號進行解碼併發送指令給機械手臂。最終,機械手臂在患者「意念」的控制下做出包括烹製日式壽喜燒在內的一整套烹飪動作。
這便是AI幫助人們重新贏得自主與尊嚴的一個示例。

其次是能動性(agency)。李飛飛表示,她所在實驗室多年來的核心理念就是探索如何讓AI「增強(augment)」人類的能力,而不是取代人類。
李飛飛相信AI可以幫助我們從創造力到醫療保健、從科研到製造業,在方方面面獲得新的能力。
「因為在許多方面,AI的技能與人類的技能其實是互補關係。我們完全可以利用這個合作者來強化自身的能力。」,她說
最後是社群(community)。過去十年裡,科技也常常被詬病「把人們越拉越遠」,催生了各種「資訊繭房」和「狂熱話題誘餌」等。
如今,AI又一次走到了十字路口:一條路是讓AI主導社交體驗,甚至為每個人定製內容並強化他們的偏見;另一條路則幫助我們構建更健康、更強大、更具有包容性的社群,比如藉助AI教育助手,讓更多人(包括孩子和成人)獲得學習的機會。
這裡,李飛飛舉了兩個簡單案例:一個是利用AI和虛擬現實技術,為有閱讀障礙的大學生提供個性化輔助工具;另一個是美國水牛城大學開發的一個AI專家系統,用來緩解語言治療師(speech-language pathologist)短缺的問題,幫助對3至10歲兒童進行早期語言干預。
1
理性、務實與多方協作
最後,李飛飛談了一下對於AI治理問題的看法。
首先,她認為務必要基於科學而不是科幻來進行治理。「我們應該用更科學的方法來評估和測量AI的實際能力與侷限,從而制定更加精準、可落實的政策,並且基於現實而非幻想。」她說。
其次,我們需要採取務實的態度來看待AI治理。
李飛飛認為,不應該只顧在上游阻礙對這項仍然非常年輕的技術的進一步探索與研究;相反,應該更多關注它的具體應用場景,確保它能被善加利用,並對可能產生的不良後果加以防範。
最後,她說我們必須投入更多資源,構建更健康、更蓬勃的AI生態系統,讓學術界、創業者、開源社群以及公共部門都能與大企業一道參與進來、發揮關鍵作用。
如上面李飛飛所說,現代AI之所以興起,主要歸功於演算法、資料和計算力這三大要素的結合,李飛飛擔憂地表示若這三種關鍵資源僅僅掌握在少數幾家公司手中,AI生態系統就會面臨好奇心驅動的研究乏力、頂尖教育人才受限、開源專案缺少資源、多學科交叉探索不足等諸多問題。
最後,李飛飛提出一種新的挑戰:與其再問「我們能否創造AI」,不如問「我們能否創造一股向善的AI力量」。
「今天我想向各位發出邀請:讓我們共同努力,去構建以人為本的AI。」她最後說。
參考資料:
https://techcrunch.com/2025/02/10/ai-pioneer-fei-fei-li-says-governments-should-embrace-a-pragmatic-attitude-instead-of-an-ideological-one-on-ai/