
—- 本週為您解讀 ③個值得細品的 AI & Robotics 業內要事 —-
1. Nature 熱議論文證明「語言不是思考工具」,LLM 可能要學不會推理了?
「語言≠思維」的論文引起了哪些討論?論文觀點和喬姆斯基唱衰 ChatGPT 有何關聯?為什麼研究語言和思維的關係很重要?哪些證據說明語言和思維關係不大?語言在人類溝通系統是什麼角色?…
2. Super App 引發的迷思:在泡沫與難題中尋找大模型落地的答案
為何 Super App 仍沒有出現?英偉達股價暴漲又暴跌,是人工智慧泡沫還是人工智慧硬體的泡沫?經典的 PMF 理論在大模型時代是否仍適用?大模型應用能否賺錢落地看哪些關鍵指標?AI 巨頭們找到可行的商業模式了嗎?大模型的潛力已經到頂了嗎?面臨哪些不得不解決的技術難題?…
3. 深度剖析:構建 10 萬卡 GPU 叢集需要知道哪些事?
構建 10萬 H100 GPU 叢集要多少錢?如何才能壓榨GPU叢集效能極限?GPU叢集成本與效能如何平衡?用叢集訓AI模型如何保證穩定?GPU叢集怎麼保證可持續發展?…
…本期完整版通訊含 3 項專題解讀 + 26 項本週 AI & Robotics 賽道要事速遞,其中技術方面 9 項,國內方面 7 項,國外方面 10 項。
本期通訊總計 2638 字,可免費試讀至 10%
消耗 99 微信豆即可兌換完3整本期解讀(約合人民幣 9.9 元)

要事解讀① Nature 熱議論文證明「語言不是思考工具」,LLM 可能要學不會推理了?
日期:6 月 24 日
事件:MIT 和 UC 伯克利的研究者近期釋出的論文《Language is primarily a tool for communication rather than thought》指出「語言不是用於思考的工具」,引發了 AI 社群的大量關注和對 LLM 推理能力的熱議。
論文都引起了哪些討論?
語言是人類智慧的一個決定性特徵,但它所起的作用或多或少一直存在爭議。《Language is primarily a tool for communication rather than thought》提供了神經科學等相關學科角度的最新證據,以論證現代人類的語言是一種交流工具,這與我們使用語言進行思考的流行觀點相反。這一論點和此前 Yann LeCun 和喬姆斯基等人在唱衰 LLM 的理由似有相關,因而引發了大量討論。
1、在論文釋出前,業界關於 LLM 是否具備推理能力或擁有智慧一直存在爭議。以 Yann LeCun 為代表的一種聲音認為,LLM 不具備理解、記憶、推理、規劃這四項智慧的基本特徵,是通往 AGI 的一條歧路。[18]
① LeCun 曾在不同場合對自迴歸 LLM 進行批判,因為它們雖然表現驚人,但很多問題難以解決,包括事實錯誤、邏輯錯誤、推理有限、容易生成有害內容等,重要的是,這類模型並不瞭解這個世界底層的事實。
② 此外,LeCun 在近期的一場訪談中指出,語言是對現實的一種簡化表示,人們在推理時並不像想象中那樣頻繁地使用語言。同時,人類大部分知識與語言無關,僅透過語言來構建智慧系統是不足夠的。
2、另一方面,美國哲學家、語言學家、認知科學家諾姆・喬姆斯基在 2023 年對大語言模型的批判文章同樣引起了極大關注。[19]
① 喬姆斯基強調人類大腦與機器學習模型的根本區別。人類大腦是一個高效且優雅的系統,能夠從有限的資訊中運作;它不尋求推斷資料點之間的直接相關性,而是尋求解釋。
② ChatGPT 等機器學習模型雖然能夠生成看似人性化的語言,但這些模型缺乏智慧的關鍵能力。它們無法進行真正的因果解釋,只能進行描述和預測。
3、MIT 的論文從腦神經研究的角度解釋了語言和思維及推理能力無關。論文在釋出後得到了大量轉發分享,並在 AI 社群中引起熱議,許多網友就論文的觀點和當下大語言模型的發展情況展開討論。
① 知名 AI 研究員 Hardmaru 在社交平臺上轉發分享了該論文,Yann LeCun 也轉發分享,對思維不等於語言表示贊同。[20]
4、有網友認為 LLM 在處理和表達抽象思維方面具有潛力,但這種潛力尚未被充分探索和實現。[20]
① 抽象概念是人類長期擁有的,它構成了我們思維的高階領域。
② 語言是一種交流工具,而 LLM 是在語言的基礎上,透過書籍和文字訓練所得,並不直接反映我們的思維。
③ 但 LLM 中的潛在空間代表了一種高階抽象形式,它能夠將大量無序的文字資訊進行壓縮和向量化儲存,之後還可以進行解壓縮,但很少有人深入研究 LLM 以解鎖這種能力。
5、有網友認為語言是一種表達能力,不是直接的推理能力。但是,大量推理的表達堆積起來,他也形成了基於統計學的推理能力,所以應該說大模型不具備建立推理邏輯的能力,而不是沒有推理能力。[21]
6、有網友指出,該論文和喬姆斯基、LeCun 的觀點具有一致性。[21]
① 他表示,喬姆斯基脫胎於維根特斯坦的觀點也認為語言的第一功能是思維。但他指的語言其實是幫助人們掌握具體語言的認知能力。
② LLM“掌握”語言的方式與人類完全不同,因此缺少了功能後沒有推理能力。
論文為什麼要研究語言和思維的關係?
1、該工作指出,儘管語言是人類的一個定義性特徵,但語言的確切功能和起源的驅動因素一直是跨學科激烈討論的話題。而目前主導了討論的話題是兩個並不互相排斥的假設:
① 一是語言主要服務於溝通功能,主要用於讓人類彼此分享知識、思想和感受。
② 二是語言會調節思維和認知,這一假設又根據主張的強烈程度分為多個具體的觀點。如最強烈的主張認為語言對所有形式的(至少是命題性)思維是必需;較弱的主張認為語言可能只是促進某些思維和推理的關鍵/部分因素。
2、從進化適應性的角度來看,語言的溝通和認知功能都可以提供適應優勢。然而,論文強調關於認知特徵的進化起源的假設是出了名的難以評估。
3、對於語言的功能和它在人類認知中的作用和重要性,研究者認為當下是一個展開討論的成熟時機,具體原因有兩個:
① 首先,過去二十年在解讀語言的神經結構方面取得了重大進展,為評估語言處理機制在各種思維形式中的參與提供清晰的“目標(Target)”。
② 其次,大量不同語言的語料庫和基於資訊理論的強大計算工具的出現,為嚴格描述語言系統提供了可能。
論文從哪些維度評估得到「語言≠思維」的結論?
1、該工作回顧了過去二十年的研究工作,提供了神經科學等相關學科角度的最新證據,以論證現代人類的語言是一種交流工具,這與我們使用語言進行思考的流行觀點相反。
2、就語言在思維中的作用,研究者聚焦於該問題中以往出現的不同觀點的多樣性和理論複雜性,而後透過不同的方法展開分析。就目前而言,有關語言在思維中作用的觀點涉及四個維度:
① 第一個維度關注語言對思維的影響範圍,其主張由強到弱涵蓋:從聲稱所有的思維(至少所有命題性思維)都需要語言表徵,到聲稱只有某些特定型別的思維需要語言。
② 第二個維度關注語言對思維的重要性程度,其主張由強到弱涵蓋:從聲稱語言表徵對思維是必需的(即沒有這些表徵的訪問,思維就不可能發生),到聲稱它們只是增強或促進思維。
③ 第三個維度關注思維和所涉及語言表徵的性質,一些理論強調所有自然語言共有的特徵(如詞彙和語法結構),其他理論關注特定語言獨有的特徵(如某些語言的特有的概念詞彙和標記)
④ 第四個維度關注語言對思維影響的時效性,部分主張認為語言在認知能力發展中起到關鍵作用,尤其是在兒童時期,而成熟的大腦可能不再需要語言來支援思維。
3、就不同維度所涉及的主張,論文從個案研究、神經科學的研究和心理學實驗等方式進行評估和驗證。
① 論文指出,對於較為極端的主張,比如所有形式的思維都需要語言表徵的說法最容易被證偽。
② 對於關注部分型別思維需要語言表徵的主張,研究者透過明確定義相關思維的範圍,讓假設在經驗上可以檢驗和評估。
③ 對於生成語言表徵會促進思維發展的主張,研究者透過明確觀察條件,並進一步描述該假設背後的神經學機制進行評估(目前的證據仍然複雜且有爭議)。