在 DeepSeek 激起千層浪的時刻,作為技術開源最忠實的擁躉,楊立昆為 Deepseek 發聲:「與其說是中國在人工智慧上超越美國,正確的看法應該是開原始碼正在超越私有模式。DeepSeek 從開放研究和開放原始碼中受益(例如來自 Meta 的 PyTorch 和 Llama),提出了新想法,並將它們建在其他人的工作之上。而因為他們的作品也是開源的,每個人都可以從中獲益。這就是開放研究和開放原始碼的力量。」楊立昆一直不遺餘力地強調 AI 競爭中「開源」的重要性,在前陣子他參加由約翰霍普金斯大學舉辦的講座上,面對矽谷知名記者 Kara Swisher,他仍然用到了 PyTorch 和 Llama 作為例子。同時,他的語出驚人也沒有改變,分享了許多別具一格的觀點:一昧給 AI 研究和開發加限制,企圖用這種方式避免危害,是一種適得其反的做法,是出於 AI 技術的錯誤理解。人類認為語言是智慧的頂峰有點違反直覺。它實際上很簡單,因為它只是一系列離散的符號。人工智慧不應該侷限於語言。目前為訓練大模型而燒的錢不冤枉,那是面向未來的長期投資。以下為訪談內容整理,有所刪減與編輯。 關注 AI 第一新媒體,率先獲取 AI 前沿資訊和洞察Kara Swischer:對於那些不知道 AI 已經和我們相處了有一段時間的人來說,現在來到了一個認識它時刻。你是 Meta 的首席科學家,負責監督世界上一些資金最充足的 AI 研究。作為一名科學家,你也非常直言不諱,是社交媒體上最有趣的人,不是很多科技行業的人在這樣做,我希望你談談你為什麼這樣。Yann LeCun:你知道,我是一名科學家。我是 Meta 的教授和高管,我非常高興在 Meta 我可以有獨立的聲音。這也反映在我在 Meta 的研究實驗室裡,我們以開源方式釋出我們所做的東西,我們對事情和觀點都非常開放。Kara Swischer:為什麼你去了 Meta 這樣的地方,而不是一所研究型大學或其他地方,你的影響力是什麼?Yann LeCun:我也有自己的學術道路。我是紐約大學的教授,當扎克伯格 11 年前來找我時,我一直在紐約大學任職,他要求我為 Meta 建立一個基本上只是 AI 的研究實驗室,這個願景將產生重大影響。我告訴他,我只有三個條件:我不會離開紐約,我不會辭掉在紐約大學的工作,我們要做的所有研究都將公開,我們將釋出我們所做的一切。他都答應了。我在那裡有機會從零開始建立一個工業研究機構,並基本上以我認為合適的方式來塑造。我在這方面有一些經驗,我在貝爾實驗室的職業生涯就是這樣開始的。所以我對如何在行業中進行雄心勃勃的研究有一些經驗,所以我認為這是最令人興奮的挑戰。Kara Swischer:許多研究都是在學術界進行的,早期的計算機研究已經完成,現在已經遠離了學術界。你現在的工作都在做什麼?Yann LeCun:我喜歡科研,在我的職業生涯中,我有很多機會成為 AI(工程師)。在 Meta 四年後,我成為了首席科學家,現在這是一個頂好的工作:我是高階副總裁,但沒有人要向我彙報,沒有一個團隊需要我來帶。Kara Swischer:從你的角度來看,對於 AI 的監管應該是什麼樣的?Yann LeCun:在過去的兩年裡,人們一直在爭論,隨著 AI 變得更加強大,它是否變得危險——不是產品危險,而是技術本身。因此,是否應該有一些法規來限制 AI 系統。我一直反對這種想法,限制研究和開發非常適得其反,它是基於對 AI 潛在能力的錯誤思考。AI 將會接管世界或者其他什麼的,我們離這個目標還很遠。所以眼下任何的開發和規範研究,都是適得其反。關於 AI 安全是重要問題,是值得和需要討論的問題,但是對自由競爭的限制完全不合理 。Kara Swischer:最近有許多大公司都在開展 AI 代理的產品或者功能,我想了解一下 Meta 在這方面的進展。你們釋出了 Llama 3.3,跟其它型號比它怎麼樣?Yann LeCun:Llama 跟多數其它大模型之間的區別在於它是免費和開放的,你可以修改、編輯和使用它。在絕大多數許可中,如果你對模型進行了一些修改並且想在產品中使用,你也必須以原始碼的形式釋出你的修改。這樣可以讓軟體快速發展。多年來,開源軟體作為分發軟體的一種方式取得了驚人的成功,整個網際網路都執行在開源軟體上,世界上許多計算機都執行在 Linux 上,幾乎所有計算機都執行在 Linux 上,除了一些桌上型電腦和一些 iPhone,你的車裡可能有 10 臺計算機執行 Linux。這不是靠設計,只是市場力量自然而然地推動行業選擇開源。
現在是 AI 時代,是否開源的問題很複雜,因為當你構建 AI 系統時,首先,你必須收集訓練資料。其次,你必須在資料上訓練所謂的基礎模型,並且訓練程式碼和資料通常是不分發的。因此,例如,Meta 不會分發訓練資料,也不會分發訓練程式碼,分發的是經過訓練的基礎模型。它帶有開原始碼,這允許您執行系統並在任何您想要的地方進行微調,而且你不需要支付 Meta 費用,也不需要詢問。Kara Swischer:那為什麼更好呢?你提出了所有其他人都不是的論點,他們是封閉的系統。有一些開源的,但大公司都閉源了。Yann LeCun:可能是為了獲得商業優勢,比如,如果你想直接從這種型別的產品中獲得收入,並且你認為你在技術上領先,或者你認為你可以在技術上領先,你的主要收入來源將來自這些服務。那麼也許有一個觀點是要保持你的壁壘。但對於 meta,情況並非如此。對於 Meta,AI 工具是一整套體驗的一部分,這些體驗都由廣告資助,因此不是主要的收入來源。另一方面,我們認為平臺會發展得更快。事實上我們已經看到這一點(的效果),而且是更具創新性的。Kara Swischer:有一種批評聲音是你們落後了,而(開源)是你們追趕的方式。Yann LeCun:現在是一場全新的競爭,對吧。首先你必須意識到,除了谷歌之外,行業中的每個人都使用名為 PyTorch 的開源軟體平臺來構建 AI 系統,該平臺主要是在 Meta 開發的。Meta 將其所有權轉讓給了 Linux 基金會。所以它不再由 Meta 擁有,但是 OpenAI,Anthropic,每個人都使用 PyTorch。如果沒有 Meta,就不會有 ChatGPT 和 Claude,以及所有其它東西一樣,或者不會達到今天的程度。OpenAI 在不保密的時候做出了一些貢獻,Google 在某種程度上開放出來了,雖然不是完全,但是 Anthropic 從未公開過,他們試圖秘密地推進這項技術。我認為我們可能要承認,Meta 是一個相當大的研究組織,叫做 FAIR,以前意思是 Facebook AI Research(Facebook 人工智慧研究院),現在意思是 Fundamentally AI Research(基礎人工智慧研究院)。那裡有 500 人,我們正在研究的是真正的下一代人工智慧系統,超越大語言模型,超越聊天機器人。Kara Swischer:你管它們叫 LCM(Large Concept Model),一種新模型對嗎?Yann LeCun:那只是某一部分。過去,有些人有這樣的想法:把模型放大,並且用更多的資料和更多的計算來訓練它們,某種程度上,人類水平的智慧將從中產生。我從來不相信這個概念。Ilya 是著名的那個概念的信仰者。現在,顯然不再是這樣了,對吧?
在本月召開的 NeurIPS 大會上,Ilya表示預訓練即將終結Kara Swischer:我們已經到達終點,沒有更多的資料了,是嗎?Yann LeCun:很明顯,我們在這些系統的效能上已經達到了一個天花板,因為我們基本上已經用盡了自然資料,就像網際網路上所有公開可用的文字目前都被用於訓練所有這些 LLMs 一樣。所以人們在生成合成資料之類的東西。所以它達到了飽和,我們正在研究的基本上是下一代人工智慧系統,不僅僅是基於預測下一個單詞。一個大語言模型之所以被稱為大型語言模型,因為它基本上是被訓練來預測你收集的文字中的下一個單詞,通常大約 20 萬億個單詞,這是網際網路上所有公開可用的文字,經過一些過濾,你訓練一個巨大的神經網路,其中包含數十億或數千億的可調引數,以預測下一個給定幾千字序列的單詞。你真的能預測下一個會出現的詞嗎?你永遠無法完全做到這一點,但這些系統所做的,基本上是預測單詞的機率分佈,因此你可以使用它來生成文字。這就是它的自迴歸部分,你向系統提供一個單詞序列,它會預測下一個單詞。很多行業人士一直在努力對這些系統進行微調、訓練它們完成特定的任務,而不是產生廢話,並且還可以詢問資料庫或搜尋引擎,它們實際上並不知道答案。因此,你必須擁有能夠檢測它們是否知道答案的系統,然後可能生成多個答案,然後挑選哪些是好的。但最終,這不是未來系統的工作方式。Kara Swischer:上週 Meta 釋出了 Motivo,它基本上是衝著數字化身去的。因此我理解它還是想在元宇宙當中做點什麼。我不太理解,可是有很多熱錢湧動。Yann LeCun:好的,我可以講講智慧眼鏡的秘密,它有攝像頭,你微笑的時候我可以拍照下來。這是我們目前的水平,跟 Google Glass(差不多),但這是一個比較低的門檻。五年,或者十年之後,我們將要使用的智慧眼鏡,或者其它裝置,它們將配備人工智慧助手,我可以和 Meta AI 交談。這些東西將在日常生活中幫助我們。我們需要這些系統具備基本上類似人類的智慧,人類水平的智慧,甚至在許多方面具有超人智慧。
Meta 與雷朋合作推出的智慧眼鏡現在我們知道如何達成了嗎?還很遠。有些人讓我們相信我們真的接近所謂的通用人工智慧,實際上我們還很遠——當我說很遠,不是按世紀算,也不是按十年算,但或許是幾年。現在我們能看到的是,一些型別的任務(是可以完成的)。我們有可以透過律師資格考試或一些大學考試的大模型,但是打掃房子、清理餐桌的家用機器人在哪裡?我們沒有。並不是因為我們做不了機器人,我們就是不能讓他們足夠聰明,無法讓他們理解物理世界。事實證明,對於 AI 系統來說,物理世界更難理解這種語言。語言很簡單。我的意思是,人類認為語言是智慧的頂峰有點違反直覺。它實際上很簡單,因為它只是一系列離散的符號。所以我們正在研究的基本上是一種新的架構和新系統,它們理解物理世界,並學會像嬰兒和年輕動物那樣理解物理世界,基本上透過觀察世界並在其中行動。這些系統最終將能夠計劃一系列的行動,以實現特定的目標。因此代理系統是一個可以計劃一系列行動、以達到特定結果的系統。現在,每個人都在談論的系統實際上並沒有實現,可能可以實現一點點。他們可以學習計劃的模板。Kara Swischer:據報道 Meta 正在開發 AI 搜尋引擎,跟 Google 競爭。這是真的嗎,你認為這重要嗎?Yann LeCun:嗯,智慧助手中一個顯然需要具備的組成部分是搜尋功能。你希望能夠搜尋資訊,對吧,並且連結到這些資訊的來源,這樣與之交流的人就會信任結果。搜尋引擎是整個完整的人工智慧的一個組成部分。所以目標不一定是直接和 Google 進行競爭,而是為需要 AI 系統的人們提供服務。Kara Swischer:大多數人認為 Meta 在人工智慧競賽中落後,尤其是在 ChatGPT 的熱潮下。然而,馬克·扎克伯格表示 Meta 擁有近 6 億月活躍使用者,並有望在年底前成為全球使用最廣泛的人工智慧。這與人們在 ChatGPT 上所做的非常不同,ChatGPT 是一個獨立的應用程式,或者用於搜尋。那麼,除了提高廣告效率之外,搜尋對你們來說意味著什麼?從你和 Meta 的角度來看,這對 Meta 意味著什麼?Yann LeCun:這個背後的願景是:一個人人都將隨時擁有一個智慧助手的未來。我的意思是,這是一個全新的計算平臺,對吧?以前我們稱之為元宇宙。那些眼鏡最終將配備增強現實顯示屏。實際上,Orion 專案最近已經展示了這一點。我們現在還無法以足夠低的成本製造它們,因此暫時無法銷售。但最終它們會出現的。這就是那個願景,最長遠的願景。Kara Swischer:很好。但目前人力助手的成本要低得多。我想 Meta 目前預計將花費 380 億到 400 億美元。Google 表示今年將花費超過 510 億美元。分析師預測微軟的支出將接近 900 億美元,支出過多。你是否擔心超支?而且為我提供一個更智慧的助手似乎並不是一個很好的商業模式Yann LeCun:這是一個長期投資。我的意思是,你需要有基礎設施才能執行那些人工智慧系統,以便為越來越多的人提供合理的速度。正如你所說,目前有 6 億人在使用 Meta AI。順便提一下,還有一個有趣的數字,Llama 已經被下載了 6.5 億次。這是一個驚人的數字。我不知道這些人都是誰,但這確實是一個驚人的數字,有 85,000 個從 Llama 衍生出來的專案已經公開發布,全部開源,主要分佈在世界的各個部分。這些專案中很多基本上是在訓練 Llama,例如,讓它能夠說來自塞內加爾、印度的一些語言。Kara Swischer:所以你認為這些錢花得不冤枉?Yann LeCun:不冤枉。因為在一兩年內,每天使用這些 AI 系統的人將會非常多,然後還會增加。如果這些系統更強大,它們就更有用。而且它們越強大,在計算上就越昂貴。所以這項投資是對基礎設施的投資。Kara Swischer:基礎設施由私人公司建設。你提到,將專有 AI 模型集中在少數幾家公司手中是一個巨大的危險。顯然,對開源模式也有批評聲音。他們擔心不良行為者可能利用這些模型傳播虛假資訊、進行網路戰爭或生物恐怖主義。鑑於 Meta 以開源方式提供這些強大的工具,Meta 是否在防止這些問題發生方面也有所作為?Yann LeCun:2023 年初我們開始分發 Llama 時,第一個 Llama 不是開源的。你必須徵得許可,並且必須證明你是一名研究員。這是因為法律環境是不確定的,我們不知道人們打算怎麼做。但是後來我們所有人都收到了很多來自行業的請求,比如,你必須開源下一個版本,因為這將造福整個行業,將使許多初創公司和各種新產品和新事物成為可能。所以我們內部進行了幾個月的大型內部討論,每週討論兩小時,包括扎克伯格在內的 40 個人進行了非常嚴肅的討論,關於安全,關於監管環境,關於各種問題。然後在某個時候,馬克決定說,好的,我們要開源。那是 2023 年的夏天,從那以後,它基本上成為整個行業的寶藏。
Kara Swischer:為什麼這樣做是更安全的?Yann LeCun:因為有更多的關注在上面,有更多的人在微調它們以適應各種各樣的問題。也許很多蓄意作惡的人會把手放在上面,把它們用於糟糕的目的。Kara Swischer:你不認為這是 Meta 的責任,你們就是開放了出來,是用工具的人的問題。Yann LeCun:在某種程度上。我們推出的所有系統背後都付出了巨大的努力,確保至少在出來的時候基本上是安全的。我們甚至最初將 Llama 交給了 Defcon 的一群駭客,我喜歡看他們嘗試用它做一些不好的事情,嘗試入侵一個系統之類的。我的意思是,你必須做一個叫做白帽子的事情,結果是我們在過去近兩年中分發的任何模型,都沒有做過任何真正糟糕的事。Kara Swischer:我留意到你發表了一些關於資料的觀點,在網上也遭到了很多批評。大概你是在回應哈佛釋出的新資料集,這個資料集由超過一百萬本書組成,但那些都是公共領域的作品,不是活著的作者、藝術家、學者的作品。請談談你對於這些 AI 模型在沒有給予創作者、作家、研究人員任何信用的情況下吸收了我們所有文化知識所造成的擔憂和批評。網際網路公司以抓取資料著稱。我記得有人之前管 Facebook 叫做「貪婪的資訊竊賊」,當然也可能是在說 Google。Yann LeCun:好的,除了所有這些法律問題之外,如果你認為人工智慧將成為所有人類知識的倉庫,那麼所有人類知識都必須可用於訓練這些模型,對嗎?大部分知識要麼尚未數字化,要麼已經數字化但未公開提供,這不一定是受版權保護的材料,比如法國國家圖書館的內容,其中許多已經數字化,但不適合用於訓練。
法國國家圖書館所以,我說的並不一定是受版權保護的作品,更像是,比如說,我父親的家族來自法國西部的布列塔尼。那裡曾經使用傳統語言,到我的曾祖父、父親和我這一代人,這門語言正在消失。每天大約有 3 萬人使用這種語言,數量非常少。如果你希望未來的 Llama 能夠說 這種語言,就需要有足夠多的訓練資料。你將從哪裡獲取這些資料呢?有文化非營利組織,收集他們擁有的各種資料,也許政府會提供幫助,諸如此類,他們會說,「使用我的資料,我希望你的系統能說這種語言」。現在,他們可能不願意將這些資料直接交給美國西海岸的大公司,但我設想的未來(這不是公司的政策,而是我的觀點)是,達到那個水平的最佳方式是透過訓練一個 AI 系統。一個通用的 AI 系統以分散式的方式儲存人類知識,這樣世界各地的幾個資料中心可以使用本地資料來貢獻訓練一個全球系統。Kara Swischer:誰來運作這個全球系統?Yann LeCun:誰寫了 Linux?誰為維基百科付費,對吧?Kara Swischer:我每個月都付 7 美元給它。Yann LeCun:那很好,所以你看到像 Linux 這樣的,是由許多公司的員工、工程師共同維護的。你可以有一個類似的系統,每個人都為這種全球模式做出貢獻。Kara Swischer:短期來看不太能變現。Yann LeCun:你不會給 Linux 花錢,但你如果買了一個像 Android 一樣執行 Linux 的裝置,或者購買了觸控式螢幕上有 Linux 的汽車,你也是在付費了。Kara Swischer:我覺得這是一種聯合少數的力量去推動發生的,從這一點上看願景是美好的,但不見得會發生。Yann LeCun:我的觀點是,這會不可避免地發生。訪談原文:https://www.youtube.com/watch?v=UmxlgLEscBs