編譯|吳瑩
來源|Cleo Abram(YouTube)
“未來我們肯定會被機器人包圍。”英偉達CEO黃仁勳近日在訪談中回答道。作為《星球大戰》的粉絲,黃仁勳很期待擁有一個像電影中R2-D2那樣的機器人陪伴自己。
近日,黃仁勳在參加完CES(國際消費類電子產品展覽會)後,接受了記者Cleo Abram的播客採訪,在訪談中,兩人著重探討了英偉達技術層面的佈局和發展。從GPU到CUDA、從影片遊戲到生成式人工智慧,黃仁勳被視為最敢“賭”的人,如今,黃仁勳將新的“賭注”下在了物理AI上,在他看來,未來所有移動的東西都會變成機器人,人機互動機器人領域會變得非常有趣。
黃仁勳表示,GPU就像一臺時間機器,能讓我們更快地看到未來,英偉達在人機互動機器人領域所做的工作才剛剛開始,在時間機器的加速下,他預想的未來很快就能實現。最後,黃仁勳還建議大家儘快找到自己的人工智慧導師,未來在超級人工智慧的幫助下,每個人都有可能成為“超人”。
以下是對話的精彩觀點:
1.GPU就像一臺時間機器,它能讓你更快地看到未來。
2.在我們追求的所有事物中,首先必須有核心信念,從第一性原理出發進行推理,如果這些原理不變,假設不變,那麼你也沒有理由改變你的核心信念。
3.過去10年是關於人工智慧基礎科學的發展,而未來10年主要發展的是人工智慧應用科學。
4.有一天,所有移動的東西都會變成機器人,而且很快就會實現。
5.我們相信創新和發明的豐富性,我們希望創造一種架構,讓發明者、創新者、軟體程式設計師和人工智慧研究人員都能在其中暢遊,並提出一些令人驚歎的想法。
以下是訪談全文(有刪改):

為什麼GPU是一臺時光機器
主持人:要談論人工智慧的這個重要時刻,我們首先需要回到20世紀90年代的影片遊戲發展歷程。當時的遊戲開發者想要建立更逼真的圖形,但硬體無法滿足計算需求,這時英偉達提出的解決方案不僅能解決這個難題,還能改變計算本身。能帶我們回顧一下當時的場景嗎?是什麼讓你和英偉達團隊創造出了第一個現代GPU?
黃仁勳:在我創辦英偉達時就觀察到,在軟體程式中,可能10%的程式碼就能完成99%的計算處理工作,而且這99%的計算處理可以同步完成,剩餘90%的程式碼執行必須按順序完成。事實證明,完美的計算機是能夠執行順序處理和並行處理的計算機,而不僅僅是其中的一種。基於這個觀察結果,我們計劃建立一家公司,去解決普通計算機無法解決的問題,這就是英偉達的由來。
主持人:英偉達為影片遊戲解鎖了新功能,為什麼會選擇先為遊戲行業服務呢?
黃仁勳:首先,我們很喜歡當時那個遊戲程式,它構建了一個虛擬世界,令人嚮往。其次,我們觀察到影片遊戲很有發展前景,將來會成為最大的娛樂市場,事實證明我們的判斷是對的。廣闊的市場非常重要,因為這項技術非常複雜,只有足夠大的市場才能讓我們有信心投入足夠多的研發預算,有機會去創造這項新技術。正是技術和市場之間的相互滿足,使得英偉達能成為世界上最重要的技術公司之一,這一切都歸功於影片遊戲。
主持人:我聽你說過GPU是一臺時光機器?這是什麼意思?
黃仁勳:GPU就像一臺時間機器,它能讓你更快地看到未來。曾經有一位量子化學科學家對我說:“Jensen,因為有英偉達的技術,我可以在有生之年完成自己的事業。”這就是時間旅行。因為我們能讓應用程式執行得更快,讓他在有限的時間裡做更多工作,縮短了看到未來的時間。例如,當你進行天氣預報時,你會看到未來,當你模擬自動駕駛汽車穿過虛擬城市時,我們實際上就是在進行時間旅行。

主持人:所以並行處理在遊戲中開始流行,它讓我們能夠在計算機中創造一個新世界,我們看到了英偉達技術在遊戲行業釋放出的能量,今天,這種能量席捲了各行各業。你們也很早就意識到了這一點,在21世紀初期就推出了CUDA平臺,允許程式設計師使用程式語言來指揮GPU怎麼做,讓更多人都能用上新技術。你能解釋一下是什麼促使你們建立了CUDA嗎?
黃仁勳:有部分原因是研究人員發現了它,還有部分是工作過程中產生的靈感。使用我們的GPU進行並行處理的第一個外部想法源自醫學成像領域的一些有趣工作,麻省總醫院的幾位研究人員用它來做CT重建。他們出於這個原因使用我們的圖形處理器,這給了我們啟發。與此同時,我們公司內部試圖解決的問題是,當你嘗試為遊戲建立虛擬世界時,你希望它既美麗又充滿活力,水要有流動感,爆炸要有爆炸的樣子,所以你想要做的是粒子物理學,是流體動力學,如果你的晶片只能處理計算機圖形,那麼就達不到你想要的這些效果。因此研究人員也在嘗試用我們的GPU進行通用加速。當時機成熟時,我們就決定創辦CUDA。從根本上講,我確信CUDA會成功,我們的GPU將成為世界上產量最高的並行處理器。因為影片遊戲市場非常大,所以這種架構能惠及更多人。
主持人:2012年,由三名研究人員組成的團隊在比賽中提交了一份特別的參賽作品,其目標是建立能夠識別影像並對其進行分類的計算機系統,這份作品完全碾壓了競爭對手。它就是AlexNet,是一種稱為神經網路的人工智慧。我的理解是,它如此出色的原因之一是使用了大量資料來訓練該系統,並且他們藉助了英偉達的GPU來實現這個目標。自此,GPU不再只是讓計算機執行更快的一種助力,它們正在成為一種全新計算方式的引擎。2012年的這一刻真正開啟了我們現在所見的人工智慧的重大轉變時刻,能從你的角度描述一下那一刻的感受嗎?這對我們所有人的未來意味著什麼?
黃仁勳:悲觀者的觀點是就算你創造一些新的東西時,比如CUDA,也不會帶來什麼,但樂觀者想的卻是如果不去創造新的東西,變革就來不了,這也是我看待世界的視角。事實上,2012年,那3位研究人員在實驗室裡接觸到了GeForce GTX 580,他們瞭解到CUDA可以用作訓練AlexNet。我們也受到啟發,認為GeForce可以成為將這種並行架構推向世界的工具,這是一種基於希望的策略,當然也是合理的希望。
我們當時正試圖在公司內部解決計算機視覺問題,並嘗試讓CUDA成為一款優秀的計算機視覺處理器,但我們在計算機視覺方面的早期開發並沒有讓我們看到希望,後來我們看到了AlexNet,這種新演算法與之前的計算機視覺演算法完全不同,讓計算機視覺能力有了巨大的飛躍。所以我們之所以能發現GPU的新用法,一方面是出於興趣,另一方面也是我們早就在這個問題上苦苦掙扎,現在新的機會出現了,我們很樂意看到它發揮作用。
不過當我們看到AlexNet時,我們問過自己,AlexNet能走多遠?如果能用計算機視覺來實現這一點,它能走多遠?如果它能達到我們認為的極限,能夠解決各種問題,這對計算機行業意味著什麼?這對計算機架構意味著什麼?我們推斷,如果機器學習、深度學習架構可以擴充套件,那麼絕大多數機器學習問題都可以用深度神經網路來標識。我們可以用機器學習解決的問題型別如此之多,它有可能重塑整個計算機行業,這個發現促使我們重新設計整個計算堆疊。
主持人:並行處理重塑了現代遊戲,徹底改變了整個行業,然後並行處理的計算方式開始被不同的行業使用。你透過構建CUDA來進行投資,然後CUDA和GPU的使用可以實現神經網路和機器學習的重大改變,並開啟一場越來越重要的革命。
黃仁勳:突然間,計算機視覺問題解決了、語音識別問題解決了,語言理解問題也解決了。這些與智慧相關的問題一個接一個被解決,而我們過去一直沒有找到解決方案,真是令人難以置信。
主持人:所以在2012年你展望未來時,意味著你是在下賭注,在我這個外行人看來,你下的賭注不小,或許需要10年才能實現目標,那在這10年裡你是什麼感受?
黃仁勳:大概和如今的感受一樣。對我來說,總會出現一些問題,總會有一些理由讓我們感到不耐煩,也總會有一些理由支撐著我們繼續前進。所以在我們追求的所有事物中,首先必須有核心信念,從第一性原理出發進行推理,如果這些原理不變,假設不變,那麼你也沒有理由改變你的核心信念。一路上總會有一些證據在告訴你正在朝著正確的方向前進。如果你走了很長時間都沒有遇到成功的證據,那可能就需要微調一下線路。

為什麼我們能長期如此堅定地走下去,答案其實恰恰相反:沒有理由不堅定,30多年來我一直相信英偉達,每天都在這裡工作,我沒有理由改變我的信仰體系,我從根本上相信我們在計算機革命方面所做的工作,我們會堅持下去。
當然,一路上會遇到很多非常艱難的時刻,當你瘋狂投資某樣東西時往往得不到外界的認可,投資人或許更想你只保留利潤,用以提高股價或其他用途,但我們自己必須有堅定的信念,相信未來,堅定投資。在CUDA真正成功之前,我們已經投資了數百億美元,這真是漫長的10年,但一路上很有趣。

未來我們會被機器人包圍
主持人:您如何總結這些核心信念?您對於計算機應該如何工作以及它能為我們做什麼有著怎樣的看法?
黃仁勳:第一個核心信念是關於加速計算。我們將CPU與GPU結合起來用就是加速計算,我至今仍然相信這一點。第二個是認識到這些深度學習網路,它們能夠從大量不同型別的資料中學習模式和關係。如果網路規模更大,它就能越學越深,因此該架構的可擴充套件性在經驗上是正確的。如果是這樣的話,那限制在哪裡?除非有物理極限、架構極限或數學極限,否則理論上講可以不斷擴充套件。那麼問題來了:你能從資料中學到什麼?你能從經驗中學到什麼?資料基本上是人類經驗的數字化版本,那麼你能學到什麼呢?顯然可以從影像中學習物體識別,只要聽聲音就是在學習說話,可以透過文字學習語言、詞彙、句法、語法等。所以我們現在已經證明了人工智慧或深度學習有能力學習任何形式的資料,並且可以轉化為任何形式的資料。這意味著機器學習可以完成文字生成、文字翻譯、影像生成,甚至將來可以把蛋白質結構轉化為文字。從計算機的角度來看,深度學習網路打開了這個充滿機遇的世界,有很多新問題等著我們去解決,這讓我們非常興奮。
主持人:感覺我們正處於這一真正巨大變革的邊緣地帶。當我思考未來10年時,我無法預測將如何使用目前正在開發的技術。
黃仁勳:你之所以有這種感覺,是因為過去10年是關於人工智慧基礎科學的發展,而未來10年主要發展的是人工智慧應用科學。人工智慧的應用方面現在變成:如何將人工智慧應用於數字生物學?如何將人工智慧應用於氣候技術?如何將人工智慧應用於農業、漁業、機器人技術、交通運輸等。

主持人:剛才我們談論了很多,我對機器人特別感興趣,包括人形機器人、自動駕駛汽車、智慧建築、自動割草機器人等,據我所知,我們可能會看到所有這些機器人的能力產生質的飛躍,因為我們正在改變訓練它們的方式。我們現在可能正處於機器人大爆炸的時刻,英偉達正在構建工具來實現這一目標——Omniverse(英偉達開發的虛擬現實與模擬平臺)和Cosmos(世界基礎模型)。你作為一個從小就喜歡《星際迷航》和艾薩克·阿西莫夫作品的人,可以談談我們如何從現在的機器人走向您所看到的機器人未來世界?
黃仁勳:我用ChatGPT來類比Omniverse和Cosmos,幫助大家理解我們在做什麼。首先,當ChatGPT首次推出時,它是非凡的,它能夠從你的提示中生成文字。但隨著使用頻率上升,它開始應付不過來,有時甚至會編造內容,也就是它會產生幻覺。不久之後,新一代技術就能夠根據上下文進行調節,你可以上傳PDF,作為它的事實基礎,讓它可以查詢搜尋並推理產生你需要的答案。
第一部分就是生成式人工智慧,第二部分是為了最佳化人工智慧而補充的基本事實。我們再回來看Omniverse和Cosmos。我們需要一個基礎模型,就像ChatGPT本身有一個核心基礎模型,這是讓機器人能夠智慧地瞭解物理世界的關鍵。機器人必須理解重力、摩擦力、慣性等物理事實,這些物理常識必須被編碼到世界基礎模型中,以便機器人和人工智慧擁有世界常識,這就是我們在Cosmos上做的事情,它是一個世界基礎模型。我們要做的第二件事是必須將其與事實聯絡起來。因此我們在Omniverse中去模擬物理世界中的各種行為動作,以此來增強機器人解決現實問題的能力。Omniverse是一個模擬器,用來模擬或調節機器人的行為,它們都是基於物理事實進行的訓練,就像給ChatGPT上傳的PDF檔案一樣。我們可以產生無限多的有趣的東西,回答一大堆有趣的問題,將Omniverse和Cosmos結合起來,我們就能夠高效地訓練機器人,幫助它們更快掌握解決問題的能力。
主持人:如果你把這個設想延展至10年,你認為在不久的將來人們如何與這項技術進行實際互動?
黃仁勳:有一天,所有移動的東西都會變成機器人,而且很快就會實現。推著割草機走的想法已經很過時了,儘管有人是因為好玩才這麼做,但真沒必要。未來所有移動的東西都將是機器人,它們會在Omniverse中學習如何成為最智慧的機器人。未來我們肯定會被機器人包圍,我對擁有自己的R2-D2(《星球大戰》電影中的機器人)十分期待。當然,R2-D2不會像罐子一樣到處滾動,它可能有不同的物理形態,有時它在我的智慧眼鏡裡,有時在我的手機裡,有時在我的電腦裡,不管怎麼說它會一直陪著我。
主持人:當前我們處於一個令人難以置信的時代,我們不再受到CPU和順序處理的技術限制,不僅開闢了一種新的計算方法,還開闢了一條持續改進的道路。我很好奇,你有沒有思考過當前我們面對的技術限制是什麼?
黃仁勳:一切都取決於你在有限的精力內能完成多少工作,這是物理極限,做這些事所需的能量限制了我們能做的事情。不過,我們並沒有遇到阻礙我們前進的根本限制。與此同時,我們也在尋求製造更好、更節能的計算機。2016年,我們給OpenAI交付了一臺人工智慧超級計算機,大概25萬美元,今年我們推出一款新的計算機,計算能效提高了1萬倍。短短8年時間,我們就把計算機的能效提高了1萬倍,想象一下,如果其他東西的能源效率也能大幅提高,比如汽車、電燈等等,那我們的日常生活將發生多麼翻天覆地的變化。因此,要想突破這一階段的限制,提高能源使用效率是我們優先要考慮和解決的問題。

英偉達下一個賭注
主持人:你已經展示了透過CUDA提高可訪問性和抽象性的價值,並允許更多人以各種其他方式使用更多計算能力。隨著技術的應用越來越具體,我正在考慮人工智慧中的Transformer模型,這是一個非常流行的人工智慧結構,如今應用也很廣泛。我比較好奇,你如何看待通用大模型和專用大模型,你會願意製造一款專門針對一種AI模型的晶片嗎?你傾向於創造一輛可以去任何地方的汽車,還是最佳化一列從A到B的火車呢?
黃仁勳:現在又回到了之前的那個問題,你的核心信念是什麼?Transformer是任何研究人員都會再次發現的一種人工智慧架構。在我看來,或許幾年後,人們就不再提起Transformer這個概念了。因為你回顧歷史,在計算機演算法的世界、在軟體的世界、在工程和創新的世界,有哪個想法和概念能一直活躍在臺前?答案是否定的。這就是計算機的本質之美,它今天能做到10年前沒人能想象的事情。我們相信創新和發明的豐富性,我們希望創造一種架構,讓發明者、創新者、軟體程式設計師和人工智慧研究人員都能在其中暢遊,並提出一些令人驚歎的想法。
自Transformer概念提出以來,已發明的不同型別的注意力機制數量非常多,所以我認為這種趨勢還會繼續下去,計算機科學還沒有結束,人工智慧研究還沒有停止,擁有一臺能夠靈活地研究、創新和實踐新想法的計算機才是最重要的。
主持人:你是一個對未來下大賭注的人,而且你一次又一次賭對了,你現在下的賭注是什麼?
黃仁勳:我在CES(國際消費類電子產品展覽會)上闡述了我的最新賭注,我很興奮,Omniverse和Cosmos的融合讓我們有了新型的生成世界系統。我認為這對於機器人和物理系統的未來至關重要。當然,我們在人機互動機器人方面所做的工作,包括開發工具系統、培訓系統和人類演示系統等都還只是剛剛開始。未來5年人機互動機器人領域會非常有趣。我們在數字生物學領域所做的工作是為了讓我們能夠理解分子和細胞的語言,就像我們理解物理的語言和物理世界一樣,我們希望瞭解人體的語言和生物的語言,這樣我們就有機會擁有人類的數字孿生了。
我們正在研究的這些事情真的很酷,很幸運創造了這種時間機器,我們剛才談到的所有這些領域都需要時間機器,這樣我們才能更快地看到未來。如果我們能夠看到未來,能夠預測未來,就有機會讓未來成為最好的版本。我們嘗試設計的一切,就是為了能夠優化出最好的版本。

主持人:可能有觀眾知道英偉達這家公司,但不太瞭解英偉達如何影響他們的生活,如果他們想展望一下未來,你會建議他們如何準備或思考當前所處的時刻,這些工具實際上會如何影響他們的生活?
黃仁勳:有幾種方法可以去推理我們將要面對的變化。比如,假設你所做的工作仍然很重要,但你需要付出的時間由一開始的一週變成瞬間就可完成,那你就有了更多時間可以做其他事。這和國家突然有了高速公路所發生的變化非常相似。
在上一次工業革命中,我們突然有了州際公路,帶來的變化是郊區快速發展起來了,商品分配的時間和距離不再是問題,高速公路上突然冒出了很多加油站、快餐店和汽車旅館,突然之間就出現了新經濟和新工作。
再比如視訊會議讓我們無需見面就能工作,我們的生活發生了什麼變化?出差變少了,工作地和居住地更遠些也沒關係。未來如果我們每個人身邊都有一個“程式設計師”,無論我想到什麼,它們都能為我寫出程式碼,我的想法可以很輕鬆變為現實展現在我眼前,這對我們的生活和職業發展有多麼大的助力。
下一個10年,人工智慧在某些事情上可以幫助我們成為“超人”。我可以告訴你那是什麼感覺,我的身邊圍繞著世界上最優秀的一群人,他們非常聰明,很多事情做得比我好得多,我每天都感受到了滿滿的信心和力量,有他們的支援,我有信心和精力去解決更多問題。假設未來每個人身邊都被超級人工智慧包圍,那麼他們將更有信心學習新東西,幾乎任何特定領域的知識,學習障礙都減少了。
我想鼓勵大家立即為自己尋找一位人工智慧導師,這位導師可以教你喜歡的東西,幫助你學習程式設計、寫作,幫助你分析、思考、推理和進步,未來我們會成為“超人”,不是因為我們有超能力,而是因為我們有超級人工智慧。
新聞熱線&投稿郵箱:[email protected]

關注“中國企業家”影片號
看更多大佬觀點和幕後故事