聞樂 不圓 發自 凹非寺量子位 | 公眾號 QbitAI
在我看來,沒有空間智慧,通用人工智慧就不完整。
這是“AI教母”李飛飛在最新訪談中對AGI的判斷——是的,李飛飛也開始談論AGI了。
不過她有自己的表述,從進入人工智慧領域開始,她就確定了她終身奮鬥的夢想:讓智慧體能夠講述世界的故事。
而這,離不開空間智慧。

正如她本人所說:
我整個職業生涯都在追逐那些極其困難、近乎瘋狂的問題。
李飛飛如今聚焦於空間智慧領域——這個人工智慧最艱難的領域之一。
她認為3D世界建模對於實現AGI至關重要,並表示:
理解三維世界、生成三維世界、推理三維世界、在三維世界中做事,是人工智慧的基本問題。
她的目標是建立一個超越平面畫素、跨越語言障礙、能夠真正捕捉三維世界結構和空間智慧的世界模型。

在這次對話中,她從ImageNet的起源和影響說起,講述了AI正規化轉變與關鍵突破,並提到了3D建模面臨的挑戰以及空間智慧的資料缺失問題。
量子位翻譯並總結了全文,讓我們一起來學習李飛飛的最新認知和分享。
ImageNet為現代計算機視覺搭建資料骨架
Q:你最早建立的專案之一是2009年的ImageNet,距今已有16年了。那篇文章有超過8萬次引用,真正觸及了人工智慧的一個關鍵問題,即資料問題。請告訴我們那個專案是如何產生的——在那會兒,這可是開創性的工作。
李飛飛:實際上,我們構思這個(ImageNet)已經是幾乎18年前的事情了。我曾在普林斯頓大學擔任助理教授,當時人工智慧和機器學習的世界完全不同,資料非常少,至少在計算機視覺領域,演算法並不起作用——那裡沒有產業。你知道,就公眾而言,AI這個詞並不存在。

但是我們中間仍有一些人——從AI的創始人開始——然後是John McCarthy、Geoffrey Hinton等人。我想我們只是做了一個人工智慧的夢:我們真的真的想讓機器能夠思考和行動。而我個人的夢想就是想讓機器能夠看見,因為看見是智慧的基石。
視覺智慧不僅僅是感知,它的真正意義在於理解世界並在世界中行動。我痴迷於讓機器看見的問題,在我當時痴迷地開發機器學習演算法時,我們嘗試了神經網路,但它沒有成功,然後我們轉向基礎網路來支援向量機。
但有一個問題一直困擾著我,那就是泛化的問題:如果你在機器學習領域工作,你必須認識到泛化是機器學習的核心數學基礎或目標。為了泛化,這些演算法需要資料。但當時還沒有人在計算機視覺領域有資料,而我是第一批開始接觸資料的研究生,因為我是最早看到網際網路、物聯網大發展的那一代研究生。
時間快進到21世紀,大約在2007年前後,我和我的學生決定,我們必須進行一次大膽的賭注:我們必須賭機器學習需要一次正規化轉變,而這個轉變必須由資料驅動的方法引領,但當時根本沒有資料。
所以我們想,好吧,去網際網路上下載十億張圖片——那是當時我們能獲取到的最大數量——然後建立整個世界的視覺分類體系,並用這個來訓練和評估機器學習演算法。這就是ImageNet被構想出來並誕生的原因。
自然語言與視覺訊號的融合,讓智慧體能夠講述世界的故事
Q:這個過程持續了一段時間,才發展出一些有前景的演算法,直到2012年AlexNet出現,這才構成了通往人工智慧的第二個關鍵部分——獲得計算能力,並投入足夠的資源到演算法中。請告訴我們,您是什麼時候開始意識到這一點的?就是當你發現“用資料播種”的方法開始奏效,整個AI社群在此基礎上取得了更多突破性進展的那個時刻。
李飛飛:在2009年,我們發表了一個非常小的CVPR海報,然後在2009年到2012年之間,那三年我們真的相信資料會驅動人工智慧,但我們幾乎沒有關於它是否有效的訊號。所以我們做了一些事情,其中一件就是開源。從一開始我們就相信,必須將這個專案開源給整個研究界,讓所有人都能參與進來。
另一件事情是,我們發起了一個挑戰賽,希望全世界最聰明、最優秀的學生和研究人員都能來解決這個問題。這就是我們所說的ImageNet挑戰賽。我們每年都會發佈一個測試資料集,然後公開邀請所有人參與。最初幾年其實是在建立基準線——當時的識別錯誤率徘徊在30%左右,雖然不算完全隨機猜測的水平,但確實不盡如人意。

但是,在第三年也就是2012年(我在一本我出版的書中寫到了這一點),我依然記得那是在夏天快要結束的時候,我們正在處理ImageNet挑戰賽的所有結果,並在我們的伺服器上執行,然後有一天深夜,我收到了我研究生的訊息:他說我們得到了一個特別特別突出的結果,我應該看看。於是我們仔細研究了它,那是卷積神經網路(convolutional neuronet network)之類的。
當時Geoffrey Hinton的團隊還不叫Alex這個名字,他們當時命名為“SuperVision”,這是對“超級視覺”和“監督學習”的巧妙雙關,所以“SuperVision”。
讓我們看看他們做了什麼——這是一個老演算法,卷積神經網路在20世紀80年代問世,而他們在演算法上做出了一些調整。最初看到這樣的飛躍變化,對我們來說還是挺令人驚訝的,嗯,你們知道,我們在那一年的義大利佛羅倫薩ICCV挑戰研討會上展示了這個,Alex Krizhevsky和很多研究者都來了。

如今這一刻已經被載入史冊,被稱為“ImageNet挑戰賽的AlexNet時刻”——這不僅僅是一個卷積神經網路的應用,這是Alex和他的團隊第一次將兩個GPU並聯用於深度學習計算的壯舉。所以這實際上是資料、GPU和神經網路第一次結合的時刻。
Q:現在,順著計算機視覺智慧發展的趨勢,ImageNet真正成為解決物體識別概念的關鍵,然後緊接著,人工智慧也達到了能夠解析視覺場景的程度。因為你和你的學生,比如Andrej Kaparthy,做了很多重要工作,讓AI首次實現了場景描述的能力。請告訴我們物體到場景是如何轉變的。
李飛飛:ImageNet解決的核心問題是:當系統接收一張影像時,能夠準確識別其中的物體,比如“這裡有一隻貓”“那是一把椅子”等等。這是視覺識別中的一個基本問題。
從我作為研究生進入人工智慧領域開始,我就有一個夢想,我認為這是一個長達一百年的夢想,即讓智慧體能夠講述世界的故事:當你在這個房間睜開眼睛時,你看見的不僅僅是人、椅子、椅子和椅子,你實際上可以看到一整個會議室,有螢幕、有舞臺、有人、有觀眾,還有攝像機……你實際上能描述你看到的整個場景。這是人類視覺智慧的基礎能力,對我們的日常生活來說至關重要。
所以我真的認為這個問題會困擾我的一生,字面意義上的,當我作為研究生畢業時,我告訴自己,如果我在臨終前能夠創造一個能夠講述場景故事的演算法,我就成功了。

隨著Alex時刻的到來,深度學習迎來了爆發式發展。當Andrej和後來的Justin Johnson進入我的實驗室時,我們開始觀察到自然語言與視覺訊號相互融合的跡象。隨後,我和Andrej提出了為影像新增字幕或講故事的問題。長話短說,2015年左右,Andrej和我發表了一系列論文,同期也有幾篇類似研究,關於製造一臺可以為影像新增字幕的計算機。那時我的感受是,天啊,我該怎麼度過我的餘生?那是我一生的目標,那對我們兩個人來說都是難以置信的時刻。
去年我做了一個TED演講,我實際上使用了Andrej幾年前在完成影像字幕工作時發的推文,基本上就是他的論文。我還和他開了個玩笑,我說:“嘿Andrej,我們為什麼不反過來做呢?取一個句子然後生成一張圖片。”當然他知道我在開玩笑,他說:“哈哈,我要走了~這個世界還沒有準備好。”快進到今天,我們都知道生成式AI了,現在我們可以用一句話生成美麗的圖片。所以這個故事的寓意是,AI已經取得了不可思議的增長。
我個人認為我是世界上最幸運的人,因為我的整個職業生涯始於AI寒冬結束的初期,也就是AI開始騰飛的起點,而我自己的工作、我自己的職業生涯有很大一部分都參與了這一變革,或者為這一變革提供了助力。所以我感到非常幸運和自豪。
沒有空間智慧,通用智慧就不完整
Q:我認為最瘋狂的事情是,即使你實現了你一生的夢想——描述場景,甚至用擴散模型生成它們——你實際上還在夢想更大的事情,因為整個計算機視覺的發展歷程從物體變成了場景,而現在這個概念是整個世界,而你決定從學術界成為教授,到現在成為World Labs的創始人和CEO。請告訴我們,有什麼是比看見物體更難的事情?
李飛飛:要總結過去五六年的經歷真的很難,我們正生活在科技進步的這樣一個文明時刻,對吧?而作為計算機視覺科學家,我們見證了計算機視覺從影像識別到影像描述再到使用擴散技術進行影像生成的驚人發展,這一切都在以一種非常令人興奮的方式發生。

我們還有另一個同樣令人興奮的領域,那就是語言,也就是LLMs,2022年11月,ChatGPT打開了真正能夠透過圖靈測試的工作生成模型的大門。對我來說,這個進展非常鼓舞人心,即使是像我這樣年紀的人,也會大膽地思考未來會怎樣。
作為一名計算機視覺科學家,我有一個習慣——我的很多靈感其實都來自進化論和腦科學——在我的職業生涯中,我常常在尋找下一個要解決的目標問題,我問我自己,進化論做了什麼,腦發育做了什麼。有一點非常值得注意或者說值得欣賞的事情是,非常寬泛地來說,人類語言的進化發展大約花了3億年到5億年,還不到十億年,而且基本上人類是唯一擁有複雜語言的動物。我們可以爭論動物是否具有語言,但就語言作為交流、推理、抽象的工具而言,真正擁有語言的是人類,這花費的時間還不到5億年。
但想想視覺,想想理解三維世界的能力,弄清楚在這個三維世界中該做什麼、導航三維世界、與三維世界互動、理解三維世界、交流三維世界……這個進化持續了5.4億年。5.4億年前,首批三葉蟲在水下進化出了視覺感知能力,而正是視覺的出現引爆了這場進化的軍備競賽。在視覺誕生前的五億年間,地球上的生物都極其簡單。但在隨後的5億年,也就是在這5.4億年裡——正因生物獲得了觀察世界、理解世界的能力——進化競賽正式開啟,動物智慧開始相互競爭。

所以對我來說,解決空間智慧的問題:如何理解三維世界、生成三維世界、推理三維世界、在三維世界中做事,是人工智慧的基本問題。在我看來,沒有空間智慧,通用人工智慧就不完整。我想要解決這個問題:這涉及到創造性的世界模型,它超越了平面畫素、超越了語言,是真正捕捉三維世界的結構和空間智慧的世界模型。
我一生中最幸運的事,就是無論我年紀多大,總能和最優秀的年輕人共事。所以,你知道的,我和三位了不起的年輕但世界級的技術專家——Justin Johnson、Ben Mildenhall和Christoph Lassner共同創立了一家科技公司,我們即將嘗試解決在我看來目前AI領域中最困難的問題。
Q:那真是令人難以置信的天賦,我是說,Chris,他是Pulsar的創造者,而Pulsar是Gosh和Splats的雛形,可以進行大量可區分的渲染;你的前學生Justin Johnson擁有超強的系統工程思維,實現了即時神經風格遷移;然後是Ben,他是Nerf的作者。所以這是一支超級精銳團隊,而你需要這樣的一支超級精銳團隊。我們之前稍微聊過,實際上,視覺任務在某些方面比LLM更難——也許這話說出來有些爭議,但畢竟LLMs基本上是一維的,而你談論的是理解三維世界的結構。為什麼這會如此困難並且落後於語言的研究呢?
李飛飛:我很感謝你能體會到我們的問題有多困難,哈哈。語言在本質上是一維的對吧?那些音節按照順序排列,這就是為什麼序列到序列、序列建模如此經典。還有一些人們沒有意識到的語言方面的東西:語言純粹是生成性的。自然界中不存在語言,你無法觸碰或者看見語言,語言源自每個人的大腦,而這是一種純粹的生成訊號——當然,你把它寫在紙上,它就存在了。
但是語言的生成、構建和效用是非常具有創造性的,現實世界遠比這複雜得多。首先,現實世界是3D的。如果加上時間,那就是4D,但就讓我們侷限於空間吧,認為世界本質上是3D的,這本身就是一個組合難度更大的問題;
其次,視覺對世界的感知和接收是一種投射,無論是你的眼睛、視網膜還是相機,它總是將3D轉換為2D,你得明白這有多難,從數學角度來說這是錯誤的,這就是為什麼人類和動物有很多個感測器;
第三,世界並非完全是生成性的,我們可以生成虛擬的3D世界,它仍然必須遵守物理規律等等,但外面也有一個真實的世界。現在虛擬世界突然以一種非常流暢的方式在生成和重建之間切換,而且使用者行為、實用性、使用場景都大不相同——如果你把時間撥到這一代,我們就可以談談遊戲、元宇宙之類的話題,如果你一路撥入現實世界,你就會發現我們正在談論具身智慧等等。但這一切都處於世界建模和空間智慧的連續體上。

一個顯而易見卻常被迴避的問題是:網際網路上充斥著大量的語言資料,而空間智慧的資料在哪裡呢?當然,這些資訊都存在於人類大腦中,但它不像語言那樣容易獲取,這些都是它如此困難的原因。但坦白說,這讓我興奮,因為如果它很容易,那別人早就解決了。我的整個職業生涯都在追逐那些極其困難、近乎瘋狂的問題,我認為這就是那個瘋狂的問題。
Q:即使從最基本的原理來思考這個問題,人類大腦視覺皮層中處理資料的神經元數量遠多於處理語言的神經元數量,人腦的這種架構與LLMs有很大差別,你也逐漸發現了這一點,對吧?
李飛飛:這實際上是個非常好的問題,現在仍然存在很多不同的觀點,我們在大語言模型中看到的很多內容實際上是在寫作,透過寫作技能將故事擴充套件到完美的結局,你幾乎可以一路透過暴力手段進行自監督。
而建設性世界模型可能會更復雜一些,世界更加結構化,可能需要我們用來引導它的訊號,你可以把它看成一種先驗形式,或者是資料監督。
我認為以上這些是我們必須解決的一些開放性的問題,而且,我們甚至都不能完全理解人類的所有感知,我們還沒有解決3D在人類視覺中如何運作這個問題,雖然從機械原理上,我們用眼睛對物體進行三維測量,但在此之後,數學模型又在哪裡呢?
人類並不像3D動物那麼偉大,所以還有很多問題有待解答,我只是在指望一件事:我期待我們之中最聰明的人來解決這個問題。

Q:那是否可以認為你們的World Labs正在構建的是全新的基礎模型,它輸出的是3D世界。你們設想的應用有哪些?因為你已經列出了從感知到生成的所有內容,但生成模型和判別模型之間始終存在著矛盾,那麼(輸出的)這些3D世界有什麼作用呢?
李飛飛:就空間智慧而言,就像語言模型一樣,從創作的角度來看這個模型用例非常廣泛,比如,可以當設計師、建築師、工業設計師,以及藝術家,還有從創作到遊戲開發者,再到機器人、機器人學習等方面,空間智慧模型或者說是世界模型的實用性非常大。
實際上,我對元宇宙非常感興趣,我知道很多人仍然覺得它不管用,雖然我也知道它仍然無法運作,但我認為硬體和軟體的融合即將到來,這也是未來的另一個絕佳用例。
Q:我個人對於你正在解決元宇宙的問題感到非常興奮,因為我也在之前的公司嘗試過(這個問題)。
李飛飛:我認為硬體是目前元宇宙障礙的一部分,在元宇宙中需要內容生成,而內容生成需要世界模型。
思想上要有無畏精神
Q:對於一些觀眾來說,他們可能會覺得你從學術界到現在成為創始人兼CEO的轉變很突然,但實際上你一生都有著非凡的經歷,這不是你第一次從0到1了,你曾移民到美國時,青少年時期不會說英語的情況下甚至開了好幾年洗衣店,跟我們講講這些經歷是如何塑造現在的你的吧。
李飛飛:我當時19歲,我需要去普林斯頓大學學物理,所以我沒有辦法養家餬口,於是我開了一家還不錯的乾洗店,用矽谷的話說,我開始籌集資金。
我曾是創始人、CEO,也曾做過收銀員等。但不管怎樣,我看著你們感到無比興奮,因為你們的年齡差不多隻有我的一半,甚至,可能只有我年齡的30%,而你們又如此優秀,你們放手去做想做的事情就好。
在我剛開始當教授的時候,我也不顧很多人的反對,去了那些我是首個計算機視覺教授的學院——雖然我知道,作為一名年輕教授,我本應該去哪些有學術氛圍和資深導師的地方。當然,我也很希望那些地方有資深導師,如果沒有的話,我就開闢自己的道路,闖出自己的一片天,我並不害怕。
後來,我去了谷歌,瞭解了很多谷歌企業方面的知識,然後在斯坦福大學創辦了一家初創公司。大約在2018年,AI成了一個全人類的問題,人類不斷推動著科技的進步,但是我們不能失去人性,我很在意AI發展程序中的一些積極導向,我想讓AI以人類為中心來造福人類。
於是我回到斯坦福創立了以人為本AI研究院(HAI),並且運營了5年,可能有些人不理解,但我對此感到非常自豪。某種程度上,我覺得自己就是熱愛當企業家。
我喜歡那種一切歸零的感覺,就像站在零點一樣,忘掉過去所做的一切,不在意別人對你的看法,只管埋頭苦幹,努力建設,那是我的舒適區。

Q:你還有一個非常了不起的地方,除了你所做的所有令人讚歎的事情之外,你還指導了很多傳奇的研究人員,比如Andrej Kaparthy、英偉達的Jim Fan、與你共同完成ImageNet的鄧嘉,他們後來都取得了非凡的職業生涯。他們學生時代真正突出的地方是什麼?
李飛飛:首先,我是個幸運的人。我認為學生對我而言意義更大,他們真的讓我成為了一個更好的人、更好的老師、更好的研究者。就像你說的,能與這麼多傳奇學生共事,真的是我一生的榮幸。
他們非常不同,他們中的一些人是純粹的科學家,試圖埋頭解決一個科學問題;有些人是行業領袖;還有一些人,是最偉大的AI知識傳播者。但我認為有一件事能將它們統一起來。
我鼓勵他們每一個人都思考一下這個問題,這也是我為那些正在招聘的創始人提一些建議,包括我的招聘標準:我尋找的是思想上的無畏精神。
我認為無論你來自哪裡,無論我們試圖解決什麼問題,都無關緊要。那種勇於接受困難之事、全力以赴並想盡辦法去解決問題的勇氣和無畏精神,是成功人士的核心特質。我從他們身上學到了這一點,而且我真的在尋找具備這種特質的年輕人——作為World Labs的CEO,在招聘時,我會尋找具備這種特質的人。
Q:所以你們也在為World Labs大量招聘。
李飛飛:是的,我們正在招聘工程人才、產品人才、3D人才和生成模型人才。所以,如果你覺得自己無所畏懼,並且熱衷於解決空間智慧問題,那就跟我聊聊,或者訪問我們的網站。
透過梯度下降法找到生活最優解
觀眾1:嗨,飛飛,我是你的超級粉絲。我的問題是,二十多年前,您從事過視覺識別方面的工作,如果我想現在開始攻讀博士學位,我應該選擇什麼方向,才能成為像你一樣的傳奇人物呢?
李飛飛:雖然我可以說,做任何讓你興奮的事,但我更想給你一個深思熟慮的答案:首先,我認為AI研究已經發生了變化,因為學術界不再擁有大部分的AI資源,這和我那個時代大不一樣了。晶片、算力和資料在學術界的資源配置方面確實非常匱乏。
作為一名博士生,我建議你去尋找那些不用透過更好的計算、更好的資料就能更好解決的問題的團隊,在學術界,我們仍然可以發現一些非常根本性的問題:無論你有多少晶片都能取得很大的進展。
其次,跨學科AI是學術界一個非常令人興奮的領域,尤其是在科學發現方面。有太多學科可以與AI交叉,我認為這是理論方面一個大有可為的領域。

很有意思的是,AI能力已經100%超越了理論:我們不知道如何做、我們缺乏可解釋性、我們不知道如何找出因果關係、我們有太多不理解的事情……所以人們可以繼續推進。
而且這個清單可以一直列下去:在計算機視覺領域,仍然存在一些我們尚未解決的表徵問題。另外,小資料也是另一個非常有趣的領域,這些就是可能性。
觀眾2:再次祝賀你獲得耶魯大學的榮譽博士學位,一個月前,我有幸在那裡見證了那一刻。我的問題是:在你看來,AGI更有可能統一模型或作為多智慧體系統,以統一、單一的形式出現嗎?
李飛飛:你提出這個問題的方式本身就已經是兩種定義了。其中一種定義更具理論性,即如果存在一個智商測試,透過該測試就可定義為AGI;另一個定義則更具功能性,如果它是基於智慧體的,它是否具備功能性,能執行哪些任務?
老實說,我也對這個AGI的定義感到困惑。1956年齊聚達特茅斯的AI先驅們,像John McCarthy和Marvin Minsky這樣的人,他們想要解決機器思考的問題。而這是圖靈早在10年前就提出的問題,在那個陳述中,它不是狹義的AI,而是一種智慧的表述。
所以我不太清楚如何區分關於AI和這個新詞AGI的定義。對我來說,它們是一回事。但我明白,如今的行業喜歡把AGI稱為超越AI的東西,我對此感到困惑,因為我不知道AGI與AI究竟有何不同。
如果我們說如今AGI的系統比80、70、90年代或其他時期的狹義AI系統表現更好,我認為這只是該領域的發展程序。但從根本上說,我認為AI的規模即智慧的規模,我們是要創造出能夠像人類一樣智慧,甚至比人類更加智慧地思考和做事的機器。
我不知道如何定義AGI,不定義它我就不知道它是否是單一的。你把大腦看作一個整體,但它確實有不同的功能。甚至還有專門的語言區域,有視覺皮層,也有運動皮層。所以我真不知道該怎麼回答那個問題。
觀眾3:看到一位女性在這個領域發揮主導作用真的很鼓舞人心。我想問,在AI迅速崛起的當下,你作為一名研究者、教育者和企業家,認為什麼樣的人應該攻讀研究生學位?
李飛飛:這是個很棒的問題。這是一個連家長都會問我的問題。我認為研究生階段是你充滿強烈好奇心的4到5年。你被好奇心引領。那種好奇心非常強烈,以至於沒有比這個時期更好的時期來滿足。
讀研究生與創業不同,因為創業不能僅僅靠好奇心來引領,這樣你的投資者會對你發火的。一家有著明確商業目標的初創公司,其中一部分原因是好奇心,但又不只是好奇心。
而對於基層人員來說,解決問題或提出正確問題的好奇心很重要,我認為那些帶著強烈好奇心投身其中的人會享受這四五年研究生時光,即便外界正以光速發展,你依然會感到快樂,因為你在那裡追尋著那份好奇心。
觀眾4:你提到開源是ImageNet發展的重要組成部分,而現在,隨著大語言模型的最新發布,我們看到各組織在開源方面採取了不同的做法,有些組織完全採用閉源模式,有些組織則完全公開其整個研究棧,還有些組織處於中間狀態,開放權重或採用限制性許可等類似做法。所以我想問,你如何看待這些不同的開源方法,以及你認為作為一家AI公司,正確的開源方式是什麼?
李飛飛:我並不拘泥於你必須開源或必須閉源這種教條。這取決於公司的業務戰略。
例如,Facebook、Meta想要開源的原因很明顯,他們目前的商業模式並不是透過銷售模型來盈利。他們正在利用它來發展生態系統,以便人們來到他們的平臺。所以開源很有意義。
而其他公司透過開源或者閉源賺錢。所以我對這個問題挺開放的。我認為開源應該受到保護,如果公共部門(如學術界)和私營部門都有開源,那對創業生態系統非常重要。我認為應該受到技術保護。
觀眾4:我有一個關於資料的問題:既然你現在正在研究世界模型,你指出了機器學習向以ImageNet為代表的資料驅動方法的轉變,並且你提到網際網路上沒有這種空間資料,它只存在於我們的頭腦中,那麼你是如何解決這個問題的呢?你是從現實世界收集這些資料嗎?還是合成數據?還是你相信那些古老的先驗知識呢?謝謝。
李飛飛:你應該加入World Labs,我會告訴你的。
作為一家公司,我沒辦法透露太多,但我承認我們正在採取混合方式,擁有大量資料固然重要,但擁有大量高質量資料同樣重要,說到底,如果不注意資料質量,仍然會出現“輸入垃圾,輸出垃圾”的情況。
觀眾5:在你的書《我看見的世界》中,你談到了作為移民女孩和女性在STEM所面臨的挑戰。我很好奇,你是否有過在工作場所感覺自己是少數群體的時刻,如果有,你是如何克服這種情況或說服他人的?

李飛飛:感謝你提出這個問題。我想非常謹慎或深思熟慮地回答你,因為我們都來自不同的背景,每個人的感受都非常獨特。其實,我們是什麼人都無關緊要,我們所有人都有過感覺自己是少數人群的時刻。
有時這取決於我是誰,有時這基於我的想法,有時候就只是在於我穿的襯衫顏色之類的,但這正是我想要鼓勵大家的地方,我從小來到這個地方,我已經檢驗了這件事情的本質,那就是作為一名移民女性,我幾乎培養出了一種不過度關注此事的能力——和你們每個人一樣,我來這裡是為了學習、做事或創造。
在訪談的最後,李飛飛給所有年輕人送上了美好的祝願:
你們即將踏上一段征程,或者正處於征程之中,你們會有脆弱的時刻,或者遇到奇怪的事情,在創業過程中,我每天都有這樣的感受,有時候我會想,“天哪,我不知道自己在做什麼”。但你們只管專注去做,透過梯度下降法找到最優解。
訪談連結: https://www.youtube.com/watch?v=_PioN-CpOP0
一鍵三連「點贊」「轉發」「小心心」
歡迎在評論區留下你的想法!
— 完 —


🌟 點亮星標 🌟