這周,《Lex Fridman Podcast》放出了谷歌/ Alphabet的CEO桑達爾·皮查伊(Sundar Pichai)的深度訪談。Lex Fridman Podcast的節目時長都很誇張,一如既往,這場對話也超過了兩個小時。

首先,此次訪談的背景值得一講:一年前,輿論充斥著對谷歌在AI競賽中落後的批評,甚至有聲音要求皮查伊下臺。而一年後,隨著Gemini系列模型的釋出和一系列產品的AI化,谷歌似乎重新奪回了領先地位。它剛釋出的gemini-2.5-pro-preview-06-05,支援自適應思考,在LMArena 上的 Elo 分數躍升了 24 分,排行榜上以 1470 分保持領先,在 WebDevArena 上的 Elo 分數則躍升了 35 分,以 1443 分保持領先。
在節目中,皮查伊與萊克斯·弗裡德曼(Lex Fridman)聊了從個人成長經歷到AI作為人類歷史終極發明的一系列議題。其中有的段落,還頗有些《魯豫有約》的風格,比如皮查伊回顧了在印度缺水缺電的童年如何塑造了他對科技的信念。當然,更核心的內容是皮查伊在合併DeepMind與Google Brain等關鍵決策中的領導力挑戰,並坦誠地討論了AGI(通用人工智慧)的時間表、P(Doom)(AI末日機率)等前沿甚至帶有些許哲學意味的話題。
全文很長,先用三組問答,歸納一下核心資訊:
問:在AI顛覆一切的時代,許多領導者因短期輿論壓力而搖擺。桑達爾·皮查伊在谷歌面臨“落後”批評時,其決策的核心原則是什麼?
答: 皮查伊的核心原則是“訊號降噪”。他將外界的批評、股價波動和媒體熱議視為“噪音”,而將第一性原理、核心技術資料和不可逆轉的長期趨勢視為“訊號”。在對話中,他透露正是在外界對Waymo自動駕駛專案最悲觀時,他基於內部技術遙遙領先的“訊號”,決定“加倍投入” 。這一思維框架讓他能夠頂住巨大壓力,專注於長期價值,最終帶領谷歌在AI競賽中重回領先地位。
問:谷歌同時在推進穩健的搜尋業務和激進的AI模式,這看似矛盾。皮查伊是如何管理這種內部“左右互搏”的?
答: 谷歌採用的是一種“主幹-分支”(Mainline-Branch)創新模式。核心搜尋業務是“穩定主幹”,確保數十億使用者的體驗和公司收入 。同時,設立“AI模式”作為“前沿分支”,專門用於測試最大膽、最前沿的技術 。兩者並非互搏,而是共生:只有在前沿分支中被資料驗證成功的特性,才會被“回遷”到穩定主幹上,如現在的AI Overviews功能 。這套系統讓谷歌既能保持穩定,又能安全地進行自我顛覆。
問:對於像AI這樣可能帶來生存風險的技術,皮查伊為何仍表現出一種謹慎的樂觀?他認為人類最終的“安全網”是什麼?
答: 皮查伊的樂觀並非源於低估風險,而是源於對人性的集體理性抱有信心 。他提出了一個深刻的觀點:當一個威脅(如P(Doom))真的大到足以毀滅全人類時,它也會成為一個前所未有的、能統一全人類去解決它的強大動力,這形成了一種“風險自我調節機制” 。他認為,人類文明的歷程證明,我們總能在關鍵時刻挺身而出,集體應對挑戰 。因此,人類的集體求生欲和智慧,是面對終極技術風險時最根本的“安全網”。
接下來,就請看全文了。
一、從缺水到熱水澡:科技如何點亮皮查伊的童年
桑達爾·皮查伊的個人經歷,是理解他為何對技術抱有如此堅定信念的鑰匙。在訪談中,他描繪了一幅成長畫卷,背景是上世紀80年代的印度金奈(Chennai)——一個充滿活力但物質相對匱乏的環境。
他成長於一個簡樸的兩居室公寓,家裡甚至沒有自來水。皮查伊回憶道,當時正值一場大幹旱,每家每戶要排隊等水車 ,每次只能分到大約八桶水 。他和兄弟、有時還有母親,都需要親自去排隊把水運回家 。直到很多年後,當家裡終於裝上自來水和熱水器,能夠隨時開啟水龍頭洗上一個熱水澡時,那種感覺對他而言是顛覆性的。“你永遠無法體會第一次擁有熱水的震撼,”他感嘆道,“那種開啟水龍頭就有熱水流出的便利,我們現在習以為常,但對我而言,那是一次人生的巨大飛躍。”
另一個深刻的記憶關乎通訊。皮查伊家等待了五年才裝上一部電話 ,而且是一臺老式的轉盤電話 。儘管如此,這部電話極大地改變了他們的生活 。鄰居們會來他家給遠方的親人打電話 。在此之前,生活中的許多事都充滿著不確定性和漫長的等待。
他舉例說,為了拿到一份血檢報告,他需要花兩個小時去醫院 ,結果可能被告知“還沒好,明天再來” 。有了電話後,這個往返四小時的折磨,變成了一個五分鐘就能解決的事情 。這些被皮查伊稱為“離散的”技術進步,一次又一次地在他腦中點亮了燈泡。“作為一個孩子,我親身體會到科技改變人們生活的巨大力量 ,以及它所帶來的機遇。” 這種體驗,從等待五年的電話,到後來家裡擁有的第一臺VCR(錄影機) ,都讓他深刻感受到,獲取新技術就如同人生的階梯,每一步都能帶來生活的質變。
正是這種源於匱乏的童年經歷,讓皮查伊對知識和資訊的獲取有著近乎本能的渴望。在沒有電腦的時代,報紙和書籍是他了解世界的視窗 。他的祖父是一位郵局職員,寫得一手漂亮的英文 ,正是祖父引導他進入了閱讀的世界,從安·蘭德的哲學著作到通俗的犯罪小說,無所不包 。這種對“獲取知識”的深切渴望,也解釋了為什麼他最終會加入谷歌,因為谷歌“組織全球資訊,使人人皆可訪問並從中受益”的使命與他的個人經歷產生了強烈的共鳴 。
二、從剋制到果決:一位“非典型”CEO的領導力秘訣
正是這種對科技力量的第一手感知,自然而然地引出了他對於如何引領這樣一家巨型企業、以及給年輕人的職業建議的思考。出人意料的是,這位身處殘酷商業競爭中心的CEO,其領導哲學核心竟是異乎尋常的謙遜與剋制。
當被問及會給那些視他為榜樣的年輕人什麼建議時,皮查伊分享了兩點核心原則。首先,他強調要跟隨內心而非頭腦做選擇 。
他解釋說:“當你在做一件事時,用心去感受你是否真的享受它。如果你熱愛你所做的事,事情會變得容易得多,你也會展現出最好的自己。” 他承認這說起來容易做起來難,但這是他最想告訴年輕人的事 。其次,他建議要與比你優秀的人共事 。
皮查伊描述了那種和高手過招的感受:“當你和某人交談,你會驚歎‘哇’,你會想要有更多這樣的感覺。把自己置於一個能被同事的能力所‘拉伸’的環境中,這才是成長的關鍵。” 這意味著要勇於將自己置於不舒服的境地,並保持開放的心態,因為你常常會驚訝於自己的潛力 。
萊克斯·弗裡德曼隨後提出了一個尖銳的觀察:在科技界這個“殘酷的世界”裡,能登上頂峰的領導者通常都有些“混蛋”(asshole)特質,但皮查伊給人的印象卻是謙遜、善良和善於傾聽 。他追問皮查伊的“秘訣”是什麼。
皮查伊坦言,他同樣會感到憤怒和沮喪,擁有和常人一樣的情緒 。但他隨著時間發現,要激發團隊最大的潛力,發怒往往不是實現目標的有效方式 。
他將領導力類比為足球教練的“人員管理”(man management) 。他說:“你要找到那些以使命為導向、追求卓越的人。你激勵他們,就能取得巨大的成就。” 他認為,很多時候,團隊成員如果犯了錯,他們內心的自責遠超於你的批評 。
在這種情況下,激勵和信任遠比發怒有效。“在關鍵時刻,堅定地說出正確的話,其影響力會隨著時間迴響。有時,沉默甚至能傳遞更強有力的資訊,所謂‘少即是多’。”當然,他也承認在必要時會採取果斷行動,讓團隊明確知道某些行為是不可接受的 。但總體而言,他更傾向於一種剋制而堅定的領導風格。這種風格,與他後來在訪談中提到的,在AI競賽最激烈時做出的合併DeepMind和Google Brain等果決行為,形成了有趣的對比,展示了他作為領導者複雜而多面的一面。
三、超越火與電:AI是人類歷史上最深遠的技術革命
如果將AI置於人類歷史的宏大敘事中,皮查伊堅信其影響力將超越火與電。這一論斷的基石,在於AI一項獨一無二的特性——遞迴自我改進,這使其不僅是工具,更是創造力的加速器。
在訪談中,萊克斯·弗裡德曼提出了一個宏大的問題:如果將人類歷史上所有的技術創新,從12,000年前的農業革命到工業革命的機械化,再到電力,按照它們作為“生產力倍增器”的效應進行排名,AI未來能否位居榜首?
皮查伊毫不猶豫地重申了他早在2017或2018年就提出的觀點:“AI是人類將要實施的最深遠的技術,它將比火或電更加深遠。” 他承認,身處當下,人們很容易有“新近度偏見”(recency bias),就像在體育界總傾向於稱眼前的明星為史上最佳一樣 。但他認為,從第一性原理出發,AI的顛覆性是前所未有的 。
他解釋了其背後的邏輯。電力、網際網路等過去的革命性技術,其影響是廣泛的,它們改變了一切 。但AI有著根本的不同:它是首個能夠遞迴自我改進的技術 。
皮查伊強調:“AI將極大加速創造本身。” 它不僅僅是一個工具,它本身就具備學習、進化和創造新事物的能力,而且其能力上限目前尚不清晰 。為了讓聽眾更直觀地理解,他提到了親眼目睹AlphaGo從零開始,在一天之內透過自我對弈成為世界頂尖圍棋手的經歷(我們之前發過一篇部落格,正好是關於這次往事的)。“當你看到那一幕發生時,它真的會深深地觸動你。”
他還提到,即使是觀察像Veo這樣的影片生成模型,從訓練30%到60%再到完成,看到它如何從無到有地“拼湊”出連貫的世界理解,那種感覺“既鼓舞人心,又讓身為人類的我們感到一絲不安”。
皮查伊認為,正是這種自我完善並能獨立實現目標的能力,使AI進入了一個“完全不同的聯盟” 。他堅信,當歷史寫就,AI所帶來的影響將遠遠超過我們之前所見過的任何技術 。特別是當AI在“AI研究”這個領域本身達到超人水平時,技術的迭代速度將進入一個全新的正規化 。一個能夠比人類更快、更好地創造出下一代自身的智慧系統,其潛力是難以估量的 。
四、“AI創新包”:當一項發明重塑整個文明
皮查伊宣稱AI比火與電更深遠,這促使弗裡德曼引入了“新石器時代創新包”(Neolithic Package)的概念來探討這一觀點——即一項核心發明如何像多米諾骨牌一樣,引發一系列連鎖社會變革,從而徹底重塑文明形態。
弗裡德曼解釋說,回顧歷史上的重大變革,無論是農業革命還是工業革命,它們的影響都遠不止於一項單一技術。大約12,000年前的第一次農業革命,並不僅僅是遊牧民族停下來開始種植糧食 。它帶來了一個“創新包”,催生了包括陶器(用於儲存食物和液體)、社會等級、早期政府雛形、貿易和大規模人類協作在內的一系列深刻變革 。這些連鎖反應(second and third order effects)共同構成了那場革命的真正威力,而當時的人們幾乎不可能預測到這一切 。基於此,弗裡德曼向皮查伊提問:那麼,在我們這個時代,我們可能在“AI創新包”中看到哪些早期的連鎖效應?
皮查伊認為,儘管大部分效應尚無法預知,但有一個趨勢已清晰可見:AI將極大降低將想法變為現實的門檻 。他特別提到了AI在程式設計領域的進步。“你可以想象,將你腦中的想法直接轉化為存在的東西,將會變得極其容易。” 這意味著AI將賦能幾乎全人類,讓他們能夠更深度地表達自己 。過去,人們或許只能用語言表達,但未來,他們可以“構建”出實際的產品、內容和服務 。
他將目前的AI創作比作“氛圍程式設計”(vibe coding)的早期階段 。使用者需要精心設計一系列提示詞才能得到滿意的結果,但這僅僅是開始 。皮查伊有一個核心信念:“你現在看到的,是這項技術有史以來最糟糕的樣子。” 換言之,它的進步速度是驚人的,未來的可能性遠超現在。
弗裡德曼對此深表贊同,他將這一變革總結為“獲取創造力的指數級增長” 。無論是創造一個程式、一段內容,還是一個遊戲,其實現的難度都將無限降低 。皮查伊進一步昇華了這個觀點,認為這不僅僅是效率提升,而是解鎖了全球80億人的認知能力 。他類比道,網際網路催生了部落格,讓成千上萬的人得以發聲 ;而AI,則可能讓數千萬甚至上億人,以更深刻的方式向世界輸出他們的創造力 。
五、創造力的民主化浪潮:AI是藝術家的畫筆還是終結者?
探討AI如何賦予大眾前所未有的創造能力,從編碼到藝術創作。然而,這種創造力的民主化也引發了現有內容創作者和機構的焦慮,他們開始直面一個問題:當人人都能成為創作者時,專業性的價值邊界在哪裡?
弗裡德曼敏銳地指出了這種變革帶來的緊張關係。他以自己所在的播客行業和傳統新聞媒體為例,比如CNN、福克斯新聞等,它們對YouTube等平臺的崛起感到緊張,因為這些平臺讓成千上萬的獨立創作者能夠製作出同等甚至更高質量的內容 。而AI的出現,將這種“去中心化”的趨勢推向了極致。弗裡德曼半開玩笑地設想:“如果一個AI模型能做出比我好5到10倍的播客,我就會停掉我自己的節目去聽那個AI的。” 這背後是一種適者生存的進化壓力,它讓許多傳統領域的從業者感到不安 。
皮查伊對此提出了一個更具辯證性的看法。他認為,即使AI能生成海量高質量內容,人類體驗的稀缺性價值可能會上升 。他用國際象棋舉例:“你我不會去看兩個頂級AI棋手(如Stockfish和AlphaGo)對弈,那會很無聊。但我們會饒有興致地觀看馬格努斯·卡爾森(Magnus Carlsen)和古克什(Gukesh)的比賽。” 同樣,他想象未來或許有機器人能比梅西更完美地盤帶,但他懷疑那能否喚起我們內心同樣的情感 。他預測,未來內容消費可能會分層。對於純粹的資訊獲取,AI可能會更高效、更具吸引力 。例如,你想了解一段歷史,可以直接問Gemini 。但如果你想看的是“人類在掙扎中理解資訊”的過程——那種夾雜著情感、意識和複雜性的思考,你可能還是會選擇人類創作者的播客 。
儘管如此,皮查伊堅信,AI作為工具,其賦能作用是巨大的,其擴張性的方面被低估了 。就像作家今天使用Google Docs而不會覺得它是什麼了不起的工具一樣,未來的創作者也將自然而然地使用AI工具 。谷歌正在與達倫·阿倫諾夫斯基(Darren Aronofsky)這樣的頂尖電影人合作,探索如何利用Veo等影片生成模型進行藝術創作 。
皮查伊將這些AI工具比作“畫筆”或“電力”這樣的基礎設施,谷歌的角色是提供工具,而藝術家則利用它們來自由表達,甚至推動思想的邊界 。這種賦能也帶來了新的挑戰。藝術家,尤其是像阿倫諾夫斯基或Doerr兄弟這樣風格前衛的創作者,其作品常常遊走在社會規範的邊緣,探索性和暴力等敏感主題 。
弗裡德曼因此提出了一個關鍵問題:作為平臺方,谷歌如何在支援藝術自由表達和維持社會責任之間找到平衡?
六、Gemini的進化與邊界:在開放與審慎間遊走
也就是說,當AI生成的內容無處不在,谷歌作為平臺方,必須在賦能創造與承擔責任之間找到精妙的平衡點。這直接關係到其核心產品Gemini的進化路徑——如何在滿足使用者對歷史、暴力等複雜話題的好奇心與設定安全護欄之間,劃定那條微妙的界線。
弗裡德曼觀察到,早期版本的Gemini在處理敏感或複雜話題時顯得“過於謹慎”,而Gemini 1.5 Pro則變得更加開放和客觀 。他以自己研究成吉思汗、阿茲特克文明以及世界大戰等充滿暴力的歷史為例,發現新版Gemini能夠以富有深度和細微差別的方式來探討這些困難話題,而不再像過去那樣“提醒你是否確定要了解這些” 。
他好奇地問,谷歌是如何把握這個“度”,既允許Gemini輸出“瘋狂”但有價值的內容,又避免“過於瘋狂”?皮查伊解釋說,這背後有一個關鍵的技術洞察:隨著模型本身變得越來越強大和複雜,它們處理這些細微問題的能力也內在地增強了 。他坦言,一年前的模型能力還不夠,更容易犯“愚蠢的錯誤”,因此需要更多的外部規則來約束 。但隨著模型智慧水平的提升,它們自身就能更好地進行推理和判斷 。
因此,谷歌的指導原則是,儘可能地讓使用者接觸到原始模型的強大能力 ,而不是用一套由人類硬編碼的規則去過度干預 。他強調,構建這些模型的正確方式,是從第一性原理出發,像對待數學或物理學一樣,讓模型從底層建立起對世界的細緻入微的理解,而不是“一小部分人把自己的想法強加於其上” 。
他表示,谷歌將繼續朝著這個方向努力,未來可能會提供更多定製化選項,比如讓使用者自定義系統提示(custom prompts),從而更自由地進行實驗 。這背後反映出一種理念的轉變:從試圖用外部規則“修補”模型的缺陷,到相信並依賴模型自身日益增長的智慧來處理複雜性。
弗裡德曼分享了一個有趣的例子來印證這一點。他讓Gemini分析自己的播客筆記,並生成一個全新的問題。Gemini提出的問題是:“你(皮查伊)曾說Gemini每月處理480萬億個token。在這資訊的汪洋大海中,隱藏著哪句足以改變人生的五個詞的句子?” 這個問題讓弗裡德曼意識到,這480萬億個token背後,是全球無數使用者在探索世界、滿足好奇心的“啊哈時刻” 。皮查伊證實了這個資料的準確性,並補充說,這個數字在過去12個月裡增長了50倍,從9.7萬億激增至480萬億 。這充分說明了人類好奇心的無限性。
七、AGI的黎明與P(Doom)的陰影:我們離終點還有多遠?
隨著模型能力的飛速提升,AGI(通用人工智慧)的實現似乎不再遙遠,這也將關於AI末日機率(P(Doom))的討論從科幻推向了現實。皮查伊對這一終極風險的看法,展現了一種獨特的、基於人性集體智慧的樂觀。
1. AGI時間表:我們正處於“鋸齒狀”智慧時代
弗裡德曼將話題引向了AI領域的終極目標:AGI(通用人工智慧)和ASI(人工超級智慧)。AGI通常被定義為在人類主要的智力活動領域達到專家水平的AI,而ASI則是AGI透過自我改進後達到的、遠超人類的智慧形態 。
他直接問皮查伊:我們會在2030年迎來AGI嗎?皮查伊首先引入了一個更接地氣的概念——“AJI”(Artificial Jagged Intelligence,人工鋸齒狀智慧),這個詞可能由安德烈·卡帕西(Andrej Karpathy)首創,用來形容當前AI能力發展極不均衡的狀態 。一方面,模型在某些方面展現出驚人的能力,另一方面,它們又會在一些看似簡單的問題上(比如數一個單詞裡有多少個字母)犯錯 。
皮查伊認為,我們正處在AJI階段 。對於AGI是否會在2030年實現,皮查伊持謹慎態度。他認為,人們總是在不斷提高對AGI的定義標準 。儘管他在Waymo自動駕駛汽車穿行於舊金山繁忙街道時,或在使用Project Astra與世界互動時,都看到了“AGI的驚鴻一瞥” ,但他感覺我們離真正的AGI還有距離 。
他預測,AGI的實現可能會略晚於2030年(這個預測和DeepMind創始人哈薩比斯的觀點一致)。然而,他緊接著強調,這個具體的時間點和定義本身並不重要。“我確信的是,到2030年,我們將取得如此巨大的進步,以至於我們必須去應對其帶來的巨大後果——無論是積極的還是消極的。”
2. P(Doom)末日機率:人性是終極安全閥
談到ASI可能帶來的生存風險,即社群內熱議的“P(Doom)”(末日機率,也就是AI讓人類毀滅的機率),弗裡德曼坦言自己的估算是10% ,並詢問皮查伊的看法。
皮查伊承認,這是一個在谷歌內部也會不時被討論的嚴肅話題 。他沒有給出一個具體的數字,而是提供了一個獨特的、基於社會動力學的樂觀視角。他類比道,在一個大型組織中,如果你能統一所有人的動機和激勵,幾乎可以實現任何目標 。雖然統一全人類的目標極為困難,但如果AI的末日風險(P(Doom))真的變得非常高且具體,它反而會成為一個強大的統一力量。“如果P(Doom)真的很高,全人類都會聯合起來確保它不會發生。” 他認為,這種威脅的真實性會激發人類前所未有的集體智慧和行動力去解決問題 。因此,他認為這裡存在一個“自我調節”的機制。“我對P(Doom)的情景感到樂觀,但這並不意味著我認為潛在的風險不高。我只是對人類能夠挺身而出、迎接挑戰抱有很大信心。”
弗裡德曼對此觀點進行了補充,他提出了一個常被忽略的變數:沒有AI的末日機率是多少? 氣候變化、核戰爭、流行病等風險同樣威脅著人類文明。AI或許不僅是風險,更是幫助我們解決這些複雜問題的關鍵工具 。皮查伊對此表示贊同,他認為在應對一些最棘手的全球性挑戰時,擁有一個AI“夥伴”將大有裨益 。
面對AGI可能帶來的巨大機遇與風險,領導者的決策變得至關重要。一年前,當外界輿論普遍認為谷歌已在AI競賽中掉隊時,皮查伊正是在內部推動著一系列影響深遠的變革,其中最艱難的莫過於合併DeepMind和Google Brain這兩大頂尖研究團隊。
八、風暴中的舵手:合併DeepMind與Brain的艱難抉擇
面對AGI可能帶來的巨大機遇與風險,領導者的決策變得至關重要。一年前,當外界輿論普遍認為谷歌已在AI競賽中掉隊時,皮查伊正是在內部推動著一系列影響深遠的變革,其中最艱難的莫過於合併DeepMind和Google Brain這兩大頂尖研究團隊。
弗裡德曼將話題帶回到了現實的領導力挑戰中,他回憶起一年前,當時鋪天蓋地的文章都在宣稱“谷歌已經迷失”、“皮查伊是領導谷歌渡過難關的錯誤人選” 。他詢問皮查伊,在那段被外界普遍看衰的時期,他是如何度過的,以及做出了哪些關鍵決策。
皮查伊坦言,作為CEO,他最重要的賭注就是推動公司全面轉向“AI優先” ,併為負責任地開發AGI做好準備。儘管外界充滿噪音,但他對公司內部正在構建的東西有清晰的認識 。他善於將訊號與噪音分離,就像潛水一樣:“水面可能波濤洶湧,但只要下潛一英尺,就是宇宙中最平靜的地方。” 他清楚地知道,谷歌擁有像TPU(張量處理單元)這樣的長期技術投資 ,並且正在訓練強大的Gemini模型,只是這一切需要時間才能顯現成果 。
在這期間,皮查伊做出了一個極其重要且艱難的決定:將谷歌內部兩大頂尖AI研究團隊——Google Brain和DeepMind合併 。弗裡德曼將此舉比作“把斯坦福和MIT合併成一個院系”,其難度可想而知,尤其是在涉及到頂尖科學家的自尊心(ego)和截然不同的組織文化時 。
皮查伊描述了兩個團隊的差異:Google Brain更像是一個自下而上、專案多元化的研究機構,誕生了許多重要的研究突破 ;而DeepMind則有著一個非常明確、自上而下的構建AGI的願景,並堅定地朝此方向前進 。推動這次合併並非易事。皮查伊坦承,那段時間有過一些“不眠之夜” 。幸運的是,當時Google Brain的領導者傑夫·迪恩(Jeff Dean)表達了希望迴歸更純粹的科研崗位的意願 ,而DeepMind的聯合創始人戴密斯·哈薩比斯(Demis Hassabis)則是領導合併後新團隊的自然人選 。皮查伊稱讚了哈薩比斯、迪恩以及科萊·卡夫喬格魯(Koray Kavukcuoglu)等領導者,他們付出了巨大的努力,才將兩個團隊的優勢成功結合 。
在那個充滿壓力的時刻,皮查伊承認自己可能比平時更加“強勢”和“緊迫” 。但他認為,這是身處“戰壕”中激烈工作的常態 。他強調,作為領導者,必須做出少數但“有重大影響的決定”(consequential decisions) 。在這些時刻,即使團隊成員有激烈反對,他也必須做出清晰的決策,並要求大家“可以不同意,但必須執行”(disagree and commit),以確保整個組織能夠繼續前進 。
九、再造網際網路首頁:AI重塑谷歌搜尋的機遇與博弈
在內部重組團隊、統一AI研發力量的同時,谷歌也必須回答一個關乎其核心業務未來的問題:如何將強大的AI能力融入擁有數十億使用者的搜尋產品中?這引發了一場關於“十個藍色連結”經典範式是否會被徹底顛覆的內部博弈。
弗裡德曼指出,谷歌搜尋的簡約介面和“十個藍色連結”已成為網際網路的標誌性符號 ,幾乎是網際網路的“首頁”。對這樣一個傳奇產品進行大刀闊斧的改變,無疑是一項高風險的決策 。他好奇,在推出AI Overviews(AI概覽)和AI Mode(AI模式)的過程中,內部經歷了怎樣的討論和博弈 。皮查伊解釋說,谷歌搜尋一直在進化,尤其是在移動網際網路時代,使用者需要更直接的答案 。而現在,AI的強大能力讓這種進化得以加速 。
他闡述了當前搜尋產品演進的核心設計理念:AI作為上下文層:AI Overviews並非要取代網頁連結,而是作為其上的一個“上下文和總結層” 。它會整合多個網頁的資訊,提供一個綜合性的概覽,但其最終目的仍然是引導使用者訪問原始網頁 ,幫助他們做出更高質量的點選決策 。
AI Mode作為前沿試驗田:AI Mode是一個獨立的標籤頁,它將搭載谷歌最前沿的模型和功能,例如“查詢扇出”(query fan-out)——即一個使用者查詢會觸發後臺進行多次、多維度的搜尋,然後將結果綜合呈現 。這個模式允許使用者進行更具對話性的、多輪的探索 。AI Mode將提供最尖端的體驗 ,而其中被驗證行之有效的功能,會逐漸遷移到主搜尋頁面 。扇出係數(Fan-out),是電子技術中表明邏輯閘帶負載能力的一個量度,其定義為一個邏輯閘電路能驅動與之同類邏輯閘的個數。
一個常被忽視的重大意義在於語言。谷歌搜尋負責人伊麗莎白·裡德(Elizabeth Reid)曾提到,透過AI模式,一個不懂英語的使用者在搜尋時,AI可以整合全球英文網頁的資訊並以使用者的母語呈現摘要 。這極大地擴充套件了非英語世界使用者可觸及的資訊範圍,打破了語言壁壘,對於解鎖全球認知能力具有深遠影響 。當然,這種變革也帶來了商業模式的挑戰。弗裡德曼直接提問,AI模式何時以及如何引入廣告 。皮查伊表示,早期會專注於打磨使用者體驗 。
但他強調,廣告本身也是一種商業資訊 ,谷歌會以同樣的質量標準來對待它。未來,AI甚至可能幫助找到呈現廣告的最佳方式,使其更有用、更不打擾 。同時,谷歌也會像在YouTube上那樣,探索訂閱與廣告混合的模式,為使用者提供更多選擇 。
十、登月計劃的耐心:Chrome與Waymo的啟示
無論是重塑搜尋,還是從零開始打造Chrome瀏覽器,谷歌的歷史充滿了挑戰傳統、押注“瘋狂想法”並最終取得成功的案例。其中最具代表性的“登月專案”之一——Waymo自動駕駛,更是以其超乎尋常的耐心和毅力,展示了在喧囂中堅持長期主義的價值。
1. Chrome的誕生:一個被認為瘋狂的想法
弗裡德曼稱讚Google Chrome是他心目中歷史排名前三甚至第一的軟體 ,並回顧了皮查伊作為早期推動者的關鍵角色。在當時,從零開始構建一個瀏覽器被認為是一個瘋狂且極其困難的想法 ,甚至時任CEO埃裡克·施密特(Eric Schmidt)也深知其難度 。
皮查伊回憶道,2004至2005年,隨著Ajax技術的興起,Flickr、Gmail、谷歌地圖等動態應用的出現,網頁正從靜態文字向富應用演變 。然而,當時的瀏覽器並未為此做好準備,JavaScript執行效率極低,且缺乏現代作業系統的穩定性和安全性 。
Chrome團隊的願景是將作業系統的核心理念引入瀏覽器 。他們開創性地設計了安全的沙盒架構,讓每個標籤頁都成為一個獨立的程序 ,這在當時是獨一無二的。團隊還在丹麥找到了一支頂尖團隊,打造了V8 JavaScript引擎,其效能是當時其他引擎的25倍 。專案名稱“Chrome”的由來,正是因為團隊希望削減瀏覽器本身繁雜的“外殼”(Chrome),將內容本身推到最前臺 。
皮查伊認為,Chrome的成功驗證了拉里·佩奇(Larry Page)和謝爾蓋·布林(Sergey Brin)一直倡導的“登月思維”(moonshots)的價值 。從事雄心勃勃的專案能吸引最優秀的人才 ;由於難度高,競爭者少,可以開闢出獨特的賽道 ;而且,即使最終只實現了目標的60%或80%,其成果也往往是巨大的成功 。我們在文章最後,對這一創新做一個思維框架總結。
2. Waymo的堅持:在低谷時加倍投入
Waymo自動駕駛專案是“登月思維”的另一個典範。弗裡德曼表示,十多年前第一次看到谷歌自動駕駛汽車,是他對機器人技術產生更深熱愛的一個“啊哈時刻” 。
皮查伊坦言,Waymo經歷了漫長的“最後20%”的攻堅階段,這部分工作佔據了80%的時間 。但谷歌始終清楚,他們在技術上擁有領先優勢 。一個反直覺的事實是:“正是在外界最質疑Waymo的時候,我決定向其投入更多資金。” 因為他深信,Waymo是在構建一個通用的AI機器人,這與公司的核心技術方向完全一致 。
對於來自特斯拉等公司的競爭,皮查伊表現得相當開放。他提到谷歌是SpaceX最早和最大的支持者之一 ,並認為自動駕駛和交通領域的市場空間極其廣闊,足以容納多個成功的參與者 。他預測,在所有未來的情景中,特斯拉和Waymo都能發展得很好 。
Waymo作為輪式機器人的成功,僅僅是AI賦能物理世界的一個開端。當AI從雲端走向邊緣,從軟體滲透到硬體,它將如何重塑我們最貼身的計算平臺——安卓(Android)作業系統,並開啟一個由眼鏡、手機和各類裝置無縫協作的增強現實(XR)新時代?
十一、從手機到眼鏡:安卓系統與XR的AI化未來
弗裡德曼指出,Waymo本質上是一個四輪機器人 ,它在物理世界中的成功探索,很自然地引出了關於通用機器人技術的話題。皮查伊確認,谷歌DeepMind團隊正專注於“Gemini機器人”專案 ,致力於構建通用的、能在現實世界中安全執行的AI模型,並已開始與一些公司合作探索應用 。他認為,硬體的進步已經很快,而AI的突破正在解決長期以來困擾機器人領域的軟體瓶頸 。
這種將強大AI模型與物理世界互動的趨勢,將深刻地影響移動作業系統的未來。皮查伊認為,計算領域的重大創新往往伴隨著人機互動正規化的變革 ,從圖形使用者介面(GUI)到移動裝置的多點觸控(multi-touch),再到語音互動 。他相信,AR(增強現實)是下一個重要的互動正規化。過去,AR的發展受限於兩大挑戰:一是硬體系統整合的極高難度;二是缺乏自然流暢的互動方式。而AI的出現,恰好解決了第二個難題。Project Astra這樣的多模態AI助手,對於Android XR世界的成功至關重要 。它能理解你所見所聞,實現無縫的對話式互動。
皮查伊進一步暢想了安卓作業系統的未來。他認為,我們目前仍生活在“應用和快捷方式”的正規化中 。未來,作業系統本身需要變得更具“智慧體”(agentic)特性。這意味著,作業系統能夠主動理解你的意圖,學習你的重複性行為模式,併為你量身定製服務,而不是被動地等待你開啟一個個應用去完成任務 。

在訪談後的演示環節,弗裡德曼親身體驗了谷歌的XR眼鏡原型。他對其極簡、高效的設計讚不絕口。例如,在地圖導航時,抬頭看前方會顯示簡潔的轉向箭頭,而低頭看則會展開更詳細的地圖,整個過程無縫且直觀 。這種體驗的實現,背後需要作業系統層面的深度整合和AI能力的無處不在 。皮查伊透露,這款XR裝置預計今年晚些時候交到開發者手中,明年推向消費市場 。
當AI最終在所有領域超越人類,從駕駛汽車到設計作業系統,甚至理解我們自身,我們將向這個新誕生的“智慧”提出怎樣的問題?這不僅是對技術的探索,更是對人類存在意義的深刻反思。
十二、與AGI對話:探索宇宙奧秘還是叩問內心?
在訪談的結尾,弗裡德曼丟擲了一個富有想象力的問題:“如果你擁有了一個確定的AGI,一個可以回答任何問題的智慧體,你會問它什麼?”
皮查伊的回答出人意料地轉向了內在。他認為,AGI或許會主動告訴我們一些我們應該知道的事情 。但如果由他來提問,他最感興趣的是讓AGI幫助我們更好地理解自己 。他相信,一個足夠強大的AGI能夠以一種深刻的、我們自己都未曾想到的方式來理解個體,揭示我們內心的運作模式。
當然,他也提到了更宏大的可能性,比如幫助我們理解宇宙的本質 ,擴充套件人類知識的邊界。但他反覆回到的,是AI在個人層面的洞察力。他認為,與AGI進行關於“什麼能讓我快樂”的對話,可能會揭示出一些“事後看來顯而易見,但說出來時卻令人豁然開朗”的深刻真理,就像偉大的藝術、書籍或與摯愛的談話所能帶來的啟示一樣 。
弗裡德曼則給出了一個更具科幻色彩的答案。他的第一個問題會是關於外星文明:“宇宙中有多少個活著的和已經消亡的外星文明?” 他會追問它們在哪裡,是否危險 ;如果不存在高等文明,原因是什麼?是否存在一個“大過濾器”(Great Filter),阻止了智慧生命的普遍發展? 他渴望從AGI那裡得到關於費米悖論(Fermi paradox)的解答 。
這場關於終極問題的討論,恰好呼應了谷歌的核心使命。皮查伊提到,一項MIT的研究曾估算,谷歌搜尋每年為每個使用者創造的價值相當於數千美元 。但這種衡量是有限的,它無法量化AlphaFold這樣的科學突破帶來的長期價值 ,也無法衡量因知識獲取而帶來的生活質量的提升和好奇心的滿足 。
當被問及是什麼讓我們人類變得特別時,皮查伊認為,在資源日益豐富的未來,同理心、善良等人性中獨特的光輝將更加凸顯 。他作為一個天生的樂觀主義者,堅信人類文明的軌跡是不斷向好的 。無論面對何種挑戰,他都相信“我們總能集體奮起,推動邊界向前” 。
十三、Takeaway:登月引擎,一個皮查伊的思維框架
透過皮查伊在訪談中關於Chrome和Waymo專案經驗的剖析,我們似乎可以構建一個指導組織進行顛覆性創新的戰略思維框架——“登月引擎”。
這個“登月引擎”框架由三大核心要素構成:1) 雄心驅動(Ambition-Driven)、2) 優勢槓桿(Leveraged Advantage)、3) 耐心資本(Patient Capital)。這三者並非線性步驟,而是一個相互作用、動態強化的飛輪。
其層次關係是:“雄心驅動”設定了10倍改進的宏大目標,是引擎的起點和方向;“優勢槓桿”利用現有能力和獨特洞察,為實現目標提供初始動力和可行性;“耐心資本”則是在漫長的攻堅過程中,持續為引擎提供燃料,抵禦短期壓力。其核心邏輯是:真正的顛覆性創新並非憑空產生的豪賭,而是透過有策略地選擇宏大目標,並以獨特的組織優勢和堅定的長期主義為支撐,從而系統性地將“瘋狂的想法”轉化為改變行業的現實。
1. 雄心驅動 (Ambition-Driven):指選擇那些旨在實現數量級提升(通常是10倍)而非百分比提升的宏大專案。如皮查伊所說,拉里·佩奇和謝爾蓋·布林倡導的“登月思維”,其價值在於“從事雄心勃勃的專案能吸引最優秀的人才”。這一要素要求組織敢於將目標設定在看似“瘋狂”的領域。
2. 優勢槓桿 (Leveraged Advantage):指在選擇“登月”方向時,必須基於組織已有的、難以複製的核心優勢或獨特洞察。以Chrome為例,谷歌的“優勢槓桿”是對網路正從靜態文字向動態應用演變這一趨勢的深刻洞察,以及其在作業系統和軟體工程領域的頂尖人才儲備。它回答了“為什麼是我們能做成這件事?”的問題,確保“登月”不是一次盲目的太空競賽。
3. 耐心資本 (Patient Capital):指組織在面對長期不確定性、外界質疑甚至短期挫折時,仍能持續投入資源和信任的戰略定力。用皮查伊在訪談中的話來說,Waymo經歷了漫長的“最後20%的攻堅階段”,正是在“外界最質疑Waymo的時候,我決定向其投入更多資金”。這不僅是財務投入,更是領導層對專案長期價值的堅定信念。
而Chrome的誕生是“登月引擎”框架的體現。
1. 雄心驅動:在當時,從零構建一個瀏覽器被普遍認為是“一個瘋狂且極其困難的想法”。其目標不是比IE或Firefox快10%,而是要從根本上重新定義瀏覽器——將其從一個簡單的頁面渲染器,變成一個穩定、安全、高效的“網頁應用作業系統”。這是一個典型的10倍目標。
2. 優勢槓桿:
洞察槓桿:皮查伊團隊敏銳地洞察到Ajax技術興起後,網頁向富應用演變的不可逆趨勢,而當時的瀏覽器架構已成為瓶頸。
技術槓桿:谷歌擁有世界頂尖的軟體工程師,他們創造性地引入了“沙盒架構”和“獨立程序”,這是作業系統級的思維降維打擊。同時,他們能找到並打造出效能提升25倍的V8引擎,這是其工程實力的直接體現。
3. 耐心資本:儘管時任CEO埃裡克·施密特都深知其難度和風險,但專案依然獲得了支援。從2004年的洞察到2008年釋出,谷歌持續投入資源,允許團隊在一個看似已有霸主的市場裡,耐心打磨一個全新的產品,最終大獲全勝。
當然,我也要說,這個框架更適用於大型組織或資金充裕的初創公司,正在開闢全新賽道、構建長期護城河的顛覆性創新專案,但不適用於追求快速盈利或漸進式最佳化的常規業務。
也就是說,它能幫助組織打破“創新者的窘境”,避免因過度關注現有業務而錯失下一代技術浪潮,也能創造強大的僱主品牌,吸引並留住最頂尖的人才。此外,如皮查伊所言,由於難度高,競爭者少,即便只實現60%的目標,其成果也往往是巨大的成功。
但是,該框架對資源和組織文化的要求極高,容錯成本巨大,絕大多數公司不具備實施條件。它高度依賴領導者(如皮查伊)的遠見和決心,容易因領導層變動而中斷。同時,漫長的投入週期可能與資本市場的短期回報預期產生劇烈衝突。
簡單說,就是有錢有資源才行。