離開Waymo的日子

自動駕駛是一場馬拉松,不是百米衝刺。時至今日,Waymo的成敗難以定義,但它是當之無愧的自動駕駛之王。
作者 | 李雨晨
編輯 | 林覺民
“Waymo是公認的無人駕駛行業先驅者,如果你有異議,那我們暫時求同存異並保持微笑。”這是前Waymo員工夏飛在自己知乎專欄裡寫下的一句話。
從最早期的Waymo華人第一人朱佳俊、小馬智行北美負責人張一萌到輕舟系的於騫、侯聰、大方、汪堃、李棟,再到90後創業者高繼揚和趙行,2009年成立至今,Waymo湧現出了幾百位華人面孔。這群聰明、勤奮、嗅覺敏銳的人,成為十多年來中國智慧駕駛以及具身智慧的見證者與參與者。
歲月如梭,斗轉星移。當初與Waymo一同引領風騷的創業明星Cruise、Argo AI、Motional等等,或黯然下線、或委身他處,但Waymo仍在續寫L4的江湖故事。
1

分拆獨立,走上正軌

在2016年更名為Waymo之前,谷歌無人車內部一直用的是“chauffeur”這一名字(法語“司機”的意思)。
Waymo由谷歌X實驗室孵化,跟總部不在一棟樓裡。谷歌X最大的特點是,裡面有很多造型奇特的硬體如機械臂、熱氣球、太陽能板。這棟樓的保密級別很高,谷歌的人無法進入。現在,這棟樓是Deepmind的人在辦公,機器人團隊也在其中。
朱佳俊是Waymo最早期的五位創始人之一,本科畢業於復旦大學計算機系。
在弗吉尼亞大學上學時,朱佳俊利用暑假來到Google Street View(街景)團隊實習。到了第三週,他就獨立完成了一個新的基於計算機視覺的改進,並因此收穫了自己在谷歌的第一份專利。
此前,使用者想接近一個特定街景,只能透過數次點選圖中一個既定箭頭,費時又費力;朱佳俊做出的“click-to-go”讓圖中任意點都能成為旅程起點。
後來,朱佳俊在國際會議SIGGGRAPH上遇到了當時Google Street View團隊的核心成員Luc,朱佳俊與谷歌就此結緣。
作為團隊裡的第一位華人,朱佳俊有著超乎年齡的成熟與老練。他寫下了Waymo的第一版感知系統,在內部有著很高的地位。
在2016年的架構融合前,感知和視覺是兩個組。朱佳俊只負責感知,不負責視覺。除了感知,朱佳俊還領導模擬團隊,模擬團隊的名字叫“Crystal ball”(水晶球)。
還有一個組名為Magic,做的是視覺、預測和場景理解。這三部分任務都是要用機器學習去做,所以最早的機器學習不是應用在感知組,而是在Magic組。Magic組的負責人是Dave Ferguson,後來和朱佳俊一起創辦了Nuro。
朱佳俊和Dave Ferguson
2014年,朱佳俊幫小組招募成員,他找到了谷歌搜尋組的張一萌。
碩士期間,張一萌在卡內基梅隆大學(CMU)的語言技術研究所。當時,計算機視覺(CV)比自然語言處理(NLP)更火,張一萌就找到了視覺領域專家陳祖翰教授,跟著他直到博士。陳祖翰教授現在是新加坡國立大學的常務副校長。
張一萌
2012年,張一萌獲得計算機視覺和機器學習方向的博士學位,並加入谷歌。這一年,是人工智慧的標誌性年份,2024年諾獎得主Hinton和其他兩位作者釋出的AlexNet在ImageNet挑戰賽上一戰成名,極大地推動了卷積神經網路(CNN)的發展。
不過,此時的深度學習並沒有在產業界引起大的波瀾。張一萌回憶到,“我還在康奈爾的時候,AlexNet還沒有引起足夠的討論,效果遠沒有讓人覺得可以應用在工業界。”
張一萌當時所在團隊的產品形態類似於Zoom。當時,谷歌內部有很多這樣創業性質的團隊。遺憾的是,這個組的產品不太成功被高層取消,張一萌需要在公司裡找其他專案。
朱佳俊聽到訊息後主動找到了她,問:“要不要來了解一下無人車?”
谷歌的無人車專案雖然從2009年就開始試水,但此時仍然是一個“Research Team”,離真正的產品比較遠,算不上人人都想進的明星團隊。
但既然朱佳俊發出邀請,張一萌決定還是聊一聊。她問了朱佳俊一個問題:專案什麼時候落地?
朱佳俊回答:“兩年,兩年就可以對公眾開放。”
加入之後,張一萌才發現自己被“忽悠”了:無人車的辦公室還沒有原先的組規模大。感知團隊只有10人左右,華人不多,早於張一萌加入的還有賈兆寅。
賈兆寅是張一萌在康奈爾大學的師弟,後來在2017年加入滴滴任前沿業務技術負責人。賈兆寅是感知組的第一個Manager,帶了4-5個人的小團隊,被朱佳俊委以重任。賈兆寅走的時候,他的師妹江韻也一起離職。
谷歌的精英文化,讓這家巨頭吸納了諸多天才,包括AI大神——AlexNet作者之一的Alex Krizhevsky。當時,Alex是從Google Brain被借調到無人車小組。
Alex Krizhevsky(中)
Alex是一個很特別的人。為了訓練模型,他手寫了一套深度學習框架——Cuda-Convnet。後來,賈揚清在美國加州大學伯克利分校讀博士,看到了Cuda-Convnet愛不釋手並且還找到了Alex。雖然沒有從Alex手上拿到程式碼,但這也促使賈揚清寫出了日後大名鼎鼎的框架——Caffe。
Alex對於Waymo的貢獻在於,幫助調試出了很多模型,最早的點雲檢測模型就是出自他手。
2015年8月,谷歌進行組織架構大調整,成立母公司Alphabet,以廣告為商業模式/盈利基礎的成熟業務,包括Search、Android、YouTube、Apps、Maps和Ads被保留在谷歌旗下,諸多探索型業務則被劃分到不同的實體繼續推進,谷歌X實驗室也就此成為Alphabet旗下的獨立公司。
站在高層角度來看,分拆Waymo是一個正確且必要的決定,既可以避免“追逐廣告收入”的心態蔓延到Waymo優勢專案,又可以尋求外部融資,給初創團隊更多的股票和期權激勵。
不過,讓谷歌高層沒想到的是,早年間設立的一項激勵計劃卻砸到了自己的腳。
故事的起因是:為了留住技術人才,Waymo曾經制定了一個薪資包,將薪酬分成四份。第一份在某一時間點發,如果能待到2016年年底、完成一些里程碑,就可以拿到剩下錢裡的一大半。
當時,Waymo的專案估值85億美元,谷歌拿出45億美元當作獎金。谷歌的這一場造富運動,讓很多人拿到數百萬到數千萬美元不等的回報,並且沒有競業協議的限制,這些錢成了Waymo元老們外出創業的底氣。
2016年1月,時任谷歌無人車團隊技術負責人的工程師 Anthony Levandowski 、谷歌地圖原負責人Lior Ron、硬體研發主管Bryan Salesky、Dave Ferguson和朱佳俊等人離職,這也讓waymo有了持續半年左右的離職潮。
8月,谷歌無人車專案的靈魂人物——CTO Chris Urmson離職。
Chris Urmson
Chris Urmson於2009年加入谷歌,當時谷歌尚未啟動無人駕駛汽車專案,在他的帶領下,谷歌確立了不要方向盤、不要剎車,開發完全自動駕駛的技術路線。Urmson雖是CTO的頭銜,卻更多是以CEO的身份帶領團隊。
但是,John Krafcik(原現代美國公司CEO)的空降讓Urmson不滿,最終演變為2016年初Urmson和Larry Page大吵一架。在員工看來,作為接任者的Krafcik在內部的口碑並不差。Krafcik有一頭銀髮,非常有個人魅力。他永遠都是站著辦公,腳底下踩著一個平衡球。
Urmson走後,Dmitri Dolgov接管了技術團隊,成為了這支團隊新的CTO。輕舟聯合創始人、前CTO,現總裁侯聰回憶,Waymo為了留住Urmson,在一次全員會上專門給他過了一次生日。
2016年底拆分獨立臨近時,Waymo在組織上做了一次大整合。
被整合的有ML(machine learning)組,這個組裡分為Reserach team、Infra team。後來,Reserach team和視覺、感合併成了一個大的感知部門,從谷歌請了一個法國人做負責人;Onboard  Infra、模擬、Offboard Infra,還有地圖定位組成一個部門;決策、規劃、控制、預測等劃歸在一個部門。
三個部門直接向CTO Dmitri Dolgov彙報,而Waymo的技術風格、商業思維也越來越像一支正規軍。
侯聰2013年加入谷歌,2016年加入Waymo後與張一萌做起了搭檔,侯聰負責感知的系統開發。對於Waymo硬體能力的更新換代,他的感觸最深。
侯聰
他回憶,從2016年起,Waymo已經開始做第四代硬體,搭載了四個GPU,算力得到大幅突破,很多模型(視覺、預測等)也開始跑起來。
Waymo沿襲了谷歌的做事風格,從軟體到硬體力圖全棧自研,雷達、雷射雷達、相機、車載電腦這些都是由Waymo設計,交給臺灣超恩、廣達來代工。其中,廣達和其他代工廠不一樣的特點在於,不是使用車規級的相機,而是選擇畫素高的相機來保證整體效果。
在具體數量上,第三代無人車的硬體約有4個攝像頭,第四代增加到了19個攝像頭,第五代硬體又猛漲到30個攝像頭,被人稱之為“武裝到牙齒”。這些攝像頭分佈在車頂和車身的各個地方,透過紅外線的方式檢測盲區是否有行人。
Waymo和谷歌一直被外界貼以單打獨鬥、大包大攬、不計成本的標籤,但其實很多操作都是為了更好的工程化效果。
第一個例子是,無人車有一個容易被忽視的問題——相機的去汙。Waymo的第四代車頂上有一個圓形的罩子,裡面包括了一個主雷達、16個相機。但是由於是圓形,很多蟲子、鳥糞、雨水沾在罩子上後,雨刮器無法去汙,因此第五代硬體又迴歸了早期的平面形態。
還有紅綠燈的識別問題。目前很多交通燈都使用LED技術,會有頻閃。如果曝光時間和頻閃不一致,相機拍到的燈就會有亮暗相間的條紋。另外,由於與周圍物體的亮度相差大,相機拍攝晚上的紅綠燈容易過曝,尤其是左轉或者右轉的箭頭,識別不清。Waymo想了一個辦法:給相機裝上一個灰鏡,強制延長曝光時間,以此解決紅綠燈的識別問題。
侯聰透露,“為什麼Waymo一圈有16個相機,其中有8個都是為了看LED燈。不僅看紅綠燈,還有警燈和消防車燈,以及一些牌子上面的文字。”
第二個例子是雷射雷達。
在很長一段時間裡,市面上沒什麼好的雷射雷達可用,唯一可用的就是Velodyne,但是Velodyne的要價太高,導致Waymo的成本居高不下。另一方面,Velodyne的產能非常低且經常出問題,Waymo曾試著找Velodyne溝通,但對方明確表示暫時沒有改進計劃,這讓谷歌感覺受制於人。這也是Waymo在硬體上大搞自研的核心原因。
侯聰表示,Waymo幾乎所有零部件都不是車規級的,比如相機用的是索尼消費級的感測器。當時的硬體條件下,車規級的相機只能達到800萬畫素水平,但是Waymo需要的是一個4000萬畫素、能有優秀夜間成像效果的相機,這就只能自研。
降本,也是谷歌自研思路的一個考慮。Waymo早期採用英特爾的晶片作為計算平臺,主要是基於伺服器CPU至強和FPGA加速卡。FPGA具有非常高的頻寬,但價格較高。為此,Waymo甚至還計劃自主研發晶片,但後來發現晶片研發的難度太大,技術迭代太快,難以實現固化而放棄。
2017年,侯聰日後的創業搭檔於騫加入了感知組。
於騫2001年從清華計算機本科畢業,楊士強教授是他的系主任,於騫和美團創始人王興是同學(清華電子工程系無線電專業)。
於騫讀博時,計算機視覺(CV)還是個冷門學科,圖形學比較熱,因為可以用在電影製作方面,容易變現。但於騫選擇CV是因為他在清華人工智慧國家重點實驗室,跟隨張鈸院士。於騫一直堅定地認為,“在人工智慧領域,計算機視覺才是最接近智慧的技術。”
於騫
當時,於騫做的是基於雙目視覺的無人車專案也使用單線雷射雷達。在清華校園和周邊的開放道路上,於騫和他的同學們做了各種實驗。
2013年底,於騫加入了谷歌地圖。一直到2017年2月,於騫做到了谷歌地圖的街景組關鍵專案技術負責人,谷歌內部叫商業發現專案,目的是讓地圖不僅僅是給導航用,更要將大量的本地商業資訊(類似餐館、加油站、商店等)增加到地圖元素中,尤其是透過谷歌大規模的街景資料高度自動化的完成本地商業資訊的發現、定位、分類和匹配工作。
當時很少有人相信可以透過街景資訊高度自動化的產生最新的本地商業資訊,這部分工作幫助谷歌地圖完成面向本地化的轉變,保持了谷歌地圖的競爭力。
在他看來,谷歌的工程師基礎非常紮實。Waymo團隊中的大多數工程水平甚至比谷歌還要高,篩選過程非常嚴苛。
於騫回憶,創始人Larry Page和Sergey Brin都對Waymo很重視。Waymo內部創新和技術氛圍很濃,特別是Sergey, 有時會和大家一起開會。Sergey穿著隨意,會穿著短褲進來加入討論。還有一次,於騫邀請了發明GAN網路的人Ian Goodfellow來做講座,於騫是那次講座的主持人。Sergey特別感興趣,陪著一起聽完了整個研討會,中午和大家一起吃午飯。
“Sergey對技術非常關注,所以谷歌的demo能燒這麼多錢往前走,源自創始人的支援。”
朱佳俊曾說到,“Google的兩個創始人Larry Page和Sergey Brin都很開放、也很有使命感,他們樂意為這些長線專案買單。”
前Waymo感知組成員、美團無人車感知負責人夏飛也直言,“別的不說,Waymo一次版本更新迭代就要花不少錢,還不算研發費用,國內很難有公司願意砸錢評估。
在谷歌高層的支援下,Waymo的商業化有了明顯起色。2018年12月,Waymo自動駕駛打車服務的產品Waymo One正式上線。摩根斯坦利給出Waymo1750億美元的估值,而前一年這個數字僅為700億美元。
2

投身創業大潮:智慧駕駛與具身智慧

估值膨脹的背後,是Waymo正在一步步擴張與增員的事實。
2018年,Waymo的感知組有將近200人,張一萌在內部的職級是L6(Tech Lead),這個職級不低。然而,感知組的L6還有3、4個。張一萌只能分到一部分專案,她坦言,“感覺自己能做更多的事情,但只發揮了40%的能力”。
另一方面,組織架構的精細與流程化,意味著一個決策會牽動各方利益。
2019年1月,The Information梳理了一份Waymo的組織架構。這時候的Waymo有950名員工,在內部被稱為“Waymonauts”,還有至少幾百名外包人員。工程部是規模最大的團隊,佔了員工總數的三分之二,其他部門的規模相對較小。在這950名員工中,有350人屬於軟體工程團隊,260人屬於硬體工程團隊。
張一萌表示,“在Waymo,想做出改變需要得到各個組的同意。真正實施的時候又要跟很多人溝通。發展到後期,Waymo就已經是一個不可輕易調整的龐大‘系統’。”
小馬智行是張一萌接觸比較早的公司。
當時,張一萌和創始人彭軍在一家咖啡館見面,兩人感覺不錯。但張一萌還想看看其他機會,彭軍對她說:“我們肯定不怕(你去其他家),這個自信還是有的,去聊吧。”
後來,張一萌花了4、5個月的時間廣約面試,最終的選項只留下百度和小馬,她在百度的最後一輪面試官是李彥宏。但最終在2018年9月,張一萌選擇了小馬。和她同一天入職的,還有現在小馬副總裁、廣州研發中心負責人莫璐怡。
小馬員工評價,張一萌早期給公司做出的最大貢獻在於完善了小馬的感知閉環。
入職後,張一萌發現小馬的短板在於,研發沒有形成資料驅動的方式。在0-1的創業初期,驗證程式碼的最直接方式就是把程式碼部署到車上跑一圈。但從1-10的階段,各個版本之間的差異不大,路測無法作出準確的評價。這個時候,團隊之間就會為了“上不上新的演算法”而爭論,拖累研發節奏。
張一萌在內部提的概念是“Development Circle”,讓資料不僅僅在訓練過程中發揮價值,而是進一步在評價體系和模擬系統中進行流轉。資料驅動的思維,也成為小馬研發體系的關鍵基礎,並一直延續至今。2024年11月,小馬正式在美股上市,市值超45億美元。
張一萌走後不久,於騫的本科同學、IDG資本合夥人牛奎光找到了他。牛奎光告訴了他中國自動駕駛領域的創業機會。後續,於騫邀請侯聰一起組創業局。
那時已是2018年底,侯聰覺得創業時間太晚,就考慮了半個月。
一個小插曲是,早在2017年,侯聰就曾差點加入小馬智行。當時,樓天城先聯絡了侯聰,後來彭軍又找了侯聰三次,甚至帶上自己的夫人和侯聰夫婦共進晚餐,但是最終因為各種原因,侯聰沒有加入小馬。
在侯聰看來,彭軍是一個很稱職的CEO,為了招人盡心盡力。後來,張一萌要去小馬時,侯聰順勢推了一把說“這是一個很好的團隊,是一個很好的機會。”
後來,半個月時間一到,於騫再找過來時,侯聰就答應加入。最終,於騫、侯聰、大方、汪堃走到了一起,在矽谷一個深圳市政府做的名為“Shenzhen Lab”的孵化器裡租了幾個工位,在孵化器門口找來一個集裝箱,買了一臺林肯進行改裝,輕舟的創業故事就此開始。
輕舟分為L2量產和L4(無人駕駛小巴)兩條發展路線。在L2量產領域站穩腳跟,離不開地平線與理想的支援,一個是給投資,一個是給定點。
最早的時候,於騫在USC的師弟黃暢(地平線聯創兼CTO)都在矽谷的NEC Lab,地平線創始人餘凱是當時NEC Lab的主任,於騫和徐健(地平線首席生態官)的關係也很密切。
有意思的是,在進行智駕方案的晶片選型時,於騫最早見的人是黑芝麻智慧的創始人單記章。當時,黑芝麻的華山晶片還在設計階段,單記章問過於騫關於自動駕駛晶片的需求。不過,輕舟最終加入了地平線陣營。餘凱給輕舟投了一筆錢,幫助輕舟度過關鍵的早期階段。在此後的時間裡,餘凱經常會給輕舟站臺,哪怕是輕舟自己的釋出會。
於騫對雷峰網說,“我們非常感激地平線和餘凱,同時地平線也感激我們。因為在基於J5的中階方案上,我們承載了他們最大的出貨量。”
輕舟和地平線更應該共同感謝的,其實是理想汽車。
2020年9月,地平線釋出了J3晶片。8個月後,J3量產上車理想ONE。為了響應理想的需求,餘凱動用了地平線的全部精銳,組建了一支300人的團隊派駐理想。在當時經歷了大瘦身的地平線裡,這幾乎佔據了總兵力的四分之一。理想ONE上市後一炮而紅,地平線迎來了大規模放量。
次年,地平線的“J5”系列產品也用了不到7個月在理想L系列上實現了量產。
2023年3月,輕舟開始與理想談合作,直到9月份才正式確定合作,這中間有著漫長的考察過程。當時,理想正在考慮要把智駕晶片從J5換成英偉達的Orin,但最終沒有成行。由於聯創的Waymo背景,輕舟開發了很多底層工具。與理想合作時,輕舟發現理想的工具質量還有很大的提升空間,幫著它一起最佳化。
2024年8月底,於騫向雷峰網表示,“有40萬輛車裝載了我們的智慧駕駛軟體。真正在車輛上應用的軟體規模,我們還是最大的,這說明我們的穩定性可靠性得到真正市場的考驗。”到了12月,輕舟官宣中高階智駕解決方案量產交付上車正式突破50萬套。
2019年從Waymo離職創業之前,於騫面試了一個人——星海圖的創始人高繼揚。
兩人見面是在2018年底,於騫是高繼揚在USC(南加州大學)的學長。高繼揚在Ram(Ram Nevatia,南加州大學計算機科學系計算機視覺領域的研究專家)教授組裡,跟他同組的還有地平線的黃暢。當時黃暢正在唸博士後,算得上是高繼揚的大師兄。
大四這一年,高繼揚去商湯實習開始接觸AI。在商湯的時候,他認識了Momenta的創始人曹旭東。這個時候,高繼揚已經感受到了AI的潛力,讀博的時候切換了方向。在導師Ram教授的指導下,他僅用了3年半的時間就完成學業,成為USC IRIS計算機視覺實驗室最快畢業的博士。
因為用了很短的時間讀完博,所以高繼揚自認為沒有特別引以為傲的論文。但好處在於,高繼揚趕在了好的時間點進入自動駕駛行業。
在Waymo,高繼揚作為高階軟體工程師,參與了基於機器學習的行為預測專案,並和趙行、孫晨聯合發表了著名的VectorNet模型。(孫晨是高繼揚的學長,當初也是孫晨將高繼揚引薦給Ram教授)
(從左往右為趙行、孫晨、高繼揚)
VectorNet是一個基於神經網路的預測和規劃演算法。相比廣泛使用的ResNet ,VectorNet在預測的精準度上提高了18%。更重要的是,它在進行行為預測時佔用的記憶體僅為ResNet的29%,計算量也僅為後者的20%。論文發表之後,不少公司開始用圖神經網路的方式去做預測規劃。
2021年1月,高繼揚加入Momenta。
Momenta是業內知名的“卷王”,去車企駐廠是一件非常平常的事情。高繼揚向雷峰網表示,“在服務客戶這件事上,我們就是服務員,保質、保量、保時間。做技術的覺得技術過硬就可以,但沒有給客戶創造價值就等於零。”
高繼揚對Momenta的日子心存感激,高繼揚進去之後向聯創孫剛彙報。孫剛的管理風格是“無為而治”,但是他很會充分放權、捏合團隊。在Momenta,從感知、定位、規控、泊車、行車、AI Infra,所有的事情高繼揚都經歷了一遍。Momenta的第一個自動駕駛量產專案——車位檢測演算法,就是由高繼揚負責給博世交付。
博世的研發中心在蘇州。高繼揚帶領團隊幾乎把蘇州一半的停車場跑了一遍。每個停車場採資料、訓練,訓完之後隨機找停車場泊車。為了建立客戶信心,高繼揚向客戶承諾:一週一發版,版版有提升,在這樣的經歷下,Momenta慢慢建立起了交付方法論。
2022年4月份,Momenta給上汽做第一次交付,交付的第一個功能是泊車和車道保持。但在2022年春節前,Momenta的泊車成功率大概只有60%,高繼揚被指派來負責泊車。由於出入不便,高繼揚樓上睡覺樓下調車,把泊車成功率從60%提升到了95%。
2022年6月,高繼揚正式開始負責NOA領航輔助系統系統,接手了規控、NOA系統研發團隊。等2023年4月份交付完成後,已經成為NOA負責人的高繼揚在5月份提出了離職,正式投身創業大潮。
而他的創業夥伴,正是他在Waymo前同事、VectorNet網路的合作者——趙行。
趙行本科在浙大,後在MIT取得了博士學位,師從MIT AI&D (人工智慧與決策)系主任Antonio Torralba教授——多模態深度學習的開創者之一。
後來,趙行加入谷歌Waymo擔任研究科學家,負責演算法方面的工作,是Research組的研究員。2020年底,趙行離開了供職一年半的Waymo。當時,已經創業的於騫曾經向他伸出了橄欖枝。但趙行最終選擇去清華大學交叉資訊院擔任助理教授。
2024年3月,在英偉達GTC 2024上,理想釋出了智慧駕駛方案——“端到端 +VLM(視覺語言大模型)快慢雙系統”,其中VLM正是理想和趙行所在的清華MARS Lab的合作成果。VLM的能力在於,即使遇到從未見過(訓練過)的場景,也能像人類一樣透過理解、分析、推理,最終安全應對。
按照李想的話說,“不再需要養幾千人的團隊去搞corner case,而且團隊越多corner case越多了。”也正是從這篇文章之後,理想的智駕進度被大大提速,在2024年取得了肉眼可見的成果。
趙行和圖森未來的前CEO侯曉迪也是朋友。有一年CVPR上,侯曉迪找他喝酒,正好當時一位MIT的老師也在。侯曉迪口才出色,這位老師聽後直接邀請侯曉迪去MIT講課。
高繼揚也認識侯曉迪。剛畢業的時候,高繼揚曾面試過圖森未來,聊技術問題時侯曉迪的壓迫感十足,這給高繼揚的心理造成了“巨大壓力”。他對於侯曉迪的印象是:“很犀利、很sharp的人,他是傳統視覺出身,深度學習也很懂,兩者結合非常好。”
2023年5月,趙行和星海圖的另一位聯創許華哲一起去非洲參加學術會議,當時許華哲還在清華,他聽說趙行有具身智慧方面的創業規劃,就找趙行了解。趙行表示,“不如來聊聊?星海圖現在也在籌建期。”
於是,趙行就拉著許華哲跟高繼揚一起吃飯,三人聊的非常投機。
2023年9月5日,星海圖正式成立。十一假期的第一天,許華哲帶組裡的PhD去郊遊,郊遊那天他決定加入星海圖。2024年11月,星海圖宣佈完成超2億元Pre-A輪融資。
3

Waymo的故事仍在續寫

Waymo系出身的自動駕駛創業者,和“清華系”、“百度系”一樣,是自動駕駛領域繞不開的存在。於騫向雷峰網說過,“Waymo有一箇中國人微信群,我在的時只有20多人,現在群成員已經增加到500人了。”
這些在Waymo來來往往的華人,成為未來中國自動駕駛乃至具身智慧領域的探路者。但是並不是所有人的離別,都是為了投身創業。Waymo本身的一些問題,也是他們離開的重要原因。
“架構比較複雜。”
這是前Waymo感知組成員、美團無人車感知負責人夏飛談及離開的主要原因。“Waymo不得不處理大量的長尾場景。Waymo需要下定決心簡化現有系統,但這個取決於多方的認知。”
與他持有類似觀點是高繼揚。在高繼揚看來,Waymo在2021年後走下坡路,人才密度有所降低,這是因為Waymo的大方向有問題,與AI行業技術的發展規律相悖。
AI有兩個衡量維度:失效成本,泛化性要求。L4級自動駕駛的失效成本高,泛化性要求高。大語言模型對泛化性的要求高,但失效成本很低;具身智慧失效成本高於大語言模型,但是顯著低於自動駕駛,同時對泛化性的要求也較低,因為具身智慧的商業化過程是一個以崗位替代為核心邏輯的過程。
高繼揚表示,Waymo開城思路是從區域L4起步,這就決定了需要圍繞各個目標城市來拆解任務,系統裡就產生了幾十個模型,每個模型背後都是一個小團隊支援,在“人比事多”之後,大家會出現搶專案或者相互掣肘的現象;其次,Waymo是Google的子公司,CEO、CTO是職業經理人,這對於一個沒有穩定業務的創業公司不利,因為出錯之後無人負責,也沒有人可以強力糾偏。
也有人不太認同高繼揚的觀點。
張一萌認為,谷歌整體的文化是bottom up(自下而上)不是top down(自上而下)。
2014年,張一萌加入時,是Chris Urmson和Dmitri Dolgov在管理方向。但當時Waymo是走在最前端的公司,沒有任何的參照可言。作為技術引領者,不像追隨者一樣有清晰的方向。在探索新東西的時候,自下而上會有更多創新的靈感。
張一萌認為,以現在的眼光去審視過去Waymo的做法有失妥當。從2016年到2020年的這段時間裡,最可用的方法就是將任務分成一個個小模型。當時有很多學術論文確實是從研究大模型開始,但那個時候的GPU條件受限,不足以去支撐大模型。
“Waymo這樣的公司包袱會重一些,但是也在改變。小馬當年也是多個模型,前兩年才慢慢換成一個大模型的方式。如果小馬在2021年成立,肯定直接走大模型的路線。”
對於特斯拉與Waymo的不同開城思路,張一萌仍然認為,L4必須一個個城市去開,特斯拉的方式更適合L2。即使今天特斯拉去做L4,也一定是如此操作。
有Waymo前員工贊同這一說法:“AI背景的人,或許對Waymo開城思路有所質疑。可以很明確的感覺到,大部分人都是盲人摸象,只能看到自己領域裡的東西。無人系統很複雜,雖然程式碼都是公開的,但是很少有人能夠全部知道其他人在做什麼。核心在於Waymo賣服務,特斯拉賣車,不是Waymo傻或者笨,而是兩者的目標不一樣。”
兩種不同的觀點對應的是在不同歷史階段的技術路線選擇。對於Waymo來說,能走到今天已經殊為不易。
2023年,智慧駕駛行業進入低谷期,Waymo裁員137人且裁員範圍大部分集中在技術崗位。加上1月份的首輪裁員,Waymo共裁員209人,佔到其員工總數的8%。
不久前,通用宣佈由於開發成本過高,將停止Cruise自動駕駛出租車業務。同時,其合作伙伴日本本田汽車也宣佈將停止向Cruise提供資金。Waymo的同行者少了一位,當初引領行業熱潮的Cruise匆匆下線。
只有Waymo還在一直堅持。
2024年10月,Waymo完成一輪56億美元的融資,這是Waymo迄今為止籌集的最大一輪融資。根據規劃,新的投資將用於加速與Uber的合作,並宣佈將於2025年在美國奧斯汀和亞特蘭大推出Robotaxi服務。
自動駕駛是一場馬拉松,不是百米衝刺。時至今日,Waymo的成敗難以定義,但它是當之無愧的自動駕駛之王。
“Waymo有一幫特別聰明的人,做事非常認真、專業,程式碼質量非常高。在全世界,你想找到第二個這樣的團隊是不容易的。”
從Waymo離開的這些人,正在繼續書寫智慧駕駛和具身智慧的江湖故事。


相關文章