Z Talk 是真格分享認知的欄目。
今年 4 月,在新一輪千萬美元融資之後,Perplexity AI 的估值超過 10 億美元,躋身獨角獸。這家創立於 2022 年的 AI 知識發現引擎公司,月活使用者已超千萬,黃仁勳曾在採訪中表示,「幾乎每天都在用 Perplexity」。
CEO Aravind Srinivas 1994 年出生於印度,博士畢業於加州大學伯克利分校,曾在 OpenAI、Google、DeepMind 實習,後從 OpenAI 離職創立 Perplexity AI。在 20VC 近期一次與 Aravind Srinivas 的深度對談中,他分享了對於基礎模型效能邊界、商品化的看法,以及 Perplexity AI 建立商業模式的經驗。
真格基金積極關注前沿科技創新動向,我們將在未來持續帶來全球頂尖創業者認知與深度內容,敬請關注。以下是編譯全文。

核心內容
-
模型效能收益遞減:純粹擴大模型規模所帶來的效能收益將變得有限,我們需要在資料管理(Data Curation)上付出更多努力。
-
基礎模型的商品化:處於第二梯隊且足夠便宜的模型將會成為可替代的通用商品,但創造前沿模型的人才和團隊將保持極高的價值。基礎模型商品化的最大受益者是應用層公司。
-
AI是廣告:月付 20 美元的訂閱制模式不夠好,Perplexity AI 未來的主導盈利引擎會是廣告。這是過去 50 年裡最偉大的商業模式,利潤率高達 80%。
01
從一次機器學習比賽開始投身 AI
Harry Stebbings:Aravind,我真的很期待這次訪談。首先,非常感謝你今天能來。
Aravind Srinivas:謝謝你邀請我,Harry。我看過你很多節目,非常期待這次訪談。
Harry Stebbings:我想先從你的經歷開始聊起,你是怎麼愛上 AI 的?你是怎麼意識到這就是你想做的事情,並打算將你的職業生涯都投身於此的?
Aravind Srinivas:這更像是一場意外,我只是一個普通的學習電子工程和計算機科學的本科生。有一次一個朋友告訴我說「有個比賽,如果你能贏的話就能獲得獎金。」我記得我當時需要錢,因為我不確定自己是否能找到實習,所以我試著參加了這個比賽。
這是一個機器學習比賽,但我當時甚至不知道機器學習是什麼。我只知道你會拿到一些資料,你可以利用已知資料中的一些模式來對你未見過的資料進行預測,這些資料在伺服器中,無法訪問。你提交演算法,它會根據正確答案和你的預測進行評分,預測得最準確的人贏得比賽,獲得獎金。然後我去看了看一個非常流行的機器學習庫 Scikit-learn。
我真的不知道這些詞是什麼意思,比如決策樹和隨機森林,這些對我來說沒有什麼意義,我就像 AI 那樣進行了暴力隨機搜尋。最後我完成了所有任務,贏得了比賽。
我打敗了那些真正懂機器學習的人,這讓我非常有信心,我覺得這可能是我很擅長的事情。我記得 Sam Altman 曾告訴我,兩三年前我曾經問他,怎麼判斷自己天生擅長的事情?他說「任何對你來說很容易,但對其他人來說很難的事情。」
這是一個很好的啟發式方法,可以用來判斷你在哪些方面可能比其他人強得多。我覺得機器學習是個好東西,當時它還不叫 AI,所以我開始研究它。我修了所有的課程,讀了 Christopher Bishop 寫的《模式識別與機器學習》。我在印度買了一本二手的,好像只花了兩三美元。閱讀後我真的很喜歡它,它很有數學的嚴謹性,又很直觀。
這讓我有機會接觸到一位教授。他在我的本科學校教書,研究強化學習,我請他指導我。所以當我真正進入 AI 領域時,就是在研究強化學習。因為我們都為跳棋或井字遊戲類似的東西寫過 AI。當你小時候和電腦下棋對戰時,你總是會問,電腦是怎麼下棋的?然後別人就會說,它就像 AI 一樣,你不用管它。他們很寬泛地使用「AI」這個詞,但 AI 的真正定義是什麼?它是智慧體 agent,它接收獎勵訊號(reward signal)並針對目標進行最佳化的環境。
當我開始研究強化學習(RL)時,所有這些框架在數學上對我來說都變得有意義了。然後我的導師在課程結束時告訴我,他有一個從讀博士的時候就認識的朋友,叫 David Silver。他的創業公司當時剛剛被谷歌以大約 5 億美元收購,因為他們寫了一篇論文,論文中模型透過學習螢幕上的畫素來玩 Atari 遊戲。
「他們已經開源了程式碼,你為什麼不把它拿過來,研究如何同時玩所有的遊戲,而非單個遊戲。」如果你已經學會了玩 Pong,那麼當你去學習翫 Breakout 時,你會學得比從零開始學快得多。這就是遷移學習,我工作的第一個專案就是這個。我很喜歡 DeepMind 裡所有論文的想法,我就想一直在實驗室裡,不停地閱讀論文,並試著去實現它們。
02
想要獲得最大的收益
需要確保資料質量
Harry Stebbings:第一個浮現在我腦海中的問題是,當我上線訪談時很多人給我發訊息,他們問的第一個問題總是關於收益遞減的,你往裡投入更多計算能力,就能得到更好的模型效能。你認為我們現在已經達到了一個收益遞減的階段了嗎?
Aravind Srinivas:我覺得這是一個複雜的答案。我可以簡單地說不是,然後你就會覺得可能使用蠻力仍然有效,但現實也並非如此。這也不是我突然來找你說:「嘿 Harry,拿我的 5 億美元去建一個大型計算叢集,處理數萬億 token,得到一個比 OpenAI 更好的模型」,事情也不是這樣的。
讓現在這些模型變得更大、用更多的 token 來訓練它們仍然還是有價值的,但如果你想要獲得最大的收益,你就需要付出很多努力確保資料質量等事情,否則就不值得了。
就好像我知道的很多研究實驗室,它們用大量資料訓練了非常大的模型,但最終一無所獲。這很大程度上取決於你用什麼資料來訓練,如何混合英語和其他語言、程式碼和比如數學及所有的思維鏈推理,它是如何在 Scaling Law 中起作用的,以及接著如何讓混合專家模型更加計算高效,所有這些都很重要。
我認為,那些把所有細節都做對的人,才能從更大的規模中獲益更多。而現在只有三到四個實驗室能做到這一點。我舉個例子,當 xAI 釋出 Grok-1 時,這個開源模型第一次亮相,Arthur 發推特說,這個模型有很多多餘的引數,因為作為一個引數量 300B 的模型甚至還不如 Mistral 56B 引數量的模型效果。
你可能會訓練一個比原來大六倍的模型,但最終得到一個更差的模型;你可能會花更多的錢,但最終得到一個更差的模型。
Harry Stebbings:所以如果你談到資料管理(Data Curation)作為決定模型效能的中心因素。本週早些時候 Reid Hoffman 參加了我的節目,他說我們將會看到模型的垂直化,你會使用不同的模型來做不同的任務。這是你指的意思嗎?
Aravind Srinivas:實際上我認為這個觀點也是有缺陷的。我以前也認為會發生這種情況,但我可以再舉一個例子來反駁這個觀點。彭博(Bloomberg)花了很多錢來訓練 Bloomberg GPT,他們甚至寫了一篇論文來說他們訓練了自己的基礎模型,但這個模型在所有金融基準測試中都被 GPT-4 打敗了。
Harry Stebbings:我們怎麼知道這不是特定案例呢?可能是他們採取的方式不對,或者團隊不夠厲害,等等。這不一定能反駁模型的垂直化,對吧?
Aravind Srinivas:我想問的是,這些模型的魔法何在?它源自哪裡?你在測試它們時使用的方式並不是你訓練它們的方式,你在聊天視窗中像與真人互動一樣去 prompt、去使用模型的方式,並不是它們被訓練時在做的事情,訓練過程中它們只是被訓練來預測網際網路上的下一個 token。當然,它們也進行了一些微調,變得擅長聊天、擅長遵循指令等等,但這只是應用的一小部分計算能力。
所以,讓這些模型具有魔法的是它們通用的自發能力。它們可以在沒有專門訓練的情況下完成任務,或者透過簡單的提示迅速理解並執行任務。這並不源於任何特定的領域,而是大量神經網路訓練後的湧現。
這些神經網路非常神奇,你只用向它們輸入一組非常多樣的資料,就能夠識別出在處理所有這些資料時所需的抽象技能。正是這種抽象技能,這種抽象的「智力」,讓這些模型在實際生產用例中如此出色。
所以,當你說要去做一個特定領域的模型時,你可以想想在這個領域裡有多少 token?程式碼可能是唯一實際擁有大量 token 的領域。你可以向模型輸入大量企業資料,說我有很多其他人沒有的內部資料。但這並不意味著這些模型會因此獲得一種全新的、無法從網際網路上獲取的推理能力。
很少有人能理解,為什麼這些模型如此擅長推理?目前對這個問題的理解仍然很有限,是因為模型接受了數學或程式碼的訓練嗎?如果模型僅僅透過教科書的內容進行訓練,是否還能獲得推理能力?這些問題目前還沒有很好的答案。
03
當模型推理達到一定高度
將會打破月付 20 美金的商業模式
Harry Stebbings:你認為模型擅長推理嗎?我認為,推理方面的一個突破將是下一波浪潮中最大的突破時刻之一。你覺得我們今天在推理質量方面處於什麼水平?要在下一波推理質量上取得突破需要什麼?
Aravind Srinivas:這取決於你所說的「擅長推理」是什麼意思:比八年級學生更好嗎?我認為是。它們比 75% 的 12 年級學生更好嗎?很可能。它們能在國際數學或資訊學奧林匹克競賽中獲勝嗎?不,肯定不能。
所以這是一個範圍。即使在人類中,也有很多人擅長推理。我肯定 AI 現在就像高中生的中位數一樣。它能達到本科生中位數的水平嗎?當然,看起來我們正在朝這個方向前進。與 AI 對話是否會像與法拉第或愛因斯坦這樣的偉大科學家對話一樣嗎?短期內還無法達到這樣的高度。有人稱這種 AI 叫人工超級智慧。
我認為,當我們達到這一點時,它將打破所有這種每月 20 美元的商業模式。你看過諾蘭的《致命魔術》嗎?裡面的魔術師相互競爭,就好比有一個魔術師想從特斯拉那裡偷學一個讓東西消失的技巧。他願意花重金,只為了學那一個技巧。
我認為,如果模型變得非常擅長推理,你就會得到這樣的結果。為了輸出,你甚至不付月費,你會為單獨一次的會話、聊天、輸出付費,你會付很多錢。Harry 你是投資者,如果我來告訴你,即便我沒有任何內幕訊息,如果我是如此擅長推理,我告訴你,Harry,兩年後這將是一家真正重要的公司。這個資訊你可能得花兩個月時間與一百個人交談才能得到。你會為這個答案付 1 萬美元嗎?
Harry Stebbings:可能會付 1000 萬美元。
Aravind Srinivas:沒錯。所以即使你只支付回報的 1%,那也是值得的。像 Demis Hassabis 這樣的人,他們非常聰明,誰能給 Demis 提建議?能數得出這樣的人有幾個?那麼如果 Demis 覺得有一個人工智慧可以給他建議,那這個人工智慧的價值是多少?它會打破你所有關於每月 20 美元的思維模式。我認為這是現在我們在期待的。
如果推理能力的基準是一個給 Demis 提供建議的 AI,我們今天還沒有這樣的東西。但有現在的 AI 可以給英國一個年薪 12 萬英鎊的人提供建議。我認為我們可以做到這一點。你必須清楚地界定什麼是好的推理。
Harry Stebbings:我理解你對好的推理的精確界定。當你考慮推理能力的軌跡時,你怎麼看待它發展的時間線?你認為它是上升、平穩、再上升嗎,還是一個持續逐漸增?你怎麼看待推理改進速度的軌跡和斜率?
Aravind Srinivas:我認為我們還沒有找到秘訣。至少根據媒體的說法,他們聲稱 OpenAI 有一個叫 Q* 的新東西,努力利用自身的資料進行自我學習和最佳化,進而提升其智慧水平。xAI 最近聘請了斯坦福大學的 Eric Zelikman,他寫過一些關於 STaR 的論文,即自學的自動推理器。基本上是讓模型本身來解釋自己的輸出。你取正確的輸出,讓模型解釋為什麼那是正確的,並用它來訓練。
你不僅是在訓練輸出,還在訓練用來推導輸出的過程。如果你能做到這一點,你基本上就是在訓練一個模型,它可以思考、推理、得到輸出,檢查輸出是否正確,然後再回去,再次推理,並且迭代。這是現在模型所缺乏的,它們只會給你輸出。未來的模型將從一個輸出開始,進行推理,從世界中獲得反饋,再改進推理,直到它們收斂。它們會一直試圖改進輸出。
我不知道什麼時候會實現。也許會在一年或兩年內,也許需要三到四年。但我認為,當實現這一點時,那將是真正的推理時代的開始。我們讓所有事情都更高效,我們將會投入很多資源。
唯一的問題是,這場比賽不會像以前那樣由學術界來玩。為了推理,為了輸出,再回去推理,構建一個邏輯,得到另一個輸出,僅僅這個過程就需要大量的推理算力。
為此你得付很多錢。即使是單一的實驗也會花你很多錢,直到你找到演算法的真相,執行這個演算法也會花費你很多錢,因為你需要得到所有的合成數據來進行訓練。
擁有大量資本的公司將更有優勢。如果最終只有四五個競爭者來做這件事,並且不管是誰最終得到了這個演算法,第一個得到的人將有巨大的優勢,一旦你破解了它,你就可以繼續投入更多的計算能力,獲得巨大的領先。
Harry Stebbings:我們後面肯定會談到所需的資金,但我想先繼續聊聊效能和功能。為什麼有記憶能力的模型這麼難實現?大家都說記憶能力是個挑戰。我不明白為什麼,可以解釋一下嗎?
Aravind Srinivas:這裡要思考兩件事。記憶是什麼意思?是指對大多數用例都實用的足夠長的上下文,還是指無限長的上下文?比如說有一個人工智慧,它能記住你的一生、記住每一個細節,那就是無限記憶,我們甚至還沒有這樣的演算法。還有另一種人工智慧,就像 Gmail 一樣,開始時就有足夠大的儲存空間,既實用又會隨著時間不斷擴充套件。到一定程度後,你可能需要每月支付 10 美元,這更像我們現在的趨勢。
上下文長度從 32K 開始,正在擴充套件到一百萬,然後 DeepMind 釋出了兩百萬。我覺得這已經足夠好了。至少我們可以選擇優先處理的部分,拋棄不相關的部分,繼續使用記憶。這並不難做到。
不過這裡有一個小挑戰,還沒有完全解決。我們實現了長上下文,但是遵循指令的能力還不夠好。因為你有記憶功能,你可以在 prompt 裡輸入很多內容,但由於資訊太多,模型可能會產生幻覺或混淆。因此,你需要確保在增加了所有這些長上下文功能後,遵循指令的能力沒有下降。
我認為現在還沒有做到,這就是為什麼這些模型還不夠好。比如它們還不能寫出一個完整的程式碼庫。但我想這一切都會到來,只是時間問題。
04
在基礎模型領域競爭
幾乎是一場必輸的遊戲
Harry Stebbings:大家都在說,我們正在看到基礎模型的商品化,我很想聽聽你的看法。你如何看待基礎模型層的最終狀態?它們真的像人們說的那樣被商品化了嗎?
Aravind Srinivas:我認為今天,「商品化」這個詞在某種程度上是真實的。像 GPT-3.75 級別的模型已經被商品化了,今天市場上有太多這樣的模型了,一些是開源的,一些是閉源的。
我認為像 GPT-4 質量的模型還沒有被商品化,今天人們可能只有一兩個選擇,比如 Claude 3 Opus 或 Gemini。所以如果只有兩三個選擇,我還不會稱之為商品。但將來會被商品化嗎?我想是的。但是,當它被商品化的時候,會不會有 4.5 或 5 的版本,那會更好?這還有待觀察,訓練正在進行中。
我的預測是,在 4 之後還會有一個很棒的模型。我不會說 GPT-4 比 GPT-4 turbo 聰明很多。它更可靠、更好、更快、更便宜,但它並不像 4 比 3.5 那樣有質的飛躍。5 是否能對 4 做到那種程度的提升,將回答你的問題,即是否這些模型正在被商品化。
Harry Stebbings:這並不像以前糟糕的商業模式那樣,在那種模式下,核心產品每六個月就會被淘汰。
Aravind Srinivas:但這是真的嗎?我是說,我看過你對 Altman 和 Brad Lightcap 的採訪,但一個產品真的會因為模型的升級而變得多餘嗎?
Harry Stebbings:我認為是這樣的。現在有了 GPT-4,GPT-3 不是已經變得不再被需要了嗎?
Aravind Srinivas:但你的產品從來都不是模型。也許我們應該把這兩者分開,如果有公司正在開發能與 OpenAI 競爭的基礎模型,那麼這絕對是最糟糕的領域之一。
我幾乎認為,現在有五家公司站在這個領域。Google、Anthropic、Meta、Mistral,也許在 xAI 的新一輪融資後,你也可以把它們包括進來。但這是一場非常難打的遊戲。我很佩服 Mistral,儘管它的資本比其他公司少 10 倍,但它仍然在這個領域裡。
Harry Stebbings:你不是也在同一個領域嗎?
Aravind Srinivas:我們後期訓練模型,我們不訓練基礎模型。我們可以使用當今市場上的任何模型,塑造它們,讓它們擅長我們的產品功能。當你說有一個 Llama 3-70B 時,那只是一個基礎模型,第一部分只是訓練來預測下一個 token;然後是監督式的微調和 RLHF 這一部分,把它們訓練得非常擅長聊天、指令遵循、總結和翻譯等所有這些技能。
第二部分是給產品增添魔法的部分,如果沒有這一部分,你就不會有這麼好的聊天機器人。但第一部分為這些模型建立了基本的智力。
我們不做第一部分,因為玩第一部分幾乎是一場必輸的遊戲。每次你完成一次大型的訓練後,你要燒掉很多錢,你有了一個很棒的模型,接著你就看著它在排行榜上被下一個新版本摧毀。然後你又得趕上去,你又得花更多的錢。
那麼你如何收回所有的錢呢?你可能會透過 API。如果其他人只是以更便宜的價格和更快的速度提供更好的模型,那麼沒有人會想使用你的 API。這就是為什麼我認為這是一場艱難的遊戲。它之所以艱難,並不是因為訓練這些模型很難。當然,背後的科學和人才是很難聚集的。但從投資回報率(ROI)和商業角度來看,競爭非常激烈。
Harry Stebbings:這不就是我們所說的模型的商品化嗎?就是你到了一個階段發現,糟了,每個人都到了這個階段,我們必須再做一次,再做一次,你的模型就變得多餘了。
Aravind Srinivas:是的,這就是為什麼我認為排在第二梯隊的模型,它們不是最前沿的模型,但足夠便宜到可以在其基礎上開展業務的,最終將成為通用商品。
但也會有一些非常智慧的前沿模型,遠遠領先第二梯隊的模型。我認為,今天仍然只有三四個人在玩這個遊戲。
Harry Stebbings:最終會是三四個玩家,還是一個玩家?
Aravind Srinivas:我認為這個問題的答案真的取決於誰首先破解了自學推理(bootstrap reasoning)。我們之前稍微談過一點,就是模型使用它們自己的輸出來進行推理和改進。無論是誰首先破解了自學推理,如果他們把所有的資本都投入到擴大這種推理的規模上,我認為最終會是一個玩家。但如果他們一直在採取保守策略,那就不會是一個玩家。
Harry Stebbings:你認為誰最有可能是這個玩家?
Aravind Srinivas:很可能是 OpenAI 或 Anthropic。我可以為這兩家公司都做出很好的論證。OpenAI 是因為他們遙遙領先。Anthropic 是因為他們在演算法上是一家更優越的公司,他們用比 OpenAI 更少的資本就達到了 OpenAI 的水平,他們在後期訓練等方面做得更好。而另一方面,OpenAI 在資本和速度上有優勢。
所以這是一個問題,什麼更重要?是聰明的頭腦和一定數量的資本,還是好的頭腦、很強的攻擊性和大量的資本。如果是後者,那就是 OpenAI。如果是前者,那就是 Anthropic。
Harry Stebbings:如果 OpenAI 沒有和微軟合作,你會選擇 Anthropic 嗎?
Aravind Srinivas:Anthropic 也和 Amazon、Google 有合作,所以它們都很有錢。xAI 也有錢和人,但在時間線上落後太多了。
Harry Stebbings:我認為大型雲服務提供商會意識到他們需要以不同的形式收購這些模型,他們會持續雲服務提供這一核心的搖錢樹業務,但他們將會收購這些模型並將它們新增到他們已經提供的免費功能中。你將會看到 Anthropic、Cohere、Adept 被這些大型雲服務提供商收購。你同意我對未來三到五年內這一預測的看法嗎?
Aravind Srinivas:我不這麼認為。
Harry Stebbings:為什麼?
Aravind Srinivas:我對 Cohere 沒有預測,但我認為對於 OpenAI 和 Anthropic 這樣的公司來說,它們的價值並不在於它們所擁有的模型。這只是一個非常初步的估值。
我認為第二層的估值是,它們的價值在於構建起這些模型的所有因素:那些擁有訓練這些前沿模型所需的所有隱性知識,並能在演算法上進行創新的人,以及他們所積累的計算能力。這就是這些公司估值如此高的原因,儘管它們的收入和估值看起來並不合理。重點不僅僅是產出,也包括給你輸出的背後運作的機器。當我們考慮估值問題時,考慮的是重新組裝整個系統的難易程度。
當你說模型正在被商品化,所以 OpenAI 和 Anthropic 並不那麼有價值時,我不同意。因為這些是將會生產出下一個模型的人。這些人才正在被商品化嗎?不。事實上,它正在變得與商品相反。公司花很多錢試圖讓他們留下來。知識只與他們同在,因為人們不再公開去發表文章了。
我最近和一個非常偉大的研究人員一起閒逛,他甚至開玩笑說最好的研究就是今天還沒有發表的研究。存檔裡已經沒有什麼可讀的了,即使是那些在斯坦福大學寫了所有這些推理論文的人,現在馬斯克花了很多錢僱他工作,他不會再發表論文了。
這就是正在發生的事情。價值不在於模型中,價值在於生產模型的人。這就是為什麼我覺得這些公司的估值很高,擁有很多談判籌碼,所以不會被收購。
這些人不想去大公司工作,而大公司需要他們的成果來繼續做生意,比如微軟需要 GPT 來達成銷售,使 Azure 成為市場第一的雲服務。AWS 需要繼續保持在雲市場的領先地位。我認為 OpenAI 和 Anthropic 不會被收購。
現在另一方面是,模型並沒有產生任何突破。從科學上講,不可能一直往模型裡塞越來越多的 token,並一直看到好的結果。如果,比如說一年後 OpenAI 沒有一個更好的模型,那麼他們的優勢就消失了。因為你必須產出新東西,如果他們無法生產出來,價值就下降了。
我認為這兩件事都可能是真的。但我相信這些人仍然會取得突破,所以我對此有不同的預測。但時間會告訴我們誰是對的。
05
每家籌集資金的公司
最終都得建立自己的商業模式
Harry Stebbings:我們剛剛提到了獲得資本的問題,顯然 OpenAI 比 Anthropic 稍微多一點。讓我印象深刻的是,我聽說 Mistral AI 新一輪的融資規模大約是微軟 30 小時產生的自由現金流。微軟每天的自由現金流是 3.3 億美元。你籌集的相對資金量,與微軟的自由現金流相比只是微不足道的。在這樣的世界裡,你要怎麼與別人競爭?
Aravind Srinivas:這就是為什麼你得建立商業模式。首先,我們把兩件事分開。如果微軟產生了那麼多的現金流,為什麼他們不能把所有 OpenAI 科學家或 Mistral 科學家都挖來為他們工作呢?他們可以用那筆錢,然後讓那些人中的 10 個人來他們這裡工作。說我會付給你們很多錢,不需要再在 OpenAI 工作了,直接在微軟這裡建立 AI,不管我給 OpenAI 什麼 GPU,我都直接給你們。但這並沒有發生,對吧?這是有原因的。
人們想和其他最優秀的人一起工作。所以光得到一個人是不夠的,你得到整個團隊。這就是為什麼當整個董事會鬧劇發生的時候,大家都在開玩笑說,微軟以很低的價格收購了 OpenAI,把整個團隊都挖走了。
我認為這是難點所在。現金流並不能改變依賴問題。如果他們能從除了這兩家公司以外的其他人那裡得到這些模型,情況就會大不相同。他們可以直接獲取開源模型,用更少的支出賺同樣的錢。這對基礎模型來說是壞訊息。
至於出路在哪裡?我認為你得自己建立商業模式。從根本上說,每家籌集資金的公司最終都得建立自己的商業模式,或者希望他們的演算法優勢能永遠保持下去。我會支援那些認真建立商業模式的人。OpenAI 正在用它的價值賺錢。他們每年的收入是 20 億美元,這比 Snowflake 還要高。他們資本效率不如 Snowflake 高,但在經常性收入方面,他們和 Snowflake 在同一個水平線上,而且增長速度更快。
所以這表明,如果你不僅僅滿足於訓練這些模型,而且還要透過產品進入市場並從中獲得收入,那麼你就有可能實現獨立和自給自足。
Harry Stebbings:你們今天在專注於建立商業模式嗎?你說我們將不再依賴每個使用者 20 英鎊的收入了,但你現在正處於從每個使用者每個月收 20 英鎊的階段。
Aravind Srinivas:我認為這門生意實際上沒那麼好,它的利潤不夠高。如果你能達到 YouTube 那樣的水平,那當然可以。Netflix、YouTube 的使用者基數有 5000 萬到 1 億人為你付費,那絕對是一門好生意。
我認為我們還沒有達到這樣一個階段,即這些 AI 對人們的生活如此重要,以至於有 1 億人訂閱它們。
如果他們能達到這個程度,如果你能開發出一個不僅僅是 AI 的產品,而且還有很多其他功能,人們為此支付了很多月費,而且留存率接近 100%,這會是一門了不起的生意。我認為我們也會嘗試這樣做。但所有這些偉大的訂閱服務做廣告也是有原因的,為了利潤率。
不管我們怎麼批評谷歌,過去 50 年裡最偉大的商業模式就是點選廣告。這是一個非常好的商業模式,利潤率高達 80%。
Harry Stebbings:當你和團隊討論加入廣告作為盈利引擎時,你們的內部討論是怎樣的?對話是怎麼進行的,怎麼得出最後結果的?
Aravind Srinivas:Larry Page 和 Sergey Brin 那篇關於 PageRank 的論文說,廣告從根本上與為使用者提供好的搜尋結果不相容。我讀過一些書,書上說他們儘可能地推遲引入廣告,直到他們屈服於投資者的壓力。我們就說,讓我們實際點,這是有史以來利潤率最高的商業模式,但我們不需要像谷歌那樣追求那麼高的利潤率。
你不必瞄準 80% 的利潤率,只要你能得到一個相當高利潤率的業務,同時又不辜負使用者的期望。可以開心點兒,但不要貪婪。
如何在不破壞搜尋結果的情況下做廣告?如果你能保證這一點,我認為這是一個很好的想法,值得去探索。這就是為什麼我們還有其他展示廣告的地方,比如「發現」功能等等,它每天都會有一堆有趣的帖子供人們閱讀。這最終會變成一個無盡滾動的資訊流,Instagram 和 TikTok 都以這種形式投放廣告。
廣告是一個很好的商業模式,當它提供的內容和使用者相關時,它就很棒。沒有一個人和我說過 Instagram 的廣告很差勁。重點在於相關性,如果你能把握個性化和相關性的訣竅,廣告體驗就很棒了。
Harry Stebbings:你認為你已經把握相關性的訣竅了嗎?
Aravind Srinivas:還沒有,我們希望可以。如果我們掌握了,我覺得我們的估值應該會更高。這是一個雞和蛋的問題。只有當你有很多使用者的時候,你才能得到密碼。所以廣告是一件有趣的事情,當你沒有足夠的使用者時,它就不可能很好地發揮作用。當你有很多使用者的時候,如果你能把所有細節都做好,就可以發揮得很好。
我最近幾個月和 Marc Andreessen 聊過,他告訴我廣告有三個層次。最高層次的是谷歌,中間是 Meta。谷歌從其他所有人的廣告中受益。因為最終,一旦你發現了一個品牌,你就會去谷歌搜尋點選他們的連結。
再往下才是像 Twitter、Reddit 和 Snap 這樣的公司。他說這兩者的差距太大了。這就像山的頂峰和在山腳下一樣,廣告目前已被 Google 和 Meta 等公司主導。
我的觀點是,如果我們能在旅程的早期就糾正谷歌犯下的根本性錯誤,不過度依賴單一的收入來源,而是透過訂閱、廣告、應用程式介面(API)、企業服務等多元化方式獲得足夠的收入,我認為我們就有機會建立一個能讓股東和使用者利益更加一致的東西。
Jeff Bezos 曾引用過這樣一句話:股東和使用者應該是利益逐漸趨向一致的。如果不是這樣,那就不是一個以客戶為中心的企業。谷歌在這方面犯了錯,因為他們無法實現使用者和股東之間的利益一致。華爾街喜歡谷歌投放更多的廣告,但使用者卻討厭這樣。
06
基礎模型商品化的最大受益者
將會是 AI 應用層公司
Harry Stebbings:你提到 OpenAI 的營收達到了 20 億美元,其中大部分是來自企業,他們的企業業務做得相當不錯。Perplexity 是什麼時候覺得應該建立自己的企業部門的?
Aravind Srinivas:我們決定建立這個部門的首要觀察是,企業如今最常用的工具是什麼?是谷歌。你在工作中每天都會用到它來進行搜尋。所有搜尋時使用的資料都是你公司內部的,但沒人會在意,因為你需要它、離不開它。你用你花費的時間和你的資料作為付費。
但在 AI 原生搜尋的世界裡情況就變了,人們總是擔心資料會洩露給 AI。如果資料洩露給傳統的搜尋引擎,他們不會在意,但如果搜尋引擎中融入了大量的 AI,他們就會感到擔憂。
所以我們說,好吧,如果你想在工作中使用 Perplexity 而你的僱主不允許,我們會為你解決這個問題。我們將提供一款帶有合規性、安全性和資料治理功能的企業專業版,實際上就是為你提供帶有所有這些安全功能的相同產品,這就是我們的企業專業版。
但這只是一個開始,你還需要更多功能。這些功能需要更加針對企業,而不僅僅是消費者。這就是我們將要構建的,我們希望以一種差異化的方式來構建它並重新思考內部搜尋的意義。
比如,我們不僅只是在企業工具(如 Slack 或 Notion)裡整合,還可以真正思考一些更深層次的問題,比如排序問題是什麼?為什麼相比消費者,企業在這方面會更有困難?
如果我們能建立一個統一的介面,讓所有專有資料、外部資料、內部資料,以及所有不同的模型、開源和閉源都集中在一個平臺上,你可以把你的輸出轉換成易於閱讀的頁面,將其組織成知識庫,自己進行索引,這會是一個很好的企業產品。我認為我們會朝這個方向努力,並不是說我們一定會成功,但我們會去嘗試。
Harry Stebbings:這令人非常敬佩。你對於開發企業產品感到緊張嗎,當你考慮到這些 GTM(Go-to-Market)的策略時,這個動作非常不同。企業是一隻難以捉摸的巨大野獸,這是一個挑戰,你也提到了 OpenAI 銷售團隊的規模。你怎麼看待企業部門 GTM 策略構建工作?人們會購買 Perplexity 企業版還是 OpenAI 企業版,或者兩者都購買?
Aravind Srinivas:我的感覺是,如今 AI 還處於非常早期的階段,沒有人對任何特定的 AI 企業產生鎖定和忠誠,它們甚至都沒有鎖定效應。比如,讓你的資料只在一個工具上執行。我甚至還沒有談到像從 Snowflake 遷移到 Databricks 為什麼會很難這樣的問題。因為 SQL 格式本身就有很大的不同。一旦你用一種格式編寫了所有的 SQL 查詢,就很難改變。在 AI 領域不是這樣的。你為 ChatGPT 編寫的自定義提示可以很容易地轉移到 Perplexity 上。
我認為企業仍然願意嘗試和實驗不同的工具。也就是說,如果沒有差異化,一開始品牌更大、團隊更大的企業會有優勢。
但遊戲結束了嗎?不,遊戲剛剛開始。我認為這完全是包裝的事情,如果你產品的價值大部分是模型的價值,價值只存在於模型中,而你圍繞它構建的所有東西都不專精,那你將會輸掉這場遊戲。
但是如果你在模型周圍構建了足夠的價值,以至於很難在沒有協調一堆其他難以實現的工程輸入(不僅僅是基於大語言模型,甚至涉及很多人為因素)的情況下做到這一點。我們很難想象一個沒有價值的世界,人們不會想要這樣的世界。這就是特定的搜尋價值。
為什麼谷歌 AI 的概述很糟糕?他們擁有世界上最偉大的索引,也擁有世界上最好的模型,但這還不夠好。或者,為什麼很多人仍然認為 ChatGPT 的瀏覽功能不如 Perplexity,儘管他們在過去一年裡進行了如此多的更新?
Harry Stebbings:為什麼 Perplexity 的瀏覽功能比 ChatGPT 更好?
Aravind Srinivas:我認為這是很多小細節的問題。我非常相信那些能夠協調模型和資料來源、構建出色的使用者體驗並一直在這裡不斷創新的人,將在這場包裝的戰爭中生存下來。這會很困難,你創立了一個企業,但每個人都一直擔心你會倒閉。
但是,隨著你積累使用者,隨著你摸清業務,我覺得基礎模型商品化的最大受益者是應用層的公司。
Harry Stebbings:為什麼這麼說?
Aravind Srinivas:如果模型被商品化,那麼模型的價格就會下降。而那些直接使用這些模型接觸使用者、利用這些模型的公司,只要將其包裝成偉大的產品體驗,創造實用價值,直接與客戶建立關係,他們會有更大的優勢。因為他們能夠讓一種商品以高價出售。
這是一項偉大的業務。如果模型被商品化,我會很高興。如果模型沒有被商品化,我仍然想找出一種從中受益的方法,這就是為什麼這是一家面臨重重困難卻偉大的公司。
這不是那種你只需要從 Twitter 或 Meta 聘請一位高階產品副總裁,讓他們為你制定產品策略的事情。這並不容易。他們沒有心智上的判斷,比如當下一個 AI 模型變得更好時會發生什麼,如何重新思考整個產品策略。同樣,也不是那種你聘請一位出色的 AI 人才,讓他們來構建產品的事情,因為他們總是會認為模型是最重要的,並一直試圖透過模型來做所有的事情。
你需要的是設計、產品和 AI 以及搜尋的完美結合。這種組合並不容易。這就是為什麼我們能夠做一些其他人無法做到的事情。
07
Perplexity 未來的主導盈利引擎會是廣告
Harry Stebbings:你在融資過程中有感到意外嗎?
Aravind Srinivas:融資過程很殘酷。我想大多數人可能以為,只要你是 AI 領域的,人們就願意給你寫投資意向書,甚至不需要做任何盡職調查。
實際上相當困難,每個人都會問你在推特上看到的那些尖銳問題,比如「如果 OpenAI 這麼做會怎樣?」「如果谷歌這麼做會怎樣?」「他們為什麼不停止給你模型?」「你打算如何建立自己的模型?」「你打算如何建立一個真正好的搜尋索引?」「你打算如何在企業銷售領域競爭?」
這些都是每個人都會問的問題,而你對未來還沒有一個清晰的判斷。你必須給他們有力的論據,但歸根結底,這些都只是論據,並不是實際的東西。
對我們有利的一個因素是,我們有很好的執行狀況。我們創立的時間還不到兩年,但相比我們的團隊規模和資金,我們已經產出了很多東西。
Harry Stebbings:在你們所籌集的資金中,有多少用於算力?
Aravind Srinivas:大部分。
Harry Stebbings:像 50%?還是 75%?
Aravind Srinivas:我想說兩件事。首先,我們並沒有花很多錢。不是說我們所籌集的大部分資金都用於算力了,而是在我們花的那部分錢中,大部分都用在了算力上。無論是我們購買 GPU 和服務模型或後期訓練模型,還是我們為像 Anthropic 或 OpenAI 這樣的 API 付費,這都沒問題。
這就是為什麼我們不訓練自己的基礎模型。因為如果我們也這麼做,錢早就用完了。因為它的工作原理是,你必須提前三年支付費用才能得到一個大型計算叢集。並不是一下花掉所有的錢,但你必須承諾三年,才能得到成千上萬的 GPU,如果你想在這個遊戲中競爭的話。
另一方面,我們從模型的商品化中受益,我們不做自己的基礎模型,因此我們所有剩下的錢都用來獲取使用者,而且獲取使用者不僅僅是透過營銷,實際上更多的是像亞馬遜 Prime 那樣的方式,以驚人的價格提供很多很棒的功能,透過卓越的產品執行來留住你,最終建立足夠大的使用者基礎和品牌忠誠度。
這就是我們要追求的商業模式。在這樣的世界裡,廣告的力量可以非常強大。
Harry Stebbings:每個企業都有一個核心盈利引擎。他們可能有輔助業務,但往往有一個是主導的。當你展望未來五年,你認為 Perplexity 的主導盈利引擎是什麼?是消費者訂閱嗎?是廣告嗎?還是企業服務?
Aravind Srinivas:我預測會是廣告。如果我們能破解廣告的密碼,那就是廣告。如果我們沒有破解它,如果我們的使用者沒有增長到那個水平,或者如果我們增長了卻沒有想出如何很好地做廣告,那就會是另外兩個。不管怎樣,我們都可以盈利。我認為透過廣告,我們可以做到很不錯的盈利。
然後你可能會問我,嘿 Aravind,你為什麼關心利潤?Sam Altman 並不關心。但他並不關心,是因為他對產品作為一門生意不感興趣,他在嘗試建立 AGI。他已經在一次公開採訪中說過,即使我們在 AGI 上花費 500 億美元,也沒關係。所以那是一家不同的公司。這就是為什麼我們根本不應該被視為 OpenAI 的競爭對手,我們不是 AGI 實驗室。
你可以說 Perplexity 和 ChatGPT 是相似空間中的產品,在互相爭奪一些心智份額和使用者。但即使這樣,兩年後也會非常清楚,你不會一直問,Perplexity 和 ChatGPT 有什麼不同?今天你會這麼問,但兩年後,我認為不會了。如果到那時還是這樣,那我們中的一個就只是在模仿另一個。
Harry Stebbings:你認為你從未被問過但最好的問題是什麼?
Aravind Srinivas:我認為有人問我,你為什麼在做現在做的事?這是一個你自己都不知道的問題。我認為很多人都會給出一些編造的答案,比如,哦,我經歷了一次存在主義危機,我要拯救人類,我見過一些企業家這麼回答。
對我來說現實是,你仰望一些人,你想成為他們,然後你試圖根據你的榜樣來塑造你的職業生涯。但最後你會發現自己真的喜歡一些事情,把它塑造成你想要的風格。至少對我來說是這樣的。
我一直是 Larry Page 的粉絲,我一直想做一些有那種雄心壯志規模的事情。不過這並不是我們做搜尋引擎的原因。我們完全是從別的東西開始的。這個問題我實際上沒有明確的答案,但我真的很喜歡這個問題,因為這是一個值得你不斷問自己的問題。
就像「你為什麼在做這個?」喬布斯就有這樣的想法,對吧?如果你把死亡內化,把死亡正常化,每天早上站在鏡子前問自己,「如果今天是我最後一天,我還會這麼做嗎?」如果這個問題的答案是肯定的,那麼今天就全力以赴。
如果這個問題的答案經常是否定的,你真的需要重新思考你的生活優先順序。對我來說,在 Perplexity,每天都是 Yes。儘管很痛苦,壓力很大,對我的身心都造成了影響,但我認為這是值得的。
Harry Stebbings:你看起來還非常年輕,所以別擔心,它並沒有讓你變老,一切都很好。
Aravind Srinivas:謝謝。我很機智地掩藏了我的白髮。
08
快問快答
Harry Stebbings:在過去 12 個月裡,你對什麼問題的看法改變最大?
Aravind Srinivas:對人的長期看法。我看到一些人沒有高效迅速地改變,但給他們足夠的時間,他們就能夠真正地改變自己。這是我一開始沒有正確態度的事情,我總是認為那些立即行動起來的人是最好的,但你知道不同的人有不同的方式來展示他們的真正才能。
Harry Stebbings:你認為在今天的 AI 領域,最大的誤解是什麼?
Aravind Srinivas:短期思維。任何時候有人釋出更新,所有人都覺得另一家公司完了,通常是推特上的那群人。即使是訊息靈通的人之間也存在最大的誤解,那就是因為世界上大多數人都沒有使用聊天機器人,他們就覺得這只是泡沫。但他們會驚訝地發現這不是泡沫,它沒有被過度宣傳,實際上它被低估了。
當你把它用在熟悉的工作流程和形式中,會產生很大的影響。聊天 UI 是一種新的 UI。我們還不習慣使用它。我們都習慣使用 WhatsApp 和 Signal 等等,但那不一樣,那更像是一種簡訊服務。另一方面,Word、Docs、Gmail、谷歌搜尋,甚至不是特指這些產品,而是更多關於使用形式、UI,你非常熟悉它們。當 AI 以一種讓你覺得如此自然而然的工作流程呈現給你時,它將產生巨大的影響。這件事還沒有真正發生。
Harry Stebbings:你們看過 WhatsApp 的整合功能嗎?
Aravind Srinivas:我看過,這種做法不太對。
Harry Stebbings:為什麼?
Aravind Srinivas:我用 WhatsApp 不是為了搜尋什麼東西,而是為了給人發信息或者回復……我的 WhatsApp 通知大多時候都有 20 到 30 條,等我把它們處理完,我只想離開這個應用。我不會點選 WhatsApp 圖示去搜索什麼東西。
Instagram 也是一樣。我只是去那裡看漂亮的圖片,而不是去搜索比如誰贏得了 NBA 總冠軍。開啟應用時使用者的意圖很重要。這也是為什麼他們多次嘗試推出「動態」和「快拍」都失敗的原因。最初,「動態」是作為一個單獨的應用來模仿 Snapchat 的。但沒起作用,然後他們又嘗試了很多不同的變體。最終起作用的是頂部的氣泡。這之所以有效,是因為它是基於現有的使用者的流程,因為使用者本來就要開啟 Instagram 檢視其他人的動態。
你必須認真考慮,不僅要考慮為什麼要新增這個功能,還要考慮在你的應用中,使用者現有的意圖是什麼?你如何確保新新增的功能與現有的意圖相結合?這一點非常重要。
Harry Stebbings:你對未來瀏覽器的願景是什麼?
Aravind Srinivas:你可以重新構想瀏覽器。我們一直沒有做瀏覽器是有原因的。我不認為瀏覽器會因為使用者得到答案而不是連結而被顛覆。人們仍然想瀏覽並進入一個新的網站,進入特定的網站,輸入細節,填寫表格等等。這些都不會因為傳統的聊天介面而被顛覆。僅僅因為你可以在 Perplexity 的搜尋框中輸入內容,比如說整合已經完成了,我不認為你就能讓瀏覽器變得更好或者怎麼樣。它會更高效,但你仍然需要很多傳統瀏覽器的功能。
不過,會發生變化的是,你開啟一個瀏覽器,只需要說,開始播放 Aravind 的播客,它就會去 Riverside,自動填寫你的登入資訊,那會很神奇,那將改變一切。或者像在亞馬遜上,給我買這個東西。
然後你可以更進一步,比如問,作業系統的未來是什麼?Mac 的未來是什麼?Windows 的未來是什麼?瀏覽器也是一個作業系統,對吧?
Harry Stebbings:你認為作業系統的未來是什麼?
Aravind Srinivas:像《Her》這樣的電影可以成真。我不是在說語音,而是作業系統本身可以就是 AI,一個完全原生的 AI 作業系統,它不是以傳統的方式組織的,你只需要和它交談,它就會為你工作。這是一個很驚人的願景。而這正是現在還沒有實現的東西。GPT-4 還做不到。
Harry Stebbings:你認為你目前工作中最困難的,但大家都不知道的部分是什麼?
Aravind Srinivas:一直在處理矛盾。大腦並不擅長處理矛盾,它實際上會讓我們感到疲憊。當我們無法在某件事上達成共識,而初創公司的 CEO 們卻都是面臨很多矛盾的。你應該冒險還是應該重注堅持你已有的東西?你應該加快速度還是應該以一種可以擴充套件的方式來建立公司?是時候嘗試這個功能了嗎?僅僅因為它不是你的競爭對手會做的事情,還是繼續做你擅長的事情,儘管你的競爭對手也在做同樣的事情?你必須不斷地在這些不同的維度上處理這些矛盾,這很累。
Harry Stebbings:倒數第二個問題。你知道,我們作為投資者會提前分析一家公司可能失敗的原因。如果今天你要為 Perplexity 寫下可能會失敗的原因,你認為會是什麼?是計算能力的問題,還是谷歌的創新將你擊敗?
Aravind Srinivas:執行力不夠。競爭對手並不會打敗初創公司,初創公司都是自己打敗自己的。並不是說 Google Drive 打敗了 Dropbox。人們會這樣說,但 Dropbox 本來可以建立一個偉大的企業業務,但他們與其他公司相比行動並不夠快。初創公司都是自己打敗自己的。
所以,如果我們要寫一個關於自己的失敗原因,那就是 CEO 不夠果斷,公司的執行力不好,缺乏重點,資本使用效率低下。這很大程度上取決於所做的決策、決策的正確性、決策的速度以及執行的速度,還有我們是否專注。如果不能持續做到這些事情,那麼我想我們就會失敗。
Harry Stebbings:最後一個問題。現在是 2034 年。你最希望 Perplexity 是什麼樣?如果我們那時再做一期節目,公司那時會是什麼樣子?
Aravind Srinivas:這是一個好問題。我只希望它能成為你離不開的事實和知識助手。你可以問我,10 年後,人們還想要事實嗎?我們總是要問這樣一個問題,10 年後什麼還會是真的?如果你致力於這個,那麼你就是在做正確的事情。
我覺得,即使在一個 AI 佔據主導,人類自主性減少的世界裡,人們仍然想知道什麼是真的,什麼不是真的。我們正在致力於這件事。如果我們能成為事實、準確資訊以及知識的首選助手,那麼我認為 10 年後我們會做得很好。
Harry Stebbings:Aravind,我很喜歡這場對話,感謝你的時間。
Aravind Srinivas:謝謝你,Harry 。這很棒。

編譯|Stone
編輯|Wendi
推薦閱讀

