


編譯:Lavida
編輯:Siqi
排版:Scout

以下為本文目錄,建議結合要點進行針對性閱讀。
👇
01 AI 創業公司要先做產品,後做模型
02 AI 套殼產品的護城河是什麼?
03 問答引擎和 Agent 是 AI 時代的搜尋
04 Perplexity的使用者增長策略
01.
AI 創業公司要先做產品,後做模型
Jacob Ephron:Perplexity 的產品很好上手、操作簡單,但也因此容易讓人們忽視背後的複雜性。為了提供這樣的使用者體驗,你們主要做了哪些工作?
Aravind Srinivas:我們主要專注五個關鍵維度:準確性、可靠性、響應速度、使用者體驗的愉悅度,以及不斷更新最佳化。這些最佳化既服務於所有使用者,也針對個人使用者進行個性化調整。要讓產品在市場上處於領先地位,這五個方面都必須做到極致。一般來說,100 家創業公司中可能只有一家能夠在某一方面做到極致,也就是說,同時在這五個方面都做到極致的機率是百分之一的五次方。這極具挑戰性,但我們必須以此為目標,因為這是創造下一個數十億甚至百億級企業的必經之路。
在使用者搜尋查詢時,我們的任務是深入理解並最佳化使用者的問題。我們會篩選出最合適的網頁,甚至針對性挑出具體段落來提供答案,還要考慮應該如何展示答案——是一個摘要或段落,還是一連串的關鍵結論,以及怎麼給每個句子配上恰當的引用,要如何儘量避免引用錯誤,確保答案中沒有出現 hallucination 等問題。
有時光文字是不夠的,還需要新增圖片或影片,而影片的資訊量非常大。但無論什麼形式,關鍵是確保答案准確無誤,方便分享,這就是我們的創新。很多使用者查詢後的答案價值特別高,對其他人也很有參考價值,所以我們做了 Permalink,後來 Bing、ChatGPT 和 Bard 也開始效仿我們。
使用者提問後,我們還會推薦一些 follow-up question,因為使用者很可能並不知道怎麼提出一個好問題,這是人類天生的侷限性,雖然每個人都有很強的好奇心,但能將好奇心轉化為精確問題的人卻很少。

大多數問題都可以透過簡單的網際網路搜尋得到答案,真正需要深思的問題卻不多,正因如此我們推出了 Copilot。我們意識到很關鍵的一點是,為什麼要怪使用者不能提出好問題呢?以前我媽媽會偶爾和我抱怨我們產品上的問題,我就會想是她提問方式有問題,但後來 Larry Page 改變了我的看法。
Larry 分享過一個故事,他們曾經差點把 Google 賣給 Excite,當時他和 Sergey 一起給 Excite CEO 做演示,打開了兩個瀏覽器視窗,一個是 Google,另一個是 Excite,然後他在兩個搜尋引擎中輸入了同樣的文字,Google 成功地返回了相關連結,而 Excite 沒有。Excite 的人看了之後說是因為你的輸入不準確。而 Larry 的回答是,我只是個使用者,我沒有犯錯。這個故事體現了人機互動的一個基本原則:使用者永遠不犯錯。
Excite 是 1990 年代中期最受歡迎的網站之一,主要提供網路搜尋、新聞、電子郵件、即時通訊和天氣等服務。Larry Page 和 Sergey Brin 作為 Google 的聯創曾經嘗試向 Excite 的 CEO 出售 Google。這件事是網際網路早期歷史上的一個有趣的軼事,因為 Excite 最終沒有收購 Google,而 Google 後來成為了全球最大、最成功的搜尋引擎之一。
Patrick Chase:你提到 Perplexity 專注的 5 大核心領域,從工程視角出發,要如何平衡在這些不同領域的資源配置?
Aravind Srinivas:我認為最成功的公司都應該做好縱向整合。如果我們的設計師、產品工程師和後端開發人員之間完全不溝通,是做不出優秀的產品的。舉個例子,如果設計做得好,我們可以透過使用者互動獲取更多資料,進一步提升產品的質量。所以我們的方法就是讓不同部門之間保持溝通順暢,比如定期組織全體會議交流,這些會議不一定要達成共識,因為大家立場不同,因此會議上的討論也很激烈,但這能讓每個人都充分理解其他團隊的重要性。
產品的價值和公司的價值應該是相輔相成的,我們公司的核心價值觀是高質、準確和迅速,這三點精準代表了我們產品的追求。
Jacob Ephron:Perplexity 最開始是基於 OpenAI 的模型來做的,後來你們對一些規模更小、推理更快的模型上做了 Fine-tune,再到後來你們又開始使用開源模型和自研模型。現在有很多創業團隊都在想自有模型這件事,你們是如何做出這些決策的?
Aravind Srinivas:如果有機會重來,我還是會做同樣的選擇。我認為一開始應該堅決用外部模型,如果你的目標是打造以產品為核心的公司,就不要在訓練自有模型上浪費時間。
當然具備模型相關的能力也很重要。我們團隊比較幸運的一點是我和 CTO 都是 AI researcher 背景,我們在創業之前就已經在模型訓練上花了 5 年左右的時間,因此我們相當瞭解訓模型需要哪些資源和條件。但如果創業者並不是 AI researcher 背景也沒問題,總體上我們的建議是,要專注產品,越早推出自己的產品越好,然後去使用者增長、做好留存,這是首先要解決的問題,也是很重要的一步,一旦做好這件事,可能接下來一半的問題都會迎刃而解,如果把產品和使用者增長做好對於融資和招人也很有幫助。
創業過程中,比融資更難的是找到頂尖人才。市面上不缺資本,只是估值高低的問題。人才對未來的影響更為深遠,找到頂尖的工程師比得到投資人支援要難得多。但是如果你的產品還沒有一個使用者,為什麼擁有很強判斷和決策能力的工程師要加入你?

Perplexity AI 由 CEO Aravind Srinivas(左)、CTO Denis Yarats(中)、CSO Johnny Ho(右)和 Andy Konwinski 於 2022 年 8 月共同創立
現在市場上有能力訓大模型的頭部 AI researcher 甚至比 GPU 還要稀缺,也許我們還能找到方法和渠道獲得 H200,但要找一個知道如何訓 GPT-4 的 AI 專家要比這件事更難。即便我們有能力付出更高的薪資,這些人也不一定放棄現有團隊選擇加入我們。所以我們需要考慮的是,我們創業的初衷是什麼?既然我們的目標是推出一款產品,並圍繞這款產品建立了自己的商業模式,接下來就專注於這個目標去做,這也是作為創始人的本職工作。
但為什麼我們發展到今天又決定訓自己的模型?原因很簡單:在競爭對手也在做相似的東西,而我們的產品還沒明顯差異化時,我們希望減少對外部的依賴,自有模型也能儘量降低成本。
訓自有模型不是團隊的盲目決策,我們一直等到 Llama2 的釋出才決定做,就好像 Bezos 曾經說過的“You need to position yourself and wait for the wave”,顯然開源會是這道浪,就像之前大家基於 GPT-3.5 做了很多創新一樣,更大的浪潮即將到來。
同理,Nvidia 的 Tensor RT 庫將極大提高每個產品的推理速度,這也是一波新趨勢,我們必須做好充足準備迎接。而我的工作就是和公司管理層充分交流,確保他們決策科學,並提供他們所需的資訊和建議。
NVIDIA TensorRT 是一個針對 NVIDIA GPU 設計的深度學習推理庫,用於提高模型的推理速度和效率,且能透過量化、層融合和專門的核心最佳化來減少能耗。TensorRT 支援主流深度學習框架,如 TensorFlow 和 PyTorch,使得訓練好的模型可以轉換成 TensorRT 格式,並在 NVIDIA GPU 上高效執行。
Jacob Ephron:你覺得未來開源模型的普及程度會有多高?大多數 App 都會建立在最先進的 LLM 上,還是大多數人會像你們一樣進行轉換?
Aravind Srinivas:我的感覺是,今天用 GPT-4 能做到的任何事情,將來都可以不用 GPT-4 做到,並且價格更便宜,延遲更低,一切都會更加最佳化。我們現在所做的包括 Copilot 在內沒有 GPT-4 是不可能完成的,我們正在試圖擺脫這種依賴,但總會有下一個 “Perplexity Copilot”出現,比如生成式使用者介面、dynamic prompt engineering,這些以前都是不可想象的。未來也會有新的應用可能出現,能實現上傳影像提問這種功能。
現在大家已經用 AI 工具來做作業了,只需使用 CamScanner 應用一樣掃描作業並上傳到 ChatGPT 就能得到答案,沒有 GPT-4 也完全不可能。當下一個模型出現時,AI 也許能幫你完成任務,比如進行多推理鏈條、多模態推理,或者你可以上傳影片,要求它準確地從中獲取某些資訊,這些在我看來都是隻有下一代模型才能做到的事情。
02.
AI 套殼產品的護城河是什麼?
Patrick Chase:你如何看 AI 套殼產品的護城河?
Aravind Srinivas:我的觀點是,只有當你真正有了值得“護”的東西時,護城河才有意義。人們可以將 Perplexity 看做是一個 AI 套殼,但成為一個擁有十萬使用者的套殼產品顯然比擁有自有模型卻沒有使用者更有意義。市場上有很多人都開發了自己的模型,但實際應用中幾乎所有人都部署了 Llama 2 或 Mistral 這些主流開源模型,在閉源和開源領域都有 power law:OpenAI 和 Anthropic 是閉源模型的頭部,開源這邊是 Llama 2 和 Mistral。我們有四個 OpenAI 模型加三個 Anthropic 模型,對我來說,管理這幾家公司的模型已經壓力很大,是極限了。
Patrick Chase:未來你們會完全轉向開源,還是繼續維持多種模型並用的狀態?
Aravind Srinivas:模型的發展是動態變化的,我們要對各種模型都保持開放心態,但要快速、積極地對於模型領域的變化做出相應選擇。如果我們有人做出更高質量的模型,我們仍舊願意使用這個模型,因為使用者只在意自己的搜尋體驗,而不是我們用了哪個模型、我們的商業模式是什麼、我們怎麼盈利。
這一點也是來自 Bezos 的啟發,他在之前一次訪談中被不斷問到,為什麼有 iPad 的情況下還有繼續在 Kindel 上做投入?為什麼要在燒錢更多的 1-2 日送達服務上投入,尤其是 Amazon 還沒盈利的情況下?Bezos 當時的回答很簡單,客戶並不會在意這些。
Jacob Ephron:Perplexity 正嘗試探索深度知識服務場景,隨著 LLM 和 Perplexity 的發展,你認為 Quora 和 Wikipedia 這類產品的未來會是什麼樣的?在你看來,Perplexity 的重點是知識服務還是搜尋?
Aravind Srinivas:我覺得 Quora 和 Wikipedia 都是為了最大化利用網際網路上的知識,但我們不僅想要最大化 IQ,還要最大化 IQ 的傳播速度。他們致力於增加知識的量,而我們致力於增加知識量隨時間的變化速度,讓這個過程加速。
人們在 Wikipedia 上看到的內容是很不個性化的,比如我檢視“黑洞”的 Wiki 頁面時是想詳細瞭解黑洞是什麼,但在看某個名人的主頁時只是想簡單看下,而另外一個人和我的需求大機率又是不同的,目前還沒有什麼產品可以實現高效、個性化的知識獲取需求。在 Quora 上,人們需要花一定時間等待別人來回答自己的提問,不僅很慢,也無法最大化加速知識的獲取,Perplexity 就是想要解決這樣的問題。
Perplexity 的初衷是滿足人們無窮的好奇心,現在是從小的細分市場出發,未來還要不斷拓寬自己的版圖。我一度很迷茫是不是應該專注做垂直搜尋引擎,而不是繼續擴充套件業務,直到 Marc Andresson 給我建議“無論如何都不要單純做搜尋。”雖然所有 VC 都會讓你做垂類搜尋引擎,但事實上其中大多數都很難成功。90 年代末和 21 世紀有過類似的時期,所有人都在說要做垂直領域的 Google ,結果大多數公司都失敗了,反而是在垂直領域建立端到端使用者體驗的公司成功了,比如 booking.com,不僅能搜尋酒店,還能直接完成預訂。
如果要獲得更長遠的發展,只做搜尋是不夠的,還需要向前一步,成為這個領域中服務更加全面的公司,比如 Airbnb 已經不只是一個住宿預定平臺,而是一個提供綜合旅行服務的公司了。只要做得足夠深,我們的競爭優勢就不只是在技術、使用者積累這樣的單點上。
03.
問答引擎和 Agent 是 AI 時代的搜尋
Patrick Chase:你怎麼看過去十多年來很多人想挑戰 Google,但幾乎沒有人能做到這件事?未來 Google 的地位會發生什麼樣的變化?
Aravind Srinivas:必須承認我們的成功很大程度上得益於時機的選擇。包括 Neeva 在內的很多由前 Google 員工創立的公司總是想照搬 Google 的運營模式,比如做個高效爬蟲系統或者相似的 GTM 策略,這是絕對錯誤的。Google 已經在這個領域做了 20 年,他們更好、更快,創業公司根本無法競爭。

Neeva:由前 Google 高階工程副總裁 Sridhar Ramaswamy 和合夥人 Vivek Raghunathan 創立的一家搜尋引擎公司,於去年被 Snowflake 收購。
還有人以無廣告、重視隱私保護為賣點,這些現在看來都已經是過去式了。DuckDuckGo、Brave 已經佔領重視隱私的搜尋市場,Go-to-Market 也非常成功,這兩家公司最正確的決策就是特別專注做市場和品牌建設,而非單純研發技術。這再次說明必須儘快打入市場,理解使用者為何選擇你。
所以說,策略和巧妙的市場定位非常重要。對這兩家公司來說,隱私保護和加密貨幣是他們的賣點。而其他試圖挑戰 Google 的公司都更多地關注技術,但這是不夠的,特別是當你的技術與 Google 完全相同時。而且反 Google 的營銷手段,比如強調隱私保護,也已經有人做過。雖然並不是每個人都關心隱私,但至少那些在意的人已經投向了其他兩個專案。這就是為什麼此前的嘗試都未能成功。
對我們來說,AI 技術的飛躍是一個轉折點。OpenAI 的模型效果相當驚豔,每個人都能透過 API 呼叫模型能力,在大模型領域 Google 失去了自己的領先地位,2 年前沒有人能想象這件事,Perplexity 也利用到了這個難得的機遇。
Patrick Chase:你認為搜尋在接下來 10 年會變成什麼樣?
Aravind Srinivas:會變成問答引擎,或者說幫你完成各項任務的 agent,就像你平時跟朋友聊天那樣自然。比如你會問朋友“你聽說過那個事嗎,快給我說說”,這時 agent 的回答要足夠簡單明瞭。這也是我們至今還沒有推廣語音互動的原因,因為回答真的太囉嗦了,我們看答案總是比聽答案要快。
Jacob Ephron:除了做 To C 應用外,未來你對產品其他方面有什麼設想?Perplexity 的長期規劃是什麼樣的?
Aravind Srinivas:很多使用者還沒有使用 Perplexity 是因為擔心我們只是個套殼應用,沒有自己的 infra,最終可能會在燒完錢之後退出市場,所以我們想要先解決這部分擔心。
我們正努力做到獨立提供全方位服務。首先至少要有能與 GPT-3.5 turbo 效能匹敵的模型來處理使用者需求,確保上線時使用者感受不到產品表現有任何不同。就像 Paul Graham 說的,“唯一能存活下來的 AI 公司是那些即便推出自有模型,使用者也察覺不到區別的公司。即便有所察覺,也必定是體驗上的提升”。
雖然 Perplexity 能夠給出簡單明瞭的答案,但和 GPT-4 相比還是差很多,因為 GPT-4 真的太強了,即使是 Google 這種資金比我們多上千倍的公司也做不出 GPT-4 級別的模型,我們現在更多希望其他公司能夠推出比如 Llama-3 或 Mistral2 這樣強大的基礎大模型,在這些模型基礎上,我們就可以利用自身的資料優勢實現更接近 GPT-4 的水平,這是我們主要的目標方向。
效能提升也將是我們的一大亮點。我們最擅長的是處理、分析和重組使用者查詢的問題,就像在 Copilot 中的互動一樣,不斷提高總結、答案和搜尋索引的質量。過去一年中我們積累了大量流量和專業知識,所以我有自信這點目前只有我們能做到。
我們還需要提供自己的模型,即便是用外部 GPU 來做 fine-tune 和部署,比如 Fireworks、Anyscale、Replicate 或者 Hugging Face,最終還是要支付給第三方服務,利潤率還是不夠高,這樣就又回到了套殼的角色。
Jacob Ephron:Perplexity 在利用 RAG 技術解決 hallucination 問題這方面做得很好,你之前也提過會把這套技術方案開放出去,具體要怎麼實施?你如何看企業搜尋領域的挑戰?
Aravind Srinivas:這個問題很重要。很多人誤以為,既然我們在網頁搜尋中用 RAG 效果這麼好,那做公司內部的搜尋系統也不在話下,但實際上兩者截然不同。Google Drive 的搜尋那麼差是有原因的,它和谷歌搜尋的索引機制完全不一樣,需要訓練的 Embedding 模型也大不相同。不僅僅是 Embedding 模型,甚至連網頁的剪輯方式、文字檢索技術,以及基於傳統 TF-IDF 的彈性索引,這些倒排索引的構建方式都不同。這就需要有公司花時間做這一特定場景的產品,就像我們專注於網頁搜尋場景一樣。實現 RAG 任務還是很艱鉅的,除了 Gen AI 還需要大量其他方面的工作,不僅僅是訓練一個大型 Embedding 模型那麼簡單。
"TF-IDF-based"指的是基於“詞頻-逆文件頻率”(Term Frequency-Inverse Document Frequency, 簡稱 TF-IDF)的方法或系統,這一方法使用詞頻(TF)和逆文件頻率(IDF)的計算方法來評估詞語在文件集中的重要性。這種方法常用於搜尋引擎和文字分析中,以幫助確定詞語對於文件的相關性。簡而言之,TF-IDF 幫助區分詞語對於文件的貢獻,給出權重高的詞更多的關注。
OpenAI 釋出 embedding API 時,Sam Altman 經常說下個萬億美元公司可能會透過接入這個 API 誕生,但其實這只是個很好的營銷手段,所以我每次聽到別人說已經解決了 RAG 問題時,也會很謹慎,因為他們可能只是某個特定 use case 上做得很好,但不意味著可以輕易推廣到其他所有場景。在處理結果排序時,還有許多其他因素共同決定了答案的質量。即使是 LLM 最終決定使用哪些連結來構成答案,並不意味著你可以隨意向模型提供低質量輸入,然後期待它能變魔法似的從中提煉出最相關的連結,還標好了所有的引用。
其實你向這些能處理大量上下文資訊的模型提供的資訊越多,出現 hallucination 的可能性就越大。因此,必須在 retrieval component 上做更多工作,不僅僅是嵌入模型的訓練,還包括索引和排序機制。排序機制也應該考慮到除了向量點積以外的多種訊號,而這些訊號的具體內容極大依賴於具體的 use case。
04.
Perplexity的使用者增長策略
Jacob Ephron:從 Twitter 上的討論來看,很多人都很喜歡你們的產品,也有很深入的瞭解,接下來你們要如何實現下一個百萬使用者增長?
Aravind Srinivas:對我們來說,目前的關鍵問題是找到使用者增長點和滿足現有核心使用者之間的平衡。Perplexity 目前確實有一群忠實使用者,他們在 Twitter 等社交平臺上對我們給出了很高的評價,他們對產品的理解也很深刻。為了實現下一個百萬使用者的增長目標,我們會持續關注產品是不是好用,確保新使用者能夠直觀地理解和使用產品。同時,我們也在探索將新使用者轉化為長期使用者的重要因素,比如最佳化使用者體驗和提供使用者引導等。
對於團隊來說最大的挑戰在於找到產品的改進方向,或者說該不該對使用者提出的各種需求都要做出響應。因為重視使用者需求並實現這些需求在我們找 PMF 的時候是很有效的策略,但一旦我們的使用者到了數百萬的量級,一定會出現一批有強烈需求的“權力使用者”,對於這些使用者,如果團隊不能滿足他們需求上線他們想要的功能,他們可能就不再使用 Perplexity,甚至會在公開場合抨擊我們不重視使用者需求,對產品帶來負面影響。另一方面,我們對產品發展是有很清晰規劃的,所以我們很重視使用者需求的同時,最終還是會圍繞一個具體的理念和目標來規劃產品。
我們一直在努力尋找一個能讓廣大使用者滿意的平衡點。尋找使用者需求、平衡使用者需求是一個不斷變化的過程,但有一條我們已經非常明確:產品對新使用者越不直觀友好(比如首次訪問 landing page 時看到很多彈窗),我們吸引新使用者的能力就越弱。我們時常會面臨這樣的困境,現在我們的產品免費,無需登入就能使用,但我們還是希望使用者能註冊,更好地去用其他功能。但如果首頁上跳出各種註冊選項,使用者可能一煩就關掉了。但現在連 Google 也在用這種策略,在搜尋結果頁面不斷提醒使用者保持登入狀態。這種權衡是我們面臨的一大挑戰。
Patrick Chase:和大多數平臺一次性輸入 prompt 不同,Copilot 是透過連續對話來逐步構建搜尋 prompt,協助使用者定製搜尋需求,未來你覺得哪種模式會更受歡迎?
Aravind Srinivas:我們並不想讓使用者老打字,這樣互動體驗會很差。大家提問題是想獲得答案,不是不停回答 AI 的追問。當然這種互動對產品最佳化有益,但使用者會不耐煩,他們會覺得你直接給我答案就行了,為什麼老是回來問我新問題?


Perplexity Copilot 篩選出具體話題並進行問題拆解,在新聞中進行搜尋,最終總結出一篇新聞稿
未來我覺得只有透過不斷的迭代才能發現最合適的解決方案。我們想達到的理想狀態是:AI 能通過了解使用者喜好準確辨認何時需要進一步追問,何時直接給出答案。我也不喜歡設定太多選項,Copilot 應該只是 Perplexity 的一個額外功能,不需要使用者特意選擇。我們試過把 Copilot 模式設為一個可勾選的開關,系統會保留這個選擇,下次你再用就還是這個模式,但部分使用者反饋很不喜歡。
這兩種截然不同的偏好完全取決於使用者使用時的意圖。有些使用者用 Perplexity 是因為我們回答速度快,而 Copilot 卻降低了這個返回速度。另一部分人則更喜歡 Copilot,因為他們更想要經過充分研究、幾乎沒有 hallucination 的答案,為此他們願意等待。也就是說,我們其實面對的是兩種截然不同的使用者,這就又回到了一個問題,我們應該為誰做最佳化服務。
Jacob Ephron:Perplexity 裡我最喜歡的功能是 Discover,你們在這個功能上有哪些收穫?
Aravind Srinivas:Discover 中展示的內容是我們專門的編輯人員篩選出來的,我也會參與這項工作,在這個過程中我學到了 Mom's test 這個概念,軟體行業用這項測試來檢驗一個產品是否足夠簡單,連普通新使用者都能輕鬆理解。也因此我深入瞭解了 Facebook 早期的兩個增長策略:首先是不斷改進產品,讓現有使用者不斷推薦給更多朋友使用,其次是讓產品能讓從未接觸過的使用者也能輕鬆上手,這是產品持續增長的唯一途徑。

Facebook 最終選擇了針對新訪客進行最佳化,並找到一個關鍵指標來將他們轉換為常規使用者:使用者在 Facebook 上的現實生活好友數量,後來也證明這是判斷一個人是否會成為忠實使用者的最佳指標。回過頭來看,因為之前並沒有明確的方法論,Facebook 做這個決策其實還挺難的。總結來說,與其增加現有使用者所需的種種功能,不如始終確保能夠吸引新使用者。
Patrick Chase:你們之前做過不少東西,比如 Text-to-SQL 生成器,還有支援搜尋 Twitter 內容的 Bird SQL,那麼最終是如何決定做搜尋,並確定 Perplexity 這個概念的呢?
Aravind Srinivas:如果一年前我們說要挑戰 Google,肯定是沒有人願意投資我們的,因為投資人更喜歡安全邊際更高的專案,聽起來很完美,甚至沒有 PMF 也能獲得投資,因為這類專案即便不能最大化回報,但至少可以最小化風險。
我最初向領投人 Elad Gil 提出的想法是,既然想挑戰 Google,不如設計一款智慧眼鏡,能用內建麥克風聽取我們的問題,並透過 AirPods 回答。這個設想雖然好,但現實中還很難實現。Elad Gil 的建議是,如果真心想做搜尋,不妨專注於更細分的市場,例如資料庫搜尋,這塊市場目前還沒人做,一旦成功,B 端市場的潛力是很大的,因為許多企業都需要在自己的資料庫、電子表格、Salesforce、Hubspot 等內部系統中進行搜尋。
我們做了一個靠譜的產品,找了幾家公司談。他們的反饋是這個產品很酷,但用處不大,因為 Hubspot 就能看到所有資料,只需要一次性輸入完就會定期更新。然後我又問了我們的投資顧問兼 DataBricks 首席架構師 Reynolds Shin,他的看法差不多,因為 80%賺錢的 SQL 程式碼其實都不是新寫出來的,而是舊的程式碼反覆定期去跑。Snowflake 和 Databricks 能發展到今天的規模,並非依靠每天寫新的 SQL 查詢,而是因為他們的使用者依賴這些 SQL 作業來執行日常運營,比如自動化的資料提取、轉換與載入(ETL)。這些作業設定一次就能夠定期自動執行。
至於那些新寫出來的查詢程式碼,其中至少 80% 的查詢都並不需要用 SQL 了。現在像 Power BI、Tableau、Metabase 這種資料分析和視覺化工具越來越普及,很多資料相關的任務都不再需要用傳統的 SQL 編寫,特別是資料查詢和報表生成。這些工具提供了 GUI 和拖放功能,使用者能直觀地編輯資料、查詢和圖表,無需編寫任何 SQL 程式碼。
我後來看了大量的 Tableau 和 Power BI 教程影片,也親自上手用了這些軟體,發現微軟和 Salesforce 開發的這些工具使用起來簡直太簡單了,所以我開始思考,使用者為什麼還要放棄這些工具呢?如果使用者真的想要一個聊天介面的話,他們希望的應該是能嵌入到這些現有工具中。
在我們的各種早期嘗試中,有一個做的很對的就是爬取了 Twitter 的所有資料。當時我在想,如果能在 Twitter 的資料上做圖譜搜尋並且找到一種方式連線起來,結果應該會特別驚人。舉個例子,如果 Jacob 不關注我,但我想給他發私信,Twitter 的規則是不允許給不關注你的人傳送私信,那麼我就需要找到一個雙方都關注的人,讓他幫我傳話給 Jacob。再比如我想知道 Paul Graham 贊過哪些提到 AI 的推文,來了解哪些是高質量的 AI 相關推文,也可以透過這個產品搜尋到。
投資人非常喜歡這個功能,因為大家都一致認為使用者很喜歡搜尋與自己相關的資訊。Instagram 聯創 Mike Kriger 告訴我,人們通常最先搜尋的就是自己的使用者名稱。這反映了一個很有趣的現象,儘管在 Instagram 上使用者可以直接點選搜尋欄的個人資料圖示來檢視個人主頁,但大家依舊習慣性地去搜索自己的使用者名稱,這是一種人的本能。
正因如此,我們不僅開發了這個功能,還做了類似 SQL 編輯器這樣的企業級工具,以及一個能夠生成帶連結摘要的搜尋服務產品。之所以做後來這個產品,是因為我們相信如果 LLM 正變革著搜尋領域,那它肯定不應該只侷限於結構化資料,非結構化資料也同樣重要,這兩類資料企業都需要處理。因此,不管是面向普通消費者還是企業使用者,二者缺一不可。
到這個時候我們已經有三個產品選擇了。我們首先推出了基於摘要的搜尋功能(summarization-based search),我們在 Discord 上與朋友們測試時,大家都覺得這比 Google 好用。但我們開始開發這個工具完全是為了自用,起初只是內部的一個 Slackbot,幫我和我們聯創解答一些技術問題,甚至在我剛開始給員工辦理醫保時,我對免賠額、共付費這些專業術語一頭霧水,但我在 Google 上搜只會看到一堆保險廣告。
這個工具當時在我和朋友間起到很大作用。比如去年 Elon 接手 Twitter,或者扎克伯格因 Facebook 股價暴跌損失了數十億時,大家都想迅速瞭解事態的發展,但是找不到任何途徑。而我們的資訊彙總工具可以幫大家迅速總結,引用格式也很受歡迎。那時大家用的還是 Slack 和 Discord 上的 bot,甚至還不是那種 Web 介面,也沒有多好的網頁設計。後來我們找到了設計師,產品一上線,第一天就有數千次查詢,這讓我確信我們的方向是對的,我們要做搜尋,面向消費者,這是切實的需求。當你的工作能帶來巨大的成就感,吸引人才加入你的團隊就變得容易多了。

Perplexity 雛形 Web Search Slackbot
我們在接下來一週還推出了 Twitter 的搜尋功能,當時想的是像 Google 的圖片搜尋那樣單獨設定一個標籤頁會怎樣?事實證明我們想對了。Twitter 的搜尋功能非常難用,而我們的工具讓大家終於能對 twitter 的內容做搜尋了。至於為什麼 Twitter 自己沒弄出這樣的東西,因為這一切都發生在 Twitter 內部劇變的時期,所以可以說正是時候。


我們產品突然火起來的過程大概是這樣,開始 Kimbal Musk 對我們專案很感興趣,關注了我們的推,後來 Jack Dorsey 轉發我們的推文,稱讚了 Perplexity 的產品,網站訪問量一下激增到伺服器直接崩潰了。有大批人來搜尋他們的使用者名稱,但資料庫裡並沒有包含所有 Twitter 的使用者名稱,於是我們就拉取了他們最近的推文,提供了一個精練的個人概要。如果這些使用者在不同的社交平臺上使用相同的使用者名稱,我們還會拉取並彙總他們在各個網站上的社交媒體活動,提供一個全面的總結。
很多人對此很不安,他們會覺得 AI 怎麼會這麼瞭解我?然後就會截圖發推,其他人就會在底下問這是什麼產品,自己也想搜搜看。於是就像 ChatGPT 剛推出時候人們紛紛傳播 ChatGPT 的截圖一樣,我們也經歷了這種病毒式傳播。
接下來我們做的就是讓產品支援完整的端到端對話。首先,我們需要明確“對話式產品”的真正含義,一些產品可能只是簡單地在聊天介面加入搜尋,但往往會出現 hallucination,沒有可靠的資訊來源,整體的設計也很糟糕。我們當時考慮的是,一個以搜尋為功能的聊天介面究竟應該是什麼樣的,以及為什麼它需要是一個聊天介面。
Patrick Chase:Perplexity 裡有什麼你本來以為會做成,但最終效果卻並不好的東西嗎?
Aravind Srinivas:收藏功能(collection)沒我們預期中那麼受歡迎,雖然現在也有很多使用者在用,每天也有上千萬的回答被收藏,但在我們看來它還沒有成為下一代研究人員的協作工具。我們還需要讓新增收藏和在收藏夾裡移動 thread(使用者每次搜尋的對話被視作一個 thread)的動作更加自動化。
Jacob Ephron:你認為在現在的 AI 領域,有哪些東西被過度炒作,又有哪些是行業做的還不夠的?
Aravind Srinivas:過度炒作確實是整體趨勢,尤其是在垂直領域裡,我到現在還沒看到哪個 AI-native 產品真正顛覆了某個行業,同時大多數公司對使用者體驗最佳化的關注度都還不夠。
Patrick Chase:你怎麼看前段時間 OpenAI 的內部變動?這件事會對行業生態產生哪些長期影響?
Aravind Srinivas:很難回答。OpenAI 內部可能存在兩派觀點,一派更加激進,另一派則相對謹慎。但我們可以肯定的是,OpenAI DevDay 時候很多人認為的“不要做套殼,而是自己開發定製 GPT,在 GPT Store 裡發展”的觀點可能不復存在了。GPU 資源是有限的,要同時做出 App Store、一流的產品、高水平的 Infra 是很困難的事情。我認為未來他們可能會更集中關注某幾個特定領域。OpenAI 仍舊是全球最頂尖的研究機構,但未來會有很多人不會再因為 OpenAI 做了某件事而望而卻步了。



延伸閱讀
關鍵詞
模型
產品
技術
功能
問題