Perplexity 聯合創始人&首席戰略官 Johnny Ho 在不久前與 Lightspeed 合夥人 Michael Mignano 的一場對話中提到,Perplexity 的產品釋出秉持“完全準備好才推出”的原則,透過小而持續的功能改進,讓產品逐步融入使用者的日常生活。
Johnny 表示,Perplexity 的產品釋出秉持“完全準備好才推出”的原則,透過小而持續的功能改進,讓產品逐步融入使用者的日常生活。這種專注於快速迭代的策略使 Perplexity 能夠在 AI 領域保持靈活和創新。
未來,Perplexity 將在語音體驗中保持來源透明和使用者互動的可能性。與純語音或純文字不同,Perplexity 希望提供多格式的沉浸式體驗,讓使用者既能聽到答案,又能看到詳細的來源資訊,這對使用者和釋出商都更公平。
以下為這場對話的主要內容:
Michael Mignano
很高興你能來。按我理解,你的背景實際上是工程學,對吧?而且是研究方向。你是 IOI 的獎牌獲得者,如果我沒記錯的話。
我知道這一點的原因是,我們也投資了另一家公司 Pika,CEO 也是 IOI 的獎牌獲得者。我在網上看到一條推文,說現在在 AI 領域,有很多 IOI 獎牌得主。
如果你是像我這樣的投資者,遇到 IOI 獎牌獲得者的公司,應該直接投資,因為他們的記錄非常優秀。能不能和我們講講作為 IOI 獎牌得主的意義,以及你的背景?
Johnny Ho
當然。是的,IOI 獎牌得主的群體確實在 AI 領域很活躍,尤其是在創始人方面。看到技術背景的參與者大量出現,確實有點非同尋常。
成為 IOI 獎牌得主需要大量的訓練。通常需要幾年時間,類似刷 Lead Code 上的典型問題,但這些問題往往耗時較長,不像 Lead Code 那樣短短 10 或 15 分鐘,而是需要花費數小時。
這種訓練需要一種截然不同的思維方式,就像是在每天提升一些可能或不一定實際有用的技能,為了自我投資而努力。
Michael Mignano
這些都是程式設計挑戰吧?
Johnny Ho
是的,類似 Lead Code,但更注重效能。基本上你需要一個最佳的解決方案才能拿到滿分。
Michael Mignano
這個是在高中還是大學期間進行的?
Johnny Ho
通常大多數人從高中開始,然後逐年提升自己的技能,最終參加國際比賽,比如叫做 IOI,也就是國際資訊學奧林匹克競賽,或者相關的 ACM ICPC。
Michael Mignano
你也參加了 ACM ICPC 嗎?
Johnny Ho
是的,在大學也參加了這個。不過大學時間少,所以表現沒那麼好。
Michael Mignano
然後你早期的職業生涯是作為一名工程師,我記得是 Core 的一員,但後來你離職回到學校,回到哈佛。我想知道做出這個決定的原因。已經在職場中有一份出色的工作和角色,為什麼會選擇回到學術界?
Johnny Ho
這個決定當時挺有趣的。Core 有一個很棒的人才庫,所以我很喜歡那裡的氛圍。你提到的 Danny 也在 Core,那時 Core 是知識型公司的代表。
現在有好幾家類似的公司,但那時 Core 是大家都向往的地方,大家在那裡學習如何為使用者構建產品,搭建基礎模組。帶著這種視角回到學校後,我就想知道能學到哪些實用的、具有現實應用價值的知識。
Michael Mignano
你學到的一些實際應用的例子是什麼?
Johnny Ho
大家都提到“大資料”,而在過去,啟動一個大資料管道非常困難,很多步驟都是手動的,你得自己搭建所有基礎設施。現在已經簡單了 100 倍左右,但要理解每天的工作如何轉化成指標還是一樣的。
比如說,如果你在最佳化某個指標,可能會把它當成當月的目標,但同時你也要考慮是否過度優化了那個指標,以及這個問題是否可以完全量化而不是質化。這些都是隨著經驗的積累而學會平衡的。
Michael Mignano
對,這很有道理。那麼你是如何從工程師和 IOI 獎牌得主轉型到產品和戰略方向的?這可不是常見的轉型。
Johnny Ho
確實不常見,但我很高興看到 IOI 社群的人們嘗試新的事物。剛開始更多是出於興趣,想要深入理解產品,用產品。
公司裡總有人驅動力去改進產品,從使用者的視角思考。我覺得隨著時間的推移,這種關注逐漸從底層開發轉向了使用者體驗方面,但我仍然會參與程式碼審查,理解團隊成員正在做的工作。
Michael Mignano
那你現在還在寫程式碼嗎?
Johnny Ho
是的,還在寫。
Michael Mignano
那太棒了。好的,那來說說 Perplexity。你們稱之為“回答引擎”,而不是“搜尋引擎”。大多數使用者使用它做的事情,可能是之前用 Google 搜尋的。你們的長期目標是什麼?是要取代搜尋引擎的行為嗎?
Johnny Ho
長期目標是補充搜尋,引入新的行為。我們有一個列表,列出了 AI 解鎖的各種垂直和使用場景,其中很多是傳統搜尋無法實現的。
這就是我們稱之為“回答引擎”的原因。大約 30% 到 40% 的長查詢在傳統搜尋中是無法解答的。因此,我們認為這些查詢仍需要傳統搜尋技術的支援,比如查詢相關的視覺表示。
關鍵區別在於使用者的意圖更復雜,可能有多個步驟。滿足這些需求是一個更困難的問題,但同時也令人興奮。
Michael Mignano
你提到使用者意圖。你覺得使用者來 Perplexity 時的意圖與 Google 不同嗎?這是你期望使用者有意識做出的選擇,還是你認為使用者會逐漸替代他們原本在 Google 上的行為?
Johnny Ho
是補充作用,使用者仍有一些簡短的舊查詢,我們希望取代這些行為,同時擴充套件它們。使用者可以用 Perplexity 完成編碼等任務,這在傳統搜尋中是無法實現的。擁有一個能同時滿足這兩種需求的引擎很有挑戰性,但這是值得努力的方向。
Michael Mignano
如果拿 Google 搜尋、Perplexity 和 ChatGPT 來比較,搜尋是覆蓋面廣泛,Perplexity 更專注於答案。那麼 ChatGPT 的位置在哪?
Johnny Ho
Perplexity 介於兩者之間,使用者可以找到連結,也可以直接獲得答案。在大多數情況下,80% 的時間使用者會得到滿意的答案,剩下 20% 的時間可以深入查詢或驗證答案。這種後備機制對我們來說非常重要,以確保答案背後有可靠來源。
Michael Mignano
80% 的時間使用者能直接得到答案,剩下 20% 需要深入。這是你們想要保持的比例,還是希望提高?
Johnny Ho
我們會不斷提升這個比例,但不是僅僅提供答案,而是增加互動。比如使用者可以查閱來源、跟進問題、點選互動元素。未來,這些互動會增加,使用者不再僅僅滿足於文字答案,他們會希望更直接的互動。
Michael Mignano
你是說未來這 20% 會變成一種補充體驗,讓使用者學到更多或獲得意料之外的東西?
Johnny Ho
是的,這 20% 會很難,最後的 20% 是最難的。逐步提升這一部分,將決定 AI 是否能真正成為面向消費者的產品。
Michael Mignano
有意思。關於 ChatGPT 和 OpenAI,你能講講這項技術的實現嗎?你們並沒有訓練自己的模型,而是結合搜尋和大語言模型來提升回答質量。可以講講它的工作原理嗎?
Johnny Ho
Perplexity 的核心是把答案與來源聯絡起來。我們離線抓取網路內容,並在線檢索合適的段落和片段。這需要平衡,從哪些來源、包含多少上下文。
我們的模型之一是“Sonar”,它被調教得快速回答問題,符合我們的品牌需求和簡潔性。我們還在探索如何引導這些模型來實現真實的互動,這是一個挑戰,但也是未來的方向。
Michael Mignano
像是為使用者做事情。是這個意思嗎?
Johnny Ho
沒錯,為使用者執行一些任務,就是有些人所說的“智慧體”。但同時也包括讓使用者進行互動的元素。因為目前來說,AI 要自主行動而不依賴於人類的輔助,其實還很困難,對吧?
Michael Mignano
那麼,在到達 Sonar 或其他語言模型之前,是否可以認為 Perplexity 的第一步是像傳統的搜尋一樣的過程?
Johnny Ho
在某種程度上是的,像傳統搜尋。但傳統搜尋的特點是透過點選獲取價值,而我們則更注重使用者的需求,點選與否並不是唯一的衡量標準。
對於我們來說,80% 的情況並不需要使用者點選,而是直接提供最真實、最值得信賴的資訊和來源。
Michael Mignano
那麼你們是如何進行搜尋的?是否在底層使用了 Google?
Johnny Ho
我們使用了多種 API 和訊號,並將它們結合起來,以確定最佳片段和來源。例如,傳統搜尋可能只能從 Wikipedia 這樣的大域名中抓取一個 URL,而我們可以從不同頁面、甚至頁面內部深層嵌入的資訊中提取併合成使用這些內容。
Michael Mignano
明白了。我想象這是一個兩步的過程:先進行某種傳統的搜尋,可能使用一些 API,也可能是你們自有的技術;然後再用語言模型將這些資訊綜合提煉,以簡潔易讀的方式呈現給使用者,並保持 Perplexity 的品牌語調。
Johnny Ho
沒錯。我們確實在制定一個簡潔、品牌化的使用者定義的目標函式,這與傳統搜尋和 ChatGPT 稍有不同。我們更關注答案的簡潔和良好的格式,併為使用者提供延展查詢和現實互動的跳板。
Michael Mignano
這一切讓我想到我們之前提到的 80-20 法則,尤其是下一代模型的影響。例如 GPT-4.1 系列模型,它們似乎在做更深入的推理。
雖然這和 Perplexity 的工作不同,但那 20% 的“使用者推理”空間是否也有助於這些新模型的應用?你們會從中受益還是遇到新挑戰?
Johnny Ho
每次新模型釋出,我們都會看到某種好處。例如,開源模型 LLaMA 釋出後,我們在產品中融入這些模型並進行微調。
GPT-4.1 的不同之處在於它有一個較長的推理鏈條,這在輸出答案之前並不完全透明。對於大多數使用者來說,這會增加 5 到 20 秒的延遲,對一般的用例並不適用。
不過,在程式設計或基於操作的介面中,這種延遲是可以接受的。當這種技術進一步發展,延遲降低、成本下降後,強模型的使用場景會持續擴充套件。
因此,可能在 6 個月內,程式設計領域的許多回答會由長推理鏈條驅動的模型來完成。但當前這個模型的版本仍然較早。
Michael Mignano
非常有趣。現在使用者可能透過額外的 20% 來實現推理,而未來模型將承擔更多推理任務,尤其是在程式設計等領域?
Johnny Ho
是的。GPT-4.1 模型主要優化了客觀功能:準確性。這也是它在選擇題和程式設計方面表現突出的原因。對於客觀主題,它將非常適用,比如法律和科學問題。
但當用戶有個性化偏好或想深入探討時,可能會遇到挑戰。比如使用者可能忘記告知 AI 自己住在紐約,而 AI 會假設,進行長時間推理,影響體驗。這時需要使用者的互動參與。
Michael Mignano
也就是說,要麼使用者完成整個推理鏈,要麼 AI 完成,但這兩者結合在一起會變得混亂。
Johnny Ho
確實是的,這就是為什麼我們要對哪些話題適合哪種語言模型有清晰的理解和判斷。我們會不斷改進這方面的理解。
Michael Mignano
那麼回到搜尋,如果目標是逐漸從搜尋轉向直接提供答案。儘管 Perplexity 似乎增長迅速,但傳統搜尋引擎有內建的分發優勢,如在 Safari、Chrome 等系統和瀏覽器中,Perplexity 如何克服這些分發優勢?
Johnny Ho
這是一個複雜的問題,但所有成功的 AI 產品的核心在於“顛覆性”。關鍵在於找到那些被我們專注“顛覆”的應用場景,而傳統公司未必會花心力去追逐的應用場景。此外,我們還需要一些留存手段。
儘管傳統公司依賴通知推送和推廣內容,而我們則用 AI 的優勢建立獨特的產品體驗。這使得我們不需要龐大的社交網路也能迅速搭建一個內容流。
Michael Mignano
從團隊目標和文化的角度來看,如何推動這種增長?感覺你們並沒有什麼捷徑,而是每天努力進步。團隊是如何實現這些結果的?
Johnny Ho
我們有很多有機的想法。例如,最近我們開展了返校季活動。大部分公司花大量資金進行營銷,而我們卻深入瞭解學生需求,比如喜歡小禮物和競賽。
所以,我們沒有複雜的管理結構,每個工程師都有自主的思考空間,快速迭代,有時候犯錯,但總能在交付前的最後 10% 調整到位。
Michael Mignano
團隊是否設定了周或月的增長目標?
Johnny Ho
我們每個季度會設定一個高層次的目標,然後分解成每週的目標。每個人每週設定自己的目標,完成率至少達到 75%。這樣就有了穩定的節奏和進度。
Michael Mignano
這些目標是基於功能釋出,還是關注周增長?
Johnny Ho
也包括定性的目標,不僅僅是使用者增長。使用者增長本身難以執行,因此需要分解成具體的小里程碑。
比如,某項實驗失敗了,那我們可以從中學到什麼?或者一個原型雖然還不完善,但卻是一個建設性的起點,可以進一步調整。因此即便當時未能直接增加使用者增長或留存,也有具體的成就感。
Michael Mignano
假設你們成功實現了產品增長,這對整個網際網路生態意味著什麼?我認為像 Perplexity 這樣的產品替代傳統搜尋,網際網路的大部分內容是基於搜尋和廣告模式免費供使用者使用的。
而 Perplexity 越是從傳統搜尋中分流,這種商業模式受到的挑戰也越大。能否談談 Perplexity 的商業模式,無論是當前還是未來?
Johnny Ho
對,核心業務目前是訂閱,包括消費者訂閱和企業訂閱。因為 Perplexity 目前是一個專注的生產力工具,這樣的訂閱模式非常合理。
我們提供的價值在於幫助使用者更高效地完成工作,比如每節省一小時的時間,我們就可能為使用者帶來 1% 的附加價值,大概相當於每隔幾小時“賺”一美元。
因此,我們並不在每次查詢中直接向用戶收費,而是基於整個月內累積提供的價值。
未來的下一步可能是廣告業務,因為並非所有人都想付費訂閱。我們希望廣告能夠以對使用者有益的方式呈現,使用者可以被動或主動地發現優質推薦內容。
重要的是,我們絕不會改變答案或對答案產生偏見,我們會始終構建與使用者需求一致的商業模式。
Michael Mignano
這非常有趣。傳統搜尋引擎的答案確實會有一定的偏見,因為一些連結可能是付費推廣的。
而在 Perplexity 中,答案始終保持客觀,廣告可能只是作為相關內容的補充。這種激勵機制和 Google 完全不同,你們專注於提供正確的答案,並希望將 80% 的準確率提升。
這樣的話,Perplexity 的“使用者停留時間”可能會低於 Google,因為使用者得到的答案更直接、簡潔。廣告的展示方式、定價和目標會因此有所不同,你如何看待這些差異?
Johnny Ho
我們在這方面既有新鮮的視角也抱有謙遜的態度。我們在構建消費類產品時沒有考慮廣告,所以對新的體驗有很多需要學習的地方。
我們會推出多個版本、快速迭代,傾聽使用者和廣告商的反饋。我們習慣了快速調整和最佳化的節奏。我認為目前我們要堅守的核心使命就是不削弱答案的客觀性,不產生偏見。
產品中確實有一些地方,廣告可能更自然地融入或更容易被使用者操作,但我們還沒有具體答案。
Michael Mignano
那麼你覺得在傳統搜尋中的每一美元廣告支出是否可以無縫轉移到一個“回答引擎”上,還是會有一些損失?
Johnny Ho
目前很難說。我認為廣告主最重視的使用者希望能夠逐步遷移到 Perplexity。隨著使用者群體的分佈變化,廣告支出流向也會隨之變化。
例如,尋找最佳 API 是一個非常昂貴的查詢,因為使用者可能最終要為該 API 支付上千美元。
在傳統搜尋中,只有當用戶點選廣告時廣告才有價值,但隨著使用者逐漸理解不喜歡點選錯誤連結的體驗,這種分佈會發生變化,使用者將透過他們的查詢進行投票。
Michael Mignano
你認為 Google 是否能在不破壞廣告模式的情況下轉型?畢竟,他們也在嘗試將 AI 回答置於搜尋結果的頂部。
Johnny Ho
很難說。大公司行動緩慢,可能受到法律問題和現有合作關係的制約。Perplexity 則可以從零開始,完全基於第一性原理思考使用者價值。
大公司始終會面臨大量的官僚束縛,至少在未來兩三年內,理論上它們很難徹底改變商業模式。
Michael Mignano
確實如此。網際網路的很多內容都依賴廣告模式免費提供。像 Perplexity 和 ChatGPT 這樣的產品可能會攔截一部分流量,削弱原本基於廣告的使用者體驗。這樣一來,釋出商能否繼續免費提供內容?如果不能,AI 產品獲取資訊的方式又會受到怎樣的影響?
Johnny Ho
這個問題很好,這正是我們開始釋出商計劃的原因。只有這樣,才能確保整個激勵機制的一致性。
從網路上獲取優質內容、展示這些內容、使用者消費內容,這一切形成一個閉環。目前的模式基本上是透過付費決定廣告排名。
我們希望透過更合理的激勵機制,讓使用者的查詢主導結果,而不僅僅是關鍵詞。確保為使用者呈現最相關的內容片段,而不是出價最高的片段。
Michael Mignano
你能進一步介紹一下發布商計劃嗎?
Johnny Ho
Perplexity 的釋出商計劃會平等地為每一個被用於生成答案的來源分配相應的報酬。
比如,如果某個來源的片段被使用,就會得到相應的分成。目前的公式比較簡單,就是根據某個來源被使用的次數來計算,但未來可能會更復雜一些。
我們的目標是讓使用最多的來源獲得最大的分成,從而鼓勵釋出商繼續創作高質量內容,也讓使用者看到最相關的內容,而不是被最高競價的片段所支配。
Michael Mignano
所以釋出商在其網站上釋出內容,Perplexity 收集這些資訊生成答案,使用的所有來源都會根據出現的頻率進行簡單的收入分成。作為釋出商,如何確保我的內容能被優先選中?
Johnny Ho
確保內容具有高質量、可驗證性、可信度和原創性。這樣可以使這些內容片段更頻繁地被展示。
Michael Mignano
我猜想會有一種新的 SEO 形式出現,釋出商會最佳化內容以便被 Perplexity 或類似服務採集,是這樣嗎?
Johnny Ho
是的,我想這確實會成為一個難題,需要去除所有隻是重複而非原創的內容。隨著時間的推移,這個過程不可能僅靠人類來完成,我們將需要 AI 來參與這場“戰鬥”。
這可能會涉及到機器學習,考慮哪些文章是最早釋出的、哪些資訊背後有真實的作者、哪個釋出商在該領域的權威性最高等等。
雖然這個公式還未完善,但這是必須要完成的,否則網際網路將充斥著無限量的不可驗證、缺乏可信度的資訊。
Michael Mignano
這確實讓釋出商在新的世界中對可信度的需求提高了。當用戶不直接檢視並評估內容來源時,對信任的要求就會更高。
Johnny Ho
對,以前使用者可以透過點選連結來驗證內容,比如看看網站設計如何,有沒有侵入性廣告。但隨著這種模式的重要性降低,未來將更多地關注頁面上的實際資訊,包括高質量的報道如何為該頁面提供資訊。
接下來會很有趣,尤其是當人們生成圖片和影片時,我們如何防止這些內容主導資訊領域?
在我看來,影像和影片更具挑戰性,因為它們缺乏結構化的格式。比如影像的來源不明確,影片的來源也越來越難辨別,即使有元資料,人們也可以輕易移除這些資訊。
Michael Mignano
我猜測對於文字內容,AI 可以驗證其是否為人工生成或 AI 生成,如果是 AI 生成的,可能會降權處理。
Johnny Ho
至少在文字領域,我們有一個較為明確的結構化框架,比如頁面標題、釋出商,最重要的是作者存在的前提。
這使得判斷資訊來源更加容易。但如果人們開始忽視作者或不再突出展示作者資訊,這將是一種危險的趨勢,使用者將難以辨別資訊的來源。
Michael Mignano
引用會在這一切中扮演什麼角色?因為在釋出商計劃推出之前,引用可能是釋出商的真正價值所在,即確保使用者知道內容來源並能為網站帶來流量。這在釋出商計劃中是否仍然是價值交換的一部分?
Johnny Ho
是的,無論是否被點選,釋出商都會獲得相應的積分。我們基於內容片段的使用次數,而非點選次數。
這避免了在點選區域大小上進行操控。我們沒有激勵去降低或提升某些來源的優先順序,我們的激勵是提供最高質量的答案。
Michael Mignano
你認為多模態模型在 Perplexity 中的潛力如何?如今大家都很期待 ChatGPT 的語音模式,這些模型似乎在語音、影片和影像交流上提供了很多新功能。對於 Perplexity,這些技術的應用前景如何?
Johnny Ho
我認為語音很有趣,但它會丟失 Perplexity 通常提供的大量上下文資訊。因此在語音設計中,我們仍會展示來源和各種媒體資訊,這樣使用者可以瞭解答案的來源,而不僅僅是接收到簡短的音訊回答。
語音也很具挑戰性,因為使用者可能不會期待透過語音輕鬆地跟進查詢。我們或許可以在語音模式中新增一些非語音的查詢或互動元素,以避免類似傳統客服的單調體驗。
Michael Mignano
明白了。所以即使是在語音為主的體驗中,你仍希望使用者看到螢幕內容,以多種格式結合的方式呈現,而不是純語音或純文字。讓體驗更具沉浸感是更好的方式。
Johnny Ho
沒錯,使用者應該隨時有選擇權。如果他們想檢查答案的準確性,應該能夠做到。對於我們產品和品牌來說,持續提供事實依據非常重要,這對釋出商也是有利的,他們不會被完全剝奪存在感。
Michael Mignano
接下來 Perplexity 有哪些新進展?似乎你們一直在推出新功能和新平臺。未來我們可以期待些什麼?
Johnny Ho
對那些期待新功能的人來說,Perplexity 的特點在於只有在完全準備好的情況下才會發布新功能。我們可能在後臺進行很多實驗和演示,但只有在達到生產標準時才會正式釋出。
我們的變化不會在一夜之間出現,而是透過一系列小而增量的更新,使產品更友好,增加小的互動,將 AI 更加融入使用者的日常生活。
這樣的迭代思維讓我們可以快速前進並集中精力。與其追求一次性的大規模釋出,我們更專注於每次小規模的進步。
✦ 最“新”活動 ✦
11月12日,矽兔賽跑邀請了UniUni企業發展事業部負責人叢霖來到直播間,分享UniUni的快速成長曆程和如何幫助客戶降本增效。

✦ 精選內容 ✦

