


這是Perplexity CEO Aravind Srinivas 不久前在 TechCrunch Disrupt 上與 TechCrunch 高階編輯 Devin Coldewey 的一場對話。
Aravind 詳盡討論了他對 AI 搜尋的未來、內容創作者的參與方式以及 Perplexity 的產品策略。
他表示,Perplexity 團隊優先根據使用者的實際需求來推進功能開發。透過分析使用者日誌,他們先後推出金融、體育等相關領域的功能,幫助使用者高效獲得精準答案,以此逐步替代傳統的“藍色連結”搜尋模式。
Perplexity 的目標是覆蓋使用者的日常用例,從而改變幾十年來依賴傳統搜尋引擎的習慣。
關於商業化,Aravind 強調了在 AI 行業中的高昂運營成本,尤其是 GPU 和資料中心的費用。他展望了未來 API 成本的下降趨勢,並提出 Perplexity 的變現方式不僅限於訂閱,計劃透過靈活的廣告變現模式實現持續增長。
Perplexity Publisher Program 的設計初衷,期望透過廣告收入分享和定製 AI 助手,幫助媒體和內容創作者參與到 AI 搜尋生態中。
在當前 AI 成本高企的情況下,Perplexity 將更多資源集中於增長,並逐步探索可持續的收入模式。以下為這場對話的主要內容,enjoy~
Devin Coldewey:
感謝你的加入,Arvin。感謝所有人參與。讓我先直接問一個問題,來了解一些基本情況。你們公司對 “抄襲” 的定義是什麼?你們肯定有一個定義吧?我很想知道。你們必須得有一個定義,以防止在無意中觸犯。
Aravind Srinivas:
呃,其實你可以問一下這方面的靈活性。
Devin Coldewey:
我以為我是這樣問的。
Aravind Srinivas:
實際上,對的,這可能是最佳的回答方式。其實這並不是我們公司自定義的定義,而是 “抄襲” 的實際定義。很顯然,Perplexity 始終會引用來源,因此並沒有對任何內容的所有權主張。
它只是從網路上提取資訊,總結成使用者易於理解的方式,並提供了這些資訊的來源。就像記者或學者們撰寫文章時那樣,只要有參考文獻和引注部分,對吧?
Devin Coldewey:
但在學術意義上,他們創造了一份原創檔案,並利用引用來構建一些原創內容,對吧?
Aravind Srinivas:
嗯,有時候當某個新聞通訊首次報道了一條新聞,之後另一個新聞媒體報道相同的新聞,並註明該新聞最初由某某報道時,這算是抄襲嗎?
Devin Coldewey:
好吧,當我引用某人的話時,我會把它放在引號裡並註明他們說了什麼。但是,CopyLeaks 剛剛進行了一項研究,他們發現當 Perplexity 可以讀取一篇文章時,往往會直接引用 8、10 或 15 個連續的詞句,並在小卡片之類的地方註明文章出處,但沒有更多說明。
Aravind Srinivas:
從一開始就在來源面板中標註,在每句話的結尾處也會有腳註,指向資訊的相應頁面。當然,並不是非常精確,每句話後都有確切的腳註,但我們確實嘗試過。
我們在 2022 年 12 月 7 日推出這個功能,當時 ChatGPT 在 7 天前剛剛上線,整個世界都被它吸引了。
但是我們是唯一一個重視引用和引文的 AI 產品,而其他產品只是從網路中吸收內容,並不提供引用。
因此,從一開始我們就關注這個問題,並不斷改進,力求在文字中更加清晰地標明特定部分的來源,我們也在努力做得更好。
Devin Coldewey:
我相信你,而且你有學術背景,所以我真的相信這對你來說很重要。我知道你從一開始就提到引用,這表明你並不僅僅是在表面功夫。但是,當然,你必須有一個定義。
問這個問題並不是為了刁難你,而是因為你們必須理解或定義 “抄襲”,以便能夠避免抄襲。如果我在我的文章中複製貼上某些內容,我會知道自己在抄襲,也會因此感到不安,所以我不會這樣做。
因此,理想情況下,你會希望你的模型也不會這樣做。所以它必須知道,或者至少得有某種監督機制。我們可以繼續探討,但我問這個問題是有原因的。
Aravind Srinivas:
是這樣的,模型會被指示不要直接引用任何特定來源的文字,而是提供一個融合不同觀點的摘要,直接滿足使用者的需求,而不是簡單複述網路上的內容。
這個指示隨著模型在指令遵循能力的提升而得到良好執行。AI 中常稱之為監督微調(SFT)或基於人類反饋的強化學習。
顯然,我們並不是唯一在做模型訓練的團隊,我們會採用來自其他開發者的模型,比如 Llama 開源模型。
沒有任何模型是完美的,任何模型都可能透過提示工程或提示注入來實現與原始設計不同的行為,整個過程被稱為提示注入。
Devin Coldewey:
好的。但如果我只是說 “嘿,幫我總結一下這篇文章” ,然後像有人展示的那樣,有時你會發現它直接拿了整句話過來。
Aravind Srinivas:
是的,這並不是我們產品的預期使用方式。我們的產品主要是用來解答問題的。有些人試圖用它來做我們不希望的事情,比如說,“幫我總結這個 URL” 然後他們貼上 URL。不過我們已經。
Devin Coldewey:
我實際上是這麼用過的。
Aravind Srinivas:
嗯,我們實際上並不允許這種特定的使用方式,我們盡力避免這種用法。但說實話,沒有任何 AI 可以聲稱對某個特定的用例總能設下保護措施。
使用者總能找到新的提示方式,使原有的保護措施失效,然後我們再逐步完善。最終,我們可以在較為安全的情況下進行部署,確保它不會以非預期的方式被使用者使用。
Devin Coldewey:
明白了。談到 AI 驅動、資料本地的 AI 搜尋,我們看到有幾家公司在做類似的事情,但我想到的最顯著的例子就是 Google。
Google 已經在複雜化和智慧化搜尋十幾年了,加入了摘要、小部件、AI 等。
這也許是我作為科技記者 15、20 年職業生涯中看到的一個最不受歡迎的重大平臺更改之一。
但感覺有些公司在說,“我喜歡你在做的事情,Google,你覺得我們是否可以接棒你做的事情,甚至做得更好?”
Aravind Srinivas:
我認為 Google 基本上還是一個以連結為基礎的搜尋引擎。無論他們是否希望提供答案,點選連結才能讓他們賺錢。
就在昨天的財報電話中,他們提到每季度僅搜尋廣告就能賺 450 億美元,這對他們的核心業務非常重要。
我認為雖然他們沒有細分利潤率來源,但主要利潤還是來自讓使用者點選更多的連結。因此,他們有動力展示儘可能多的連結。
即便 AI 摘要在某些資訊查詢中開始出現,但這並不是主要的使用方式。每天約 50~80 億的查詢中,大多數查詢並不需要這麼深度的答案,因為如果不是這樣的話,肯定會破壞他們的收入模式,對吧?
我們正在嘗試做的事情與 Google.com 或至少 Google 的搜尋欄有所不同。Google 查詢的平均詞數在兩到三之間,具體資料很難確定,但有人估計約為 2.7,而在 Perplexity 上,大約是 10~11 個詞。
顯然,在 Perplexity 上,人們直接問問題,而在 Google 上,你只是輸入幾個關鍵詞以快速找到某個連結。
使用者仍然會使用 Google 查詢一些簡單的問題,比如某個名人的年齡、正在進行的比賽比分,或者舊金山的天氣。
這些情況下,使用者會輸入 2~3 個詞,而目標是快速獲得答案。可以說,Perplexity 和 Google 都應該滿足這種即時資訊查詢的需求,但除此之外,這兩個產品完全不同。
Devin Coldewey:
所以我對某些用例很感興趣。首先,你在 Twitter 上釋出了大量的用例和功能,過去兩週內我看到你們釋出了大概 50 個。你剛剛提到比賽比分,你們剛剛在 Perplexity 上增加了這個功能。
Aravind Srinivas:
是的,目前只有 NFL。
Devin Coldewey:
只有 NFL 嗎?你們是直接從 NFL 獲取資料,還是從其他地方抓取資料?
Aravind Srinivas:
不,我們透過與一家體育資料提供商簽訂的資料合約來獲取資料,和 Google 採用的方式一樣。沒人會直接抓取比分,因為確保資料的準確性非常困難。
Devin Coldewey:
那這樣做是因為使用者會查詢類似 “今天 Seahawks 的比分是多少?” 還是他們會說 “給我展示過去 20 場 NFL 比賽的比分資料”?
Aravind Srinivas:
更像是後者。我們希望 Perplexity 成為一個可以回答任何問題的地方,我們的任務就是提供準確的答案。
顯然,我們在初期找到了一些特定的使用者群體,比如,Facebook 初期流行於學生群體,Amazon 以圖書銷售為主。
類似的,早期的網際網路確實迎合了學術型使用者,積累知識庫的能力在 AI 中也不例外。
Perplexity 最初深受那些學術研究型、知識導向型使用者的喜愛,我們也圍繞這些人群建立了品牌。但我們希望擴充套件到全球,讓所有人都能提問任何問題。
儘管體育看似與知識無關,但許多人喜歡圍繞體育進行分析、統計比賽,深入瞭解特定球員或球隊的成功機率,預測比賽,或總結比賽。
因此我們不僅提供即時比分,還提供更深入的內容,比如解說總結、球員對比、球隊對比以及更詳細的細節,滿足那些關注這一領域的使用者需求。
Devin Coldewey:
這是我提到的眾多新功能之一,比如說幾十個新功能。你們頻頻推出這些功能,有什麼策略嗎?還是說有點像散彈槍的策略,你們打算推出 10 種產品,然後其中三種會成功?這是在嘗試找出對使用者來說真正有價值的功能嗎?
Aravind Srinivas:
不,我們實際上會檢視日誌,看看使用者都在詢問什麼。事實上,在增加體育功能之前,我們優先考慮了金融。
因為我們在商業和金融領域有很多使用者,他們會進行市場研究、投資組合管理,或者查詢加密貨幣的相關新聞或其他投資者的投資策略,試圖瞭解不同股票的新聞動態。我認為人們是在嘗試理解這個世界。
所以我們會檢視日誌,看看哪些方面我們可以做得更好,哪些方面我們能提供的不只是文字牆,這點非常重要。
體育是一個領域,很多人發現了一些我們產品的幻覺問題,比如在無法提供比賽的準確比分時。
這就像,如果我們能夠涵蓋使用者在現有搜尋引擎上習慣的多種日常需求,那麼他們就沒有理由回到傳統的藍色連結介面,對吧?我們的目標是,如果你想要改變習慣,這並不容易。
這是一個已經持續了二三十年的習慣,大家早已習慣於 10 個藍色連結的搜尋引擎。
但是如果這是未來的趨勢,我們必須努力贏得使用者的信任,覆蓋他們的日常用例,超越單純幫助他們的軟體開發、研究規劃、學術研究或金融研究,我們還需要涵蓋諸如本地搜尋、體育、天氣、購物、旅行等 “無聊” 的需求,這就是我們決定優先順序的依據。
Devin Coldewey:
你們也引來了訴訟,關於 Dow Jones 的問題。他們稱 Perplexity 是一個 “內容盜竊帝國”。這個說法有點強烈。你們公開回應說媒體公司希望這種技術不存在。
但我不認為這是真的,因為你們和 Fortune、Time 有合作協議,原告 News Corp 也與 OpenAI 友好合作。所以問題不是他們希望你們不存在,而是他們可能不喜歡你們提出的合作模式,對嗎?
Aravind Srinivas:
他們聲稱我們沒有回應,但這並不屬實,我們實際上在同一天就做出了回應。所以我希望人們能夠理解,我們的意圖是合作、參與和共同努力。
Devin Coldewey:
那這實際的合作會是什麼樣的?如果你們要談合作,這些協議的內容是什麼?是收入分享嗎?什麼收入?你們要如何分享?這會是什麼樣子?
Aravind Srinivas:
我們推出了一個名為 Perplexity Publisher Program 的專案,幾個月前釋出的。這個專案的理念是,內容授權是一種短期的安排。首先需要明確兩點:一是要將 AI 公司分為兩類:
一類公司會利用網際網路上的所有資料訓練大型基礎模型,模型將所有文字、所有詞彙內化,擁有完整的知識。如果訓練得足夠好,隨著模型規模擴大,所有這些內容都被內化到模型權重中。
另一類則是隻在特定查詢時即時使用網路上的內容作為來源,用於生成摘要,而不對內容進行訓練。
我們正在向出版商解釋,我們屬於第二類,不應該帶著 “第一類公司付錢授權內容訓練模型” 的心態來看待我們。對於第二類公司,我們提出了不同的結構,目前還沒有人提出過類似的提議。
我們表示,我們將透過廣告盈利,因為我們本質上是一個搜尋產品。是的,我們直接提供答案,但我們屬於搜尋類別,而搜尋是面向大眾市場的消費品。
最終,透過廣告可以獲得可觀的收入。與傳統搜尋引擎賺取大量廣告收入卻從不與出版商分享的方式不同,我們的承諾是按查詢級別與出版商分享廣告收入。
即在特定查詢中,如果我們透過廣告獲得收入,而你的來源被引用為答案的一部分,我們會與您分享這筆收入。
如果我們的使用者增長持續,並能透過廣告有效變現,這對所有願意合作的出版商來說都是巨大的回報,使他們的內容可以作為我們答案的一部分被引用。
Devin Coldewey:
問題在於,出版商認為,當有人在 Perplexity 上檢視我的文章被引用的摘要時,他們不會再點選我的文章,從而剝奪了我們賴以生存的流量和收入。
這在 News Corp 的訴訟中體現得尤為明顯。他們說,你們宣稱並不與我們競爭,但實際上你們就是競爭對手,這就是這麼簡單。對此你有不同看法嗎?你怎麼反駁?
Aravind Srinivas:
我們不是一個新聞產品。沒有人來 Perplexity 是為了獲取日常新聞。
Devin Coldewey:
那為什麼你們還要頻繁獲取所有這些內容呢?
Aravind Srinivas:
使用者來到這裡是為了弄清楚周圍發生的事情對自己有什麼影響。比如說,有一則關於 Nvidia 的新聞,可能 Blackpool 的 GPU 出現延誤,或者 Jensen 宣佈按計劃推進。
你會問,在這個新聞背景下,我是否應該繼續購買 Nvidia 的股票?這些問題你不會去問 TechCrunch,但是你會問 Perplexity。
同時,你不會來 Perplexity 獲取 Jensen 說了什麼的新聞,而是直接去新聞來源。這是兩個不同的產品,使用者需要理解這一點。
我們也有責任去教育使用者,幫助他們理解這些區別,並展示使用者是如何使用我們產品的。沒有人會來這裡要求“準確地復現這篇文章”。
網上已經有其他網站可以做到這一點了,有一些免費的網站可以讓你直接貼上 URL,然後獲得任何收費牆背後的內容。而我們完全不是為了這個用途而設計的。
Devin Coldewey:
但是你們確實從廣泛的網際網路和所有內容創作者中獲取價值,比如那些釋出 YouTube 影片、文章、書籍、故事和其他內容的上百萬使用者。
我們如何參與其中?我們已經習慣了 Google 和 YouTube 的廣告模式,比如說 “你們做廣告” 或 “透過 YouTube 變現” 。那我們該如何變現呢?
Aravind Srinivas:
確實如此。所以我們邀請了所有人參與,我們的 Perplexity Publisher Program 就是為了這個。
在廣告收入分享之外,我們還會幫助你們在自己的平臺上構建 AI 原生助手,或者任何型別的 AI 輔助功能,這樣使用者在你們的網站上時可以僅搜尋你們的內容。
比如說,他們在閱讀一篇文章時可能有很多後續問題,直接在你們網站上提問而不必來找我們。
我們會透過 API 提供支援,給予大量 API 點數,還會為所有媒體公司員工提供 Pro 高階訂閱和企業計劃,因為我們相信我們的產品可以讓你們的內容創作更加高效。
無論是寫新內容還是進行新聞寫作,都會涉及到事實核查、市場研究或人物背景調查。我們目前是最前沿的研究工具之一,可以幫助人們更有效地簡化研究流程。
Devin Coldewey:
我明白。我不是學術界的,所以可能在獲取來源以及不同需求的方面,我們的看法會有些根本性差異。
不過就像現在,假裝他們不在,只有我們在談話。這是個關於版權和訴訟的複雜問題,智慧財產權法在這方面尚無先例,所以如果出現錯誤也是可以理解的。你認為有可能在某個環節上無意中犯了錯嗎?這很常見。你覺得有可能嗎?
Aravind Srinivas:
我們的回應已在部落格中釋出,這也是我們信奉的立場。我們不會故意違反任何法律,自然會為自己辯護。
Devin Coldewey:
你認為法律是否需要改變,以便讓更多類似的事物存在,給智慧財產權更多流通的自由?
Aravind Srinivas:
我認為目前已經有很多關於版權的法律,並且有一些先例已確立——對事實的版權並不成立。
Devin Coldewey:
確實是這樣,但不僅僅是事實。我並不只是寫“事實”。
Aravind Srinivas:
我們都不是律師,所以顯然我們無法在這裡解決這個爭論。我們的信念是,事實應該被普及和共享。想象一個世界,科學家們聲稱某個事實屬於他們,其他人就無法獲取該知識,這樣的真相無法傳播。
Devin Coldewey:
確實如此。這是個有趣的觀點。我真的很好奇。那為什麼籌集這麼多資金?是因為傳遞事實很昂貴嗎?
Aravind Srinivas:
AI 很昂貴。我希望未來成本能降低。但目前 GPU 和資料中心都很貴。提供模型的公司需要透過推理費用來收回投資,而我們這樣的使用者則需要付費使用。
我觀察到 API 成本大約每 4-5 個月下降一半,這是最近的趨勢。如果這種趨勢再持續一兩年,模型成本將會進一步降低 10~50 倍。
對於我們這種增長趨勢的公司來說,這非常理想,因為成本在下降的同時,我們可以專注於擴充套件。短期內先處理成本,隨著規模擴大,我們也在探索長期可持續的盈利模式。
我們認為,除了訂閱外,還有很多方法可以讓 AI 產品變現。雖然許多公司在訂閱模式上取得了成功,我們也做得相當不錯,但我們認為在使用層面的變現可能更好,而不僅僅是按月收費。
我們認為,如果不透過募資籌集大量現金,就可能遇到麻煩,但我們相信可以找到解決方案。
Devin Coldewey:
你覺得能從 Google 那裡分一杯廣告收入嗎?人們會轉向你們嗎?
Aravind Srinivas:
我不確定這是否是零和的。基本上,有人可能會說“我的營銷預算裡,有 95% 給 Google,5% 給 Perplexity”。這種情況並不一定會發生。
根據現有的趨勢,即便像 Matter 的廣告收入增長,Google 的收入也保持穩定或略有增長。
因此,如果我們廣告收入增長,可能會影響其他公司的廣告收入,但不一定會立即減少 Google 的份額。
我認為,出現一個新平臺時,首先要確保不失去現有使用者的信任,不要過度追求廣告收入,以免破壞平臺存在的初衷。
同時,我們也需要讓廣告商確信在這裡投放廣告沒有品牌風險。我們需要處理諸如幻覺等問題,這需要很多努力。我估計我們至少需要兩年時間來解決這些問題。
✦ 最“新”活動 ✦
「虎嗅 F&M 創新節」來啦!
11月23日-24日,北京751D·PARK
將有⼀場為創新把脈、為創意喝彩、給開放⿎勁⼉的Party
1️⃣ 11月23日|AI:邊界與落地
數位科技公司大佬,一場關於AI的大膽前瞻
10 位 AI 初創公司創始人,下一代獨角獸提前
2️⃣ 11月24日|商業的邏輯,變了
寶藏創業者分享獨家搞錢心得
更有「未來玩家.00版」看斜槓Z世代切磋思想
🎁 有新Newin|粉絲專屬福利
下方掃描海報小程式碼,點選【我要購票】
在購票介面右上角兌換碼處輸入 【有新Newin】
選擇單日票線下參與,數量有限先到先得!

✦ 精選內容 ✦

