真格精釀回顧:如何把握AIAgent的創業時機|ZEvents

Z Events 是真格的活動欄目。
「真格精釀」系列活動從 2019 年起,已走過 5 年,旨在幫助創業者更深入地洞察行業賽道,發現科技前沿機會,結交更多志同道合的創業夥伴。
3 月 9 日,真格基金在北京舉辦「真格精釀·AI Agent 圓桌派」線下行業沙龍,邀請到了五十餘位 AI Agent 領域的前沿研究者和資深從業者,與來自產業界及投資界的專家們一起,從技術、行業應用、創業投資等多維度出發,深入分析 AI Agent 的發展前景、應用場景,發掘產業中潛在的機遇。
2024 開年,大模型迭代帶來的 AI 浪潮仍在以不可擋之勢狂奔,為我們帶來了智慧時代的曙光。
在關注底層技術變化的同時,我們也十分關注應用的落地方向。例如,AI Agent 領域具體會如何發展?何時使得科幻電影中的智慧助手真正走入生活,用技術顛覆現有習慣,並帶來可觀的市場機遇?
真格基金自成立以來,始終是新技術和創業精神的堅定支持者,從基礎模型、應用、開發者工具、基礎設施等方面,持續關注並佈局 AI 及前沿科技領域。我們投資了月之暗面、雲天勵飛、格靈深瞳、依圖科技、出門問問、愛筆智慧、思謀科技、晶泰科技等創業公司。
本次活動我們邀請到了來也科技聯合創始人&CTO 胡一川、微軟亞研院首席研究經理譚旭,與真格基金管理合夥人戴雨森、投資副總裁謝巖一起,圍繞 AI Agent 的技術發展、應用場景和產業前景等話題進行交流探討。
活動招募的一週內,我們收到了超 300 份的報名申請,但囿於閉門沙龍規模限制,我們最終只能邀請到部分觀眾來到線下參加本期精釀。
我們整理出了本次活動中嘉賓的部分精彩發言以及現場觀眾的問答內容,雖不足以展現 4 個多小時熱烈探討的全貌,但希望可以帶給大家一些啟發,也歡迎在評論區與我們交流。
01

AI Agent 領域如何構築護城河

微軟亞研院首席研究經理 譚旭
在透過大語言模型完成任務自動化工作時,我們發現核心就是呼叫 prompt,然後用大語言模型去完成複雜的任務,最終解決一些場景。部分學術研究可能更像是一些概念,並沒有太多技術壁壘。
如果真正想要繼續深入研究,就需要知道各個環節的反饋。比較有護城河的方向就是深入到各個環節去提升相應的能力,解決實際需求並在實際場景中得到反饋,再提升對應能力,從而逐漸構建起 AI Agent 領域的壁壘
現在 AI Agent 領域裡很缺乏一個比較完整的評估體系,指導大家去進一步設計和最佳化模型。我們繼續研究的初衷,就是想要去構建一個完善的 Benchmarking 來指導該領域的技術發展,去評估哪些 Agent 的機制更合理?哪些 Agent 背後使用的語言模型更好?
02

阻礙相關研究落地的主因在於效果

微軟亞研院首席研究經理 譚旭
我覺得做 AI 研究永遠有兩個指標,一個指標是效果,第二個才是成本或推理成本。制約我們的永遠是效果,而不是成本。只要效能或效果能夠達到,一定會有非常多的動力和資源投入來解決成本問題。
目前唯一的瓶頸是,現有研究效果無法達到落地指標。比如公司內部聊天工具中也有非常智慧的功能,幫助檢視會議、收集郵件、擬定郵件等,能夠在嘗試的過程中為你帶來耳目一新的驚豔感。
但在真實的使用場景中,你可能還是不放心將一些重要的回覆交給 AI 完成。所以我認為只有 AI 的效果能夠真正達到我們的需求標準時,才會被大規模廣泛使用。
03

AI Agent 落地數字員工時的挑戰

來也科技聯合創始人&CTO 胡一川
第一個是模型的能力需要更強。在所有模型的對比中,GPT-4 的效果相較於其他模型來說有較大優勢。但是現實中的實際業務場景比評測中的任務要複雜得多。可能在很多場景中,GPT-4 的效果也遠遠不夠。
第二是應用生態需要更開放。影響數字員工發揮價值作用的關鍵因素,就是它接觸的資料、操作的系統、完成的任務是否豐富。
首先我們看到國內的生態還需要很長時間來建立。其次,過去的 API 更多是給人看的,不見得對大模型比較友好。如果未來想要透過大模型操作 API 來實現 AI Agent 形態的數字員工,還需要討論 API 的具體形態。這是一個目前大家還未能達成共識的問題,甚至有可能誕生很多新的機會。
最後一點是目前的許多工作流程需要被最佳化和重構。比如一個 HR 想要做招聘,他目前的工作流程與有 AI Agent 的工作流程可能有較大差異。如果根據現有工作流程去設計 AI Agent 服務於招聘,可能就是錯的。
04

開發者選擇大模型時的三個考量指標

來也科技聯合創始人&CTO 胡一川
第一是效果的考量。大模型在通用評測指標上領先是不夠的,還需要在特定領域任務中的效果足夠好。大模型能夠針對真實場景定義出任務,有與真實使用者分佈接近的資料集,並且能夠進行自動化評估和快速最佳化,這非常重要。如果你在創業中做這個方向,這也有可能成為你的早期競爭力。此外,在一些 To B 的複雜任務場景下,大部分模型離 GPT-4 還差得比較遠。
第二是成本的考量。這主要包括使用大模型時的訓練成本、推理成本和維護成本。因為目前大部分人還不需要去訓練,所以目前可能最重要的就是推理和維護成本。
不同的應用場景下大家對成本的敏感度是不一樣的。例如,對於擁有 10 萬日活 To C 聊天機器人產品來說,使用 GPT-3.5 API 一天的價格大概是 100 美元,大家可能不太敏感,因為產品已經擁有了 10 萬日活,甚至已經可以在此基礎上進行變現。
但是在 To B 的場景下,使用 GPT-4 API 處理一張英文發票的成本大概為 0.2 美元,客戶就會計算機器是否比人力實惠,價格能否更低。
最後就是關於開源和閉源的考量。我們其實一直存在一個共識,就是閉源模型將會因算力和資料持續領先開源模型。所以服務 B 端客戶提供的複雜場景時,我們目前的策略基本上都是先用閉源模型做驗證,再考慮基於開源模型建立資料閉環,然後去服務一些無法一直使用閉源模型的客戶。

05

回溯移動互聯時代

對於中國早期AI創業者的三條建議

真格基金管理合夥人 戴雨森
其一是要靈活,用一種動態的眼光看待技術本身。因為目前技術還在高速發展變化,所以創業公司需要將變化看成一種常態,對變化有充分的準備。移動網際網路發展時代,行業發展到後期時大家才有了一些比較具體的判斷和固定的套路。
但是在 AI 時代一切皆有可能,所以公司的組織架構和創業方向需要能夠根據變化快速做出改變和嘗試。
其二在商業化方面,應該先關注使用者新增,再思考使用者留存。很多人會說在移動網際網路時期,留存是最重要的,但這需要以成熟的技術為前提。一切還未知時,就需要首先關注產品是否有很多人想要使用。很多時候隨著技術的進化,留存會越來越好。
還有一條是先關注使用者價值,再思考商業模式。如果在技術和產品尚未成熟時先思考賺錢,那賺錢的方式會極其有限。但是如果產品真的帶來了使用者價值,創造了全新的場景,那就可以賺到另外完全不一樣的錢。我們始終相信如果你的產品能帶來使用者價值,就始終有辦法從中提取一部分成為商業化收入。“Make something people want”,這也是 YC 的哲學。
每一代技術革命都會催生屬於它的新的商業模式,但這往往要在其滲透率到達一定程度時才會呈現。
從歷史上看,Google 和 Facebook 都是先做了使用者需要且滿意的產品,逐漸做大後才思考出商業模式。AI 時代也會有新的屬於它的商業模式。Google 這樣的大公司可能很難改變原有的商業模式,這時候就需要創業公司去抓住機會。

06

不去搶有限的時間

讓使用者願意為價值付費

真格基金 EIR 季逸超
分享一下我對這波 Agent 浪潮的一個核心思考。我們回到 Agent 這個詞,它的本意是「代理」。這就意味著無論咱們現在創業做什麼,在新平臺沒有真正出現之前,使用者時間和注意力的總量是恆定不變的,那隻要是聚焦於 To C 領域,本質上可以說你都與 TikTok 是競爭對手。
傳統意義上的「代理」,比如代辦簽證等各項代理服務——你只需要迅速地說清需求,代理就能在有限的互動時間內幫你實現。這啟發我思考,Agent 可能帶來的機會是:我們能不能去尋找一類機會,並不需要跟一個產品有很長的直接互動時間,但是我會願意為它產生的價值去付費?也就是說我們不再跟成熟的產品去搶使用者有限的時間,這可能一定程度上重新定義了 DAU 這個概念。這個也是我接下來會一直思考的點。

07

先驅還是先烈?

創業公司如何把握入場時機

真格基金管理合夥人 戴雨森
創業需要尋找一個大趨勢和小拐點結合的時機。
大趨勢意味著這件事情在不久的將來一定會發生,比如說中國過去發生的城市化、資訊化、工業化、全球化等趨勢。只有堅持跟進大趨勢,才不容易做錯,我覺得 AI 就是接下來的大趨勢之一。
確定好大趨勢後,仍需在其中尋找一個變化的拐點。這需要你比別人提前認知到這個拐點或在拐點發生之後迅速做出行動。太早和太晚可能都會出現問題,太早會變成先烈,而太晚又可能無法抓住時機。
我之前有聽說過一句話,「如果你相信一件事情遲早會發生,你就每隔三年做一次。」在我看來,如果你認為一件事五年之後大機率會發生,就可以去做。如果三年後就會發生,往往就已經有人在做了。如果十年後才發生,可能大部分公司都很難撐過這十年。所以從經驗主義的角度出發,我認為五年也許是一個對初創公司來說比較好的時間視窗。
來也科技聯合創始人&CTO 胡一川
2015 年的時候,來也科技其實就想做一款 To C 的個人助理產品。但是回頭來看,那個時候其實技術和市場都尚未成熟,最重要的一點就是我們在中途及時覆盤了不足並轉到了新的方向——面向 B 端客戶透過 RPA(機器人流程自動化)的方式提供更具有顯性價值的產品和服務。
但我們並沒有完全放棄 C 端的產品。去年大模型推出後,團隊就非常興奮,覺得這件事情又值得再做一次了。所以我也覺得,如果你認為一件事情有價值,那就可以每隔 3-5 年重新嘗試一次。
08

未來兩年最期待看到該領域有何發展?

來也科技聯合創始人&CTO 胡一川
我期待未來兩到三年內 AI Agent 能夠在某個特別垂直的場景中實現規模化落地。比如幫助大家打客服投訴電話。你的目標非常明確,只需要告訴 Agent 你的經歷、遭遇和訴求,Agent 就會完成撥號、等待、互動等一系列過程。
它還有可能會倒逼客服行業變化,客服團隊也可能會出現專門接機器人電話的 Agent 客服。久而久之就會變成機器人與機器人互動,這是我相信在未來兩三年內可能會出現的場景。
微軟亞研院首席研究經理 譚旭
我比較期待 Agent 背後最原始的推動力——底層技術的突破。比如在不久的將來,GPT-5 能否增強技術能力,覆蓋我們目前所做的很多系統性工作。
此外,在產品形態層面,我希望未來幾年能夠出現像鋼鐵俠中的賈維斯一樣的智慧助手。雖然目前也有類似的形態,但目前 Agent 更多是服務於辦公和企業流程的,我更希望在未來它能夠更加接地氣,服務於每一個人。
文字|Hanbao
影片|Vivia
編輯|Fanghan
推薦閱讀

相關文章