從中國出發、走向全球,網易有道AI創新應用的商業化實踐

演講嘉賓|趙越
編輯 |李忠良
策劃 |AICon 全球人工智慧開發與應用大會
在 InfoQ 舉辦的 AICon 全球人工智慧開發與應用大會上網易有道國際 App 產品部業務負責人趙越做了專題演講“AI 創新應用 C 端 B 端商業化實踐,從中國走向全球”,演講圍繞 AI 技術在不同市場中的應用和變現策略。
首先,將探討網易有道是如何利用 AI 技術開發出具有千萬級日活躍使用者的翻譯應用,並分享在北美市場成功佔據高比例語音轉寫市場份額的經驗。隨後,我會介紹在音樂娛樂和影像娛樂領域的實踐,講述如何在 AI 翻唱領域開發出全球排名第一的應用,以及如何透過創新和技術優勢打造影像娛樂類產品,從而在全球市場中獲取競爭優勢。
最後,我將詳細闡述 AI 及大模型技術在 B 端市場中的應用,展示如何有效實現全面覆蓋演算法研發和銷售成本的目標。
透過這些實踐內容,我希望展示 AI 技術如何在 C 端和 B 端市場中實現高使用者活躍度和高盈利能力。
內容亮點
  • 瞭解如何基於大模型和 AI 技術,開發出具有高 DAU 和高利潤空間的 C 端 App。
  • 瞭解如何將大模型和 AI 技術應用於 B 端場景,覆蓋所有成本並實現公司整體盈利。
以下是演講實錄(經 InfoQ 進行不改變原意的編輯整理)。
我今天分享的主題是 “AI 創新應用商業化實踐”。這個主題的出發點其實是從“全球走向中國”。
因為我一開始從事的是海外相關業務,之後才逐漸轉向國內的產品開發。
首先做一個簡單的自我介紹。我目前所在的部門是國際 APP 產品部。我在 2014 年碩士畢業,當時的研究方向是機器學習和人工智慧。但在經過三年的碩士學習之後,我意識到自己在學術研究方向上可能並沒有太大的天賦,於是畢業後就開始轉向 AI 技術的應用落地方向。
從 2016 年開始,我陸續做了多款 AI 應用產品。最開始做的是國際版的有道詞典,這是一個相對成功的專案,最初是在印度上線,最高的時候日活使用者接近一千萬,在全球幾十個國家的教育類應用榜單上都能排名第一。
從 2021 年開始,我開始開發多個同傳類應用。一開始這些產品主要在北美市場上線,之後才開始拓展到國內市場。其中一個產品叫 Lectmate,是一款專門為中國留學生開發的“留學聽課助手”。
因為很多留學生在國外上課時可能面臨語言障礙,我們希望透過轉寫和翻譯功能,幫助他們更好地理解課堂內容。這個產品目前在國內同類產品中也可以排到前列。
除了教育方向,我們還做過一款 AI 翻唱類娛樂產品,也是在北美市場推出,在該類應用中也曾排名第一。最近,我們也開始在 To B 方向出海,並開展了一些相關的研究。
我之所以選擇“商業化實踐”作為分享主題,是因為商業化本質上是大多數公司,甚至可以說是所有公司的最終目標。當然,一開始我也有過困惑。比如在我最初做國際版有道詞典的時候,我們的團隊一年辛苦下來,雖然產品取得了使用者增長,實際上卻並未給公司帶來利潤。
那時候我確實比較迷茫。不過,隨著工作經驗的積累,我逐漸認識到:所有的工作最終都是為了商業化,只不過每個專案的商業化路徑不太一樣。
一種是直接商業化,比如透過向用戶收費、廣告投放、會員訂閱等方式來獲得收入;另一種是間接商業化,即先提升產品的使用者規模(日活),在當前或未來再透過其它方式實現變現。比如現在很多 Chatbot(聊天機器人) 應用目前是免費的,但等它們積累了足夠的使用者後,就會開始推出收費功能,或者透過產品影響力帶來其他變現機會。這種模式也是近年來,尤其是在資本市場驅動下,非常流行的路徑。
我認為,一個產品或者一項工作的開展,首要問題是要搞清楚我們走的是哪一條商業化路徑。如果這個問題搞不清楚,就很容易陷入內耗。因為你可能每天都在很努力地工作,但回頭看,卻發現公司賬面上是虧損的,這就會對自己的價值產生懷疑。
新產品取得成功的三種情況
我們團隊在過去幾年中做了很多產品上的嘗試。回顧這些經歷,我總結出一個新產品在市場上取得成功的三種主要路徑
一、入局足夠早
我們發現,很多現在市場上已經成功、甚至可以穩定盈利的產品,往往是在十幾年前就已經入局,在該領域長期積累、持續打磨。我們也曾嘗試將我們在國內做得非常成功的翻譯類產品,擴充套件到 T1 國家市場(如美國、加拿大、英國等)。但我們很快發現這是一件極其困難的事。雖然我們在 T2/T3 國家 推出翻譯類產品時仍然可以獲得一定的收入,但一旦進入 T1 國家市場,情況就完全不同了。
我們在這些市場投入了大量資源,但始終難以撼動頭部產品,最終賠了不少錢。回頭覆盤,主要原因在於:
  1. 頭部競品入局早,已經建立起完善的流量結構。
  2. T1 國家頭部產品的流量來源一般分為三部分:
    • 買量(付費廣告投放):大家在這一塊的效率可能相近;
    • 關鍵詞自然流量:因為他們入局早,早已在應用商店中佔據了大量高價值關鍵詞,這些詞每天帶來的搜尋流量對他們來說是免費的自然量
    • 品牌認知流量:長時間的市場積累讓使用者對其產品形成了品牌認知,也帶來了穩定的自然流量。
因此,即使我們在買量環節與其效率相當,但對方有額外的 2/3 自然流量作為“補貼”,使得他們可以虧著買、持續投放。而我們完全沒有這些“紅利”,就意味著再怎麼投,也都是虧的,根本無法進行長期競爭。所以我認為,“入局早”本身就是一項重要的戰略優勢,很多成功案例的底層邏輯,就是他們在合適的時間點進入市場,並持續積累。
二、產品明顯更好
如果我們不是最早入局者,那麼第二種可能成功的路徑就是:產品足夠優秀,甚至明顯優於競品
舉一個典型的例子:在北美市場,使用者家中普遍擁有庭院,種植各種植物,植物也常常容易生病,比如葉子發黃、掉落等問題。因此,早在 2017 或 2018 年之前,市場上已經出現了識別植物病症的產品,比如 PlantSnap。後來,來自杭州的 瑞奇軟體推出了 PictureThis,也進入了北美市場。
結果是,PictureThis 逐步替代了 PlantSnap,拿下了該領域的大部分市場份額。我們深入研究後發現,PictureThis 在產品識別準確率、體驗流程等維度上,整體水平遠高於原有競品。這說明,如果產品體驗明顯優於市場上已有的選擇,就有可能打破原有格局,獲得使用者青睞。
這裡需要強調的是:“稍微好一點”遠遠不夠。我們曾經也有過類似的嘗試,產品在某些維度可能比競品略好,但沒有形成“明顯優勢”,最終仍舊無法撼動頭部地位。
所以,第二個成功路徑的前提是:產品在核心能力上必須具備顯著提升,而不是小幅最佳化。
三、新的技術要素的出現
第三種情形是“有新的技術要素”出現,帶來了新的機會視窗。這是近兩年來我們特別強烈感受到的一點。比如隨著 Stable Diffusion 和 ChatGPT 等前沿技術的出現,帶動了一大批具有極強商業潛力的應用爆發。這類技術的出現本身,就在使用者體驗層面和應用形態上帶來了巨大革新,進而重塑了整個產品競爭格局
在海外市場,我們觀察到許多成功的產品,比如:
  • 基於 Stable Diffusion 的 圖片生成類應用;
  • 基於 GPT 的 聊天機器人(Chatbot)類應用。
這些產品每天都能產生非常可觀的收入。這說明,一旦有新的底層技術出現,便可能帶來新一輪“視窗期”,誰能在第一時間內結合技術優勢推出高質量產品,誰就有可能抓住這個時代的新紅利。
面向翻譯類、語音處理類等
C 端需求的實踐
我想先簡單介紹一下我們此前做的產品——U-Dictionary,也就是有道詞典的國際版,主要面向 南亞市場,特別是印度等 T2、T3 國家的使用者群體。
一、產品在印度的成績與成功要素
右邊這張圖是我們當時在印度教育類 App 榜單中排名第一的截圖。回顧這款產品在印度等市場取得成功的原因,我認為主要有兩個:
  • 入局早:我們是較早進入這一細分市場的團隊,搶佔了先發優勢;
  • 產品質量相對較好:這裡“好”是一個相對的概念。印度本地的多數網際網路公司在技術能力和產品設計能力方面相比國內仍存在一定差距。因此,當我們以國內成熟的 AI 和語言技術進入當地市場時,能夠明顯形成優勢。
二、核心產品能力與技術優勢
我們出海時主推了兩大核心能力。
  • 查詞與翻譯能力
我們依託國內有道詞典多年積累的釋義自動挖掘演算法和小語種翻譯引擎,將這些能力遷移到國際版產品中。雖然需要做一些本地語料收集的工作,但整體翻譯效果已經能夠與 Google 翻譯相媲美——甚至在某些小語種場景中更優。這是因為 Google 往往是基於一個統一模型進行泛化訓練,而我們針對不同語種做了精細化調優
  • 亮點功能:OCR 技術
我們的 OCR 技術支援多種字元集,尤其適配了東南亞等地的特殊語言和字元結構,可以覆蓋一些非常“稀奇古怪”的字型。這一功能也非常適合用於網紅營銷,因為它具有很強的視覺衝擊力和傳播屬性。例如,我們支援影像翻譯,拍照後自動識別並用翻譯內容“蓋住”原文,整體效果儘量貼近原圖視覺。我們還推出了即時翻譯功能(AI 所見即所譯),在互動效率和使用者體驗上都取得了不錯的反饋。
三、OCR 技術的多語言和複雜場景適配
OCR 是我們特別下功夫最佳化的技術模組,因為它不僅能服務國內使用者,也能很好支援海外多語種環境。我們做了以下幾個方向的最佳化:
  • 多語種混排識別:如同時識別包含阿拉伯文、泰文、印地語等的影像;
  • 多角度文字識別:如日語的橫寫與豎寫混雜排版;
  • 特殊場景訓練
    • 手寫體識別
    • 公式識別
    • 超模糊影像處理——第三世界國家的手機拍照硬體和光照條件較差,我們專門訓練了模型以適應昏暗、模糊的拍攝環境,從而顯著提升使用者體驗。
四、海外推廣策略:買量 + 網紅營銷
在海外推廣方面,我們主要採用了兩種方式:
  • 買量
主要渠道為 Google 和 Facebook,這是一種標準打法。
  • 網紅營銷
我們在這一塊也走在了較前的位置,早在 2016 年就開始在 YouTube 上嘗試。當時做網紅合作的廠商還非常稀少。我們發現,如果你的產品是面向大眾使用者的,那就非常適合做網紅營銷。我們總結了網紅營銷的執行經驗:
    • 關鍵是要有“吸量功能”,即視覺上或功能上“眼前一亮”的特性,類似廣告素材,能調動觀眾的感官和情緒;
    • 推廣節奏上的技巧:我們採用“KOL + 投流”的模式。即先找一批網紅在某個時間點統一發布內容,後續對錶現最好的網紅進行重點投流,從而實現 ROI 最大化,降低 CPI。
五、現實挑戰:商業化困境與使用者付費能力
儘管我們在很多國家都做到了不錯的成績,甚至在一些國家成為了品類第一,擁有品牌關鍵詞、良好的使用者認知,但始終面臨一個核心問題——商業化能力薄弱。這些國家和地區的使用者,尤其是我們的主力使用者群體——學生(K12),實在是沒有支付能力。他們的收入結構決定了他們無法為教育類產品支付較高的費用。我記得看到一句話特別有共鳴,是查理·芒格說的:
“釣魚的第一條規則是在有魚的地方釣魚;第二條是永遠不要忘記第一條。”
印度、埃及這樣的市場,“魚實在太少”。我們即使投入了大量資源,做到了品牌領先和產品領先,最後還是掙不到錢。公司也給我們下了明確的商業化指標:如果不能變現,就“你們自己看著辦”。於是,我們開始探索新的變現方式,希望打破單一盈利路徑的困境。
在 2021 年,我們啟動了一個新的產品專案,叫做 iRecord。我們當時有一個非常明確的判斷:印度使用者沒錢,美國使用者有錢。所以我們決定將目標市場轉向 北美,開發面向美國使用者的錄音轉寫類產品,主要應用場景包括:
  • 會議記錄
  • 課堂筆記
  • 教堂講道記錄
這個產品的發展路徑,實際上也符合我們此前總結的新產品在市場上取得成功的三種情況:
  • 入局早:當時北美市場上在這個賽道的競品還不多,我們算是較早一批進入者;
  • 競品不強:現有產品技術能力不突出,產品形態也比較老舊;
  • 技術優勢明顯:我們擁有穩定且先進的語音識別、音訊處理等底層技術;
  • 針對使用者做了定製最佳化:在理解場景的基礎上,做了本地化適配和使用者體驗提升。
這些因素的疊加,幫助我們在相對短的時間內拿下了北美市場大約 40%~50% 的份額
我們在 iRecord 中實現了一系列核心功能與技術特性:
  • 多語種支援:覆蓋主流及部分小眾語種;
  • 音色識別與聲音定位:用於識別不同說話人,以及判斷其在空間中的位置;
  • 預處理增強:在音訊識別前對原始語音進行預處理,使聲音更飽滿、清晰,提高識別準確率;
  • 人聲分離:特別針對會議場景最佳化,可將多位發言人各自的聲音分離開來,提升內容結構化程度;
  • 背景音去除:借鑑音樂處理中的降噪技術,我們也做了一些如同“分離一首歌”那樣的處理方式,有效去除背景雜音,增強人聲識別效果。
在這一產品中,我們也成功實現了商業化變現,相比此前在發展中國家的產品有了明顯提升。得益於美國使用者更高的支付能力和對效率工具的付費習慣,iRecord 成為了我們出海戰略中,第一個“跑通技術→市場→變現”的閉環產品。
在 iRecord 取得階段性成功之後,我們也開始嘗試更多新的產品方向,並繼續秉持“找準市場、有技術優勢、快速落地驗證”的理念,不斷探索海外的創新機會。
面向音樂娛樂類、
影像娛樂類 C 端需求實踐
AI 娛樂是一個在全球範圍內增長非常迅速且潛力巨大的賽道。頭部公司每月營收可以達到數千萬美元,日收入在 40 萬美元左右。據我們掌握的一些內部訊息,這類產品的利潤率大約在 30%,也就是說,一家公司每天可以淨賺約 10 萬美元的利潤。這個體量對任何一家創業公司來說,都是非常可觀的。
我們注意到國內的 AI 孫燕姿翻唱功能火爆之後,立即將這一能力產品化,並遷移到海外市場,讓使用者可以自定義訓練任意一個他們喜歡的音色,讓這個音色去翻唱任意一首歌。這個產品在海外也取得了不錯的反響,可以看作是一個從國內場景出發、透過“時光機效應”在國外市場重現成功的案例。“時光機理論”依然在發揮作用。類似的例子還有妙鴨相機。
它上線之前,海外市場就已經有非常相似的產品——Lensa。Lensa 在高峰期的日營收能達到 200 多萬美元。這個趨勢驗證了一個現象:一些在國內成熟併成功的產品形態,往往可以在海外市場再次爆發,彷彿歷史總是在一遍一遍地重演。
在已有產品基礎上,我們還持續進行了功能上的擴充套件。例如,AI 翻唱產品中加入了伴奏替換功能,一首歌可以切換為爵士、搖滾等不同風格的伴奏;我們也開發了超擬人的 TTS 技術,不僅用於娛樂類產品中角色語音的生成,也作為功能亮點用於廣告素材製作。這些 TTS 引擎的生成效果已經幾乎無法與真人語音區分,因此在使用者體驗上極具吸引力。我
們還嘗試了將這些 TTS 技術用於廣播劇的製作,雖然技術實現上沒有問題,但從市場反饋來看,這個細分場景的規模有限,變現能力也比較有限,不太可能成為核心的營收來源。
綜合來看,我們認為海外娛樂類 App 會長期存在並持續湧現機會。即使像 ChatGPT 這樣的大模型佔據了市場主導地位,其它中小型的 Chatbot 仍然可以擁有可觀的收入。與國內不同的是,在海外,絕大多數 Chatbot 都是付費產品。在這個市場上,最核心的邏輯只有一條:只要你的產品單元經濟模型能跑正,就能持續擴張規模
而不像國內,很多公司採用燒錢補貼的方式來爭奪使用者。影像類產品在海外也同樣具備非常強的商業化能力。例如美圖類的工具型產品,依然能帶來穩定且可觀的營收規模。這也說明,在 AI 娛樂和視覺創意類方向上,海外市場還遠未飽和,依舊充滿機會。
面向使用者的變現實踐
我們如何找到新的方向並起步?
我們在尋找新方向和啟動新專案時,其實採用的方法和許多團隊類似,首先會搭建一個情報系統,用來追蹤並遍歷市場上新近出現、且增長勢頭較快的產品。在使用情報系統時,有一個非常關鍵的判斷要做:這個產品究竟是真的具備盈利能力,還是在依賴資本進行補貼式增長。這個判斷非常重要,如果分辨不清,就很容易偏離自己的目標和資源能力,導致方向跑偏。
在確定一個方向是否值得嘗試時,我們強調的是與競品之間的相對優勢。只要我們具備明確的優勢,就有可能做得起來;反之,如果優勢不明顯,進入這個市場的價效比就會很低。我們內部有一個明確的原則,叫做“先射子彈,再射炮彈”
也就是說,先做一個基礎版本的產品,甚至這個產品可能都還達不到 75 分,先推向市場測試一輪。如果市場反饋好,我們再加大投入;如果反饋一般或者不行,那我們就會及時止損,轉而尋找下一個機會。
不過歸根結底,到最後比拼的還是核心能力。無論你是做 B 端產品,還是內容型產品,還是 AI 驅動的產品,最終決定競爭力和可持續性的,是背後的技術、演算法、資源、商業理解等方面的綜合能力。前期的技術紅利或打法差異可能會帶來一時的領先,但從長期來看,所有表面的差異都會被拉平,剩下的就是硬實力的對抗
如何獲得競爭優勢獲得利潤
我們在評估一個新產品能否建立競爭優勢時,通常會從五個維度進行判斷。
  • 第一,是否具有核心能力。我們會審視自己的核心技術能力是否在這個領域中有明確的優勢,是否能做到比競爭對手更好。
  • 第二是產品功能本身,是否真正能滿足使用者需求,以及是否具備差異化。
  • 第三是商業化策略。很多產品雖然功能強大,但在定價模型、付費路徑設計或者使用者轉化策略上存在明顯短板,結果也難以實現盈利。所以商業化策略的對比和最佳化非常關鍵。
  • 第四是硬體成本的考慮。尤其是 AI 類產品,對計算資源的依賴極強。如果一個大公司進入這個市場,他們在伺服器租賃、推理成本等方面的資源可能是小公司的幾分之一,這對競爭格局影響很大。我們也需要評估自己在這方面是否具備足夠的資源支撐。
  • 第五是投放能力。投放不僅僅是渠道覆蓋的廣度,更是對流量轉化效率、素材最佳化能力、投放節奏管理等綜合能力的考驗。我們看到有些產品本身質量很高,但因為投放能力不足,始終起不來。而這恰恰是我們作為大公司的優勢,比如網易本身就有大量直客資源和投放渠道的支援。
我們會以這五個維度為標準進行全面評估:只要在這些核心要素上能形成足夠競爭力,我們就會堅定投入;如果評估下來不具備優勢,我們就果斷轉向,不做無效投入。
如何抓住機會
第一點,我認為最重要的就是多看。移動網際網路已經發展了十幾年,準確地說已經是第 11 年了。大機會基本都已被佔據,小機會也大多被人發現併入局。不過,小機會雖已存在參與者,頭部競品的能力可能並不強,還有可操作的空間。與此同時,技術的持續演進也會不斷帶來新的“視窗期”。比如我們剛剛提到的 Lensa,它的母公司其實是一家小公司,但依靠一波技術浪潮依然在這個市場中賺到了錢。
第二點是“慢慢跟、慢慢抄”。新技術並不是每天都誕生的,如果沒有新技術,就很難拿到新機會。但這不意味著什麼都不做。平時我們要做的就是練內功:在已有的成熟產品上,打磨自己的投放方法、商業化策略、產品功能,持續總結成功的方法。對標競品抄是一個非常直接有效的方式。不是簡單照搬,而是理解其路徑和打法,最佳化為自己的方案。
第三點是等待。我們在能力打磨好之後,要有耐心等待新的技術或新機會的出現。一旦技術浪潮來了,準備好的人才有可能第一時間抓住它。
最後一點,我想講的是先做中小機會。中小機會通常門檻較低、落地難度也相對較小,適合作為團隊的“基本盤”。一方面,它可以穩定現金流和團隊狀態;另一方面,也能為後續搏擊更大機會打下基礎。大的機會當然值得追,但當下能拿下的先拿下來,大的拿不下也沒關係,等時間夠長,總會輪到你
這一點我們團隊體會特別深。過去公司老闆經常 push 我去研究一些特別大的方向。但我的經驗是:如果一開始就盯著所謂的“大機會”,我們團隊早就“死好幾回”了。所以我們並不刻意去追逐“宏大敘事”,而是選擇了更踏實的打法。
B 端機會觀察
我們團隊主要做的是 AI 的 C 端產品,這些產品成熟後,相關技術也會向 B 端輸出。反正技術已經沉澱好了,多賣一次就是多一份收入。但我們也清楚,在國內做 B 端公司是很難的。我們系統性地研究了多個 B 端公司的財報,發現幾乎都處於虧損狀態,而且這種虧損並沒有好轉趨勢。
相比之下,英偉達提供了一個更具啟發性的 B 端公司模式。它並不直接提供產品解決方案,而是提供那些大眾產品不可或缺的能力——顯示卡。顯示卡一旦交付出去,客戶就可以基於它去訓練模型、提升估值、甚至“挖礦”、開展商業應用。
也正因如此,英偉達的產品始終處於供不應求的狀態。這種做法給了我們啟示:如果我們能幫助 B 端客戶賺錢,或成為他們產品裡的關鍵能力,就可能建立起更穩定的商業模式
此外,我們還看到了另一個值得關注的機會:國內 AI 能力“質優價廉”,在海外市場具有競爭力。以語音識別(ASR)為例,我們發現谷歌、微軟等海外頭部廠商的平均價格在 1 美金每小時,約合 7 到 8 元人民幣,而國內的 ASR 廠商標價通常只需 2 到 4 元人民幣,價格優勢非常明顯。因此,我們最近也在積極推動國內 AI 技術向海外市場的輸出
嘉賓介紹
趙越,網易有道國際 App 產品部負責人,成功研發了多款廣受歡迎的 AI 應用,包括有道詞典國際版 U-Dictionary、iRecord 和 LectMate。其中 U-Dictionary 在全球教育類應用下載量中名列前十,iRecord 和 LectMate 分別在北美和中國大陸的語音轉寫領域排名前列。此外,在 AI 音樂和 AI 影像處理方面也取得了多項成功案例。
 活動推薦
AICon 2025 強勢來襲,5 月上海站、6 月北京站,雙城聯動,全覽 AI 技術前沿和行業落地。大會聚焦技術與應用深度融合,匯聚 AI Agent、多模態、場景應用、大模型架構創新、智慧資料基建、AI 產品設計和出海策略等話題。即刻掃碼購票,一同探索 AI 應用邊界!

相關文章