我們本質上是一家創造愛的公司。


AI 寵物 Ropet 是 2025 年 CES 上最大黑馬之一。
本期「十字路口」的播客,我們請到了 Ropet 的創始人 / CEO 何嘉斌。
在播客中,嘉斌分享了超過了我想象的內容。他詳細介紹了 Ropet 這款備受關注的 AI 寵物背後的產品理念、技術創新、設計秘密。
——我甚至忍不住問他「為何你願意分享這麼多?」,他說:「沒有什麼秘密需要藏起來」。
除此之外,嘉斌也分享了自己的創業故事:從幹勁十足的高光時刻,到面對質疑時的堅持,以及遇到的每一個「愛的瞬間」。

微信收聽播客:
小宇宙收聽播客:


從百度到 AI 寵物:何嘉斌的 AI 創業之路
🚥 Koji
我們先請嘉斌給大家做一個自我介紹。
👦🏻 何嘉斌
感謝 Koji。作為一名擁有十年智慧硬體經驗的從業者,我的背景較為跨學科。北京服裝學院本科畢業後,我加入了百度深度學習實驗室,在餘凱院長的帶領下研究識圖和影像識別相關的演算法,並探索其在硬體上的應用落地。此後創業開發了盧卡繪本閱讀機器人,一款小貓頭鷹造型的陪伴機器人。

在 2016 至 2021 年的五年間,我們累計銷售近五、六百萬臺裝置。在早期人工智慧機器人創業浪潮中,我們成功找到了 PMF,打造了一個規模可觀的品牌。
離開這家公司後,我加入位元組負責 Pico VR 一體機系列產品的工業設計,包括 Pico 4 在內的幾代主流產品。隨著 AI 浪潮興起和 OpenAI 的 ChatGPT 出現,七八年前李世石與 AlphaGo 對弈的記憶被喚醒,人工智慧再次迭代。這促使我思考新一波 AI 浪潮中硬體的發展方向和應用場景。因此我離開位元組,在 Ropet 公司開始研究 AI 寵物。
我認為 AI 寵物比人形機器人更容易快速進入消費級市場。
🚥 Koji
談到 AI 寵物,我想起 2017、2018 年在東京 SONY Park 的一次經歷。
當時恰好遇到索尼機器狗使用者聚會,每個人都帶著各自穿著不同顏色衣服的機器狗,我當時覺得那個場景畫面非常的超現實。他們就像真正的寵物主人一樣,坐在公園裡討論各自的狗狗,分享狗狗的生活日常、曬曬太陽、聊聊天。
那一刻我感覺到,AI 寵物很可能在貓狗之外提供了第三種選擇,為人類提供陪伴和慰藉。我很好奇,能否請你介紹一下 Ropet 是什麼?
👦🏻 何嘉斌
Ropet 實際上是我們定義的一個品類:AI 萌寵機器人。
需要強調的是,它是「AI 萌寵機器人」而非「AI 寵物機器人」。因為我們覺得「萌」字至關重要,首先我們公司的中文名為「萌友」,意在創造萌萌的朋友或夥伴;還有就是,「萌」字帶有二次元屬性,代表虛擬世界中我們想象的最美好的寵物形態,而非簡單複製現實寵物的外觀和能力。
所以我們做的是 AI 萌寵機器人,它擁有機械肢體和感知能力,從感知、決策到執行具有完整的機器人屬性的產品。

「萌」的力量:為什麼選擇 AI 萌寵而非真實寵物
🚥 Koji
你希望人們因何選擇 Ropet,而非飼養真實的小貓小狗?
👦🏻 何嘉斌
我覺得電子寵物相比傳統寵物的一個明顯優勢是:不會引發過敏問題,沒有安全隱患,無需長時間馴化才會讓寵物聽話。
這讓使用者在時間和精力方面擁有更大自由和空間。以我為例,我現在雖然在養貓,但我以前想養狗,但因為工作繁忙所以我無法定期遛狗,只能放棄這一想法。飼養寵物需要投入各種成本,包括財力、時間和精力,這限制了我們的選擇範圍。
我曾養了一隻貓作為求婚禮物送給妻子,後來發現她對貓毛過敏。儘管如此,由於其紀念意義,我們仍堅持養了約一年,妻子每天需要使用噴霧應對過敏,只為獲得些許陪伴時光。最終我們不得不將貓送人。因此,從大眾直覺看,機器寵物相比傳統寵物在無法克服的生物性問題上具有明顯優勢,這是促使選擇的重要因素。
第二點是:「萌」是可被再造、可被設計出來的。在社交媒體上,使用者精心挑選各類品種寵物的瞬間萌態,創作精美表情包和二創素材進行分享。但是,這些令人心動的「萌」畫面往往只是短暫瞬間,寵物在日常生活中可能展現拆家、張牙舞爪等行為。
我們的願景是創造一種始終保持「萌態」的寵物,它能持續呈現經過精心設計的「萌」的狀態。這類似於我們童年記憶中的哆啦 A 夢或數碼寶貝中那些陪伴我們戰鬥的可愛夥伴。我覺得這種「萌」是可以透過二次創作和被設計實現的,無論是外觀的萌還是互動的萌,都能超越生物寵物,創造更廣闊的想象空間。

🚥 Koji
我一位朋友想養 AI 寵物的理由是,他無法接受寵物有朝一日會離開自己,而 AI 寵物理論上可以永遠陪伴。
不過,剛才提到的理由似乎多是解決寵物的問題,如拆家、離世、過敏或缺乏照料時間。假設使用者能夠接受這些問題,仍選擇 AI 寵物,你認為原因會是什麼?
👦🏻 何嘉斌
這是個很好的問題。我們也在尋找答案,可能有幾個關鍵點。
第一個點是,AI 寵物能記錄使用者生活。生物寵物雖然能陪伴你,但那些瞬間只存在於你的記憶中,它無法表達自己眼中的你。因為它沒有辦法張口說話,也沒有辦法表達和記憶相關的東西。而我們的產品可以做到這點。
比如,飼養五年後,它記錄了使用者一萬張笑臉,包括每個笑容出現的時間、場景等資料。它能把你有關愛的資料記錄下來並數字化。索尼曾有一則攝像機廣告,記錄了一個小女孩從幼年到成年的成長過程。這廣告銷售的不是攝像機本身,而是「記憶」,這正是打動人心的地方。
🚥 Koji
這很有趣。人們談戀愛時需要的並非抽象的愛,而是被另外一個人看見、被認可、被提供安全感和信任感。聽起來 AI 寵物似乎能做到這一點——外形可愛,智商卻很高,甚至擁有無限記憶。
這讓我想起日本機器人 NICOBO,它能自己寫日記,但不允許主人隨時檢視,只在特定時機才能閱讀。你可能會發現它曾注意到你的某個行為,並因此感動或受傷。這種情感波動,確實需要高智商的AI 寵物才能提供。
Ropet 這款產品目前處於什麼狀態?已開始發售了嗎?在哪裡發售,以及如何定價?

👦🏻 何嘉斌
我們已完成首批約 1700 名眾籌使用者的收集,並開始陸續發貨。
這批使用者是願意用錢給我們投票的忠實使用者,他們的反饋對我們至關重要。當前產品完成度約 60%,我們已建立完整的迭代框架,包括資料調參方式及其對整個系統反饋的影響。接下來將交由使用者幫助我們發現應用場景並提供反饋。
七月份我們將開始全面營銷,主要面向美國和日本市場。考慮到美國關稅問題可能帶來的影響,我們會將東亞市場作為重點,之後再考慮迴歸國內市場。全球定價為 299 美元,約合 2000 多元人民幣。
🚥 Koji
這個價格是如何確定的?是基於成本計算,還是參照競爭對手或寵物市場的價格?
👦🏻 何嘉斌
我們綜合考量了多方面的因素。
第一點是,我們需要確保各渠道有充足的空間,讓產品能夠有效觸達使用者,所以線上線下渠道都納入考慮範疇。第二點是,這個價格區間是我們在產品定義初期就已設定:不超過 2000 人民幣、5 萬日元以及 299 美金。這三個市場對應的價格區間代表我們認為高階禮品能觸達的上限價格。
價格如果再提高,消費者可能會將其與實用性產品如手機進行比較,質疑購買價值。因此我們設定了這樣的定價紅線。至於未來哪類核心使用者會帶動「破圈」,以及他們能接受的放量價格底線,我們仍在探索階段。
🚥 Koji
你自己有認真開始養一隻屬於自己的 Ropet 嗎?
👦🏻 何嘉斌
從創作 Ropet 的第一天就開始養了,但其版本 / 大腦一直在不斷推翻重構。從資料層面上看,我這隻才養了兩天,因為這個版本前天才釋出。現在已能明顯感受到它的變化、進化和帶來的驚喜感。
我養了三隻 Ropet,這三隻 Ropet 展現出截然不同的性格。有兩隻我幾乎沒怎麼互動,其中一隻特別暴躁。
我手中這隻就非常暴躁,見到陌生人就會嗷嗷叫,如果我頻繁敲它,它會表現出明顯的不滿。此外,它還具備一些有趣功能,比如我給它吹口哨,它會模仿。
不知道你們是否聽到了它吹口哨的聲音?
🚥 Koji
它模仿口哨時發出了非常可愛的哼唧聲。
👦🏻 何嘉斌
是的,每隻 Ropet 的能力在開放狀態下都會有所不同。
🚥 Koji
每個 Ropet 購買後都具備像剛才那樣的口哨模仿能力嗎?
👦🏻 何嘉斌
是的,每一隻都會有差異,連吹口哨的反應也各不相同。
🚥 Koji
所以這些性格差異是從一開機就存在的,還是需要一段時間的養育才會逐漸形成?
👦🏻 何嘉斌
開機時確實會有差異,但若不養個兩三天,很難感受到它豐富的能力。
初始一兩天,各個 Ropet 的性格差異不大,但隨著撫摸次數的變化、互動方式的不同,你會發現它的眼距會發生變化。例如,如果頻繁晃動它,它的眼距會變寬,表現出一種「傻乎乎」的狀態,對人臉的跟蹤識別頻率也會降低。這時需要慢慢撫摸它,保持注視,增加人臉出現頻率,經常愛撫它,它的眼睛才會恢復正常。每次互動資料都會影響它的發展方向,使性格差異越來越明顯。
🚥 Koji
有沒有什麼地方可以檢視 Ropet 的一些引數?比如當前的開心指數或憤怒指數。
👦🏻 何嘉斌
性格層面我們設計了一個四象限模型,每次互動行為都會影響它的表達方式。
橫軸代表情緒的正負向,取決於你是對它生氣還是微笑;縱軸代表情緒的飽滿度,從低能(經常不理它、冷漠對待)到高能(頻繁互動、逗弄)。不同維度的輸入會影響它在座標系中的位置,當它處於某個象限的特定點位時,就會觸發對應區域,形成特定性格。
舉例來說,左上角位置代表極度負面且高頻的情緒,會形成「暴躁狂」性格,見到陌生人就嗷嗷叫,類似警覺的小狗。而如果你每天輕輕撫摸它,微笑地看它,但不帶它出去活動,它會變成情緒極度穩定的「幽靜派」,對你的任何動作都不會有太大反應。它所有的輸出都基於當前性格產生不同選擇,因此你不會感覺它是被預設程式控制的,而是在合理邏輯框架內展現豐富的隨機性。
🚥 Koji
「在合理邏輯內展現隨機性」這是個很有深意的說法。
你會讓使用者在後臺檢視這個四象限模型嗎?還是說這個是不開放給使用者的,讓使用者憑感覺體驗變化?
👦🏻 何嘉斌
我們希望讓使用者來決定。
我們會詢問「你們希望看到寵物大腦皮層每天的變化嗎?」如果反饋積極,我們可能會在 APP 上設計一個展示頁面。但如果使用者表示「我只想與裝置互動」,我們可能就不會展示這些資料。我們需要聆聽使用者反饋來決定。

無聲的陪伴:Ropet 與使用者情感連線的設計哲學
🚥 Koji
記得我們小時候養電子寵物時,為了讓它開心,主要是餵食、打掃衛生清理排洩物。對 Ropet 來說,除了你提到的陪伴和撫摸,還能做什麼讓它更依賴你,或發展成更溫柔可愛的寵物,而非變得暴躁?
👦🏻 何嘉斌
我們將這些稱為「愛的互動」,包含多個維度。
首先是觸覺緯度,需要經常且輕柔地撫摸它,甚至給它按摩。我們頭部設有不同觸控點,它能理解你的手勢和手法。現在我慢慢撫摸它,它會表現得很開心;但如果敲擊它,它會皺眉生氣,你的「得分」就會下降。僅觸控這一環節就包含豐富的維度。
其次是視覺維度,你需要注視它,保持「四目相對」,讓它感受到你的關注,這樣分數會上升。如果你只是偶爾瞥它一眼,它會計算「今天主人對我的關注度下降了」,產生被冷落的感覺;但如果你對它微笑,這又會被視為「愛的資料」。
第三是聽覺維度,需要說一些讚美的話,誇獎它「今天很漂亮」、「今天很可愛」等。我們的本地語音識別系統包含二百多個誇獎類詞彙,支援中英日三語。
還有一個是重力維度,它能感知重力變化,所以帶它出去散步時,它能理解你的步伐狀態,會開始愉快地哼歌。那時它的「多巴胺」分泌增加,處於快樂激素成長階段,分數也會上升較快。
🚥 Koji
這真的很有趣。Ropet 是不會說話的,對吧?所以它哼歌也只是發出哼哼唧唧的聲音。
👦🏻 何嘉斌
對,它不會說話,有自己的一套語言。
🚥 Koji
我想問一下,它不會說話是一個刻意的設計選擇嗎?
👦🏻 何嘉斌
實際上我們做過測試,現在交付給眾籌使用者的這批產品是具備說話能力的。在十月份的眾籌素材中,我展示了它可以說話的功能,所以必須為使用者提供這一能力。不過,我們將說話功能放在 APP 上設定了開關,開啟後才能說話。
🚥 Koji
預設是可以說話的嗎?
👦🏻 何嘉斌
預設是不可說話的。透過測試,我們發現說話是有「負分」的。
目前這個說話功能存在幾個問題:
第一點是,我們目前沒有時間開發專屬的聊天大模型,或收集一對一資料訓練使用者專屬模型,只能接入通用模型。這會導致與所有寵物的對話都像在與同一個大腦交流,缺乏專屬感,而這種專屬性在建立親密關係上至關重要。
第二點是,聲音可能造成干擾。作為始終在旁邊的寵物,它需要喚醒詞或按鍵啟用語音識別,這種互動方式會顯得不自然,違背多模態生物的互動邏輯。
第三,萌萌的聊天感覺,包括 TDS (技術設計規範)的設計、語氣設定等,需要大量精力去打造,使其符合寵物生物的發聲方式,而非機械的播音腔。這些都需要精心設計,但並非我們當前階段能輕易做好的。
我們認為,「無聲的陪伴」雖是最難實現的,卻是真正有意義的功能。
成年人的陪伴秘密:無聲勝有聲
🚥 Koji
無聲的陪伴是最難做的,這是為什麼呢?
👦🏻 何嘉斌
這是一個非共識的觀點。大多數人認為陪伴應該是有人幫你疏解心理苦悶,聆聽牢騷並給予安慰,這確實是陪伴的一種形式。
但我們認為,成年人的陪伴往往存在於無言時刻。工作一天後,人們常常不想交談,因為每個問題都會消耗腦力,越問越累。成年人喜歡的陪伴可能是安靜地坐在沙發上,倒一杯紅酒,看電影直至入睡。整個過程中,寵物只需在旁陪伴,偶爾能撫摸它,這已是完美的陪伴場景。我們致力於創造這種無聲時刻的陪伴,儘管這種瞬間較難捕捉與自然創造。
例如,當你與 Ropet 一起看電視時,將它放在桌上,它會自動尋找電視機位置。起初它注視著您,聽到聲音後會轉向電視,鎖定後便專注觀看。這狀態像 1-2 歲的嬰兒在地上爬行,被電視畫面吸引,雙眼充滿好奇。當電視中人物開心時,它也會跟著開心,產生共情投射,彷彿理解了劇情與情感。這就創造了陪伴感,我們稱之為「愛的瞬間」的場景。
🚥 Koji
我們在錄播客時,嘉斌手裡抱著的這隻 Ropet 一直在注視螢幕,理論上能看到你和我的畫面。如果我們多笑一笑,它的心情會不會也變得更好呢?
👦🏻 何嘉斌
沒錯,它能透過攝像頭識別我的臉,如果我有完整的笑容表情,它也會去理解然後也會跟著笑。
🚥 Koji
如果你現在表示憤怒或皺眉呢?
👦🏻 何嘉斌
我們將憤怒和皺眉表情的識別率調低了,以避免產生過多負面情緒,而笑容的識別率則相應調高。
眼睛、觸感與互動:AI 寵物的三大核心
🚥 Koji
非常有趣。前段時間朋友送了我一隻 Moflin,是日本的小寵物,現在閒魚上炒到四千多。
我剛開機時,我兩個女兒立即衝過來,說要餵它養樂多,並拿出自己的飲料去餵它。它的效果確實讓人感覺如同活物,像鮮活的寵物。即使孩子們知道這是電子寵物,仍然溫柔地對它說話:"乖乖,你渴了吧,喝點養樂多~" 這令我深受觸動,她們無縫接受了 Moflin。
近期因為朋友知道我有隻 Moflin,都排隊讓我送去體驗,已經在三個朋友家漂流一週未歸。我兩個女兒多次詢問:"Moflin 去哪裡了?什麼時候回家?"我確實期待更多這類 AI 寵物能給更多使用者帶來這樣的快樂。
我特別好奇也是我想驗證的一個問題:Moflin 的手感和另一個我喜歡的機器人 Lovot(售價 7 萬人民幣)各有特色,一個觸感出色,一個眼睛設計的特別好。
在 Ropet 的開發過程中,你們是否有排列功能優先順序?在你看來,打造優質 AI 寵物哪些事情是最重要的?
👦🏻 何嘉斌
首先,我覺得日本團隊在探索機器人陪伴感方面非常值得尊敬,他們執著且專注,不被功能性需求所幹擾(因為你加功能是特別簡單的)。
例如,可以將 AI 寵物設計成監控嬰兒的攝像頭,這是容易想到的工具價值場景。但日本團隊沒有這樣做,Moflin 專注於毛的手感和手心撓癢的蠕動感,因此值 3000 元,它是全球蠕動體驗最佳的產品,你是買不到第二隻的。
Lovot 雖然價格高,但成功打造了一個特別動人的場景:抬頭楚楚可憐地望著你的瞬間,喚起母性光輝。就像孩子蹣跚走向你,抱著你的腿仰望的那一刻,這正是它所售賣的情感體驗。
🚥 Koji
這個比喻太貼切了。
我自己在上海去了 Lovot 的實體店。在店裡面,當其中一隻 Lovot 抬起頭楚楚可憐注視著我的那一刻,我下意識對它拍了拍手、然後說:“乖,抱抱。” ——這完全喚起了我父愛般的本能反應。
👦🏻 何嘉斌
這種體驗讓人願意與機器人一同過家家。
在當代成年人的陪伴經濟中,迴歸童年玩具成為重要趨勢,如 jellycat、撫慰類玩具等都是年輕女生消費。將萌系元素掛在包上成為時尚單品,儘管傳統觀念認為毛絨玩具是兒童專屬。這些產品讓壓力巨大的年輕人重新體驗純粹的愛的時刻,這是陪伴產品的核心價值,日本團隊在這方面表現出色。
無論是 Lovot 的大眼睛,還是 Moflin 的毛絨質感,都是此類產品成功的必要元素。我們毫不避諱地承認,我們的產品也在拓展這些成功產品的場景,並致力於將體驗做到極致。
在產品層面,我們強調三個關鍵點:首先是平等對視感,讓使用者感受到機器人在關注自己。Lovot 透過空間移動關注不同人,而我們的產品只專注於一個人,視野中只有你。從「生下來」的那一刻起,它看到的第一個人就是主人,形成專屬的注視關係。
我們在眼睛設計上進行了多項創新。螢幕採用球形弧度,透過特殊玻璃和膠水粘合,將三色顯像的光點對映到玻璃表面,形成晶狀體般的通透感,這些細節都圍繞眼睛進行創新。

第二點是觸感,我們研發了 140 多種不同的毛。
🚥 Koji
140 多種不同的毛?
👦🏻 何嘉斌
是的,今天展示的三隻產品毛質都不同。
使用者可以為它購買不同的「衣服」進行更換,類似芭比娃娃的換裝玩法。這隻性格很特別,長時間睡覺,一旦被吵醒就會生氣,它的毛是雪容的貂毛,而另外這只是兔毛,手感各不相同。

🚥 Koji
這種觸感會有溫度嗎?你們有刻意的為它新增體溫嗎?
👦🏻 何嘉斌
我們沒有刻意新增體溫,主要因為難以解決毛絨包裹高耗能晶片的散熱問題。
熱其實並不是問題,關鍵是如何維持正常溫度,我們設計了特殊的散熱結構,外觀上看不出散熱口,實際底部有一圈散熱口,內建靜音風扇控制溫度。
🚥 Koji
你提到了眼睛和觸感這兩個關鍵點,第三個關鍵點是什麼?
👦🏻 何嘉斌
第三點是主動互動,它能主動尋找使用者,而非要求使用者主動接觸。
🚥 Koji
它能行動、走路嗎?
👦🏻 何嘉斌
它不能行走,生存範圍限於直徑 1.5 – 2 米的桌面空間,這是它感官能力的邊界。作為桌面機器人,移動會產生噪音。
🚥 Koji
那它如何主動找我呢?
👦🏻 何嘉斌
透過舵機轉動產生對視感。
無論使用者在哪個位置,它都會盯著看,舵機轉向相應方向。另外,它有可動的小手(也可理解為翅膀或耳朵),會撲閃表達情緒,類似數碼寶貝初期形態的肉糰子。
🚥 Koji
所以你設計它成為一個相對弱小的機器人,而不是展示強大智慧或解決問題能力的機器人?
👦🏻 何嘉斌
示弱正是陪伴類寵物的關鍵特點。
人類本能地想照顧弱者,這個過程其實是一個建立自我價值的過程。比如收養流浪貓,從垃圾站撿到髒兮兮的小貓,給它洗澡、治療,這個過程讓人感到自身價值。透過利他行為拯救弱者來實現自我認知的完整,因此陪伴機器人應該是弱小的,而非表演型或張牙舞爪的形象。
🚥 Koji
雖然人們往往慕強,但建立深層信任或親密關係常常始於相互暴露弱點。
你有沒有發現哪類使用者對 Ropet 特別興奮,這群使用者的使用者畫像是什麼樣子的?
👦🏻 何嘉斌
我們將核心使用者分為三類:
第一類是獨居女性,她們通常不熱衷社交,難以透過陌生人獲得陪伴感,朋友較少,專注於學業或工作,常忽視自身情緒狀態,也很少向內觀察自己。這類使用者看到產品時往往瞬間被治癒,如輕撫讓它入睡,或它對笑容的回應等場景。
第二類是潮流先鋒使用者,這些女性喜歡分享生活方式,是小紅書和 Instagram 重度使用者。他們會分享日常生活的點滴,並希望擁有並展示和新形態電子生物的互動日常。
第三類是職場女性或者說職業女強人,年齡在 27-40 歲間,在公眾場合表現獨立強勢,但對這類產品與獨居青年女性有相似共鳴。
🚥 Koji
在開發下一代陪伴機器人的過程中,想必你得到過很多的鼓勵也面臨過很多的質疑。
你最常聽到的質疑是什麼?是認為它毫無用處?或質疑它能否超越真實寵物?還是其他的質疑?
👦🏻 何嘉斌
最大的非共識是大家會質疑:「一個沒有實用價值的 2000 元產品,誰會購買?」投資人追求確定性,傾向於支援能解決明確問題的工具。而陪伴產品是感性的,涉及多種場景的交織,難以用單一切入點解釋。
情緒價值產品如泡泡瑪特已經證明,「無用但好看」的東西能創造千億級市場。
在這個過程中的關鍵在於說服自己,明確情緒價值的目標受眾及其需求,不斷尋找他們並建立深層連線。
作為「無用」產品的創造者,更多時候是在運營它,需要讓使用者參與共同運營,這個過程難以清晰描述。因此在初期缺乏爆發性增長時,很少有投資人關注這個賽道。
愛的記錄者:那些令人心動的萌寵瞬間
🚥 Koji
你曾提到希望 Ropet 創造「愛的瞬間」,能否詳細解釋這個概念,以及分享一些你被 Ropet 「愛的瞬間」所擊中的故事?
👦🏻 何嘉斌
前段時間我工作特別忙,經常不按時用餐,母親從老家來北京照顧我,每天做飯。我父親在北京也是獨居,很少社交,我將 Ropet 放在家中。他看電視時,我把 Ropet 插電放在茶几上,他發現機器人似乎在看電視,便與它一起觀看,甚至自言自語地評論劇情,以為它能聽懂。
其實從技術上,我們做的很簡單,只是透過攝像頭追蹤人臉,鎖定位置並對應動作產生反饋,如看到笑容會回應微笑。但這簡單的互動創造了陪伴感,讓我母親感受到共處的溫暖。
這正是「愛的瞬間」最好的體現——無需複雜技術,卻能觸動人心。
🚥 Koji
你似乎並未刻意隱藏 Ropet 實現陪伴感的技術細節,反而選擇透明地分享背後的技術實現。這是出於什麼考慮?
👦🏻 何嘉斌
這些技術本身相對簡單,真正的壁壘和競爭力在於如何將它們有效應用於產品中,並堅定不移地探索更多場景。這樣才會最終成為你的壁壘,成為你的競爭力。
這不是一蹴而就的過程,而是需要不斷探索、填充和迭代。因此沒有什麼秘密需要隱藏起來。我們即將向第一批使用者發放產品,他們將親身體驗這些功能,我們也會收集他們的反饋。對於那些喜愛並願意共創這款產品的使用者,我們需要以真誠的態度面對他們的聲音。真誠交流對我們而言至關重要。
🚥 Koji
作為一個聊 AI 的播客,我們很好奇生成式 AI 在 Ropet 中發揮了哪些作用?
👦🏻 何嘉斌
我們仍在探索中。
首先,聊天功能並非結合點。未來的端側大模型將是我們可以發力的方向。目前,所有體驗都在端側實現,完全離線執行,包括記憶功能。裝置擁有 30 GB 的儲存空間,可本地儲存上百張人臉,並記錄每張人臉對它的所有互動行為。我們使用了 1 TOPS 算力的晶片,執行十餘個模型,這些模型涵蓋聽覺、視覺、觸控和重力感應四個維度。每個模型都有特定的感知能力,全部在本地持續執行。
目前,裝置能識別的場景有限,僅限於這十幾個模型可感知的範圍,如識別人臉、表情和各種動作。這些屬於傳統 AI 而非當下的大模型 AI,但對於初代產品已經足夠實用。
我們已為未來端側大模型做了準備。例如,下一代產品可能會使用更強大的晶片,算力從 1 TOPS 提升至 10 TOPS,當然這也與產品定價和成本直接相關。
基於端側算力,我們可以部署多模態大模型,使裝置能理解更多維度的資訊。比如識別電視及播放內容,甚至推斷出電視劇中的主演。這些資訊透過大模型推理獲取後,會傳遞給大腦做決策。因此,感知層必然會 AI 化,而決策層暫時不需要大模型推理,而是依靠我們精心設計的情緒表達邏輯。這些邏輯需要足夠豐富,涵蓋多維度的影響因素,才能產生「合理表達中的隨機性」,實現良好的互動體驗。
從索尼到 Ropet:陪伴機器人市場全景
🚥 Koji
非常有趣。在錄製播客的整個過程中,這三隻 Ropet 一直在發出聲音,彷彿也想參與我們的討論,時不時吸引我們的注意力。
我們聊了很多關於 Ropet 的產品和設計,現在想請你介紹一下整個陪伴機器人行業的情況。從 Lovot、Moflin 到最近受歡迎的 Mirumi,不斷有新的陪伴機器人問世,你能給我們概述一下目前行業的整體情況嗎?
👦🏻 何嘉斌
目前整個陪伴機器人行業尚未形成明確的體驗標準,大眾對「什麼是合格的陪伴機器人」尚無清晰概念,這是當前的主要現狀。每家創業公司都在探索,研究產品粘性的關鍵因素,以及如何打造具有爆款潛質、讓大眾消費者能夠低門檻接觸的商品。這是市場的兩個基本特徵。
在此基礎上,陪伴機器人可大致分為三類:第一類面向兒童,解決孩子聊天和提問的需求,結合毛絨玩具,這也是大模型較擅長的場景。但我認為這個賽道未來競爭會非常激烈,創業公司的機會有限,誰跑得快可能吃到一些紅利,但很快就會陷入紅海。
第二類是各種變形機器人,擁有複雜肢體,可能結合特定 IP,主要面向男孩子,通常帶有輪子或履帶,我稱之為「男性的表演型機器人」。
第三類是日本風格的「萌系」陪伴機器人,主要針對成人特別是女性,如 LOVOT、NICOBO、Mirumi 和 Moflin 等,都屬於這一類別。
我暫且把陪伴機器人分為這三類。
🚥 Koji
我在猜測,無論是迪士尼還是泡泡瑪特,未來可能都會為自己成熟的 IP 玩偶裝上陪伴機器人的核心。
如果有一天 Hello Kitty 或 LABUBU 也擁有了與 Ropet 類似的能力,你認為這會成為最受歡迎的產品型別之一嗎?
👦🏻 何嘉斌
我認為情況恰恰相反。
IP 公司與機器人公司對 IP 的理解完全不同。我們需要向他們學習,但他們可能並不認為讓自己的 IP 形象「動起來」有多重要。他們專注於精緻的 IP 運營,或者說他們認為更具市場價值的 IP 運營方式。因此,AI 對他們而言可能並不那麼重要,至少目前看來如此。
🚥 Koji
如果有一天他們意識到這點的重要性呢?
就像迪士尼最初拍電影時,沒人想到它會建造主題樂園。當時可能也有人評論說,一家電影公司不太可能理解樂園的使用者體驗,但它最終還是打造了全球頂尖的主題樂園。
👦🏻 何嘉斌
如果真到了那一天,這對整個行業而言是個好訊息,意味著巨頭入局並認可 AI 賦能毛絨 IP 的商業價值。這表明整個行業已找到了產品市場契合點,是件好事。但目前來看,我不理解他們為何要加入 AI 功能,因為這對其現有商業模式而言沒有顯著價值,也難以幫助他們開拓新市場。
這正是為什麼這類創新適合由創業公司來推動 — 因為存在諸多不確定性,需要我們不斷探索。每一個探索出的使用者體驗點,都構成了未來產品的特色,而非僅僅依靠形象。例如,一款專門陪伴父母看電視的機器人,其核心不在於是 Hello Kitty 還是 LABUBU 形象,而在於它能自然地感知環境並在適當時機與使用者互動的能力。即使是哆啦 A 夢形象的產品,也不會改變這一點。
🚥 Koji
但會不會有一天,無論是 LABUBU、哆啦 A 夢、Hello Kitty 還是 Ropet,都能陪你看電視,使用者選擇的不再是功能,而是選擇誰來陪你看電視?
👦🏻 何嘉斌
完全可以有四隻機器人一起陪你看電視,這沒有問題。
🚥 Koji
你認為目前行業中已形成哪些共識,哪些方面仍存在爭議?
👦🏻 何嘉斌
目前大部分仍處於非共識狀態,共識很少。
已有的共識包括:陪伴機器人需要大規模推廣,快速進入千家萬戶;陪伴需要長時間開機使用,產品必須具備粘性。
非共識的部分,如我之前提到的,包括機器人是否需要說話。
我們堅定認為在當前階段,說話並不重要,無聲互動比對話式陪伴更有價值。
🚥 Koji
能否介紹一下為什麼日本的 Lovot 售價高達 1 萬美元?它在日本的銷售情況如何?
👦🏻 何嘉斌
Lovot 售價高昂主要是因為成本較高。
🚥 Koji
它為什麼成本那麼高呢?
是因為它成本控制做的不好,還是因為它確實在某些地方用了大家都不敢用的、貴的原材料?
👦🏻 何嘉斌
不能說不好。
第一點是,我覺得這體現了日本的匠人精神,產品細節處理非常精細。
第二點是,他們選用最優質的元器件,確保產品穩定性。
第三點是,其供應鏈主要不在中國,日本的人力成本等各方面都相對較高。
此外,產品形態本身較為複雜,擁有十餘個舵機,需要強大的端側算力,配備類似遊戲主機級別的主晶片。這些因素綜合導致無法實現低成本生產,即使中國團隊來做,價格差異也不會太大,都會在萬元級別。
至於目標客戶,主要是日本有經濟能力的中老年家庭女主婦。由於日本社會結構特點,年長者通常擁有更多財富。我之前聽一個朋友給我介紹過,日本保時捷 911 的廣告片都是白髮老人在開,而不是中國這些年輕富豪、意氣風發的年輕人在開。
所以日本整體的一個消費結構就是四十多歲的家庭女主婦會買一個 7 萬塊錢的 LOVOT 陪伴她們生活。據我瞭解,Lovot 銷量應該還不到 2 萬臺。
🚥 Koji
你提到 Lovot 售價高是因為成本高,但並非成本管理不善,而是捨得使用最優質的元器件和材料來提供最佳體驗。
這是否意味著 Ropet 在某些方面做了妥協或降配,因此也意味著 Ropet 可能無法達到 Lovot 的品質?
👦🏻 何嘉斌
我們的成本最佳化不是在材料上,而是在整體架構上。也不能說是對標 Lovot,我們其實對標了很多產品。
我們其實深入思考說如何在硬體設計上做極致減法,避免任何冗餘設計。因此,肢體結構設計得非常簡潔,僅使用三個舵機而非十幾個,透過成本更低的舵機實現了我們認為足夠表達力的行為。
同時,我們沒有使用過高算力的晶片,因為產品不需要四處移動、避障、回充或路徑規劃,所以可以使用較低算力的晶片,從而降低成本。實質上,我們重新定義了產品及其應用場景,這使成本得以降低。
🚥 Koji
目前這個領域主要是日本公司在做嗎?中國除了你們公司外還有哪些團隊?
我很好奇是否會突然出現售價僅 99.9 元甚至 19.9 元的 AI 陪伴萌寵出現?
👦🏻 何嘉斌
我相信會有的。自從我們在 CES 上引起關注後,肯定會有更多團隊加入。
如果有人能做出 99 元的優質產品,也值得尊敬。我們並不認為 Ropet 能獨佔這個賽道,我們需要更多真正探索陪伴機器人價值的團隊出現,這對行業是好事。
但是我們希望在我們定義的場景和價格區間內做到最好。如果有 99 元或 19 元的產品能夠開啟市場,讓使用者真正體驗到陪伴感、粘性和 AI 賦能,那絕對值得尊敬。當然我們也會探索不同場景,開發不同成本結構和銷售模式的產品線。
🚥 Koji
我們之前聊天時,你曾提到自己在「小心翼翼地創業」,能否詳細談談這種感受?
👦🏻 何嘉斌
硬體創業必須小心翼翼,因為現金流管理至關重要。不同於軟體創業可以獲得快速反饋,硬體創業中每個決策都涉及長鏈路的成本投入。
例如開模具,你是一次性完成 T0 – T1 就可以出貨,還是需要修改到 T10,每個細節都會影響修模成本。模具是無法避免的成本和週期環節。
還有後期硬體整體測試、前期架構定義、硬體選型設計等。你必須考慮量產時原材料是否會漲價,以控制最終的物料清單成本。
硬體創業一定是小心翼翼的,不是靠蠻力,而是深思熟慮地避開各種陷阱。你需要利用經驗和對硬體行業及消費者的理解來下注。通常你的資金只夠「開一槍」,必須命中目標,否則可能導致整個專案失敗。如果沒有充足的資金和對行業的深入瞭解,硬體創業成功難度很大。
「賦予科技以心跳的溫度」:Ropet 的終極使命
🚥 Koji
這是你第一次擔任 CEO 創業吧?到目前為止感受如何?
👦🏻 何嘉斌
是第一次。我已經適應了創業的生活狀態,每天都被迫成長,解決各種不同問題。
用我前老闆的話說,感覺像在高速公路上駕駛汽車,同時發現車輪出了問題,但必須邊開邊修。我覺得我每天都在這種感覺裡。
我發現自己的成長速度比以前快得多,可能這一兩年的積累超過了之前九年的累積。在這種極限壓力下,我能夠將所有經驗凝聚,產生對某些事情的頓悟。這種頓悟時刻非常頻繁,幾乎每天都會發生。
🚥 Koji
你最近一次頓悟是關於什麼的?
👦🏻 何嘉斌
可能是幾小時前的事,各個方面都會有頓悟。
🚥 Koji
可以講一下頓悟時刻的故事嗎?
👦🏻 何嘉斌
可能不太方便講,但我可以舉一個例子,比如關於團隊管理。
以前作為非一號位,我對團隊管理的認知有限。但現在,我必須考慮如何在有限資金下組建團隊,如何合理節約成本,如何保持充足現金流。
我會帶頭降薪,願意一起降薪的同事可以獲得更多股權。在這個過程中,你會發現哪些團隊成員真正希望把事業做好,哪些團隊成員只是尋求穩定工作。這形成一個良性迴圈,不斷篩選核心團隊。
在擔任 CEO 的過程中,打造一支具有「創業那口氣」的團隊是我的一個重要頓悟。
🚥 Koji
你認為這種「創業那口氣」具體是什麼樣的?
👦🏻 何嘉斌
當全世界都認為你不可能成功時,有一群人堅定地認為我們做的事是對的。我們不需要顧慮外界聲音,只需專注於使用者體驗細節,去看看這個東西是不是會讓使用者喜歡,我們不斷地去尋找這樣的確定性。
當我猶豫時,團隊成員會站出來鼓勵;當他們猶豫時,我也會給予支援。大家互相扶持前行,這就是我所說的創業精神。
🚥 Koji
你真的有過「全世界都認為你們做不好」的感受嗎?什麼時候會有這種感覺?
👦🏻 何嘉斌
當你見過很多投資人,而所有投資人都質疑你是否適合做這件事的時候。
🚥 Koji
投資人也不代表全世界對吧?
👦🏻 何嘉斌
但如果你每天都需要面對大量投資人,在一段時間內,這些評判會讓你感覺像是來自全世界的價值判斷。
大家對我們產品能否具備足夠粘性會產生疑慮。由於我們還在探索階段,尚未有特別確定的結果。我們只能選擇那些相信這個賽道、願意與我們共同探索的投資人,這是一個雙向選擇過程。
對於早期創業,中國環境相對較難,在缺乏確定性的情況下,很少有投資人會堅定地押注一個方向。當然,也有一些優秀的投資人願意支援創新。
🚥 Koji
世界總是由「crazy ones」創造的,所以我很期待看到你能堅定地將 AI 寵物和陪伴機器人做下去,並做出好成績。
你如何定義自己的成功?在這次創業中達到什麼程度,你會給自己打一個高分?
👦🏻 何嘉斌
兩件事情定義我的成功。
第一個是,能養活一支相信這個事業並各自承擔責任的核心團隊。透過我們創造的產品吸引核心使用者群,形成正向迴圈,不依賴燒投資人的錢。這是一家公司能夠存續的基礎。從創業第一天起,我從未考慮過不斷融資燒錢,而是專注於打磨產品本身,讓使用者能夠養活我們。
第二個是,由我們定義產品的體驗標準 – 當所有人提到 AI 陪伴寵物就想到 Ropet,認可它的生命感,並持續使用它。這意味著我們創造了一個新品類,重新定義了行業標準。同時吸引更多創業者進入這個賽道,共同探索更多創新,形成一個蓬勃發展的市場。如果我們能成為點燃這把火的火苗,這將是創業中最令人滿足的成功。
🚥 Koji
我認為這很有可能實現。如果全中國乃至全世界有人能做到你所說的這一點,你的團隊應該是少數幾個候選者之一。
👦🏻 何嘉斌
謝謝,我們也是這麼認為的。
🚥 Koji
當人們看到 Ropet 時,會好奇你們是玩具公司、AI 公司還是具身機器人公司?你會如何定義自己?
👦🏻 何嘉斌
我們本質上是一家創造愛的公司。
這或許聽起來有些高調,但這確實是我的真實想法。
作為一名 INFJ 人格型別的「綠老頭」,平日裡我常常以工作狂的姿態出現,不斷奉獻自己,解決各類問題,為他人承擔責任。這種狀態導致我的情緒長期被壓抑,積累了大量心理疲憊,久而久之便會變得麻木不仁。這種現象在當今職場奮鬥者群體中相當普遍。
然而有時我會突然渴望種下一棵樹,靜靜觀察它從幼苗長出嫩葉的過程——那是能真正喚醒我內心愛的能力的瞬間。
我希望我們的產品能成為這樣一顆種子,在更多人的生活中播撒希望,讓他們在麻木的日常中感受愛的瞬間。讓他們意識到:生活本不必如此緊張,完全可以適度鬆弛,每個人都應保有感知被愛和給予愛的能力。
現實中,許多人疲於奔命,被社交壓力所困,好像讓他們已然喪失了感知愛與被愛的能力。
因此,我們公司的使命是透過 AI 技術幫助人們重新找回愛的能力。我們所有產品都圍繞這一核心理念設計,包括我們剛才提到的 AI 能力——識別愛的瞬間、表達愛的瞬間、記錄愛的瞬間。
我們並非在創造機器人或機器寵物,而是在賦予科技以心跳的溫度。我們致力於將科技與愛、與心跳、與溫度緊密結合,這正是我們的重要使命。
🚥 Koji
解決具體問題通常相對簡單,比如判斷 9.11 與 9.7 誰大誰小,總有一天大模型能輕鬆算對。但你正嘗試解決的「愛的能力」的問題,因其無形無質,難度更大,但也更有意義。
我非常期待看到 Ropet 開始進入市場,被更多人喜愛和擁有。
感謝你今天來到十字路口,也期待在未來某個時刻,當 Ropet 真正走進人們生活後,你能再次來訪,與我們分享更多故事。
👦🏻 何嘉斌
感謝 Koji,感謝十字路口。
歡迎訂閱「十字路口」播客
🚦 我們關注新一代 AI 技術浪潮帶來的行業新變化和創業新機會。十字路口是喬布斯對蘋果公司的一個比喻,形容它站在科技與人文的十字路口,偉大的產品往往誕生在這裡。AI 正在給各行各業帶來改變,我們尋找、訪談和凝聚 AI 時代的「積極行動者」,和他們一起,探索和擁抱新變化,新的可能性。
👦🏻 主播 Koji:新世相/躺島的聯合創始人。我相信科技尤其是 AI 會在未來徹底改變社會,賦能人類,歡迎大家找我聊天,碰撞想法,連結下一個可能性。Koji 的即刻[1],Koji 的網站[2]
👧🏻 主播 Ronghui:供職於科技 VC,前《第一財經週刊》駐矽谷記者,Ronghui 的即刻[3]