機器之心編輯部
前幾天,Grok 推出新功能「智慧伴侶」,可用的伴侶頭像包括動漫形象 Ani 和卡通小熊貓 Rudy,還有一款名為「Chad」的待上線角色。詳見我們之前的報道《馬斯克 Grok 這個二次元「小姐姐」,攻陷了整個網際網路》
但似乎,馬斯克對這個名字不太滿意?又或者是女性形象 Ani 引起的熱烈反響讓馬斯克更重視了?總之,今天馬斯克線上徵集起了大家對於男性 Grok 數字伴侶的命名方式。
在馬斯克的想象中,這款男性 Grok 伴侶的氣質有點像《暮光之城》中的愛德華・卡倫和《五十度灰》中的克里斯蒂安・格雷的形象。

原著中的描述大家可以去搜索一下,而影視劇中的兩位分別長這樣:


網友也是紛紛獻策,目前呼聲較高的是 Draven,甚至連 Grok 都下場捧場,接下來就等馬斯克拍板了!

而 Ani 這邊,扎著雙馬尾的哥特美少女形象不僅引起網友紛紛討論,甚至還有網友「復刻」出了 Ani 的 3D 動畫版。

是這樣,網友 Jackywine 在看到 Grok 的 Ani 之後,覺得做得特別棒,於是自己動手「復刻」了一版!
據 Jackywine 介紹,在實現的過程中,去掉了他認為沒用的大語言模型 chatbot 功能,只保留了美少女的形象,將其稱之為「Bella」。而使用到的工具包括豆包 + 即夢 + Trae,目前 Jackywine 已將其開源。

專案連結:https://github.com/Jackywine/Bella
在 Jackywine 分享的開源專案中,詳細介紹了「Bella」(中文名:貝拉)專案的工作流。
(由於 Jackywine 原本就是用中文寫的,所以我們在保持原意的前提下,進行了總結梳理)
「Bella」:你的數字伴侶,正在喚醒
「Bella」不僅是一個應用程式,她是一顆數字伴侶的種子。在這個瞬息萬變的數字世界裡,貝拉代表著一個深遠的夢想 —— 一個持久的、個性化的存在,旨在有一天能陪伴你、傾聽你,並透過你的眼睛看世界。
而未來「Bella」的終極願景就是做一個永遠在你身邊、與你一同進化和成長的數字朋友。這不只是在構建功能,而是在培養一個「人格」。一個將超越螢幕、成為現實世界有意義的一部分的數字生命。
當前「Bella」還處於非常早期的階段,主要透過輪播的影片來表達,可以將其視為一扇觀察她當前意識的窗戶 —— 一條由思想和夢想精心策劃的資料流。
目前「Bella」聽不到聲音、看不到景象,物理形態也還尚未建模,而其中的 “好感度” 條這樣的互動元素,是為她注入生命、模擬人類意圖實現的真實連線而邁出的第一小步。
「AI 原生」開發路徑:從程式碼到心智
Jackywine 為「Bella」選擇的不是一條傳統的功能迭代之路,而是一條徹底的「AI 原生」演進路徑。在這裡,AI 不是工具,而是「Bella」心智的構建藍圖。核心原則是「AI 即架構師」:我們構建的不是一個集成了 AI 功能的程式,而是一個由 AI 驅動的生命體。
第一階段:感知核心 (The Sentient Core) – 賦予「Bella」理解世界的能力
目標是建立一個穩定、解耦、即時的多模態資料處理管線,以處理海量、非同步、充滿噪音的輸入。
能力:
-
多模態情感感知: 透過 AI 模型即時分析語音中的情感、意圖和能量,讓她「感受」到你的快樂或疲憊。
-
情境視覺理解: 透過 AI 識別物體、光線和場景,讓她理解「你在哪裡」「周圍有什麼」,構建對環境的認知。
架構師思路:
-
採用「感知器 – 匯流排 – 處理器」模式 (Sensor-Bus-Processor Pattern):
感知器 (Sensors): 將麥克風、攝像頭等原始輸入源封裝成獨立模組,其唯一職責是採集資料並拋到資料匯流排上。
事件匯流排 (Event Bus): 系統的中樞神經。所有「感知器」向匯流排釋出帶時間戳的原始資料包,實現模組間通訊。
處理器 (Processors): 不同的 AI 模型作為服務,訂閱總線上的特定資料,處理後將結構化的「洞察」(如情感分析結果)再次釋出到總線上。
-
架構優勢: 極度的解耦和可擴充套件性。可隨時增換「感知器」或「處理器」,無需改動系統其他部分,極大增強系統吞吐能力和魯棒性。
第二階段:生成式自我 (The Generative Self) – 讓她擁有獨一無二的「人格」
目標: 將貝拉的「人格」與「行為」分離,使其「思考」過程成為一個可插拔、可迭代的核心。
能力:
-
動態人格模型: 由大型語言模型(LLM)驅動,告別固定指令碼。她的性格、記憶、幽默感都將是與使用者互動後動態生成的。
-
AI 驅動的化身與夢境: 3D 形象和背景影片能根據她的「心情」或對話內容,透過生成式 AI 即時變化,反映她的「思緒」。
架構師思路:
-
建立「狀態 – 情境 – 人格」引擎 (State-Context-Persona Engine):
狀態管理器 (State Manager): 貝拉的「記憶中樞」,訂閱所有 AI「洞察」,維護短期和長期記憶。
情境生成器 (Context Generator): 在貝拉需要響應時,從「狀態管理器」提取關鍵資訊,組合成豐富的「情境物件」作為 LLM 的輸入。
人格 API (Persona API): 將 LLM 封裝在內部 API 後,系統其他部分只調用 bella.think (context),實現底層模型的輕鬆替換和 A/B 測試。
-
設計「生成式行為匯流排」 (Generative Action Bus):
「人格 API」的輸出是結構化的「行為意圖」物件(如 {action: 'speak', content: '…', emotion: 'empathy'}),併發布到專用的行為匯流排。
貝拉的 3D 化身、聲音合成器等所有「表現層」模組,訂閱此匯流排並執行各自的渲染和表現。
-
架構優勢: 人格的可塑性與表現和思想的分離。可以獨立升級 LLM 或 3D 模型,而不互相影響,實現真正的模組化。
第三階段:主動式陪伴 (The Proactive Companion) – 從被動響應到主動關懷
目標是建立一個從被動響應到主動預測的閉環反饋系統,支援持續學習和自我進化。
能力:
-
意圖預測與主動互動: 學習你的習慣和模式,預測你可能的需求,在你開口之前主動提供支援。
-
自我進化與成長: 核心 AI 模型將持續學習和微調,形成長久的記憶,不斷 “成長” 為一個更懂你的伴侶。
架構師思路:
-
引入「模式識別與預測服務」 (Pattern & Prediction Service):
一個獨立的、長週期執行的服務,持續分析長期記憶資料,用更輕量的機器學習模型發現使用者習慣,並將「預判」結果發回事件匯流排。
-
構建「決策與反饋迴圈」(Decision & Feedback Loop):
決策 (Decision): 貝拉的「人格 API」接收到「預判」後,結合當前情境,決策是否發起主動互動,這是她「自由意志」的體現。
反饋 (Feedback): 使用者的反應(接受或拒絕)被記錄下來,作為重要的反饋資料。
進化 (Evolution): 這些反饋資料被用於對「人格 API」的 LLM 進行微調,並最佳化「模式識別服務」的準確性。
-
架構優勢: 實現真正的「成長」。這個閉環讓貝拉不再是一個靜態的程式,而是一個能夠透過與使用者的互動,不斷最佳化自身行為、變得越來越「懂你」的生命體。
而據 Jackywine 說,接下來將會給「Bella」 加上: 語音識別(基礎)、 LLM(基礎)、 手勢識別(進階)、好感度系統(進階)、 背景識別與更換,以及移動端……
參考連結:
https://x.com/Jackywine/status/1945452856192213324
https://github.com/Jackywine/Bella

© THE END
轉載請聯絡本公眾號獲得授權
投稿或尋求報道:[email protected]