當AI有了溫度,2700萬聾啞人群重獲新「聲」

除了用“算力、演算法、資料”來訓練、評估AI,還可以有什麼指標?
AI應用除了“效率、娛樂”,還有沒有更貼近本質的應用?
除了利用“人性之惡”以外,有沒有更向善的方式,取得AI產品的成功?
這些是我一直思考的問題。
也許,科技不僅是“技術先鋒”的特權,更是幫助普通人的良藥。最需要AI的,恰恰是看起來距離AI最遠的人群……
官方資料顯示,中國殘疾人有近一個億,聾啞人數量超過2700萬,而實際人數只會遠比統計數字更多。
之前我花了很大精力,研究日本人工智慧、機器人在老年陪伴、健康養護相關的應用;而今天我非常欣喜,因為看到了國內已經有做得更好的產品。
DUIX.AI讓聽障人群重獲新「聲」
前段時間在2024年的WWEC教育者大會上,最令我印象深刻的是兩位聾啞使用者的故事。
男生使用者是殘聯聾協的副主席,自己也是一位聾啞人,他透過DUIX.AI這款產品的AI分身技術,第一次體驗到彷彿“影分身”般的奇蹟:耳聽八方,能說會道。
對於他而言,雖然之前也嘗試過各種高科技輔助裝置,但在日常生活中,依然很難正常高效地與人溝通。
“聾啞人群日常最大的障礙就是溝通,就像我要去銀行辦理個普通業務,都是非常困難的事,而AI分身可以幫我無縫和這個世界交流。”
而DUIX.AI,則是新近釋出的插上了“AI翅膀”的產品。它不僅僅是一個工具,更是通向無障礙交流的橋樑,讓這位殘聯聾協辛勤工作的年輕人,得以在生活和工作中實現從未敢想的溝通自由。

除了聾協的工作,這個看起來陽光年輕的大男孩,還是一位熱愛生活的“無聲”咖啡師。藉助DUIX.AI數字分身的表達,做咖啡這件事也變得更加有趣、更加有溫度。
現場男生的AI分身表示:“我相信這項技術會給更多殘疾人帶來希望和便利,讓我們能更平等地參與社會生活。”
“她就好像平行宇宙中的另一個能講話的我”。
另一位女生聾啞使用者,是國家及省殘運動會的多次金銀獎得主,也是長春大學的畢業生。
把DUIX.AI的AI分身比做她的“翻譯官”,成為了她和這個世界連線的紐帶。

2024WWEC教育者大會現場

女生在現場表示,“AI分身就像一個具象化的投射——一個在現實中無法發聲,但在虛擬世界中能以她的身份與他人溝通交流的另一個自己。”
這個分身讓她能夠突破語言的障礙,將內心的情感、思想以及她對生活的理解清晰地傳達給周圍的人,成為她與世界連線的紐帶,讓她在無聲的世界裡,也能透過這個“平行宇宙中的我”發出有力的聲音。
當主持人問及第一次透過AI正常交流的感受時,女生透過大螢幕上的AI分身,激動地說:“那一刻我感到無比激動和驚喜,彷彿打開了一個全新的世界。”

DUIX.AI可以自由定製分身
為什麼是DUIX.AI這款產品
有的產品是為了“殺時間”,而有的產品是為人“更好地活”。
只有少數AI產品能讓生活變得更美好,而DUIX.AI正逐步成為這樣的一個突破性應用。
大會上聽了兩位聾啞使用者的故事以後,我不禁對背後的產品非常好奇:DUIX.AI還有哪些功能,是用什麼技術手段實現的?
原來,DUIX(Dialogue User Interface System)是「矽基智慧」這家公司的核心作業系統,這個名字對標了歷史上最偉大的作業系統之一:UNIX。
DUIX作業系統的核心能力就是傳遞知識,從技術棧的角度看,它集成了STT(聽寫),LLM(文字大模型),TTS(發音),CV(機器視覺),數字人等多種AI技術,是人工智慧的集大成者。
這次被用於幫助聽障人士就是它的一個落地方向——透過AI幫助實現智慧對話。
憑藉“真人級”的互動體驗和AI智慧體克隆技術,DUIX.AI不僅讓2700萬聾啞人群體重新找回了與世界對話的能力,也為AI情感陪伴領域樹立了新的標杆。
自DUIX.AI在北美、歐洲及日本市場上線以來,使用者註冊數已突破100萬,真正幫助數以百萬計的殘障人士開啟新的人生體驗。 

來自DUIX.AI官網
這款由矽基智慧開發的產品,不僅為聽障人士提供了前所未有的溝通能力,更透過其技術實力展示了人工智慧在人類生活中的無限可能。
DUIX.AI的核心功能之一是「定製數字分身」。透過簡單地上傳一段個人影片,使用者便能獲得一個獨一無二的數字分身。
對於聽障群體來說,這項技術尤其具有革命性意義。他們不僅可以透過聲色俱全的短影片自由表達思想和情感,還能在日常訓練中不斷最佳化這個分身,使其更加符合自己的性格和特點。

這種技術帶來的不僅僅是便利,更是對聽障人士表達能力的極大增強,讓他們可以用“自己的聲音”發聲。
除此之外,DUIX.AI還支援即時影片交流。
透過面對面的沉浸式互動體驗,聽障人士能夠更加自如地參與到日常對話中。這一功能不僅幫助了大會上的兩位聽障青年代表,也將在未來為更多有需求的人士提供無障礙的溝通渠道。
值得一提的是,DUIX.AI還提供多重身份的「智慧體選項」——使用者可以選擇數字助理、健身教練等不同角色,甚至還能與歷史名人進行對話。
這種多維度的陪伴,既能滿足日常生活中的陪伴需求,又能作為使用者的知識寶庫,支援隨時互動。

在DUIX.AI中與馬斯克互動

模型設計與技術路線
DUIX.AI的技術亮點主要依託於其強大的核心技術平臺。
「炎帝大模型」是矽基智慧引以為豪的多模態行業大腦。
這款大模型不僅融合了數字人大模型、聲音大模型、文字大模型、影像大模型等技術,還透過深度學習的多層神經網路結構,實現了對複雜文字的理解,並能高效準確地生成包含數字人、聲音、畫面等內容的影片。
這一技術已廣泛應用於知識生產、知識傳播、知識創作等多個領域,併成功克隆了超過50萬名律師、老師、醫生、企業家和博主等數字人,實現了AIGC產品在多個商業化場景中的應用落地。

DUIX.AI在海外也廣受好評
矽基智慧創始人司馬華鵬,在大會上詳細介紹矽基智慧在“數字永生”方面的探索。他指出:“透過AI技術,我們能夠克隆逝者的形象、聲音和思想,使其實現‘數字永生’。去年到今年,矽基智慧已經克隆了上千個名人,包括梅蘭芳和聞一多。”
“我們還幫助了一位南京的律師談先生AI復活,他曾歷時八年幫助一名南京大屠殺倖存者對日本政府提起國際訴訟,最終贏得勝訴,成功捍衛了歷史真相。今年清明節,我們透過AI技術讓他在數字世界中復活,這不僅是對他個人的致敬和緬懷,更是對民族精神傳承與延續。”司馬華鵬現場說道。
此外,DUIX.AI還配備了MOTM-X和EMOTE-X兩大深度學習模型。
MOTM-X模型能夠精準模擬人類的肢體動作。無論是在虛擬社交、影片生成還是虛擬主播等場景中,都能帶來高度逼真且互動性極強的數字人體驗。這個模型不僅能透過文字驅動生成豐富的肢體動作,還能透過影片驅動精確模擬樣本畫面。
而EMOTE-X則賦予了DUIX.AI智慧體對人類情緒的細膩表現能力。透過對使用者文字輸入的分析,EMOTE-X能夠動態調整AI角色的表情和語調,使互動更加自然、富有情感。這使得DUIX.AI在情感表達上遠超同類產品,提升了使用者的沉浸感和情感共鳴。

為什麼是矽基智慧
我在2022年之前就有過接觸矽基智慧,後來在香港做AI定製服務的創業,更是對矽基智慧旗下的產品有了很多好感。
成立於2017年,在全球AIGC數字人模式上都是首創者,矽基智慧在行業中扮演著定義標準的角色。公司迄今為止已擁有120件授權專利。經過騰訊、招銀國際和紅杉資本等九輪融資,展現了其在人工智慧領域的強大影響力和創新能力。

除了數字人、智慧體等應用形式,對於殘障人士更精準、更有溫度的關懷,是我感到差異化的亮點。

比如AI盲人眼鏡,是矽基智慧在成立之初就推出的產品。
創始人司馬華鵬強調:“大模型的多模態能力已經可以識別圖片和影片,並與眼鏡結合,為盲人提供極大的幫助。中國目前有近 1700 萬盲人,這款盲人眼鏡已經升級為第二代,利用多模態的炎帝大模型能夠識別上萬種物體,成本僅約200美元左右,相比海外同類產品價格降低了約70%。”
用AI滿足人性的負面,某種程度上是今天諸多AI應用的商業密碼。
從成癮性誘導、到倫理道德的邊緣,用技術走鋼絲註定難以長久。
但矽基智慧選擇了一條更漫長、更向善、更注重底層技術積累的道路。

就像教育領域,矽基智慧打造的VPPT.AI,利用AI大模型克隆老師來講課,目的是促進鄉村教育的發展,讓偏遠地區的學生享受到優質的教育資源。
比如,將《紅樓夢》匯入大模型,讓一個虛擬老師來講解這部經典文學作品。目前,大模型已經能夠生成一個AI教師,並將龐大的文件轉化為可檢索、可描述和可表達的教學內容。
我一直期待,AI更加成為一件普惠、向善的事,在社會的側面和邊緣處,創造屬於科技的價值。
而今天,從DUIX.AI產品的落地,我看到了更多AI美好應用的可能。
有期待、有興趣的朋友,不妨下載DUIX.AI,親自去試一試~👇
https://apps.apple.com/app/id6451088879

參考閱讀:
新鮮真話,關注一下👆
朋友圈會發一些具體的案例和商業化日常~ 
AI交流,歡迎加我本人微信:FrankGPTs

相關文章