
文/VR陀螺 萬里
今年Connect大會上,扎克伯格丟擲了一個有意思的話題:“讓我特別感興趣的一個領域是,如何將AI的進步與下一代計算平臺相結合。”
伴隨著因ChatGPT爆火而引發的新一輪熱潮,AI開始加速與千行百業融合,如今年三月微軟宣佈將GPT接入Office辦公套件,谷歌將其AI助手Bard整合到谷歌日曆等應用全家桶中等。
同樣,對於AR或者是其他可穿戴式裝置而言,AI也成為了其不可或缺的賣點之一。本文將對目前AR眼鏡上的主流AI功能進行盤點,一窺技術發展趨勢。

以AI驅動的可穿戴式裝置,圖源:Humane
Meta AI引入智慧眼鏡;ARKnovv A1支援AI三件套
早在GPT爆火之前,VR、AR產品中已經出現了很多有關AI的用例,如結合了AI演算法的手勢識別、基於AI預測使用者的全身追蹤等。不過這些功能多停留在使用者無法直接感知的隱性層面。現如今隨著LLM、AIGC等技術的發展,AI進一步走到了臺前。
以Meta最近釋出的新一代智慧眼鏡產品Ray-Ban Meta為例,它與老款產品比較重要的差異點在於,產品正式實現了對Meta AI的支援。
Meta官網指出,Meta AI由Llama 2大模型驅動,並與微軟Bing搜尋引擎達成了合作,目前已經可以透過Instagram、WhatsApp等Meta社交平臺進行訪問。
今年Meta Connect期間,扎克伯格對於Meta AI進行了演示(基於其社交APP),Meta AI具備很強的上下文理解能力,可以快速響應使用者的各種提問。此外,它還集成了Meta的AI影像生成工具Emu,可以基於使用者的需求生成相應的圖片。

圖源:Meta
除應用於自家社交平臺,Meta AI還搭載到了自家的硬體產品Ray-Ban Meta中。由於Ray-Ban Meta並沒有配備螢幕,所以只能以語音的方式輸出,這使得它並不能承擔太多複雜的工作。基於釋出會演示,Meta AI的作用主要體現在兩方面:一是偏向於功能互動的場景,如透過語音命令拍攝照片,透過語音將圖片影片分享到Messenger等;二是充當一個類似於ChatGPT式的AI助手的角色,使用者可以與之進行閒聊、詢問出行建議等。
除Meta AI外,扎克伯格透露明年將會為Ray-Ban Meta新增更多AI的能力,如使用者在旅遊時可以透過AI詢問眼前建築的具體資訊;協助翻譯外語廣告牌上面的內容、詢問水龍頭的一些維修建議等。
Ray-Ban Meta AI功能的落地離不開新處理器驍龍AR1 Gen1的應用,據瞭解,該處理器可實現眼鏡側AI,這使得硬體廠商可以在眼鏡中接入系列AI模型。高通官網指出,驍龍AR1 Gen1搭載了第三代Hexagon NPU和用於視覺分析的AR級引擎,可用於增強影像和音訊質量、視覺搜尋、即時翻譯等。
近日,雷鳥創新官宣了其下一代AR眼鏡新品雷鳥 X2 Lite,產品同樣搭載驍龍AR1 Gen1,具備更強的AI能力也是產品的重要賣點之一,產品可實現即時翻譯、智慧出行建議等AI功能。

圖源:Meta
除Ray-Ban Meta以及雷鳥X2 Lite,今年以來發布的大多數AR眼鏡產品均配備了AI相關能力,比較典型的是致敬未知於今年7月釋出的ARKnovv A1。致敬未知創始人吳德周曾表示,“AI和AR的結合一定是方向,我們希望能夠深度結合AI,讓AR眼鏡真正能夠成為更有效率、更好玩的工具。”
產品定位方面,ARKnovv A1與Ray-Ban Meta有較大不同,前者採用分體式設計,但是補充了雙目Micro-OLED螢幕。此外,前者配備了單目攝像頭,但並不聚焦於拍照攝影,而是用於實現SLAM等相關玩法。
在AI功能方面,ARKnovv A1分為了三大塊:基於AI大模型驅動的語音助手、藉助攝像頭以及CV實現的現實大爆炸(可識別建築物、植物、餐廳等)以及基於開源繪圖大模型Stable Diffution打造的AI圖生圖功能。

圖源:致敬未知
近日,李未可CEO茹憶公佈了其下一代AR眼鏡李未可Meta Lens S3。茹憶認為,當下AI在互動計算平臺領域的重要性越來越突出,AI互動能力將成為AR眼鏡的核心能力。
產品方面,李未可團隊正在將AI大模型深度整合到AR眼鏡中,AI模型採用“重雲輕端 雲端一體”的搭建模式,雲端構建以認知、推理、服務、任務等模型為基礎的AI大腦,並即時響應AR終端的使用者需求。
除增強現實、AI如何賦能產品構建更前沿的生活方式
可以發現,如何結合AI為使用者提供更加高頻更加有趣的玩法已經變成了如今AR/智慧眼鏡產品所探討的重要議題。不過由於產品多聚焦於大眾消費市場,使得功能也相對趨同,當然也有廠商試圖從中挖掘更加垂直化的用例。
如海外企業Envision專門面向視障群體開發了一款眼鏡產品Envision Glasses。該產品基於Google Glass Enterprise 2開發而來,產品搭載驍龍XR1,配備800萬畫素攝像頭。由於產品面向視障群體,它更依賴於AI所支撐的環境感知以及理解能力,而螢幕或者AR反倒成為了無關緊要的功能。
以下是Envision Glasses所對外展示的一系列用例:
-
可以掃描書籍、信件等手寫或印刷文字資訊並透過語音的方式向用戶播報,它可識別超過60種語言; -
藉助攝像頭進行第一視角的通話; -
從一堆白色的衣服中挑出紅色的襪子,判斷室內的燈是否亮著; -
識別親人朋友等,提醒使用者打招呼。

圖源:Envision
值得一提的是,Envision的前身是一家OCR和物體識別應用開發商,2017年,企業上線《Envision AI》APP,該APP同樣瞄準了視障群體。Envision Glasses需要搭配其手機APP使用,官網指出眼鏡在正常情況下可提供約5-6小時的使用時長。

圖源:Envision
扎克伯格曾表示眼鏡將會是AI最佳的硬體載體之一,因為眼鏡能夠見你所見、聽你所聽,很好洞悉使用者的一切。不過,這並不只是當前的唯一解。
今年9月底,The Information爆料稱,OpenAI CEO Sam Altman、軟銀集團CEO孫正義與前蘋果首席設計師Jony Ive進行了洽談,三方或將成立一家專注於研發新一代AI硬體的新公司,不過對於AI時代下的新硬體究竟會是什麼樣子,目前他們仍沒有達成共識。
10月中旬的WSJ公開採訪中,Altman曾表示AI 時代下計算機可以獨立思考,所以什麼樣的硬體都有可能,它或許是新一代手機、或許是智慧音箱、甚至有可能是某種AI驅動的機器人。不過外界猜測稱,關於前沿AI硬體最佳實踐或許正是Altman曾多次投資的科技企業Humane。

圖源:網路
Humane團隊打造了一款AI投影裝置AI Pin,裝置體積小巧,可像一枚胸針一樣掛於胸前。該產品集成了無喚醒詞的AI助手,除此之外,AI Pin內建了一個投影模組,它可將一些來電聯絡人等簡單的資訊投射於手掌中。
據瞭解,Ai Pin將會搭載專用系統,甚至有可能會結合OpenAI的GPT-4,基於過往的一些案例,使用者可以向裝置傳送撥號指令、詢問就餐建議、旅行安排、檢測食物卡路里等。此外,Ai Pin的AI助手還將具備一定的上下文聯絡能力。
其他方面,Ai Pin售價可能會高達1000美元,配備高通驍龍晶片,效能可以比肩智慧手機。此前該產品已經在9月底的巴黎時裝秀上有所亮相,並即將於11月9日召開新品釋出會。更多資訊可檢視VR陀螺過往文章《iPhone核心團隊成員創業,融資2.3億美元,要做“另類”下一代計算平臺》。

圖源:Humane
AI持續進化,未來眼鏡終端還將如何發展?
目前AR眼鏡/智慧穿戴仍處於探索期,而AI如何與新一代計算終端所結合也同樣如此。基於前面的一些硬體終端其實也不難發現,各家廠商對於AI的理解以及側重點會有一定差異,但是共識是AI將會在新一代計算裝置革命中發揮重要用途。
對此,茹憶則提出了一個簡單明瞭的觀點,如果AR眼鏡是iPhone,那麼AI就是iOS,即AI將成為硬體驅動的核心。
從當前來看,眼鏡產品上的AI用例仍多集中於基於LLM的語音助手、簡單的識圖功能等,目前體驗仍相對單薄。此外,由於隱私以及裝置續航所限,裝置的AI能力很多時候只能處於被動觸發狀態,如只有按下按鈕或者撥出特定語音指令才能有所響應(這有點類似於搜尋與資訊推送的差異)。這種單項互動在一定程度上阻礙了AI功能的黏性。
此外,根據海外平臺SparkToro調查資料,聊天機器人模型ChatGPT的使用者會話中,程式設計協助以及教育用途最為廣泛,分別達到了29.1%和11.9%,而聊天互動等私人用途佔比反而並不算高。未來,如何實現大語言模型與眼鏡終端更為有機的結合也是一個值得持續思考的問題。

圖源:SparkToro
其他方面,AR眼鏡的算力薄弱,目前仍以雲端側AI為主。高通今年釋出《混合AI是AI的未來》白皮書裡面提到,雲端和終端協同處理的混合AI是AI的未來,這樣才能高效推動AI規模化落地,併發揮其最大潛能。隨著端側AI能力的增強,未來裝置可以構建更加個性化以及安全的AI助手,可以在離線狀態下工作,並且響應速度也會更快。
而AGI(通用人工智慧)是AI的下一個發展階段,AGI具備更強的感知、推理與學習能力,未來當AGI引入AR眼鏡之後,它的能力將得到更為廣泛的提升。彼時,AR眼鏡將會成為一個更加無感以及智慧的裝置。
高通技術公司產品管理高階副總裁兼AI負責人Ziad Asghar採訪中曾提到,在未來5年內,AI將會成為一個更加智慧的個人助理,比如當告知裝置會議要遲到了,它將能自動給相關成員傳送訊息。

圖源:高通
關於這一點,或許我們能在即將釋出的Ai Pin上面看到相關解法。Humane的一份專利檔案中指出裝置可以結合使用者的體溫、心率等資料來估算使用者的感情狀態以及當前環境的重要性,然後會選擇是否啟用麥克風攝像頭等。它有點類似於iPhone的相簿“回憶”功能,但是裝置會替使用者完成很多隱形的決策工作。
而美國未來學家Devin Liddell則認為,在AI技術的加持下,AR眼鏡將能獲得遠超普通人類的超級感官,比如眼鏡可以洞悉使用者的真實情緒、是否在撒謊等。
比爾蓋茨曾提到,人工智慧革命重要程度不亞於手機和網際網路的誕生,這是其一生中唯二的革命性技術進步。而未來AR眼鏡/智慧眼鏡在AI的加持之下,也將迸發出我們難以想象得到的創作力以及生命力。
參考資料:
https://mp.weixin.qq.com/s/npZduUT7FYhlqAdp3SsAiQ
https://mp.weixin.qq.com/s/XMzMACpCwjanMpyba73QVQ
第一時間瞭解XR資訊
關注VR陀螺官網(vrtuoluo.cn)
VR陀螺的聯絡方式:
商務合作 | 投稿 :
六六(微訊號 13138755620)
尋求免費曝光:
六六(微訊號 13138755620)
投稿郵箱:[email protected]
推薦閱讀