撕不開的AI入口,從AI耳機聊起

前陣子體驗到了位元組的新品 Ola Friend 耳機,感謝播客「腦放電波」的胡老師提供的試用。這款耳機被稱為 AI 耳機,也勾起了我對 AI 硬體重新梳理一下的興趣。今天就聊聊這個話題。
1 AI 耳機:Ola Friend
 Ola Friend 中 Ola 的意思是葡萄牙語的「你好」,所以產品名字指的是「你好,朋友」。
這款耳機是分離式的 OWS,即 Open Wearable Stereo(開放式穿戴耳機),跟我們熟悉的耳機型別 TWS 不一樣。後者即 True Wireless Stereo(真無線耳機)。當然這個概念都是自研自創的,不是那種嚴謹的命名方法,W 在兩個裡面含義都不同。
現今的主流耳機是 TWS 藍牙耳機。藍牙耳機的風潮源於一款歷史性產品, 即蘋果公司的 AirPods。
2011 年喬布斯去世後,蘋果一度被唱衰為要隕落的巨星。沒有喬布斯的蘋果,大家認為會缺乏創新。更讓大家不理解的是,喬布斯為什麼選擇庫克?在媒體語境、大眾語境裡,喬布斯是產品經理,而庫克只是無趣的供應鏈管理者、職業經理人。我當年作為預備產品經理,也對庫克沒有好感。
但是坦白說,喬布斯從 1996 重新迴歸蘋果後,庫克應該是第一功臣,在供應鏈的大量工作讓蘋果能起死回生、緩過氣來,才有機會做出 iPod 和 iPhone。在加入蘋果之前,庫克早就是電腦行業最資深的「庫存大師」之一了。

庫克掌管的蘋果公司也沒有喪失創新能力,AirPods 就是經典一例。此後,藍牙耳機行業完全被改變。

AirPods 的重要意義在於,做出了最佳體驗的分離式耳機,並且進行推廣。過去的分離式藍牙要正常連線有難度,在於分離式的同步問題。如果是手機連線兩個耳機的藍牙,就會產生或多或少的延遲。AirPods 為代表的藍牙耳機實現了主耳機、副耳機的技術,即主耳機連線手機,副耳機連線主耳機。也因此這類耳機叫 TWS 耳機。
所以 2017 年就是藍牙耳機的轉折年,如今街頭多數年輕人,幾乎都在戴這種耳機了。
當然,AirPods 也順便改造了播客市場,尤其國內的播客市場。有了降噪藍牙耳機後,在馬路上、公車地鐵裡,也都能聽到清晰的內容了,播客順勢在 2019 年後,無論供給還是消費,都有大幅的增長。這太重要了。
TWS 耳機在耳機領域佔絕對優勢。根據 IDC 中國 2024 年上半年的統計,藍牙耳機出貨量 5540 萬臺,其中 TWS 出貨 3508 萬臺,在 63% 左右。也能看得出來,耳機確實是大市場,一年有 1 億多的量。
也由於耳機實在是個巨大的市場,就能容納各種耳機的商業空間。OWS 就是其中在快速增長的一種。有統計 OWS 耳機在 2023 年一年有 1000 萬臺的銷量,也不算小了。
那麼,OWS 耳機的需求在哪呢?主要還是舒適度。TWS 耳機幾乎都是入耳式的,戴久了耳道會不舒服,因為需要透過塞入耳朵固定和降噪,還會存在氣壓問題,內外氣壓不同也會有壓迫感。OWS 耳機提到比較多的優點就是不用入耳、不用耳道固定。
說到這個,可能會聯想到骨傳導。OWS 跟骨傳導又不一樣,骨傳導是在耳朵上方的,比較有距離。我家有臺韶音的耳機,游泳的時候體驗很好。
OWS 乍一看好像也在耳朵眼,其實沒有進去。OWS 是掛在耳朵上的,就不用塞緊了。別的說實話差不多。
那我們說回來 Ola Friend。
(官方樣圖)
這款耳機的設計挺有意思的,錢包盒一樣,挺精緻的,放桌上跟小提包一樣。乍看一眼很漂亮。裡面開啟設計也有風格。科技感還是很足。
只是佩戴的話,稍微費點功夫,不像 TWS 掏出來一塞就行。
佩戴之後,耳朵是真的挺舒服的,有種給耳朵卸下重擔的感覺。長期佩戴都沒有問題。
本來是想當成主力耳機用一段時間,但這就要提到 TWS 耳機的痛點了:沒有降噪。這屬於絕對性的因素,對我而言,平時出門、坐地鐵、趕飛機的路上,還是必須開降噪的。這就讓佩戴場景相對有限。
音質而言個人體驗是很不錯的,在藍牙耳機裡算很好的。Ola Friend 的技術背景是夠硬的,背後的公司 Ola Dance是 2019 年成立的,由前 BOSE 高管李浩乾與多名 BOSE 工程師共同創立。他們也是最早 OWS 的倡導者。
都是 Dance,這不是巧了嘛,Byte Dance 收 Ola Dance,很合理。這也是剛剛發生的事情,就在今年 9 月份。
那麼位元組為什麼要做耳機呢?當然因為剛提到的 AI。
一款藍牙耳機,為什麼是 AI 耳機?那是因為能夠喚醒AI。其實 2017 年的分水嶺產品 AirPods 就主打喚起 Siri 的功能。只是當下提 AI 更加有吸引力,營銷是一方面,豆包跟 Siri 也不可同日而語了。你懂的。
早在 2020 年,iFLYBUDS 作為訊飛的智慧耳機,就釋出,併成為垂直場景的主流產品。說到訊飛,當然這款耳機就跟翻譯有關係了。最重要的功能是會議記錄和轉寫。這款耳機說起來,硬體算是 TWS,長得也是普通耳機的樣子。
Ola Friend 跟豆包的聯動,解決了更多有意義的場景。過去喚醒 AI,頂多也就是定個鬧鐘、問個天氣。
有了豆包,有大量的知識可以獲取,還能持續對話得到更深入的資訊,有點低配賈維斯的意思了。尤其對我這種開車和走路時經常想事情,想到就想去搜的場景來說,是真的很好使,比 Siri 中間差了好幾個小愛同學。也是第一次透過耳機有這種順滑的聊天體驗。
所以 Ola Friend 的整體評價就是:在 1200 塊錢的價位上,我確實還挺喜歡這個產品的,挺想購買的。可以跟 AirPods 替換著用,作為備用耳機。
這樣就能理解為什麼官方宣傳是 AI 耳機了。重點還是有豆包的支援。
豆包是今天使用率最高的國內 AI 產品。根據 Questmobile 2024 年 9 月釋出的 AI 原生應用半年報,豆包的月活高達 3000 萬,是第二名文小言 1000 萬的三倍。各位應該也能體驗到,豆包算是第一個破圈,身邊老人小孩都有在用的產品。
可是豆包的聯動並不能解決很多問題,關鍵是,不是系統級支援。因此,音樂、播客無法接入,豆包無法喚起,也無法控制手機裡的其它功能。作為 AI 耳機,它也只能跟豆包聊天。哪怕聊天也有點費勁,必須在系統設定裡開啟後臺 APP 重新整理,讓豆包持續常駐在後臺才行。這是個作為第三方公司,無解的問題。
我很佩服位元組的行動力,這款產品當下也很好用,屬於 AI 耳機當下體驗最好的。
但不得不聊到,所有第三方裝置面臨的局面,即真正系統級的 AI 入口,將會是另一個 AI,Apple Inteligence。Apple Inteligence 在北美已經發布。根據 10 月 23 日庫克訪華的問答,庫克老師說:「我們正在努力推進,這背後有一個非常具體的監管流程,我們需要走完這個流程,也希望儘快將它帶給中國消費者。」作為跟中國官方關係最好的美國企業之一,蘋果的 AI 應該的確是指日可待。
等到蘋果的 AI 正式釋出,有了系統級的支援後,iOS 將會是最好用也最常用的 AI 產品。而耳機將會是呼叫系統 AI 的入口,第三方 AI 將沒有吸引力。且不說 iOS 會不會給第三方耳機開放介面,哪怕開放了,使用體驗也必然不如官方自己的配件要好。
這也是一個大的趨勢。目前華為、小米、OPPO,vivo 都有自己的 TWS 耳機。他們都會完成系統級 AI 的支援,也會完成與各種配件的聯動。他們的耳機目前賣的也都挺好,也大有把入口牢牢抓在手裡的趨勢。
2 AI 眼鏡:Meta & Ray-Ban
既然說到 AI 硬體,在 AI 耳機之後,第二個值得一提的就是眼鏡。
其實人的複雜資訊輸入裝置,就是眼睛耳朵。作為眼耳鼻舌身五感裡,鼻子、嘴和四肢只能輸入很有限的資訊。
另外,作為可穿戴的裝置,就需要找地方放。設想你是一個可穿戴裝置的產品經理,手機之外,能想到還可以做手腕上的手錶,還可以想到做耳朵上的耳機。這是蘋果的路線。再接下來,最日常的可穿戴產品,可不就是眼鏡了。

(即刻看到的一張網圖)

提到 AI 眼鏡,就必須提到雷朋(Ray-Ban)和 Meta 合作的智慧眼鏡,這一代 2023 年 10 月發售,據說已經賣了近 200 萬臺。
這個產品非常成功,也確實是我自己眼前一亮的產品。今年去參加 13 叔(姬十三)辦的一個聚會,現場播客「腦放電波」的另一位主播白老師就帶了一臺過去。13 叔也有一臺。體驗過後,我就忍不住自己下單買了。日常經常用。
出去旅行的時候用。
參加播客活動的時候用。
在維權上電視的時候也用。

要聊為什麼這個眼鏡體驗好,我們先回顧一下。
大家對科技公司的眼鏡最初的印象可能是 Google Glass,這是 2012 年釋出的 AR 眼鏡。當年它的野心也很大,目標是長期要替代智慧手機。
Google Glass 有攝像頭,畫素 500 萬,在右眼上方有一個微型顯示器,大概相當於 25 寸螢幕在 2.5 米遠的效果。這是增強現實(Augmented Reality)最早的「大單品」,能夠在正常進行現實生活的時候,可以獲取和處理數字資訊。
這個眼鏡很輕,只有幾十克,用的是安卓系統,有骨傳導的音響系統,有藍牙,有 16G 硬碟儲存和 680M 的記憶體。喚起的方式是「ok glass」,跟今天喚起 AI 的方式也類似。當年釋出的時候看起來也很有科技感。
可是為什麼後來不行了呢?還是要回到產品的定位和使用者需求說。
Google Glass 有 7 個基礎功能:搜尋、導航、拍照、錄影片、發訊息、打電話、影片聊天。在科幻電影裡那種有 AR 虛擬顯示屏的操作(比如鋼鐵俠)不一樣,操作起來並沒有那麼那麼順滑。說白了,跟手機比起來沒有那麼有效率。
語音對話準確率本來就有限,另外問題是,這個眼鏡本來就是連線手機的,既然手機在旁邊,掏出來快速點選操作,甚至往往更方便。除非像地圖導航這種場景,否則就有點脫褲子那啥了。
基礎功能之外,還有個問題,這個眼鏡不像眼鏡,確實有科技感,可在大街上走起來特別奇怪。當你看螢幕的時候,就跟翻白眼一樣,邊看邊翻來翻去,很是社死。同時,還有隱私問題,當年 Google Glass 鋪天蓋地的新聞和爭議,戴著這個簡直就是在說:我隨時可能偷拍你。
最後很麻煩的是,定價 1500 美元,小一萬塊錢人民幣。對於多數人,買它就只是買個玩具的話,很難狠下心做決定。就跟 Vision Pro 面臨的窘境一樣,產品是好產品,但價格擺在這,就不會有好的轉化率。
這個價格看似跟高階一些的智慧手機接近,但在使用者樸素的消費觀念裡,消費不只是比絕對值,是要比使用頻率和需要程度。對於收入普通的朋友,也會買很貴的智慧手機,因為太重要了,iPhone 看起來大幾千,如果用幾年,一天幾塊錢,帶來的是能回訊息更快、處理事情更順滑,看影片玩遊戲更過癮,算起來當然可以接受。而 Google Glass 和 Vision Pro 這種開啟率不高的玩具比起來,就會尷尬。
說回來 Meta 眼鏡,在某種程度上,很多功能也很接近。它的主要調整是:第一,把手機能做的絕大多數的功能,在眼鏡上全部刪掉,Google Glass 的 7 大功能,主要就留下了拍照和影片。硬體上配了耳機,拍照、影片、音樂/播客,就構成最核心的功能了。
Meta 眼鏡的三個主打功能,最後一個就是 AI,跟 Ola Friend 跟豆包聯動一樣,作為融合了耳機功能的 Meta 眼鏡,也連線了 Meta AI,也能順暢對話。只是國內使用相對不方便,就不展開說了。
對我來說,前兩個功能就很夠用了。一個是作為開放式耳機,聽歌聽播客,不難受。作為眼鏡,不用再額外增加一個穿戴裝置。另一個,拍照和拍影片,我在開車的時候,出去玩、尤其運動的時候,經常戴。
這個眼鏡的造型很正常,不會給人壓力。你可能會疑慮,是不是偷拍就更方便更容易了。的確存在這個問題,Meta 眼鏡也考慮到了,於是做了個小功能,拍攝的時候,左眼上方是攝像頭,而右眼上方會有個明顯的 LED 白燈在閃。
閃爍提示還不能完全防止偷拍,肯定有人會不注意,所以這款眼鏡在某些國家地區也是停用的。不過對我來說,主要用來拍路上看到的有趣瞬間,拍小動物,拍花花草草的,都很方便。有時手機來不及掏出來,或者不適合掏出來。在這個場景下的確很剛需。

比如在狂喜播客節臺上聊天的時候,就順手拍了一些值得紀念的瞬間。這是影片裡的一小塊截圖。

那麼對於 Meta 眼鏡來說,三個新功能是不是值很多錢呢?當然也未必,這就要提到,Meta 眼鏡實際價格也只有人民幣 2000 多。
作為眼鏡,你可能會說,是挺貴的啊。這是 Meta 聰明之處,跟雷朋眼鏡的合作也是亮點。雷朋眼鏡本來就是輕奢的眼鏡品牌,動輒 1000 – 2000 裡,本來價格就不便宜。Meta 眼鏡的樣式算不錯的,哪怕沒有這些智慧的功能,也能有 1000-2000 的價格,那麼多點功能,算起來價格就沒有太離譜了。
這就是整體來說,為什麼 Meta 眼鏡能成立:簡單,便宜。
扎克伯格曾經說過:「一年半前你問我,什麼時候人們會更喜歡使用眼鏡作為主力裝置使用,我會說,要到眼鏡的顯示效果足夠好的時候。現在,我認為可能有三種路徑,其中一種就是無顯示屏、只具有人工智慧的眼鏡。」
這樣的眼鏡,Meta 也不是首創。Snapchat 旗下的 Spectacles 眼鏡也是一樣的,釋出時間更早,在 2016 年。也同樣有閃爍的 LED 燈提醒,同樣可以拍照錄像。跟 Snapchat 配合,錄短影片非常方便。
Meta 眼鏡的野心顯然就沒有 Google Glass 那麼大了,它重點強調的也是在 Instagram 的使用。連攝像頭的豎屏比例,都是為了 Instagram 服務的。
所以 Meta 眼鏡的確更像耳機這樣的配件。像華為也有智慧眼鏡配件,實際上的重點在麥克風和耳機,有語音輸入互動,沒有拍照錄影片。
這是一種大的閹割,也就跟 AR 眼鏡區分開了。AR 行業裡當然也依然有探索者和好產品,像雷鳥 X2。只是相對影響力沒那麼大了。
在每個歷史階段,無論是元宇宙還是 AR,無論是區塊鏈還是 AI,在硬體身上,往往都是熱門概念基礎上的營銷話術。Meta 眼鏡是款好眼鏡,Olaa Friend 也是一款好耳機。但 Meta 眼鏡是不是 AI 眼鏡?Ola Friend 是不是 AI 耳機?值得思考。
3 AI 硬體,還是能用 AI 的硬體?
仔細思考一下,Ola Friend 和 Meta 眼鏡的真的有 AI 功能嗎?並不是,他們的 AI 只是呼叫和喚醒,AI 的資訊獲取和處理,依然都來自於手機。
當然不能說語音互動方面它們沒有做出努力。Meta 眼鏡有活活 5 個麥克風,就是為了準確識別「主人」的聲音。各路 AI 耳機也都具備一定的降噪和更準確識別語音的技術能力。類似的技術,像華盛頓大學就在研究的「Target Speech Hearing」。不過這些依然是技術解決方案,為了提高效率、提升體驗,它們與 AI 的關係並不直接。
說到底,100 塊錢的華強北耳機,能不能喚起豆包?也可以。
那麼 AI 硬體到底是 AI+ 還是 +AI,就是個有意思的問題。沒有 AI 是不是就不成立了,還是有 AI,純粹是錦上添花。
例如訊飛智慧辦公本,我之前評測體驗過(一款 AI 場景的驚喜硬體產品)。這跟剛才說的訊飛耳機一樣,是翻譯垂直場景。
另外還有一個產品:Plaud Note。在眾籌網站上釋出後,已經交付了十幾萬臺,簡單說,是一個貼在 iPhone 背面的 AI 錄音機。很薄,有點像外掛充電寶那種,可以持續錄音 30 個小時。
說到錄音,iPhone 的錄音不行嗎?第一,手機通話不能錄音(這個 iOS 18.1 版本提供了,只是會強制提示對方)。第二,可以轉文字並翻譯。整理成筆記。同時可以跟 OpenAI 的介面聯動。
我個人還沒用過,據說效果很好。像開會、上課、跟別人聊天,能持續記錄和整理資訊,就很方便。這跟訊飛智慧辦公本有點像。
我之前喜歡這個辦公本,就是因為專門的裝置專門用。設想一下,如果用手機錄音,會有很多打擾。這跟用墨水屏電子書讀書的邏輯一樣。
Plaud Note 之外,還有一個更火的產品 AI Pin,由兩位蘋果設計師創立的公司 Humane 釋出的,他們拿到了新的矽谷教父山姆·奧特曼的投資,含著金鑰匙出生。很多媒體直說 AI Pin 就是下一代 iPhone。而媒體風向的變化是隨著評測和試用越來越多開始的,體驗翻車的比比皆是。AI Pin 的那些評測影片特別出圈,我看過一些。各位也比較容易能搜到。
AI Pin 的概念是,一個很小的方形小盒子,也有攝像頭,可以隨時拍一下,問問題。比如「告訴我我在看什麼」。還有能夠直接投影到手掌上,做一些互動。作為硬體的特色是,它可以掛在脖子上,或者貼在胸口,也算是個潮流飾品。
只是在產品方面,最大的問題,慢。有個國外的大哥 Marques Brownlee 的一個影片很出圈,他用 AI Pin 問面前這輛車是什麼,在等的過程中,用手機解鎖、拍照、識別、檢視,得到結論之後,AI Pin 都還沒有反應過來。
另外一個 Rabbit R1 也是類似,創始人呂聘老師當年我見過的,是一位奇人。這個裝置簡單說是一個帶螢幕的青春版 AI Pin,比 AI Pin 最大的優勢是便宜,200 美刀,而 AI Pin 是 699 美刀。

還有一種新品類是 AI 智慧指環,套在手指頭上的,功能類似,有的是翻譯、轉文字等等,跟訊飛那個很像;有的是監控體徵的,跟手錶很像。指環的特色通常是手指的手勢控制。這個也不展開說了,大家應該能體會到,可能面臨同樣的問題。
不過說起,有一個挺好玩的,在亞馬遜上賣的戒指,穆斯林專用的  Muslim Islamic Prayer Smart Rings,用來做儀式的鬧鐘提醒、指出準確的禮拜方向等等。
前陣子還有一個挺知名的產品,Friend AI 項鍊,主打情感陪伴、虛擬朋友的概念。幾乎沒有特別的功能,沒有攝像頭,只有麥克風。
Friend AI 的宣傳片在推特上有 2300 萬的播放,宣傳片裡,一個女生邊吃飯邊在手機上看劇,Friend AI 還能聽到電視裡的聲音,會說:「這部劇被低估了,太精彩了」。女生一不小心把醬汁灑在了 Friend AI 上,它立馬回覆:「嗯…味道不錯。」
由於全靠聲音判斷,不知道準確率是不是真能達到宣傳片那麼誇張,能夠準確識別是醬汁滴到了自己身上。而且剛剛所謂的「說話」,其實是透過 iPhone 的通知推送。
這讓我想到小時候的電子寵物。不過奇怪之處就在於,既然只是個麥克風的作用,為啥不用 APP?也許是為了能持續開啟麥克風。以及有一個實體存在,給人的情感連線更不同?
Friend AI 這類產品還有很多,比如 AI 虛擬手辦,怎麼說呢,就是個大盒子,觸屏的,能夠簡單做一些互動,裡面有個紙片人。這……也是一言難盡吧。
以上總結來看,AI 硬體大概分為三類。
第一類,是手機的延伸。需求是真實的,圍繞手機的。比如剛剛說的,在手機不方便開啟的時候,耳機和眼鏡幫助我們提供手機上的資訊,或者記錄資訊(拍攝 or 錄音)。這方面,手錶也是類似的作用。
第二類,是獨立硬體的垂直場景。比如訊飛和 Plaud Note,是辦公專用的記錄和翻譯的工具。這個類別下,我還看到還有一些更特別的,比如 AI 輪椅、AI 盲人助行器,都還挺有意思的。
第三類,是想要替代手機的可穿戴計算裝置,很多主打的是「AI 助理」的概念。聽起來很性感,AI 助理也是我們理想中 AI 能帶來的未來。可是,扎心的問題是:AI 助理,何必是硬體助理?

4 手機不香嗎?

我們為什麼還需要另一個硬體?它到底比手機好在哪了?這是個最扎心的問題。我常有這種感受:目前的手機已經做到非常極致的體驗了,而這種極致,也扼殺了下一代計算裝置的影子。你想,拿起手機,劃一下,點選幾下,各種操作都能實現,各種資訊呈現也都很完整、準確。
對於手機來說,有兩個體驗極致的重點。
一個是可得性。開啟就能看到,隨時能從兜裡套出來,這點極為重要。Vision Pro 顯然是不行的,很容易理解。
可得性也可以在跟摺疊屏手機的對比上看得出來。很多人總會認為摺疊屏代表著未來,因為看起來摺疊屏技術複雜、工藝難,開啟就能擁有巨大的螢幕,似乎是體驗更好。但實際上這不是關鍵,不是越牛逼的技術就越代表未來,摺疊屏的工藝確實了不起,我自己用過,橫向、縱向摺疊的都用過,也很感慨如今的技術水平。可是,始終沒辦法作為主力機,就是每次摺疊,實在受不了,看起來小小的動作,就會降低開啟的慾望。很多用摺疊屏的朋友,外屏使用的頻率比內屏還高——那麼問題來了,為什麼不直接用只有外屏的手機呢?就我而言,iPhone + iPad 的解決方案,還是優於摺疊屏。
第二個是確定性,語音互動和語音的準確性。
哪怕 AI 的水平再厲害,在互動方面,也容易出現小問題。平時常用語音輸入文字的朋友也知道,每次多多少少會有那麼一兩個錯別字,發給朋友倒還好,對方也能識別出來。但真把語音當成真正的互動,有錯別字就意味著意思會理解錯,而改錯是非常麻煩的。遇到需要確定性的場景,點選操作,還是比語音互動更有效率。因此,除非是手和眼睛不能在手機螢幕的場景下,否則並不需要別的硬體。
語音的互動有個專門的概念,LUI(Language User Interface),現在我們日常使用的是 GUI(Graphical User Interface)。從 PC 到手機都是。LUI 的主要問題還有:無法多執行緒,無法精準定位,也會有比較大的延遲。如今透過語音跟 AI 對話的節奏,很難做好,交談的延遲會特別違和,跟人與人正常的交談差不少。AI Pin 面臨的就是這個問題。
對於定位而言,可以類比的是滑鼠。滑鼠非常偉大,解決了過去游標移動麻煩、需要一點點移動的問題。而聲音更麻煩,很難用「你聽錯了我剛剛說的第三句話的第二個詞」來做修正。這點,大家可能對錘子科技的 TNT 有印象。
再說遠一點,是不是未來的 LUI 是現在的我們想象不到的?是不是因為我已經 35 歲了,中了亞當斯的科技三定律?
當年英國科幻作家道格拉斯·亞當斯說:
– 任何在我出生時已經有的科技都是稀鬆平常的世界本來秩序的一部分。
– 任何在我15-35歲之間誕生的科技都是將會改變世界的革命性產物。
– 任何在我35歲之後誕生的科技都是違反自然規律要遭天譴的。
仔細想想,好像也不是。我清楚地記得,高中的時候我盯著鉛筆盒,就想象過,這玩意兒要是有螢幕能玩就好了。大螢幕、觸控、資訊呈現、聯網這些,在當年都是可以想象到的。
雖然以前沒有智慧手機,但可以想象到如果有,會很棒。那我們目前能想象比手機更好的東西嗎,可能不是更大的螢幕的手機,摺疊屏,不方便;也不是元宇宙,因為純粹的虛擬世界肯定也不是我們想要的。
至於 AI Pin 想象的隨時投屏、XR 領域的增強現實等等技術,如果能達到科幻片中的場景,必然是更好的替代品。但目前還沒有看到技術上能達到手機體驗的可能性。
還有一個層面,是具身(embody)的問題。微軟推出的 Recall 功能很有意思,能夠把我們在電腦所有的操作記錄下來。未來如果有個可穿戴裝置,把我們每天所見所聞記錄下來,這個將會是另外一種大殺器。因為手機並不能記錄外部世界我們的所見所聞。
這也是黑鏡一般的劇情,可以再回顧下第一季第三集。
對於未來,還有很多前輩和年輕人都在努力,我也充滿期待。只是當下看到的進展,並沒有真讓人眼前一亮的產品。
今天而言,手機依舊還是最好的資訊時代聯網通訊、處理資訊的終極解決方案。如果科技領域有福山這樣的學者,也可以寫一本《歷史的終結》。樂觀點看,這本書寫完以後,就可能很快發現並沒有終結。
所以每當出來一個新產品的時候,我們就得思考一下:同樣的需求,為什麼不用手機。像剛才說的,AI Pin 和 Rabbit R1 就是典型的案例。沒錯,有個螢幕很酷,但是日常使用時,有視網膜螢幕、高效能晶片的手機,速度更快、螢幕更大,為什麼不用?
而再說回來,剛才說的「專門裝置專門用」的垂直場景,倒是個好的方向。
比如智慧枕頭,已經有團隊做了很多年了。現在就往往不提智慧枕頭了,提就是 AI 枕頭。 比如智慧家居,我們都很熟悉的智慧音箱。還有兒童玩具,玩偶機器人。還有教育,比如兒童相關的 AI 手錶,AI 學習機,AI 學習燈,等等。但是歸了包堆,都是硬體本來就成立,AI 更多就是補充,或者至少跟 2023 年至今所說的大模型 AI 關係並不大。
還有 AI PC 的概念,也是在強調 AI,但實際上電腦本來就是 AI 的原生硬體。
還看過一個 AI 嬰兒車,能自己開。我也是挺拿不準到底是不是有真實需求的,總覺得,父母可能不會放心嬰兒自己在前面走?
有的已經屬於純粹噱頭。比如 AI 滑鼠、AI 鍵盤。我在蒐集材料的時候搜到一個 AI 滑鼠的產品,官方宣傳可以「智慧生成影片」。這個當場嚇到我了,一款滑鼠可以做影片?結果看了一下,說是滑鼠滾輪長按 5 秒鐘,就會出現一個 AI 軟體,能生成影片。這尼瑪,跟我開啟別的軟體和網站,有什麼區別?那跟滑鼠,又有什麼關係?
所以說回來,AI 硬體現在也是個沒那麼實在的概念,並不是一個統一定義的、有明確產品價值的概念。真要說殺手級的 AI 硬體,也有,就在各位自己手上:手機。AI 這把屠龍刀不是在少年手上,是在龍自己手上。
5 撕不開的入口
剛剛說的都是 AI 硬體的觀察,並不代表這次 AI 都是泡沫。其實對於非顛覆式的改變,我是很樂觀的。我們日常生活工作裡,將會有越來越多的 AI 技術。諾貝爾獎都忍不住頒給傑夫·辛頓了,很有意思。(關於人工智慧和姐夫·辛頓的故事,可以參見「半拿鐵」的人工智慧風雲錄。)
AI 會影響新的網際網路入口,但跟 AI 硬體面臨的問題非常接近。網際網路入口是長期以來的兵家必爭之地。最早的入口是瀏覽器和入口網站,後來是搜尋引擎,再後來是手機和 APP。每次都是技術驅動,創造了新的入口。
那麼在入口方面,AI 是會顛覆還是會最佳化。AI 是創造了新的入口,還是讓原來的入口更方便了呢?是旁邊砸出一個新的門來,還是鐵門換成了不鏽鋼門呢?
我的感受是目前還是後者。
系統級的支援才是繞不過去的。比如 AI 助理最經典的一種演示:「幫我點杯咖啡」。支付寶做了點星巴克的功能,在周鴻禕直播間,榮耀的老闆現場也演示怎麼點三杯瑞幸。這些都讓人眼前一亮。我們在操作手機的時候有一些環節複雜、步驟明確、容錯率高的操作,都是可以語音的,是可以 AI 來幫助的。我之前寫過一篇文章(從 ChatGPT 看 AI 未來的 7 種場景可能性),在「三五環」播客 104 期也聊過。比如這樣的場景:
小 A 打開了手機,說我想知道絲瓜和雞蛋能做出什麼菜來。AI 回覆說,搜到了三個點贊量挺高的小紅書筆記,還有兩篇你經常閱讀的公眾號的文章,以及三個 B 站上過首頁的相關影片。小 A 說現在沒工夫看影片,把小紅書的筆記的主要流程念給我聽。唸完之後,小 A 說這個做法太油了,幫我找一個更清淡的做法。AI 再找到另一篇,回覆給小 A。
這個系統級的實現幾乎是必然的。各個應用都是系統的供給方。而具體系統怎麼推薦,比如先推薦美團還是餓了麼,比如推薦小紅書還是微博,那就是個要磨合的問題了。這將會是個大問題,國內的網際網路公司本質上幾乎都是廣告公司(阿里、位元組、美團等等),讓他們只提供內容和服務,是不太現實的。猶如在移動時代,搜尋引擎很快就被各個供給方給拋棄了一樣,沒有人想讓消費場景都讓給別人。
系統級的實現,就意味著強者愈強,入口愈發堅固。現在除了賣水的英偉達,蘋果、微軟這種大公司是 AI 浪潮裡吃得最香的公司。五大巨頭,英偉達、亞馬遜、Alphabet、蘋果、微軟,五家的市值,佔據了所有科技公司的 65% 的市場份額。
國內也是類似,手機廠商一定都會有 AI,要麼自研,要麼合作。前幾名的原生 AI 應用主要是豆包、文心一言、通義千問等這些大公司的產品。剛剛說的硬體也一樣,耳機、眼鏡、智慧家居,這些跟手機關聯的,跟資料和網路需要互通的產品,都是會逐步被大廠生態覆蓋的。要麼大品牌,要麼就是白牌。
還有個有意思的資料《2024年Q3全球AIGC行業月報》,顯示前三名是剪映、豆包、美圖秀秀。

其實也都是老產品。這也是我這兩年的觀察:AI 產品面向的都還是過去的場景,那過去場景的產品+AI,是更有優勢、更有競爭力的。

真要說不管體驗,還是生產力都是在 AI 之前完全無法做到,而等 AI 來了才成立的,非常少。大多數場景下,AI 都是一個槓桿,甚至有時候都沒有真正提效,都是噱頭。
我們日常中最常用到的 AI 功能,目光可及的未來裡,可能還是+AI 的形式。不管是 iOS、安卓這樣的作業系統,還是剪映、Photoshop 這樣的多媒體處理工具,或者 Office 這樣的辦公軟體,等等,它們的 AI 能力將會越來越強大,而小公司單純靠 AI 能破局的可能性會比較小,除非一件事情的工作流程完全變掉。

因為對於每個場景來說,老玩家的

資產基礎好,花得起錢;長期迭代的綜合體驗更好,新玩家的體驗差不足以轉移使用者。這樣形成的使用者黏性、商業基礎會迴圈,讓老玩家更有壁壘。

AI 還在不斷進步,但更多是增程式,不是顛覆式。而對於網際網路產品來說,入口太硬了,別人都攥在手裡,撕不開。
對網際網路產品來說,入口爭奪戰已經結束了,現在是入口攻城戰。它們都有高高的圍牆,一般人很難進去。哪怕是美圖秀秀這樣的小城池,也很難攻打進去。
ToB 又是另外一幅場面,是有很多有意思的機會的。比如程式設計,GitHub有自己的 Copilot,今年 10 月 ChatGPT 也推出了程式碼開發相關的產品 Canvas。AI 不一定寫程式碼,但是對於程式碼這種邏輯性很強、總結的經驗又很有用的任務,AI 可以完成程式碼補全、糾錯、寫備註等等工作。
我之前三五環聊過螞蟻的 Codefuse。包括百度,阿里,騰訊,智譜,商湯,位元組在內,全都有自己的 AI 程式碼工具。未來普通人寫程式碼,完全能成立。上次跟王亞輝老師也聊到這件事兒來著,作為多年遊戲行業從業者,他對未來小團隊甚至個人都能做出很多好玩的遊戲這件事,很樂觀。
這個趨勢是不可逆的。有點像我們過去用畫筆,後面會有更好的工具——Photoshop。它不會消滅畫師和設計師這個職業,但會重塑行業。
類似的還有,動態捕捉行業、動畫行業、影視行業等等,都會有更多 AI 的參與。

6 少談 AI,多談體驗

AI 已經不是那種宏大敘事。耳機很好,眼鏡很好,但就跟我們昨天買的挺好用的鍵盤一樣、挺好用的電視機一樣,屬於一種個性化的選擇了。做 AI 耳機、AI 眼鏡也跟之前做網際網路產品的門檻低不一樣了,需要把硬體本身面臨的場景都做透、做好才行。
回到開頭說的 Ola Friend,很難說位元組靠耳機就能如何如何,也很難說創業公司靠一個小硬體就能顛覆大廠的產品。不討論宏大敘事,只聊聊 AI 有沒有能讓我們體驗更好的機會,反而可能會開啟新局面吧。
想想前面說的 Plaud Note 小工具、穆斯林的小戒指、小朋友用的小手錶,都挺好的。還是常說的那句話,大的時代結束了,多看看小的機會。
少談談 AI 有多牛逼,多談談體驗上有哪些機會吧。
怎麼看機會,我倒是看到一個好玩的說法,華強北嚴選。去看看華強北最近在模仿什麼產品,晚上工廠運轉的時候流水線上都是什麼。如果華強北都懶得做的市場,很可能沒什麼前途。
以上,我聊的是我掌握的情況。大家有建議和批評的,歡迎交流。也希望能對大家有啟發。

——

哦對,最後推薦一個歸藏老師的小報童專欄《AIGC 週刊》。這應該是中文世界最好的 AIGC 週刊了。裡面都是具體的、實際在發生的 AIGC 的進展,比如最新一期就聊了 Claude 的版本更新、開源的影片生成模型 mochi 是什麼,SD 在 3.5 版本做了哪些調整,谷歌、蘋果、Meta 等等公司在 AI 方面的最新進展,也推薦了一些近期知名的 AIGC 作品,還有一大堆好文章,非常划算。感興趣的朋友可以自行關注。

題圖由 Midjourney 繪製。


相關文章