小紀有話說:
十年前,2014 年 11 月 6 日,Alexa 釋出,對貝佐斯來說,這個專案代表著未來。
名字來源於《星際迷航》中的「計算機」,語音控制的全能 AI 助手。
「從科幻小說的早期開始,人們就夢想著能夠擁有一臺可以自然對話的計算機,實際上可以和它交流並讓它為你做事。如今,這個夢想終於實現了。」貝佐斯說
兩年時間,智慧音箱 Echo 進入 500 萬個家庭,現在美國市場銷量已經超過 4000 萬臺。但很多想象中它能做到的事,Alexa 沒有做到。
來源:Founder Park
原標題:Alexa 做了 10 年,銷量 4000 萬臺,卻還是一個智慧鬧鐘
Echo 智慧音箱在美銷量超過 4000 萬臺,Alexa 每週處理全球數十億條命令。
現在的 Alexa,依舊在做它最基礎的事情:播放音樂、提供天氣資訊、定鬧鐘。你可以用 Alexa 控制家中的燈光、打電話給媽媽,或者提醒你丟垃圾。
但正如一位前 Amazon 員工所說:「雖然僱了一萬多人,結果我們做的還是一個智慧鬧鐘。」
這讓人有些失望。Alexa 原本有著巨大的潛力。儘管它的功能非常強大——特別是在無障礙技術和老年護理等領域,對於很多人來說它變得不可或缺——但它現在基本上還是家裡的一個遙控器。現在,家裡每個房間都有 Alexa 智慧揚聲器,但它並沒有讓生活變得更便利。雖然這些年 Alexa 加入了成千上萬的功能,但我仍然不會依賴它做一些比執行計劃中的命令、將牛奶加入購物清單,或者告訴我小雞能不能吃葡萄之類更復雜的事。
如果非要說有什麼變化,那就是在語音助手誕生 10 週年之際,Alexa 最初的夢想似乎變得更加遙不可及了。
當 Alexa 首次推出時,它是多麼具有突破性。不同於蘋果的 Siri 被束縛在手機裡,或者微軟的 Cortana 被侷限在電腦上,Alexa 走出了自己的路,搭載在 Echo 這款世界上首個語音啟用揚聲器裡。它的遠場語音識別技術,憑藉七麥克風陣列提供支援,真的是讓人驚豔。你可以在房間的任何地方對著 Echo 喊話,那個藍色光圈幾乎總是會亮起,表示 Alexa 已經準備好為你講笑話或者設定定時器了。
Amazon 進入智慧家居領域,為我們揭開了「星際迷航」般的未來的序幕。儘管有些玩笑話和百科全書式的知識不太靠譜,但 2016 年釋出的 Alexa 智慧家居 API,之後 2017 年 Echo Plus 加入了 ZigBee 無線電,使得 Alexa 可以連線並控制我們家裡的各種裝置。
坐在沙發上讓 Alexa 關燈,或者躺在床上讓溫控器升溫,感覺就像生活在未來。我們終於在家裡有了一款類似《星際迷航》中的「計算機」的裝置——Amazon 甚至讓我們稱它為「計算機」(Computer)。
回頭來看,Alexa 其實為現代智慧家居鋪平了道路。簡單的語音控制讓物聯網(IoT)變得更普及,它把技術帶入家庭,而不是讓它被困在複雜的裝置裡。加上 Amazon 的開放式智慧家居策略——在其他公司都推出封閉生態系統的時候——也促進了一波新消費級智慧裝置的崛起。Nest、August、Philips Hue、Ecobee、Lutron 和 LiFX 等品牌的成功,部分功勞要歸功於 Alexa 的易用性。
然而,圍繞 Alexa 的生態系統發展得太快了。任何人都可以為 Alexa 開發「技能」,幾乎沒有什麼限制。雖然有些技能簡單有趣,但很多功能不穩定,甚至需要特殊的詞句才能啟用。最終,這導致了一個不穩定、常常令人沮喪的使用體驗。
Amazon 透過不斷擴大的 Echo 硬體產品線來掩蓋 Alexa 沒什麼智慧的問題。
每年都有新款智慧音響釋出,Alexa 也逐漸進入了時鐘和微波爐等裝置中,還推出了多種新形態,試圖推動使用者將 Alexa 帶到戶外——比如耳機(Echo Buds)、戒指(Echo Loop)、眼鏡(Echo Glasses)和車載裝置(Echo Auto)等。
然而,這些裝置大多讓人留不下印象,對提升 Alexa 的功能幾乎沒有幫助,反而讓 Amazon 背上了虧損。今年,《華爾街日報》報道說,Amazon 在裝置部門的損失已經高達數百億美元。
即便採取了這種「什麼都試試,看哪樣有效」的策略,Amazon 還是沒能突破那個第二個必不可少的形態。2017 年,它推出了智慧顯示器——一種帶觸控式螢幕的 Echo,可以進行視訊通話、檢視安防攝像頭,甚至顯示資訊,而不只是簡單告訴你。但由於處理器速度慢、觸控式螢幕不靈敏,且廣告過多,智慧顯示器並沒有真正提升 Alexa 的核心功能。
現在,很多使用者都抱怨 Alexa 在核心功能上變得更差了。大家買 Echo 裝置,主要是因為它比其他競爭產品便宜,並且能做一些 Alexa 2014 年就能做的事:定鬧鐘、查天氣、聽音樂。
對這種價格最低可至 18 美元的裝置,人們的期待也並不高。
這麼多年過去了,和 Alexa 對話依然是最大的難題。而且是我們學會了如何跟 Alexa 說話,而不是 Alexa 學會了怎麼和我們溝通。例如,我家裡連線的廚房水龍頭,還需要我說:「Alexa,告訴 Moen(水龍頭品牌)給我倒 2 杯熱水。」正如我丈夫所說,如果 Alexa 真那麼「聰明」,它應該知道我正在廚房水槽前,直接按照我的要求做,而不是讓我記住這些複雜的指令。
還有就是,Alexa 遇到了技術瓶頸。在科技界,有一個普遍的預期,那就是技術會持續進步。但 Amazon 並沒有專注於提升核心技術,而是依賴第三方開發者讓 Alexa 擁有更多的功能,集中資源將語音助手推向更多裝置,並讓它能控制更多的東西。
隨著越來越多裝置支援 Alexa,Amazon 在平臺上增加了更多功能,但也帶來了管理、控制和使用這些裝置的難度。語音控制非常適合簡單的命令,但如果沒有更方便的方式與 Alexa 互動,很多新功能對於大多數使用者來說就變得毫無意義。
Amazon 推出 Alexa Routines(Alexa 常規任務)作為解決方案,幫助使用者整合可以用 Alexa 控制的各種裝置和功能,但這需要你花時間在應用裡進行設定,並且不斷除錯裝置和它們的連線問題。
每次發出命令後聽到「您的『2 燈』沒有響應,請檢查網路連線和電源」這種提示,真的讓人非常沮喪。而每個月花上幾個小時來配置和解決智慧家居的問題,這並不是 Alexa 當初承諾的體驗。
一個智慧計算機應該能為你做的事情,結果現在卻成了負擔。
十年過去了,Alexa 依然主要是用來播放音樂、問問題和看天氣。這很大程度上是因為,儘管 Amazon 讓 Alexa 在各種裝置和家庭中普及開來,但始終沒能讓開發者真正關注它。
Alexa 本來是沒有應用商店的。相反,它有「技能」(skills),Amazon 希望開發者透過這些技能讓 Alexa 連線到新的功能和資訊。開發者不需要在作業系統上搭建自己的應用,而是要為 Alexa 開發新的功能。這個區別雖然細微,但卻至關重要。我們的手機大多是孤立的體驗——Instagram 和 TikTok、Snapchat、日曆應用和 Gmail 各自獨立,互不關聯。這種方式對於 Alexa 或任何其他成功的助手都不適用。如果 Alexa 知道你的待辦事項,但卻不知道你的日程安排;它知道你喜歡吃什麼披薩,但卻不知道你的信用卡資訊,那它能做的事情就非常有限。Alexa 需要獲得所有必要的資訊,並且能呼叫各種工具,才能幫你完成任務。
在 Amazon 的理想世界裡——那裡「環境計算」無處不在且完美無缺——你只需要向 Alexa 提問或下達指令:「幫我找個有趣的活動做做。」「幫我預定下週去紐約的火車票。」「幫我瞭解一下深度學習。」Alexa 會訪問所有必需的應用和資訊源,而你不需要擔心這些細節;它會根據需要處理併為你提供答案。雖然關於如何實現這一點的問題非常複雜,但這是 Amazon 的整體目標。
「Alexa Skills 讓開發者能快速、輕鬆地建立語音驅動的體驗,為開發者和品牌與客戶的互動打開了全新的方式,」Amazon 的發言人 Jill Tornifoglio 在宣告中說。她表示,客戶每年使用這些技能的次數達數十億次,並且隨著公司擁抱生成式 AI,「我們對未來充滿期待。」
回頭看,Amazon 的這一想法幾乎是完全正確的,且超前的。
多年後,OpenAI 和其他公司也在圍繞聊天機器人構建自己的第三方生態系統,聊天機器人就是網際網路互動介面的一種新形式。但儘管 Amazon 對 AI 革命的預見非常精準,它卻從未搞清楚如何讓技能真正發揮作用。它始終未能解決開發者面臨的根本問題,也未能突破使用者介面的難題,更沒有找到一種方法,讓使用者意識到他們的 Alexa 裝置其實能夠做很多事情,只要他們願意去問。
Amazon 確實盡了最大努力讓「技能」成為現實。
公司不斷為開發者推出新工具,當他們的技能被使用時,提供 AWS 積分和現金獎勵(儘管最近已經停止了這種做法),並盡力讓技能的開發變得幾乎毫不費力。從某種角度來說,這些努力是有回報的:Amazon 表示,平臺上已經有超過 160,000 個技能可供使用。雖然這個數字遠不及智慧手機上的數百萬個應用,但依然是個相當可觀的數字。
然而,發現和使用這些技能的介面一直都是一團糟。舉個簡單的例子:如果你讓 Alexa 幫你點披薩,它可能會告訴你它有幾個技能,並推薦 Domino's。你回答「好」。「這是 Domino's,」Alexa 說。然後又過了一會兒,Alexa 又說:「這是 Domino's 技能,由 Domino's Pizza,LLC 提供。」再過一會兒,「要連結你的 Domino's Pizza 賬號,請到 Alexa 應用的技能設定中去。我們需要你的郵箱地址才能進行客人訂單。請在 Alexa 應用中開啟『郵箱地址』許可權。」這時,你必須找到一個你可能根本沒有在手機上下載的應用裡的設定;直接去 Domino's 官網或打個電話不就更簡單嗎?
如果你知道自己想用的技能,情況會稍微好些。你可以說「Alexa,開啟 Nature Sounds」或「Alexa,啟用 Jeopardy」,它會開啟對應的技能。但如果你忘記了那個技能的名字,像「Easy Yoga」這個名字之類的,單純讓 Alexa 開始一次瑜伽訓練就沒那麼優秀的反應了。
這種系統的問題到處都是。當你啟動了一個技能,你必須明確地說「停止」或「取消」才能退出並使用其他技能。你不能輕鬆地在技能之間切換——比如我想檢查披薩的價格,但 Alexa 根本不允許我這樣做。而也許最讓人沮喪的是,即使你已經啟用了某個技能,你仍然得專門提到它。比如說「Alexa,讓 AnyList 把義大利麵加入我的購物清單」,這並不是和一個全知助手的無縫互動;這相當於得學習計算機那種特別具體的語言,才能正常使用它。
最終,事實證明,最受歡迎的 Alexa 技能有兩個共同點:它們通常都是簡單的問答遊戲,並且大部分是由一個叫做 Volley 的公司製作的。從《Song Quiz》到《Jeopardy》,再到《誰想成為百萬富翁》以及《你比五年級生聰明嗎》,Volley 是其中一家真正懂得如何讓技能發揮作用的公司。Volley 的聯合創始人兼 CEO Max Child 表示,將你的技能展示給使用者是最重要也是最困難的部分之一。
「我認為 iOS 和 Android 應用商店如此成功的一個被低估的原因就是 Facebook 廣告太強大了,」他說。透過精準的廣告投放到應用安裝的流程,已經被完善了多年,而語音助手卻沒有類似的流程。最接近的可能就是人們詢問 Alexa 能做什麼的時候插入廣告,但這與資訊流廣告和社交媒體刷屏的效果相比差得遠。「因為沒有那種精準的營銷,你只能做廣泛的營銷,只能做廣泛的遊戲。」因此,像《Jeopardy》和《Millionaire》這樣的遊戲成為了大眾化的品牌,幾乎適合所有人。
Volley 的盈利方式之一是透過訂閱。例如,完整版的《Jeopardy》每月收費 12.99 美元,像許多現代訂閱服務一樣,訂閱比取消要容易得多。這也是為技能賺取收入的少數途徑之一:開發者可以在某些技能中插入音訊廣告,或者直接要求使用者填寫信用卡資訊,就像 Domino's 做的那樣,但讓語音優先的使用者去拿起手機,翻閱設定,實在是個很高的門檻。廣告只有在足夠大規模時才有用——曾經有段時間,很多媒體公司認為「閃電簡報」會成為一個熱門,但並沒有發展成預期的那樣。
順便提一下,這些 Alexa 面臨的挑戰並不特別。移動應用商店也面臨類似的投放難題、貨幣化難題、亟待最佳化的訂閱模式等等。只不過在 Alexa 這裡,解決方案本應是如此引人嚮往:你不需要,也不應該需要應用商店。你只要說出需求,Alexa 就能幫你搞定。
十年過去,看來一個無所不能的全能語音 AI 可能確實難以實現。這幾乎成了一個悖論:
如果 Amazon 能夠做到一切都無縫和快速,你甚至不需要知道自己在和第三方開發者互動,披薩也能神奇地出現在你家門口,那樣就會帶來巨大的隱私問題,同時也引發人們對 Amazon 如何選擇服務提供商的質疑;
如果讓使用者自己去選擇所有這些預設設定,那就意味著每一個新使用者都得做大量繁瑣的「設定」工作。那就會破壞 Alexa 最初的簡潔和吸引力。過度的簡化和抽象也會成問題。
不過,目前我們正處在一個轉折點。十年之後,Alexa 正在發生兩方面的變化。一方面是好訊息,另一方面可能是壞訊息。
好訊息是,Alexa 不再僅僅是語音的,甚至也不再是以語音為主的體驗——隨著 Echo Show 和 Fire TV 裝置的普及,更多人開始在有螢幕的裝置旁邊與 Alexa 互動。這可能會解決很多互動中的問題,併為開發者提供新的展示方式,將他們的技能呈現給使用者。當 Alexa 可以顯示內容時,它能做的事情就會更多。
另外一個好訊息是,技術正在逐步跟進。大型語言模型和生成式 AI 有望讓我們與 Alexa 的對話變得更加自然。去年,Amazon 宣佈正在開發一個全新的基於大型語言模型(LLM)驅動的 Alexa,這個 Alexa 將更加主動、對話性更強,而不是像現在這樣單一的命令式。一個更智慧、AI 驅動的 Alexa,能夠真正理解你想做什麼,不再需要那些笨拙的語法來使用技能。它能夠理解更復雜的問題和多步驟的指令,並代表你使用技能。
這無疑是一個很大的進步。但儘管生成式 AI 有潛力讓語音助手變得更聰明,它並不是解決一切的靈丹妙藥。大型語言模型解決了「理解語言」的問題,但它們現在還無法在理解語言的基礎上做出實際行動,更不用說 LLM 幻覺可能帶來的風險了。
要讓 Alexa 真正變成像「計算機」一樣的存在,它需要具備上下文感知。為了高效工作,一個無所不知的語音助手必須全面瞭解你、你的家庭以及家裡所有人和裝置的情況。這是個相當複雜的任務。雖然 Echo 音響搭載的超聲波技術和智慧家居感測器可以提供一些背景資訊,但 Amazon 在一個關鍵領域明顯落後於競爭對手,那就是:你。
與 Google 和 Apple 不同,Google 和 Apple 透過智慧手機、日曆、郵件甚至網際網路搜尋,能夠獲取你的個人資料。而 Amazon 除了知道你在它的商店買了什麼東西,或者你允許它獲取的某些資料外,基本無法深入瞭解你的私人生活。而且,Amazon 在隱私保護方面的失誤也讓許多人對它失去了信任。
不過,Google 和 Apple 在智慧家居方面仍然沒有佔領市場主導地位,雖然它們也在積極進軍這個領域,但 Alexa 依然有著不小的先發優勢。據 Amazon 表示,「新 Alexa」可以完成透過列出任務建立的多步驟操作。再加上你家裡人的資訊、他們的所在位置以及他們需要做的事,Alexa 就可以透過一個簡單的命令來完成類似以下的任務:
Alexa,提醒我兒子不要忘了他的科學專案;他離開時設定鬧鐘。下午 4 點解鎖後門給水管工進來,5 點再鎖上。下午 6 點預熱烤箱至 375 度,如果我晚了,自動調整時間。
這種功能將為 Alexa 帶來全新的實用性,甚至可能足夠支撐 Amazon 實現收費,這也是它計劃中的一部分。
儘管去年表示即將推出一款由 LLM 驅動的助手,但我們至今沒有再聽到任何後續訊息。Amazon 今年甚至跳過了它的年度硬體釋出會,通常這場釋出會會展示數十款新的 Alexa 及相容 Alexa 的裝置和服務。據報道,這很可能是因為 Amazon 離實現它所承諾的「新 Alexa」還差得很遠。
Amazon 必須完成對 Alexa 的重塑,否則 Apple 和 Google 將會很快趕超它。
2014 年,Amazon 為家庭語音控制打下了基礎,在過去十年裡也為智慧家居的發展鋪平了道路。如今,Alexa 是最受歡迎的智慧音響語音助手,掌握著美國市場三分之二的份額。而在家庭之外的移動裝置上,Google 的 Assistant 和 Apple 的 Siri 則佔據了主導地位。隨著這兩家公司加大在智慧家居領域的投入,並逐步將 Apple Intelligence 和 Gemini 等智慧技術帶到家居產品中,Alexa 的主導地位或許會面臨挑戰。
實現一個由生成性 AI 驅動、具備上下文感知能力的智慧家居並不容易,充滿了各種挑戰,但憑藉其豐富的經驗和積累,Amazon 似乎是最有希望實現這一目標的公司——前提是它能夠克服自身的障礙。家庭是科技的最後疆域,現在是時候了,Alexa 需要向前邁出勇敢的一步,去開創語音助手的全新時代,真正成為智慧助手。
也有證據表明,Amazon 在 AI 領域可能有所滯後,插入一個語言模型也不一定能讓 Alexa 瞬間變得非常強大。(即使是最好的 LLM,它們在完成這些任務時依然感覺差強人意。)但即便如此,這也更讓我們關注一個更大的問題:虛擬助手到底能為我們做些什麼?我們又該如何讓它們幫忙?
答案理應是「任何你想做的事」,以及「你喜歡的任何方式」。這就意味著需要大量開發者為 Alexa 賦能。而這也需要 Amazon 提供一個足夠有價值的產品和商業機會,值得他們去努力。
The Verge 還梳理了 Amazon 推出的一系列失敗/停產的 Echo 硬體產品,從攝像頭到微波爐,沒錯,微波爐。
Echo Look
Echo Look,亞馬遜最奇特和最具爭議的 Echo 裝置之一,它可以捕捉到使用者穿著各種服裝的全身照片和影片。售價 199.99 美元,於 2020 年停產。
Amazon Tap
Amazon Tap 是亞馬遜第一款將 Alexa 與電源插座斷開連線,但需要連線 WiFi 的智慧揚聲器。2016 年推出,2018 年停產,售價 130 美元。
亞馬遜應該復活它嗎?是的,並非所有裝置都需要始終監聽。
Echo Buttons
Echo Buttons 是新「Alexa 小工具」系列中的第一款,是一款無線冰球形狀的蜂鳴器,可用於透過 Echo 智慧揚聲器玩單人或多人益智遊戲。售價 19.99 美元,於 2017 年首次亮相,但從未真正作為遊戲裝置流行起來,幾年後停產。
Echo Spot
Echo Spot,一個 2.5 英寸的圓形螢幕,可用於視訊通話,但它最好作為床頭櫃上的智慧鬧鐘。但也可以為那些有隱私問題的人停用攝像頭。它在 2019 年停產,但在 2024 年重新推出了沒有攝像頭的 Echo Spot。
Echo Connect
2017 年,Echo Connect 問世,幾年後停產。它是一個將 Echo 的通話功能擴充套件到實際的電話號碼的裝置,而不僅僅溝通 Echo 裝置。當插入電話插孔時,這個黑色的小盒子將 Echo 智慧揚聲器變成了可以撥打包括 911 在內的固定電話號碼的揚聲器。
亞馬遜應該復活它嗎?是的,如果只是為了我們的祖父母。
Echo Plus
2014 年最初推出,更新版本於 2018 年,最終於 2020 年停產。Echo Plus 包括一個經過重新設計的揚聲器,並希望成為一站式智慧家居中心。支援 ZigBee 但不支援 Z-Wave。
亞馬遜應該復活它嗎?不,現在有更好的智慧家居解決方案。
Echo Wall Clock
2018 年釋出的 Echo 掛鐘沒有麥克風,而是被設計成 Echo 智慧揚聲器的配件,使用一圈 LED 顯示當前時間和執行計時器的進度。亞馬遜後來與迪士尼合作推出了米老鼠版的時鐘,而 Citizen 則推出了替代設計。
Amazon Basics Microwave
儘管它沒有自己的麥克風和揚聲器,但售價 59.99 美元的 Amazon Basics Microwave 旨在連線到家中現有的 Echo 裝置,這樣你就可以透過語音讓 Alexa 用微波爐加熱土豆或一袋爆米花,而無需瀏覽烤箱上的烹飪預設選單並且在聞到燒焦味道時用語音命令停止。首次亮相四年後,微波爐停產。
亞馬遜應該復活它嗎?沒有,但我們會帶一個配備 Alexa 的空氣炸鍋。
Echo Input
Echo Input 是一個小型冰球形狀的加密狗,它使用音訊線或藍牙將音樂流功能和對亞馬遜 Alexa 的訪問帶到現有的揚聲器和音訊設定中。2018 年首次亮相,但考慮到其他 Echo 產品也可以連線到現有的揚聲器,Input 是多餘的,最終停產。
Echo Link and Echo Link Amp
Echo Link 和 Echo Link Amp 提供了更高質量音訊流的音樂服務。199.99 美元的 Echo Link 具有更多的輸出選項,用於連線到音訊系統的接收器或放大器,以及它自己的音量旋鈕。299.99 美元的 Echo Link Amp 還內建了一個 60 瓦的放大器,可以直接連線到揚聲器。但它們在幾年內就停產了。
Echo Dot with Clock
到 2019 年,緊湊型 Echo Dot 已成為亞馬遜上最暢銷的產品之一,帶時鐘的 Echo Dot 有一個四位數的七段 LED 顯示屏,可獲得時間、天氣和計時器等資訊。2020 年更新為球形設計,2022 年更新為改進的 LED 點陣顯示器。帶有時鐘的 Echo Dot 於 2024 年停產,取而代之的是具有全綵 LCD 顯示屏的 Echo Spot 的復興。
亞馬遜應該復活它嗎?是的,並非所有裝置都需要螢幕。
Echo Loop
亞馬遜的 Echo Loop 智慧戒指於 2019 年首次亮相,是一款小型可穿戴 Echo 智慧揚聲器。使用者就可以用手與 Alexa 進行互動。儘管 Echo Loop 允許離散互動,但它的電池壽命有限,價格昂貴,為 179.99 美元,而且它的揚聲器有時太安靜而無法真正聽到。一年後,亞馬遜停止了 Echo Loop。
Echo Flex
2019 年首次亮相的 Echo Flex 售價 24.99 美元。這款微型智慧揚聲器可以直接插入牆上的插座,其功能可以透過模組化配件進行擴充套件,包括夜燈、運動感測器和數字時鐘。聲控智慧助理只有在離你足夠近的地方才能聽到你的聲音。最終於 2023 年停產。
亞馬遜應該復活它嗎?是的,但集成了模組化附件的所有功能。
溫馨提示:雖然我們每天都有推送,但最近有讀者表示因平臺推送規則調整,有時候看不到我們的文章~
歡迎大家進入公眾號頁面,右上角點選“設為星標”點亮⭐️,收藏我們的公眾號,新鮮內容第一時間奉上!