前華為員工創業AI翻譯耳機,拿下全球第一,年收入2億|Insight全球

當全球化越來越成為眾多中國公司的核心戰略時,如何征戰全球市場就成為一個極其專業的話題。在全球化的演變中,已有不少中國品牌站立潮頭。「Insight全球」專欄,從品牌成長與變遷,探索全球化品牌的前沿方向與時代契機,為中國品牌玩家與行業提供思考與啟發。
2016年,前華為工程師團隊錨定語言服務賽道,以5秒極速翻譯延遲與90分貝降噪技術攻克跨國溝通痛點;2023年登頂美國亞馬遜翻譯裝置銷冠,服務網路遍及170個國家和地區……中國硬體品牌如何以“自然對話邏輯+垂直場景深耕”,在AI翻譯紅海築起技術護城河?基於此,我們與時空壺CMO吳衛兵聊了聊。

林晴晴
編輯袁斯來
來源|硬氪(ID:ID:south_36kr)
封面來源企業供圖
時空壺創始人田力決定創業,是在他母親的一次意外後。
2015年,田力父母決定去歐洲旅遊。出發前,田力的媽媽下載了滿屏翻譯軟體,田力還專門給老兩口準備了翻譯機。
到了國外,翻譯機出乎意料地難用,簡單地買瓶水都要等機器反應很長時間。
旅途行至瑞士法語區的一座高山時,意外發生了。語言問題變得生死攸關。
田力的母親感覺身體不太對勁,頭疼乏力,疑似高原反應。兩人匆忙趕往當地醫院,卻發現居然完全無法交流。面對急診護士,老兩口對著翻譯機急促說話,卻因語速過快導致翻譯結果支離破碎。當老兩口沒辦法,用手拼命比劃時,護士又在埋頭研究翻譯機。很多時候,中文和法語你來我往,彼此聽不懂一句話。
一段焦灼的語言真空帶就這樣橫亙在生死時刻。
他們又花了些時間,終於把握到翻譯機的節奏,必須放慢語速、逐字吐詞,這才勉強能交流。
當聽父母說起這件事,田力一瞬間脊背發涼:如果母親不是高反而是更嚴重的疾病,是否已經發生不可挽回的後果?
他對跨語言溝通障礙並不陌生,此前的商務溝通中一些商務談判經常用到翻譯軟體。彼時他沒想過自己去改變現狀。離開華為後,他到了一家機器人公司,主導硬體開發。想過創業,卻沒看到什麼機會。
父母在歐洲的經歷算是給他一種啟發。根據世界衛生組織資料,全球超過10億人因語言障礙無法自由溝通。
從手持翻譯機到手機APP,傳統解決方案始終未能解決“自然對話”的痛點。“吵架時,沒人願意舉著翻譯機來回傳遞。”田力這樣說過。
顯然,這是個廣闊而未被滿足的市場。而田力希望能做一款“讓人忘記翻譯存在的裝置”,最貼近他想法的就是入耳式耳機。
2016年,田力找到大學同學,聯合幾個工程師,成立時空壺品牌,開始做可穿戴翻譯耳機。
他們經歷過產品大失敗、方向的調整,到2020年才推出第一款真正成功的耳機M2,這款產品當年迅速賣出10萬臺。2023年,時空壺登上美國亞馬遜翻譯裝置銷量榜首。2024年,時空壺又推出了W4Pro系列,總體營收超過2億元。
翻譯硬體是個傳統產品。海外來看,目前市佔全球第二的日本Post主打手持翻譯機Talkmate因技術迭代緩慢逐漸退出市場(已三年未更新產品),而谷歌、蘋果等大廠則聚焦於AI語音助手與耳機功能整合(如Pixel Buds Pro的即時翻譯),尚未形成規模化硬體。至於國內,市場上主要還是科大訊飛為首的翻譯機。
時空壺選擇了AI翻譯耳機這個相對新穎的模式,並做出了技術壁壘。在亞馬遜上,它們是華強北廉價翻譯耳機外唯一的品牌商家,所以即便價格和AirPods相當,也有不錯銷量。
當然,時空壺的生意還遠談不上穩定。ChatGPT開啟AI大模型浪潮後,翻譯質量和速度都上了一個臺階。如果硬體大廠下場整合,將直接刺入創業公司的領土。

終極訴求
最初,在田力的認知裡,做翻譯硬體是一個很小的事情,只需要找個軟體外包公司合作就能解決。
但隨著不斷地深入,田力發現,想要真正實現跨語言溝通,必須儘可能地還原母語交流時地場景,現有的方案根本無法滿足需求。
“使用者要的不是翻譯,是自然對話。”時空壺CMO吳衛兵告訴硬氪。
他們經歷了慘痛的教訓才明白這一點。2017年,時空壺首款翻譯耳機WT2 Plus登陸Kickstarter,憑藉“即時翻譯”概念眾籌超百萬美元。
但當極客們戴上耳機測試時,反饋卻令人尷尬:對話雙方需嚴格遵循“說完-等待-播放”的節奏,稍有插話就會導致翻譯混亂。“像和機器人對暗號。”一位早期使用者抱怨。
2018年,他們又嘗試了一款即插即用裝置,卻因收音缺陷滯銷20萬臺,損失上千萬,將公司逼到懸崖邊緣。
這次失敗讓團隊徹底轉向耳機品類,並錨定兩大技術痛點:即時性與抗噪能力。傳統翻譯機的序列處理模式(收音-翻譯-播放)導致至少2秒延遲,而藍牙協議的頻寬限制進一步加劇資料擁堵。轉機出現在技術路徑的“暴力拆解”,時空壺團隊將單通道藍牙拆分為四通道(雙耳獨立處理上傳與下載),如同在單車道馬路上強行開闢四條並行車道。
“就像在耳機裡建交通樞紐。”吳衛兵形容,“稍有不慎,左右耳資料就會‘撞車’,翻譯結果變成亂碼。”他們花了18個月才最終實現“邊說邊譯”功能,將對話效率提升2倍。
抗噪則是另一場硬仗。在東京澀谷的測試中,環境噪音導致翻譯準確率暴跌至70%。時空壺團隊開發出RNNVAD人聲識別演算法,透過聲源方向鎖定與距離感知,過濾90%背景噪音。“我們甚至要求工程師戴著耳機去夜店測試,確保在90分貝環境下仍能精準收音。”吳衛兵說。這項技術讓翻譯準確率在鬧市區提升至93%,酒吧點單、機場問詢等場景得以實現。
技術取捨始終是研發過程中的核心挑戰。2021年,團隊為壓縮翻譯延遲,一度簡化演算法校驗流程,卻導致商務場景翻譯準確率下降。某跨境貿易公司反饋,耳機將合同中的“不可抗力條款”誤譯為“無力條款”,引發法律風險。
“錯誤翻譯比等待更致命。”吳衛兵在內部覆盤會上強調。此後,團隊開始做出調整,日常對話呼叫谷歌、微軟等六大翻譯引擎,覆蓋通用需求,醫療、法律等垂直領域則建立自己的專用術語庫。據第三方測試報告,在涉及“冠狀動脈搭橋術”等醫學名詞時,時空壺翻譯準確率從通用引擎的76%提升至92%。
為平衡專業性與易用性,他們還增設“場景模式”功能——商務談判時採用正式書面語,旅行場景則自動切換為口語化表達。比如,一位經常出差的使用者舉例:“‘Let’s talk tomorrow’在商務模式下譯為‘煩請明日再議’,旅行模式下則是‘明兒再聊’。”
在M2推出後,時空壺終於爬出了低谷。他們接著推出M3、W3,熱度越來越高。2023年,時空壺登上美國亞馬遜翻譯裝置銷量榜首。
但此時,真正的戰鬥剛剛開始。
山寨圍剿,B端破局
沒有什麼電子產品,是華強北無法山寨的。
當時空壺成為細分品類第一時,深圳華強北的白牌廠商們自然聞風而動,推出“19.9美元AI翻譯耳機”,有的在TikTok用“跨國情侶甜蜜對話”短影片營銷,單月銷量衝到20萬臺。這些產品實為公模耳機搭配開源翻譯APP,實測延遲達3秒,退貨率超40%。
整個行業都步入晦暗。
“山寨機毀掉的是整個品類認知。”吳衛兵苦笑。更棘手的是,低價策略吸引大量首次使用者,他們誤以為“AI翻譯就該這麼便宜”,迫使時空壺投入雙倍預算教育市場。
面對山寨機的低價衝擊,時空壺選擇了一條雙軌並行的防禦路線。在C端市場,團隊推出售價1299元的T1新銳版,保留“雙向同傳”核心功能,但將離線語言從40種縮減至13種。“我們像做手機裡的‘青春版’,砍掉非必要功能,但必須守住技術底線。”吳衛兵解釋。
這款產品在亞馬遜Prime Day期間衝上翻譯裝置銷量前三,成功攔截下部分價格敏感使用者。
B端成了華強北廠商無法觸達的戰場。時空壺的確能拿出過硬的翻譯指標:5秒超低延遲秒與90分貝環境降噪——前者是離線翻譯延遲速度(手機依賴網路延遲),後者是隻識別說話者聲音的定向降噪能力(手機麥克風在同等環境準確率不足50%)。
技術表現成為企業支付溢價的關鍵。2023年,時空壺萬豪、希爾頓達成合作,將翻譯耳機植入酒店服務體系——外籍旅客入住時可租賃裝置,日租金僅為人工翻譯成本的1/10。在深圳盈科律師事務所,律師們甚至將耳機寫進保密協議條款:“客戶對話必須透過我們的裝置,禁止使用第三方翻譯軟體。”吳衛兵回憶。
B端使用者對效果極其敏感,時空壺的產品達到了他們的預期。深圳雲杉醫療的護士接待外籍患者時,用他們的耳機後,誤診率下降40%。深圳機場導遊靠耳機對接海外地接社,投訴率下降75%,墨西哥城某教堂用耳機雙語禮拜,信徒首次參與英語聖經討論。“大廠可以複製功能,但軟硬一體化的Know-how需要三年沉澱。”吳衛兵表示。
目前時空壺覆蓋40種語言、93種口音,平均準確率超95%,在醫療、法律等專業領域表現尤為突出。他們近六成營收來自亞馬遜,獨立站與線下渠道均攤其餘部分,產品覆蓋170個國家。
成立以來,他們見證了很多故事。曾有一個美國使用者Christian來感謝他們,他的妻子是委內瑞拉人,日常與妻子和岳父岳母溝通需頻繁使用耳機,他稱“產品拯救了婚姻”;也有日本使用者透過耳機向醫生準確描述了急性闌尾炎症狀。
未來三年,行業競爭或將聚焦多模態翻譯(語音、文字、影像協同)與垂直場景深化。AI大模型的逐漸成熟,也給時空壺這樣的創業公司帶來更多緊迫感。
無論如何,當硬體引數競賽趨於白熱化,時空壺的突圍背後,仍是一個樸素的理想:技術的終極價值,在於讓人重新成為人。他們無需學習語言規則,不必適應機器邏輯,只需如本能般開口說話。
“說到底,我們不是一家純粹做耳機的公司,而是解決跨語言溝通問題。”吳衛兵說。


相關文章