參觀了這家翻譯公司後,他們的想法把我看愣了…

說起時空壺,差友們應該不陌生了,畢竟之前差評君已經跟大家聊過好幾次這個做AI翻譯產品的品牌。

遠的不說,就在3個月前,我們舉辦了一場別開生面的“人機大戰”,作為AI翻譯代表出征的時空壺AI同傳耳機,就讓大家看到了其不同於人工同傳的優勢。
但您猜怎麼著,前幾天我刷影片的時候猛然發現,時空壺居然上了新聞聯播,並且播了得有近4分鐘。
咱們都知道新聞聯播一般也就播個30分鐘,如果不是在經濟、文化和科技等領域有突出表現的企業,不太可能有這麼長的報道篇幅。

不兒,哥們這麼有實力的嗎?

正好咱們前陣子剛聊過9.9美刀的AI翻譯耳機,以及接下來蘋果也將會給AirPods上即時對話翻譯功能。
要不趁著這波熱度,咱們一起到時空壺那裡看看,他們到底和市面上一眾“即時翻譯耳機”有啥區別,憑啥能上新聞聯播?

於是我和同事們一起來到了時空壺位於深圳南山的“老巢”。

到了他們公司後,我二話不說就開始嘎嘎體驗產品。

然後我就發現,雖然都叫“即時翻譯耳機”“AI翻譯耳機”,但是時空壺跟我之前體驗的其他產品,完全就是兩個東西。

舉個很典型的例子:其他產品在翻譯時,但凡你普通話不是很標準,把“人工同傳”說成“人工同床”,它就沒法給你識別和糾錯。相比之下,時空壺就能給你翻譯準確。
其他翻譯耳機的APP介面 

那對於這種體驗上的差異,時空壺又是怎麼看的呢?

一方面,他們覺得目前市場上的翻譯產品,在能力上還是參差不齊,需要有個統一的標準來劃分技術等級,不然會把本就不太成熟的AI翻譯市場給玩壞。
另一方面,時空壺之所以在翻譯準確度領先別人,也是因為他們更新了大模型翻譯技術。
先說第一點,他們目前已經在跟同傳領域的專家和學者們,一起研究搞AI翻譯技術分級。

具體怎麼去分級呢?

他們參考了自動駕駛的分級標準,也是劃分了L1到L5五個等級。
其中L1是最基礎的文字翻譯,相當於你自己查電子詞典,效率是最低的,延遲大概數十秒。
L2是從文字翻譯進化為語音翻譯,比如手持翻譯機、帶翻譯功能的藍牙耳機,可以給你播放語音翻譯,延遲大概十多秒。
L3已經是語音同傳翻譯了,在能力上非常接近人工同傳,基本能做到5秒延遲,可以讓對話雙方實現自由地交流。
時空壺給自己目前的定義就是L3級別。
L4進化為高階譯員同傳翻譯,如果說L3是接近人,那麼L4就是等同於人,到了這個級別,它能夠把你的語氣和情緒都給翻譯出來。
比方說,你說話的時候是帶著疑問還是憤怒,這些都可以在翻譯結果中體現出來。
而L5就屬於是超越人的範疇了,它可以基於多模態能力去觀察你想要表達的意思,比如你的表情,或者是你過去積累的一些表達習慣。
這個東西就相當於一個會“察言觀色”的智慧助理,真正的賈維斯了屬於是。

如果這個翻譯技術分級能真正落地,我覺得對於行業和消費者都是件好事。

有了分級,行業不再是一片混亂,想要割一波就走的企業沒法渾水摸魚;而消費者也能清楚自己花錢買到的產品到底是個什麼水平。

再來說說,他們的大模型翻譯技術是如何去提升準確度的。

產品經理跟我說,過去的機器翻譯無法理解語義和語境,主要依賴逐字直譯,不僅沒法識別各種語氣詞、停頓詞和重複詞,還容易鬧出一些笑話。
比如在點菜這個場景下,傳統機器翻譯由於沒法很好地識別“點”的意思,會給你翻譯成英語的“Click”,變成點選的意思。
對於這些問題,他們開發了全新的AI同傳翻譯大模型,並且國內也會接入豆包和DeepSeek等大模型。
在大模型的加持下,它能像人工同傳那樣,根據當下的主題和背景,聯絡上下文,分析對話的主旨,把你想要傳達的真正意思翻譯出來。

時空壺已經從以前的直譯進化為意譯了。

比如,同樣是“同傳”和“同床”的問題,時空壺就可以結合你的上下文,知道你當前聊天的內容與同聲傳譯有關,從而對翻譯內容進行糾錯。
在聽懂人話、傳達你的真正意圖這件事上,時空壺無疑又先於同行們邁出了一步。

而在跟他們聊了一下午後,我算是明白了,他們的成功秘訣就是:

願意在自己看好,但別人不看好的領域,投入大量的精力和技術,然後埋頭苦幹。
更具體的,咱們接下來再好好嘮嘮。
說起當時為啥會想到做AI翻譯耳機,時空壺的創始人田力表示,其實一開始他也沒想到去做這個東西。
2016年的時候他意識到AI技術是未來,於是從華為出來創業後,就想著朝AI應用這個方向發力。
一次偶然的機會讓他發現過去的翻譯產品始終存在侷限性。
他的父母有次去歐洲旅遊,雖然他提前幫父母下載了很多翻譯軟體,但當他媽媽在阿爾卑斯山突發高原反應時,卻無法透過翻譯軟體跟說法語的醫生進行很好的交流。
後來,他也自己嘗試著使用翻譯軟體去跟老外交流,結果發現這種按著說話、鬆開翻譯,只能你說一句、我說一句的翻譯體驗,壓根沒法實現長時間的對話。
過往的這些經歷和觀察,讓田力意識到,即便翻譯技術在當時已經非常成熟,但是在具體的對話場景中,兩個說著不同語言的人壓根沒法很自然地交流。
在找到了場景痛點後,田力就著手組建團隊開發產品。

但剛開始做,他們就碰了一鼻子灰。

原本他們的想法很簡單,就是把一個翻譯軟體直接塞進藍牙耳機。
至於具體的實現方案,他們覺得能在深圳找到合適的方案供應商,畢竟在電子產品這塊,華強北啥都能給你搓出來。
然而事實證明,他們當時選擇的是一條無人走過的賽道,行業也沒有可行性方案供他們選擇。
於是他們剛開局就遇到了行業的第一大難題:通訊。
是的沒錯,跟很多人想的不一樣,做AI翻譯耳機最難的還不是AI,而是通訊技術。
那它難在哪呢?
是這樣的,他們一開始設想的場景是,兩個人各戴一隻耳機進行交流。
但在產品開發階段卻發現,標準的藍牙耳機走的是單通道錄音,壓根不支援兩隻耳機同時錄音。

也就是說,兩個人各戴一隻耳機對話時,只有一個人的聲音能被錄進去。

這樣一來,他們的設想就失去意義。
估計當年大廠們圍坐一起討論藍牙協議的時候,也沒想到多年後會有一家初創企業有如此瘋狂的想法——基於藍牙協議去做多人錄音。
聽他們說,當時甚至還找了高通和海思等晶片廠商的工程師諮詢,但都沒有一個很好的解決方案。

由於沒有先例,行業裡也找不到現成的解決方案,所以時空壺只能夠自己搞。

他們從2017年開始自研通訊技術,經過4年的埋頭苦幹,終於在2021年釋出的時空壺W3上,實現了兩隻耳機同時錄音的“雙向通訊”技術。
但你以為搞定通訊技術就夠了嗎?

顯然不是的。

因為他們發現AI翻譯耳機要提升溝通效率,還要解決另一個難題:錄音降噪。
簡單來說,當兩個人各戴一隻耳機進行交流時,你的聲音很容易串到對方的耳機裡,對方的聲音也是如此。
同時,環境的雜音也容易對錄音效果造成影響。
而翻譯耳機不同於普通耳機,它對於聲音的質量有更高的要求。
正在進行降噪測試的W4 Pro
因為機器需要對聲音內容進行識別並翻譯,而機器對錯誤聲音的容錯率比人耳低,畢竟咱們可以靠自己腦補嘛。。。
對於這個問題,市面上的一些翻譯耳機搞了個“土辦法”,那就是用手動控制的方式,來避免兩個耳機出現串音——
打個比方,兩個人在交流時,需要一個人按下按鈕講完話後,另一個人才能在耳機聽到翻譯結果,然後接著同樣的操作進行交流。
“這種類似交替翻譯的形式,溝通效率是非常低下的,甚至不如你用傳統的翻譯APP。”時空壺的產品經理這麼跟我說道。
相對而言,時空壺的解決方案是,給耳機用上三麥克風陣列+向量降噪技術。
相當於透過演算法判斷聲音的方向和距離,確保只錄入佩戴者的聲音,然後對其他無關的聲音進行抑制。
這樣哪怕是周圍環境非常嘈雜,耳機也只會收到你自己的聲音。
那實際效果是不是有他們說的那麼牛X呢?

我們也替大家試了一下。

即便是在耳機旁邊播放動感舞曲和增加人聲干擾,經過降噪處理後,它也能保證只錄進佩戴者的聲音,消除掉其他噪音。
除了溝通效率的問題外,產品經理跟我說,準確度和延遲也算是行業內的技術難點。
關於準確度,咱們開頭已經聊過了,這裡就不再囉嗦了。
而說到延遲,產品經理表示:過去的文字翻譯,只要網路好,它甚至可以做到零點幾秒給你出結果,並且還能不斷地根據上下文去調整翻譯結果。
但是語音翻譯不行,因為語音一旦開始合成播放,它沒法像文字一樣隨時糾正,這就導致了在快速地播放翻譯結果時,大機率會出現翻譯結果越來越歪的情況。
所以你會看到,目前市面上的很多AI翻譯耳機,為了保證準確率,它都會等你說完一整段話後,才開始出語音翻譯結果。
為了解決這個問題,他們搞了個叫做AI語義判斷的技術。
讓AI即時判斷每句話的語義,一旦它覺得你這句話的意思不會發生改變了,那麼它就會開始輸出語音翻譯結果。
按照他們的測試結果,行業內其他家能做到的最低語音延遲也就是十幾秒。
相比之下,時空壺是已經做到了5~8秒的平均延遲,跟人工同傳大概3秒左右的翻譯延遲相比,算是很大的進步了。

總之,跟他們這麼一頓聊下來,我感覺做好一個AI翻譯耳機,遠沒有大家想的那麼簡單。

市面上類似的產品千千萬,但實際想要搞好體驗,藍牙通訊、錄音降噪、翻譯引擎、語義判斷。。。等等等等,每一座“大山”都不好啃。
而時空壺作為開拓者,顯然給行業證明了這條賽道的可行性。
按照他們的說法,在AI翻譯裝置這個品類中,時空壺在北美亞馬遜的市佔率已經做到40%,過去3年裡他們實現了產品銷量年均100%的增長。
並且今年海關總署還將他們的產品,作為2024年“中國製造升級”案例進行展示。
圖片來自深視新聞
可以說,時空壺已經成為AI出海企業的標杆。
從攻克各種技術難關,建立技術壁壘,再到提出翻譯分級標準,時空壺確實貫徹了他們創始人的創業哲學——
“在混沌中尋找出路才是小公司的出路。”
目前來看,他們的出路似乎已經找到,但隨著他們不斷探索AI翻譯領域的“無人區”,面臨的挑戰也會越來越多。

這裡咱也只能祝願他們能夠一路披荊斬棘了。

撰文:粿條   
編輯:米羅   
美編:煥妍
圖片、資料來源
時空壺、央視新聞


相關文章