WAIC唯一指定C位,AI「國家隊」又贏麻了!秒懂Hinton倫敦腔,現場殺瘋老外狂點贊


新智元報道  

編輯:Aeneas 桃子
【新智元導讀】WAIC 2025大會上,一套國產AI同傳系統技驚四座。從AI教父Hinton金句翻譯,到多語種即時翻譯,它實現了2秒極致響應,超8萬專業詞彙拿捏到位,如母語般絲滑交流。作為WAIC唯一翻譯合作伙伴,這家中國公司成為了全場矚目的焦點。
剛剛過去的WAIC大會現場,一套同傳系統徹底驚豔了全場。
AI教父Hinton的重磅演講《數字智慧是否會取代生物智慧》金句頻出,時不時引起全場讚歎。
當他用標準的倫敦腔講述自己的觀點時,幾乎就在張口的同一瞬間,標準的中文翻譯就同步出現了右邊的大屏上。
而在場的每一位觀眾,都能立刻秒懂對應的英文內容,因為右邊的字幕精準、流暢,完全符合中文讀者的理解習慣。
無論是多專業的術語,多深奧的表達,都能立刻被這套系統完美地捕捉,轉化出的翻譯極度符合語境。
演講結束後,現場爆發出熱烈的掌聲,可以說,一方面是出於現場觀眾對於AI教父精彩演講的反響,另一方面,也是對於旁邊這位由AI「國家隊」科大訊飛打造的「AI同傳」的肯定。
要知道,2018年訊飛還在和國內其他大廠同臺競技,共同為WAIC提供AI同傳服務;而到了今年,訊飛已經成了WAIC 2025的唯一翻譯合作伙伴。
走到這個位置,懂行的人都知道一款產品得做到多麼優秀才行。畢竟,WAIC的現場可隨時隨地都是真刀真槍的考驗——30多個國家、1200餘位嘉賓的即時交流場景,能完美做到無障礙跨語言交流,技術門檻可謂相當高。
七年裡,究竟發生了什麼,讓訊飛的產品成為了國際大會的AI同傳首選?

WAIC 2025唯一翻譯合作伙伴
訊飛如何做到?
這,就要從以往同傳背後的重重難點說起。
很多人認為,如今AI大模型的突飛猛進,即時語音同傳必然變得輕而易舉。
然而出乎大家意料的是,多年以來AI同傳其實都難以完全落地。
首先的一大難點,就是即時性與高延遲之間的矛盾。
因為同傳強調的是同步,延遲必須極短,翻譯結果必須準確,還要幾乎立即同時呈現。在這種極端情況下,很難避免翻譯質量的下降。
第二大難點,就是上下文語境的精準理解。
人類語言中充滿了歧義、隱喻、指代,這些都需要結合上下文才能準確理解。想要即時準確翻譯大量專業術語,就需要提前做好知識儲備和領域知識建模。
一些讓人啼笑皆非的AI翻譯翻車現場(左右滑動檢視)
更何況,大會演講者可能使用不同的方言和口音,甚至會出現口誤;會議的演講現場也環境複雜,會存在噪音、回聲、交疊說話等問題。
比如,這位日本科學院院士Toshio Fukuda的日式英語,對AI同傳就是不小的挑戰
此外,不同語言的結構差異,也會讓同傳的難度大大增加。比如中英文的語序截然不同,翻譯系統很可能需要等待一句話結束,才開始翻譯,這就會帶來嚴重的延遲。
同傳中還有一大難點,就是語音合成。在傳統同傳模式下,最終的翻譯由譯員的聲音播報,這使得聽感比視覺呈現更為流暢,不會對視覺造成干擾。
而在AI同傳要達到同樣的效果,就需要聲音快速無縫銜接,彷彿有一個真人在播報出來一樣。這就需要在技術上達到極細緻的要求。
而且,同傳需要同時實現語音識別、語言理解、機器翻譯、語音合成等多個技術模組的高度融合,技術鏈條複雜。
還有就是,高質量平行語料的匱乏,也制約了模型的訓練效果。

真正的同傳大模型,需要做到什麼?
好在,現在不少AI同傳產品,開始嘗試解決這些問題,一些還取得了不錯的效果。
在國外,諸如Zoom自帶的AI Companion和Zoom Interpretation這類即時翻譯與同傳工具,能夠很好地服務於專業會議及網路研討會。
不過,儘管它支援多種主流語言,整合度出色,非常適合商務場合使用,但翻譯質量尚有提升空間,且價格偏高,部分高階功能還需透過付費訂閱來解鎖。
Microsoft Teams,也可以透過整合Azure的語音識別和翻譯服務,從而實現多語種的字幕和翻譯,能支援70+種語言。
它的翻譯倒是很流暢,然而缺點也很明顯:設定複雜,需要一定的技術整合能力,這就大大提升了門檻,不適合亟需翻譯場景的小白使用者。
谷歌家當然也少不了類似產品。
比如Google Meet內建字幕功能+自定義整合Google Translate,就能實現AI同傳。
這個產品的特點是延遲低,非常適合教育和遠端協作。然而它的翻譯精度嚴重依賴語境,在專業術語的翻譯上時常出現翻車的情況。
影片中可以看出,Google Meet在英語和西語的互譯上延遲極低,效果不錯
在國內,許多AI同傳產品完全不輸外國AI。
其中,作為WAIC 2025的唯一合作伙伴,科大訊飛在AI同傳領域尤為引人注目。
縱觀市場上的主流AI同傳產品,競爭的焦點普遍集中在延遲、專業術語準確度、多語言支援以及語音效果等關鍵指標上。
在這些方面,訊飛星火語音同傳大模型均表現出色。
以往很多傳統的同傳大模型,基本上採取傳統的「語音識別+文字翻譯+語音合成」串聯模式,上文所提到的種種弊病,都難以打破。
然而所有這些「魔咒」,卻都被科大訊飛的星火語音同傳大模型克服了。
該模型基於機器學習(ML)和大規模語言模型技術,實現端到端語音即時翻譯。
基於星火X1底座,其在四大維度——翻譯效果、響應時間、專業覆蓋、語音品質上,呈現出系統性領先優勢,而非單點技術突破。
它模擬了人類譯員思維鏈路,透過智慧意群切分、上下文精準選詞和碎片化資訊重組,實現了無縫的跨語言即時交流。
在即時性、準確性和專業性上,它在行業內都做到了最優,如母語般絲滑交流。
在保證翻譯質量的同時,模型實現了2秒極致響應,達到人類頂尖同傳譯員的水平。
全新升級的語音同傳大模型,針對醫療、製造業、金融等高壁壘專業領域深度最佳化,覆蓋了超8萬個專業詞彙。
實測顯示,專業內容翻譯得分超90分,業內率先達到「可用」標準。
此外,其智慧雙語識別功能,在中英文混合發言的情況下,也能自動切換翻譯方向。
要知道,真正的同傳大模型,絕不能僅僅是翻譯工具,而是一種交流方式的徹底革命。
在這次Hinton演講的同傳任務中,星火語音同傳大模型的表現,實在可以稱得上是國民級AI同傳的水平,在全世界觀眾面前都十分拿得出手。
比如,當Hinton講到關於同一個詞語意義的兩種不同理論時,大模型在螢幕右側迅速給出了正確通順的翻譯——
「為了捕捉意義,我們需要一種類似關係圖的東西,心理學家曾相信一種截然不同的理論,即一個詞的意義只是一大堆語義和句法特徵」
這種學術性和專業性非常高的知識,大模型能夠即時給出足夠精準的翻譯,能力可見一斑。
可以說,當競品還在苦苦追趕「能用」的水平時,星火已經狂飆到「好用」的境界,堪稱AI同傳界的「卷王」。

國內首個同傳大模型
訊飛何以快人一步?
要說現在國內做語音同傳最牛的,訊飛可真是獨一檔的存在,其他家還沒有誰能跟上這個節奏。
而這個成就,可不是一夜之間取得的。可以說,訊飛的硬核實力,靠的是20多年來在語音技術領域的「死磕」。
早在2010年,這家公司就All in深度學習搭上AI快車,成為了全球最早一批搞機器學習的玩家。
一年後,其自研的基於深度神經網路「中文語音識別系統」正式上線,直接把行業甩在了身後。
這些都為後來的技術演進埋下了關鍵伏筆。
此後數年,訊飛在技術和應用上雙線狂飆,拿獎拿到手軟——
2018年,訊飛機器翻譯口譯能力首次拿下了CATTI翻譯資格考試;2019年,其機器閱讀理解能力,在全球首次超越人類平均水平。
在語音識別上,2016-2023年,訊飛連獲國際多通道語音分離和識別大賽CHiME五連冠;在多語種翻譯上,又在2021-2023年連續三屆拿下IWSLT冠軍。
如今星火大模型的快速迭代,直接把科大訊飛的技術底盤又往上拉了一層。
WAIC上,星火X1基於全國產算力平臺「飛星一號」,採用端到端架構,直接把傳統「語音識別-翻譯-語音合成」三步流程簡化成一步,極大提升效率、降低延遲。
這也就是為什麼,我們能看到Hinton說話和字幕的出現做到了神同步。
而且,基於X1的多語言能力,星火同傳大模型不僅能「聽懂」複雜語境,還能精準捕捉語義、語調和專業術語,全場絲滑無壓力。
而這背後,都是訊飛多年來廣泛積累的資料在做支撐——他們已經為全球超過40萬場國際會議做過同傳,資料維度廣,最不缺的就是覆蓋多語種、多場景的真實語料,堪稱行業翹楚。
更不要說,訊飛的開放平臺上,還擁有廣大的52萬海外開發者。這就讓資料池源源不斷,生態持續壯大。
總之,訊飛實打實地經歷了一場場真金白銀的考驗——從北京冬奧會、進博會,再到聯合國會議,無論是多麼高規格的國際場合,它的AI同傳技術都能carry全場,在每一次實戰中都獲得了滿場稱讚。
可以說,訊飛能在全球的AI同傳領域穩站C位,靠的就是一步步打出來的技術和經驗。
而現在國內首個同傳大模型的釋出,更是代表著全新的里程碑。不僅訊飛交出了漂亮的成績單,在全球賽道上衝到了最前排,也讓人類的「語言無障礙」變得越來越近了。

軟硬一體,用「服務閉環」征服WAIC
WAIC上,訊飛不僅以技術實力霸屏會場,更透過「軟硬一體」的戰略,完美適配了國際會議的複雜場景。
這一現象背後,折射出AI同傳技術的新趨勢以及市場競爭的新格局。
當前來看,AI同傳市場早已從單一技術輸出,轉向了生態的競爭。一些單一技術提供商或純軟體方案,往往在複雜場景下適配性不足。
訊飛軟硬一體戰略,並非是簡單的產品堆疊,而是以星火「全家桶」為核心,透過硬體協作持續放大的技術能力。
舉個栗子,首款搭載離線LLM翻譯裝置「訊飛雙屏翻譯機2.0」,能精準分離多方發言,自動切換翻譯方向,延遲率非常低。
WAIC展覽館中,一位來自泰國Omniscien公司的CTO Dion Wiggins對訊飛的多語種透明屏技術讚不絕口。
不僅如此,AI同傳的競爭已從演算法精度轉向了場景適配能力,而硬體是實現這一躍遷的關鍵。
相較於純軟體方案,訊飛翻譯硬體透過場景化設計,能夠直接觸達使用者需求。
WAIC現場3款新系列的訊飛AI錄音筆的首秀,分別針對學生、職場人、商務人士提供了定製化需求,並覆蓋了課堂、辦公等多種場景。
還有訊飛同傳和同傳耳機的協作,進一步放大了星火大模型的能力。
WAIC參會者透過耳機收聽AI合成的語音,再結合螢幕的即時字幕,即能體驗「聽譯同步」的沉浸式溝通。
更重要的是,訊飛的軟硬體協作邏輯,不僅在於單一裝置的突破,更在於多裝置的協同,形成了覆蓋WAIC全場景的「服務閉環」。
在大會的翻譯服務點,訊飛還提供了現場租借的翻譯機,讓參會者即拿即用,與全球同行無障礙交流。
這屆WAIC大會,涵蓋了開幕式、3場主論壇,以及19場分論壇,涉及到多語言、多場景的併發需求。
訊飛同傳透過大螢幕即時呈現多語種字幕,為開幕式和分論壇的順利溝通提供了保障。
這種從前端硬體到後端服務的閉環能力,恰恰體現了訊飛對國際會議場景的深刻洞察,也彰顯了其硬體賦能在提升服務效率上的核心價值。
當然了,能成為國際會議翻譯唯一合作伙伴,不僅要技術和服務過硬,還需強大的品牌背書。
如上所述,從2018年首屆WAIC開始,訊飛就承包了翻譯重任,為各路AI大牛們「搭橋」。
如今,訊飛憑藉其「全棧式」AI同傳解決方案,構建了「軟體+硬體+服務」三位一體的核心競爭力,以技術突破與生態協同重塑行業標準。
放眼未來,AI同傳在教育、旅遊、醫療等領域進一步滲透,硬體賦能將成為技術落地的關鍵驅動力。
訊飛將帶領行業打破語言壁壘,登上「巴別塔」之巔,讓全球溝通更加高效、自然。


相關文章