意外!又一超級獨角獸殺出:在北京海淀,全國第五

作者丨直八
近日,北京殺出一個超級獨角獸:雲知聲智慧,向港交所發起IPO衝刺,2023年營收7.27億元,位列中國智慧語音市場第五。
這家由前摩托羅拉科學家黃偉創立的公司,從2012年推出國內首個免費語音雲平臺,到2023年釋出600億引數“山海大模型”,十年間踩準了深度學習、多模態晶片、大模型三次技術浪潮。作為國內語音AI領域唯一的獨角獸,已連續六年(2018-2024年)入選CB Insights全球人工智慧獨角獸榜單,估值超85億。
這不僅是又一家AI企業的資本突圍,更折射出中國智慧語音賽道的爆發邏輯。這個千億賽道還隱藏著哪些新機會?
01 

全球排名第五

雲知聲智慧科技的創始人黃偉,是一位在人工智慧和語音技術專家,畢業於中國科學技術大學,獲得訊號與資訊處理專業博士學位。
畢業後,黃偉加入摩托羅拉中國研究中心,擔任高階研究員,專注於語音識別和自然語言處理技術的研究。
2011年,移動網際網路的快速發展,黃偉看到了語音技術在智慧裝置上的潛力,決定離開摩托羅拉,創立雲知聲。
2012年,雲知聲成立,彼時專注於物聯網人工智慧領域。同年9月,公司釋出國內首家永久免費的語音雲平臺,並率先將深度學習引入智慧互動領域。
2018年12 月,雲知聲與平安好醫生成立合資公司澔醫智慧,佈局醫療人工智慧 。
2019年1月,它釋出多模態AI晶片戰略,3月與世茂集團成立合資公司,助力地產行業智變。次年1月,雲知聲(子公司)推出業界首款車規級全棧語音AI晶片。
大模型爆火之後,它與360公司達成框架合作,在語音大模型等多個方向協同發展。
02 

產業鏈拆解

根據雲知聲的財務資料和公開資訊,其核心業務為智慧語音技術,主要覆蓋智慧生活和智慧服務兩大場景 。其中,智慧生活的收入佔比最高(可超80%),比如智慧家居、智慧酒店等。
智慧語音技術產業鏈可拆解為:上游為基礎層,提供硬體和資料支援;中游是技術核心層,負責演算法研發與平臺搭建;下游是應用拓展層。
2-1 上游:硬體和資料資源供應
硬體裝置供應:為智慧語音系統提供基礎執行硬體。晶片製造商如英偉達、英特爾等,生產用於語音處理的高效能晶片,決定了語音識別、合成等任務的計算速度與處理能力。麥克風、揚聲器等音訊採集與播放裝置供應商,像樓氏電子、歌爾股份,其產品質量影響語音輸入輸出的準確性與清晰度,優質麥克風能精準採集聲音,高保真揚聲器可還原清晰語音。
資料資源供應:資料是智慧語音技術訓練的關鍵。資料標註公司,如龍貓資料、海天瑞聲,透過人工或半自動方式對海量語音資料進行標註,包括語音轉文字、標註語義資訊等,為模型訓練提供高質量資料。
2-2 中游:演算法創新和平臺搭建,打造核心競爭力
技術研發與演算法創新:這是智慧語音技術的核心環節。以科大訊飛、雲知聲為代表的企業,專注於語音識別、語音合成、語義理解等關鍵技術研發。
技術平臺搭建:構建智慧語音技術平臺,方便開發者接入和使用。百度大腦語音技術平臺、阿里雲智慧語音互動平臺等,整合語音技術能力,提供語音識別、合成、喚醒等 API 介面和開發工具包,開發者透過簡單呼叫介面,就能在自己的產品或服務中整合智慧語音功能。
2-3 下游:全渠道銷售體系,觸達終端消費者
產品與服務應用:將智慧語音技術融入各類產品和服務,面向終端使用者。智慧家居領域,如小米智慧音箱、華為全屋智慧系統,使用者可透過語音控制家電裝置;智慧客服領域,許多企業採用智慧語音客服系統,如中國移動、招商銀行,透過語音識別和語義理解,自動回答客戶諮詢,提高服務效率和質量。
系統整合與解決方案提供:系統整合商將智慧語音技術與其他相關技術、裝置進行整合,為客戶提供定製化解決方案。例如,在智慧辦公場景中,系統整合商將智慧語音會議系統、智慧語音文件處理系統等整合在一起,打造高效的辦公環境。
03 

 智慧語音賽道全景

3-1 智慧語音的分類
關鍵詞識別:主要用於精準識別特定的關鍵詞或短語,常見於語音助手、語音控制等場景。語音轉文字:將語音內容轉化為文字形式,在語音轉寫、語音搜尋領域應用廣泛。
語音指令識別:專注於識別特定的語音指令,如在智慧家居、智慧手機裝置上,使用者可以透過語音指令實現開啟應用、撥打電話等操作。
語音情感識別:旨在識別語音中的情感資訊,如喜怒哀樂等情緒。在情感分析、客服等場景中發揮重要作用。
語音合成:是將文字轉化為語音,實現計算機生成語音輸出的技術。常見於有聲讀物、智慧客服語音回覆等場景。
3-2 智慧語音的市場規模及增速
中國智慧語音市場規模呈持續增長態勢。2023 年中國智慧語音市場規模達到 382 億元 。相關機構預測,2024 年市場規模將達到469億元,2025 年將進一步增長至 563 億元 。如此快速的增長,反映出智慧語音技術在各行業的應用不斷深化,市場需求持續擴大。
3-3 智慧語音的發展階段
智慧語音技術已從萌芽期邁入成熟期,並進入商業應用階段。多數技術已經成熟,實現了大規模的商業化應用落地。在消費級市場,智慧音箱、智慧車載語音系統等產品廣泛普及;在企業級市場,智慧語音技術在智慧客服、智慧辦公等領域得到大量應用。不過,該行業仍在持續發展,如車載語音市場在不斷細分,生態系統有待進一步完善 。
04 

 智慧語音上游產業鏈剖析

智慧語音上游賽道的核心資料要素包括語音資料和語義資料。語音資料涵蓋各種場景下采集的人類語音,像日常生活對話、特定領域專業語音等;語義資料則涉及對語言含義的標註和解析,如語句意圖、情感傾向等,幫助模型理解語言背後的真實意圖,實現更精準互動。
4-1解決的痛點:
在語音識別準確性上,由於缺乏大量多樣的語音資料訓練,模型難以適應不同口音、語速和複雜環境,導致識別錯誤率高。語義理解層面,有限的語義資料使得模型無法精準把握使用者意圖,互動效果差 。
4-2所處的地位強弱:
上游話語權較強,但不如中游。資料如同智慧語音技術發展的“燃料”,沒有充足、高質量的資料,中游的技術研發和演算法最佳化將受限,下游應用的功能拓展和體驗提升也難以實現 。
4-3主要代表玩家:
在資料採集和標註領域,有海天瑞聲、標貝科技等。海天瑞聲為智慧語音企業提供多場景、多語種的語音資料採集和標註服務,其資料覆蓋智慧安防、智慧車載等多個領域;標貝科技自主研發 AI 資料平臺,採用人機協同方式進行多模態資料標註,在智慧駕駛領域的資料採集標註服務表現突出。此外,一些大型網際網路公司如百度、阿里巴巴等,憑藉自身業務積累的海量語音和語義資料。
05 

 智慧語音中游產業鏈剖析

智慧語音中游賽道主要由語音技術提供商組成,負責將上游的硬體和資料資源轉化為可應用的技術和服務。這包括智慧語音解決方案提供商、大型網際網路企業以及初創企業等。
5-1所處的地位強弱:
智慧語音中游環節在整個產業鏈中的話語權很強。在毛利率方面,中游企業透過技術研發和創新,將上游的基礎資源轉化為高附加值的技術和服務,通常能獲得較高的毛利率。在寡頭集中度上,全球語音市場基本形成了寡頭壟斷格局,如科大訊飛、百度等企業憑藉技術和使用者積累,佔據較高市場份額。這些頭部企業能夠主導行業發展方向。
5-2 關鍵驅動要素:
技術突破:深度學習、大模型與語音互動技術的融合顯著提升了識別準確率和場景適配能力,推動AI客服、智慧助手等新應用落地。
政策導向:國家《人工智慧產業綜合標準化體系建設指南》等檔案明確技術研發方向,地方政府透過專項基金和稅收優惠加速產業佈局。
5-3主要代表玩家:
頭部企業(如科大訊飛、百度)憑藉技術壁壘主導市場,而云知聲作為垂直領域代表,以“雲端芯”一體化戰略聚焦醫療和物聯網場景,其語音電子病歷和車規級晶片凸顯差異化優勢。行業驅動力來自大模型技術突破(如多模態融合)、政策支援(國家AI標準化)及智慧家居/車載需求爆發,形成“技術-場景-生態”閉環競爭格局。
06 

智慧語音下游產業鏈剖析

下游核心是各類終端產品和服務中,直接面向消費者和企業使用者。
6-1解決的痛點:
在智慧家居方面,解決了傳統家居裝置操作繁瑣的問題。智慧車載領域,改善了駕駛者手動操作車載裝置存在的安全隱患;智慧客服領域,有效緩解了企業人工客服成本高、效率低的問題;智慧教育領域,傳統教育模式難以滿足每個學生的學習節奏和需求,為學生提供了個性化學習支援;智慧醫療領域,解決了醫生病歷錄入耗時久的痛點,提高了病歷錄入的效率和準確性,減少醫生工作負擔。
6-2所處的地位強弱:
下游賽道競爭激烈,產品同質化現象較為嚴重,企業需要不斷提升產品的差異化競爭優勢,緊密貼合用戶需求,才能在市場中立足。
6-3主要代表玩家:
下游產業鏈五大核心應用領域呈現以下競爭格局
場景垂直化:企業均透過深耕特定領域構建壁壘(如雲知聲醫療電子病歷、思必馳車載晶片),技術方案高度定製化;
生態協同性:頭部廠商依託生態優勢擴張(小米家居聯動、百度內容整合),垂直企業透過技術授權融入產業鏈;
技術代際差:大模型推動競爭從功能互動轉向認知互動,具備語義理解與閉環能力的企業(如科大訊飛多模態技術)佔據先機。
07 

未來1-3年新機遇

7-1技術創新推動應用拓展:
多模態融合技術的發展將為智慧語音帶來更豐富的互動方式。智慧語音與視覺、手勢等融合,使裝置能更全面理解使用者意圖,在智慧車載和智慧家居領域,實現更自然便捷的互動體驗。比如,駕駛者在雙手忙碌時,僅靠語音和簡單手勢就能完成複雜操作
7-2新興市場需求增長:
智慧語音控制領域的新興市場需求呈現爆發式增長,主要受三大因素驅動:
智慧家居普及:語音助手(如小愛同學、天貓精靈)透過生態聯動實現全屋控制,推動全球市場規模從2024年127億美元躍升至2034年5146億美元,年複合增長率達44.8%。
車載與醫療場景深化:車載語音系統提升駕駛安全(如科大訊飛前裝方案),醫療電子病歷(如雲知聲系統)最佳化診療效率,垂直領域定製化需求激增。
技術代際升級:大模型賦能多模態互動(如阿里雲ET語音API),邊緣計算降低延遲,推動智慧客服、教育等場景向認知互動轉型。
本文內容僅供參考,不構成任何投資建議。圖片源自AI圖片。

歡|迎|聯|系
想獲得調研,請聯絡:pencil-news
想商務合作,請聯絡:renguozhou2019
想加入創業社群,請聯絡:Pencil-news
想進行市場合作,請聯絡:Pencil-news
文章轉載,請聯絡:Pencil-news

推|薦|閱|讀
關|注|我|們
喜歡的話,記得分享、點贊和在看哦

相關文章