科大訊飛釋出首個基於全國產算力的深度推理大模型X1，率先落地教育、醫療

整理 | 褚杏娟

1 月 15 日，科大訊飛釋出了當前全國產算力平臺上唯一的深度推理大模型——訊飛星火 X1。該模型中文數學能力國內第一，並率先應用於教育、醫療等剛需場景。

同時，訊飛星火 4.0 Turbo 底座能力再次迎來全新升級，圖文、數學和長文字能力顯著提升，並首發混域知識搜尋技術，進一步解決行業、企業痛點。此外，科大訊飛還推出了業界首個具備端到端語音到語音同傳能力的大模型——星火語音同傳大模型，最快語音同傳時延小於 5 秒。

首個基於全國產算力的推理大模型

訊飛星火一直走全國產化路線。科大訊飛與華為華為合作，成功攻克了訓練推理強互動、高吞吐推理最佳化以及國產運算元最佳化等一系列難題，最終成功訓練出我國首個基於全國產算力訓練的具備深度思考和推理能力的大模型——訊飛星火 X1。

釋出演示中，訊飛星火 X1 不僅準確給出了高考題、AIME 競賽題以及高中奧賽題題目的答案，還對解題思路和步驟進行了詳細拆解。與通用大模型相比，其解題過程更接近人類的“慢思考”方式。

訊飛星火 X1 展現出了深度推理模型的三大典型特徵：化繁為簡，運用長思維鏈分步驟解析能力，將複雜問題分步拆解簡化；進行自我探索和反思驗證；基於答案正確與否的優質反饋資訊進行強化訓練。

根據介紹，目前訊飛星火 X1 率先在教育等真實場景中實現了應用落地。去年 1024，科大訊飛聯合中國教育科學研究院釋出了基於“問題鏈”的高中數學智慧教師助手，同時也正面向全國百個試點區域、聯合千名優秀教研員和老師打造上萬個優秀案例。星火 X1 現已經部署上述試點區域。隨著訊飛星火 X1 相關技術的深度融入，科大訊飛 AI 學習機也將持續升級。

醫療領域，訊飛星火 X1 的模型策略已取得初步驗證成效，可使得專科輔助診斷和複雜病歷內涵質控的準確率均達 90%。釋出會上，科大訊飛還宣佈將在今年上半年正式釋出基於訊飛星火 X1 的醫療大模型升級版，確保其深層次診斷推理效果和質控能力業界領先。

訊飛星火 4.0 Turbo 底座能力

再升級，變得更懂行業

此次釋出會，訊飛星火 4.0 Turbo 底座能力實現了全新升級，七大核心能力全面提升，全面對標 OpenAI 最新版的 GPT-4o。此次升級最重要的特點，是針對行業、企業的痛點問題，在數學能力、行業知識、圖文識別、長文字能力等能力上實現提升。

據介紹，此次基於訊飛星火 X1 的高質量合成數據，訊飛星火 4.0 Turbo 的數學能力變得更強，可以在數學教學、金融分析和科研推演等工作中更好的幫助使用者。

圖文識別能力直接關乎著企業能否高效的採編和利用行業、私域資料，是大模型“學習”的基礎。在各行各業的實際工作中，經常面臨圖文識別的“疑難雜症”：如醫療的體檢報告、法院的文書、學術論文、企業合同等，還有複雜長表格、雜亂板式、手寫公式、印章手寫合同、傾斜少線等情況。為此，訊飛星火 4.0 Turbo 圖文識別能力升級，使得通用文件版面分析、文字識別的準確率相對提升了 40%，複雜表格結構、潦草手寫文字等方面的準確率相對提升了 60%，可以解決上述難題、大幅提升高價值資料的獲取能力。對比測試顯示，訊飛星火 4.0 Turbo 的圖文識別能力顯著領先國內外頂尖競品。

此次升級還針對性地提升了文件要素檢測能力，在知識切分和構建的粒度上更加精細、準確，能有效防止大模型幻覺，同時釋出了掃描文件解析的極速版本，文件理解速度提升了 10 倍以上。對於一份 500 頁的專案檔案，從掃描、識別到解析的全過程，僅需 2 分鐘即可全部完成。

大模型的長文字能力一直是使用者關注的重點，特別是在企業知識問答這類嚴謹的應用場景中，使用者對大模型幻覺的容忍度幾乎為零。因此，訊飛星火推出了基於智慧體的全新長文字框架，並行業首發了句子級溯源功能。這一新框架優化了超長注意力機制，同時利用大規模網頁和書籍資料進行知識關聯式合成，使得知識回覆的錯誤率降低了 40%，句子級溯源效果更是超越了 GPT-4o，顯著緩解了問答搜尋服務中因大模型幻覺而需要反覆溯源確認的應用落地難題。

考慮到不少使用者在寫報告、做調研這類工作時，往往需要花費大量時間蒐集資訊、整理資料，基於圖文、長文字能力的提升和行業應用能力的積累，訊飛星火行業首發了混域知識搜尋技術。該技術能夠實現對個人知識、企業知識、業務系統資料、精品行業資料以及網際網路資訊的綜合搜尋，使用者只需一次提問，即可獲得綜合搜尋後的結果，大大提升資訊搜尋效率。

首發星火語音同傳大模型

釋出會上，科大訊飛帶來了在智慧翻譯領域又一突破：針對日常對話、商務交流、行業翻譯等國際交流場景中的高難度同傳翻譯需求，釋出了國內首個具備端到端語音同傳能力的大模型——星火語音同傳大模型。

“現在大模型能力的發展，結合訊飛在智慧語音技術上的獨特演算法積累，可以做端到端的語音同傳。”據瞭解，該模型透過模仿人類同傳譯員的思維鏈路進行訓練，具備即時意群理解和切分、上下文語境精準選詞以及碎片化資訊重組的能力，這一特性使得星火語音同傳大模型在處理複雜句式和語境時表現出色，能夠迅速準確地傳達原意。

根據訊飛的技術測試結果顯示，即便將訊飛的語音同傳技術和國外最優競品的交傳技術對比，訊飛語音同傳在內容完整度、資訊準確度以及語言質量上都處於領先水平，同時星火語音同傳大模型還可以最快實現僅 5 秒的同傳時延，達到人類專家譯員的水平。

另外，除了端到端的語音同傳能力，星火語音同傳大模型還促進了語音到文字翻譯效果的提升，使得科大訊飛全系產品的翻譯能力都得到顯著提升，在日常對話、單人演講、影視節目，包括場景更復雜、翻譯難度更高的多人會議等場景以及醫療等專業領域，為各種國際交流場景提供高質量翻譯服務。

釋出會最後，科大訊飛透露，針對語音到語音的同傳場景，訊飛翻譯機將會配置耳機、音箱、麥克風，在 2025 年推出商務套裝，滿足使用者在不同的商務洽談場景的使用需求。

會議推薦

在 AI 大模型技術如洶湧浪潮席捲軟體開發領域的當下，變革與機遇交織，挑戰與突破共生。2025 年 4 月 10 – 12 日，QCon 全球軟體開發大會將在北京召開，以 “智慧融合，引領未來” 為年度主題，匯聚各領域的技術先行者以及創新實踐者，為行業發展撥雲見日。現在報名可以享受 8 折優惠，單張門票立省 1360 元，詳情可聯絡票務經理 18514549229 諮詢。