訊飛星火X1單挑滿血版DeepSeek-R1,全國產算力單機部署!中國AI再下一城


新智元報道  

編輯:編輯部 HNY
【新智元導讀】就在昨天,全國產算力訓出的訊飛星火X1全面升級!70B小身板在數學領域全面領先,效能直接對標OpenAI o1和DeepSeek-R1。單機部署成本驟降,徹底顛覆行業應用門檻。
業界唯一全國產算力訓出的深度推理模型,再次迎來全面升級!
時隔一個半月,星火X1在數學能力上大幅躍升,僅以70B引數規模,便追平了o1和DeepSeek-R1。
尤其是,在競賽級難題上再攀高峰。就中小學實用任務,新模型更是全面領先DeepSeek-R1。
針對小初高中文測試集(來自2023/2024各學段考試真題/模擬題/競賽題),星火X1拿下SOTA
令人振奮的是,這一切全是在全國產算力平臺上實現的。
不用依賴昂貴的英偉達卡,星火X1用更小的規模、更少的算力,就能對標671B滿血版R1和o1,充分證明了演算法創新在國產算力上的巨大潛力。
在自主可控的前提下,科大訊飛再下一城,這是中國AI的硬核自信。
從醫療到教育,從政務到司法,70B的星火X1正以更低成本、更高效率,加速釋放出行業的無限潛力。
星火X1再升級,數學登頂對標DeepSeek-R1
1月15日,星火X1首次亮相,便在多項指標媲美國際領先水平。此次,升級後的星火X1不僅「會算」,而且「會想」。
網頁端展示的解題過程,更加直觀完整,每一步的思考細節、反思邏輯、結論整合都一覽無餘。
同時,星火X1在中小學數學作業的批改、輔導以及題目推薦等任務上,已經展現出明顯的優勢。
還有新增的「識圖答題」功能讓體驗再升級,只需截圖上傳題目,即可快速獲取解答。
而現在,開啟訊飛星火網頁端/APP,進入深度推理X1即可體驗。

一手實測

先上手一道簡單的——2024北京中考第4題,根據所給的一元二次方程,求解實數C。
透過左下角「識圖解題」入口,選擇題目4圖片,AI直接開啟學霸做題模式。
星火X1先是精準分析、理解了題目的條件、要求,然後用時50秒,給出了詳細的思路歷程。
首先,先從概念上拿出一元二次方程的一般形式,以及判別式Δ=b²-4ac,而且只有Δ=0,方程才有2個相等的實數跟。
它透過對照後發現,原題目中給出的就是一個標準的方程式,由此得出了a=1,b=-4,需要求解c值。
接下來,它透過將已知的數值代入方程Δ=(−4)²−4⋅1⋅c=16−4c,最後得出了c=4,也就是選項C。
注意看,其實思維鏈截止到這裡,已經得出了正確答案。
那麼,下面的思考過程又是怎麼回事呢?
就像考場中的學生一樣,作為深度推理模型,星火X1也有自己的反思、驗證、自我糾正的過程。
更驚喜的是,它給出了另一種驗證方法:根據方程有兩個相等的實數根的條件,可以寫成完全平方形式,即(x – r)²=0(r是重根),展開方程式得到x² -2rx +r²=0。
然後再和題目中原方程比較,便可以得到r=2,常數c=r²=4。
最終,透過兩種方法得出了一致的結果,讓答案更加可靠。
上下滑動檢視
在給出解答中,星火X1用了中學知識點中更為常見的方法,即思維鏈第一種,給出了翔實、讓人易懂的求解過程。
再拿一道高中的機率統計題考考它:
已知隨機變數X服從指數分佈,其引數λ=0.3,求P(X>2)
收到題目後,星火X1很快就看出「這個題目看起來應該是機率論裡的關於指數分佈的問題。」然後,它開始使用機率論的知識進行推導。
首先,列出指數分佈的機率密度函式,並注意到了λ=0.3這個已知條件。
接著,意識到了求P(X>2)實際上就是這個機率密度函式從2到∞的積分。更聰明的是,它想到這裡面可能有現成的公式,從而不用從頭推導!
然後,它將λ=0.3代入到公式中去,很快就得出了正確結果e^-0.6。
值得一提的是,為了算出e^-0.6大概等於多少,星火X1非常聰明的先算了e^0.6的值,然後再求倒數就得到了近似值0.5488。
而在檢查過程中,星火X1則使用了多種不同的方法。比如為了驗證e^-0.6的值,它選擇了泰勒級數展開來算,直到達到一定的精度後才罷手!相當認真。
上下滑動檢視
最後的答案完美的渲染出了思考及解答過程。
接著我們給它上難度,找一道關於二元一次不等式的多選題給它試試。
看完題目後,星火X1開始了詳細的思考過程,並在177秒後,給出了正確的選項。
接下來,是一道常見,但略有難度的極限題。
經過302秒的長推理後,星火X1給出了正確答案。這麼長的CoT竟然沒被截斷,屬實厲害。
甚至,就連2024年AIME2競賽級難題,也可完美拿捏。
上傳第4題,星火X1用時2分多,透過拆解問題、詳細求解、反覆驗證,最終得出了33。
沒錯,最終的正確答案就是33。
這份亮眼成績單背後,離不開科大訊飛的兩大技術創新。
首先,透過高效領域資料自動化挖掘,以及多型別資料合成演算法,構建出了海量數學領域的預訓練資料。
其次,基於評語模型與RL演算法,激發了大模型長思維鏈的能力,以及在推理過程中的反思驗證,進一步提升了推理結果的準確性。

在訊飛星火X1具備了強大的能力之後,接下來的落地階段,便要考驗模型的行業適配性了。

單機部署,成本驟降

600B的超大模型效果確實很好,但部署成本高昂,讓許多機構望而卻步。相比之下,星火X1的70B模型,則有著顛覆性的優勢。
它不僅能夠單機執行,訓練更高效,最重要的是定製門檻低。更小的模型規模,可以讓科研單位、央國企、醫院等基於國產算力用上高效能AI。
具體來看,70B模型擁有700億引數,若每個引數以8位浮點數(1位元組)儲存,則引數記憶體需求為70GB。而671B模型(如DeepSeek-R1)擁有6710億引數,其引數記憶體需求為671GB。
單機若配備8張H800 GPU(每張80GB,總640GB),一臺不僅能容納70B模型,還能實現出色的併發效能。而671B的模型則需要至少2臺機器才能跑。
正如我們所見,70B含金量,不僅在於效能,更在於用更低的成本撬動更大的行業價值。
醫療、教育加速兌現,五大場景全面開花
現在,全新升級後星火X1,正為各行各業的應用,注入新動能。

星火醫療大模型X1重磅上線,AI醫療邁進「深度思考」時代

在醫療領域,科大訊飛首發深度推理星火醫療大模型X1,並將其正式落地旗下AI健康助手應用「訊飛曉醫」。
這一次升級,不僅讓曉醫從「知識查詢」工具進化成「決策輔助」專家,更標誌著AI醫療邁入了「深度思考」的新時代。
憑藉個性化、專業化、實用化,星火醫療大模型X1以醫學專家級的推理能力取得了重大突破。
如下所示,在診斷推薦、健康諮詢、檢查檢驗報告解讀等推理任務匯中,星火醫療大模型X1一舉超越了GPT-4o和DeepSeek。
資料來源:曉醫、智醫助理、安貞心內科等真實場景測試集
過去,AI健康諮詢往往千篇一律,難以滿足患者的個性化需求。而升級後的訊飛曉醫,首次實現了健康檔案與AI模型的深度融合。
不論是既往病史、檢查報告,還是用藥記錄,星火醫療大模型X1都能逐一分析,深入洞察患者的健康狀況和潛在風險。
這種從千人一面,到量身定製的體驗,才能讓AI醫療真正進入每個人的生活。
比如,針對「沙庫巴曲纈沙坦能否降壓」問題,訊飛曉醫不僅明確給出回答,還會詳細說明適用人群、禁忌症和劑量的調整建議,堪稱教科書級解答。
而像DeepSeek這樣的通用大模型,回答卻可能遺漏關鍵資訊。
此外,星火醫療大模型X1還解決了「建議答案寬泛不實用」的痛點,能夠給出更加個性化、實用的建議。
隨著星火醫療大模型X1在醫療場景的持續落地,無論是患者,還是醫生,都將得到AI助手更高效、更精準的智慧支援。

教師助手更會「思考」,盤活課堂教學

那麼,教育又該如何擁抱AI?
科大訊飛再次給出了創新性答案,讓AI不僅會教,還能會想。
基於星火X1的星火教師助手,也迎來了升級,透過教學思維視覺化,為老師打造從備課到課堂的全流程智慧助手。
在備課時,在教學設計過程中,星火教師助手能夠結合教師意圖,明確教學重難點、要達成的目標。且,它還做出了分步說明,幫助老師理解前後邏輯,激發靈感創新。
在授課過程中,它還能夠將「思維視覺化」,不論是學生對基礎問題提問,還是對複雜問題進階研究,都可以做到有跡可循。
比如,在合肥望湖中學的一堂歷史課上,老師丟擲了一個經典問題——如何評價武則天?
正是星火教師助手,讓這堂課變得與眾不同。
系統迅速呼叫了多模態知識圖譜,呈現出武周革命、《資治通鑑》等多元史料,透過語義理解和因果推理,拆解出評價的多個維度,最終生成清晰的三段論引導框架。
對此,在座的學生們驚歎道,「原來評價歷史人物需要多維座標系」!
智慧黑板上,AI生成的思維導圖動態展示了「統治功績與道德爭議的平衡考量」,ML演算法構建的認知模型讓抽象概念變得直觀可感。
這種教學方式,不僅讓歷史課從傳統的「背書」轉向「思辨」,更讓學生在研究中培養了批判性思維。
透過人機協同教學,教育生態正被悄然重塑。

星火+DeepSeek雙引擎,AI老師來了

課堂之外,家庭學習場景也迎來了革新。
科大訊飛還推出了首款「訊飛星火+DeepSeek」雙引擎學習機——T30系列。
兩個聰明大腦強強聯合,打造出一位診斷超快、推薦超準、輔導超細的「AI老師」。
基於星火的教育CoT和DeepSeek視覺化CoT優勢,這款學習機能根據孩子個性化學情資料,深入剖析學習弱項,並給出清晰的推理過程。
假設孩子在一個數學題上卡殼,AI老師會用「蘇格拉底啟發式」輔導,透過語音、影像、文字互動,引導孩子一步步找到答案,培養期自主思考能力。
相比原生DeepSeek,它能夠彌補教研理解不足、知識幻覺等問題,真正做到1+1>2。
在家長端,「訊飛AI學」親子助手中補充接入了DeepSeek,幫助家長與孩子有效溝通出謀劃策。
而且,訊飛AI學習機還實現了三大功能升級——AI 1對1精準學、AI 1對1英語口語陪練、家長端「訊飛AI學」,不僅讓孩子學習更高效。讓家長輔導更省心。

全新星火一體機,行業效率飆升

值得一提的是,科大訊飛還與華為強強聯手,釋出了全新升級的「星火一體機」——4U訓推一體機和2U推理一體機。
從算力、模型、訓練、推理到應用,一體機透過全國產化架構,為政企提供安全高效的AI底座。
此次升級,還深度融合了訊飛星火與DeepSeek的雙引擎能力,讓行業知識能力提升30%,模型幻覺率下降10%。
具體來說,星火一體機具備了多項核心優勢:
  • 面向昇騰硬體的大模型推流效能極致最佳化
  • 內建知識蒸餾、模型微調等成套工具鏈
  • 內建「一站式」星火智慧體平臺,三款精品智慧體到手即用
面向醫療、高教、政務、警務、法律等垂類場景,訊飛還專門定製了行業一體機。
  • 星火醫療一體機:內建基於千億級token權威醫學知識庫訓練醫療LLM,外加20個醫療專業智慧體、工具鏈,可高效學習專業資料。
  • 星火高教一體機:內建星火科研大模型,讓科研成果調研效率暴增10倍以上;內建工具鏈和特色語料庫,倒灶學科大模型;內建科研助手、智慧程式設計等智慧體應用。
  • 星火政務一體機:內建各類政務服務智慧體,辦件登記效率平均提升5倍以上。
  • 星火警務一體機:內建警務報告輔助生成系統,生成效率飆升10倍多。
  • 星火法律一體機:部署深度推理訊飛法律大模型,內建法律專業智慧體,支援部署法律專業工具鏈,高效學習私域資料。
自主可控,中國AI再下一城!
星火X1超進化的意義,遠不止一場技術競賽的勝利。
70B對標o1、R1的技術高度,證明了中國AI在業界唯一全國產化底層算力和演算法創新上的硬實力。
頂天立地,勇攀高峰,是科大訊飛成立以來一直堅守的初心,不僅要在源頭技術上創新,更要在應用落地中開花結果。
不難看出,星火X1已經跑通了許多垂類應用,從醫療、教育,到法律、政務等,實現了深度賦能。
這種「底座進步+場景兌現」的雙輪驅動,成為科大訊飛走向國民級市場的有力註腳。
回看DeepSeek-R1,它是國產大模型的一次高光亮相;而星火X1,則是中國AI的一次全面進階。
它不止於與R1比拼數學能力,更在應用廣度和深度上,樹立了全新標杆。
從一臺國產機就能服務千行百業,再到醫療教育的智慧化躍遷,星火X1讓大模型的紅利真正惠及科研機構、企業,甚至是普通使用者。
這種普惠性和實用性的結合,正是中國AI「再下一城」的核心價值。
未來,隨著大模型迭代和應用場景不斷擴充套件,星火X1的潛力還將進一步釋放。
從70B驚豔亮相,到自主可控的產業落地,科大訊飛用實際行動告訴世界:中國AI不僅能站得更高,還能走得更遠。

相關文章