騰訊推出新一代快思考模型混元TurboS：主打秒回、低成本，將在騰訊元寶灰度上線

作者 | 褚杏娟

2 月 27 日，騰訊混元自研的快思考模型 Turbo S 正式釋出。

據悉，區別於 Deepseek R1、混元 T1 等需要“想一下再回復”的慢思考模型，混元 Turbo S 能夠實現“秒回”，吐字速度提升一倍，首字時延降低 44%，另外，透過模型架構創新，Turbo S 部署成本也大幅下降，持續推動大模型應用門檻降低。

在業界通用的多個公開 Benchmark 上，騰訊混元 Turbo S 在知識、數學、推理等多個領域展現出對標 DeepSeek V3、GPT 4o、Claude3.5 等業界領先模型的效果表現。

表格中，其它模型的評測指標來自官方評測結果，官方評測結果中不包含部分來自混元內部評測平臺

據介紹，透過長短思維鏈融合，騰訊混元 Turbo S 在保持文科類問題快思考體驗的同時，基於自研混元 T1 慢思考模型合成的長思維鏈資料，顯著改進理科推理能力，實現模型整體效果提升。

架構方面，混元 Turbo S 採用了 Hybrid-Mamba-Transformer 融合模式，降低了傳統 Transformer 結構的計算複雜度，減少了 KV-Cache 快取佔用，實現訓練和推理成本的下降。新的融合模式也突破了傳統純 Transformer 結構大模型面臨的長文訓練和推理成本高的難題，一方面發揮了 Mamba 高效處理長序列的能力，也保留 Transformer 擅於捕捉複雜上下文的優勢，構建了視訊記憶體與計算效率雙優的混合架構，這是工業界首次成功將 Mamba 架構無損地應用在超大型 MoE 模型上。

騰訊表示，作為旗艦模型，Turbo S 未來將成為騰訊混元系列衍生模型的核心基座，為推理、長文、程式碼等衍生模型提供基礎能力。基於 Turbo S，透過引入長思維鏈、檢索增強和強化學習等技術，騰訊自研了推理模型 T1，該模型已在騰訊元寶上線。騰訊混元表示，正式版的騰訊混元 T1 模型 API 也將很快上線，對外提供接入服務。

當前，開發者和企業使用者可以在騰訊雲上透過 API 呼叫騰訊混元 Turbo S，即日起一週內免費試用。定價上，Turbo S 輸入價格為 0.8 元 / 百萬 tokens，輸出價格為 2 元 / 百萬 tokens，相比前代混元 Turbo 模型價格下降數倍。

直播預告

今年年初，扎克伯格宣佈 Meta 計劃用 AI 取代中級軟體工程師，與此同時，Salesforce 也表示今年將暫停招聘軟體工程師。種種跡象似乎都在進一步印證一個趨勢——AI 正在加速取代部分軟體工程崗位。在技術圈，人們一方面因 AI 帶來的生產力飛躍而興奮不已，另一方面，也難免瀰漫著一絲焦慮。

3 月 3 日晚 20:00 直播，一起圍繞“當下 AI 如何影響工程師的就業”、“工程師核心競爭力的再定義”等話題，探討工程師如何應對這場變革。