
2 月 27 日,騰訊混元自研的快思考模型 Turbo S 正式釋出。
據悉,區別於 Deepseek R1、混元 T1 等需要“想一下再回復”的慢思考模型,混元 Turbo S 能夠實現“秒回”,吐字速度提升一倍,首字時延降低 44%,另外,透過模型架構創新,Turbo S 部署成本也大幅下降,持續推動大模型應用門檻降低。
在業界通用的多個公開 Benchmark 上,騰訊混元 Turbo S 在知識、數學、推理等多個領域展現出對標 DeepSeek V3、GPT 4o、Claude3.5 等業界領先模型的效果表現。


表格中,其它模型的評測指標來自官方評測結果,官方評測結果中不包含部分來自混元內部評測平臺
據介紹,透過長短思維鏈融合,騰訊混元 Turbo S 在保持文科類問題快思考體驗的同時,基於自研混元 T1 慢思考模型合成的長思維鏈資料,顯著改進理科推理能力,實現模型整體效果提升。
架構方面,混元 Turbo S 採用了 Hybrid-Mamba-Transformer 融合模式,降低了傳統 Transformer 結構的計算複雜度,減少了 KV-Cache 快取佔用,實現訓練和推理成本的下降。新的融合模式也突破了傳統純 Transformer 結構大模型面臨的長文訓練和推理成本高的難題,一方面發揮了 Mamba 高效處理長序列的能力,也保留 Transformer 擅於捕捉複雜上下文的優勢,構建了視訊記憶體與計算效率雙優的混合架構,這是工業界首次成功將 Mamba 架構無損地應用在超大型 MoE 模型上。
騰訊表示,作為旗艦模型,Turbo S 未來將成為騰訊混元系列衍生模型的核心基座,為推理、長文、程式碼等衍生模型提供基礎能力。基於 Turbo S,透過引入長思維鏈、檢索增強和強化學習等技術,騰訊自研了推理模型 T1,該模型已在騰訊元寶上線。騰訊混元表示,正式版的騰訊混元 T1 模型 API 也將很快上線,對外提供接入服務。
當前,開發者和企業使用者可以在騰訊雲上透過 API 呼叫騰訊混元 Turbo S,即日起一週內免費試用。定價上,Turbo S 輸入價格為 0.8 元 / 百萬 tokens,輸出價格為 2 元 / 百萬 tokens,相比前代混元 Turbo 模型價格下降數倍。
今年年初,扎克伯格宣佈 Meta 計劃用 AI 取代中級軟體工程師,與此同時,Salesforce 也表示今年將暫停招聘軟體工程師。種種跡象似乎都在進一步印證一個趨勢——AI 正在加速取代部分軟體工程崗位。在技術圈,人們一方面因 AI 帶來的生產力飛躍而興奮不已,另一方面,也難免瀰漫著一絲焦慮。
3 月 3 日晚 20:00 直播,一起圍繞“當下 AI 如何影響工程師的就業”、“工程師核心競爭力的再定義”等話題,探討工程師如何應對這場變革。

今日薦文
