清程極智聯合創始人唐適之：低成本DeepSeekR1推理挑戰與赤兔推理引擎實踐｜公開課預告

DeepSeek R1具有強大的推理能力，能夠透過多次推理和思考得出問題的最佳答案。但其中每一步推理和思考都會消耗大量的計算資源，進而提高了單次推理的算力成本。如何縮減DeepSeek R1的推理算力成本，降低私有化部署門檻，是全行業共同面臨的難題。

今年3月，清程極智聯合清華大學翟季冬教授團隊開源了大模型推理引擎赤兔（Chitu），率先實現了在非H卡裝置執行原生FP8模型突破。實測資料顯示，使用赤兔引擎在H800叢集上部署滿血版DeepSeek R1，相比於vLLM部署方案，能夠在減少50%的GPU使用量的同時，將輸出速度提升3.15倍。這意味著透過赤兔推理引擎，企業可以透過更少的硬體資源，實現更高的效能，大幅降低推理模型的私有化部署成本。

3月27日19點，智猩猩「DeepSeek大解讀」系列公開課第6期將開講，由清程極智聯合創始人唐適之博士主講，主題為《低成本DeepSeek R1推理挑戰與赤兔推理引擎實踐》。

本次公開課，唐適之博士首先會對DeepSeek R1與日益增長的算力需求進行分析，並探討有限硬體資源下的大模型推理取捨之道。之後，唐適之博士還會深入講解開源大模型推理引擎“赤兔”如何降低DeepSeek R1推理所需的硬體成本，尤其是在更廣泛GPU上的FP8資料型別的推理最佳化實踐。

第6期資訊

主題

《低成本 DeepSeek R1 推理挑戰與赤兔推理引擎實踐》

提綱

1、DeepSeek R1 與日益增長的算力需求

2、有限硬體資源下的大模型推理取捨

3、“赤兔”方案：更廣泛 GPU 上的 FP8 推理最佳化

主講人

唐適之，清程極智聯合創始人，清華大學計算機專業學士、博士，負責清程極智並行訓練、推理框架、運算元最佳化等各類技術研發。唐適之曾獲全國資訊學奧賽 NOI 金牌，曾為清華大學國際超算競賽 ASC/ISC/SC 三冠團隊成員，主要的學術研究領域包括程式語言、異構計算等，代表工作為 FreeTensor 程式設計框架。

直播時間

3月27日19:00-20:00

直播預約

本期公開課將以影片直播形式在智猩猩GenAI影片號進行，大家可以點選下方影片號卡片，提前預約。

如何報名與入群

針對此次公開課，也會組建交流群。希望入群與更多同仁探討的，可以掃描下方二維碼新增小助手“小石頭”，私信傳送“DeepSeek06”。