
這個春節,DeepSeek憑藉高效能模型、低訓練成本和開源,引爆了全球AI界。
在技術創新的討論之外,我們也非常關注——如何將模型能力落地到具體應用場景?垂直領域的創業者如何抓住DeepSeek帶來的機會?
熵簡科技率先驗證了DeepSeek-R1和推理模型對於金融投研這一To B場景帶來的質變。
熵簡定位為AI投研領域的基礎設施提供商。公司最早服務國內大型資管機構,幫助客戶建設投研資料中心;大模型出現之後,熵簡順勢推出了旗艦產品AlphaEngine——一款面向金融人士的專業AI搜尋引擎,一年多時間實現機構投資者使用者從0到40000+的增長,服務了國內5000+家資管機構。基於AlphaEngine,使用者可以高效搜尋和查閱各類行業研報、公告和會議紀要,並透過FinGPT與資料庫進行問答。

DeepSeek-R1開源之後,熵簡迅速行動起來,用DeepSeek-R1結合高質量的投研CoT(思維鏈)軌跡作為參考,蒸餾了國內首個具備深度推理能力的金融大模型FinGPT Deep,並搭載於AlphaEngine產品上。
“上線以後市場反饋很熱烈,有很多使用者截圖說AI的回答太牛了,對比之前模型能力是質的提升。”熵簡科技創始人、CEO費斌傑說道。
有了深度推理能力,AlphaEngine能實現哪些升級?我們看兩個例子。
提問FinGPT:DeepSeek點燃A股後,有哪些實質意義上的關聯標的?可以看到大模型透過多步推理,給出了自己的答案。

近期小米股價和市值一路上漲,未來的投資價值如何?這是FinGPT基於基本面、業務增長潛力和估值分析給出的回答,背後有著精準的資料溯源,並展示出投研分析的思考過程。

“我們看到了AI輔助投研向AI輔助投資決策演進的可能性。”近期,我們和費斌傑做了一次對話,分享如何站在DeepSeek的肩膀上,推開AI投研新世界的大門。

以下是費斌傑的分享:

DeepSeek-R1允許使用者透過蒸餾技術訓練其他模型,而且春節期間DeepSeek非常火爆,我們就想到用DeepSeek-R1來蒸餾熵簡的FinGPT模型,那麼就可以在算力有限的條件下支援使用者的訪問。我們調了不到30張GPU、用了2周的時間,將R1背後600多億引數所蘊含的深度理解和長程推理能力遷移並蒸餾到FinGPT中,使其具備邏輯推理、因果分析和多步決策能力。
依託FinGPT的深度推理能力,AlphaEngine實現了三大核心功能升級:1)多步推理問答,2)精準資料溯源,3)融合分析師思維。
之所以我們能快速完成這項工作,並且讓產品體驗有了顛覆性的提升,源於熵簡積累的全面深度的投研資料庫和高質量的投研CoT。
實際上,目前投研領域的資料還遠未被充分挖掘。幾年前,大家高頻接觸的投研資料包括行情資料、財務資料、公告資料以及海內外研報;今天有一種新的形式出現了——會議。金融市場上每天都有大量的會議在發生,例如業績會、券商分析師面向客戶組織的各種公開和小型會議,這些會議時效性很高,也有非常大的價值。
熵簡集合了全市場最全的會議紀要,全行業日均更新300+場次。有人會說,如果要高效挖掘這些會議資料的價值,前提是語音轉文字的準確度要足夠高,“把A公司誤轉譯成B公司,AI分析能力再強也無濟於事”,加之投研領域有很多專業詞彙。因此熵簡針對會議場景推出一個名為FinAudio的模型,支援將投研領域會議音訊準確地轉寫為文字。
由於FinGPT背後接的是行業的私域資料庫,它的回答相比通用大模型更加貼近使用者需求。比如提問《哪吒2》上映後有哪些值得關注的關聯股票,其他大模型參考的可能是網際網路上的新聞報道等資料;而FinGPT參考的是一篇專家訪談、一篇研報,亦或是某個券商首席的會議分享。

此外,熵簡也積累了幾十萬的高質量投研CoT、即推理過程資料集作為冷啟動,也讓整個工作更快完成、模型效果更佳。

我們很早就在關注推理模型。OpenAI從Q*到Strawberry再到o1,原理都是將推理算力scale up之後,大模型推理能力提升,並且能湧現複雜的思考邏輯。o1本質上是把原本在大模型之外的推理的思維鏈能力內化到LLM中了。
DeepSeek-R1的橫空出世,標誌著一個全新的轉折點。DeepSeek不單純的是把OpenAI的能力學過來,復刻一個開源版的o1;而是在演算法、平行計算等方面有自己獨到見解和創新,例如純強化學習激發推理能力、GRPO演算法等。DeepSeek不是純粹站在巨人肩膀上,自己也成為了一個新的肩膀。
讀了R1的論文,我們感到非常興奮,因為帶給垂直領域的AI廠商顛覆性的改變。
1. DeepSeek驗證了用蒸餾方法可以把大模型的推理能力遷移至小模型,使得小模型的效能得到顯著提升甚至超越原來的大模型。帶給我們的啟發是,想要訓練一個行業模型,最好的方式是拿一個開源的基座模型去蒸餾行業小模型。
2. 有人說R1出來以後行業模型不復存在了;我們認為恰恰相反,有了R1,我們完全可以在一個垂直細分領域快速訓練出一個在行業中表現勝於R1的模型。
背後是2個邏輯:1)一個行業模型和一個同等引數規模的通用模型相比,經過行業訓練後模型在行業領域的效能會顯著提升;2)把一個大模型推理能力蒸餾到一個小模型,這個小模型處理行業問題的能力顯著高於其他同等規模的小模型。
3. 通用模型和行業模型一定是共生關係。可以想象一棵樹,通用模型是主幹,行業模型是枝幹,當主幹向上生長,側邊會長出新的枝幹。新的枝幹也就是行業模型,在領域中的能力一定會比通用模型優一個量級。
直到通用模型再往上進一個臺階,我們再在基礎上訓練行業模型,繼續為行業帶來新的變化。
4. DeepSeek-R1驗證了只要做純粹的強化學習,不需要大規模的標註資料,不需要做SFT(監督微調),就能讓大模型自己湧現推理過程。這提示我們,模型蒸餾應該準備行業特定訓練集,而且訓練集不需要靠人工標註,應該更多由機器以規則化的方式來生成。
換言之,只需要準備特定行業足夠多有明確結論的資料集,就能批次生成無窮無盡的訓練集。例如讓大模型推薦下週最有可能上漲的10支股票,大模型自己透過各種各樣的方式去推理最後給出答案,我們可以用一套明確規則化的評判系統檢驗這10支個股接下來一週的市場表現。當評判模型(股票漲跌)是100%準確的,訓練成本大幅下降,收斂速度也會快速提升。
5. 幾年前我們訓練行業模型,需要讓從業人員大量標註資料、貢獻知識,例如問模型某某公司應該怎麼分析其投資價值,那就需要分析師搭一個知識框架和圖譜丟給機器學習。而今天大模型透過強化學習能夠自己湧現智慧。
這是R1為第三方AI廠商帶來的重要機會。以往我們的痛點是沒有那麼龐大的投研團隊去貢獻知識,現在可以靠湧現的方式來攻克,那麼距離行業智慧化就不再遙遠。

從實際應用角度看,隨著大模型推理能力的進化,AlphaEngine可以實現此前受限的一些客戶需求。
去年我們就做了大量客戶調研,整理出一個涵蓋30多項功能的AI輔助投資“願望清單”。上一代大模型大概只能滿足其中20%的需求;有了推理模型,可以基本實現50%的需求。
例如最近攻克的一項能力——AI挖掘投資線索。挖掘投資線索是資管行業最核心的能力,投研本質上是在不確定性的資訊中去挖掘出正確的非共識。投資機會又包括短期機會(1周以內)、中期機會(1-3個月),以及長期機會。越是長期機會推理難度越大,因為其中思考的深度越深。目前推理大模型的能力比較適合挖掘一些短中期機會。
這也意味著R1的出現為智慧投研打開了一個很大的新空間。借用無人駕駛的L1到L4概念,之前我們做到的是L1,即AI輔助投研,在搜尋資料的時候AI幫你找得更準,可能替代的是實習生;R1出現之後,我們發現AI可以向輔助投資決策的方向演進,即L2,從中短期開始探索嘗試,未來逐步邁向長線投資。
未來再進一步,我們認為智慧投研的產品形態一定是朝著AI Agent的方向去演進的。從使用者體驗來說,除了自己搜尋,未來大模型可以每天為你整理和加工日報、主動推送給你,乃至自動執行一些任務。
暢想智慧投研的L4終局形態,可能每一家基金公司就是一個AI。員工要做的是餵給AI資料,為它挑選優質的訓練集,準備行業中獨家的優質資料,又或是訪談專家之後同步紀要,然後把這些資料給到大模型做綜合判斷。

我們的產品之所以命名為AlphaEngine,是希望打造一個引擎幫助投資者去產生Alpha(超額收益)。
我們堅定相信,深度推理型AI會成為全新的Alpha來源。關鍵是看投資機構誰能把握得更快,把AI能力內化。
為什麼這麼說?假設你是一位非常勤奮的投資經理,每天工作10個乃至12個小時,那一天參加8個會議基本是上限,加上每天市場上都會出現大量的新研報,還有各個媒體和大V的文章,個人是沒精力讀完的。而AI每天都可以讀完所有資料,再深度分析其中有哪些有價值的線索和機會。這件事情本身人做不到,但是機器可以做到。
未來,熵簡也將持續深耕投研領域,並將AI的能力貫穿到投研人士的工作流中。例如熵簡已上線專家服務模組,利用AI幫助投研人員高效匹配專家資源,讓專家call的價值充分發揮。

大模型狂奔之下,垂直領域的廠商更加應該做深做透,只有做到行業裡最極致,才能去體現價值,價值再變成利潤。就像我們一直所說的,“挑2釐米寬度的事,把它做到2米深”。
福利時間
投研神器AlphaEngine免費VIP權益
Web端:https://www.alphaengine.top
小程式端:AlphaEngine
APP端:https://www.alphaengine.top/app/index.html
在小程式或App端“我的”頁面,輸入“gaorong”權益碼即刻兌換1個月VIP權益。先到先得,送完即止。


