量化投資與機器學習微信公眾號,是業內垂直於量化投資、對沖基金、金融科技、人工智慧、大資料等領域的主流自媒體。公眾號擁有來自公募、私募、券商、期貨、銀行、保險、高校等行業40W+關注者,曾榮獲AMMA優秀品牌力、優秀洞察力大獎,連續4年被騰訊雲+社群評選為“年度最佳作者”。


作者:沈暉
風評轉向很快,量化從股市敵對勢力到掀起科技國運,僅用了一年時間。
DeepSeek R1的開源,幾乎拉齊了中美大模型的代差,也重塑了量化行業的公眾形象。對於過去兩年深陷某種道德困境的量化私募行業而言,AI 實驗室成為了當下一個不可忽視的風口。在巨大的社會價值面前,擴招的訊息一個接著一個。
寬德Will Lab招募AI工程師,鳴石創世紀AI Lab招募AI科學家,蒙璽AI Lab招募機器學習實習生,黑翼、磐松、正定、啟林、世紀前沿近期也加入AI搶人之爭。
而頭部量化之間,這場AI軍備競賽其實早已暗流湧動。
眾所不周知的是,明汯已囤了數千張GPU卡,數萬張CPU核,在金融資料的應用場景下AI算力可以達到400P Flops;九坤更是與微軟亞洲研究院復現了DeepSeek R1模型,在此之前低調建立了Data Lab、AI Lab、水滴等多個AI實驗室。
看起來DeepSeek已不僅是資本市場信心重啟的重要催化劑,更變成了一些量化私募的OKR,激勵他們以更重要的角色參與到時代程序裡。
只是在與多位量化管理人交流後,筆者感受到一種溫差:如火如荼的投產之下,各大建立AI實驗室的量化在大語言模型能力上距離DeepSeek還很遠。反過來,DeepSeek目前對量化投研的幫助也十分有限。
整個量化行業,集體投入到建設AI實驗室的熱情中,真實意圖並不只是技術理想主義的追求。
量化難有下一個DeepSeek
開年以來,機構盡調量化私募時會多問一句,「你們家有多少張卡?」
雖說算力儲備難與投資能力扯上多少關係,但在很多盡調機構眼裡,卡的數量一定程度反映了量化私募的做成大模型的機率,對於一些銷售機構而言,這也是衡量量化私募未來的某種標尺。
但一個顯而易見的現實是,大多數量化私募目前並沒有足以支撐做大模型的算力。
大模型的算力門檻相當之高。幻方是全國為數不多萬卡叢集的公司,2021年,幻方對「螢火2號」AI叢集投入10億,搭載了1萬張A100顯示卡。2024年,DeepSeek V3官方報告訓練大模型使用了2048塊H800 GPU叢集。中存算董事長陳巍測算,幻方實際的卡數2.78萬張(A100+H20)+2048張H800,大概在3萬張左右的規模[1]。
多數量化私募並不具備如此闊綽的家底。
一名上海百億量化管理人向遠川透露:「當前購入大量先進顯示卡難度非常大,且成本高昂,建設大模型算力投入至少數十億,這就要求量化每年至少有10億利潤。即便如此,人才成本、時間成本、團隊磨合成本都不可忽略,未來幾年基本不可能再出一個DeepSeek,彎道超車難度巨大。」
另一名百億量化老闆告訴遠川,目前在算力和利潤上符合做大模型條件的另外兩家量化,只有九坤和明汯,「九坤規模體量足夠大,而且比較學院派,跟清華北大聯絡密切,有足夠的人才供給。」但據遠川瞭解,九坤與幻方的方向並不相同,相較基礎模型,他們更關注垂域模型並推動AI在應用領域的落地。
「而明汯,我覺得搞大模型不像老裘的風格,老裘還是希望在金融領域與國際頂級對沖基金競爭。」
簡言之,量化做大模型最大的兩個門檻是算力密度和人才密度,這兩者與鈔能力休慼相關。比如幻方沒有融資的顧慮,擁有大部分量化以及大部分AI 創業公司都難以企及的「造血能力」。
這種「造血能力」創造了鬆弛的研發環境,DeepSeek 160人研發團隊基本是沒有海歸背景和大廠背景的年輕人,BOSS直聘上DeepSeek招募的深度學習研究員年收入高達176萬,超越了降薪背景下很多公募投研。在優渥待遇的前提下,研發人員還能從容地獲得源源不斷的輸血支撐演算法行業的巨量失敗。
超額衰減的當下,多數量化自身規模尚不算殷實,面臨著未來更激烈的內卷,更沒有在晶片出口管制之前低價囤上數萬張卡,錯過了財富積累的黃金時間。
就算具備一切現實要素,創始人沒有利潤之上的價值取向也很難維繫持續的重金投入,就像朱嘯虎溢於言表的讚美,「梁文鋒的想法確實不一樣,他連幾個億的使用者都不要,任何考慮賺錢的角度都太世俗了。」
蒙璽投資告訴遠川,量化做大模型的視窗期已經過去了。「做這個的價值在哪裡?DeepSeek是開源的,在他們的基礎上改一改程式碼然後讓大家眼前一亮,怎麼可能?」
DeepSeek對投資幫助有限
DeepSeek橫空出世以來,金融行業瀰漫了一層焦慮,量化私募運用DeepSeek先進生產力,好比給本就強悍的策略增添了核動力。量化集體建設實驗室加碼AI,也意味著僅剩不多的超額未來或許會被加速榨乾。
倍漾量化CEO馮霽判斷:「三年內不使用AI的量化基金勢必遭淘汰。」在他看來,DeepSeek是向那些仍然不相信AI力量的人,作最後一次的呼籲[2]。
除了網際網路行業,資管行業數十家機構已爭先恐後地「接入」DeepSeek。中金測試其量化選股能力,發現2024年以來671b標準版DeepSeek-R1在行業輪動上有穩定超額[3]。大模型極大提高量化中後臺製作路演材料的速率,VS Code+Github Copilot比炸雞配啤酒還香。
雖然行業一片歡呼雀躍,但客觀看DeepSeek在投研上的主要應用於兩個維度,與其他大模型沒有實質區別:
一是輸入端拓寬另類資料獲取方式。DeepSeek能分析新聞研報文字、語音、影片多個另類資料來源,有很強的資訊處理能力,不僅能從新聞中獲取情緒因子,對專家訪談的回答質量也能定性判斷。
鳴熙資本基金經理陳昊煒,曾就職於美國對沖基金Point 72。他想起一個有意思的細節,當上市公司高管回答投資者問題時,Point 72創始人Steve Cohen 喜歡聘請FBI的專家來對他們的微表情進行判斷,觀察他們表達是否自信,話語是否存在貓膩。諸如此類的細節,為美劇《億萬》打造主角提供了非常多的原型參考。
「具備多模態的能力的大語言模型能透過微表情變化進行情緒判斷,把非結構化資料轉變為結構化資料。」陳昊煒說。
二是輸出端提高程式設計的效率。平方和投資對遠川表示,最直觀的變化是DeepSeek降低了投研人員在接觸新的程式語言時的門檻,「VS Code等編輯器也整合諸多AI外掛,實現從程式碼靜態分析到動態最佳化建議的全鏈路賦能,便於程式設計人員的程式碼分析、最佳化和管理。」
DeepSeek是能夠對程式碼層面的重構、金融語料的訓練、另類資料的處理等投研流程提效增速,但百億量化龍旗科技告訴遠川,「至少目前而言,大模型處理的精細度還遠遠達不到我們的實際要求。」龍旗認為透過基本面研究,結合機器學習特別是深度學習來處理資料構建模型,對他們來講比運用大模型更具實踐意義。
蒙璽投資很早在本地部署DeepSeek,最大的用處是輔助程式設計,「通俗來說就是找BUG。」如果研究員Prompt寫的足夠好,還可給DeepSeek喂研報,讓它自動去做因子。「不過在精細化層面,比如模型預測這塊我們是不太可能讓DeepSeek參與太多。」
對於絕大多數量化私募來說,DeepSeek等大模型對量化投資的實盤幫助有限。
從過程來看,大模型在處理文字及其邏輯上優勢明顯,量化投研則是資料處理上有更大需求,輿情類因子佔比不大;從結果來看,DeepSeek有幻覺和生產內容隨機性的侷限,模型輸出結果未必符合現在量化投研的嚴謹要求。
即使不聚焦DeepSeek,AI整體對量化也無法起到決定性作用。目前量化管理人的AI能力和基金的未來業績並沒有直接的正相關係,否則幻方就是業績最好的量化的基金。
AI作為一種科技工具,現已被廣泛應用於高頻量價的因子挖掘。雖然AI在機器學習、深度學習、大資料處理等方面能提供超越人類思維的演算法邏輯,為策略研發提供更多可能,但在當前市場AI更多是一種輔助工具,能發揮多少還得看管理人的水平。
特別是一些低頻量化、具有獨特資料處理邏輯與演算法的私募對AI的依賴性並沒有那麼強,這樣的團隊市場上仍是主流,其中不乏業績持續穩定的管理人。
既然時下大模型對量化投資幫助有限,量化私募距離做大模型還很遠。那量化集體佈局AI實驗室的目的是什麼?僅僅是看好量化未來的火拼,取決於各家AI實力?
DeepSeek對量化意味著什麼?
在非量化金融人士眼裡,國內量化做出DeepSeek似乎有其必然性。
因為DeepSeek降低訓練成本,原本就屬於量化的方法論,包括怎麼針對卡的叢集做更精準的調校,如何用浮點的精度調整文字模型。再加上量化對卡的使用較早,運用嫻熟,對叢集的理解比別人更強,所以很多人認為量化做出DeepSeek是一件自然的事情。
但在很多量化老闆眼裡,DeepSeek是一個無法複製的行業個例。
一個直觀的對比:美國擁有D.E.Shaw、Two Sigma等遠比幻方體量、實力強得多的量化基金,同樣在AI領域積澱深厚,更是沒有晶片制約,但做出世界級大模型的也不是他們。
在量化從業者們看來,DeepSeek誕生在量化行業本就是一個奇蹟,不僅重振了人們對中國科技與中國資產的信心,也間接地改善了量化的展業環境。
輿論壓力緩解的同時,量化的技術力量也引起了金融行業更廣泛的重視。近日,深圳私募基金業協會召開私募量化機構調研座談會,與16家頭部量化共同探討「AI+資產管理」,並對設立「量化創新實驗室」推動產學研合作提供政策支援。
蒙璽投資辦公地在上海,AI實驗室卻落地合肥。創始人李驤安徽人,畢業於中科大,當前是中科大金融碩士研究生指導老師。據遠川瞭解,蒙璽的目的不是追趕DeepSeek,而是另闢蹊徑吸引中科大的優秀學生,也有一部分回饋母校的情懷。
「我們做AI Lab是為了給中科大學生提供一些AI 相關的就業機會、實習機會。AI Lab如果能做出一些用到實盤的東西就非常成功了,如果能在主流期刊發表論文那就極度成功了。」蒙璽認為即使實現這些成果,距離做大模型還是很遠。
另一方面,在大學邊駐點是量化搶人的一種方式。比如李驤的校友,寬德創始人馮鑫就在北京高校邊駐點時發現人大數學系90後天才少年徐御之,後者一路晉升為寬德合夥人併成為公司最大股東。相比之前,AI實驗室總比量化炒股對頂級大學生更有吸引力。
過去,量化老闆最大的困惑是找不到在中國商業社會的站位——除了為市場提供流動性,自身的價值意義在哪?如果作為一種普惠金融幫老百姓賺錢尚且算是一種意義,但私募百萬申購門檻顯然把這層意義擋在了門外。
直到DeepSeek的出現,為量化行業打樣了一個實現社會價值的路徑,量化老闆的困惑也由此解開。某種程度上,量化私募集體設立AI實驗室不是為了造出下一個DeepSeek,而是在一個 AI 正在從方方面面改變和重塑人們的工作和生活方式的時代裡,將溢位的技術透過逐漸普及的應用反哺給更多的普羅大眾。