孵化DeepSeek的量化交易:一個數據驅動的隱秘世界

從十萬次交易到千億引數的 AI 進化。
來源 | 晚點LatePost
作者 | 孫海寧
1994 年,量化公司是當時最神秘最熱門的技術公司,他們僱用數學家和物理學家,成批買來高效能計算機做交易。
這個行業裡的標杆公司是 D.E. Shaw,它能在一天內貢獻紐交所超 2% 的訂單量。
這一年,D.E. Shaw 為計算機行業做了兩個貢獻:
一個副總裁帶隊,做出了當時罕見的免費電子郵件產品 Juno,成功上市;
另一個副總裁離職,帶著自己和老闆討論產生的好點子開車去了西雅圖,做出了全世界的電商鼻祖、市值超過 20000 億美元的亞馬遜。
30 年後,又有一家量化公司的 “副業” 影響整個計算機行業:
管理數百億元的中國頭部量化公司幻方,推出大語言模型 DeepSeek R1。
沒花一分錢營銷就震撼全球,使用者湧來的速度甚至快過早年的抖音。
貝索斯創辦亞馬遜,或者梁文鋒造出 DeepSeek 的主要原因自然不是因為他們做過量化,而是因為他們骨子裡都是創業者。
但量化投資這個極度追求人才密度且極度保密的行業文化,確實提供了適合大模型研發的環境。
招來一群聰明人不必然導致創新,疊加一個簡單的環境才夠。
量化公司證明了這一點,DeepSeek 則證明這也適用於大模型研發。
01

剝離主觀因素

在資料裡挖掘規律

“很多主觀投資說難聽點,就是靠打聽。” 
一名從業幾十年、調研過數千只基金的投資人說。
基金經理們也鑽研公開的財務資料,但他們同樣樂於組織業內人士研討會、支付每小時上千元的專家諮詢費,甚至僱上千人守在咖啡店門口拍影片,只為更早獲得獨家資訊,搶先同行一步下注。
於是,人脈變得和經驗一樣重要。
儘管橋水基金創始人瑞 · 達利歐把利率、匯率的變動原理寫成書,反覆講橋水基金憑它們投資,但《紐約時報》的記者覺得達利歐賺錢的真正秘訣是討好宏觀政策決定者,靠他們 “透題” 賺錢,也寫了本書論證。
量化公司完全放棄這些捷徑。
他們相信任何事都有人更早知道,自己也沒能力超越對手做任何判斷。
他們全部投資決策基於一個簡單的事實:
人類行為總是不斷重複,因此價格運動有規律可循,而計算機可以捕捉到這個規律。
足夠多人靠邏輯交易,會產生規律。
可口可樂和百事可樂都做汽水生意,受同樣的市場環境影響。
如果兩家公司股價差距沒來由地擴大或收窄,那至少有一家定價錯誤、價差總要回歸。
四十年前,先發現這個機會的投資者靠程式監測六、七隻相關股票的價差變動,就能撐起一隻管理 3000 萬美元的基金。
足夠多的人靠情緒交易,也產生規律。
可口可樂的投資者中總有自信過頭的,他們會更傾向於跟著自己喜歡的訊息買入,而把自己不喜歡的訊息當作噪音。
由此,新訊息只會將可口可樂股價向上頂。
學界發現過去收益好的公司,未來大機率還會好下去,把這規律稱為 “動量效應
量化研究員賈乾說,股票每天收益的波動中,最多可能有 5% 可被解釋。
他的工作就是找到能刻畫規律、解釋波動的 “因子”,基於它們構建投資策略。
可口可樂未來走勢與百事可樂過往股價、可口可樂過往漲幅相關,股價、漲幅資料就能作為 “因子” 投入量化模型。
因子可能是上面這樣容易理解的資訊,也可以更加複雜。
特朗普習慣把各種聳人聽聞的想法隨手發在 Twitter 上。
他第一任期內,J.P. Morgan 的研究員透過程式分析特朗普上萬條推文的語義、構建 “Volfefe” 指數,並驗證它可以解釋美國國債利率變動。
靠買賣國債賺錢的量化模型可以把 Volfefe 指數當作因子。
量化公司文藝復興創始人西蒙斯研究過月球週期對市場的影響。
路徑之一可能是:月動影響潮汐、潮汐影響航運、航運影響油價。
但他最終無功而返。
傳導鏈條太長、中間變數太多,因子對價格影響就難以識別。
機器學習方法在量化行業普及後,很多左右股價變化的因子已經完全無法用邏輯理解。
研究員確定評價因子的標準,輸入開盤價、收盤價、成交量等 “原始因子”,程式就能自動組合、迭代出更能預測股價的新因子。
投資機構 WorldQuant 曾分享過一個實際用於交易的 “較為簡單” 的因子:
 ((rank(correlation(sum(((open * 0.178404) + (close * (1 – 0.178404))), 12.7054), sum(adv120, 12.7054), 16.6208)) < rank(delta(((((high + low / 2) * 0.178404) + (vwap * (1 – 0.178404))), 3.69741))) * -1)  
除了能增加因子對價格的解釋能力外,沒人知道公式中的 0.178404 等數字有什麼現實意義。
但量化研究員不介意。
“如果是意義非常明顯的訊號,早就被用於交易了。有些訊號你不理解,但它們就在那裡,而且可能相對較強。” 文藝復興 CEO 彼得 · 布朗說。
量化研究員軒浩告訴我們,基於現實意義、拍腦袋想因子十分困難,“一天能想十個,就是天才了”。
人找的因子通常能持續幾個月、半年幫基金賺到錢。
而機器挖出來的因子失效非常快,“但架不住每天能產生幾千個。”
如果知道因子的人多了,搶著做同一種交易,它就會失效。
這讓量化行業在保密方面近乎偏執。
頭部量化公司會要求離職員工 18-24 個月內既不能自己交易、也不能去其他公司任職。
“俗稱 Gardening Leave,回家種花。” 軒浩說。
LinkedIn 簡歷中的 Gardening Leave
D.E. Shaw 創始人大衛 · 肖曾說自己公司安保水平媲美中央情報局。
被記者問 D.E Shaw 是否用神經網路演算法構思策略時,這名擁有數十億美元財富的創始人回答:
“我可以告訴你,然後必須殺了你。”
單次買賣可賺可賠,量化公司只關注大量交易時擊敗市場的機率。
2000 年初,文藝復興的大獎章基金每天交易 15-30 萬次。
“我們只在 50.75% 的情況下是對的。” 一名員工說,但這已足夠成就公司大獎章基金一年管 38 億美元、賺 21 億美元的成績。
02

僱聰明人

在簡單環境裡解決複雜問題

美國國家數學博物館每年舉行一次 “數學大師” 錦標賽:
聚起一群聰明人,比誰能在限時內能解出最多這樣的數學問題:
找到最小正整數 m,使 m²+7m+89 能被 77 整除。
2014 年比賽夜的參與者有陶哲軒,他 24 歲成為加州大學洛杉磯分校數學系終身教授,31 歲獲得 “菲爾茲獎”——數學界的諾貝爾獎。
不過他只是第二,贏過他的是約翰 · 奧弗德克,量化公司 Two Sigma 的聯合創始人。
奧弗德克可能也不是 Two Sigma 最聰明的人。
2015 年時,這家公司已經招了 130 名博士和 6 名國際數學奧林匹克競賽獲獎者。
奧弗德克前東家 D.E. Shaw 直接說自己招聘時有 “毫無歉意的精英主義”。
前美國財政部長、哈佛大學校長勞倫斯 · 薩默斯在 2006 年想去 D.E. Shaw 工作,同樣要做智力測驗。
受量化公司青睞的候選人往往來自數學、計算機、統計學等專業,金融、商科背景不是加分項。
創立幻方前,梁文鋒在浙江大學讀通訊工程,之後也偏好僱高中或大學時參加全國或國際學科競賽,比如 NOI(全國青少年資訊學奧林匹克競賽)、IOI (國際資訊學奧林匹克競賽),拿到好名次、最好是金牌的年輕人
沒競賽背景,最好本科能考上北大、浙大、清華等高校,學計算機、電子資訊工程專業。
“科學家做這行的優勢不是數學或計算能力,而在於他們的科學思維。”西蒙斯說,他們更不可能接受統計學上的偶然事件。
2022 年 2 月,一名拿過獎的首席分析師寫 “定量分析” 研報說寧德時代未來可能跌超 20%。
儘管他事後被證明結論正確,但推導方式卻訴諸偶然:
一年前,同為行業龍頭的貴州茅臺面臨相似的市場環境,兩家公司股價走勢長得也像,他據此推測茅臺過去的跌幅可以指引寧德時代的未來表現。
現在已經被撤回的研報中,貴州茅臺和寧德時代的走勢對比
量化則是不同的研究正規化。
Two Sigma 面試員工時,一個例題是如何用數學方法驗證 “CEO 離職,公司股價下跌”。
應試者和麵試官會討論實驗方案:
如何確定收集的資料樣本足夠多、足夠全面?
如何定義下跌——是用一天的跌幅,還是一週、一個月?
如何控制對照組和測試組儘可能相似?
如何區分 CEO 離職是因為能力不足還是正常退休?
如何區分股價下跌是因為 CEO 離職,還是在被大盤向下拽?
用哪個統計值做推斷、它超過多少時,要以多少置信度推翻假設?
哪怕選鄰居時,量化公司也和傳統金融行業保持距離。
Two Sigma、D.E. Shaw 們不在華爾街設辦公室;
幻方總部位於杭州,它和同行們的北京辦公室也聚集在清華科技園,而不是國貿、金融街。
選址本身就是一個宣言:
不靠人情世故、不靠勾兌資訊,潛心研究也能賺大錢。
去過 D.E. Shaw 辦公室的投資人覺得那裡安靜得像圖書館研究室;
文藝復興公司內有能容納 100 人的禮堂,定期舉辦科學講座,比如結直腸癌研究的最新進展。
“當聽到有人談論有趣的統計應用時,有助於激發思考。” 一名員工說。
希望聰明人持續創新,最好的方法是減少管控、干預。
軒浩就職於一家全球頂級量化投資機構,其內部有多個小組互不透風、獨立交易,就像一個個小投資機構:
各組只要控制好風險,投資方法論並不需要一致,每年扣掉交給公司的提成、資料介面等成本後,剩下的利潤都歸自己所有。
“有一個組瞄準一種另類資產,做一套策略賺了數十億元。所有人都財富自由了。”
另一類量化公司偏好集體決策。
全員共同打磨一個交易系統,但依然給員工自由發揮的空間。
在文藝復興,員工可以出入同事辦公室,尋求建議或發起合作。
研究員花大量時間用於成果展示,“如果沒有取得太大的進步,你會感到有壓力。” 一名員工說。
評判標準十分清晰:一天結束,賬戶裡的錢是變多還是變少。
這與網際網路公司顯著不同。
大廠的中層管理者把手下人數與晉升機會掛鉤,不會輕易允許下屬參與其他團隊分工,自己還要在雙月會上爭搶更多業務領地。
所有人都要在 KPI 或 OKR 中提前寫定自己下週、下個月、下個季度要幹什麼。
在難以分清個人成績和公司體系力量的大公司,只能用各種管理手段。
幻方的管理風格與文藝復興類似,並被 DeepSeek 團隊繼承。
後者辦公區會議室兩側都設定了隨手能推開的門,“給偶然留出空隙”。
“我們一般不前置分工。” 梁文鋒說,員工沒有 KPI,“遇到問題,自己就會拉人討論。” 當想法顯出潛力,公司會自上而下調配資源。
03

一種方式,用到極致

把數十億美元交給機器打點,完全相信它們是件反人性的事,哪怕對行業先驅也如此。
最早嘗試機器學習演算法時,西蒙斯並不放心:
“我不理解為什麼模型一直要求買入而不是賣出?這就是個黑箱!”
緩解焦慮不是靠退回人工干預,而是窮盡資料、算力,將演算法的潛力發揮到極致。
文藝復興的資料庫從 18 世紀開始,現在 “每天增長 40TB(1TB = 1000GB)”,他們還有 “52000 個計算核心與 150GB 每秒的全球傳輸速度”。
Two Sigma 則有 “超過 7200 個伺服器”“來自 10000 多個數據源的超過 300PB 資料(1PB = 1000TB)”。
呼叫資源、設計量化策略時則要執著於每一個細節。
軒浩舉例:一個模型預測股價要漲 20%,應該以什麼機率相信它?
模型說要下 1000 單,那應該在 10 秒、20 秒還是 1 分鐘內執行完?
賣的時候,是真要等到漲到 20%、市場交易量變小的時候,還是趁有人願意買,漲 15% 就提前止盈?
不是每一分投入都有相應的回報。
結果出現前,量化研究員甚至不確定自己努力方向是否正確。
伊黎試過從文字資訊中提取因子,先人工看完 1000 條樣本、打上標籤,用它們訓練一個自動打標的語義分析模型,還要訓練另一個模型驗證打標準確性。
輸入第三個模型分析後,她終於得出幾十個因子,測試完,所幸有五個可以用。
大模型迭代與之類似。
GPT 模型理論架構最早來自 Google,OpenAI 成為最終受益者,是因為敢在前景模糊時,租卡、買資料,花千萬美元一次又一次訓練更大的模型。
1.17 億引數,表現平平;
15 億,仍不驚豔;
1750 億,智慧湧現。
黃仁勳問 OpenAI 聯合創始人蘇茨克沃:
研發 GPT 模型時,你一直相信擴大規模能提高效能嗎?
“這是一個直覺。我有一個很強烈的信念,更大意味著更好。” 蘇茨克沃回答。
一個量化從業者感慨梁文鋒從浙大資訊與通訊工程專業畢業後,沒有選擇當時很好、之後會更好的就業機會,自己花幾年閉門琢磨用演算法買股票——
“這麼搞就不好再找工作了”。
到了 2021 年,大語言模型的影響主要還停留在學界,ChatGPT 沒誕生。
當時頭部量化投資公司個個用了機器學習,但只有幻方花出上億元買來一萬張英偉達顯示卡,執行各種大型 AI 模型。
成功的創業者往往押中一套正確的方法,將它貫徹到極致。
前者多少靠運氣,後者只能靠信念,是 AI 取代不了的決策。
  ·   END   ·  
視 頻 推 薦
合 作 對 接
尋求報道、商務合作、投融資對接媒體互推、開白、投稿、爆料等……

掃碼新增投資人說運營者微信,備註「商務合作」詳細溝通。


超 級 社 群
【投資人說】正在組建超級投資者社群、超級創業者社群、超級讀者群、超級媒體群等,目前總人數已超1000人。
關注【投資人說】微信公眾號,傳送資訊「進群」,與各行業精英直接交流,共同進步。
旗 下 媒 體
發現在看了嗎,戳下看看

相關文章