
量化投資與機器學習微信公眾號,是業內垂直於量化投資、對沖基金、金融科技、人工智慧、大資料等領域的主流自媒體。公眾號擁有來自公募、私募、券商、期貨、銀行、保險、高校等行業40W+關注者,曾榮獲AMMA優秀品牌力、優秀洞察力大獎,連續4年被騰訊雲+社群評選為“年度最佳作者”。
量化投資與機器學習公眾號獨家出品

何為半鞅?
一個定義在帶域流的機率空間的實值隨機過程 被稱為半鞅。
用更加通俗易懂的話來說就是:金融定價理論中的布朗運動和萊維過程都是半鞅,半鞅是最大的無套利隨機過程,超過半鞅以外將存在套利的空間。
很多量化私募會以數理概念或定義來命名自己,半鞅私募基金(以下簡稱“半鞅”)就是其中之一。半鞅希望透過量化技術獲得市場中的套利機會,推動金融市場不斷逼進半鞅。
早在2017年,半鞅就開始探索機器學習在金融領域的應用,成為國內最早一批將這一前沿技術引入量化投資的團隊之一。
半鞅在創立之初,其主要集中於技術積累與研究工作,因此並未立即註冊備案,而是花費了近兩年的時間構建獨特的底層技術架構和投資邏輯框架,這種與傳統機構完全不同的路徑使得半鞅能夠專注於技術的創新。加上多策略分散化的策略理念,使得半鞅在過去幾年中,即使在市場波動較大的情況下,也依然保持了平穩的業績表現。
近日,量化投資與機器學習公眾號(QIML)採訪了半鞅的投資總監王芹女士,我們將透過Quant的視角,為大家解讀不一樣的半鞅。
機器學習在量化投資中的應用
對於這個問題,QIML從創立至今,就採訪過很管理人,而大家的回答也各不相同。現如今,隨著軟硬體的提升和大模型的湧現,當我們再次問起這個問題時,想必大家會有和10年前不同的答案,半鞅亦是如此。
▌在股票和期貨策略研究中,機器學習的使用有哪些不同?
在這兩者的研究中,最大的區別主要在於資料來源的不同。
股票的資料比較豐富,例如包括快照、逐筆委託和逐筆成交等。而期貨的資料主要來源於交易所提供的500毫秒級切片資料。正因如此,當構建模型時,我們夠捕捉到的資料量與資訊是完全不同的。
說到這裡,我們提出了一個疑問——但對於傳統的量價資料,如果大家都基於此做因子挖掘,勢必會出現一些同質化或者失效、擁擠的情況,對於這一點,王芹總給出了不一樣的回答:
目前半鞅的股票端完全擁抱量價數據,沒有使用任何其他型別的資料。
例如你在因子加工端,假設我們與另外一家管理人的因子集或者特徵集90%是重疊的,那麼,無論後端我們怎麼去設計模型,其實都很難學出不一樣的東西。原因在於這樣的因子本身就自帶了很強的資訊量,它會引導模型去往該方向收斂,所以大家訓練出來的結果與別人訓練出來的結果差異性就會特別小。
早在4-5年前,半鞅就發現這個問題,也正因如此,便著手開始構建構屬於半鞅的端到端策略模型框架。
其中的一個動作就是把前面的因子端完全拿掉,半鞅希望喂到模型裡的資料是一些簡單原始的線性變換,這也是為什麼目前半鞅並沒有大規模使用其他型別的資料。正因如此,在同一時期如果大家去比較不同管理人的業績曲線,你就會發現半鞅的不同。
▌機器學習如何改進傳統因子模型的不足?有哪些具體的實戰案例?
傳統因子模型通常假設因子與收益之間存線上性關係,但市場中許多非線性關係無法被捕捉,限制了模型的表現。機器學習透過強大的非線性建模能力,可以有效挖掘複雜的因子關係。同時,傳統因子模型依賴人工篩選因子,效率低且容易受到主觀偏見的影響,而機器學習能夠自動處理大規模因子庫,快速篩選出重要因子,顯著提升效率。此外,傳統因子模型基於靜態邏輯框架,難以適應快速變化的市場環境。相比之下,機器學習模型能夠動態調整權重和結構,更及時地響應市場變化,從而最佳化因子的組合效果,提升投資策略的整體表現。
王芹總給出了一個她當年的心得體會:
在2017年,她自己建立的因子庫已積累超過1000個因子,當他們對這1000+個因子透過機器學習後發現,僅需簡單疊加兩層神經網路,就可以捕捉到這些因子的核心資訊,這讓他們深受鼓舞與啟發。
▌如何看待端到端的機器學習策略?比如原始資料直接到股票權重,還是會結合傳統的金融投資理論?
半鞅目前並沒有把所有的策略都透過端到端生成股票權重,原因有兩點:
1、如果直接生成到股票權重,那麼樣本的多樣性就會有很大的犧牲。例如你只需300只股票,最終我們得到的就只有300只股票的權重,這也就意味著剩下5000多隻股票的多樣性就會被埋沒,這對於模型的泛化能力是一個很大的損失。
2、目前整個量化產品線是非常多元化的,這就要求其風控也是要多元化的。在應對不同的風控要求或推出新產品時,端到端模型通常需要重新進行大規模訓練,這增加了很多開發和應用的成本。
因此,在實際應用中,端到端策略通常會與傳統金融理論相結合使用。模型透過生成交易訊號,交由最佳化器結合傳統的投資約束(如風險分散和行業分佈)處理,從而生成最終的股票權重。這種“技術與理論結合”的方式既發揮了端到端模型的資料處理能力,也保留了傳統理論的指導價值。
▌如何平衡因子的可解釋性及因子多樣性?
對於這個問題,也是業內十分關注的一個話題。
在半鞅看來,他們並沒有過多關注因子的可解釋性,因為半鞅所做的機器學習模型與傳統的多因子框架是兩個完全不同的概念。前文也提到過,半鞅餵給機器學習模型的資料都是原始資料的簡單變換,半鞅在乎的是資料量綱的匹配與時序的平穩性。
反過來說,如果從樣本多樣性的角度來看,經歷大的波動行情其實對機器學習模型是有益的,因為我們可以讓模型看到更多樣的資料,以後再遇到類似資料時會更加從容。同時,我們只要保證資料來源和變化方式的多樣性,模型會自行判斷資料的價值,而無需過多地從可解釋性的角度去考慮問題。
最後在模型上線之前,半鞅也會在內部對模型的可解釋性進行拆解,但這種拆解也有別於多因子框架,他們的目的很簡單,就是清楚模型在什麼市場環境下適應,在什麼情況下可能面臨壓力。
如果我們一直用多因子框架的角度來思考這個問題,有時會難以接受。因為從本質來說,機器學習模型和多因子框架是完全不同的兩條賽道,技術壁壘也是不同的。
▌實盤過程中,如何應對市場風格切換導致的失效風險?
半鞅回答的核心主要是以下幾點:
1、多策略的優勢;
2、異常情況下的模型定製化;
3、堅定提升日內收益率佔比,降低對風格切換的依賴和影響。
對於第三點,半鞅認為極其重要,因為你的收益不是因為你偏離在某一種風格上面賺到的!
▌對於短週期日內策略,如何平衡換手率與交易成本?
對於每一筆交易,只要你的預期收益大於預期成本,交易便具備執行價值。
因此,半鞅的策略優先提升模型對市場變化的預測能力,確保每筆交易都有足夠的利潤空間。儘管單筆交易可能收益有限,但透過高頻次的交易累積,使得策略能夠實現整體的高收益。
此外,半鞅也注重交易成本的精細化管理,例如透過最佳化執行演算法降低滑點等方式,從而進一步提升策略的盈利能力。這種以預測精度為核心,輔以成本最佳化的方式,確保了短週期日內策略在高換手率的情況下依然能夠保持穩健的盈利表現。
▌如何看待機器學習在量化投資中應用的天花板?
對於技術的迭代,還有很長的路要走,未來還是一片藍海!
這是半鞅給出的答案。
原因是目前的應用主要集中在深度學習和基本的模型最佳化,而更前沿的技術如強化學習和生成式模型在量化領域的普及度仍然較低。
在半鞅看來,AI只是一個工具,一個用來賺錢的工具。關鍵是不要陷入另一種固定思維,反而被侷限,而是要真正做到“為我所用”。在這個市場中,最終的競爭可能還是對投資的深刻認知。
技術架構與差異化優勢
除了機器學習,QIML還對大家關心的技術、風控與投研進行了採訪,讓我們看看半鞅是如何回答的。
▌QIML瞭解到半鞅專門為量化投資場景打造了一個大資料平臺。為此,QIML好奇的點在於,其自主研發的大資料平臺與其他市場通用的方案相比,效能提升的關鍵點在哪裡?
王芹談到,在半鞅在初期,他們就測試了市面上幾乎所有的開源資料庫平臺,但金融資料是一種有狀態的流資料,從交易所到平臺,其歷史資料是不會被更改的。也因此通用資料庫的功能對於其半鞅來說是不實用的。
根據半鞅的實踐經驗,如果是做日頻的交易策略,實際上開源的工具就足夠了。雖然可能會帶來一些複雜性,帶來一些時間損耗,但這對於日頻策略的損耗其實是有限的。
但如果做更加快速的預測,例如分鐘級別或者毫秒級別等,此時的開源工具就會給模型帶來很大的損耗,而其自研的大資料平臺就展現了其特殊的價值。
其次是因為與股票相關的很多模型與通用資料庫有一個很大的差別——許多股票模型是基於截面的,而通用資料庫則是基於時序的。這樣就會導致一個很大的問題,當我們在建模的時候會消耗很多時間成本。如何把一個時序資料流合理的利用到截面模型中去,這就是半鞅研發該大資料平臺的訴求與意義。
▌對於風控而言,大家比較關心的是如何避免極端行情中的風險敞口?
半鞅的回答是:風控系統是透過分級預警機制,根據風險事件的嚴重性對公司相關人員進行即時通知。
如從輕微的交易波動到可能影響資金安全的重大異常,系統分別推送給不同的管理層級,確保問題能夠被迅速識別並處理。這種多層次的監控體系和快速響應機制,能有效避免了極端行情中可能造成的重大風險敞口。
同時,半鞅的風控系統在“多層次交叉驗證”和“分級預警機制”上有著創新的應用。例如在交易即時監控中,系統引入了IT部門和交易部門的雙重交叉監控機制——IT部門基於內部監控系統捕獲公司交易流資料,而交易團隊使用獨立的第三方交易平臺數據進行核對。
▌在之前的文章中,QIML曾專門對當前量化機構的兩種模式——投資經理模式和流水線模型進行了深入的解讀。
其討論的結論是:在機器學習時代,流水線模式的量化研究更適合Quant的職業發展。像科研一樣做量化策略的研究,才是最符合這個時代量化投資機構的發展路徑。
那麼,與傳統量化公司相比,流水線模式下的投研流程具體解決了哪些行業痛點?
半鞅的流水線投研流程解決了量化投資中的重複性勞動和資源分配低效的問題。在傳統的PM制度中,不同投資經理獨立負責策略的全流程開發,這種模式導致了重複造輪子和技術資源浪費。半鞅透過流水線式的分工合作,將資料處理、模型訓練、訊號生成等環節模組化,由專門的團隊負責核心元件開發和最佳化。
同時,這種模式也極大地提高了投研效率。例如,資料組專注於構建高質量的資料平臺,而模型組最佳化機器學習演算法,訊號團隊負責策略的最終部署。透過分工協作,投研團隊不僅能夠專注於自己的專業領域,還能透過共享模組減少開發時間,從而顯著提升策略的整體質量和迭代速度。
▌還有一個大家關心的問題——Alpha策略的灰度上線機制
對於這個問題,半鞅給出了最好的答案:
只有迭代才能夠抵抗!
半鞅策略迭代的速度,遠遠超越了其模型失效的速度。
目前半鞅透過分階段部署新策略來控制風險。在新策略上線初期,僅將其應用於小部分資金或賬戶,以測試策略在真實市場環境下的表現。這種逐步擴大應用範圍的方法,確保策略效能在低風險條件下得到驗證。同時,透過即時監控新策略的收益、風險和穩定性,團隊能夠迅速識別失效訊號,並及時調整或替換策略。對老策略的逐步下線與新策略的快速迭代相結合,使得整體策略體系能夠保持高效的更新速度,從而抵禦單一策略衰減帶來的影響。
一家量化私募的成功與否,人才是最關鍵的要素,沒有之一!
這是QIML對行業調研後得出的一個結論。
一個最直接的答案就是策略是量化私募的核心競爭力,而策略的創新與最佳化離不開高水平的人才。縱觀國內外的量化基金,大家在用各種各樣的方式吸引全球的頂尖人才,如提供有競爭力的薪酬待遇、打造一流的工作環境和文化、給予廣闊的職業發展平臺和晉升空間等。
可能有的人會說,規模也很重要,因為大規模的私募往往更容易受到市場的關注和認可,樹立起較強的品牌形象。這不僅有助於吸引更多的投資者,還能夠吸引優秀的人才加入,形成良性迴圈。
但在QIML看來,在規模和人才的權衡中,注重質量才是關鍵。
對於這個問題,半鞅的回答也很真誠:
“薪酬給夠、心不委屈”
半鞅介紹到,在薪酬、年終獎和分紅激勵等方面,他們遠高於行業平均水平。此外,半鞅也十分注重員工的職業發展,透過明確的晉升路徑和對貢獻的認可,幫助團隊成員看到自身成長的方向。
此外,半鞅特別強調了他們的價值觀——“平等、坦誠、信任、創新”
“平等”體現在公司扁平化的管理結構中,團隊成員無論資歷如何都能暢所欲言,充分表達自己的觀點。“坦誠”則透過日常的團隊交流和反饋機制得以體現,團隊成員之間鼓勵公開討論,面對問題直言不諱,從而促進策略的最佳化和進步。
“信任”是半鞅文化的核心,公司給予每位員工高度的自主性,在分配任務時允許他們根據興趣和專長選擇專案,從而激發創造力。而“創新”則是投研的驅動力,公司鼓勵團隊成員探索新的方法和工具,透過持續迭代和技術突破,保持在行業中的領先地位。
這些核心價值觀的貫徹,為半鞅投研團隊營造了一個開放、高效、充滿活力的工作環境,使得團隊成員不僅能充分發揮自身潛力,也能在合作中取得卓越的成果。
如果在螢幕前閱讀此文的你正在尋求一份這樣的工作,可以嘗試投遞簡歷哦~
10年後的自己
訪談的最後,QIML希望半鞅給10年後的自己寫一段話:
10年的時間足以見證無數的變革與創新,而半鞅希望在這場變革中,能夠始終堅守初心,與一群志同道合的人一起,不斷突破自我,創造出真正有價值、有意義的成果。
這也許就是一家量化管理人的終極夢想!