
量化投資與機器學習微信公眾號,是業內垂直於
量化投資、對沖基金、金融科技、人工智慧、大資料等領域的主流自媒體。公眾號擁有來自公募、私募、券商、期貨、銀行、保險、高校等行業40W+關注者,曾榮獲AMMA優秀品牌力、優秀洞察力大獎,連續4年被騰訊雲+社群評選為“年度最佳作者”。
作者:Matthias Hanauer、Amar Soebhag、Marc Stam、Tobias Hoogteijling

本文研究了在股票收益預測中,是否需要使用行業特定的機器學習模型。作者比較了三類模型:一體化的“通才”(Generalist)模型、行業特定的“專家”(Specialist)模型,以及結合兩者優勢的“混合”(Hybrid)模型。研究發現,混合模型在樣本外預測能力上明顯優於專家模型,且在多個衡量標準上略優於通才模型,特別是在夏普比率和風險控制方面表現突出。透過美國與國際股票市場的實證分析,文章證明——將行業意識嵌入統一模型中,可以有效提高預測精度與投資組合的風險調整收益。核心觀點包括:
-
不同行業之間存在顯著的預測異質性; -
單一通才模型容易造成行業傾斜,導致風險加大; -
混合模型在兼顧行業結構和樣本量的同時,提升了學習效率和估計精度。
是否需要對行業單獨訓練特定的模型?
近年來,機器學習在資產定價中的應用迅速增長,大多數研究構建的模型都基於“一個橫截面預測一切”的前提,即通才模型。然而,既有文獻表明行業結構影響定價機制——企業間因所處行業不同而面對不同的市場摩擦、宏觀衝擊和監管環境。傳統機器學習模型大多采用“一刀切”的通才策略,將所有股票納入統一框架進行收益預測。這種做法忽視了行業間潛在的異質性:
-
行業內企業面臨相似宏觀衝擊、監管環境與供需結構; -
投資者與分析師在行業層面具備更強資訊處理優勢; -
實證研究顯示風險溢價存在行業差異。
因此,有必要探討不同模型設計對預測準確性和風險管理的影響。
模型設計
作者基於153個來自Jensen et al. (2023)的特徵變數,構建並比較以下三種模型:
-
Generalist模型:通用訓練,忽視行業特徵; -
Specialist模型:每個行業獨立建模; -
Hybrid模型:使用所有股票樣本,但特徵與目標值在行業層面標準化,實現隱性行業建模。 -
模型分別採用四種演算法:Elastic Net(線性)、GBRT(樹模型)、NN3(三層神經網路)、ENS(整合平均)。 -
資料來源與處理:涵蓋1957–2023年美股市場,排除微盤股;使用Fama-French行業分類; -
滾動訓練與測試:使用18年訓練集+12年驗證集+1年測試集的滾動視窗設計; -
目標變數:分別為全市場中位數、行業中位數的超額收益; -
評價指標: -
OOS R²(平均交叉樣本R²) -
資訊係數(IC,預測與真實排名的Spearman相關係數) -
投資組合的經濟指標:夏普比率、最大回撤、組合分權測試(spanning tests)
以下是論文中三種模型(通才 Generalist、專家 Specialist、混合 Hybrid)在關鍵維度上的異同的對比表:

實證結果
Generalist 模型存在顯著行業傾斜(尤其是科技 Tech 行業),顯示出其“無意識”地集中過度投資於某些行業。相比之下,Hybrid 和 Specialist 模型透過行業中性化排序或獨立建模,顯著降低了行業暴露偏移風險。

專家模型的預測效果(Sharpe)與行業樣本數量正相關。樣本多的行業,如金融(Finance)和科技(Tech),專家模型效果更好;而樣本少的行業預測效果顯著下降。這解釋了為什麼 Specialist 模型總體上表現不如 Hybrid 模型。

Hybrid 模型在半數行業中表現最好,其次是 Generalist,而 Specialist 表現最弱。這表明即使在行業內部預測收益時,混合模型也比完全行業分組訓練更穩健,具備較強的一致性。


該圖展示了特徵的重要性在行業間的穩定性與差異性。例如,“短期反轉”(ret_1_0)、“動量”(ret_12_1)、“skewness”等變數是多個行業共享的重要預測因子,而某些特徵只在特定行業有效。說明收益預測中既存在共通因子,也存在行業特有因子。

Hybrid 模型構建的投資組合在整個樣本期(1987–2023)中表現出最穩定、持續增長的收益曲線。透過對每月收益進行波動率調整,圖中清晰顯示出 Hybrid 策略在控制風險基礎上實現了更高的收益積累。這說明該模型在實證中不僅預測能力強,而且具備顯著的經濟效用。

以下是評價指標總結:
