NavigatingtheFactorZoo

作者:石川,北京量信投資管理有限公司創始合夥人,清華大學學士、碩士,麻省理工學院博士。《因子投資:方法與實踐》領銜作者,《機器學習與資產定價》譯者。
封面來源:www.pexels.com
未經授權,嚴禁轉載。
這是一個量化私募間非典型的 collaborative effort。
The Question
2011 年,時任 AFA 主席的 John Cochrane 在他的主席演講中首次提出 zoo of factors 這個提法,並提出鏗鏘三問:
1. Which characteristics really provide independent information about average returns? Which are subsumed by others?
2. Does each new anomaly variable also correspond to a new factor formed on those same anomalies?
3. How many of these new factors are really important?
至此以後,factor zoo 深入人心。根據 Google Scholar Citation 的統計結果,2011 到 2023 年的 13 年間 AFA 主席演講(按照慣例,AFA 主席演講會被髮表在 Journal of Finance 上)的 citation 次數如下圖所示。Cochrane 的演講獨一檔的存在,緊隨其後的是 Cam Harvey 的 p-hacking —— 也是一個和 factor zoo 密切相關的話題。(抱歉,我選擇性地對 Zingales 的 Does Finance Benefit Society“視而不見”。它當然非常重要,但和本文的主題並不相關。)
另一方面,如今的實證資產定價和從其中衍生出來的因子投資已然進入了協變數的高維數時代,而我們對於哪些因子是股票 cross-section 的核心驅動力的理解也在與時俱進。例如,在 Barra 剛剛推出的全新中國股票因子模型中,加入了股票擁擠度因子、機器學習因子等。在這樣的背景下,回答 Cochrane 的問題就顯得格外重要。
The Answer
如果說《因子投資:方法與實踐》系統闡述了多因子模型框架下的研究方法,但它並沒有對不同維度的因子進行詳細的說明。而我和“麥教授”(Michael Zhang)以及盧濤博士合著的 Navigating the Factor Zoo 則是為了彌補這個 gap 而做出的嘗試。
在內容上,全書第一章從資產定價理論出發勾勒了因子投資的整體框架,然後第 2 到 11 章分別從以下方面介紹了學界研究和業界實踐中最重要的大類因子:Quantamentals、Statistical Moments、Market Beta、Technical Analysis、Microstructure and Liquidity、Tail Risk、Behavioral Finance、Option Information、Uncertainty 以及 Alternative Data。最後,第 12 章以客觀的視角闡述了機器學習在因子投資中能夠發揮的作用(瞭解我的小夥伴一定知道,我在這方面的看法是倡導在資產定價理論的指導下使用機器學習,正如 Nagel 和很多學界大佬所強調的那樣)。
而在寫作風格上,除了學術文獻應有的嚴謹,本書還穿插了很多量化投資領域的有趣科普。例如:
又如:
除此之外,本書的另一個特點是隨書而來的一個 GitHub 開源專案 —— FIRE(Factor Investing Research Engine)。《因子投資》被很多讀者“吐槽”的地方是沒有提供程式碼 —— 儘管 www.factorwar.com 上提供了資料(而且五年後的今天還在持續更新!)。而這本 Navigating the Factor Zoo 的配套專案也算是彌補了我個人的一點遺憾。希望透過它,可以和各位小夥伴一起共同推進量化投資的邊界。
以上是關於這本新書的簡要介紹。和當年為《因子投資》所寫的介紹相比,這似乎很不“川總寫量化”。這是因為,我想把更多的筆墨留給創作這本新書背後的故事。
The Motivation
差不多是一年前的這個時候(2024 年 1 月),作為我清華和 MIT 雙料師兄的麥教授找到我,和我談起了這個 project,並邀請我加入他和盧博士一起,完成這本書的創作。
當時,這本書已有雛形。相較於最終出版的版本,當時的初稿的完成度大概是現在的 40%。但面對他們兩位的熱情邀請,我最初還是有些猶豫。原因是我不想也不能 take 他們二人的 credits。另一方面,他們二人除了學界的身份之外,更是執掌和管理著超量子基金。
你知道,私募和私募之間通常是沒有什麼交(he)流(zuo)的。原因,你懂的。
因此,從各個角度而言,我似乎都有充分的理由來婉拒這份好意(那麼也就不會有今天這篇推文)。而另一方面,我又有足夠的動機來接受這個邀請,並在我的價值觀下為這個 project 竭盡全力。而這個動機也和我寫公眾號的初衷如出一轍 —— 普及科學的定量化思維。(BTW,掐指一算,公眾號也已經寫了 9 年,我想我有資格鄭重的陳述自己的心路歷程。)
就國內市場的量化投資而言,高速發展的階段是 2016 到 2020 這幾年,量化私募的管理規模上升了一個數量級、超過 1 萬億。伴隨而來的,是資金和人才的湧入。毫無疑問,這些對於量化行業的飛速發展提供了客觀的條件。然而,人們對於量化的理性認知並沒有和行業的飛速發展相匹配。這也導致了一些無端的猜疑和不必要的誤解。然而,量化並非黑箱,也不是牛鬼蛇神。
量化首先是一種方法論。
定量研究是所有課題深入到一定程度之後的必經之路。人們在投資活動中積累了大量的經驗,這些經驗被抽象歸納,形成可以稱之為科學的投資學。量化投資的核心是對投資實踐經驗的抽象與歸納,它已經發展成為基於現代科學方法的理論體系和研究方式。擅長各種精確計量的量化投資的興起只不過是一個學科變得更為成熟的必由之路。無論接受與否,投資領域的“工業化大生產”時代已然來臨。
當然,量化又不侷限於方法論。
北京大學王漢生教授曾經在科普統計學的時候,說過這樣一句話“我們在產品的設計上,怎麼樣既能把在預測過程中的相對優勢表達出來,同時又容忍不確定性的存在。這是個大問題。”這句話引起了我的共鳴,我認為這就是量化投資的目標,即如何更好的預測資產的預期收益並同時控制它們的風險,也就是不確定性。為了實現這個目標,靠的是數量化的思維以及工程化的體系。前者讓我們透過統計手段結合金融學先驗來進行預測和估計,後者讓我們把理論分析落地到投資實踐,二者缺一不可。量化投資是數量化思維和工程化體系的結合。
這是我一貫的看法,也是我希望透過完成這本書 —— 哦,對了,這本書還有個副標題,叫做 The Science of Quantitative Investing —— 所傳遞的觀點。最終,我加入了這個 project,並和兩位優秀的 co-authors 一起,在初稿的基礎上又歷經半年的修改(部分章節甚至是推翻了重寫),最終把它打磨成了現在的樣子。這本書也得到了學界和業界前輩的認可,在此表示由衷的感謝。
在此,我也要向麥教授和盧博士兩位 co-authors 表示感謝。不僅僅感謝他們當初的邀請,更感謝他們在整個寫作過程中所體現出的專業度。在寫作過程中,我們三人配合默契,形成了一條有序而高效的流水線。這種以普及知識為唯一目標的 collective spirit 讓我享受其中,也受益匪淺,正如麥教授所說:
This book is a testament to the collective spirit and dedication of all those who have been involved.
以上就是我和這本書的故事。
最後,關於這本書的精彩照片以及更多介紹(包括我們三人都在的讀者群),感興趣的小夥伴請參考這篇介紹
https://mp.weixin.qq.com/s/sOVVnacrOZ79GVfzFoFMIA
期待有機會和你在因子投資的道路上攜手前行。
Last but not least, 新春將至,祝各位小夥伴因子選得好,模型跑得穩,蛇年一起‘量化’幸福。
免責宣告:入市有風險,投資需謹慎。在任何情況下,本文的內容、資訊及資料或所表述的意見並不構成對任何人的投資建議。在任何情況下,本文作者及所屬機構不對任何人因使用本文的任何內容所引致的任何損失負任何責任。除特別說明外,文中圖表均直接或間接來自於相應論文,僅為介紹之用,版權歸原作者和期刊所有。
總寫量化
分享量化理論和實證心得

相關文章