構建可比的交易訊號


量化投資與機器學習微信公眾號,是業內垂直於量化投資、對沖基金、Fintech、人工智慧、大資料領域的主流自媒體公眾號擁有來自公募、私募、券商、期貨、銀行、保險、高校等行業30W+關注者,曾榮獲AMMA優秀品牌力、優秀洞察力大獎,連續4年被騰訊雲+社群評選為“年度最佳作者”。

Elliot Rozner

可比性-衡量資訊有用性的標準
資訊只有在與其他資訊進行比較時才有意義!
這可能聽起來很抽象。我們來舉個例子:一小時是多少時間?
這個問題幾乎有無限的答案。你可以說一小時是60分鐘,或者3600秒。你也可以說是一天的1/24,或者一週的1/168。
但如果你不知道秒、分、日或周是什麼呢?這個問題並不像聽起來那麼抽象。當我們還是嬰兒或蹣跚學步的時候,我們都經歷過這種情況。我們不知道一小時,一分鐘,或者其他時間段是多少,那麼我們是如何學習的呢?
從經驗中學習!
我們被告知可以再多睡5分鐘,或者被告知我還沒到目的地,但大約一個小時後就會到,或者得知奶奶這個週末不來了,但我們下週末會看到她。換句話說,既然我們不能透過比較其他時間框架來了解時間,我們就可以透過比較我們的經歷來了解時間。
時間的好處是,一旦我們理解了它的任何單位,我們就可以(理論上)理解任何其他單位。一小時實際上只有60分鐘,而一天實際上只有24小時。我們使用相同的“時間尺”來測量所有這些時間框架。不幸的是,在投資中對資訊進行比較有些困難。
考慮下面的陳述:
ABC的股票今天上漲了3美元。這幾乎沒有傳達任何關於ABC移動的資訊。首先,我們不知道ABC的上漲前的價格。ABC是1000美元的股票,3美元的變動幅度小於1%,還是10美分的股票,3美元的變動幅度小於3000%。
現在考慮這個陳述:
XYZ股票今天上漲了3美元。我們對此有同樣的問題,就像上次關於ABC股票的陳述一樣。我們不知道XYZ的價格,所以我們不知道3美元變動的重要性。由於我們不知道ABC或XYZ的價格,我們不能比較XYZ和ABC的變動。缺乏可比性是無用資訊的標誌。
我們將討論如何構建交易訊號以確保最大程度的資訊,或最大程度的可比性。但由於交易訊號有些抽象,讓我們首先繼續討論價格走勢,以及我們如何更有效地傳達有關它們的資訊。
如何衡量價格變動?從最不可比性到最可比性
有幾種方法可以衡量資產的價格變動,其中一些方法傳達了很多資訊,而另一些方法幾乎沒有傳達任何資訊。所傳達的資訊量與價格變動與其他價格變動的比較難易程度成正比。讓我們逐一討論這些方法。
1、今天道瓊斯指數上升了300點
這是金融媒體通常採取的方法,正如我們前面提到的,它幾乎沒有傳達有用的資訊。除非我知道道瓊斯指數的當前水平,否則我無法將其今天的走勢與其他資產的走勢進行比較。此外,我甚至無法將今天的走勢與道瓊斯指數前幾天的走勢進行比較,這可能發生在不同的價格水平上!我唯一能做的比較就是向下移動。我知道今天道瓊斯指數的漲幅超過了其他下跌的資產,也超過了前幾天道瓊斯指數本身下跌時的漲幅。
2、道瓊斯指數今天上漲了1%
這傳達了一些有用的資訊。現在,我可以將道瓊斯指數的走勢與其他資產的走勢或之前的道瓊斯指數走勢進行比較。然而,仍然存在可比性問題,這與波動性有關。一些資產每天經常變動幾個百分點,而另一些資產的變動很少超過5到10個基點。在不瞭解道指波動率的情況下,我無法將其1%的波動率與其他具有不同波動率水平的資產進行比較,也無法將其與之前的波動率進行比較(因為波動率會隨著時間而變化)。
3、道瓊斯指數今天上漲了一個日標準差
這種框架是我們不習慣的,但它實際上包含了比引用百分點更有用的資訊。使用每日標準差使我們能夠比較具有巨大不同波動性的資產的變動。例如,它允許我們比較比特幣5%的波動和政府債券ETF0.25%的波動;如果我們將這些百分比變動轉化為標準差,我們可能會發現債券ETF的變動比比特幣的變動更重要!儘管如此,還是有一些可比性被遺漏了。我們現在可以比較不同價格和波動水平的資產的走勢,但我們無法比較不同時間框架內發生的走勢。我們不能將前一天發生的變動與上個月發生的變動進行比較。這是因為按日標準差計算,月波動自然會比按日波動大,所以用日標準差來引用每一次波動並不能告訴我們哪一次波動更顯著。
4、道瓊斯指數今天的上升幅度等於其按日標準差計算的日平均絕對移動幅度
這種對道指走勢的分析對進行比較最有幫助。如果我知道日平均波動是向上或向下一個標準差,月平均波動是向上或向下4.5個標準差,我就可以比較不同價格、資產、波動水平和時間框架的波動。我可以將昨天道瓊斯指數的走勢與上個月的走勢進行比較,或者將上個月比特幣或牛期貨的走勢進行比較。這是因為所有這些價格變動都將以該時間段的平均標準偏差變動來表示。平均日移動值為1,平均月移動值為1。
既然我們已經看到了表示價格變動的各種方法,讓我們將討論擴充套件到表示交易訊號的方法。
構建有可比的交易訊號
我們對交易訊號的討論將遵循我們對價格變動的討論;我們將討論四種構建量化交易訊號的方法,從最低可比性到最高可比性。我們將使用一個簡單的動量規則作為交易訊號的例子。
假設我們有一組10種資產,我們想做多動量最大的那一種。在這裡,我們將動量定義為當前價格和200日移動平均線之間的距離。這意味著我們的訊號將是“距離”的一個排名,從1到10。我們如何正確地測量距離?
1、距離將由當前價格減去200天移動平均線(以美元計算)來定義
這相當於以美元報價價格變動;它不允許我們區分高價格的資產和低價格的資產,所以它對我們來說是無用的。
2、距離將由當前價格和200天移動平均線之間的百分比差來定義
許多人在構建動量規則時使用這種方法,我們不會說它是無效的。但是,它沒有區分高波動率資產和低波動率資產。例如,資產價格高於200天移動平均線10%的情況可能非常不穩定,高於或低於平均線10%的情況很典型。另一項資產可能比平均水平高出5%,這對該資產來說可能是一個很大的變動(經波動性調整後)!
3、距離將由當前價格減去200天移動平均線,除以每日標準偏差來定義
這種方法修正了波動性,所以現在得分最高的資產將是真正有最顯著上漲的資產。
如果我們只使用一個動量訊號,即距離200日移動平均線的距離,這就很好了。假設我們想用多個訊號的平均值。例如,我們可能還想測量距離50天移動平均線的距離,然後取我們兩個測量值的平均值,並將平均值從1排到10(還有另一種方法;對兩個訊號進行排序,然後對組合的秩進行排序,但你可能不希望這樣做)。問題是,當前價格離200天移動平均線的距離可能比離50天移動平均線的距離要遠得多;只是有更多的時間讓它移動!如果我們把這兩個指標取平均值,平均值將嚴重偏向於較長的時間框架,即200天移動平均線。顯然,如果我們想要平等地衡量這兩個訊號,我們需要對它們中的每一個進行一些調整,以便它們的平均值相似。
4、使用3中的方法,然後將每個訊號乘以一個標量以使其歸一化。標量應該等於1除以原始訊號的平均絕對值
假設平均而言,資產的當前價格高於或低於其200日移動平均線10個每日標準差。這意味著使用上面的方法3,我將得到平均原始訊號的值為10(或-10)。如果我用這個乘以標量,在這個例子中是1/10,得到1。還假設,平均而言,資產的當前價格高於或低於其50天移動平均線5個每日標準差。原始訊號的平均值是5,標量是1/5,所以平均值是1。
讓我們用一個具體的例子來說明這一點:
假設資產ABC比其200天移動平均線高出15個每日標準差,比其50天移動平均線高出3個每日標準差。我們把標量應用到這些度量上,15乘以(1/10):得到的總價值為1.5, 3乘以(1/5):得到的總價值為0.6。1.5和0.6的平均值是1.05,這是我們對資產ABC的動量得分。
現在假設資產XYZ比200天移動平均線高出9個日標準差,比50天移動平均線高出7個日標準差。我們把標量應用到這些度量上。9乘以(1/10):得到的總價值為0.9,7乘以(1/5):得到的總價值為1.4。0.9和1.4的平均值是1.15,這就是我們對資產XYZ的動量得分。基於這些度量,資產XYZ動量更高。
一旦我對所有的訊號應用標量,它們的平均值都是1。然後我可以以任何我想要的方式組合它們。根據訊號與平均訊號的關係來呈現訊號,可以在資產和時間框架之間實現最大的可比性。
結論
如何使用預測標量似乎是一個相當小眾的話題。但關於資訊的有用性及其與其他資訊的可比性是交易訊號最根本的假設。


相關文章