日日碰狠狠躁久久躁96avv-97久久超碰国产精品最新-婷婷丁香五月天在线播放,狠狠色噜噜色狠狠狠综合久久 ,爱做久久久久久,高h喷水荡肉爽文np肉色学校

睿治

智能數據治理平臺

睿治作為國內功能最全的數據治理產品之一,入選IDC企業數據治理實施部署指南。同時,在IDC發布的《中國數據治理市場份額》報告中,連續四年蟬聯數據治理解決方案市場份額第一。

趙子平:基于深度學習的金融指數基金設計

時間:2022-02-16來源:小小少年有煩惱瀏覽數:200


? ? ? ?導讀:近年來,隨著深度學習技術的快速發展,人工智能技術在金融領域得到了越來越多的重視。FinTech,量化金融等技術成為人工智能的重要研究領域。深度學習,尤其是基于多層神經網絡的學習方法,在解決金融領域的復雜性問題的研究中得到了越來越多的關注。今天非常有幸跟大家分享來自我們學界的一些關于智能金融應用的最新科研成果。

? ? ? ?本次分享主題為基于深度學習的金融指數基金設計,將從介紹金融指數、指數基金相關概念,和用深度學習方法設計指數基金的原因入手,介紹我們提出來的基于深度學習的金融指數基金設計方法,以及相比于傳統指數基金設計方法,該方法取得的優異表現。

? ? ? ?01問題背景

? ? ? ?首先介紹一下什么是金融指數和指數基金。

? ? ? ?1. 投資基金的兩種基本策略

? ? ? ?按照投資范圍基金可分為以下四類:


  • 債券型基金
  • 股票型基金
  • 混合型基金
  • 貨幣型基金


? ? ? ?按照投資策略基金可分為以下兩類:


  • 被動型基金:選取特定金融指數的(如滬深300指數、標普500指數等)成分股作為投資對象,不主動尋求超越市場的表現,而是試圖復制指數的表現,因而又通常被稱為指數基金(Index Fund)。
  • 主動型基金:通過技術成分和基本面分析等方法來進行選股和擇時,以尋求超越市場的業績表現為目標。主動型基金更看重基金經理的個人投資能力。


? ? ? ?2.?指數基金超越大部分主動型基金的歷史表現

? ? ? ?大部分的主動型基金波動性會比較大,當我們回顧歷史數據,長期來看主動型基金很難去超越指數基金。這個結果符合有效市場假說,在美國的資本市場可能會更明顯一點。

? ? ? ?因此,對于指數基金,如果我們能夠穩定地復制指數的收益,就能獲得超越大部分主動型基金的表現。如圖中美國2020年主動型基金的收益率。

? ? ? ?此外,相較于主動型基金,被動型基金所需的投資研究成本更低。

? ? ? ?3. 金融指數

? ? ? ?指數型基金以復制特定金融指數的業績表現為目標。

? ? ? ?金融指數是與金融市場活動相關的指數,比如股票指數、期貨指數、行業/主題指數等。如上圖左側是世界上一些主要指數的列表,圖右側是指數的整體表現,長期來說是呈上升趨勢的,即呈現一個正的收益率。

? ? ? ?4. 股票指數:寬基指數和窄基指數

? ? ? ?股票指數又被叫做股市的晴雨表。根據編制方式,股票可分為以下兩類:

? ? ? ?寬基指數:代表了整個股票市場的績效,包含了一個國家最大的證券交易所里最具規模的上市公司編制。如上證50指數、滬深300指數等,它們一般包含了市場中市值比較大的那些公司,然后計算出來這樣一個指數,例如全世界最大指數之一的道瓊斯威爾夏5000指數,其實際包含有7000多支股票。

? ? ? ?窄基指數:追蹤的是市場部門的績效,更多是反應一個特定行業的情況,例如能源指數、材料指數、信息技術指數、醫療保健指數等。

? ? ? ?5. 股票指數:價格加權指數和市場加權指數

? ? ? ?根據計算方式,股票指數可分為以下三類:

? ? ? ?平均加權指數:基于成分股的價格加和除以總數量進行編制。

? ? ? ?價格加權指數:基于成分股的價格進行加權編制,價格變動對某高單價個股影響不大,卻會顯著影響整個指數。例如,道瓊斯工業平均指數。

? ? ? ?市值加權指數:基于公司規模進行加權編制,大公司的小幅價格波動機會顯著影響指數。例如,標準普爾500指數、上證綜指、深證綜指、恒生指數等。這個編制方式更自然一點,因為考慮到大公司對于整個市場的影響更大一點。

? ? ? ?6. 股票指數基金:構建指數跟蹤投資組合

? ? ? ?股票指數基金的目標是,以股票指數的成分股為備選資產進行投資組合設計,復制指數(收益率)表現。

? ? ? ?02指數跟蹤投資組合設計

? ? ? ?1.?指數跟蹤投資組合設計

? ? ? ?最簡單的一種指數跟蹤投資組合策略就是按照指數中不同成份股的權重去購買。但這個方式會存在以下問題:

? ? ? ?投資組合中的成分股權重會頻繁變動,需要頻繁買賣,從而導致交易成本增加。

? ? ? ?有些公司股票流動性低,會導致賣出的時候無法及時執行交易。

? ? ? ?因此這是一個不現實的操作。

? ? ? ?指數基金的設計通常都是試圖構造一個稀疏的投資組合,即在大量股票或投資金融資產中選取一小部分。所以指數基金的設計最后就變成了構造一個稀疏的投資組合的問題。

? ? ? ?如圖右側這樣一個資產池是我們感興趣的某個指數的成分股,我們把每只股票在某一天的收益率用一個rt表示,同時也可以把指數的收益率用rind示出來。

? ? ? ?最后我們要做的就是設計一個投資組合,或者投資比例w使得最后得到的投資組合收益率rind, t跟基金的收益率wTrt能夠相近。用Loss函數表示為:

? ? ? ?在這樣的組合設計下,還可以加一些我們比較感興趣的限制條件。比如購買某個資產不能超過某個上限,也不能低于某個下限:l≤w≤h。又因為政策原因,基金公司不允許賣空操作,因此這里的l要大于零。另外我們的總投資是有限的:1Tw=1,其中w表示的是一個百分比。

? ? ? ?當然這里有一個問題w有n個,也就是說包含了該指數下面所有的成分股,我們最后得到的解就會是所有成分股都進行買賣。

? ? ? ?為了得到稀疏的資產組合,我們進一步引入二元變量z,zi=1表示對應資產被選入投資組合,zi=0表示對應的組合未被選入。并且設置變量k,表示我們想在這n個成分股當中最多選幾支股票。比如標普500指數,可能有接近500個成分股,假如我們只需要從中選出20個股票對它們進行跟蹤,那么這里的k就等于20。

? ? ? ?最后我們從優化上來講,問題如下:

? ? ? ?這個就叫做一個混合整數規劃問題,看起來比較難一點,并且它的難點不光是這個問題本身比較復雜, 還有n的規模會非常大。比如要對兩個市場進行跟蹤,那可能就有幾千甚至上萬只股票。但是k又往往比較小,因為我們總是不希望資產組合中投資太多這樣的底層資產。所以對于這樣的問題,它的計算復雜度也是非常高。

? ? ? ?首先我們對它進行一步變換,采用上鏡圖變化的形式把它轉化成圖右側的樣子,這樣問題就會簡單很多。它就變成了一個混合整數線性規劃的問題,所以在求解上把非線性變成了一個線性的問題。

? ? ? ?但這個問題在實際解決當中會存在一些問題,比如剛剛提到的n很大k很小,所以復雜度非常得高。即使我們可以用一些經典的求解器進行求解,比如SCIP,CPLEX、GUROBI等,但仍然很有可能一天都解不完,并且得到的解也不一定是精確的。

? ? ? ?所以為了能夠使得這個問題高效地求解,我們將它分成兩個階段進行求解。第一階段先做資產選擇,用圖神經網絡進行資產選擇;第二階段進行資產配置,就是在選定的k個資產里,再求解如何配置權重的問題。

? ? ? ?03基于深度學習的兩階段指數跟蹤投資組合設計

? ? ? ?來看一下我們實際設計出來的系統流程圖是怎樣的。

? ? ? ?1. 人工智能的發展

? ? ? ?第一階段用到的是圖神經網絡,這里先稍微講一下圖神經網絡的背景。人工智能從40年代開始一直發展到現在,經歷了起起伏伏。從最開始的Electronic Brain,發展到感知機。后來大家發現感知機很難求解非線性問題,比如異或問題。接著又發展到了多層感知機。當多層感知機層數變多的時候,在訓練模型的時候復雜度會變高。在當時的八九十年代,由于計算基礎設施的匱乏,大家很難去把多層感知的模型發展起來。后來統計學習蓬勃發展,像SVM算法成為了研究的主流。近些年由于高效的計算與存儲設備的出現,深度神經網絡獲得了重生。

? ? ? ?2. 深度學習的應用

? ? ? ?深度學習現在是人工智能非常重要的一部分。比如在圖像領域,比較經典的卷積神經網絡,它在分析音頻領域會有一個基于循環神經網絡的LSTM這樣的結構,這些都是非常有代表性的深度學習的模型。

? ? ? ?3. 普遍存在的動態變化的圖數據

? ? ? ?隨著大數據時代的到來,大家開始關注圖數據的結構。因為數據之間總是有關系的,這樣的關系可以很自然地用一個圖來進行表示,比如社交網絡,計算機網絡等等。然而,傳統的比如說基于圖像或者文本數據的深度學習的方法,很難處理這樣大規模的圖結構數據。

? ? ? ?4. 圖神經網絡的快速興起

? ? ? ?為了處理這一類數據圖,圖神經網絡大概是從2016年開始就變得非常火爆了,在很多工業場景當中都獲得了應用,比如說信貸機構的風險分析,網絡平臺的推薦系統等。

如圖中下方所示,在機器學習領域頂會ICLR上可以看出,過去三年關于圖神經網絡的發文數量迅速上升,到現在還是一個最火爆的話題。

? ? ? ?5. 動態變化的金融指數

? ? ? ?對于一個金融指數來說,因為它的成分股是在不斷變化的,因此我們想要把它建模成圖。圖中下方展示的是香港恒生指數近三年來的成分股的變化情況,可以看出不斷有一些股票被剔除出去,也有一些被加入進來。那么對于一個圖來說,就可看成這個圖中有一些節點會消失,有一些會產生新的節點,并且這個圖的大小是在不斷變化的。成分股的數量也從最初的50只逐漸變到了現在的60只,所以這是一個很自然的圖的結構。

? ? ? ?6.?將指數跟蹤投資組合設計問題抽象為圖

? ? ? ?很多研究都表明圖是可以很好的去表現金融資產之間的關系的。所以我們也想用圖神經網絡來解決指數中的動態變化的成分股的配置問題。

首先我們把指數跟蹤投資組合的設計問題表述成如圖右側這樣一個圖結構。圖中的節點分別表示這個問題當中的z⊙h二元變量。continuous variable是左側公式里的w,也就是進行資產配置時不同資產配額的百分比的變量。

另外這是一個優化問題,需要對其他的一些問題參數進行建模,所以就有了這樣一個圖的表示。

? ? ? ?7. 圖神經網絡

? ? ? ?有了這樣一個圖的表示之后,會得到一個計算圖,如圖左側。在這個計算圖中,可以通過信息傳遞得到每個節點的嵌入,節點嵌入其實就是一個向量。

? ? ? ?每個節點代表一個資產,對于股票這樣一個指數來說,它就對應一支具體的股票,比如這里的蘋果、微軟、亞馬遜等公司都會有一個特征向量,這個是經過信息傳遞之后求得的一個節點嵌入。

? ? ? ?然后這個嵌入通過多層的感知機的結構,輸出一個我們想要的二元變量。如果這個二元變量是1,就代表在投資組合中要去買這個資產;如果是0,則代表資產沒有被選入投資組合中。

? ? ? ?所以前面資產組合配置的問題,或者混合整數規劃的問題,最后就變成了通過圖網絡進行分類的問題,一個二分類的問題,選與不選。

? ? ? ?8. 資產配置問題

? ? ? ?有了上述的結果,我們就可以再對已經選擇的資產進行配置,會得到變量w。

? ? ? ?9. 系統框圖

? ? ? ?這是整個系統的框圖,從最初的資產池到最后的股票指數基金的買賣份額配比,整個流程如圖中所示。

? ? ? ?10. 模型訓練

? ? ? ?這里是我們實際在訓練模型時候的一些細節。

? ? ? ?我們用CPLEX求解器所求得的結果作為標簽,通過最小化交叉熵損失函數對網絡進行訓練。因為對于這個問題,最后只要訓練出一個如何能夠求解混合整數規劃的問題,也就是滿足這樣一個問題子結構的網絡。所以我們的訓練樣本其實可以不用來自于實際數據,而用IBM的求解器CPLEX來產生。CPLEX對于小規模的問題可以很快給到一個最優解。

? ? ? ?得益于圖神經網絡的可擴展性,我們可以在維度小的樣本上進行訓練,再應用到維度更大的問題上去。這是圖神經網絡的一個特性。

? ? ? ?11. 實驗結果:數據生成

? ? ? ?我們用到了價格加權指數的形式生成了不同維度的數據,如圖。

? ? ? ?12. 實驗結果:跟蹤效果

? ? ? ?我們通過CPLEX產生的數據訓練模型,最后把得到的模型跟業界中應該會用到的CPLEX的模型進行對比。這里用了兩個指數跟蹤誤差,最大的誤差和平均誤差進行比較。可以看到模型的最后表現跟標準的方法是很接近的。

圖中下方展示的是圖神經網絡的可擴展性,比如在30選10上進行了訓練,我們可以把它擴展到50選20,70選20的問題上去。

? ? ? ?13. 實驗結果:計算時間

? ? ? ?這是在計算時間上的比較,當問題規模逐漸變大的時候,CPLEX的運行時間會非常高,并且成功的概率也會非常低。但是用GNN都可以在一秒之內把問題給解決掉,并且它的成功率達到100%。

? ? ? ?總結一下這個模型的亮點,對于大規模的計算可以達到一個既快又好的效果。

? ? ? ?14. 指數跟蹤投資組合設計:單周期

? ? ? ?前面講到的模型其實都是基于單周期的模型。單周期是指在每一個進行投資的時間段內,單獨地進行一次指數跟蹤基金的設計。但對于不同的投資階段,需要分別進行設計,因為指數是在不斷變化的。所以當從一個階段到另外一個階段進行投資的時候,投資比重是需要進行再調整的,最后會導致一個交易成本的問題。所以我們可以把單周期的模型擴展到一個多周期的模型,控制交易費用。

? ? ? ?15. 指數跟蹤投資組合設計:多周期

? ? ? ?多周期的模型其實就是在每個周期都重新進行一次指數跟蹤基金的設計。最后考慮到兩個周期之間投資組合的調整,這樣可以使得整個投資階段之內的交易費用變小,因而獲得一個更高的收益。

? ? ? ?對于交易費跟交易成本的假設,也是符合當前業界的做法。現在許多資產管理公司做的公募基金其實都是基于這樣一些比較實際的假設。

? ? ? ?04總結

? ? ? ?在今天的話題中,首先給大家介紹了金融指數以及什么叫做指數基金。接著我們提出了一種基于深度學習的金融指數基金的設計方法。最后相比較傳統的方法,我們的方法大幅降低了計算復雜度,并在大規模指數基金的構建中取得了優異的表現。

? ? ? ?05精彩問答

? ? ? ?Q:多層感知機是什么?算是一種黑盒嗎?

? ? ? ?A:多層感知機算是一種黑盒,這個也要看怎么看。相比較我們前面完全是基于模型的這樣一個優化問題來說,你可以認為我們中間把這樣一個解決混合整數規劃的問題,用圖神經網絡的方法進行求解,算是一個黑盒模型。但是現在有一些理論是可以證明這樣一個模型的最優性的。所以就用圖神經網絡來解混合整數規劃。其實盡管是一種深度模型,但是它是有理論保證的,所以從某種程度上也可以說它并不是一個黑盒模型。

? ? ? ?Q:請問一下這套指數資產分析算法及數據有開源嗎?或者有相關的文章嗎?

? ? ? ?A:文章是有的,并且現在都已經公開了。開源的話,如果有相關機構或者個人對此感興趣,可以發郵件與我們聯系,我們可以以合適的形式把代碼提供給大家。

? ? ? ?Q:用圖神經網絡代替傳統的優化方法,這個思路可以用到其他的優化問題嗎?

? ? ? ?A:我們這里是用來解決混合整數規劃的問題,這樣一個混合整數規劃問題用圖神經網絡來進行求解應該是有很多文章在研究的,并且理論結果也都是非常好。如果大家感興趣的話可以關注一下。對于其他的問題的話,其實應該是有一定的擴展性,但是因為混合整數規劃是一類比較難的問題,所以圖神經網絡在這上面的應用把它變成一個分類問題進行求解算是研究的一個重點。在其他優化問題上肯定也是可以求解的,比如說一般的非凸問題也是有其他的一些深度模型進行求解,但是能不能用圖神經網絡,我個人沒有去關注過太多這方面的文章,所以沒法給出一個非常準確的解答。

(部分內容來源網絡,如有侵權請聯系刪除)
立即申請數據分析/數據治理產品免費試用 我要試用
customer

在線咨詢

在線咨詢

點擊進入在線咨詢