MLAT-Autoencoders for Conditional Risk Factors and Asset Pricing---上篇
寫在前面
本文對《Machine Learning for Algorithmic Trading》一書第20章進行了梳理及代碼復現。這個系列會分為上、下撰寫,此篇為上,主要進行理論介紹,下篇則主要進行代碼復現的演示。
Chapter20主要介紹了自編碼器及其在交易中的應用。自編碼器是一種神經網絡,經過訓練,它可以在學習新的數據表示的同時再現輸入(input),并通過隱藏層的參數進行編碼。自編碼器長期以來一直被用于非線性降維和流形學習。本文將重點介紹自編碼器如何通過構建一個深度神經網絡來支持交易策略。
目錄
第一部分
一、用于非線性特征提取的自編碼器
二、代碼復現:廣義主成分分析和非線性降維
三、代碼復現:卷積自編碼器對圖像進行壓縮和去噪
第二部分 用于回報預測和交易的條件自編碼器
第一步:創建包含股價和元數據信息的新數據集
第二步:計算預測資產特征
第三步:創建和訓練條件式自編碼器架構
第四步:評估結果
一、用于非線性特征提取的自編碼器
通過之前的學習我們了解了神經網絡如何通過提取對給定任務有用的特征來實現監督學習。如:卷積神經網絡從類似網格的數據中逐漸學習并合成復雜的模式,比如識別檢測圖像中的目標,或對時間序列進行分類。然而,自動編碼器是一種專門用來學習一種新的表示方式的神經網絡,這種方式對輸入信息進行編碼,來幫助解決另一項任務。由于自動編碼器通常使用相同的數據作為輸入和輸出,也被認為是一個自我監督學習的實例。
二、代碼復現:廣義主成分分析與非線性降維
降維是較為傳統的自編碼器的應用,過程是通過限制隱藏層的大小從而進行有損壓縮。這種自編碼器被稱為不完整自編碼器,它通過最小化損失函數來學習數據的相對顯著特性。自動編碼器還可以使用前饋、卷積結構來學習分層特征表示。
后續文章會演示使用TensorFlow實現幾個自動編碼器模型,包括深度前饋網絡和稀疏約束自編碼器,標題會標注為代碼復現(1)。
三、代碼復現:卷積自編碼器對圖像進行壓縮和去噪
自編碼器可以使用卷積層來學習分層特征表示。卷積自編碼器利用卷積和參數共享來學習層次模式和特性,而不管它們的位置或大小變化。
后續文章會演示如何通過卷積和去噪自編碼器來恢復損壞的輸入圖像,標題標注為代碼復現(2)。
第二部分:用于回報預測和交易的條件自動編碼器
Gu、Kelly和Xiu最近的研究開發了一個基于證券風險因子暴露的資產定價模型。它基于本書前面提到的數據驅動風險因子這個概念。此書作者表明:因子模型用來捕捉“異常”的系統驅動因子的資產特征,它代表了無法直接測量的風險因子的時變暴露程度。在這種情況下,“異常”是指回報率超過由市場總風險敞口所解釋的回報率。
第一步:創建包含股價和元數據信息的新數據集
第二步:計算預測資產特征
第三步:創建和訓練條件式自動編碼器架構
第四步:評估結果
以上步驟會在后續文章中進行代碼演示,標題標注為(3)。
總結
以上是生活随笔為你收集整理的MLAT-Autoencoders for Conditional Risk Factors and Asset Pricing---上篇的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Android加载百度地图
- 下一篇: 我们终将泄露的人脸数据,后果到底有多可怕