竞博JBO

您的位置首頁  農業資訊  分析預測

股票預測模型設計了一個強強聯合型模型來預測股票價格為什么這么形容?

  預測股票價格不是一個新話題,隨著技術的不斷發展,大家一直在不斷嘗試新技術。這次教程中,作者設計了一個強強聯合型模型來預測股票價格,為什么這么形容?作者設計了一個 GAN 模型,其生成網絡為 LSTM 模型用來預測時間序列數據、CNN 模型作判別網絡,用 BERT 模型作為情緒分析模型。帶有高斯過程的貝葉斯優化和深度強化學習方法來獲得 GAN 的超參數。為什么創建這樣的組合?都將在下面的內容中為大家進行一一解答。

竞博JBO  這篇教程的篇幅很長,為了讓大家能對重要技術內容一目了然,作者在開始加入了層級清晰的目錄,主要從【背景】、【數據特征】、【GAN 模型架構】、【超參數優化】等幾大方面進行全面講解。

  在今天的任務中,預測的是高盛公司(本文中會簡稱為 GS)的股票變化趨勢,使用 2010 年 1 月 1 日至 2018 年 12 月 31 日的日收盤價作為訓練(七年)和測試(兩年)數據。

  成功訓練一個 GAN 最棘手的部分是獲得正確的超參數。為此,作者使用 Bayesian opsation(帶有高斯過程的貝葉斯優化)和用于決定何時以及如何改變 GAN 的超參數的深層強化學習(DRL),在創建強化學習過程中,將使用一些最新技術,如 RAINBOW 和 PPO。

  此外,在模型中還使用許多不同類型的輸入數據。隨著股票的歷史交易數據和技術指標,設計了一些技術方法,如使用 NLP 中的 BERT 來創建情緒分析模型(作為基本面分析的來源),以及用傅立葉變換(Fourier transforms)提取總體趨勢方向、識別其他高級特征的棧式自動編碼器( Stacked autoencoder);采用特征投資組合尋找相關資產;采用 ARIMA 方法進行股票函數近似。實際上,這些技術都是為了盡可能多的獲取關于股票的信息、模式、依賴關系等等。

竞博JBO  開發環境和框架選擇 MXNet 和其高級 API(Gluon)創建所有的神經網絡,并在多個GPU上進行訓練。

  通過上面的技術背景介紹,相信大家已經感覺到想準確預測是一項非常復雜的任務,影響股票變化的事件、條件或因素等實在是太多了。所以,想更好的了解這些先決條件,還需要先做幾個重要的假設:(1)市場不是 100% 的隨機;(2)歷史重復;(3)市場遵循人們的理性行為;(4)市場是“完美的”。

  首先,要了解什么因素會影響 GS 的股票價格波動,需要包含盡可能多的信息(從不同的方面和角度)。將使用 1585 天的日數據來訓練各種算法(70% 的數據),并預測另外 680 天的結果(測試數據)。然后,將預測結果與測試數據進行比較。每種類型的數據(亦稱為特征)將在后面的部分中詳細解釋。

  a.相關資產:涉及商品、外匯、指數、固定收益證券等各類資產數據;影響高盛公司股票價格趨勢的外部因素又有很多,并且很復雜,包括競爭對手、客戶、全球經濟、地緣形勢、財政和貨幣政策等等,這些因素還會相互產生影響。選擇合適的相關資產是非常重要的:

  (1)首先是和 GS 相似的公司,如將摩根大通(JPMorgan Chase)和摩根士丹利(Morgan Stanley)等加入數據集。

  (5)貨幣,全球貿易多次反映在貨幣流動中,使用一籃子貨幣(如美元-日元、英鎊-美元等)作為特征。

  b.技術指標:許多投資人都會關注技術指標,在這里,把最受歡迎的指標作為獨立特征,包括 7 天和 21 天波動平均值、指數波動平均、Momentum、MACD 等 12項技術指標。

  c.基本面分析:無論股票漲跌,這都是一個非常重要的數據。分析時會用到兩個特征:公司業績報告和新聞將引導的一些趨勢,因此通過分析新聞來準確預測市場的情緒也是一項非常重要的工作,所以這次的方法中,將使用 BERT 來構建情緒分析模型,提取股票新聞中的情緒傾向。最后采用 sigmoid 歸一化,結果介于 0 到 1 之間,(0 表示負面情緒,1 表示正面情緒),每一天都會創建一個平均每日分數作為一個特征添加。

  使用的是 MXNet 中 Gluon NLP 庫中所提供的經過預訓練的 BERT 模型,大家可以嘗試一下。此前我們也為大家介紹過簡單易上手的 Gluon,詳情可參考營長親自上手的教程。

  d.傅里葉變換:利用每日收盤價,創建傅立葉變換,以獲得幾個長期和短期趨勢。使用這些變換消除大量的噪聲,獲得真實股票波動的近似值。有了趨勢近似,可以幫助 LSTM 網絡更準確地選擇其預測趨勢。

  f.Stacked autoencoders(棧式自動編碼器):上面提到的一些特征是研究人員經過幾十年的研究發現的,但是還是會忽視一些隱藏的關聯特征,由此,Stacked autoencoders  就可以解決這個問題,通過學習每個隱藏層,發現更多新特征(可能有些是我們無法發現,理解的)。這次沒有把 RELU 作為激活函數,而是使用了 GELU,也可以用于 BERT 模型中。至于為什么選擇 GELU,大家可以在原文中看到作者給出的和 RELU 對比的實例。

竞博JBO  g.深度無監督學習:用于期權定價中的異常檢測,將再使用一個特征:每天都會增加高盛股票90天看漲期權的價格。期權定價本身結合了很多數據。期權合約的價格取決于股票的未來價值(分析師也試圖預測價格,以便為看漲期權得出最準確的價格)。使用深度無監督學習(自組織映射),嘗試發現出現異常的每日價格。異常(如價格的劇烈變化)可能表明出現了一個事件,這有助于LSTM了解整體股票模式。

竞博JBO  h.對數據的“質量”進行統計檢查:確保數據質量對模型來說非常重要,因此要執行以下幾個簡單的檢驗,如異方差、多重共線性、Serial correlation 等。

  i.確定特征重要性:采用 XGBoost 算法。這么多的特征,必須考慮是否所有這些都真正地指示了 GS 股票波動方向。例如,數據集中包括其變化可能意味著經濟變化的 LIBOR,而這又可能暗示 GS 股票將會發生波動,因此需要對此預測進行測試,在眾多的測試方法中,本教程中選擇了 XGBoost,其在分類和回歸問題上都提供了很好的結果。

  最后一步,使用主成分分析(PCA)創建特征組合,以減少自動編碼器生成特征的維數。在自動編碼器中創建了 112 個特征,不過高維特征對我們的價值更大,所以在這 112 個特征的基礎上通過 PCA 創建高維的特征組合,減少數據維度。不過,這也是我們提出的實驗性方法。

  GAN 最多被應用在創作逼真的圖像、畫作和視頻剪輯等。對預測時間序列數據的應用并不多。但這兩者的思想都是類似的。我們希望預測未來的股票價格,GS 的股票波動和行為應該大致相同(除非開始以完全不同的方式運作,或者經濟急劇變化)。因此,希望“生成”的數據與已經擁有的歷史交易數據分布相似,當然不是完全相同。在這個例子中將使用 LSTM 作為時間序列生成模型,CNN 作為判別模型。

  關于 RNN、LSTM 等模型的基礎介紹這里不多做贅述,主要聚焦在 RNN 在時間序列數據上的應用,因為它們可以跟蹤所有以前的數據點,并且可以捕獲經過時間發展的模式。可以通過裁剪解 RNN 梯度消失或梯度爆炸問題。

  在精度方面,LSTM 和 GRU 的結果相差不多,但是 GRU 使用的訓練參數要比 LSTM 少,計算強度也要小。

竞博JBO  LSTM架構非常簡單:一個LSTM層,包含112個輸入單元(數據集中有112個特征)和500個隱藏單元;一個以每日股價為輸出的 Dense 層;采用 Xavier 初始化,使用 L1 損失函數

  學習率是非常重要的參數之一,每個優化器設置學習率,如 SGD、Adam 或 RMSProp 在訓練神經網絡時至關重要,因為它既控制著網絡的收斂速度,又控制著網絡的最終性能,接下來就要確定每個階段的學習率。

  防止過擬合,注意總損失也是要在訓練模型中非常重要的一個問題。不僅在生成器中的 LSTM 模型,判別器中的 CNN 模型、自動編碼器中都使用了幾種防止過擬合的技術:

  b.正則化,或權重懲罰:最常用的兩種正則化技術是L1 和 L2 正則法。L1對離散值更有魯棒性,當數據稀疏時使用,可得到特征重要性。因此,在股票價格預測這個應用案例中將使用 L1 正則法。

竞博JBO  建立復雜神經網絡時,另一個重要的考慮因素是偏差-方差權衡。訓練網絡的誤差基本上是偏差、方差和不可約誤差 σ(噪聲和隨機性引起的誤差)的函數。

竞博JBO  a.偏差(Bias):偏差衡量一個經過訓練的(訓練數據集)算法對未見數據的概括能力。高偏差(欠擬合)意味著模型在隱藏數據上不能很好地工作。

竞博JBO  CNN 網絡在提取隱藏特征等工作上具有優勢,那如何應用于這個任務中?大家不妨嘗試一下,數據點行程小趨勢,小趨勢行程大趨勢,趨勢反之形成模式,而 CNN 在此用檢測特征的能力來提取 GS 股價趨勢中的模式信息。

  經過 200 次 GAN 訓練后,將記錄 MAE(LSTM、GG 中的誤差函數)并作為獎勵值傳遞給強化學習(RL)模型,以決定是否用同一組超參數來改變保持訓練的超參數,如果RL決定更新超參數,它將調用 Bayes 優化庫。

竞博JBO  為什么在超參數優化中使用強化學習?股票市場一直在變化。即使能夠訓練  GAN 和 LSTM 來創造非常精確的結果,結果也只能在一定的時間內有效。也就是說,我們需要不斷優化整個過程。為了優化這一過程,可以添加或刪除特征,或改進深度學習模型。改進模型的最重要的方法之一就是通過超參數。一旦找到了一組特定的超參數,就需要決定何時修改它們,以及何時使用已經知道的集合(探索或利用)。此外,股票市場代表了一個依賴于數百萬參數的連續空間。

竞博JBO  使用無模型的 RL 算法,原因很明顯,我們不知道整個環境,因此沒有關于環境如何工作的定義模型(如果存在,就不需要預測股票價格的變化)。使用兩個細分的無模型RL:策略優化(Policy Optimization)和 Q-Learning。構建 RL 算法的一個關鍵方面是精確設置獎勵。它必須捕捉環境的所有方面以及代理與環境的交互。

  b.策略優化:這里采用近端策略優化(Proximal Policy Optimization, PPO),在決策優化中,學習從某一狀態采取的行動。(如果使用諸如Actor/Critic之類的方法,也會了解處于給定狀態的價值。

  可見,作者在把各路強模型聯合打造的結果還是非常優秀的。不過作者還嘗試創建一個 RL 環境,用于測試決定何時以及如何進行交易的交易算法。GAN 的輸出將是此環境中的一個參數,雖然這些都不能完全做到預測的作用,但是在實際任務中不斷嘗試新技術還是很有意義的,期待作者后續工作可以帶來更好的結果。

  文章出處:【微信號:rgznai100,微信公眾號:AI科技大本營】歡迎添加關注!文章轉載請注明出處。

  David,加州大學物理博士,美國著名電商數據科學家。本課程介紹什么是深度學習, 深度學習與機器學習的關系,幾種神經網絡

  預防中暑:日本的研究人員正在結合解剖學模型、核心溫度算法、熱調節反應模型、太陽輻射模型和天氣數據,以....

  人工智能已經有了自己的想法了。AlphaGo就有自己的想法。首先,AlphaGo不僅僅是一個深度學習....

  深度學習不是教育學獨有的概念。事實上,這一概念濫觴于20世紀50年代計算機科學的人工智能研究。195....

  在這種情況下進行編輯意味著在不影響其他輸入的情況下,更改輸入對子集的模型預測(與錯誤分類的對象相對應....

竞博JBO  這些網絡被稱為AttoNets,用于圖像分類和實體劃分,但也可以作為視頻動作識別、視頻姿態估計、圖像....

竞博JBO  這篇文章無論是從敘事、舉證、事實分析還是結論啟發都句句有聲、層層推進,確實能夠給朋友們帶來沖擊。作為....

  漸進式改良路線已不能滿足負增長時代下的營銷需求,結合了知識圖譜、語義理解、深度學習等技術的智慧外呼服....

  如今,人們面臨的大多數任務都可以通過編寫計算機軟件來完成。Python 是一種解釋型、面向對象、動態....

  最近幾年數據量和可訪問性的迅速增長,使得人工智能的算法設計理念發生了轉變。人工建立算法的做法被計算機從大量數據中自動...

  自從以深度學習為代表的神經網絡算法的精度大大提升以后,人工智能開始終于又再次火了起來,且有席卷全球之....

竞博JBO  他詳細解釋說,表面瑕疵檢測一直是機器視覺檢測行業的難點與空白,在AI技術介入前幾乎沒有企業愿意投入技....

  人工智能是21世紀以來,人類最偉大的發明之一。它帶給了人類諸多便利,但是,霍金卻十分擔憂它的隱患。2....

竞博JBO  通過攝像頭等圖像攝取設備來拍攝車牌,進行自動化的識別,并與后端的管理系統對接,可以自動的執行車輛停車....

  利用一個簡單的示波器裝置,研究了由正向柵偏壓引起的gan基金屬絕緣體半導體hemts閾值電壓漂移(v....

  本文報道了algan/gan高電子遷移率晶體管(hemt)在反向柵偏壓作用下閾值電壓的負漂移。該器件....

  現代人工智能的始于2012年。研究員成功開發「深度學習」(deep learning)技術,利....

  在他們的研究中,研究人員從18個月的101位視力良好且健康的兒童中收集了OCT脈絡膜視網膜眼部掃描圖....

  通過提供虛擬儀器來補充物理設備,深度學習可以幫助我們從當前監控太陽的能力中獲得更多價值。這項研究發表....

竞博JBO  機器學習對日常生活影響深遠。無論是在上點擊個性化推薦內容、在智能手機上使用語音溝通,或利用面部識別技....

  PI CEO Balu Balakrishnan在季報電話會議上所說:“基于GaN的InnoSwit....

  眾所周知,人工智能從感知智能到認知智能就是要讓機器人能夠理解,能夠思考,能夠交流。這是目前人工智能研....

  在之前的介紹中,我們了解了關于I‑V 曲線和負載線路的基礎知識,但還有另一種分析設備的非線性行為的方....

竞博JBO  對微表情的研究,在方法上事實上類似于人臉識別,一般包含檢測和識別兩個具體問題。 對于人臉識別,一般都....

竞博JBO  作為本次大會的另一大亮點,同期舉辦的首屆中國人工智能產品博覽會吸引到了阿里巴巴、百度、科大訊飛、曠視....

  在延續往屆大會成功經驗的基礎上,第五屆中國人工智能大會由7位國內外院士領銜,共設置1個主論壇、1個大....

竞博JBO  DLBoost是什么?直觀來說就是DeepLearning Boost(深度學習加速),深度學習是目....

竞博JBO  瑞薩電子株式會社(TSE:6723),與具備深度學習專業知識的自動駕駛視覺處理技術解決方案提供商St....

竞博JBO  所以我相信,雖然在換臉軟件這里看似是用戶自愿點擊“同意”奉上自己的人臉信息,如果你把2017年12月....

  隨著人臉識別、語音識別和自動駕駛日益成為關注焦點,人工智能(AI)與社會、人類生活融合程度正在快速演....

  目前,VR已針對在虛擬空間中進行社交進行了優化,并通過將人類沉浸在3D環境中來覆蓋人類的視覺范圍。這....

  莫濤所供職的企業,以一家人臉識別技術的AI初創公司,創始團隊由知名科學家組成,在2017和2018年....

  近日,2019第五屆中國人工智能大會(CCAI)在青島膠州盛大開幕,大會以“智變融合”為主題,旨在搭....

  機器學習尤其擅長于識別模式和發現異常或異常值。“模式匹配模式”是人工智能項目中不斷重復使用的方法之一....

竞博JBO  人工智能研究人員需要在處理深度學習前所未有的計算需求時所能獲得的所有優勢。GPU處理能力發展迅速,最....

竞博JBO  很多人看到人工智能,看到的都是悲觀的景象,但我看到的是光明的未來。在過去的60多年當中,科技進步最重....

  從布盧姆的教育目標分類來看,翻轉作業在課前主要為實現記憶與理解層次的部分目標,為課堂實現更高階的其余....

竞博JBO  這些研究人員認為,受大腦生物學啟發的、那些被稱為神經網絡、連接主義和并行分布處理的AI實現方法,會最....

竞博JBO  隨后,以傳統機器閱讀的方法作為引入,引出了深度學習的方法。先介紹了機器閱讀的主要步驟:文本表示(將文....

  好的,大腦是如何表現的?它使用幾個無限對(x,y)樣本(訓練集)訓練自己,并且在整個逐步過程中,f(....

  隨著互聯網時代的發展,AI 技術給人們的生活帶來便捷的同時,大眾的職業信息、購買偏好、日常出行、刷臉....

  EmbodyMe所研發的應用Xpression與國內之前風靡的《ZAO》類似,基于AR通過深度學習技....

  二是基于學生的知識經驗:物理知識本身就是一個完整的知識體系,它們之間有著本質的邏輯關系,通過對原有知....

竞博JBO  做圖片預處理的目的是為了解決對象識別中訓練集不足的問題。當對象識別應用于某個專用領域的時候,就會遇到....

  TAP 延續了會議文章 [1] 中的 Encoder 框架,在 Attention 機制上針對在線手....

  說到深度學習與人工智能的關系,簡單來說就是:將海量數據通過深度學習進行處理后形成一個模型,再將模型應....

  目前,該項目在 GitHub 上已獲得超過 1.1 萬星,并且中文版電子書還發布了紙質版書籍。不過雖....

  大客流管理:用于公共場所、大型活動區域等地大規模人流疏導管理,同時可分析識別拉橫幅、打架斗毆、人群聚....

  為了展示奧迪Q2深度學習概念的能力,奧迪展示了一個面積為3米x 3米的區域,代表了一個停車區域。在沒....

竞博JBO  中國科學院新疆理化技術研究所研究人員首次開發和提出了基于序列信息來預測潛在的抗癌多肽的深度學習方法。....

  厄爾尼諾主要指太平洋東部和中部熱帶海洋的海水溫度異常持續變暖的現象。其可能造成極端氣候和生態系統破壞....

竞博JBO  這三種方式在運行機制上的差異使得它們分別適用于不同的任務。而其間最為突出的差別存在于人工智能 (AI....

竞博JBO  人工智慧、機器學習以及深度學習已變成現今最熱門的話題之一,但以字面上的意思不足以清楚的表達其意義,使得人們常常混淆。以下...

  近年來,深度學習的繁榮,尤其是神經網絡的發展,顛覆了傳統機器學習特征工程的時代,將人工智能的浪潮推到了歷史最高點。然而,...

竞博JBO  就在前段時間,MIT和IBM的研究人員們共同開發了一個叫GAN Paint Studio的后期圖像處理工具,人們通過它能隨心所欲地編...

  近年來,隨著人工智能的進一步發展創新,新技術持續獲得突破性進展,呈現出深度學習、跨界融合、人機協同、群智開放、自主操控等...

竞博JBO  移動應用、基礎設施與國防應用中核心技術與 RF 解決方案的領先供應商 Qorvo®, Inc.(納斯達克代碼:QRVO)今日宣布,發...

免責聲明:本站所有信息均搜集自互聯網,并不代表本站觀點,本站不對其真實合法性負責。如有信息侵犯了您的權益,請告知,本站將立刻處理。聯系QQ:1640731186
熱網推薦更多>>