日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

数据集转换_为什么LSTM看起来那么复杂,以及如何避免时序数据的处理差异和混乱...

發布時間:2023/12/4 编程问答 60 豆豆
生活随笔 收集整理的這篇文章主要介紹了 数据集转换_为什么LSTM看起来那么复杂,以及如何避免时序数据的处理差异和混乱... 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

LSTM(long short term memory,長短期記憶網絡)是預測時間序列最常用的神經網絡模型之一。但是這種神經網絡模型相當復雜,需要特定的結構、數據前期處理等操作。

當在網上搜尋要學習的代碼時,很難將另一個程序員的代碼合并到當前開展的項目中。對于LSTM尤其如此,導致這些問題的關鍵在于:

  • 數據準備的順序
  • 數據存儲的結構

簡單地說,由于兩個關鍵步驟有多種方法可以獲得相同的結果,因此每個程序員選擇的路徑可能有所不同。

在這篇文章中,將分析為什么我們必須下定決心使用一組特定的范例,特別是在為冗長的LSTM編程時,以便更好地調試和共享。

LSTM 數據準備階段

本質上,當我們為模型準備時間序列數據時,需要執行以下關鍵步驟:

  • 按時間分割數據集
  • 將數據集轉換為有監督學習問題

這兩個步驟的執行順序沒有明確規定。
因此一部分程序員先分割數據集,然后將其轉化為監督學習問題。而其他程序員則顛倒兩者順序。


先分割數據集,然后轉換為有監督學習問題


先轉換為有監督學習問題,然后分割數據集


處理結果

對比而言,雖然處理的結果相同,但是先分割數據集的方式所需代碼更少。而部分程序員在編程過程中,會使用第二種方式,這就導致了社區中交流問題和代碼時產生一定的差異和混亂。所以本文推薦優先分割數據集的方式。

數據結構

在我們決定了為LSTM準備數據的正確順序之后,我們需要選擇使用哪種合適的數據結構。數據結構大致可以分為以下三種:

  • Pandas DataFrame
  • Numpy Arrays
  • Lists

Pandas DataFrame

Pandas 是一個可靠的且便于操作的數據處理庫。而我們在編寫人工智能算法時,總是需要在進程的任何一步檢查數據以便于調試。在 Pandas 庫中可以很方便地做到這一點:

df.head()


<br>Pandas 示例:谷歌股票

通過 Pandas 可以打印出數據情況,以檢查在程序運行過程中是否出現錯誤。


Pandas 示例:一個模擬有監督學習問題的pandas dataframe

相比較而言, List 則具有多維度、不易于理解的缺點,對于調試工作不太友好。

Numpy Arrays

所有數據集或多或少都會轉換為 NumPy Arrays 以進行編輯或縮放操作。例如,如果我們希望在0和1之間縮放數據集,可以使用名為MinMaxScaler的工具:

from sklearn.preprocessing import MinMaxScaler
#df is pandas DataFrame
#conversion to numpy array
df = df.Values
scaler = MinMaxScaler(feature_range=(0, 1))
scaled_values = scaler.fit_transform(df)

將整個數據集作為NumPy Array 的問題在于,無法詳細查看其中的內容。不能夠以列名稱的方式查看數據(將數據集轉換為有監督的學習問題時,這一點非常重要)。并且對于算法的調試工作不夠友好。

幸運的是,可以輕松地從NumPy Arrays 切換回 DataFrame。

Lists

將數據集的內容存儲在多維列表中是十分低效的。以 Kaggle 上發表的一段代碼為例:


List 示例:一個四因素的時間序列數據存儲

不難發現,通過 Lists 難以直接定位數據并查看數據,并且不能夠通過列名稱的方式組織數據。

總結

規范化這個問題并不局限于LSTM,但是在 LSTM 編程過程中十分普遍。缺乏規范化導致在實際編程中,不能夠直接一個接一個地調用程序或函數。

現有的情況下,代碼看起來可能很簡單而且很快,但是搜索錯誤、調試代碼是個很大的問題。在函數聲明過程中,輸入數據的名稱可能會更改,因此當想要檢查隱藏在代碼中的變量的值或輸出時,往往不能簡單地調用原始的數據名稱,必須使用它所涉及到的所有代碼才能提取該數據的真實值。

這就是本文推薦使用統一的數據框架的原因。通過統一使用 Pandas Dataframe,可以輕松地檢查每個函數地輸出,更好地進行算法調試工作。

deephub 小組經驗

基本上所有的所有的編程語言的數字下標都是從0開始的,這就使得我們在處理序列數據的時候需要改掉以 1為起始的現實中的習慣。并且在python處理分片的時候使用的是左閉右開(絕大部分,并不是全部)的原則,這也是導致了我們對時序數組的操作需要特別的注意。

實際案例:LSTM需要通過前30天的數據,預測當天的數據,處理輸入數據的數組下標如何寫,有興趣的小伙伴可以手動試試。

作者:Michelangiolo Mazzeschi

deephub翻譯組:oliver lee

關注公眾號 "deephub-imba" 獲取更多AI干貨

總結

以上是生活随笔為你收集整理的数据集转换_为什么LSTM看起来那么复杂,以及如何避免时序数据的处理差异和混乱...的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。

主站蜘蛛池模板: 天堂在线视频网站 | 日本美女影院 | 中国少妇乱子伦视频播放 | 国产三级在线免费观看 | 日韩精品四区 | 在线观看免费视频a | 日本精品久久久久久久 | 黄色欧美视频 | 夜夜爽av | 悟空影视大全免费高清观看在线 | 久久久久区 | 国产欧美日韩综合精品 | 美女一区二区三区 | 日韩欧美片| 中文字幕在线观看91 | 久色网站| 精品国产一区二区三区av性色 | 免费无码国产精品 | 国产五月天婷婷 | a人片| 亚洲精品乱码久久久久久蜜桃动漫 | 天天插天天爽 | 国产精品一区二区在线 | 伊人影院中文字幕 | 激情网络 | 污视频网址在线观看 | 都市激情国产精品 | 中文字幕永久视频 | 国产精品久久久久影院色老大 | 少妇h视频 | 国产精品无人区 | 一级黄色欧美 | 可以免费看黄的网站 | 91国内精品视频 | 成人依依 | 超碰97av | 极品另类| 韩国电影大尺度在线观看 | 91久久久久久久久久 | 成人一区三区 | 亚洲成人生活片 | 天堂av资源在线 | 龚玥菲一级淫片 | 97精品自拍 | 美女一区二区三区视频 | 国产精品一二三级 | 久久久久久国产精品免费免费 | 亚洲网在线观看 | 免费的一级黄色片 | 爱的色放韩国电影 | av男人天堂av | 日韩精品乱码久久久久久 | 精品国产AV色欲天媒传媒 | 小日子的在线观看免费第8集 | 精品一区二区久久久 | 成人av一区二区在线观看 | 国产高清一区在线 | 国产一区二区观看 | 国产精品播放 | 欧美精品www | 999久久久免费精品国产 | 欧美在线视频二区 | 免费观看黄一级视频 | 国产精品熟女视频 | 在线视频一区二区三区四区 | 国产成人精品视频在线 | 青青草视频播放器 | 欧美高潮视频 | 成人av免费播放 | 在线观看免费黄色 | 黄网站在线免费 | 国产日产欧美一区二区 | 日本簧片在线观看 | 桃谷绘里香在线播放 | 国产精品色片 | 亚洲天堂手机版 | 日韩制服诱惑 | 国产理论一区 | 超碰下载页面 | 97av超碰| www国产精品内射熟女 | 99热这里只有精 | 波多野结衣毛片 | 福利视频亚洲 | 精品在线小视频 | 欧美日本二区 | 中文字幕免费一区二区 | 午夜综合 | 丝袜av在线播放 | 性一交一乱一伧国产女士spa | 在线视频观看一区二区 | 欧洲亚洲一区 | 国产美女裸体无遮挡免费视频 | 亚洲最大福利视频网 | 荒野求生21天去码版网站 | 欧洲一区二区三区在线 | 日韩一级影院 | 校园春色亚洲 | 亚洲成人黄色 |