十九、Pytorch中的数据加载
生活随笔
收集整理的這篇文章主要介紹了
十九、Pytorch中的数据加载
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
1. Pytorch中DataSet的使用方法
1.1 DataSet加載數據的方法
-
DataSet是Pytorch中用來表示數據集的一個抽象類,在torch中提供了數據集的基類torch.utils.data.Dataset,繼承這個基類,我們能夠快速地實現對數據的加載**.**
__len__:返回數據集大小; __getitem__:可以通過下標方式獲取數據
1.2 DataSet類的源碼
1.3 DataLoader使用方法
- 定義dataset實例
- 設置讀取數據batch的大小,常用128,256等等
- 設置shuffle:bool類型,表示是否在每次獲取數據的時候提前打亂數據
1.4 數據集介紹
- 數據集:setiment.test.data,情感分析二分類數據,數據包含兩列,文本和標簽.
- 地址:https://github.com/bojone/bert4keras/tree/master/examples/datasets.
- 數據集格式如下圖所示:
1.5 代碼
- 步驟一:導入工具庫
- 步驟二:定義數據讀取類
- 步驟三:定義主函數
- 步驟四:使用DataLoader批量讀取數據
總結
以上是生活随笔為你收集整理的十九、Pytorch中的数据加载的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 十八、梯度下降与反向传播
- 下一篇: 二十、文本情感分类