日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

Fashion-mnist数据的读取与保存

發布時間:2024/3/13 编程问答 34 豆豆
生活随笔 收集整理的這篇文章主要介紹了 Fashion-mnist数据的读取与保存 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

Fashion-mnist數據的讀取與保存

  • 圖像分類數據集(Fashion-MNIST)
    • 一、獲取數據集
      • 1.1 方法一
      • 1.2 方法二
    • 二、顯示數據
      • 2.1 方法一
      • 2.2 方法二
    • 三、保存數據
    • 四、讀取小批量
      • 4.1 方法一
      • 4.2 方法二
    • 小結

圖像分類數據集(Fashion-MNIST)

一、獲取數據集

首先導入本節需要的包或模塊。

%matplotlib inline import d2lzh as d2l from mxnet.gluon import data as gdata import sys import time from mxnet import nd

1.1 方法一

下面,我們通過Gluon的data包來下載這個數據集。第一次調用時會自動從網上獲取數據。我們通過參數train來指定獲取訓練數據集或測試數據集(testing data set)。測試數據集也叫測試集(testing set),只用來評價模型的表現,并不用來訓練模型。

mnist_train = gdata.vision.FashionMNIST(train=True) mnist_test = gdata.vision.FashionMNIST(train=False)

1.2 方法二

下面采用手動導入這個數據集導入已經下載好的mnist數據函數:load_mnist()

import os import struct import numpy as npdef load_mnist(path, kind='train'):"""Load MNIST data from `path`"""labels_path = os.path.join(path,'%s-labels-idx1-ubyte'% kind)images_path = os.path.join(path,'%s-images-idx3-ubyte'% kind)with open(labels_path, 'rb') as lbpath:magic, n = struct.unpack('>II',lbpath.read(8))labels = np.fromfile(lbpath,dtype=np.uint8)with open(images_path, 'rb') as imgpath:magic, num, rows, cols = struct.unpack('>IIII',imgpath.read(16))images = np.fromfile(imgpath,dtype=np.uint8).reshape(len(labels), 784)return images, labels X_train, y_train = load_mnist(r"H:\vacation\myGitHub\Machine_Learning\training\d2l-zh\data\fashion-mnist",kind='train') X_test, y_test = load_mnist(r'H:\vacation\myGitHub\Machine_Learning\training\d2l-zh\data\fashion-mnist',kind='t10k') len(X_train),len(X_test) (60000, 10000)

二、顯示數據

2.1 方法一

import matplotlib.pyplot as pltfig, ax = plt.subplots(nrows=2,ncols=5,sharex=True,sharey=True, )ax = ax.flatten() for i in range(10):img = X_train[y_train == i][0].reshape(28, 28) #一張圖片784(28*28)列ax[i].imshow(img, cmap='Greys', interpolation='nearest')ax[0].set_xticks([]) ax[0].set_yticks([]) plt.tight_layout() plt.show()

我們還可以繪制某一物品的多個樣本圖片, 來看一下這些樣本到底有多不同:

fig, ax = plt.subplots(nrows=5,ncols=5,sharex=True,sharey=True, )ax = ax.flatten() for i in range(25):img = X_train[y_train == 7][i].reshape(28, 28)ax[i].imshow(img, cmap='Greys', interpolation='nearest')ax[0].set_xticks([]) ax[0].set_yticks([]) plt.tight_layout() plt.show()

2.2 方法二

我們可以通過方括號[]來訪問任意一個樣本,下面獲取第一個樣本的圖像和標簽。

feature, label = mnist_train[0]

變量feature對應高和寬均為28像素的圖像。每個像素的數值為0到255之間8位無符號整數(uint8)。它使用三維的NDArray存儲。其中的最后一維是通道數。因為數據集中是灰度圖像,所以通道數為1。為了表述簡潔,我們將高和寬分別為 h h h w w w像素的圖像的形狀記為 h × w h \times w h×w或(h,w)。

feature.shape, feature.dtype ((28, 28, 1), numpy.uint8)

圖像的標簽使用NumPy的標量表示。它的類型為32位整數(int32)。

label, type(label), label.dtype (2, numpy.int32, dtype('int32'))

Fashion-MNIST中一共包括了10個類別,分別為t-shirt(T恤)、trouser(褲子)、pullover(套衫)、dress(連衣裙)、coat(外套)、sandal(涼鞋)、shirt(襯衫)、sneaker(運動鞋)、bag(包)和ankle boot(短靴)。以下函數可以將數值標簽轉成相應的文本標簽。

# 本函數已保存在d2lzh包中方便以后使用 def get_fashion_mnist_labels(labels):text_labels = ['t-shirt', 'trouser', 'pullover', 'dress', 'coat','sandal', 'shirt', 'sneaker', 'bag', 'ankle boot']return [text_labels[int(i)] for i in labels]

下面定義一個可以在一行里畫出多張圖像和對應標簽的函數。

# 本函數已保存在d2lzh包中方便以后使用 def show_fashion_mnist(images, labels):"""images類型:mxnet.ndarray.ndarray.NDArraylabels類型:numpy.ndarray"""d2l.use_svg_display()# 這里的_表示我們忽略(不使用)的變量_, figs = d2l.plt.subplots(1, len(images), figsize=(12, 12))for f, img, lbl in zip(figs, images, labels):f.imshow(img.reshape((28, 28)).asnumpy())f.set_title(lbl)f.axes.get_xaxis().set_visible(False)f.axes.get_yaxis().set_visible(False)

現在,我們看一下訓練數據集中前9個樣本的圖像內容和文本標簽。

X, y = mnist_train[0:9] show_fashion_mnist(X, get_fashion_mnist_labels(y))

type(X) mxnet.ndarray.ndarray.NDArray

三、保存數據

另外, 我們也可以選擇將 MNIST 圖片數據和標簽保存為 CSV 文件, 這樣就可以在不支持特殊的字節格式的程序中打開數據集. 但是, 有一點要說明, CSV 的文件格式將會占用更多的磁盤空間, 如下所示:
如果我們打算保存這些 CSV 文件, 在將 MNIST 數據集加載入 NumPy array 以后, 我們應該執行下列代碼:

np.savetxt('train_img.csv', X_train,fmt='%i', delimiter=',') np.savetxt('train_labels.csv', y_train,fmt='%i', delimiter=',') np.savetxt('test_img.csv', X_test,fmt='%i', delimiter=',') np.savetxt('test_labels.csv', y_test,fmt='%i', delimiter=',')

一旦將數據集保存為 CSV 文件, 我們也可以用 NumPy 的 genfromtxt 函數重新將它們加載入程序中:
NDArray和NumPy相互變換
我們可以通過array函數和asnumpy函數令數據在NDArray和NumPy格式之間相互變換。下面將NumPy實例變換成NDArray實例。

X_train2 = nd.array(np.genfromtxt('train_img.csv',dtype=int, delimiter=',')) y_train2 = np.genfromtxt('train_labels.csv',dtype=int, delimiter=',') X_test2 = nd.array(np.genfromtxt('test_img.csv',dtype=int, delimiter=',')) y_test2 = np.genfromtxt('test_labels.csv',dtype=int, delimiter=',')

訓練集中和測試集中的每個類別的圖像數分別為6,000和1,000。因為有10個類別,所以訓練集和測試集的樣本數分別為60,000和10,000。

len(mnist_train), len(mnist_test) (60000, 10000) #用csv數據畫出圖像 from mxnet import nd X1 = X_train2[0:9] y1 = y_train2[0:9] show_fashion_mnist(X1, get_fashion_mnist_labels(y1))

四、讀取小批量

我們將在訓練數據集上訓練模型,并將訓練好的模型在測試數據集上評價模型的表現。雖然我們可以像“線性回歸的從零開始實現”一節中那樣通過yield來定義讀取小批量數據樣本的函數,但為了代碼簡潔,這里我們直接創建DataLoader實例。該實例每次讀取一個樣本數為batch_size的小批量數據。這里的批量大小batch_size是一個超參數。

在實踐中,數據讀取經常是訓練的性能瓶頸,特別當模型較簡單或者計算硬件性能較高時。Gluon的DataLoader中一個很方便的功能是允許使用多進程來加速數據讀取(暫不支持Windows操作系統)。這里我們通過參數num_workers來設置4個進程讀取數據。

此外,我們通過ToTensor實例將圖像數據從uint8格式變換成32位浮點數格式,并除以255使得所有像素的數值均在0到1之間。ToTensor實例還將圖像通道從最后一維移到最前一維來方便之后介紹的卷積神經網絡計算。通過數據集的transform_first函數,我們將ToTensor的變換應用在每個數據樣本(圖像和標簽)的第一個元素,即圖像之上。

4.1 方法一

batch_size = 255 transformer = gdata.vision.transforms.ToTensor() if sys.platform.startswith('win'):num_workers = 0 # 0表示不用額外的進程來加速讀取數據 else:num_workers = 4train_iter = gdata.DataLoader(mnist_train.transform_first(transformer),batch_size, shuffle=True,num_workers=num_workers) test_iter = gdata.DataLoader(mnist_test.transform_first(transformer),batch_size, shuffle=False,num_workers=num_workers) gdata.DataLoader??

4.2 方法二

# 將訓練數據的特征和標簽組合 mnist_train2 = gdata.ArrayDataset(X_train2,y_train2) mnist_test2 = gdata.ArrayDataset(X_test2,y_test2) train_iter2 = gdata.DataLoader(mnist_train2,batch_size, shuffle=True,num_workers=num_workers) test_iter2 = gdata.DataLoader(mnist_test2,batch_size, shuffle=False,num_workers=num_workers)

我們將獲取并讀取Fashion-MNIST數據集的邏輯封裝在d2lzh.load_data_fashion_mnist函數中供后面章節調用。該函數將返回train_iter和test_iter兩個變量。隨著本書內容的不斷深入,我們會進一步改進該函數。它的完整實現將在“深度卷積神經網絡(AlexNet)”一節中描述。

最后我們查看讀取一遍訓練數據需要的時間。

start = time.time() for X, y in train_iter2:continue '%.2f sec' % (time.time() - start) '2.29 sec' X.shape,y.shape ((75, 784), (75,))

小結

  • Fashion-MNIST是一個10類服飾分類數據集,之后章節里將使用它來檢驗不同算法的表現。
  • 我們將高和寬分別為 h h h w w w像素的圖像的形狀記為 h × w h \times w h×w或(h,w)。

總結

以上是生活随笔為你收集整理的Fashion-mnist数据的读取与保存的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。

主站蜘蛛池模板: 99热| 欧美黄色短视频 | 国模无码视频一区二区三区 | 日韩中文字幕精品 | 香蕉av一区二区 | 久草免费在线 | 波多野结衣欧美 | 日韩成人av毛片 | 无码少妇一区二区三区芒果 | 国产一区二区精品丝袜 | 欧美xxxx18国产| 高清av一区二区三区 | 金瓶狂野欧美性猛交xxxx | 日本免费三区 | sao虎视频在线精品永久 | 求免费黄色网址 | 大胸奶汁乳流奶水出来h | 亚洲精品国偷拍自产在线观看蜜桃 | 九九免费精品视频 | 18视频在线观看娇喘 | 久久影视网 | 中文字幕一级二级三级 | 国产精品一区二区三区四区五区 | 亚洲精品v天堂中文字幕 | 午夜精品久久久久久久久 | 精品无码一区二区三区在线 | 久久国产经典 | 姝姝窝人体www聚色窝 | 亚洲第一福利网站 | 性色国产成人久久久精品 | 依人在线视频 | 亚洲欧美一区二区三区四区五区 | 成人av日韩| www免费网站在线观看 | 日韩在线第一 | 91久久久久久久久 | www..com黄色| 中文字幕在线观看91 | 四虎在线视频免费观看 | 成人一区二区三区四区 | 欧美xxxx网站| 日韩欧美精品久久 | 高清国产午夜精品久久久久久 | 精品一区二区三区在线播放 | 黄色av免费在线播放 | 亚洲第一色播 | 久草a视频 | 天堂影音| 国产一区99 | 欧美激情视频在线 | 亚洲国产综合av | 国模av | 手机在线永久免费观看av片 | 青青青国内视频在线观看软件 | av中文字幕一区二区三区 | 日韩激情成人 | 草草影院在线免费观看 | 亚洲成人精品一区二区三区 | 国产精品入口a级 | 亚洲精品人人 | 好男人www社区 | 蜜臀va| 久久露脸国语精品国产91 | 在线成人免费观看 | 亚洲免费视频一区二区三区 | 欧美与黑人午夜性猛交久久久 | 免费黄色小视频 | 色成人综合 | 国产精品不卡一区 | 欧美成人黄 | 91精产国品一二三 | 久草免费在线观看视频 | av在线播放一区二区三区 | xxxx69国产 | 久久av免费 | 久久久一区二区 | 中国黄色大片 | 国产色拍| 四虎影视免费永久大全 | 情侣作爱视频网站 | 三级毛毛片 | 特黄aaaaaaaaa毛片免费视频 | 自拍 亚洲 欧美 | 激情九月婷婷 | 嫩草影院在线视频 | 打开每日更新在线观看 | 久久一 | 欧美怡红院视频一区二区三区 | 国产视频一 | 青青草综合视频 | 国产女主播在线播放 | 黄色特级毛片 | 色哟哟免费 | 亚洲宅男天堂 | 午夜精品久久久久久99热 | 女教师高潮黄又色视频 | 天天操天天操天天操天天 | 色综合福利 | 午夜影院0606 |