深度学习数据集的准备
生活随笔
收集整理的這篇文章主要介紹了
深度学习数据集的准备
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
深度學習數據集的準備
下面介紹一個做了很久的項目,其中最簡單的一部分是將該乳腺X線數據集進行有病沒病的分類訓練,說到訓練最基本的就是數據集的準備,在這里先講講數據集怎么準備。下圖是原始數據集的一部分。數據集在我電腦路徑為C:\Users\Administrator.SKY-20180518VHY\Desktop\my
0中的數據
1中的數據
創建***空***的文件夾制作train集和validation set如下圖,路徑為C:\Users\Administrator.SKY-20180518VHY\Desktop\1
對其進行準備,詳細程序及講解如下:
在train和val文件夾中制作0,1文件夾
for i in range(len(c)):qqq=os.path.exists(train_root+'/'+c[i])if (not qqq):os.mkdir(train_root+'/'+c[i])qq=os.path.exists(val_root+'/'+c[i])if (not qq):os.mkdir(val_root+'/'+c[i])#將原始數據按照7:3分別復制到train 與val 中 aq='C:\\Users\\Administrator.SKY-20180518VHY\\Desktop\\my\\' for i in range(len(c)):a=c[i]#print(i)data_0=os.listdir(aq+a)#抓取0,1文件夾內X線照片的內容#print(data_0)#print(data_0[5])#索引的為文件夾中的x線圖像random.shuffle(data_0)#打亂數據for z in range(len(data_0)):#data_0為數據#print(z)pic_path=root+'/'+a+'/'+data_0[z]#得到data_0中的數據路徑if z<int(len(data_0)*0.7):obj_path=train_root+'/'+a+'/'+data_0[z]else:obj_path=val_root+'/'+a+'/'+data_0[z]#print(len(data_0),len(data_0)*0.7)#if (os.path.exists(pic_path)):shutil.copyfile(pic_path,obj_path)#將pic_path復制到obj_path中最終得到的數據集如下圖所示:
train文件夾中有:
val文件夾中有:
train中的0文件夾中數據:
val中1文件夾有:
總結
以上是生活随笔為你收集整理的深度学习数据集的准备的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 正交矩阵的定义及证明和性质
- 下一篇: JAVA网易云热评接口_网易云音乐热评爬