c++读取图片_Pytorch读取,加载图像数据(一)
Pytorch讀取,加載圖像數(shù)據(jù)(一)
在學(xué)習(xí)Pytorch的時候,先學(xué)會如何正確創(chuàng)建或者加載數(shù)據(jù),至關(guān)重要。
有了數(shù)據(jù),很多函數(shù),操作的效果就變得很直觀。
本文主要用其他庫讀取圖像文件(學(xué)會這個,你就可以在之后的學(xué)習(xí)中,將一些效果直觀化)
更好的文章組織結(jié)構(gòu):
- Github
- 關(guān)注公眾號:tuduisuinian(土堆碎念),菜單底部可以獲取pytorch教程PDF文檔
零:準(zhǔn)備
加載數(shù)據(jù)前,需要掌握正確的讀取路徑方法。很多教程中的例子,在講解的時候,沒有提供圖片,或者讀者不知道修改教程中的讀取路徑,打擊了熱情。
**建議:為了保證大家可以跟著教程一步一步練習(xí),教程中會出現(xiàn)示例圖片,建議大家右鍵-另存為圖片,將圖片保存到 你運行程序的文件夾 中。**如下圖:
壹:數(shù)據(jù)集的準(zhǔn)備
任務(wù):我們用不同的方式讀取這兩張圖片(記得右鍵-另存為圖片,保存到程序所在位置,記得文件重命名為你喜歡的方式,我的重命名為002.jpg和003.jpg
將文件另存為后,同時新建一個python文件,我的效果如下:
接下來,我們就可以在load_images.py中,進(jìn)行相關(guān)操作了。
貳:用其他庫讀取圖像文件
- 使用matplotlib庫進(jìn)行圖像的讀取
matplotlib中的函數(shù)跟Matlab很像。
我們需要使用matplotlib.pyplot中的函數(shù):
imread(文件地址):進(jìn)行讀取圖像的操作(參數(shù)為讀取圖像文件的路徑)
imshow(數(shù)組):進(jìn)行圖像的顯示操作(顯示圖像的數(shù)組)
show():顯示一個窗口,用于顯示圖像(很多時候,不顯示圖像的話,是忘記使用這個函數(shù))
我們嘗試探討,圖像被讀取后的數(shù)據(jù)類型,大小形狀
import matplotlib.pyplot as pltimg = plt.imread('002.jpg')#圖片的高H為460,寬W為346,顏色通道C為3print(img.shape)print(img.dtype)print(type(img))plt.imshow(img)plt.show()復(fù)制代碼輸出為:
(460, 346, 3)uint8復(fù)制代碼結(jié)論:imread讀取的圖片為numpy.ndarry的數(shù)組,數(shù)組的大小排列為:高×寬×通道數(shù),數(shù)組的數(shù)據(jù)類型是uint8,即每個數(shù)據(jù)的大小為[0,255]
如果不想手動進(jìn)行多圖像的讀取,需要使用到Python的文件,路徑操作等。暫不介紹
手動添加的話,就是用[array1,array2]這種形式,將數(shù)組進(jìn)行連接
import matplotlib.pyplot as pltimg1 = plt.imread('002.jpg')img2 = plt.imread('003.jpg')img = [img1, img2]for i in img: plt.imshow(i) plt.show()復(fù)制代碼- 使用cv2進(jìn)行圖像的讀取
在cv2庫中,需要用到的函數(shù)有:
imread(文件地址):讀取地址處的文件圖像
imshow('窗口名稱', 圖像數(shù)組):將圖像數(shù)組顯示出來,但必須結(jié)合waitKey()使用,否則無法顯示圖像
waitKey(延遲時間):需要設(shè)置延遲時間,當(dāng)延遲時間≤0時,窗口將會一直延遲,延遲無窮長時間,按下任一按鍵,可以繼續(xù)執(zhí)行下面程序。當(dāng)延遲時間>0,即窗口圖像會顯示對應(yīng)毫秒后,自動消失。
import cv2img1 = cv2.imread('002.jpg')print(img1.shape)print(img1.dtype)print(type(img1))cv2.imshow('img', img1)cv2.waitKey(0)復(fù)制代碼輸出為:
(460, 346, 3)uint8復(fù)制代碼結(jié)論:imread讀取的圖片為numpy.ndarry的數(shù)組,數(shù)組的大小排列為:高×寬×通道數(shù),數(shù)組的數(shù)據(jù)類型是uint8`,即每個數(shù)據(jù)的大小為[0,255]
Matplotlib與cv2對圖像的數(shù)據(jù)格式的處理是相似的,但是也是有區(qū)別的:
對于通道的讀取,cv2是按BGR的順序讀入,而matplotlib按RGB的順序讀入
- 使用PIL庫進(jìn)行圖像處理
PIL全稱為Python Image Library。是給Python提供圖像處理相關(guān)的庫。
需要使用到的函數(shù):
open(文件地址):打開文件,注意是打開,并沒有讀取。主要作用是保持檢查文件地址,同時保證文件是打開的狀態(tài)。當(dāng)對圖像處理的時候,會自動加載。
show():使用系統(tǒng)自帶的圖像查看器,查看圖像
from PIL import Imageimg1 = Image.open('002.jpg')# 因為PIL有自己的數(shù)據(jù)結(jié)構(gòu),所以沒有shape,dtype屬性# print(img1.shape)# print(img1.dtype)print(type(img1))img1.show()復(fù)制代碼輸出為:
復(fù)制代碼我們可以使用numpy.array()函數(shù),將PIL結(jié)構(gòu)的數(shù)據(jù)轉(zhuǎn)換成numpy數(shù)組。
import matplotlib.pyplot as pltfrom PIL import Imageimport numpy as npimg1 = Image.open('002.jpg')img1 = np.array(img1)print(img1.shape)print(img1.dtype)plt.imshow(img1)plt.show()復(fù)制代碼輸出:
(460, 346, 3)uint8復(fù)制代碼可以看到,PIL轉(zhuǎn)換成numpy后,數(shù)據(jù)類型是uint8的。
叁:總結(jié)
主要介紹了使用matplotlib,cv2,PIL庫進(jìn)行圖像文件的讀取
- matplotlib中的imread,imshow,show函數(shù)
- cv2中的imread,imshow,waitKey函數(shù)
- PIL中的open,show函數(shù)
總結(jié)
以上是生活随笔為你收集整理的c++读取图片_Pytorch读取,加载图像数据(一)的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: python中什么是算法_python自
- 下一篇: c++字符串输入_【pwn】什么是格式化