python图像处理教程_Python基于Tensor FLow的图像处理操作详解
本文實例講述了Python基于Tensor FLow的圖像處理操作。分享給大家供大家參考,具體如下:
在對圖像進(jìn)行深度學(xué)習(xí)時,有時可能圖片的數(shù)量不足,或者希望網(wǎng)絡(luò)進(jìn)行更多的學(xué)習(xí),這時可以對現(xiàn)有的圖片數(shù)據(jù)進(jìn)行處理使其變成一張新的圖片,在此基礎(chǔ)上進(jìn)行學(xué)習(xí),從而提高網(wǎng)絡(luò)識別的準(zhǔn)確率。
1、圖像解碼顯示
利用matplot庫可以方便簡潔地在jupyter內(nèi)對圖片進(jìn)行繪制與輸出,首先通過tf.gfile打開圖片文件,并利用函數(shù)tf.image.decode_jpeg將jpeg圖片解碼為三位矩陣,之后便可以通過matplot繪制與顯示圖片信息了
import matplotlib.pyplot as plt
import tensorflow as tf
import numpy as np
#讀取圖像文件
image_raw=tf.gfile.GFile('D:\Temp\MachineLearning\data\cat.jpeg','rb').read()
with tf.Session() as sess:
#對jpeg圖像解碼得到圖像的三位矩陣數(shù)據(jù)
image_data=tf.image.decode_jpeg(image_raw)
print(image_data.eval())
plt.imshow(image_data.eval())
plt.show()
可以看到打印的圖片三維矩陣信息和顯示的圖片:
????????????????????????????
2、圖像縮放
tensorflow還自帶了許多圖像處理函數(shù),比如resize_image對圖片進(jìn)行大小的縮放。其中第一個參數(shù)代表圖片數(shù)據(jù)源,第二個數(shù)組代表縮放后的大小,第三個method代表采用的縮放方法,默認(rèn)0是雙線性插值法,1代表最近鄰插值法,2代表雙立方插值法,3代表像素區(qū)域插值法。
#對圖片大小進(jìn)行縮放
image_resize=tf.image.resize_images(image_data,[500,500],method=0)
#tensorflow處理后的圖片是float32格式的,需要轉(zhuǎn)化為uint8才能正確輸出
image_resize=np.asarray(image_resize.eval(),dtype='uint8')
plt.imshow(image_resize)
plt.show()
3、圖像裁切
函數(shù)tf.image.resize_image_with_crop_or_pad可以在保證圖片原始比例的條件下對圖片進(jìn)行裁切或填充。
函數(shù)tf.image.random_crop是隨機對圖片進(jìn)行選取裁剪,而不是以中心。
#圖片裁剪
image_crop=tf.image.resize_image_with_crop_or_pad(image_data,500,500)
plt.imshow(image_crop.eval())
plt.show()
#隨機裁剪
img_random=tf.image.random_crop(image_data,[300,300,3])
plt.imshow(img_random.eval())
plt.show()
??????????????????????????????
resize_image_with_crop_or_pad第一個參數(shù)是圖片資源,后兩個參數(shù)是裁切后的圖片大小,當(dāng)原始圖片大于目標(biāo)值時將裁去兩邊多余部分,當(dāng)圖片小于目標(biāo)值時將用黑色填充,例如上圖左右被裁剪,上下用黑色填充。
random_crop第一個參數(shù)是圖片資源,第二個參數(shù)是一個三位張量,代表目標(biāo)圖像大小。
4、圖像翻轉(zhuǎn)
通過函數(shù)實現(xiàn)圖片的上下、左右翻轉(zhuǎn),在模型訓(xùn)練時,可以將原本的樣本圖片進(jìn)行反轉(zhuǎn),作為新的特征值進(jìn)行輸入供模型訓(xùn)練。
#上下翻轉(zhuǎn)
img_down=tf.image.flip_up_down(image_data)
plt.imshow(img_down.eval())
plt.show()
#左右翻轉(zhuǎn)
img_left=tf.image.flip_left_right(image_data)
plt.imshow(img_left.eval())
plt.show()
5、調(diào)整對比度、明度、飽和度
通過tf.image.adjust_contrast可以對圖像對比度進(jìn)行調(diào)整,當(dāng)參數(shù)大于1代表加深,小于1代表減淡
tf.image.random_contrast可以在指定范圍內(nèi)隨即調(diào)整對比度
類似的還有adjust_brightness、adjust_saturation、adjust_hue對明度、飽和度、色相進(jìn)行調(diào)整
#加深對比度
img_deep=tf.image.adjust_contrast(image_data,2)
plt.imshow(img_deep.eval())
plt.show()
#降低對比度
img_fade=tf.image.adjust_contrast(image_data,0.5)
plt.imshow(img_fade.eval())
plt.show()
#隨機對比度
img_contrast=tf.image.random_contrast(image_data,0.5,2)
plt.imshow(img_contrast.eval())
plt.show()
6、對VGG網(wǎng)絡(luò)的輸入圖片進(jìn)行處理
Vgg網(wǎng)絡(luò)訓(xùn)練中傳入的圖片參數(shù)x_img是以batch_size為單位的四維數(shù)據(jù),例如傳入20張32×32的3通道圖片,其數(shù)據(jù)為[20,32,32,3]。但是tensorflow的圖片處理函數(shù)只可以處理三維的單張圖片。因此需要首先通過split()函數(shù)將20張圖片拆分成單張[1,32,32,3],再通過reshape()函數(shù)轉(zhuǎn)化為三維數(shù)據(jù)[32,32,3],之后再調(diào)用圖片處理函數(shù)對圖片進(jìn)行處理,將處理后的圖片恢復(fù)成四維,然后放在數(shù)組res_arr中,拼接成原來的一組20×32×32×3的數(shù)據(jù)。
# 將一批batch_size張圖片在第一維上切分為單張圖片
img_arr=tf.split(x_img,batch_size,axis=0)
res_arr=[]
# 遍歷每個圖片對其進(jìn)行處理
for img in img_arr:
# 將單張四維的圖片[1,32,32,3]處理成三維[32,32,3]
img=tf.reshape(img,[32,32,3])
# 對單張圖片進(jìn)行圖像增強
img_flip=tf.image.random_flip_left_right(img) # 翻轉(zhuǎn)圖片
img_bright=tf.image.random_brightness(img_flip,max_delta=63) # 隨機調(diào)整亮度
img_contrast=tf.image.random_contrast(img_bright,lower=0.2, upper=1.8) # 調(diào)整對比度
# 將增強后的圖片再變回原來的四維格式
img=tf.reshape(img_contrast,[1,32,32,3])
# 將每個處理后的圖片放在一個數(shù)組
res_arr.append(img)
# 將處理后的單個圖片重新拼接在一起
img_aug=tf.concat(res_arr,axis=0)
希望本文所述對大家Python程序設(shè)計有所幫助。
總結(jié)
以上是生活随笔為你收集整理的python图像处理教程_Python基于Tensor FLow的图像处理操作详解的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: Adobe Reader 背景色修改
- 下一篇: python用一行代码画个迷宫_用 Py