日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

计算图片相似度的方法

發布時間:2025/3/8 编程问答 21 豆豆
生活随笔 收集整理的這篇文章主要介紹了 计算图片相似度的方法 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

文章目錄

  • 1.余弦相似度計算
  • 2.哈希算法計算圖片的相似度
  • 3.直方圖計算圖片的相似度
  • 4.SSIM(結構相似度度量)計算圖片的相似度
  • 5.基于互信息(Mutual Information)計算圖片的相似度

1.余弦相似度計算

把圖片表示成一個向量,通過計算向量之間的余弦距離來表征兩張圖片的相似度。

from PIL import Image from numpy import average, dot, linalg # 對圖片進行統一化處理 def get_thum(image, size=(64, 64), greyscale=False):# 利用image對圖像大小重新設置, Image.ANTIALIAS為高質量的image = image.resize(size, Image.ANTIALIAS)if greyscale:# 將圖片轉換為L模式,其為灰度圖,其每個像素用8個bit表示image = image.convert('L')return image # 計算圖片的余弦距離 def image_similarity_vectors_via_numpy(image1, image2):image1 = get_thum(image1)image2 = get_thum(image2)images = [image1, image2]vectors = []norms = []for image in images:vector = []for pixel_tuple in image.getdata():vector.append(average(pixel_tuple))vectors.append(vector)# linalg=linear(線性)+algebra(代數),norm則表示范數# 求圖片的范數norms.append(linalg.norm(vector, 2))a, b = vectorsa_norm, b_norm = norms# dot返回的是點積,對二維數組(矩陣)進行計算res = dot(a / a_norm, b / b_norm)return res image1 = Image.open('010.jpg') image2 = Image.open('011.jpg') cosin = image_similarity_vectors_via_numpy(image1, image2) print('圖片余弦相似度', cosin)

2.哈希算法計算圖片的相似度

感知哈希算法是一類算法的總稱,包括aHash、pHash、dHash。顧名思義,感知哈希不是以嚴格的方式計算Hash值,而是以更加相對的方式計算哈希值,因為“相似”與否,就是一種相對的判定。

幾種hash值的比較:

aHash:平均值哈希。速度比較快,但是常常不太精確。
pHash:感知哈希。精確度比較高,但是速度方面較差一些。
dHash:差異值哈希。精確度較高,且速度也非常快
值哈希算法、差值哈希算法和感知哈希算法都是值越小,相似度越高,取值為0-64,即漢明距離中,64位的hash值有多少不同。三直方圖和單通道直方圖的值為0-1,值越大,相似度越高。

import cv2 import numpy as np from PIL import Image import requests from io import BytesIO import matplotlib matplotlib.use('TkAgg') import matplotlib.pyplot as pltdef aHash(img):# 均值哈希算法# 縮放為8*8img = cv2.resize(img, (8, 8))# 轉換為灰度圖gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)# s為像素和初值為0,hash_str為hash值初值為''s = 0hash_str = ''# 遍歷累加求像素和for i in range(8):for j in range(8):s = s+gray[i, j]# 求平均灰度avg = s/64# 灰度大于平均值為1相反為0生成圖片的hash值for i in range(8):for j in range(8):if gray[i, j] > avg:hash_str = hash_str+'1'else:hash_str = hash_str+'0'return hash_strdef dHash(img):# 差值哈希算法# 縮放8*8img = cv2.resize(img, (9, 8))# 轉換灰度圖gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)hash_str = ''# 每行前一個像素大于后一個像素為1,相反為0,生成哈希for i in range(8):for j in range(8):if gray[i, j] > gray[i, j+1]:hash_str = hash_str+'1'else:hash_str = hash_str+'0'return hash_strdef pHash(img):# 感知哈希算法# 縮放32*32img = cv2.resize(img, (32, 32)) # , interpolation=cv2.INTER_CUBIC# 轉換為灰度圖gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)# 將灰度圖轉為浮點型,再進行dct變換dct = cv2.dct(np.float32(gray))# opencv實現的掩碼操作dct_roi = dct[0:8, 0:8]hash = []avreage = np.mean(dct_roi)for i in range(dct_roi.shape[0]):for j in range(dct_roi.shape[1]):if dct_roi[i, j] > avreage:hash.append(1)else:hash.append(0)return hash def calculate(image1, image2):# 灰度直方圖算法# 計算單通道的直方圖的相似值hist1 = cv2.calcHist([image1], [0], None, [256], [0.0, 255.0])hist2 = cv2.calcHist([image2], [0], None, [256], [0.0, 255.0])# 計算直方圖的重合度degree = 0for i in range(len(hist1)):if hist1[i] != hist2[i]:degree = degree + \(1 - abs(hist1[i] - hist2[i]) / max(hist1[i], hist2[i]))else:degree = degree + 1degree = degree / len(hist1)return degreedef classify_hist_with_split(image1, image2, size=(256, 256)):# RGB每個通道的直方圖相似度# 將圖像resize后,分離為RGB三個通道,再計算每個通道的相似值image1 = cv2.resize(image1, size)image2 = cv2.resize(image2, size)sub_image1 = cv2.split(image1)sub_image2 = cv2.split(image2)sub_data = 0for im1, im2 in zip(sub_image1, sub_image2):sub_data += calculate(im1, im2)sub_data = sub_data / 3return sub_datadef cmpHash(hash1, hash2):# Hash值對比# 算法中1和0順序組合起來的即是圖片的指紋hash。順序不固定,但是比較的時候必須是相同的順序。# 對比兩幅圖的指紋,計算漢明距離,即兩個64位的hash值有多少是不一樣的,不同的位數越小,圖片越相似# 漢明距離:一組二進制數據變成另一組數據所需要的步驟,可以衡量兩圖的差異,漢明距離越小,則相似度越高。漢明距離為0,即兩張圖片完全一樣n = 0# hash長度不同則返回-1代表傳參出錯if len(hash1) != len(hash2):return -1# 遍歷判斷for i in range(len(hash1)):# 不相等則n計數+1,n最終為相似度if hash1[i] != hash2[i]:n = n + 1return ndef getImageByUrl(url):# 根據圖片url 獲取圖片對象html = requests.get(url, verify=False)image = Image.open(BytesIO(html.content))return imagedef PILImageToCV():# PIL Image轉換成OpenCV格式path = "/Users/waldenz/Documents/Work/doc/TestImages/t3.png"img = Image.open(path)plt.subplot(121)plt.imshow(img)print(isinstance(img, np.ndarray))img = cv2.cvtColor(np.asarray(img), cv2.COLOR_RGB2BGR)print(isinstance(img, np.ndarray))plt.subplot(122)plt.imshow(img)plt.show()def CVImageToPIL():# OpenCV圖片轉換為PIL imagepath = "/Users/waldenz/Documents/Work/doc/TestImages/t3.png"img = cv2.imread(path)# cv2.imshow("OpenCV",img)plt.subplot(121)plt.imshow(img)img2 = Image.fromarray(cv2.cvtColor(img, cv2.COLOR_BGR2RGB))plt.subplot(122)plt.imshow(img2)plt.show()def bytes_to_cvimage(filebytes):# 圖片字節流轉換為cv imageimage = Image.open(filebytes)img = cv2.cvtColor(np.asarray(image), cv2.COLOR_RGB2BGR)return imgdef runAllImageSimilaryFun(para1, para2):# 均值、差值、感知哈希算法三種算法值越小,則越相似,相同圖片值為0# 三直方圖算法和單通道的直方圖 0-1之間,值越大,越相似。 相同圖片為1# t1,t2 14;19;10; 0.70;0.75# t1,t3 39 33 18 0.58 0.49# s1,s2 7 23 11 0.83 0.86 挺相似的圖片# c1,c2 11 29 17 0.30 0.31if para1.startswith("http"):# 根據鏈接下載圖片,并轉換為opencv格式img1 = getImageByUrl(para1)img1 = cv2.cvtColor(np.asarray(img1), cv2.COLOR_RGB2BGR)img2 = getImageByUrl(para2)img2 = cv2.cvtColor(np.asarray(img2), cv2.COLOR_RGB2BGR)else:# 通過imread方法直接讀取物理路徑img1 = cv2.imread(para1)img2 = cv2.imread(para2)hash1 = aHash(img1)hash2 = aHash(img2)n1 = cmpHash(hash1, hash2)print('均值哈希算法相似度aHash:', n1)hash1 = dHash(img1)hash2 = dHash(img2)n2 = cmpHash(hash1, hash2)print('差值哈希算法相似度dHash:', n2)hash1 = pHash(img1)hash2 = pHash(img2)n3 = cmpHash(hash1, hash2)print('感知哈希算法相似度pHash:', n3)n4 = classify_hist_with_split(img1, img2)print('三直方圖算法相似度:', n4)n5 = calculate(img1, img2)print("單通道的直方圖", n5)print("%d %d %d %.2f %.2f " % (n1, n2, n3, round(n4[0], 2), n5[0]))print("%.2f %.2f %.2f %.2f %.2f " % (1-float(n1/64), 1 -float(n2/64), 1-float(n3/64), round(n4[0], 2), n5[0]))plt.subplot(121)plt.imshow(Image.fromarray(cv2.cvtColor(img1, cv2.COLOR_BGR2RGB)))plt.subplot(122)plt.imshow(Image.fromarray(cv2.cvtColor(img2, cv2.COLOR_BGR2RGB)))plt.show()if __name__ == "__main__":p1="https://ww3.sinaimg.cn/bmiddle/007INInDly1g336j2zziwj30su0g848w.jpg"p2="https://ww2.sinaimg.cn/bmiddle/007INInDly1g336j10d32j30vd0hnam6.jpg"runAllImageSimilaryFun(p1,p2)

3.直方圖計算圖片的相似度

利用直方圖計算圖片的相似度時,是按照顏色的全局分布情況來看待的,無法對局部的色彩進行分析,同一張圖片如果轉化成為灰度圖時,在計算其直方圖時差距就更大了。對于灰度圖可以將圖片進行等分,然后在計算圖片的相似度。

# 將圖片轉化為RGB def make_regalur_image(img, size=(64, 64)):gray_image = img.resize(size).convert('RGB')return gray_image# 計算直方圖 def hist_similar(lh, rh):assert len(lh) == len(rh)hist = sum(1 - (0 if l == r else float(abs(l - r)) / max(l, r)) for l, r in zip(lh, rh)) / len(lh)return hist# 計算相似度 def calc_similar(li, ri):calc_sim = hist_similar(li.histogram(), ri.histogram())return calc_simif __name__ == '__main__':image1 = Image.open('123.jpg')image1 = make_regalur_image(image1)image2 = Image.open('456.jpg')image2 = make_regalur_image(image2)print("圖片間的相似度為", calc_similar(image1, image2))

4.SSIM(結構相似度度量)計算圖片的相似度

SSIM是一種全參考的圖像質量評價指標,分別從亮度、對比度、結構三個方面度量圖像相似性。SSIM取值范圍[0, 1],值越大,表示圖像失真越小。在實際應用中,可以利用滑動窗將圖像分塊,令分塊總數為N,考慮到窗口形狀對分塊的影響,采用高斯加權計算每一窗口的均值、方差以及協方差,然后計算對應塊的結構相似度SSIM,最后將平均值作為兩圖像的結構相似性度量,即平均結構相似性SSIM。

# -*- coding: utf-8 -*- from skimage.measure import compare_ssim from scipy.misc import imread import numpy as np # 讀取圖片 img1 = imread('../dataset/100002.png') img2 = imread('../dataset/100001.png') img2 = np.resize(img2, (img1.shape[0], img1.shape[1], img1.shape[2])) print(img1.shape) print(img2.shape) ssim = compare_ssim(img1, img2, multichannel = True) print(ssim)

5.基于互信息(Mutual Information)計算圖片的相似度

通過計算兩個圖片的互信息來表征他們之間的相似度,如果兩張圖片尺寸相同,還是能在一定程度上表征兩張圖片的相似性的。但是,大部分情況下圖片的尺寸不相同,如果把兩張圖片尺寸調成相同的話,又會讓原來很多的信息丟失,所以很難把握。經過實際驗證,此種方法的確很難把握。

from sklearn import metrics as mr from scipy.misc import imread import numpy as npimg1 = imread('1.jpg') img2 = imread('2.jpg')img2 = np.resize(img2, (img1.shape[0], img1.shape[1], img1.shape[2]))img1 = np.reshape(img1, -1) img2 = np.reshape(img2, -1) print(img2.shape) print(img1.shape) mutual_infor = mr.mutual_info_score(img1, img2)print(mutual_infor)

總結

以上是生活随笔為你收集整理的计算图片相似度的方法的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。