【CV】基于聚类的图像分割-Python
了解圖像分割
當我們在做一個圖像分類任務時,首先我們會想從圖像中捕獲感興趣的區(qū)域,然后再將其輸入到模型中。讓我們嘗試一種稱為基于聚類的圖像分割技術,它會幫助我們在一定程度上提高模型性能,讓我們看看它是什么以及一些進行聚類分割的示例代碼。
什么是圖像分割?
想象一下我們要過馬路,過馬路之前我們會做什么?
首先,我們會看道路兩旁,以確定接近的車輛等環(huán)境對象,然后我們會對接近的車輛的速度做出一些快速的估計,并決定何時以及如何過馬路。所有這些都發(fā)生在很短的時間內(nèi),非常很的神奇。
我們的大腦捕捉道路兩側(cè)的圖像
它檢測道路上的車輛和其他物體==物體檢測
它還確定了它檢測到的每個對象的形狀 == 圖像分割
通過確定不同物體的形狀,我們的大腦能夠在同一張快照中檢測到多個物體,這是多么神奇啊。
讓我們進一步了解,假設我們有我們的圖像分類模型,它能夠以 95% 上的準確率對蘋果和橙子進行分類。當我們輸入一幅同時包含蘋果和橙子的圖像時,預測精度會下降。隨著圖像中對象數(shù)量的增加,分類模型的性能會下降,這就是目標定位發(fā)揮作用的地方。
在我們檢測圖像中的對象并對其進行分類之前,模型需要了解圖像中的內(nèi)容,這就是圖像分割的幫助所在。它為圖像中的對象創(chuàng)建一個像素級的蒙版,這有助于模型更精細地理解對象的形狀及其在圖像中的位置。
目標檢測 VS 圖像分割?
分割的類型有哪些?
圖像分割大致分為兩大類。
語義分割
實例分割
檢測到的對象 — 語義段 — 實例段?
在第一張圖片中,我們可以看到檢測到的對象都是男性。在語義分割中,我們認為所有這些像素都屬于一類,因此我們用一種顏色表示它們。另一方面,在實例分割中,這些像素屬于同一類,但我們用不同的顏色表示同一類的不同實例。
根據(jù)我們使用的分割方法,分割可以分為許多類別。
基于區(qū)域的分割
基于邊緣檢測的分割
基于聚類的分割
基于CNN的分割等。
接下來讓我們看一個基于聚類的分割示例。
什么是基聚類的分割?
聚類算法用于將彼此更相似的數(shù)據(jù)點從其他組數(shù)據(jù)點更緊密地分組。
現(xiàn)在我們想象一幅包含蘋果和橙子的圖像。蘋果中的大部分像素點應該是紅色/綠色,這與橙色的像素值不同。如果我們能把這些點聚在一起,我們就能正確地區(qū)分每個物體,這就是基于聚類的分割的工作原理。現(xiàn)在讓我們看一些代碼示例。
from skimage.io import imread from skimage.color import rgb2gray import numpy as np import matplotlib.pyplot as plt %matplotlib inline from scipy import ndimage # Scaling the image pixels values within 0-1 img = imread('./apple-orange.jpg') / 255 plt.imshow(img) plt.title('Original') plt.show()由于肉眼可見,圖像中有五個色段
蘋果的綠色部分
橙子的橙色部分
蘋果和橙子底部的灰色陰影
蘋果頂部和右側(cè)部分的亮黃色部分
白色背景
讓我們看看我們是否可以使用來自 scikit-learn 的 K 均值算法對它們進行聚類
# For clustering the image using k-means, we first need to convert it into a 2-dimensional array image_2D = img.reshape(img.shape[0]*img.shape[1], img.shape[2]) # Use KMeans clustering algorithm from sklearn.cluster to cluster pixels in image from sklearn.cluster import KMeans # tweak the cluster size and see what happens to the Output kmeans = KMeans(n_clusters=5, random_state=0).fit(image_2D) clustered = kmeans.cluster_centers_[kmeans.labels_] # Reshape back the image from 2D to 3D image clustered_3D = clustered.reshape(img.shape[0], img.shape[1], img.shape[2]) plt.imshow(clustered_3D) plt.title('Clustered Image') plt.show()效果非常好,我們能夠?qū)⑽鍌€部分組合在一起,這就是聚類分割的工作原理。目前有許多先進的技術,例如 Mask R-CNN,可以進行更細粒度的分割。
Github代碼連接:
https://github.com/Mathanraj-Sharma/sample-for-medium-article/blob/master/cluster-based-segmentation-skimage/cluster-based-segmentation.ipynb
往期精彩回顧適合初學者入門人工智能的路線及資料下載機器學習及深度學習筆記等資料打印機器學習在線手冊深度學習筆記專輯《統(tǒng)計學習方法》的代碼復現(xiàn)專輯 AI基礎下載黃海廣老師《機器學習課程》視頻課黃海廣老師《機器學習課程》711頁完整版課件本站qq群554839127,加入微信群請掃碼:
總結(jié)
以上是生活随笔為你收集整理的【CV】基于聚类的图像分割-Python的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 图神经网络概述:Graph Neural
- 下一篇: 【python】app未注册用户自动筛选