3D点云的深度学习
使用卷積神經(jīng)網(wǎng)絡(luò)(CNN)架構(gòu)的深度學(xué)習(xí)(DL)現(xiàn)在是解決圖像分類任務(wù)的標(biāo)準(zhǔn)解決方法。但是將此用于處理3D數(shù)據(jù)時,問題變得更加復(fù)雜。首先,可以使用各種結(jié)構(gòu)來表示3D數(shù)據(jù),所述結(jié)構(gòu)包括:
1 體素網(wǎng)格
2 點云
3 多視圖
4 深度圖
對于多視圖和深度圖的情況,該問題被轉(zhuǎn)換為在多個圖像上使用2D CNN解決。通過簡單定義3D卷積核,可以將2D CNN的擴(kuò)展用于3D Voxel網(wǎng)格。但是,對于3D點云的情況,目前還不清楚如何應(yīng)用DL工具。但是之前也已經(jīng)有幾種解決辦法了,具體可以參看 http://www.cnblogs.com/li-yao7758258/p/8182846.html 的總結(jié)
以及最近山東大學(xué)研究者們提出的PointCNN,對于pointCNN 這篇論文是一種為基于點云的特征學(xué)習(xí)提出了一種簡單且通用的框架。CNN成功的關(guān)鍵是要能利用數(shù)據(jù)中以網(wǎng)格形式密集表示的空間上的局部相關(guān)性(比如圖像)。但是,點云是不規(guī)則和無序的,因此在這些點關(guān)聯(lián)的特征上直接求核的卷積會導(dǎo)致形狀信息的丟失,同時還會因順序不同而不同。為了解決這些問題,提出了根據(jù)輸入點學(xué)習(xí)一種X變換,然后將其用于同時加權(quán)與點關(guān)聯(lián)的輸入特征和將它們重新排列成潛在隱含的規(guī)范順序,之后再在元素上應(yīng)用求積和求和運算。我們提出的方法是典型CNN向基于點云的特征學(xué)習(xí)的泛化,因此將其稱為PointCNN。實驗表明,PointCNN能在多種有挑戰(zhàn)性的基準(zhǔn)數(shù)據(jù)集和任務(wù)上實現(xiàn)與之前最佳方法媲美或更好的表現(xiàn)。
總結(jié)
- 上一篇: segMatch:基于3D点云分割的回环
- 下一篇: PCL之C++动态内存学习