當(dāng)前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

OpenCV学习笔记（五十一）——imge stitching图像拼接stitching OpenCV学习笔记（五十二）——号外：OpenCV 2.4.1 又出来了。。。。。 OpenCV学习笔记（五

發(fā)布時間：2025/3/21 编程问答 34 豆豆

生活随笔收集整理的這篇文章主要介紹了 OpenCV学习笔记（五十一）——imge stitching图像拼接stitching OpenCV学习笔记（五十二）——号外：OpenCV 2.4.1 又出来了。。。。。 OpenCV学习笔记（五小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

OpenCV學(xué)習(xí)筆記（五十一）——imge stitching圖像拼接stitching

stitching是OpenCV2.4.0一個新模塊，功能是實現(xiàn)圖像拼接，所有的相關(guān)函數(shù)都被封裝在Stitcher類當(dāng)中。這個類當(dāng)中我們可能用到的成員函數(shù)有createDefault、estimateTransform、composePanorama、stitch。其內(nèi)部實現(xiàn)的過程是非常繁瑣的，需要很多算法的支持，包括圖像特征的尋找和匹配，攝像機的校準(zhǔn)，圖像的變形，曝光補償和圖像融合。但這些模塊的接口、調(diào)用，強大的OpenCV都為我們搞定了，我們使用OpenCV做圖像拼接，只需要調(diào)用createDefault函數(shù)生成默認(rèn)的參數(shù)，再使用stitch函數(shù)進行拼接就ok了。就這么簡單！estimateTransform和composePanorama函數(shù)都是比較高級的應(yīng)用，如果各位對stitching的流程不是很清楚的話，還是慎用。

實例也非常簡單，下載鏈接哦：http://download.csdn.net/detail/yang_xian521/4321158。

輸入原圖（為了顯示，我都壓縮過）：

OpenCV學(xué)習(xí)筆記（五十二）——號外：OpenCV 2.4.1 又出來了。。。。。

距離2.4.0放出來才一個月。兒童節(jié)當(dāng)天2.4.1就出爐了。。。。真心跟不上節(jié)奏啊，路漫漫其修遠兮。。。。

這次主要的改變還是bug的修訂，之前有朋友告訴我，說他的2.3.1版本說什么都不能成功配置CUDA，后來他用2.2版本就成功了，看來新出的版本bug還是很多的，也不能盲目求新。這次的2.4.1版本更新如下：

GPU模塊支持了CUDA4.1、CUDA4.2版本，添加了一個文件字符串存儲回讀的API接口

完善了光流法的clacOpticalFlowPyrLK，支持了金字塔圖像作為輸入

完善了文檔，使文檔和版本更加對應(yīng)

修正了SURF、MSER的python包裝

修正了其他45處bug

最近更新比較慢，感覺沒有學(xué)習(xí)OpenCV過程有新的太大收獲，還請見諒

OpenCV學(xué)習(xí)筆記（五十三）——新版本2.4.2簡介&FREAK和ORB特征描述子效果對比features2d

OpenCV 2.4.2簡介

OpenCV從未放慢自己前進的步法，就在7月4日，最新版的2.4.2又放出來了。與之同時放出的還有兩個網(wǎng)站http://opencv.org/和http://answers.opencv.org，前者作為一個正式的全新的官方用戶網(wǎng)站，簡單瀏覽了一下，應(yīng)該是一個對應(yīng)之前維基百科上的那個網(wǎng)站，是一個介紹性的新聞網(wǎng)站，對開發(fā)者的意義可能不是太大；后面這個網(wǎng)站就厲害了，是一個類似google討論組一樣的交流區(qū)，大家可以在上面提問，留言，解答，我也剛剛注冊了個用戶，剛成立沒幾天已經(jīng)有60多個問題了，應(yīng)該還是很活躍的一個討論區(qū)。

還是老樣子，介紹一下新版本的更新以及改動：

現(xiàn)在支持IOS操作系統(tǒng)了！開發(fā)iphone的朋友們，你們也可以用OpenCV了，是不是內(nèi)牛滿面。

添加了一個新的特征點描述算法FREAK，這也是今年的CVPR的一個新算法，也是一個2值的特征，文章里說是根據(jù)人視網(wǎng)膜的原理，挺玄乎的，據(jù)說是效果比ORB和SURF都好，我要試試看。

對GPU的模塊進一步優(yōu)化，對個別算法的性能有較大提升。

還修正了2.4.1的50多個bug。

介紹就這么多，感覺亮點就是網(wǎng)站的建設(shè)和這個FREAK特征，其他的還得慢慢摸索啊

FREAK和ORB特征描述子效果對比

ORB就是BRIEF的改進，BRIEF太簡單了，就不介紹了，有興趣的朋友自己看paper吧。ORB的paper我讀下來，感覺改進主要有以下幾點：用FAST作為特征點提取的算法，更快了，添加了特征點的主方向，這樣就具有了旋轉(zhuǎn)不變性。最后一點其實我也想到了，當(dāng)時看BRIEF的時候就想應(yīng)該可以優(yōu)化，就是ORB采用貪婪窮舉的方法得到了相關(guān)性較低的隨機點對，還有一個改進就是對于隨機點對，受噪聲的影響很大BRIEF的辦法就是對原圖像濾波，降低噪聲的影響，ORB不在使用像素點的直接比較，而是選擇該像素為中心的一個小patch作為比較對象，提高了抗噪能力。

FREAK我只是大致看了下，理解可能不到位，我的理解是這個算法是基于人眼視網(wǎng)膜細(xì)胞的分布，中間密集，四周稀疏，從而在圖像中構(gòu)建很多的區(qū)域，當(dāng)然越靠近中心的區(qū)域采樣更密集，四周區(qū)域采樣稀疏，隨機對比各區(qū)域的像素得到一組2值特征，這個算法也關(guān)注了尺度和方向的問題，都有對應(yīng)的解決辦法，還根據(jù)了人眼看事物時眼睛不停的轉(zhuǎn)動，設(shè)計了一種級聯(lián)的搜索器，總而言之，我感覺這個算法也是受ORB和BRISK這種2值特征的啟發(fā)下的一種改進吧。

下面就利用OpenCV對其進行一下對比，值得說明的是，在2.4.2中，FREAK給出了pattern的訓(xùn)練代碼。

對比實驗效果如下：（上圖為ORB，下圖為FREAK）

經(jīng)過篩選之后的特征點如下圖：（上圖為ORB，下圖為FREAK）

當(dāng)然，我這里只是個簡單的測試，其實并不能完全反應(yīng)實際的性能，因為我這里FREAK的特征點位置的檢測用的是SURF，而ORB用的是FAST。但從我這里的比較效果來看，ORB要好很多。下面讓我來對比一下算法的運行時間：

?	ORB	FREAK detection	FREAK extraction
debug	0.317s	0.301s	0.167s
release	0.094s	0.162s	0.085s

雖然兩種算法不能直接比較，因為FREAK沒有提供特征點位置檢測的算法，個人感覺如果FREAK采用FAST來做detection，確實速度應(yīng)該要逼ORB要快一些。

最后分享給大家我的工程鏈接：http://download.csdn.net/detail/yang_xian521/4421537

OpenCV學(xué)習(xí)筆記（五十四）——概述FaceRecognizer人臉識別類contrib?

在最新版的2.4.2中，文檔的更新也是一大亮點，refrence manual擴充了200多頁的內(nèi)容，添加了contrib部分的文檔。contrib就是指OpenCV中新添加的模塊，但又不是很穩(wěn)定，可以認(rèn)為是一個雛形的部分。這次結(jié)合refman的閱讀，介紹一下FaceRecognizer這個人臉識別類，這個類也是2.4.2更新日志里著重強調(diào)過的更新，配套的文檔也是相當(dāng)充實。這個類的基類也是Algorithm類，對于Algorithm類的簡單介紹，請參看我之前的blogOpenCV學(xué)習(xí)筆記（五十）——Algorithm類介紹（core），這個類內(nèi)的接口函數(shù)也是異常簡單，人臉識別的任務(wù)也就是兩大部分，訓(xùn)練和預(yù)測，分別對應(yīng)著train函數(shù)和predict函數(shù)，還有對應(yīng)的數(shù)據(jù)加載保存函數(shù)save和load。不過它當(dāng)然還可以調(diào)用其基類Algorithm的函數(shù)。特別說明的是，人臉識別中預(yù)測的參數(shù)也是可以調(diào)節(jié)的，但這里只給出了train和predict函數(shù)，為啥沒有setparameter的函數(shù)呢，那是因為各中人臉識別方法的參數(shù)并不相同，要通過Algorithm的get和set函數(shù)實時的調(diào)整~~v5啊！

先來說說訓(xùn)練的過程，train函數(shù)的兩個參數(shù)也很簡單，訓(xùn)練的圖像組vector<Mat>和對應(yīng)的標(biāo)簽組vector<int>，這個label標(biāo)簽只需保證同一個人的標(biāo)簽相同即可，不需要保證圖像的按標(biāo)簽順序輸入，方便極了。對于預(yù)測，有兩種調(diào)用，其中的參數(shù)有測試圖像、返回的標(biāo)簽值和測試樣本和標(biāo)簽樣本的相似性。返回的標(biāo)簽值為-1，說明測試樣本在訓(xùn)練集中無對應(yīng)或距離較遠。這里用個FisherFace作為示例說明一下如何訓(xùn)練和預(yù)測：

[cpp] view plain copy

vector<Mat>?images;??

vector<int>?labels;??

//?images?for?first?person??

images.push_back(imread("person0/0.jpg",?CV_LOAD_IMAGE_GRAYSCALE));??

labels.push_back(0);??

images.push_back(imread("person0/1.jpg",?CV_LOAD_IMAGE_GRAYSCALE));??

labels.push_back(0);??

//?images?for?second?person??

images.push_back(imread("person1/0.jpg",?CV_LOAD_IMAGE_GRAYSCALE));??

labels.push_back(1);??

images.push_back(imread("person1/1.jpg",?CV_LOAD_IMAGE_GRAYSCALE));??

labels.push_back(1);??

Ptr<FaceRecognizer>?model?=?createFisherFaceRecognizer();??

model->train(images,?labels);??

Mat?img?=?imread("person1/2.jpg",?CV_LOAD_IMAGE_GRAYSCALE);??

int?predicted?=?model->predict(img);??

當(dāng)然我們也不需要每次使用都進行一次訓(xùn)練，可以把訓(xùn)練好的模型通過save函數(shù)保存成一個文件，下次使用的時候只需load即可。

目前支持的3種人臉識別的方案：特征臉EigenFace、Fisher臉FisherFace、LBP直方圖LBPHFace。分別調(diào)用函數(shù)createEigenFaceRecognizer、createFisherFaceRecognizer、createLBPHFaceRecognizer建立模型。

對于EigenFace兩個輸入?yún)?shù)，分別為PCA主成分的維數(shù)num_components和預(yù)測時的閾值threshold，主成分這里沒有一個選取的準(zhǔn)則，要根據(jù)輸入數(shù)據(jù)的大小而決定，通常認(rèn)為80維主成分是足夠的。除了這兩個輸入?yún)?shù)外，還有eigenvalues和eigenvectors分別代表特征值和特征向量，mean參數(shù)為訓(xùn)練樣本的平均值，projections為訓(xùn)練數(shù)據(jù)的預(yù)測值，labels為預(yù)測時的閾值。

對于FisherFace，和EigenFace非常相似，也有num_components和threshold兩個參數(shù)和其他5個參數(shù)，FisherFace的降維是LDA得到的。默認(rèn)值為c-1，如果設(shè)置的初始值不在（0，c-1]的范圍內(nèi)，會自動設(shè)定為c-1。

特別需要強調(diào)的是，EigenFace和FisherFace的訓(xùn)練圖像和測試圖像都必須是灰度圖，而且是經(jīng)過歸一化裁剪過的。

對于LBPHFace，我想不用過多介紹，LBP簡單和效果是大家都很喜歡的，參數(shù)包括半徑radius，鄰域大小即采樣點個數(shù)neighbors，x和y方向的單元格數(shù)目grid_x,grid_y，還有兩個參數(shù)histograms為訓(xùn)練數(shù)據(jù)得到的直方圖，labels為直方圖對應(yīng)的標(biāo)簽。這個方法也要求訓(xùn)練和測試的圖像是灰度圖

接下來應(yīng)該結(jié)合文檔進一步研究一下這個人臉識別類。我之前大量的人臉實驗都是在matlab下進行的，有了這個利器，我感覺會有越來越多的學(xué)生做老師和老板布置的project會選擇用OpenCV，而不是Matlab。希望我們都愛的OpenCV越來越好，越來越強大。歡迎交流

OpenCV學(xué)習(xí)筆記（五十五）——用OpenCV做人臉識別和性別識別contrib

人臉識別的故事說也說不完，調(diào)研的事還是交給大家吧。這里說的是用OpenCV做人臉識別。

因為是真正的人臉識別，不是搞笑娛樂的東西，所以數(shù)據(jù)庫一定要強大的，推薦個網(wǎng)站http://www.face-rec.org/databases/。這里有最全的人臉庫的概述，希望大家能找到自己需要的人臉庫（PS：我現(xiàn)在特別需要一個3d的人臉庫，不知道哪位大俠知道如何free獲取，或者愿意共享給我那更是極好的了，先謝過咯）。這里簡單介紹兩個庫，ORL和Yale，ORL是一個輕量級的庫，Yale更為復(fù)雜，但并不是免費的。

數(shù)據(jù)的準(zhǔn)備：在我們程序里需要讀取圖像和對應(yīng)的標(biāo)簽，這里采用CSV文件，是一種簡單的數(shù)據(jù)交互格式，在我們最常用的Excel里就支持這種格式。這種格式每條信息占一行。信息格式為：文件名；標(biāo)簽，例如C:/ORL/image.jpg;0。只要創(chuàng)建了一個CSV文件和對應(yīng)的圖像，你就可以對任何一個數(shù)據(jù)庫進行訓(xùn)練了。當(dāng)然，這個CSV文件并不一定要自己手動的創(chuàng)建，也可以Python腳本自己生成自己需要的CSV文件，對應(yīng)的腳本為\modules\contrib\doc\facerec\src\create_csv.py，唉，誰讓咱對這個腳本不熟悉，只能偷懶了，直接調(diào)\modules\contrib\doc\facerec\etc\at.txt或者\samples\cpp\facerec_at_t.txt。這個txt對應(yīng)的是ORL的數(shù)據(jù)庫，其中的路徑就按照其改一下就好了。

至于人臉識別的具體實現(xiàn)，我已經(jīng)在blogOpenCV學(xué)習(xí)筆記（五十四）——概述FaceRecognizer人臉識別類contrib提到了如何實現(xiàn)。\modules\contrib\doc\facerec\src很多很好的示例，我這里就不上傳代碼了。

最后再說一下人臉的標(biāo)定。因為對Python也不是太熟悉，只給大家一個腳本文件吧，是\modules\contrib\doc\facerec\src\crop_face.py，通過這個腳本可以制作自己需要的人臉圖片大小。

性別識別和視頻中的識別在對應(yīng)的demo里都有介紹，我這里就不詳細(xì)說了，因為性別識別無非就是把訓(xùn)練樣本的標(biāo)簽只有兩類：男性和女性。需要說明的是，EigenFace是基于PCA的，是一種非監(jiān)督的模型，不太適合性別識別的任務(wù)，這里的demo用的是FisherFace。對于視頻的人臉識別，無非就是添加了個VideoCapture和一個人臉檢測的CascadeClassifier。

關(guān)于訓(xùn)練的模型的保存和調(diào)用，就是用save和load函數(shù)，好簡單的，就不介紹了吧。

最后說一下偽彩色圖的這個函數(shù)applyColorMap，其中colorMap參數(shù)是用來選擇偽彩色圖的樣式。因為人眼對顏色的敏感的程度要比對亮度的敏感程度要高，所以用偽彩色圖的對比效果要更好。這才醫(yī)學(xué)圖像處理中用的比較多，以前的B超現(xiàn)在都用彩超了，價格竟然要貴好多，其實就是一個偽彩色處理罷了，醫(yī)院真黑啊！！

from: http://blog.csdn.net/yang_xian521/article/category/910716

總結(jié)

以上是生活随笔為你收集整理的OpenCV学习笔记（五十一）——imge stitching图像拼接stitching OpenCV学习笔记（五十二）——号外：OpenCV 2.4.1 又出来了。。。。。 OpenCV学习笔记（五的全部內(nèi)容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯，歡迎將生活随笔推薦給好友。

上一篇： OpenCV学习笔记（四十六）——FAS
下一篇： OpenCV学习笔记（五十六）——Inp