第一章计算机视觉引论
一、基礎(chǔ)作業(yè)
機(jī)械臂視覺(jué)控制系統(tǒng):光源(室內(nèi)光線或?qū)S霉庠?#xff09;、相機(jī)(放在機(jī)械臂前端的單相機(jī))、主機(jī)(臺(tái)式計(jì)算機(jī)或嵌入式處理器)、視覺(jué)處理系統(tǒng)(用C++或其他語(yǔ)言編寫(xiě)的視覺(jué)識(shí)別算法及程序)。
2.嘗試從模仿人類(lèi)視覺(jué)處理流程的角度,闡述本對(duì)課程內(nèi)容組織的理解。進(jìn)一步在網(wǎng)上搜索,找到自己認(rèn)為學(xué)習(xí)過(guò)程中最值得參考的1-2本書(shū)(不要太厚)
以Marr視覺(jué)計(jì)算理論為基礎(chǔ),從2維最基本的基元特征的提取開(kāi)始,過(guò)度到2.5維對(duì)三維特征的粗略描述,再到三維視覺(jué)的重建,步步深入。
老師課中推薦的前兩本:谷口慶治的數(shù)字圖像處理 基礎(chǔ)篇、岡薩雷斯的數(shù)字圖像處理,之所以選這兩本是因?yàn)閮?nèi)容比較基礎(chǔ),并且一本厚一本薄可以相互補(bǔ)充的使用。等到基礎(chǔ)掌握以后可以找?guī)妆局鱽?lái)看。
3.什么是光通量和輻照度?說(shuō)明幾個(gè)常見(jiàn)光源的光通量,以及幾個(gè)常見(jiàn)照明環(huán)境的輻照度。
光通量(luminous flux)指人眼所能感覺(jué)到的輻射功率,它等于單位時(shí)間內(nèi)某一波段的輻射能量和該波段的相對(duì)視見(jiàn)率的乘積。白熾燈和鹵鎢燈為12~24lm/W、熒光燈和HID燈(氣體放電燈)為50~120lm/W、LED燈目前在110lm/W左右。
輻射照度又稱(chēng)輻照度,是受照面單位面積上的輻射通量,單位為瓦每平方米(W/㎡)。與太陽(yáng)垂直的平面上的輻照度(太陽(yáng)常數(shù))為1535W/m2,白光 LED 光源照射的輻照度為 600W/m2)
結(jié)合顏色空間示意圖,簡(jiǎn)述HSI顏色空間中各通道的物理意義,并結(jié)合圖像實(shí)例說(shuō)明。
HSI(Hue-saturation-intensity)分別表示
色調(diào):是指圖像的相對(duì)明暗程度。圖中點(diǎn)與圓錐中心連線在圓錐底面角度的投影,決定不同的色彩區(qū)別
飽和度:是指色彩的鮮艷程度,飽和度取決于該色中含色成分和消色成分的比例,圖中點(diǎn)與圓錐中心線的距離,越往外越鮮艷
光強(qiáng):是指通過(guò)該點(diǎn)的平均能流密度,圖中沿著圓錐母線的點(diǎn)的高度,越往上越明亮。
如圖,從做到右為色調(diào)的變化,從上到下為飽和度的減小。
如圖,在HSI中,從上往下亮度越來(lái)越大。
說(shuō)明彩色圖像傳感器及γ校正的基本原理。
圖像傳感器:圖像傳感器是指利用光電器件的光電轉(zhuǎn)換功能。將感光面上的光像轉(zhuǎn)換為與光像成相應(yīng)比例關(guān)系的電信號(hào)。色彩傳感器分為三層,第一層收集圖像的灰度信息,第二層為彩色紅黃藍(lán)單色薄膜,其中綠色為其他顏色的兩倍,第三層為小透鏡組成,確保光線匯集到下部的刻度中心。采集以后有Bayer格式顯示色彩,即通過(guò)插值的方法分別確定每個(gè)格子的三原色數(shù)據(jù)
伽馬校正:目的:在通常的照明(既不是漆黑一片,也不是令人目眩的明亮)的情況下,人類(lèi)的視覺(jué)大體有伽馬或者是冪函數(shù)的性質(zhì)。如果不將圖像進(jìn)行伽馬編碼,那么數(shù)據(jù)位或者帶寬的利用就會(huì)分布不均勻——會(huì)有過(guò)多的數(shù)據(jù)位或者帶寬用來(lái)表示人類(lèi)根本無(wú)法察覺(jué)到的差異,而用于表示人類(lèi)非常敏感的視覺(jué)感知范圍的數(shù)據(jù)位或者帶寬又會(huì)不足。
原理:針對(duì)影片或是影像系統(tǒng)里對(duì)于光線的亮度或是三色刺激值(三色系統(tǒng)中,與待測(cè)光達(dá)到顏色匹配所需的三種原色刺激的量)所進(jìn)行非線性的運(yùn)算或反運(yùn)算.
二、進(jìn)階作業(yè)
在計(jì)算機(jī)上安裝OpenCV 3.0以上版本,為后續(xù)作業(yè)準(zhǔn)備。開(kāi)發(fā)語(yǔ)言可采用C++或Python。
在安裝過(guò)程中遇到了網(wǎng)址文件下載不了的情況,仔細(xì)檢查過(guò)后發(fā)現(xiàn)是因?yàn)闆](méi)有用谷歌內(nèi)核瀏覽器,換瀏覽器后解決
創(chuàng)建第一個(gè)視覺(jué)程序“Hello,world!”,顯示Lena圖片。具體效果參看課程PPT。
3. 對(duì)Lena圖像,分解得到RGB分量及HSV分量,顯示各分量,并對(duì)結(jié)果進(jìn)行比較說(shuō)明。
RGB分量顯示
顯示結(jié)果:
HSV分量顯示
對(duì)比:BGR顯示的三張圖分別為Red、Green、Blue的成分多少,越亮表示成分越多。越暗表示相應(yīng)的成分越少。
HSV顯示的三張圖分別為Value、Hue、Saturation的成分。
由HSV分量范圍(如下圖)可知,在Hue分量中紫色值較高,黑灰白紅分布較廣,與lena原圖中分布吻合。在Value分量中,原圖中亮的部分比較明顯。在saturation分量中,色彩鮮艷的部分比較明顯,原圖中灰白色部分顯得暗淡。
總結(jié)
以上是生活随笔為你收集整理的第一章计算机视觉引论的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: C语言程序——常见的错误集合
- 下一篇: 计算机输出科学计数法,C语言里要对输出的