日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 人工智能 > pytorch >内容正文

pytorch

基于数据驱动的人脸识别课题研究

發布時間:2023/12/10 pytorch 50 豆豆
生活随笔 收集整理的這篇文章主要介紹了 基于数据驱动的人脸识别课题研究 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

目錄

    • 摘要
    • Abstract
    • 1 項目研究背景
      • 1.1 課題研究背景及意義
      • 1.2 人臉識別國內外研究現狀
    • 2 圖像預處理
      • 2.1 圖像縮放
      • 2.2 圖像灰度化
    • 2.3 直方圖均衡化
    • 第三章 人臉識別
      • 3.1 HOG
      • 3.2 SVM
    • 4 人臉識別
      • 4.1 LBP原理
        • 4.1.1 圓形LBP算子
        • 4.1.2 旋轉不變模式
        • 4.1.3 等價模式
      • 4.2 LBP特征用于檢測的原理
      • 4.3 LBP于SVM相結合
        • 4.3.1 分類器
        • 4.3.2 非線性支持向量機
      • 4.4 數據驅動
    • 第五章 結論

摘要

人臉識別技術是指根據人臉的面部特征,對人臉進行識別,通 過人臉識別技術進行身份識別,是一種方便有效的方式,跟其他身 份識別方式相比,具有方便,不宜復制等優點。因此可以廣泛用于 門禁識別,安防監控等領域。基于此需求,本文提出了人臉識別技術在住宅小區安全監測中的應用。人臉識別技術的核心問題是識別計算機的能力。它可以促進人工智能、模式識別和計算機視覺等相關領域的發展。它具有一定的理論意義。人臉識別在信息安全、醫療保健、安全監控、人機交互、金融等領域有著廣泛的應用。
人臉識別包括人臉檢測、預處理、特征提取和人臉檢測四個主要步驟。本文對上述步驟進行了研究。主要內容如下:
1、研究了局部二值模式(LBP)人臉特征的表達和提取方法,比較了直方圖均衡化、高斯平滑和Sobel邊緣提取三種預處理方法對LBP識別率的影響。通過比較發現,不同的預處理方法對LBP算法有不同的影響。其中,LBP算法與索貝爾相結合提高了不同光照條件下人臉圖像的識別率。
2、通過實驗驗證了基于LBP人臉識別方法的塊大小對LBP算子性能的影響。實驗表明,識別率越高,識別率越高,識別率越低。
3、提出了一種結合LBP特征提取和支持向量機(SVM)分類器的算法,并在FRET人臉庫中使用支持向量機分類器和最近鄰分類器對實驗進行比較。實驗表明,支持向量機分類器結合LBP特征提取方法具有較好的分類性能。
最后,對全文的工作進行了總結。
關鍵詞:人臉識別;局部二值模式;預處理;支持向量機。

Abstract

The key issue of face recognition is how to make computer identify the specific person, It can speed up the development of the Artificial Intelligence,Pattern recognition and Computer Vision.and it is very significant in theoretical aspect. At the same time,face recognition is of wide potential applications, such as information security,medical treatment,security monitoring, human-computer interaction, and the finance,and so on.Face recognition mainly consists of four basic steps: face detection,pretreatment,feature extraction and face judgment. The main contents are as follows:
1.Study on the LBP representation and extraction of the facial features,compare the LBP recognition rate with the three kinds of pretreatment methods of histogram equalization, Gaussian smoothing, Sobel edge detection.Experiment found that different pretreatment on the LBP algorithm induces different influence.The recognition rate of LBP algorithm with Sobel under different light conditions increase larger.
2.Experiments validate the face recognition method based on LBP,
observing the block-size effects on the performance of the LBP operator.Experiments show that the more block, the more higher the recognition rate,but blocks too much lead to a fall in the recognition rate.
3.The thesis combin LBP algorithm with classification,through experiment compare the classification result of support vector machine classifier and nearest neighbor classifier.The results show the combination of LBP feature extraction method and support vector machine classifier has a better classification performance.
The last,The thesis make a summary for all of work.
Key Words: face recognition;LBP;pretreatment;SVM

1 項目研究背景

1.1 課題研究背景及意義

人臉識別技術在商業、軍事、政府和其他領域中都有著廣闊的應用前景。例如信息安全、檔案管理、出入口控制、醫療、刑事偵破、保安監視、人機交互系統、視頻會議等場合。在經濟和電子商務領域,對各種銀行卡、儲蓄卡的持卡人身份進行驗證。在家庭娛樂方面,有智能玩具、家政機器人、真實感虛擬游戲等。主要典型應用有:
①身份鑒定:將采集到的臉部數據進行處理后與人臉數據庫中的數據進行實時的對比,按相似度進行排序,給出鑒定的結果或相對應的可信度。可用于計算機、網絡安全、金融業務、邊境控制、訪問控制等領域。例如,2008 年北京奧運會入場檢測首次采用了人臉識別技術對入場者進行身份識別;2009 年國慶閱兵武器管理以及天安門廣場日常安全監控系統都采用了人臉識別技術。
②身份確認:將實時采集到的人臉數據和存儲在智能卡或其他存儲設備中的人臉數據進行對比,相似度達到一定程度,則對比成功即可以確定用戶身份。身份確認可應用于選民登記、身份證、護照、駕駛執照、工作證、機場安檢口身份證檢查及結合犯罪嫌疑人識別系統的安檢口控制系統等。利用人臉特征識別用戶,保護計算機信息,及人臉屏幕保護和文件加密。
③視頻監控:人臉識別技術可以用攝像機對人進行連續跟蹤和定位,將人臉從背景中分離出來,與監控列表進行比對,具有連續實時性、不被干擾等點。在對圖像進行分析時,用到人臉檢測、跟蹤及識別等技術。該技術可應用于閉路電視監控、交通管理、臉部照片登記系統、事件后分析系統,以及基于Internet 的網上追逃系統等。

1.2 人臉識別國內外研究現狀

人臉識別國內外研究現狀如下:
目前,國內從事人臉識別技術研究的主要專業機構和相關人員包括:
中國科學院計算所,高文教授和陳熙霖教授帶領的研究小組在人臉檢測、大型人臉數據 庫的建立、人臉識別算法的實用化等方面取得了豐碩成果;
中國科學院自動化所,譚鐵牛研究員領導的研究小組提出將人臉特征與其它生物特征相 融合的方法,大幅度改善了單一生物特征識別的效果;
生物特征識別與安全技術研究中心,李子青教授帶領的研究小組在近紅外人臉識別和中 遠距離人臉識別的研究中獲得了顯著成果,有效降低了光照對人臉識別性能的影響。
國外人臉識別技術的研究主要以美國、歐洲、日本等國家為主。例如:
美國哈佛大學(Harvard University)的 Stone Z 等人提出了一種基于社交語境下的大規模 人臉識別方法;英國格拉斯哥大學(University of Glasgow)的 Mike 教授和斯特林大學(University of Stirling)的 Bruce 教授領導的研究組,主要從事大腦在人臉識別中的作用和人 臉感知方面的研究。
人臉識別技術的發展最早始于上世紀60年代末。它主要經歷了三個階段:第一階段是1964-1990年,是人臉識別的初級階段,其主要方法是基于人臉的幾何結構特征。以Bertillon、艾倫和帕克為代表,研究了人臉識別所需的人臉特征,計算出各特征點之間的幾何距離,并利用最近鄰法和其他分類方法對人臉進行識別。識別過程由人工操作完成。這是一個非自動識別過程。在這一階段,結果很少,實際應用也不多。第二階段為1991~1997年。人臉識別研究正在迅速發展。這是人臉識別研究的高潮。已經產生了一些代表性的人臉識別算法,并且許多商業操作的人臉識別系統已經誕生,并且美國軍方還組織了一個著名的FRET人臉識別算法測試。其中,重要的結果是Turk和Pentland提出的“特征臉”方法,并成為人臉識別性能識別的基準算法。一般來說,線性子空間判別分析、統計外觀模型和統計模式識別方法是現階段的主流技術。在理想條件下,該算法能取得令人滿意的結果。第三階段是從1998到現在。它屬于機器識別階段,用戶不合作、不合意的采集條件、光照和姿態等問題逐漸成為研究熱點。這一時期的重要成果是基于Georghiades等人提出的光錐模型的人臉識別等。基于Blanz和維特爾提出的基于三維變形模型的人臉識別技術,在姿態變化、光照變化、年齡和表情變化的條件下,提高了人臉識別的性能。以支持向量機為代表的統計學習理論也被應用于人臉識別。

2 圖像預處理

從廣義上講,人臉識別過程包括人臉檢測、圖像預處理、人臉特征提取和人臉識別四個部分。
人臉檢測是指任何圖像或視頻輸入判斷是否有人臉。如果有人臉,則區分人臉區域和背景,并給出人臉的位置、大小和其他相關信息。它還可以在一系列圖像序列或動態視頻和人臉跟蹤中實時檢測人臉。人臉檢測主要受光照、噪聲、姿態和遮擋等因素的影響。人臉檢測作為人臉識別系統的第一步,直接關系到人臉識別的準確性和可行性,影響整個系統的性能。人臉檢測與跟蹤是人臉識別研究中的一項關鍵技術,具有很高的學術價值。模型的特點是復雜的,很難找到一個常用的算法來檢測,所以在應用中經常會集成很多模式來檢測。本章將詳細分析圖像預處理。

2.1 圖像縮放

圖像因大小不同,不可以直接使用,需要對圖像進行預處理使得圖像大小一致。
假如圖像的象素矩陣如下圖所示(這個原始圖把它叫做源圖,Source):
234 38 22
67 44 12
89 65 63

這個矩陣中,元素坐標(x,y)是這樣確定的,x從左到右,從0開始,y從上到下,也是從零開始,這是圖象處理中最常用的坐標系,就是這樣一個坐標:

---------------------->X
|
|
|
|
|
∨Y

如果想把這副圖放大為 4X4大小的圖像,那么該怎么做呢?那么第一步肯定想到的是先把4X4的矩陣先畫出來再說,好了矩陣畫出來了,如下所示,當然,矩陣的每個像素都是未知數,等待著我們去填充(這個將要被填充的圖的叫做目標圖,Destination):
? ? ? ?
? ? ? ?
? ? ? ?
? ? ? ?
常用的插值方法有:最近鄰插值、雙線性插值、三次卷積法。
在進行數字圖像處理時,經常會遇到十進制像素坐標值的問題,因此需要根據相鄰像素的值插值坐標。例如:地圖投影轉換,將目標圖像中的一個像素坐標變換到對應點上的源圖像,變換的坐標是一個十進制,例如,幾何校正的圖像,也會遇到同樣的問題。下面是三種常用的數字圖像插值方法。
1、最鄰近元法
這是最簡單的插值方法。它不需要計算。在像素的四個相鄰像素中,像素的最近像素灰度被給予最近像素中的像素。設i+u, j+v(i, j為正整數, u, v為大于零小于1的小數,下同)為待求象素坐標,則待求象素灰度的值 f(i+u, j+v) 如圖1.1所示:

圖1.1 像素坐標最鄰近元法

如果(i+u, j+v)落在A區,即u<0.5, v<0.5,則將左上角象素的灰度值賦給待求象素,同理,落在B區則賦予右上角的象素灰度值,落在C區則賦予左下角象素的灰度值,落在D區則賦予右下角象素的灰度值。
最鄰近元法計算量較小,但可能會造成插值生成的圖像灰度上的不連續,在灰度變化的地方可能出現明顯的鋸齒狀。
2、雙線性內插法
雙線性內插法是利用待求象素四個鄰象素的灰度在兩個方向上作線性內插,如圖1.2所示:

圖1.2 雙線性內插

對于 (i, j+v),f(i, j) 到 f(i, j+1) 的灰度變化為線性關系,則有:
f(i, j+v) = [f(i, j+1) - f(i, j)] * v + f(i, j)
同理對于 (i+1, j+v) 則有:
f(i+1, j+v) = [f(i+1, j+1) - f(i+1, j)] * v + f(i+1, j)
從f(i, j+v) 到 f(i+1, j+v) 的灰度變化也為線性關系,由此可推導出待求象素灰度的計算式如下:
f(i+u, j+v) = (1-u) * (1-v) * f(i, j) + (1-u) * v * f(i, j+1) + u * (1-v) * f(i+1, j) + u * v * f(i+1, j+1)
雙線性內插法的計算比最鄰近點法復雜,計算量較大,但沒有灰度不連續的缺點,結果基本令人滿意。它具有低通濾波性質,使高頻分量受損,圖像輪廓可能會有一點模糊
w

圖1.3 最鄰近插值放大圖片

圖1.4 雙線型內插值放大圖片

2.2 圖像灰度化

識別物體,最關鍵的因素是梯度(現在很多的特征提取,SIFT,HOG等等本質都是梯度的統計信息),梯度意味著邊緣,這是最本質的部分,而計算梯度,自然就用到灰度圖像了。顏色本身,非常容易受到光照等因素的影響,同類的物體顏色有很多變化。所以顏色本身難以提供關鍵信息。
將彩色圖像轉化成為灰度圖像的過程成為圖像的灰度化處理。彩色圖像中的每個像素的顏色有R、G、B三個分量決定,而每個分量有255中值可取,這樣一個像素點可以有1600多萬(255255255)的顏色的變化范圍。而灰度圖像是R、G、B三個分量相同的一種特殊的彩色圖像,其一個像素點的變化范圍為255種,所以在數字圖像處理種一般先將各種格式的圖像轉變成灰度圖像以使后續的圖像的計算量變得少一些。灰度圖像的描述與彩色圖像一樣仍然反映了整幅圖像的整體和局部的色度和亮度等級的分布和特征。圖像的灰度化處理可用兩種方法來實現。
第一種方法使求出每個像素點的R、G、B三個分量的平均值,然后將這個平均值賦予給這個像素的三個分量。
第二種方法是根據YUV的顏色空間中,Y的分量的物理意義是點的亮度,由該值反映亮度等級,根據RGB和YUV顏色空間的變化關系可建立亮度Y與R、G、B三個顏色分量的對應:Y=0.3R+0.59G+0.11B,以這個亮度值表達圖像的灰度值。

2.3 直方圖均衡化

如果圖像中的像素占據大量灰度并均勻分布,那么這些圖像往往具有高對比度和可變灰度。直方圖均衡化是一種僅由輸入直方圖信息自動實現這種效果的變換函數。其基本思想是擴大圖像中的像素數,壓縮圖像中的幾個像素的灰度級,從而擴大像素值的動態范圍,提高對比度和灰度色調的變化,使圖像更加清晰。
圖像對比度增強方法可分為兩大類:一種是直接對比增強,另一種是間接對比增強。直方圖拉伸和直方圖均衡是兩種最常用的間接對比度增強方法。通過對比度拉伸來拉伸直方圖,以擴大前景和背景灰度之間的差異,從而達到增強對比度的目的。這種方法可以通過線性或非線性的方法來實現。利用累加函數對灰度值進行“調整”,實現直方圖均衡化。對比增強。
直方圖均衡化是在圖像處理領域中利用圖像直方圖進行圖像對比度的一種方法。這種方法通常用于增加許多圖像的局部對比度,特別是當有用數據的對比度非常接近時。通過這種方法,亮度可以更好地分布在直方圖上。這可以用來增強局部對比度而不影響整體對比度,并且直方圖均衡可以通過有效地擴展通常亮度來實現。
直方圖均衡化的“中心思想”是將原始圖像的灰度直方圖變換成灰度范圍內從相對集中的灰度范圍內的均勻分布。直方圖均衡化是對圖像進行非線性拉伸并重新分配圖像的像素值,使得某一灰度級的像素數大致相同。直方圖均衡化是給定圖像的直方圖。分布改變成“均勻”分布直方圖分布。
直方圖均衡化的基本思想是把原始圖的直方圖變換為均勻分布的形式,這樣就增加了像
灰度值的動態范圍可以增強圖像的整體對比度。將原始圖像的灰度(x,y)設置為f,當改變圖像為G時,圖像增強方法可以被描述為將灰度f映射到(x,y)到g。灰度直方圖均衡過程中的映射函數到圖像可以定義為g=eq(f),映射。G函數Eq(f)必須滿足兩個條件(L是圖像的灰度序列):
(1)EQ(f)在0≤f≤L-1范圍內是一個單值單增函數。這是為了保證增強處理沒有打亂原始圖像的灰度排列次序,原圖各灰度級在變換后仍保持從黑到白(或從白到黑)的排列。
(2)對于0≤f≤L-1有0≤g≤L-1,這個條件保證了變換前后灰度值動態范圍的一致性。
累積分布函數(cumulative distribution function,CDF)即可以滿足上述兩個條件,并且通過該函數可以完成將原圖像f的分布轉換成g的均勻分布。此時的直方圖均衡化映射函數為:
= EQ( ) = (ni/n) = pf( ) ,
(k=0,1,2,……,L-1)
根據該方程,上述求和區間為K.的0,可以直接從源圖像中每個像素的灰度值獲得每個像素的灰度值。在實際的處理變換中,對原始圖像的灰度情況進行統計分析,計算原始直方圖分布,然后根據計算得到的累積直方圖分布得到灰度映射關系。在重復上述步驟之后,將源圖像的所有灰度映射到目標圖像的灰度級,可以根據映射關系通過源圖像像素像素的灰度變換完成源圖像的直方圖均衡化。
直接白地理解直方圖均衡化:上述公式不能簡單地從數學的角度解釋直方圖均衡化的計算方法,也不能解釋數學公式背后的含義。簡而言之,直方圖均衡化是尋找對應函數s= f(r),r作為輸入信號圖像,s作為輸出信號的圖像。我們的目標是找到F的表達式,想象一個直方圖位于小灰度值區域的未處理圖像。俗話說,柱狀圖很窄。我們想把它變成一個非常寬的直方圖,所以這需要一個拉伸函數。顯然,該函數必須保證圖像中像素的大小不能順序改變,否則將改變原始圖像中表達的內容。我們認為此時的累積分布函數。為了便于理解,相反,我們討論如何找到累積分布函數。首先,一般來說,灰度圖像的像素值在0~255之間。然后,如果要在0~255之間盡可能地分布像素,則在灰度分布時,原始圖像的灰度值的密度是不同的。例如,圖像R的原始像素分布在原始像素的像素值的100-150和140~150之間。此時,如果將原始圖像映射到0~255的線性函數(45度直線的起點)是不可行的,則線性函數不能表示原始像素值的密度分布。情況。然而,累積分布函數與原始像素在一定間隔內的分布密切相關。如果原始像素被累加,則發現140~150像素占據累積函數的大部分變化。累積函數僅是表示區間內原始像素的分布規律。它以灰度值表示100-150區間內原始圖像中像素的分布。此時,我們使用這個分布乘以255,并且我們將分布擴展到0~255區間。如果將該產品作為像素值來形成新的圖像S,則發現原始的窄直方圖將被拉伸到0~255,并且在原始圖像中像素值分布的分布被良好地保存。上述過程是從輸入圖像R到輸出圖像S的過程,這是我們正在尋找的映射函數F。
該方法對背景和前景過于明亮或太暗的圖像有很大的幫助,特別是在X射線圖像中顯示出更好的骨結構顯示,并且在曝光過度或曝光不足的情況下能更好地顯示細節。這種方法的主要優點之一是它是一種相當直觀的技術和可逆操作,并且如果已知平衡函數,則可以恢復原始直方圖,并且計算量小。
這種方法的一個缺點是它不選擇處理過的數據。它可以增大背景噪聲的對比度,減少有用信號的對比度,減少變換后的灰度值,消除一些細節;直方圖等圖像具有峰值,處理后的對比度自然地過度增強。

第三章 人臉識別

3.1 HOG

梯度直方圖(HOG)是計算機視覺和圖像處理中用于目標檢測的特征描述符。通過計算統計圖像局部區域的梯度方向直方圖,特征描述符HOG特征。
在一對圖像中,可以通過梯度或邊緣的方向密度的分布來很好地描述局部目標的圖像和形狀。本質是梯度的統計信息,梯度主要存在于邊緣。
HOG特征和SVM分類器在圖像識別中有著廣泛的應用,特別是在行人檢測中。
1、顏色和伽馬歸一化
為了減少光照因素的影響,首先需要對整個圖像進行歸一化處理。在圖像的紋理強度中,局部表面曝光的貢獻較大,因此這種壓縮處理可以有效地減少圖像的陰影和光照變化。
2。圖像梯度的計算
計算圖像的水平坐標和垂直坐標的梯度,并相應地計算每個像素位置的梯度方向值。引導操作不僅可以捕捉輪廓、人體陰影和一些紋理信息,而且可以進一步削弱照明的影響。
最常用的方法是簡單地將一維離散差分模板在一個方向上或同時在水平和垂直兩個方向上進行圖像處理,更具體地說,該方法需要使用濾波器核來濾除圖像或C的顏色。收集暴力數據。
三。施工方向直方圖
單元單元中的每個像素對基于方向的直方圖信道進行投票。投票是一個加權投票,也就是說,每個票都有一個權重值。權重是根據像素點的梯度來計算的。權重值本身或其功能可以用來表示權重。結果表明,利用振幅表示權重值可以獲得最佳效果。當然,它也可以選擇振幅的函數,如振幅的平方根、振幅的平方、振幅的截斷等。單元單元可以是長方形的或星形的。直方圖通道均勻分布在01800(NO或0(3600))。在研究的范圍內,發現有一個方向)。使用無向梯度和9個直方圖通道,可以在行人檢測實驗中獲得最佳結果。
4。將細胞單元結合成大間隔
由于背景光的變化和前景背景的對比,梯度強度變化很大。這需要梯度強度的歸一化。歸一化可以進一步壓縮光、陰影和邊緣。
該方法是將每個單元單元組合成一個大的、空間上連接的間隔。以這種方式,HOG描述符成為由每個間隔中的所有單元單元的直方圖組成的向量。這些間隔彼此重疊,這意味著每個單元單元的輸出多次作用于端部。描述符。
間隔有兩個主要的幾何形狀-矩形間隔(R -豬和環間隔(C)-豬-豬間隔通常是一個正方形格子)。它可以具有三個參數來表征每個間隔中的單元單元的數目、每個單元單元中的像素數目、以及每個單元的直方圖通道的數目。眼睛。
5。收集豬的特點
提取的HOG特征被輸入到SVM分類器,以找到最優超平面作為決策函數。

當數據量大或數據維數大但樣本量小時,在計算過程中可能存在大量的資源消耗或過度學習(過擬合)[39 ] -[ 40 ]。過濾特征篩選方法與樣本維數不直接相關,當特征維數較高時,可以有效地過濾特征。過濾方法是基于現有的數據集,并從數據角度選擇特征。在這個過程中,特征選擇與訓練模型沒有直接關系。過濾器主要從距離、信息、依賴性和一致性四個角度對[41 ]進行評價。
從信息的角度進行測量是當前研究的一個重要方向。從信息熵的角度出發,提出了提取特征的算法。信息熵理論提出了數據分布,并利用不確定性來評估42個特征間的關系(用最大線性關系)。

信息的測量是多種多樣的,例如SNR(方查碧),這是一種廣泛使用的測量方法。
信號噪聲大,響應數據中的有用信息大,信噪比低。在實際應用中,變量數可能變化較小,不能提供有用的信息,但其存在可能影響算法的運算時間或精度,因此有必要濾除數據中的小變化特性。當數據發生很大變化時,它被認為是有用的信息,而基本不變。它被認為是噪聲信號。基于方差閾值的特征選擇方法是一種相對簡單的特征,它消除了數據方差的方差,并且類似于低通濾波器。然而,由于數據單元的不同,為了避免引入閾值設置,應該進行數據標準化。

圖2-2方差閾值與特征個數關系圖
Fig.2-2 The relation graph of variance threshold and characteristic number
方差閾值與特征個數關系圖顯示,隨著閾值的提高,特征個數逐漸降低。因為對數據做歸一化處理,使得數據落在(0,1),在數據波動不到1%既認為數據的波動主要來自噪聲數據,數據特征是不相關特征。通過方差閾值特征篩選法,將特征數從728維降到479維。

3.2 SVM

支持向量機(SVM)是指支持向量機,這是一種常見的判別方法。在機器學習領域,它是一種有監督的學習模式,它通常是用于模式識別,分類和回歸分析。
支持向量機方法是地圖樣本空間到特征空間(希爾伯特空間)的非線性映射,使得非線性可分的問題在原始樣本空間轉化為特征空間中的線性可分問題。將樣本映射到高維空間。在一般情況下,這會增加計算的復雜度,甚至導致“維數災難”,所以很少有人問。但作為分類和回歸,它是可能的樣本集不能在低維樣本空間的線性處理,但它可以在高維特征空間,通過。線性超平面是一個線性劃分(或回歸)。一般的升維會帶來復雜的計算。支持向量機方法巧妙地解決了這個問題:利用核函數的展開定理,沒有必要知道的非線性映射的顯式表達式;因為線性學習機在高獸醫空間建立,所以線性學習機是建立。與線性模型相比,它不僅不僅增加了計算的復雜度,又避免了“維數災難”在一定程度上。這一切都是由于核函數的擴展和計算理論。這是訓練分類器建立分類模型的第一步,和訓練次數需要在訓練階段分析。根據機組的特點,相應的數據集的一個準確的描述或模型為每個類生成。我們可以使用LIBSVM軟件包來訓練分類器模型。首先,我們需要寫的人臉圖像的特征向量為樣本文件根據libsvm格式。數據格式是
[label][indexl]:[value1][index2]:[value2]…
其中[label]標識樣本類別,通常為整數。[index]為有序的索引,以1開始的整數,可以是不連續的整數,代表特征向量序列。
選擇不同的核函數,可以生成不同的SVM,常用的核函數有以下4種:
⑴線性核函數K(x,y)=x·y;
⑵多項式核函數K(x,y)=[(x·y)+1]^d;
⑶徑向基函數K(x,y)=exp(-|x-y|2/d2)
⑷二層神經網絡核函數K(x,y)=tanh(a(x·y)+b)

4 人臉識別

歷史數據包括電梯運行數據、故障原因、維修記錄等。由于收集器故障和通信環境的運行環境,原始數據中不存在臟數據。“臟數據”指的是不完整的數據和噪聲,影響數據集訓練模型的正確性,這使得決策系統產生錯誤的結果并影響信息服務的質量。良好的數據挖掘結果的前提是數據必須是正確的、一致的、完整的和可靠的。數據預處理在很大程度上決定了用于分析的數據質量,影響了決策的科學性。
在預處理中,實際特征數據與業務背景應有效結合。該方案以電梯數據和電梯營業環境為背景。通過對數據進行預處理,使原始數據更適合于電梯設備的健康評估。
3-1 數據預處理系統
Fig.3-1 Data preprocessing system

4.1 LBP原理

人臉識別是指將一個需要識別的人臉和人臉庫中的某個人臉對應起來(類似于指紋識別),目的是完成識別功能,該術語需要和人臉檢測進行區分,人臉檢測是在一張圖片中把人臉定位出來,完成的是搜尋的功能。從OpenCV2.4開始,加入了新的類FaceRecognizer,該類用于人臉識別,使用它可以方便地進行相關識別實驗。
原始的LBP算子對于每幅圖上每個像素點用其周圍3× 3鄰域像素值對此像素點進行紋理描述。LBP 算子公式為

原始的LBP算子定義為在33的窗口內,以窗口中心像素為閾值,將相鄰的8個像素的灰度值與其進行比較,若周圍像素值大于或等于中心像素值,則該像素點的位置被標記為1,否則為0。這樣,33鄰域內的8個點經比較可產生8位二進制數(通常轉換為十進制數即LBP碼,共256種),即得到該窗口中心像素點的LBP值,并用這個值來反映該區域的紋理特征。如下圖所示:

原始的LBP提出后,研究人員不斷對其提出了各種改進和優化。

4.1.1 圓形LBP算子

基本的 LBP算子的最大缺陷在于它只覆蓋了一個固定半徑范圍內的小區域,這顯然不能滿足不同尺寸和頻率紋理的需要。為了適應不同尺度的紋理特征,Ojala等對LBP算子進行了改進,將3×3鄰域擴展到任意鄰域,并用圓形鄰域代替了正方形鄰域,改進后的LBP算子允許在半徑為R的圓形鄰域內有任意多個像素點,從而得到了諸如半徑為R的圓形區域內含有P個采樣點的LBP算子,OpenCV中正是使用圓形LBP算子,下圖示意了圓形LBP算子:

4.1.2 旋轉不變模式

從LBP的定義可以看出,LBP算子是灰度不變的,但卻不是旋轉不變的,圖像的旋轉就會得到不同的LBP值。Maenpaa等人又將LBP算子進行了擴展,提出了具有旋轉不變性的LBP算子,即不斷旋轉圓形鄰域得到一系列初始定義的LBP值,取其最小值作為該鄰域的LBP值。下圖給出了求取旋轉不變LBP的過程示意圖,圖中算子下方的數字表示該算子對應的LBP值,圖中所示的8種LBP模式,經過旋轉不變的處理,最終得到的具有旋轉不變性的LBP值為15。也就是說,圖中的8種LBP模式對應的旋轉不變的LBP碼值都是00001111。

4.1.3 等價模式

一個LBP算子可以產生不同的二進制模式,對于半徑為R的圓形區域內含有P個采樣點的LBP算子將會產生P2種模式。很顯然,隨著鄰域集內采樣點數的增加,二進制模式的種類是急劇增加的。例如:5×5鄰域內20個采樣點,有220=1,048,576種二進制模式。如此多的二值模式無論對于紋理的提取還是對于紋理的識別、分類及信息的存取都是不利的。為了解決二進制模式過多的問題,提高統計性,Ojala提出了采用一種“等價模式”(Uniform Pattern)來對LBP算子的模式種類進行降維。Ojala等認為,在實際圖像中,絕大多數LBP模式最多只包含兩次從1到0或從0到1的跳變。因此,Ojala將“等價模式”定義為:當某個局部二進制模式所對應的循環二進制數從0到1或從1到0最多有兩次跳變時,該局部二進制模式所對應的二進制就成為一個等價模式類。如00000000(0次跳變),00000111(含一次從0到1的跳變和一次1到0的跳變),10001111(先由1跳到0,再由0跳到1,共兩次跳變)都是等價模式類。除等價模式類以外的模式都歸為另一類,稱為混合模式類,例如10010111(共四次跳變)。

通過這樣的改進,二進制模式的種類大大減少,模式數量由原來的2P種減少為P(P-1)+2+1種,其中P表示鄰域集內的采樣點數,等價模式類包含P(P-1)+2種模式,混合模式類只有1種模式。對于3×3鄰域內8個采樣點來說,二進制模式由原始的256種減少為59種,這使得特征向量的維數更少,并且可以減少高頻噪聲帶來的影響。

4.2 LBP特征用于檢測的原理

顯而易見的是,上述提取的LBP算子在每個像素點都可以得到一個LBP“編碼”,那么,對一幅圖像(記錄的是每個像素點的灰度值)提取其原始的LBP算子之后,得到的原始LBP特征依然是“一幅圖片”(記錄的是每個像素點的LBP值),如圖所示:

如果將以上得到的LBP圖直接用于人臉識別,其實和不提取LBP特征沒什么區別,在實際的LBP應用中一般采用LBP特征譜的統計直方圖作為特征向量進行分類識別,并且可以將一幅圖片劃分為若干的子區域,對每個子區域內的每個像素點都提取LBP特征,然后,在每個子區域內建立LBP特征的統計直方圖。如此一來,每個子區域,就可以用一個統計直方圖來進行描述,整個圖片就由若干個統計直方圖組成,這樣做的好處是在一定范圍內減小圖像沒完全對準而產生的誤差,分區的另外一個意義在于我們可以根據不同的子區域給予不同的權重,比如說我們認為中心部分分區的權重大于邊緣部分分區的權重,意思就是說中心部分在進行圖片匹配識別時的意義更為重大。 例如:一幅100100像素大小的圖片,劃分為1010=100個子區域(可以通過多種方式來劃分區域),每個子區域的大小為1010像素;在每個子區域內的每個像素點,提取其LBP特征,然后,建立統計直方圖;這樣,這幅圖片就有1010個子區域,也就有了1010個統計直方圖,利用這1010個統計直方圖,就可以描述這幅圖片了。之后,我們利用各種相似性度量函數,就可以判斷兩幅圖像之間的相似性了。

4.3 LBP于SVM相結合

人臉識別的最后一個步驟,就是分類人臉的特征信息,對人臉進行判別。LBP 方法是一個很有效的特征提取方法,很適合人臉表征。但在分類性能上存在一定不足,與后續的學習算法無關,我們嘗試將其與分類器結合來提高圖像識別率。因此本章要研究的問題就是LBP特征提取與SVM分類器的結合,通過實驗來研究LBP特征提取與SVM分類器的關系,并比較SVM和最近鄰分類器的性能。

4.3.1 分類器

分類器的設計是模式識別領域的重要內容,對人臉識別來說,分類器的設計是否合適是一個值得研究的重要問題,其分類能力好壞直接決定了系統的性能。在人臉識別過程中,在人臉特征提取之后,可以利用分類器對提取的特征向量進行分類處理。
支持向量機是2世紀90年代提出的基于統計學習理論的學習算法,是近年來非常流行的分類器。其基本原理是以結構風險最小化為原則,通過某種非線性映射把原始數據映射到高維特征空間,在高維空間中構造具有低VC維的最優分類超平面,使其具有最優的推廣能力。在人臉識別的分類系統中,一開始就收集到完備的訓練樣本是很困難的,我們要求分類器能夠在使用過程中,從實際測試樣本中選擇出重要的樣本進行主動、增量和長期的學習,不斷提高分類器的性能,支持向量機憑借統計學習理論堅實的基礎,成為解決小樣本、非線性及高維模式識別的有力工具。Guodong 在ORL人臉庫上進行實驗比較了支持向量機、特征臉和最近鄰分類器的分類效果,實驗結果表明支持向量機的分類性能要優于特征臉和最近鄰分類器。因此我們選擇支持向量機作為實驗的分類器,觀察LBP 特征提取方法和SVM 結合的效果。

4.3.2 非線性支持向量機

線性支持向量機對于許多具有非線性結構的現實問題來說是不適合的。對于非線性問題,如何把線性支持向量機推廣到解決非線性模式分類問題?利用一個簡單的方法可以解決這個問題,如圖4.2所示,利用非線性函數? (x)把數據從低維輸入空間Rn映射到一個高維的特征空間H。使得數據在高維空間中具有更好的可分性。在高維特征空間H中求解線性支持向量機的最優分類面,再投影回低維輸入空間就是一個非線性的曲面。

4.4 數據驅動

在計算機系統中, 經驗通常是以數據的形式存在. 我們將提供給計算機每個類別的許多實例(examples), 它們組成了訓練集(training set), 利用學習算法(learning algorithms)從訓練集中產生分類器(classifier)}或模型(model). 在面對新情況時(例如看到一張以前未出現的圖像), 模型會提供相應的判斷. 這個過程, 即本文需要討論的數據驅動過程.
為了通過攝像頭或者其他的攝取人臉設備采集到圖像信息,相應的開發板需要安裝相應的攝像頭驅動程序,以及對攝像頭訪問的應用程序,需要編寫對攝像頭的訪問程序。通過攝像頭所獲得的圖像信息的數據格式為YUV編碼格式,而opencv所支持的圖像信息顏色通道順序為BGR格式,在qt中對圖像操作的類是Qimages,該類支持的Qimage支持的顏色通道順序是RGB,在opencv 中實現顏色通道順序的轉換可使用函數cvCvtColor(const CvArrsrc, CvArr dst,int code)來實現。

第五章 結論

人臉識別在公安部門、安全驗證系統、信用卡驗證、檔案管理、人機交互系統等領域有著廣闊的應用前景,已經成為當前模式識別和人工智能領域的一個研究熱點。對于機器來說,要快速準確的通過人臉識別出人的身份是很困難的事情,識別率容易受到姿態、光照和表情的影響。經過幾十年的發展,各種人臉識別技術相對成熟,各種識別技術各有優缺,本文對紋理描述算子LBP 進行了研究,主要工作有:
1.歸納總結了常用的人臉識別方法,分析人臉識別的主要步驟,介紹了國際上常用的人臉數據庫。
2.針對LBP 基本算子和LBP 的演化算子進行深入研究,總結出LBP 的優點。通過實驗對傳統的LBP 人臉識別方法進行驗證,為了提升識別率,對圖像進行三種預處理。結果表明經過高斯平滑和Sobel 邊緣提取的LBP 算子對于不同光照條件下人臉圖像識別率提高幅度較大。分塊大小對LBP 算子性能也產生一定的影響,分塊越多,識別率相對提高,特征向量維數也越高,花費的時間和存儲空間也隨之增大。
3.比較了各分類器的優缺,針對SVM 分類器原理進行研究,認為SVM 比較適合解決人臉識別這類小樣本、非線性、高維并稀疏的模式識別問題,通過實驗證明將SVM 與LBP 結合可以提高LBP 的識別率,SVM 與最近鄰分類器相比有更好的分類性能。

總結

以上是生活随笔為你收集整理的基于数据驱动的人脸识别课题研究的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。