matlab截视频人脸,一种视频图像中人脸图像截取方法与流程
本發明涉及人工智能領域,具體涉及一種提高人臉比對性能的視頻圖像中人臉圖片截取方法。
背景技術:
人臉圖像比對需要對人臉圖像提取特征數據,用于人臉對比的人臉特征提取,主要是對經人臉檢測過程截取到的視頻圖像中的人臉圖片進行特征數據提取。
人臉檢測是指對于任意一幅給定的輸入圖像,采用一定的計算方法對其進行搜索以確定其中是否含有人臉以及人臉在輸入圖像中的位置,方法主要是對輸入的圖像,用訓練好的模型進行多層級聯的卷積神經網絡運算。
這種人臉檢測的卷積神經網絡運算量很大,并且運算量隨圖像像素增長以平方關系增長,因此為了在輸入實時視頻圖像的應用中,能夠快速完成在檢測人臉過程,通常需要對更高像素的圖像采用抽點的方法減少圖像像素,比如典型的從4k(4096×2160分辨率)圖像或1080p(1920*1080分辨率)圖像,將圖像像素減少到720*576像素或同一數量級分辨率像素,作為卷積神經網絡的輸入圖像,進行人臉檢測運算。
目前人臉檢測算法一般能夠最小檢測到10*10像素的人臉圖片,但是從輸入圖像(比如720*576像素)裁剪出這樣少的像素的人臉,卻不足以支持進行比較精確的人臉特征數據提取,人臉特征數據提取通常需要提供40*40或30*30像素人臉圖像,以獲得準確率較高的人臉比對結果,像素過少的人臉數據檢出后也會被丟棄,造成信息獲取的缺失或運算量的浪費。
技術實現要素:
本發明的目的是為解決上述不足,提供一種能夠提高人臉比對性能的人臉圖片截取方法。
本發明的目的是通過以下技術方案實現的:
一種視頻圖像中人臉圖片截取方法,通過緩存若干幀連續的原始圖像(全部像素)并對這些原始圖像進行編號,同時對緩沖的最早的原始圖像進行按照一定的方法進行抽點運算,生成送給卷積神經網絡的輸入圖像(抽點后減少像素的圖像),同時確立了原始圖像像素與輸入神經網絡圖像像素的映射關系f,把輸入圖像和對應的原始圖像編號傳送給卷積神經網絡進行人臉檢測運算,遍歷檢測輸入圖像中的所有人臉,對無法識別檢測的人臉采用舍棄策略;對像素數量滿足后續特征識別人臉(達到像素數閾值),直接輸出人臉圖片給后續處理;對像素過少的人臉(閾值設到最大值時,是全部檢測出的人臉),記錄其在抽點后輸入圖像中的位置,根據原始圖像編號和檢測到人臉在輸入圖像中的位置,根據與f對應的反向映射關系f-1,計算輸入圖像中的人臉圖像在原始圖像中的位置,在對應原始圖像中找到對應的人臉圖像位置并裁剪出人臉圖像,輸出給后續人臉圖片歸一化處理和人臉特征提取運算,并刪除緩存中這一幀原始圖像,順序裝入新的原始圖像幀,完成一幅原始圖像的全部可識別人臉圖像截取。
本發明具有如下有益的效果:
本發明通過緩存原始圖像幀,增加原始圖像幀編號,并以抽點輸入圖像中像素位置反推其在原始圖像中位置的方法,從而能夠在人臉檢測后計算出人臉圖像在原始圖像中的位置,并根據人臉像素是否達到閾值判斷,選擇在壓縮圖像或在原始圖像中截取出相應人臉圖片,從而保證了截取到的人臉圖片保持較高的像素數量,提高后期人臉比對的成功率與準確性。
附圖說明
附圖1為本發明的人臉圖像截取方法流程圖。
具體實施方式
下面結合附圖對本發明作進一步的說明:
如附圖所示,一種視頻圖像中人臉圖片截取方法,通過圖像編號對應,以及原始圖像和抽點后的輸入圖像進行像素對應,實現在抽點后的輸入圖像檢測畫面中的人臉位置,再返回原始圖像截取人臉圖像的方式,提高后期人臉比對的成功率與準確性。
在確定緩存幀數時,要根據單幅圖像最大處理時間和視頻輸入幀率根據以下公式計算取得:
最小緩存幀數>視頻幀率(幀/秒)*單幅圖像最大處理時間(秒)。
總結
以上是生活随笔為你收集整理的matlab截视频人脸,一种视频图像中人脸图像截取方法与流程的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 从头撸到脚,SpringBoot 就一篇
- 下一篇: 用python写王字_看这里!Pytho