What?你还搞不懂什么是物体检测?
全世界只有3.14 %?的人關(guān)注了
爆炸吧知識(shí)
計(jì)算機(jī)視覺在上一個(gè)世紀(jì)60年代脫胎于人工智能與認(rèn)知神經(jīng)科學(xué),并旨在通過(guò)設(shè)計(jì)算法來(lái)讓計(jì)算機(jī)自動(dòng)理解圖像的內(nèi)容。
于是為了“解決”這類機(jī)器視覺的問(wèn)題,麻省理工在1966年正式將這個(gè)問(wèn)題作為一個(gè)夏季項(xiàng)目,然而事實(shí)驗(yàn)證,要解決這個(gè)問(wèn)題可能還需要更長(zhǎng)時(shí)間。
轉(zhuǎn)眼間,距離麻省理工最初提出這個(gè)項(xiàng)目已過(guò)去50多年,一般的圖像理解任務(wù)仍舊是不能得到完美解決。
不過(guò)也已取得顯著進(jìn)展,并且隨著機(jī)器視覺算法商業(yè)化的成功,機(jī)器視覺產(chǎn)品已經(jīng)開始擁有廣泛的用戶,包括圖像分割(例如微軟office中去除圖片背景的功能)、圖像檢索、人臉檢測(cè)對(duì)焦和Kinect的人體運(yùn)動(dòng)捕捉等。
物體檢測(cè)是計(jì)算機(jī)視覺與模式識(shí)別領(lǐng)域的核心問(wèn)題,一直以來(lái)受到學(xué)術(shù)界與工業(yè)界的廣泛關(guān)注。當(dāng)前物體檢測(cè)最大的難點(diǎn)是如何對(duì)場(chǎng)景中多種尺度的物體進(jìn)行有效表征,進(jìn)而進(jìn)行更為高效、更為準(zhǔn)確、更為魯棒的物體檢測(cè)。
物體檢測(cè)對(duì)于人眼來(lái)說(shuō)并不困難,我們可以通過(guò)對(duì)圖片中不同顏色、紋理、邊緣模塊的感知很容易定位出目標(biāo)物體,但對(duì)于計(jì)算機(jī)來(lái)說(shuō),面對(duì)的是RGB像素矩陣,很難從圖像中直接得到狗和貓這樣的抽象概念并定位其位置,再加上物體姿態(tài)、光照和復(fù)雜背景混雜在一起,使得物體檢測(cè)更加困難。
于是人們?cè)诓粩嗵剿鞯倪^(guò)程中,涌現(xiàn)出用以解決各類問(wèn)題的算法、框架,例如決策樹、Fast R-CNN、Mask R-CNN等,今天小天將主要講講Mask R-CNN。
Mask R-CNN是一個(gè)實(shí)例分割(Instance segmentation)算法,由何凱明等人在2017年發(fā)表的論文中提出,可以用來(lái)做“目標(biāo)檢測(cè)”、“目標(biāo)實(shí)例分割”、“目標(biāo)關(guān)鍵點(diǎn)檢測(cè)”。
Mask R-CNN是一個(gè)非常靈活的框架,可以通過(guò)增加不同的分支來(lái)完成不同的任務(wù),例如可以用來(lái)完成目標(biāo)分類、目標(biāo)檢測(cè)、語(yǔ)義分割、實(shí)例分割、人體姿勢(shì)識(shí)別等多種任務(wù)!
Mask R-CNN算法建立在Faster R-CNN架構(gòu)的基礎(chǔ)之上,我們可以將Mask R-CNN架構(gòu)可視化如下圖所示:
相較于Faster-rcnn,Mask R-CNN擁有更高速、高準(zhǔn)確率(高的分類準(zhǔn)確率、高的檢測(cè)準(zhǔn)確率、高的實(shí)例分割準(zhǔn)確率等)、簡(jiǎn)單直觀、易于使用的特性。即便如此,Faster-rcnn與Mask R-CNN這兩個(gè)算法都是對(duì)應(yīng)領(lǐng)域中的經(jīng)典之作。
Mask R-CNN比Faster-rcnn復(fù)雜,但是最終仍然可以達(dá)到5fps的速度,這和原始的Faster-rcnn的速度相當(dāng)。
此外,由于發(fā)現(xiàn)了ROI Pooling中所存在的像素偏差問(wèn)題,提出了對(duì)應(yīng)的ROIAlign策略,加上FCN精準(zhǔn)的像素MASK,使得其可以獲得高準(zhǔn)確率。
縱觀整個(gè)Mask R-CNN,它的算法的思路很簡(jiǎn)單,就是在原始Faster-rcnn算法的基礎(chǔ)上面增加了FCN來(lái)產(chǎn)生對(duì)應(yīng)的MASK分支。即Faster-rcnn + FCN,更細(xì)致的是 RPN + ROIAlign + Fast-rcnn + FCN。
那么問(wèn)題來(lái)了,到底如何借助Mask R-CNN來(lái)進(jìn)行進(jìn)行物體檢測(cè)呢?
為了讓大家對(duì)Mask R-CNN在物體檢測(cè)領(lǐng)域的應(yīng)用有全面的了解,爆炸吧知識(shí)攜手唐老師推出《深度學(xué)習(xí)-物體檢測(cè)實(shí)戰(zhàn)》。
長(zhǎng)按識(shí)別二維碼
即可查看課程
內(nèi)容包含:物體檢測(cè)框架Mask R-CNN項(xiàng)目配置,Mask R-CNN網(wǎng)絡(luò)框架源碼詳解、基于Mask R-CNN訓(xùn)練自己的數(shù)據(jù)集與任務(wù)、遷移學(xué)習(xí)與Resnet網(wǎng)絡(luò)架構(gòu)、物體檢測(cè)Faster R-CNN系列。
限時(shí)直降70元,卻有滿滿干貨!不止是學(xué)習(xí)建議,更注重學(xué)以致用:
多維度教學(xué)模式:錄播+學(xué)習(xí)群,不受時(shí)間/地域限制,大家可輕松安排時(shí)間學(xué)習(xí);
項(xiàng)目實(shí)戰(zhàn):以真實(shí)賽題為訓(xùn)練目標(biāo),學(xué)習(xí)就是比賽,這樣才能學(xué)以致用;
全程代碼:課上講解的訓(xùn)練代碼都會(huì)分享給大家,使學(xué)生做到及時(shí)的活學(xué)活用。
關(guān)于主講老師
適用對(duì)象與課程特色
適用對(duì)象:
◆?人工智能愛好者、Python愛好者、機(jī)器學(xué)習(xí)愛好者、深度學(xué)習(xí)愛好者
課程特色:
學(xué)習(xí)平臺(tái)——騰訊課堂
上課形式——錄播
課程資料——配有專屬實(shí)戰(zhàn)案例
課程收益——了解物體檢測(cè)Faster R-CNN與Mask R-CNN,快速入門物體檢測(cè)
注意事項(xiàng)
①課程有疑問(wèn)或成功報(bào)名均請(qǐng)聯(lián)系助教?
小七微信:zwjlee001
大魚QQ:210187565
來(lái)吧,點(diǎn)擊下方“閱讀原文”,跟隨著老師的腳步,提升自我!
總結(jié)
以上是生活随笔為你收集整理的What?你还搞不懂什么是物体检测?的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。
- 上一篇: 越来越多的人不刷朋友圈竟然是因为....
- 下一篇: 让TA们告诉你,疫情当下如何更彪悍的成长