日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問(wèn) 生活随笔!

生活随笔

當(dāng)前位置: 首頁(yè) > 人工智能 > ChatGpt >内容正文

ChatGpt

【OpenMMLab AI训练营第二期】Class6:目标检测与MMDetection

發(fā)布時(shí)間:2024/1/18 ChatGpt 48 豆豆
生活随笔 收集整理的這篇文章主要介紹了 【OpenMMLab AI训练营第二期】Class6:目标检测与MMDetection 小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

目標(biāo)檢測(cè)與MMDetection

  • 目標(biāo)檢測(cè)的基本范式
    • 什么是目標(biāo)檢測(cè)
      • 發(fā)展
      • 目標(biāo)檢測(cè)技術(shù)的演進(jìn)
    • 基礎(chǔ)知識(shí)
      • 交并比IoU
    • 目標(biāo)檢測(cè)的基本思路
      • 滑窗
      • 感受野
      • 使用卷積實(shí)現(xiàn)密集預(yù)測(cè)
      • 邊界框回歸
      • 非極大值抑制
      • 密集預(yù)測(cè)的流程
      • 密集預(yù)測(cè)模型的訓(xùn)練
      • 密集檢測(cè)的思路
      • 多尺度檢測(cè)與FPN
  • 單階段&無(wú)錨框檢測(cè)器選講
    • RPN
    • YOLO、SSD
    • Focal Loss與RetinaNet
    • FCOS
    • YOLO系列選講

視頻鏈接:目標(biāo)檢測(cè)與MMDetection

目標(biāo)檢測(cè)的基本范式

什么是目標(biāo)檢測(cè)

目標(biāo)檢測(cè)是在給定的圖片中用矩形框框出所有感興趣物體同時(shí)預(yù)測(cè)物體類別的過(guò)程。

  • 圖像分類和目標(biāo)檢測(cè)的異同

    目標(biāo)檢測(cè)在生活中有非常廣泛的應(yīng)用,例如人臉識(shí)別、智慧城市、自動(dòng)駕駛等。也可作為其他下游視覺(jué)任務(wù)的基礎(chǔ),例如OCR、姿態(tài)識(shí)別等等。

發(fā)展


早期是傳統(tǒng)方法DPM,在進(jìn)入深度學(xué)習(xí)階段之后就有了更多算法。

  • 根據(jù)算法階段來(lái)劃分。 首先出現(xiàn)的是兩階段算法,以R-CNN和Faster R-CNN為代表;此后是單階段算法,以YOLO和SSD為代表。
  • 根據(jù)是否使用Transformer。 2020年左右,涌現(xiàn)了諸多基于Transformer的方法,例如DETR、ViT等等。
  • 如今基于CNN和TR的方法日趨成熟,學(xué)術(shù)界開(kāi)始在探討Open Vocabulary Detection,希望目標(biāo)檢測(cè)算法能夠不局限在有標(biāo)注的數(shù)據(jù)集中。

目標(biāo)檢測(cè)技術(shù)的演進(jìn)

基礎(chǔ)知識(shí)


是橫平豎直的框,如果是旋轉(zhuǎn)的是旋轉(zhuǎn)目標(biāo)檢測(cè)這一小類。

交并比IoU

如果存在多個(gè)框,那么就需要考慮框之間的關(guān)系。最常用的方法就是交并比。

IoU是介于[0,1]的數(shù)值。后續(xù)也有很多新的IoU方式,例如CIoU、DIoU等等

目標(biāo)檢測(cè)的基本思路

滑窗




如上述圖片所示:滑窗法首先是通過(guò)設(shè)定一個(gè)固定大小的窗口,然后按照一定規(guī)律遍歷圖像所有位置。在遍歷的時(shí)候根據(jù)滑窗對(duì)圖像進(jìn)行一個(gè)裁剪,然后對(duì)滑窗內(nèi)的圖片進(jìn)行分類,根據(jù)分類分?jǐn)?shù)來(lái)判斷屬于前景還是背景。

但是滑窗方法的效率是非常低的。

為了減少不同滑窗中被同一卷積計(jì)算的冗余,可以用卷積對(duì)全圖進(jìn)行計(jì)算,然后通過(guò)卷積的位置一致性取出對(duì)應(yīng)位置的特征。

感受野


感受野的計(jì)算

有效感受野(感受野的大小)

使用卷積實(shí)現(xiàn)密集預(yù)測(cè)


不同感受野自然形成了一系列等距離分布的滑窗。本來(lái)在每個(gè)滑窗的部分都有線性分類的過(guò)程,可以對(duì)其進(jìn)行維度上的轉(zhuǎn)置,得到一個(gè) 1 × 1 × C i n × C o u t 1 \times 1 \times C_{in} \times C_{out} 1×1×Cin?×Cout?的卷積,實(shí)現(xiàn)特征圖的密集預(yù)測(cè)。這樣就可以一次性計(jì)算出所有位置上包含物體的概率。

邊界框回歸



神經(jīng)網(wǎng)絡(luò)對(duì)于回歸比起分類任務(wù)還是比較困難的,所以設(shè)置一個(gè)錨框還是能降低難度。當(dāng)然錨框也不是純粹為了回歸任務(wù),也可以檢測(cè)出不同大小的物體還有重疊物體。

非極大值抑制


預(yù)測(cè)結(jié)果中,可能多個(gè)預(yù)測(cè)結(jié)果間存在重疊部分,需要保留交并比最大的、去掉非最大的預(yù)測(cè)結(jié)果,這就是非極大值抑制(Non-Maximum Suppression,簡(jiǎn)寫作NMS)。

密集預(yù)測(cè)的流程

  • 圖像輸入到卷積網(wǎng)絡(luò)里產(chǎn)生一個(gè)特征圖,然后用 1 × 1 1 \times 1 1×1的卷積去卷特征圖,得到類別概率和預(yù)測(cè)結(jié)果
  • 把不是背景的框保留
  • 基于框的位置,加上預(yù)測(cè)的邊界
  • NMS
  • 密集預(yù)測(cè)模型的訓(xùn)練


    GT怎么映射到密集預(yù)測(cè)中呢?因?yàn)闃?biāo)注的時(shí)候只會(huì)標(biāo)出物體,那么如何用這個(gè)稀疏的標(biāo)注去產(chǎn)生一個(gè)密集的GT,這個(gè)過(guò)程就是匹配。

    采樣:自然的想,存在以下兩種情況

  • 背景較多,不能訓(xùn)練成一個(gè)預(yù)測(cè)背景的檢測(cè)器
  • 前景周圍的模糊邊界,也不該被預(yù)測(cè)到,刪去,因?yàn)樽鳛榍熬昂捅尘岸疾惶谩?/li>

    密集檢測(cè)的思路


    這是一個(gè)抽象的基本范式。

    多尺度檢測(cè)與FPN

    單階段&無(wú)錨框檢測(cè)器選講

    RPN

    YOLO、SSD

    Focal Loss與RetinaNet

    FCOS

    YOLO系列選講

    總結(jié)

    以上是生活随笔為你收集整理的【OpenMMLab AI训练营第二期】Class6:目标检测与MMDetection的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問(wèn)題。

    如果覺(jué)得生活随笔網(wǎng)站內(nèi)容還不錯(cuò),歡迎將生活随笔推薦給好友。