日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 人文社科 > 生活经验 >内容正文

生活经验

部署可扩展的目标检测管道:推理过程(上)

發布時間:2023/11/28 生活经验 26 豆豆
生活随笔 收集整理的這篇文章主要介紹了 部署可扩展的目标检测管道:推理过程(上) 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

部署可擴展的目標檢測管道:推理過程(上)
基于YOLOv3的目標檢測推理過程的所有代碼都可以在eriklindernoren/PyTorch-YOLOv3 GitHub repo找到。
為了進行審查,使用了完整版的YOLO配置文件。它包含有關網絡,卷積層,三個YOLO檢測層以及其它層及其屬性的信息。使用PyTorch來解析配置文件并應用模型定義來實現網絡。YOLOv3檢測層默認情況下啟用了CUDA。來自NGC軟件中心的PyTorch CUDA提供了GPU優化的容器,并預先配置了cuDNN之類的庫,以利用多個支持CUDA的處理器。
接下來,為YOLOv3-416加載了預訓練的偏差和權重文件,該文件連接了層之間的節點。卷積層使用可訓練的參數,其中包括內核權重和偏差。權重指定為3D張量,帶有行,列和通道的數量。在整個網絡中使用零填充來保持圖像的尺寸。輸入層不包含任何可訓練的參數,因為它包含數據。而且,快捷方式和路由層沒有權重,因為它們不執行任何卷積。
卷積層的可訓練參數的數量由以下公式確定:
權重+偏見
輸入x輸出+偏差
如果最后一層很密集,則輸入=節點數
如果最后一層是conv,則輸入=過濾器數
輸出=(過濾器數量)x(過濾器尺寸)
偏差=過濾器數量
輸出層可訓練的參數數由以下公式確定:
權重+偏見
輸入x輸出+偏差
輸入=圖像寬度x圖像高度x過濾器數量
因為它是一個密集層,所以輸出=節點數
偏差=節點數
網絡通過稱為網絡卷積層內核步幅的因子對圖像進行下采樣。輸入416 x 416時,將以13 x 13的步幅(步幅32),26 x 26的步幅16和52 x 52的步幅8進行檢測。在每個尺度上,每個像元都使用三個錨點預測三個邊界框(規模不同),總共有9個錨點。
基于預測概率的權重與邊界框相關聯-隨后,將檢測閾值某個值,以僅查看高評分檢測。最后,非最大抑制(NMS)用于刪除多個檢測,以為每個檢測到的目標選擇一個邊界框,以生成合并的推理圖像輸出。

圖1.推理過程。
推理輸出

圖2.原始的1280 x 720圖像。

圖3.比例尺為1的大型物體。

圖4.以比例2檢測到的中等物體。

圖5.規模為3的較小物體被檢測到。

圖6.合并到推理圖像中的預測邊界框。
推理性能指標
目標檢測推理過程負責執行圖像分類和定位。每個圖像可以具有用于分類和定位的不同類別的多個目標。檢測到的目標類別包括汽車,卡車,公共汽車,行人和交通燈。目標檢測性能指標用作量化評估推理對圖像分類,定位和目標檢測任務的執行程度的度量。

? 圖7.汽車(單個目標)的圖像分類。

? 圖8:圖像本地化(邊界框)

? 圖9:目標檢測(汽車,行人,交通信號燈)
圖7和8顯示了單個目標。圖9顯示了多個目標。
評估圖像分類
對圖像進行分類是一個難題,而準確的分類則更加困難。對于預注釋,力求在速度和圖像分類精度之間取得平衡。在本節中,術語圖像和目標可互換使用。
圖像分類的任務是為給定圖像預測單個標簽(或具有置信度的標簽分布)。圖像是從0到255的整數的3D數組,大小是寬度x高度x3。三個代表顏色通道:紅色,綠色和藍色。
以下是對影響圖像推理速度和準確性的圖像進行分類時,所面臨的挑戰的已知列表。在數據集中遇到了這些。另外,還提到了YOLOv3中包含的適用于應對這些挑戰的技術和技巧。重要的是要注意,許多貢獻來自許多先前的研究工作。深度卷積網絡的分類可能是最具影響力的研究論文之一,其中包括其它著名的研究成果:
? 2014年–用于大規模圖像識別的超深度卷積神經網絡
? 2015年–進一步發展卷積
? 2015年–用于圖像識別的深度殘差訓練
視點變化
目標的方向可能會因相機傳感器的位置而異。

? 圖10.左側汽車的前視圖。

? 圖11:汽車的側視圖

? 圖12:汽車的后視圖
YOLOv3每幅圖像的誤報率(FPPI)隨視點而變化。這取決于相機傳感器的位置和視場(FOV)的影響。在某些情況下,較大的FFPI歸因于從單個前置攝像頭捕獲的圖像。
規模變化
目標的大小通常會變化(現實世界中的大小,不僅限于圖像的大小)。

? 圖13.大型汽車。

? 圖14:中等規模的汽車。

? 圖15:小型汽車。
YOLOv3可以從檢測大型物體到小型物體三個方面進行預測,盡管它在檢測遠距離較小的物體方面并不可靠。
失真
許多感興趣的目標不是剛體。在極端情況下,它們可能以極端方式變形。

? 圖16.人走。

? 圖17:人員停止行走。

? 圖18:等待行人過路。
由于YOLOv3是具有眾所周知幾何形狀的剛性物體,因此在預測汽車,卡車,公共汽車和交通信號燈時更準確。但是,由于行人不是剛體,并且具有各種姿勢和變形,因此有更好的網絡結構可以使行人檢測更加準確。

總結

以上是生活随笔為你收集整理的部署可扩展的目标检测管道:推理过程(上)的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。