2—YOLO2
Darknet: Open Source Neural Networks in Chttps://pjreddie.com/darknet/
YOLO: Real-Time Object Detectionhttps://pjreddie.com/darknet/yolo/
Pre-Trained Modelshttps://pjreddie.com/darknet/imagenet/
yolo_voc.cfg中參數
第一個net
[net] batch=64 //每次迭代要進行訓練的圖片數量 subdivisions=8// height=416 //圖像縮放后的大小 width=416 channels=3//彩色圖像 momentum=0.9 decay=0.0005 angle=0 //角度 saturation = 1.5 //飽和度 exposure = 1.5 //曝光度 hue=.1 //色調 learning_rate=0.0001 max_batches = 32000//最大訓練迭代次數 policy=steps steps=100,20000,30000 scales=10,.1,.1 【解釋】 batch:每次迭代要進行訓練的圖片數量 subdivisions:batch中的圖片再產生子集,源碼中的圖片數量int imgs = net.batch * net.subdivisions * ngpus width:輸入圖片寬度, height:輸入圖片高度,channels :輸入圖片通道數對于每次迭代訓練,YOLOv2會基于角度(angle),飽和度(saturation),曝光(exposure),色調(hue)產生新的訓練圖片 angle:圖片角度變化,單位為度,假如angle=5,就是生成新圖片的時候隨機旋轉-5~5度 saturation & exposure: 飽和度與曝光變化大小,tiny-yolo-voc.cfg中1到1.5倍,以及1/1.5~1倍 hue:色調變化范圍,tiny-yolo-voc.cfg中-0.1~0.1 max_batches:最大迭代次數中間的網絡結構不列出了,看最后一個卷積層
[convolutional] batch_normalize=1 size=3 stride=1 pad=1 filters=1024 //卷積核的個數 activation=leaky//leaky激活函數,大于0的為x,小于0的為0[convolutional] size=1 stride=1 pad=1 filters=40//用3類訓練,所以5*(3+4+1) activation=linear [region]最后一層 anchors = 1.08,1.19, 3.42,4.41, 6.63,11.38, 9.42,5.11, 16.62,10.52 bias_match=1 classes=3//類別數 coords=4 // num=5 softmax=1 jitter=.2 rescore=1雖然region(YOLOv1的detection)在最后一層,但是很多參數都是一開始就載入使用的,尤其是對于圖片數據處理的參數 classes:類別數量 coords:BoundingBox的tx,ty,tw,th,tx與ty是相對于左上角的gird,同時是當前grid的比例,tw與th是寬度與高度取對數 num:每個grid預測的BoundingBox個數 jitter:利用數據抖動產生更多數據,YOLOv2中使用的是crop,filp,以及net層的angle,flip是隨機的,crop就是jitter的參數,tiny-yolo-voc.cfg中jitter=.2,就是在0~0.2中進行crop anchors:預測框的初始寬高,第一個是w,第二個是h,總數量是num*2,YOLOv2作者說anchors是使用K-MEANS獲得,其實就是計算出哪種類型的框比較多,可以增加收斂速度,如果不設置anchors,默認是0.5,還有就是anchors讀入參數中名字是biases 這里有一個計算樣本anchors的Python腳本,anchors生成腳本 bias_match:如果為1,計算best iou時,預測寬高強制與anchors一致 softmax:如果為1,使用softmax rescore:決定使用哪種方式計算IOU的誤差,為1時,使用當前best iou計算,為0時,使用1計算 object_scale & noobject_scale & class_scale & coord_scale:YOLOv1論文中cost function的權重,哪一個更大,每一次更新權重的時候,對應方面的權重更新相對比重更大 thresh:決定是否需要計算IOU誤差的參數,大于thresh,IOU誤差不會夾在cost function中 random:如果為1每次迭代圖片大小隨機從320到608,步長為32,如果為0,每次訓練大小與輸入大小一致總結
- 上一篇: 1—YOLO2:环境搭建
- 下一篇: 3—YOLO:训练自己的数据