语义分割的时候,发的牢骚
問題:opencv讀取灰度圖調(diào)用shape屬性,顯示通道數(shù)是3
- 我想跑起來 嗚嗚嗚嗚
1:VOC數(shù)據(jù)集
1:IPEGImages
- 原始圖片,RGB圖片,大小不一致
2:Segmentation
- 分割之后的圖片,得到的是灰度圖(深度是8位)
3:ImageSet
- ImageSet 中含有train.txt,value.txt,test.txt
4:VOC_COLORMAP
- 標(biāo)簽
https://github.com/ShusenTang/Dive-into-DL-PyTorch/blob/master/docs/chapter09_computer-vision/9.9_semantic-segmentation-and-dataset.md
2:Train.py
1:aux_branch
- 是否使用輔助分支
2:下采樣的倍數(shù)
- 16
- 8的話,顯存占用量特別大
3:Epoch
-
初始化
-
凍結(jié)層
-
0
-
50
-
50
-
100
-
找一個(gè)pspnet網(wǎng)絡(luò)
-
開始的RGB顏色的標(biāo)注
-
MIOU的計(jì)算
mask獲取對(duì)應(yīng)的區(qū)域
3:pspNet網(wǎng)絡(luò)的采集
-
怎么將灰度圖轉(zhuǎn)化為 RGB圖像
-
MIOU的計(jì)算問題
1:pspNet
- 不失幀的resize
- 主干提取網(wǎng)絡(luò)resNet50 進(jìn)行初步特征提取
- pspNet,不同大小的池化層進(jìn)行平均池化
- 我們使用了 1 X 1, 2 X 2, 3 X 3, 6 X 6的區(qū)域進(jìn)行操作 進(jìn)行加強(qiáng)特征提取
2 問題
- 【PyTorch系列】找不到d2lzh_pytorch包,No module named ‘d2lzh_pytorch’
- https://blog.csdn.net/lilileon/article/details/114435102
3:問題
AttributeError: 'NDArray' object has no attribute 'convert'-
colormap.convert(RGB)
- Image.fromarray(arr, 'RGB')
4:NDaRRAY 和 Nparray
{[128, 0, 64], [128, 64, 0], [128, 0, 192], [0, 128, 64], [0, 192, 128], [192, 224, 224], [0, 0, 192], [128, 128, 192], [0, 128, 192], [0, 0, 64], [128, 128, 64], [0, 64, 0], [0, 128, 0], [128, 128, 128], [0, 0, 0], [0, 128, 128], [128, 0, 128], [128, 0, 0], [128, 128, 0], [0, 0, 128], [0, 192, 0], [0, 64, 128]} 0:白色[128, 0, 64] [128, 64, 0], [128, 0, 192], [0, 128, 64], [0, 192, 128], [192, 224, 224], [0, 0, 192], [128, 128, 192], [0, 128, 192], [0, 0, 64], [128, 128, 64], [0, 64, 0], [0, 128, 0] , [128, 128, 128] 14:黑色[0, 0, 0], [0, 128, 128], [128, 0, 128] , [128, 0, 0], 18:貓頭鷹[128, 128, 0], [0, 0, 128], [0, 192, 0], [0, 64, 128]}[0, 0, 0] 背景
-
0 是 白色 [128, 0, 64]
-
18 是鳥
-
實(shí)在不行,采用非深度學(xué)習(xí)的方法,全部設(shè)置為背景???
-
是不是我讀取的時(shí)候讀錯(cuò)了???8位的應(yīng)該怎么讀取
5:讀取txt中的所有目錄
- 讀取 RGB的所有圖像
[外鏈圖片轉(zhuǎn)存失敗,源站可能有防盜鏈機(jī)制,建議將圖片保存下來直接上傳(img-KKys6WnY-1622361549148)(CV%E4%BD%9C%E4%B8%9A%E7%AC%94%E8%AE%B0.assets/image-20210529181221769.png)]
-
我要死了~~~~~ ~~~~
-
應(yīng)該寫不完了,我死了~·
-
弄一個(gè)全是黑的的圖片吧,這個(gè)怎么弄的
-
測(cè)試集上是 0.8732
標(biāo)簽
-
VOC 2012中的ground truth label 是以RGB偽彩色圖像的形式保存的
-
完結(jié),撒花~~~
7:為什么一訓(xùn)練就變花了啊????
上天啊~~~— 讓我過一過吧,我真的只想得到一個(gè) 0.02 的結(jié)果
- 可以嗎???
8:kaggle 下載代碼后運(yùn)行的結(jié)果文件
- commit之后,就會(huì)重新執(zhí)行,得到最后的結(jié)果輸出
9:TMD
顏色又搞反了
我真是個(gè) 廢物
- 我覺得很扯,怎么顏色又不對(duì)····我是真的迷,迷了···
kaggle下載代碼運(yùn)行后的結(jié)果文件_筆記小屋-CSDN博客
一次跑三分鐘,50輪就是一百五十分鐘,差不多三個(gè)小時(shí)
-
為什么我越訓(xùn)練越低啊????為什么我第一次最高???搞笑吧???
-
當(dāng)epoch = 0 的時(shí)候
- MIOU = 0.83
-
epoch = 1 的時(shí)候
- 先執(zhí)行的是test文件
- MIOU 74.06
-
epoch = 4 的時(shí)候
- MIOU 79.89
-
epoch = 4 2 的時(shí)候
- mIoU: 82.82; mPA: 89.19
-
epoch = 56 的時(shí)候
- ===> mIoU: 82.63; mPA: 89.25
-
epoch = 70 的時(shí)候
- Mean IoU: 0.8263
-
很服,很迷,你是不想讓我訓(xùn)練嗎??、
-
哭
代碼地址
CV3Predict:https://www.kaggle.com/kksspsls/cv3predict
CV3MIOUTEST:https://www.kaggle.com/kksspsls/cv3mioutest
CV3trainModel:https://www.kaggle.com/kksspsls/cv3trainmodel
總結(jié)
以上是生活随笔為你收集整理的语义分割的时候,发的牢骚的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 语义分割 小总结
- 下一篇: VOC 灰度图 索引图