當(dāng)前位置：首頁(yè) > 编程资源 > 编程问答 >内容正文

编程问答

语义分割的时候，发的牢骚

發(fā)布時(shí)間：2025/1/21 编程问答 32 豆豆

生活随笔收集整理的這篇文章主要介紹了语义分割的时候，发的牢骚小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

問題：opencv讀取灰度圖調(diào)用shape屬性，顯示通道數(shù)是3

我想跑起來嗚嗚嗚嗚

1：VOC數(shù)據(jù)集

1：IPEGImages

原始圖片，RGB圖片，大小不一致

2：Segmentation

分割之后的圖片，得到的是灰度圖（深度是8位）

3：ImageSet

ImageSet 中含有train.txt，value.txt，test.txt

4：VOC_COLORMAP

標(biāo)簽

https://github.com/ShusenTang/Dive-into-DL-PyTorch/blob/master/docs/chapter09_computer-vision/9.9_semantic-segmentation-and-dataset.md

2：Train.py

1：aux_branch

是否使用輔助分支

2：下采樣的倍數(shù)

16
8的話，顯存占用量特別大

3：Epoch

初始化
凍結(jié)層
0
50
50
100
找一個(gè)pspnet網(wǎng)絡(luò)
開始的RGB顏色的標(biāo)注
MIOU的計(jì)算

mask獲取對(duì)應(yīng)的區(qū)域

3：pspNet網(wǎng)絡(luò)的采集

怎么將灰度圖轉(zhuǎn)化為 RGB圖像
MIOU的計(jì)算問題

1：pspNet

不失幀的resize
主干提取網(wǎng)絡(luò)resNet50 進(jìn)行初步特征提取
pspNet，不同大小的池化層進(jìn)行平均池化
我們使用了 1 X 1, 2 X 2, 3 X 3, 6 X 6的區(qū)域進(jìn)行操作進(jìn)行加強(qiáng)特征提取

2 問題

【PyTorch系列】找不到d2lzh_pytorch包，No module named ‘d2lzh_pytorch’
https://blog.csdn.net/lilileon/article/details/114435102

3：問題

AttributeError: 'NDArray' object has no attribute 'convert'

colormap.convert(RGB)
Image.fromarray(arr, 'RGB')

4:NDaRRAY 和 Nparray

{[128, 0, 64], [128, 64, 0], [128, 0, 192], [0, 128, 64], [0, 192, 128], [192, 224, 224], [0, 0, 192], [128, 128, 192], [0, 128, 192], [0, 0, 64], [128, 128, 64], [0, 64, 0], [0, 128, 0], [128, 128, 128], [0, 0, 0], [0, 128, 128], [128, 0, 128], [128, 0, 0], [128, 128, 0], [0, 0, 128], [0, 192, 0], [0, 64, 128]} 0：白色[128, 0, 64] [128, 64, 0], [128, 0, 192], [0, 128, 64], [0, 192, 128], [192, 224, 224], [0, 0, 192], [128, 128, 192], [0, 128, 192], [0, 0, 64], [128, 128, 64], [0, 64, 0], [0, 128, 0] , [128, 128, 128] 14：黑色[0, 0, 0], [0, 128, 128], [128, 0, 128] , [128, 0, 0], 18：貓頭鷹[128, 128, 0], [0, 0, 128], [0, 192, 0], [0, 64, 128]}

[0, 0, 0] 背景

0 是白色 [128, 0, 64]
18 是鳥
實(shí)在不行，采用非深度學(xué)習(xí)的方法，全部設(shè)置為背景？？？
是不是我讀取的時(shí)候讀錯(cuò)了？？？8位的應(yīng)該怎么讀取

5：讀取txt中的所有目錄

讀取 RGB的所有圖像

image_ids = open(r"../input/voc2012-segmentation/ImageSets/Segmentation/train.txt",'r').read().splitlines()for i in image_ids:print(len(myset))print(myset)img = cv2.imread("../input/voc2012-segmentation/SegmentationClass/" + str(i)+".png")# print(img)for x in range(img.shape[0]): for y in range(img.shape[1]):# print(img[x][y])lst = (img[x][y][0],img[x][y][0],img[x][y][0])myset.add(lst)

[外鏈圖片轉(zhuǎn)存失敗,源站可能有防盜鏈機(jī)制,建議將圖片保存下來直接上傳(img-KKys6WnY-1622361549148)(CV%E4%BD%9C%E4%B8%9A%E7%AC%94%E8%AE%B0.assets/image-20210529181221769.png)]

我要死了~~~~~ ~~~~
應(yīng)該寫不完了，我死了~·
弄一個(gè)全是黑的的圖片吧，這個(gè)怎么弄的
測(cè)試集上是 0.8732

標(biāo)簽

VOC 2012中的ground truth label 是以RGB偽彩色圖像的形式保存的
完結(jié)，撒花~~~

7：為什么一訓(xùn)練就變花了啊？？？？

上天啊~~~— 讓我過一過吧，我真的只想得到一個(gè) 0.02 的結(jié)果

可以嗎？？？

8：kaggle 下載代碼后運(yùn)行的結(jié)果文件

commit之后，就會(huì)重新執(zhí)行，得到最后的結(jié)果輸出

9：TMD

顏色又搞反了

我真是個(gè) 廢物

我覺得很扯，怎么顏色又不對(duì)····我是真的迷，迷了···

kaggle下載代碼運(yùn)行后的結(jié)果文件_筆記小屋-CSDN博客

一次跑三分鐘，50輪就是一百五十分鐘，差不多三個(gè)小時(shí)

為什么我越訓(xùn)練越低啊？？？？為什么我第一次最高？？？搞笑吧？？？
當(dāng)epoch = 0 的時(shí)候
- MIOU = 0.83
epoch = 1 的時(shí)候
- 先執(zhí)行的是test文件
- MIOU 74.06
epoch = 4 的時(shí)候
- MIOU 79.89
epoch = 4 2 的時(shí)候
- mIoU: 82.82; mPA: 89.19
epoch = 56 的時(shí)候
- ===> mIoU: 82.63; mPA: 89.25
epoch = 70 的時(shí)候
- Mean IoU: 0.8263
- 很服，很迷，你是不想讓我訓(xùn)練嗎？？、
- 哭

代碼地址

CV3Predict：https://www.kaggle.com/kksspsls/cv3predict

CV3MIOUTEST：https://www.kaggle.com/kksspsls/cv3mioutest

CV3trainModel：https://www.kaggle.com/kksspsls/cv3trainmodel

總結(jié)

以上是生活随笔為你收集整理的语义分割的时候，发的牢骚的全部?jī)?nèi)容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯(cuò)，歡迎將生活随笔推薦給好友。