日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當(dāng)前位置: 首頁 > 人工智能 > pytorch >内容正文

pytorch

【学员分享】深度学习计算机视觉,两个星期从入门到上线

發(fā)布時(shí)間:2025/3/20 pytorch 32 豆豆
生活随笔 收集整理的這篇文章主要介紹了 【学员分享】深度学习计算机视觉,两个星期从入门到上线 小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

Hello,everyone!今天給大家講述一個(gè)深度學(xué)習(xí)項(xiàng)目。

在講這個(gè)項(xiàng)目之前,很多業(yè)外人士可能不明白人工智能(AI),機(jī)器學(xué)習(xí)(ML),深度學(xué)習(xí)(DL),這三者是什么關(guān)系。先科普一下小常識(shí),它們?nèi)呤前蛹P(guān)系。即人工智能是最大范疇,包含機(jī)器學(xué)習(xí),機(jī)器學(xué)習(xí)包含深度學(xué)習(xí)。

好了,進(jìn)入正題。本人所解決的是人臉識(shí)別登錄的業(yè)務(wù),最后抽象為一個(gè)深度學(xué)習(xí)的三分類問題。接下來會(huì)以解決問題的順序進(jìn)行展開描述。用的深度學(xué)習(xí)框架是caffe,網(wǎng)絡(luò)結(jié)構(gòu)是mobilenet。

01

數(shù)據(jù)的獲取

首先深度學(xué)習(xí)的數(shù)據(jù)很重要。而數(shù)據(jù)集的獲取則應(yīng)該根據(jù)業(yè)務(wù)需求去尋找。本項(xiàng)目是圖片數(shù)據(jù)集的獲取,可以從各大開源數(shù)據(jù)集尋找,之后發(fā)現(xiàn)有些類別的數(shù)據(jù)集量還是不夠大,又去各大影視中尋找錄屏,然后按幀數(shù)切分成圖片。

02

數(shù)據(jù)的清洗

該部分將消耗大概百分之七十的時(shí)間。數(shù)據(jù)清洗包括對(duì)圖片數(shù)據(jù)集的篩選,分類,又稱標(biāo)注數(shù)據(jù)。尤其是數(shù)據(jù)的分類很重要。數(shù)據(jù)分類的準(zhǔn)確性可能就決定了你訓(xùn)練模型能否收斂。該部分是個(gè)細(xì)活,過程比較瑣碎,暫時(shí)先不說。數(shù)據(jù)集分為9類,為啥是9類,解決的不是3分類問題嗎?因?yàn)榍捌?分類訓(xùn)練模型的準(zhǔn)確率不是很高,考慮到3個(gè)大類內(nèi)部的數(shù)據(jù)方差過大,于是調(diào)整策略為訓(xùn)練為9分類問題,最后測(cè)試為3分類,因?yàn)樽詈髽I(yè)務(wù)解決的還是3分類問題。

以下是9類圖片標(biāo)注標(biāo)準(zhǔn):



03

訓(xùn)練模型

? ? ? 接下來就是訓(xùn)練模型了,模型的訓(xùn)練由于是在服務(wù)器上訓(xùn)練,加上模型不是很大,訓(xùn)練很快,正常跑個(gè)4個(gè)小時(shí)左右就可以迭代出一個(gè)模型。模型的acc,loss,隨迭代次數(shù)的關(guān)系可以通過繪制圖表觀看,很直觀。訓(xùn)練集上的acc只能做個(gè)參考,主要還是最后測(cè)試的表現(xiàn),因?yàn)槟隳P涂赡軈?shù)很多,最后導(dǎo)致模型過擬合。

? ? ? 該部分還包含模型的調(diào)優(yōu),也就是調(diào)參,這是個(gè)學(xué)問,值得好好繼續(xù)學(xué)習(xí)。

04

測(cè)試模型

該部分是拿一批最接近業(yè)務(wù)的數(shù)據(jù)去測(cè)試,看每一類準(zhǔn)確率。3分類是標(biāo)注為0,1,2三個(gè)大類。由于業(yè)務(wù)追求0,1,2的準(zhǔn)確率很高,允許2的召回率可以低一些,所以測(cè)試時(shí)要關(guān)注這些。

下面是訓(xùn)練模型在驗(yàn)證集上的表現(xiàn):

acc

0.9183

acc0

0.9676

acc1

0.8

acc2

0.9723

準(zhǔn)確率已經(jīng)達(dá)到業(yè)務(wù)需求了,然后就結(jié)束了嗎?當(dāng)然沒有。作為一個(gè)專業(yè)人士,我們要追求細(xì)節(jié),哈哈。因?yàn)橛?xùn)練的是9分類,我們要看9分類的具體情況,以及那些錯(cuò)分的樣本是哪些。

下面是9類的結(jié)果:

acc

0.9183

acc0

0.9676

acc1

0.8748

acc2

7665

acc3

0.5178

acc4

0.8152

acc5

0.9125

acc6

0.9837

acc7

0.5072

acc8

0.6136

怎么3,7的準(zhǔn)確率那么低,怎么解決了?此處先埋下伏筆。

祭出大殺器,矩陣統(tǒng)計(jì)。

下圖是在服務(wù)器上運(yùn)行結(jié)果的矩陣部分截圖:



看著很不舒服,于是把它調(diào)整到文本中,方便觀看。


以上矩陣共有arrays1,arrays2,arrays3三個(gè)矩陣,每個(gè)矩陣的每一行代表真實(shí)標(biāo)簽label,共有9行,依次表示label從0到8,每一列代表預(yù)測(cè)標(biāo)簽predict,共有9列,依次表示predict從0到8,所以每個(gè)矩陣都是一個(gè)9*9的矩陣。arrays1表示共有81種可能組合,每一個(gè)元素表示模型把樣本的label預(yù)測(cè)為predict的可能的個(gè)數(shù)。例如arrays1[0][0]表示模型把0預(yù)測(cè)為0的樣本共有5975張。arrays2表示模型把樣本的label預(yù)測(cè)為predict的概率總和,例如arrays2[0][0]表示模型把0預(yù)測(cè)為0的樣本概率總和為5.53879372e+03。arrays3表示模型把樣本的label預(yù)測(cè)為predict的概率平均值,arrays3=arrays2/arrays1。例如arrays3[0][0]表示模型把0預(yù)測(cè)為0的樣本概率均值為0.92699476。從arrays3可以看出,主對(duì)角線的值(表示模型預(yù)測(cè)正確的概率均值)還是蠻大的,其它值不是很大,說明模型的整體性能還是挺優(yōu)的。

好,下面解決上面埋下的伏筆: 3,7的準(zhǔn)確率怎么那么低,答案得在arrays3中尋找,我們得看label為3時(shí),分為predict的情況,從arrays3可以看出,arrays3[3][0]較大,表示模型把3錯(cuò)分為0的概率,再去看對(duì)應(yīng)的arrays1[3][0]=9, 表示模型把3錯(cuò)分為0的樣本數(shù)為9,數(shù)據(jù)量不是很大啊,然后我們?cè)偃ゲ榭催@9個(gè)樣本的情況,發(fā)現(xiàn)是自己標(biāo)注錯(cuò)了,好了,這不是模型的鍋,模型是還是不錯(cuò)的。同理,分析7的準(zhǔn)確率情況。

經(jīng)過以上的環(huán)節(jié),基本深度學(xué)習(xí)的模型可以出第一版本了,之后再根據(jù)業(yè)務(wù)需求看模型是否需要迭代。

感謝鵬哥帶我。

注:圖片全部為實(shí)驗(yàn)數(shù)據(jù)圖片


—END—

如果想加入我們,后臺(tái)留言吧

微信

Longlongtogo

公眾號(hào)內(nèi)容

1 圖像基礎(chǔ)|2 深度學(xué)習(xí)|3 行業(yè)信息

往期精彩

?

【深度學(xué)習(xí)圖像項(xiàng)目實(shí)戰(zhàn)-從入門到上線1】怎樣學(xué)會(huì)科學(xué)的調(diào)研并啟動(dòng)一個(gè)項(xiàng)目。

?

【技術(shù)綜述】一文道盡softmax loss及其變種。

總結(jié)

以上是生活随笔為你收集整理的【学员分享】深度学习计算机视觉,两个星期从入门到上线的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯(cuò),歡迎將生活随笔推薦給好友。