當(dāng)前位置：首頁 >

caffe入门学习

發(fā)布時間：2025/3/21 38 豆豆

生活随笔收集整理的這篇文章主要介紹了 caffe入门学习小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

轉(zhuǎn)載自：深度學(xué)習(xí)（六）caffe入門學(xué)習(xí) - hjimce的專欄 - 博客頻道 - CSDN.NET
http://blog.csdn.net/hjimce/article/details/48933813

本文主要講解caffe的整個使用流程，適用于初級入門caffe，通過學(xué)習(xí)本篇博文，理清項目訓(xùn)練、測試流程。初級教程，高手請繞道。

我們知道，在caffe編譯完后，在caffe目錄下會生成一個build目錄，在build目錄下有個tools，這個里面有個可執(zhí)行文件caffe，如下圖所示：

有了這個可執(zhí)行文件我們就可以進(jìn)行模型的訓(xùn)練，只需要學(xué)會調(diào)用這個可執(zhí)行文件就可以了，這便是最簡單的caffe學(xué)習(xí)，不需要對caffe底層的東西懂太多，只需要會調(diào)參數(shù)，就可以構(gòu)建自己的網(wǎng)絡(luò)，然后調(diào)用這個可執(zhí)行文件就可以進(jìn)行訓(xùn)練，當(dāng)然如果你不僅僅是調(diào)參數(shù)，而且想要更改相關(guān)的算法，那就要深入學(xué)習(xí)caffe的底層函數(shù)調(diào)用了，這個以后再講。本篇博文僅適合于剛?cè)腴T學(xué)習(xí)caffe，高手請繞道。廢話不多說，回歸正題：

一、總流程

完成一個簡單的自己的網(wǎng)絡(luò)模型訓(xùn)練預(yù)測，主要包含幾個步驟：

1、數(shù)據(jù)格式處理，也就是把我們的圖片.jpg,.png等圖片以及標(biāo)注標(biāo)簽,打包在一起，搞成caffe可以直接方便調(diào)用的文件。后面我將具體講解如何打包自己的數(shù)據(jù)，讓caffe進(jìn)行調(diào)用。

2、編寫網(wǎng)絡(luò)結(jié)構(gòu)文件，這個文件的后綴格式是.prototxt。就是編寫你的網(wǎng)絡(luò)有多少層，每一層有多少個特征圖，輸入、輸出……。看個例子，看一下caffe-》example-》mnist-》lenet_train_test.prototxt。這個便是手寫字體網(wǎng)絡(luò)結(jié)構(gòu)文件了，我們需要根據(jù)自己的需要學(xué)會修改這個文件：

[cpp]?view plaincopy

<span?style="font-size:18px;">name:?"LeNet"??

layer?{??

??name:?"mnist"??

??type:?"Data"??//data層??

??top:?"data"??

??top:?"label"??

??include?{??

????phase:?TRAIN???//訓(xùn)練階段??

??}??

??transform_param?{??

????scale:?0.00390625???//對所有的圖片歸一化到0~1之間，也就是對輸入數(shù)據(jù)全部乘以scale，0.0039=?1/255??

??}??

??data_param?{??

????source:?"examples/mnist/mnist_train_lmdb"??//訓(xùn)練數(shù)據(jù)圖片路徑??

????batch_size:?64????//每次訓(xùn)練采用的圖片64張，min-batch??

????backend:?LMDB??

??}??

}??

layer?{??

??name:?"mnist"??

??type:?"Data"??

??top:?"data"??

??top:?"label"??

??include?{??

????phase:?TEST???//測試??

??}??

??transform_param?{??

????scale:?0.00390625??

??}??

??data_param?{??

????source:?"examples/mnist/mnist_test_lmdb"?//測試數(shù)據(jù)圖片路徑??

????batch_size:?100??

????backend:?LMDB??

??}??

}??

layer?{??

??name:?"conv1"???//卷積神經(jīng)網(wǎng)絡(luò)的第一層，卷積層??

??type:?"Convolution"??//這層操作為卷積??

??bottom:?"data"???//這一層的前一層是data層??

??top:?"conv1"???//??

??param?{??

????lr_mult:?1?????

??}??

??param?{??

????lr_mult:?2??

??}??

??convolution_param?{??

????num_output:?20????//定義輸出特征圖個數(shù)??

????kernel_size:?5????//定義卷積核大小??

????stride:?1??

????weight_filler?{??

??????type:?"xavier"??

????}??

????bias_filler?{??

??????type:?"constant"??

????}??

??}??

}??

layer?{??

??name:?"pool1"??

??type:?"Pooling"??????//池化層，這一層的操作為池化??

??bottom:?"conv1"???//這一層的前面一層名字為：conv1??

??top:?"pool1"??

??pooling_param?{??

????pool:?MAX???//最大池化??

????kernel_size:?2??

????stride:?2??

??}??

}??

layer?{??

??name:?"conv2"??

??type:?"Convolution"??

??bottom:?"pool1"??

??top:?"conv2"??

??param?{??

????lr_mult:?1??

??}??

??param?{??

????lr_mult:?2??

??}??

??convolution_param?{??

????num_output:?50??

????kernel_size:?5??

????stride:?1??

????weight_filler?{??

??????type:?"xavier"??

????}??

????bias_filler?{??

??????type:?"constant"??

????}??

??}??

}??

layer?{??

??name:?"pool2"??

??type:?"Pooling"??

??bottom:?"conv2"??

??top:?"pool2"??

??pooling_param?{??

????pool:?MAX??

????kernel_size:?2??

????stride:?2??

??}??

}??

layer?{??

??name:?"ip1"??

??type:?"InnerProduct"??

??bottom:?"pool2"??

??top:?"ip1"??

??param?{??

????lr_mult:?1??

??}??

??param?{??

????lr_mult:?2??

??}??

??inner_product_param?{??

????num_output:?500??

????weight_filler?{??

??????type:?"xavier"??

????}??

????bias_filler?{??

??????type:?"constant"??

????}??

??}??

}??

layer?{??

??name:?"relu1"??

??type:?"ReLU"??

??bottom:?"ip1"??

??top:?"ip1"??

}??

layer?{??

??name:?"ip2"??

??type:?"InnerProduct"??

??bottom:?"ip1"??

??top:?"ip2"??

??param?{??

????lr_mult:?1??

??}??

??param?{??

????lr_mult:?2??

??}??

??inner_product_param?{??

????num_output:?10??

????weight_filler?{??

??????type:?"xavier"??

????}??

????bias_filler?{??

??????type:?"constant"??

????}??

??}??

}??

layer?{??

??name:?"accuracy"??

??type:?"Accuracy"??

??bottom:?"ip2"??

??bottom:?"label"??

??top:?"accuracy"??

??include?{??

????phase:?TEST??

??}??

}??

layer?{??

??name:?"loss"??

??type:?"SoftmaxWithLoss"??

??bottom:?"ip2"??

??bottom:?"label"??

??top:?"loss"??

}??

上面的網(wǎng)絡(luò)結(jié)構(gòu)，定義的data層，就是定義我們輸入的訓(xùn)練數(shù)據(jù)的路徑、圖片變換等。

3、網(wǎng)絡(luò)求解文件，這個文件我們喜歡把它取名為：solver.prototxt，這個文件的后綴格式也是.prototxt。這個文件主要包含了一些求解網(wǎng)絡(luò)，梯度下降參數(shù)、迭代次數(shù)等參數(shù)……，看下手寫字體的solver.prototxt文件：

[cpp]?view plaincopy

<span?style="font-size:18px;">net:?"examples/mnist/lenet_train_test.prototxt"??//定義網(wǎng)絡(luò)結(jié)構(gòu)文件，也就是我們上一步編寫的文件??

test_iter:?100???

test_interval:?500?//每隔500次用測試數(shù)據(jù)，做一次驗證??

base_lr:?0.01?????//學(xué)習(xí)率??

momentum:?0.9???//動量參數(shù)??

weight_decay:?0.0005???//權(quán)重衰減系數(shù)??

lr_policy:?"inv"???//梯度下降的相關(guān)優(yōu)化策略??

gamma:?0.0001??

power:?0.75??

display:?100??

max_iter:?10000???//最大迭代次數(shù)??

snapshot:?5000????//每迭代5000次，保存一次結(jié)果??

snapshot_prefix:?"examples/mnist/lenet"?//保存結(jié)果路徑??

solver_mode:?GPU???//訓(xùn)練硬件設(shè)備選擇GPU還是CPU??

這個文件的輸入就是我們前面一步定義的網(wǎng)絡(luò)結(jié)構(gòu)。

4、編寫網(wǎng)絡(luò)求解文件后，我們可以說已經(jīng)完成了CNN網(wǎng)絡(luò)的編寫。接著我們需要把這個文件，作為caffe的輸入?yún)?shù)，調(diào)用caffe可執(zhí)行文件，進(jìn)行訓(xùn)練就可以了。具體的命令如下：

[cpp]?view plaincopy

<span?style="font-size:18px;">./build/tools/caffe?train?--solver=examples/mnist/lenet_solver.prototxt??

這樣就完事了，程序就開始訓(xùn)練了。上面的第一個參數(shù)caffe，就是我們在編譯caffe，生成的可執(zhí)行文件：

然后solver就是我們在步驟3編寫的solver文件了，只要在ubuntu終端輸入上面的命令，就可以開始訓(xùn)練了。

回想一下文件調(diào)用過程：首先caffe可執(zhí)行文件，調(diào)用了solver.prototxt文件，而這個文件又調(diào)用了網(wǎng)絡(luò)結(jié)構(gòu)文件lenet_train_test.prototxt，然后lenet_train_test.prototxt文件里面又會調(diào)用輸入的訓(xùn)練圖片數(shù)據(jù)等。因此我們?nèi)绻?xùn)練自己的模型，需要備好3個文件：數(shù)據(jù)文件lmdb(該文件包含尋數(shù)據(jù))、網(wǎng)絡(luò)結(jié)構(gòu)lenet_train_test.prototxt、求解文件solver.prototxt，這幾個文件名隨便，但是文件后綴格式不要隨便亂改。把這三個文件放在同一個目錄下，然后在終端輸入命令，調(diào)用caffe就可以開始訓(xùn)練了。

二、相關(guān)細(xì)節(jié)

1、lmdb數(shù)據(jù)格式生成

caffe輸入訓(xùn)練圖片數(shù)據(jù)我比較喜歡用lmdb格式，好像還有另外一種格式leveldb，這個具體沒用過，這里主要講解lmdb格式數(shù)據(jù)的制作。其實在caffe-》example-》imagenet文件夾下面的一些腳本文件可以幫助我們快速生產(chǎn)相關(guān)的caffe所需的數(shù)據(jù)。

create_imagenet.sh這個文件可以幫我們快速的生成lmdb的數(shù)據(jù)格式文件，因此我們只需要把這個腳本文件復(fù)制出來，稍作修改，就可以對我們的訓(xùn)練圖片、標(biāo)注文件進(jìn)行打包為lmdb格式文件了。制作圖片的腳本文件如下：

[python]?view plaincopy

<span?style="font-size:18px;">#!/usr/bin/env?sh??

#?Create?the?imagenet?lmdb?inputs??

#?N.B.?set?the?path?to?the?imagenet?train?+?val?data?dirs??

EXAMPLE=.??????????#?生成模型訓(xùn)練數(shù)據(jù)文化夾??

TOOLS=../../build/tools??????????????????????????????#?caffe的工具庫，不用變??

DATA=.??????????????????#?python腳步處理后數(shù)據(jù)路徑??

TRAIN_DATA_ROOT=train/??#待處理的訓(xùn)練數(shù)據(jù)圖片路徑??

VAL_DATA_ROOT=val/??????#?帶處理的驗證數(shù)據(jù)圖片路徑??

#?Set?RESIZE=true?to?resize?the?images?to?256x256.?Leave?as?false?if?images?have??

#?already?been?resized?using?another?tool.??

RESIZE=true???#圖片縮放??

if?$RESIZE;?then??

??RESIZE_HEIGHT=256??

??RESIZE_WIDTH=256??

else??

??RESIZE_HEIGHT=0??

??RESIZE_WIDTH=0??

fi??

if?[?!?-d?"$TRAIN_DATA_ROOT"?];?then??

??echo?"Error:?TRAIN_DATA_ROOT?is?not?a?path?to?a?directory:?$TRAIN_DATA_ROOT"??

??echo?"Set?the?TRAIN_DATA_ROOT?variable?in?create_imagenet.sh?to?the?path"?\??

???????"where?the?ImageNet?training?data?is?stored."??

??exit?1??

fi??

if?[?!?-d?"$VAL_DATA_ROOT"?];?then??

??echo?"Error:?VAL_DATA_ROOT?is?not?a?path?to?a?directory:?$VAL_DATA_ROOT"??

??echo?"Set?the?VAL_DATA_ROOT?variable?in?create_imagenet.sh?to?the?path"?\??

???????"where?the?ImageNet?validation?data?is?stored."??

??exit?1??

fi??

echo?"Creating?train?lmdb..."??

GLOG_logtostderr=1?$TOOLS/convert_imageset?\??

????--resize_height=$RESIZE_HEIGHT?\??

????--resize_width=$RESIZE_WIDTH?\??

????--shuffle?\??

????$TRAIN_DATA_ROOT?\??

????$DATA/train.txt?\?????#標(biāo)簽訓(xùn)練數(shù)據(jù)文件??

????$EXAMPLE/train_lmdb??

echo?"Creating?val?lmdb..."??

GLOG_logtostderr=1?$TOOLS/convert_imageset?\??

????--resize_height=$RESIZE_HEIGHT?\??

????--resize_width=$RESIZE_WIDTH?\??

????--shuffle?\??

????$VAL_DATA_ROOT?\??

????$DATA/val.txt?\????#驗證集標(biāo)簽數(shù)據(jù)??

????$EXAMPLE/val_lmdb??

echo?"Done."??

同時我們需要制作如下四個文件：

1、文件夾train，用于存放訓(xùn)練圖片

2、文件夾val，用于存放驗證圖片

3、文件train.txt，里面包含這每張圖片的名稱，及其對應(yīng)的標(biāo)簽。

[python]?view plaincopy

<span?style="font-size:18px;">first_batch/train_female/992.jpg????1??

first_batch/train_female/993.jpg????1??

first_batch/train_female/994.jpg????1??

first_batch/train_female/995.jpg????1??

first_batch/train_female/996.jpg????1??

first_batch/train_female/997.jpg????1??

first_batch/train_female/998.jpg????1??

first_batch/train_female/999.jpg????1??

first_batch/train_male/1000.jpg?0??

first_batch/train_male/1001.jpg?0??

first_batch/train_male/1002.jpg?0??

first_batch/train_male/1003.jpg?0??

first_batch/train_male/1004.jpg?0??

first_batch/train_male/1005.jpg?0??

first_batch/train_male/1006.jpg?0??

first_batch/train_male/1007.jpg?0??

first_batch/train_male/1008.jpg?0??

上面的標(biāo)簽編號:1，表示女。標(biāo)簽：0，表示男。

4、文件val.txt，同樣這個文件也是保存圖片名稱及其對應(yīng)的標(biāo)簽。

這四個文件在上面的腳本文件中，都需要調(diào)用到。制作玩后，跑一下上面的腳本文件，就ok了，跑完后，即將生成下面兩個文件夾：

文件夾下面有兩個對應(yīng)的文件：

制作完后，要看看文件的大小，有沒有問題，如果就幾k，那么正常是每做好訓(xùn)練數(shù)據(jù)，除非你的訓(xùn)練圖片就幾張。

二、訓(xùn)練

1、直接訓(xùn)練法

[python]?view plaincopy

<span?style="font-size:18px;">#!/usr/bin/env?sh??

TOOLS=../cafferead/build/tools??

$TOOLS/caffe?train?--solver=gender_solver.prorotxt??-gpu?all??#加入?-gpu?選項??

-gpu 可以選擇gpu的id號，如果是 -gpu all表示啟用所有的GPU進(jìn)行訓(xùn)練。

2、采用funing-tuning 訓(xùn)練法

[python]?view plaincopy

<span?style="font-size:18px;">$TOOLS/caffe?train?--solver=gender_solver.prorotxt?-weights?gender_net.caffemodel?#加入-weights??

加入-weights，這個功能很好用，也經(jīng)常會用到，因為現(xiàn)在的CNN相關(guān)的文獻(xiàn)，很多都是在已有的模型基礎(chǔ)上，進(jìn)行fine-tuning，因為我們大部分人都缺少訓(xùn)練數(shù)據(jù)，不像谷歌、百度這些土豪公司，有很多人專門做數(shù)據(jù)標(biāo)注，對于小公司而言，往往缺少標(biāo)注好的訓(xùn)練數(shù)據(jù)。因此我們一般使用fine-tuning的方法，在少量數(shù)據(jù)的情況下，盡可能的提高精度。我們可以使用：-weights 選項，利用已有的模型訓(xùn)練好的參數(shù)，作為初始值，進(jìn)行繼續(xù)訓(xùn)練。

三、調(diào)用python接口

訓(xùn)練完畢后，我們就可以得到caffe的訓(xùn)練模型了，接著我們的目標(biāo)就預(yù)測，看看結(jié)果了。caffe為我們提供了方便調(diào)用的python接口函數(shù)，這些都在模塊pycaffe里面。因此我們還需要知道如何使用pycaffe，進(jìn)行測試，查看結(jié)果。下面是pycaffe的預(yù)測調(diào)用使用示例：

[python]?view plaincopy

#?coding=utf-8??

import?os??

import?numpy?as?np??

from?matplotlib?import?pyplot?as?plt??

import?cv2??

import?shutil??

import?time??

#因為RGB和BGR需要調(diào)換一下才能顯示??

def?showimage(im):??

????if?im.ndim?==?3:??

????????im?=?im[:,?:,?::-1]??

????plt.set_cmap('jet')??

????plt.imshow(im)??

????plt.show()??

#特征可視化顯示，padval用于調(diào)整亮度??

def?vis_square(data,?padsize=1,?padval=0):??

????data?-=?data.min()??

????data?/=?data.max()??

????#因為我們要把某一層的特征圖都顯示到一個figure上，因此需要計算每個圖片占用figure多少比例，以及繪制的位置??

????n?=?int(np.ceil(np.sqrt(data.shape[0])))??

????padding?=?((0,?n?**?2?-?data.shape[0]),?(0,?padsize),?(0,?padsize))?+?((0,?0),)?*?(data.ndim?-?3)??

????data?=?np.pad(data,?padding,?mode='constant',?constant_values=(padval,?padval))??

????#?tile?the?filters?into?an?image??

????data?=?data.reshape((n,?n)?+?data.shape[1:]).transpose((0,?2,?1,?3)?+?tuple(range(4,?data.ndim?+?1)))??

????data?=?data.reshape((n?*?data.shape[1],?n?*?data.shape[3])?+?data.shape[4:])??

????showimage(data)??

#設(shè)置caffe源碼所在的路徑??

caffe_root?=?'../../../caffe/'??

import?sys??

sys.path.insert(0,?caffe_root?+?'python')??

import?caffe??

#加載均值文件??

mean_filename='./imagenet_mean.binaryproto'??

proto_data?=?open(mean_filename,?"rb").read()??

a?=?caffe.io.caffe_pb2.BlobProto.FromString(proto_data)??

mean??=?caffe.io.blobproto_to_array(a)[0]??

#創(chuàng)建網(wǎng)絡(luò)，并加載已經(jīng)訓(xùn)練好的模型文件??

gender_net_pretrained='./caffenet_train_iter_1500.caffemodel'??

gender_net_model_file='./deploy_gender.prototxt'??

gender_net?=?caffe.Classifier(gender_net_model_file,?gender_net_pretrained,mean=mean,??

???????????????????????channel_swap=(2,1,0),#RGB通道與BGR??

???????????????????????raw_scale=255,#把圖片歸一化到0~1之間??

???????????????????????image_dims=(256,?256))#設(shè)置輸入圖片的大小??

#預(yù)測分類及其可特征視化??

gender_list=['Male','Female']??

input_image?=?caffe.io.load_image('1.jpg')#讀取圖片??

prediction_gender=gender_net.predict([input_image])#預(yù)測圖片性別??

#打印我們訓(xùn)練每一層的參數(shù)形狀??

print?'params:'??

for?k,?v?in?gender_net.params.items():??

????print?'weight:'??

????print?(k,?v[0].data.shape)#在每一層的參數(shù)blob中，caffe用vector存儲了兩個blob變量，用v[0]表示weight??

????print?'b:'??

????print?(k,?v[1].data.shape)#用v[1]表示偏置參數(shù)??

#conv1濾波器可視化??

filters?=?gender_net.params['conv1'][0].data??

vis_square(filters.transpose(0,?2,?3,?1))??

#conv2濾波器可視化??

'''''filters?=?gender_net.params['conv2'][0].data?

vis_square(filters[:48].reshape(48**2,?5,?5))'''??

#特征圖??

print?'feature?maps:'??

for?k,?v?in?gender_net.blobs.items():??

????print?(k,?v.data.shape);??

????feat?=?gender_net.blobs[k].data[0,0:4]#顯示名字為k的網(wǎng)絡(luò)層,第一張圖片所生成的4張feature?maps??

????vis_square(feat,?padval=1)??

#顯示原圖片，以及分類預(yù)測結(jié)果??

str_gender=gender_list[prediction_gender[0].argmax()]??

print?str_gender??

plt.imshow(input_image)??

plt.title(str_gender)??

plt.show()??

上面的接口，同時包含了pycaffe加載訓(xùn)練好的模型，進(jìn)行預(yù)測及其特征可視化的調(diào)用方法。

總結(jié)

以上是生活随笔為你收集整理的caffe入门学习的全部內(nèi)容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯，歡迎將生活随笔推薦給好友。

入门
Caffe

上一篇： CNN应用之基于Overfeat的物体检
下一篇：微博收藏（机器学习代码与工具）（一）

日韩av黄I国产麻豆传媒I国产91av视频在线观看I日韩一区二区三区在线看I美女国产在线I麻豆视频国产在线观看I成人黄色短片

caffe入门学习

總結(jié)