當前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

CNN框架的搭建及各个参数的调节

發(fā)布時間：2023/11/30 编程问答 53 豆豆

生活随笔收集整理的這篇文章主要介紹了 CNN框架的搭建及各个参数的调节小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

本文代碼下載地址：我的github

本文主要講解將CNN應用于人臉識別的流程，程序基于Python+numpy+theano+PIL開發(fā)，采用類似LeNet5的CNN模型，應用于olivettifaces人臉數(shù)據(jù)庫，實現(xiàn)人臉識別的功能，模型的誤差降到了5%以下。本程序只是個人學習過程的一個toy implement，樣本很小，模型隨時都會過擬合。

但是，本文意在理清程序開發(fā)CNN模型的具體步驟，特別是針對圖像識別，從拿到圖像數(shù)據(jù)庫，到實現(xiàn)一個針對這個圖像數(shù)據(jù)庫的CNN模型，我覺得本文對這些流程的實現(xiàn)具有參考意義。

《本文目錄》

一、olivettifaces人臉數(shù)據(jù)庫介紹

二、CNN的基本“構(gòu)件”（LogisticRegression、HiddenLayer、LeNetConvPoolLayer）

三、組建CNN模型，設置優(yōu)化算法，應用于Olivetti Faces進行人臉識別

四、訓練結(jié)果以及參數(shù)設置的討論

五、利用訓練好的參數(shù)初始化模型

六、一些需要說明的

一、olivettifaces人臉數(shù)據(jù)庫介紹

Olivetti Faces是紐約大學的一個比較小的人臉庫，由40個人的400張圖片構(gòu)成，即每個人的人臉圖片為10張。每張圖片的灰度級為8位，每個像素的灰度大小位于0-255之間，每張圖片大小為64×64。如下圖，這個圖片大小是1190*942，一共有20*20張人臉，故每張人臉大小是（1190/20）*（942/20）即57*47=2679：

本文所用的訓練數(shù)據(jù)就是這張圖片，400個樣本，40個類別，乍一看樣本好像比較小，用CNN效果會好嗎？先別下結(jié)論，請往下看。

要運行CNN算法，這張圖片必須先轉(zhuǎn)化為數(shù)組（或者說矩陣），這個用到python的圖像庫PIL，幾行代碼就可以搞定，具體的方法我之前剛好寫過一篇文章，也是用這張圖，考慮到文章冗長，就不復制過來了，鏈接在此：《利用Python PIL、cPickle讀取和保存圖像數(shù)據(jù)庫》。

訓練機器學習算法，我們一般將原始數(shù)據(jù)分成訓練數(shù)據(jù)（training_set）、驗證數(shù)據(jù)(validation_set)、測試數(shù)據(jù)(testing_set)。本程序?qū)raining_set、validation_set、testing_set分別設置為320、40、40個樣本。它們的label為0～39，對應40個不同的人。這部分的代碼如下：

[python]?view plain?copy

"""?

加載圖像數(shù)據(jù)的函數(shù),dataset_path即圖像olivettifaces的路徑?

加載olivettifaces后，劃分為train_data,valid_data,test_data三個數(shù)據(jù)集?

函數(shù)返回train_data,valid_data,test_data以及對應的label?

"""??

def?load_data(dataset_path):??

????img?=?Image.open(dataset_path)??

????img_ndarray?=?numpy.asarray(img,?dtype='float64')/256??

????faces=numpy.empty((400,2679))??

????for?row?in?range(20):??

???????for?column?in?range(20):??

????????faces[row*20+column]=numpy.ndarray.flatten(img_ndarray?[row*57:(row+1)*57,column*47:(column+1)*47])??

????label=numpy.empty(400)??

????for?i?in?range(40):??

????label[i*10:i*10+10]=i??

????label=label.astype(numpy.int)??

????#分成訓練集、驗證集、測試集，大小如下??

????train_data=numpy.empty((320,2679))??

????train_label=numpy.empty(320)??

????valid_data=numpy.empty((40,2679))??

????valid_label=numpy.empty(40)??

????test_data=numpy.empty((40,2679))??

????test_label=numpy.empty(40)??

????for?i?in?range(40):??

????train_data[i*8:i*8+8]=faces[i*10:i*10+8]??

????train_label[i*8:i*8+8]=label[i*10:i*10+8]??

????valid_data[i]=faces[i*10+8]??

????valid_label[i]=label[i*10+8]??

????test_data[i]=faces[i*10+9]??

????test_label[i]=label[i*10+9]??

????#將數(shù)據(jù)集定義成shared類型，才能將數(shù)據(jù)復制進GPU，利用GPU加速程序。??

????def?shared_dataset(data_x,?data_y,?borrow=True):??

????????shared_x?=?theano.shared(numpy.asarray(data_x,??

???????????????????????????????????????????????dtype=theano.config.floatX),??

?????????????????????????????????borrow=borrow)??

????????shared_y?=?theano.shared(numpy.asarray(data_y,??

???????????????????????????????????????????????dtype=theano.config.floatX),??

?????????????????????????????????borrow=borrow)??

????????return?shared_x,?T.cast(shared_y,?'int32')??

????train_set_x,?train_set_y?=?shared_dataset(train_data,train_label)??

????valid_set_x,?valid_set_y?=?shared_dataset(valid_data,valid_label)??

????test_set_x,?test_set_y?=?shared_dataset(test_data,test_label)??

????rval?=?[(train_set_x,?train_set_y),?(valid_set_x,?valid_set_y),??

????????????(test_set_x,?test_set_y)]??

????return?rval??

二、CNN的基本“構(gòu)件”（LogisticRegression、HiddenLayer、LeNetConvPoolLayer）

卷積神經(jīng)網(wǎng)絡（CNN）的基本結(jié)構(gòu)就是輸入層、卷積層（conv）、子采樣層（pooling）、全連接層、輸出層（分類器）。 ?卷積層+子采樣層一般都會有若干個，本程序?qū)崿F(xiàn)的CNN模型參考LeNet5，有兩個“卷積+子采樣層”LeNetConvPoolLayer。全連接層相當于MLP（多層感知機）中的隱含層HiddenLayer。輸出層即分類器，一般采用softmax回歸（也有人直接叫邏輯回歸，其實就是多類別的logistics regression），本程序也直接用LogisticRegression表示。
總結(jié)起來，要組建CNN模型，必須先定義LeNetConvPoolLayer、HiddenLayer、LogisticRegression這三種layer，這一點在我上一篇文章介紹CNN算法時講得很詳細，包括代碼注解，因為太冗長，這里給出鏈接：《DeepLearning tutorial（4）CNN卷積神經(jīng)網(wǎng)絡原理簡介+代碼詳解》。

代碼太長，就不貼具體的了，只給出框架，具體可以下載我的代碼看看：

[python]?view plain?copy

#分類器，即CNN最后一層，采用邏輯回歸（softmax）??

class?LogisticRegression(object):??

????def?__init__(self,?input,?n_in,?n_out):??

????????self.W?=?....??

????????self.b?=?....??

????????self.p_y_given_x?=?...??

????????self.y_pred?=?...??

????????self.params?=?...??

????def?negative_log_likelihood(self,?y):??

????def?errors(self,?y):??

#全連接層，分類器前一層??

class?HiddenLayer(object):??

????def?__init__(self,?rng,?input,?n_in,?n_out,?W=None,?b=None,activation=T.tanh):??

????????self.input?=?input??

????????self.W?=?...??

????????self.b?=?...??

????????lin_output?=?...??

????????self.params?=?[self.W,?self.b]??

#卷積+采樣層（conv+maxpooling）??

class?LeNetConvPoolLayer(object):??

????def?__init__(self,?rng,?input,?filter_shape,?image_shape,?poolsize=(2,?2)):??

????????self.input?=?input??

????????self.W?=?...??

????????self.b?=?...??

????????#?卷積??

????????conv_out?=?...??

????????#?子采樣??

????????pooled_out?=...??

????????self.output?=?...??

????????self.params?=?[self.W,?self.b]??

三、組建CNN模型，設置優(yōu)化算法，應用于Olivetti Faces進行人臉識別

上面定義好了CNN的幾個基本“構(gòu)件”，現(xiàn)在我們使用這些構(gòu)件來組建CNN模型，本程序的CNN模型參考LeNet5，具體為：input+layer0(LeNetConvPoolLayer)+layer1(LeNetConvPoolLayer)+layer2(HiddenLayer)+layer3(LogisticRegression)

這是一個串聯(lián)結(jié)構(gòu)，代碼也很好寫，直接用第二部分定義好的各種layer去組建就行了，上一layer的輸出接下一layer的輸入，具體可以看看代碼evaluate_olivettifaces函數(shù)中的“建立CNN模型”部分。

CNN模型組建好了，就剩下用優(yōu)化算法求解了，優(yōu)化算法采用批量隨機梯度下降算法（MSGD），所以要先定義MSGD的一些要素，主要包括：代價函數(shù)，訓練、驗證、測試model、參數(shù)更新規(guī)則（即梯度下降）。這部分的代碼在evaluate_olivettifaces函數(shù)中的“定義優(yōu)化算法的一些基本要素”部分。

優(yōu)化算法的基本要素也定義好了，接下來就要運用人臉圖像數(shù)據(jù)集來訓練這個模型了，訓練過程有訓練步數(shù)（n_epoch）的設置，每個epoch會遍歷所有的訓練數(shù)據(jù)（training_set），本程序中也就是320個人臉圖。還有迭代次數(shù)iter，一次迭代遍歷一個batch里的所有樣本，具體為多少要看所設置的batch_size。關于參數(shù)的設定我在下面會討論。這一部分的代碼在evaluate_olivettifaces函數(shù)中的“訓練CNN階段”部分。

代碼很長，只貼框架，具體可以下載我的代碼看看：

[python]?view plain?copy

def?evaluate_olivettifaces(learning_rate=0.05,?n_epochs=200,??

????????????????????dataset='olivettifaces.gif',??

????????????????????nkerns=[5,?10],?batch_size=40):?????

????#隨機數(shù)生成器，用于初始化參數(shù)....??

????#加載數(shù)據(jù).....??

????#計算各數(shù)據(jù)集的batch個數(shù)....??

????#定義幾個變量，x代表人臉數(shù)據(jù)，作為layer0的輸入......??

????######################??

????#建立CNN模型:??

????#input+layer0(LeNetConvPoolLayer)+layer1(LeNetConvPoolLayer)+layer2(HiddenLayer)+layer3(LogisticRegression)??

????######################??

????...??

????....??

????......??

????#########################??

????#?定義優(yōu)化算法的一些基本要素：代價函數(shù)，訓練、驗證、測試model、參數(shù)更新規(guī)則（即梯度下降）??

????#########################??

????...??

????....??

????......??

????#########################??

????#?訓練CNN階段，尋找最優(yōu)的參數(shù)。??

????########################??

????...??

????.....??

????.......??

另外，值得一提的是，在訓練CNN階段，我們必須定時地保存模型的參數(shù)，這是在訓練機器學習算法時一個經(jīng)常會做的事情，這一部分的詳細介紹我之前寫過一篇文章《DeepLearning tutorial（2）機器學習算法在訓練過程中保存參數(shù)》。簡單來說，我們要保存CNN模型中l(wèi)ayer0、layer1、layer2、layer3的參數(shù)，所以在“訓練CNN階段”這部分下面，有一句代碼：

[python]?view plain?copy

save_params(layer0.params,layer1.params,layer2.params,layer3.params)??

這個函數(shù)具體定義為：

[python]?view plain?copy

#保存訓練參數(shù)的函數(shù)??

def?save_params(param1,param2,param3,param4):????

????????import?cPickle????

????????write_file?=?open('params.pkl',?'wb')?????

????????cPickle.dump(param1,?write_file,?-1)??

????????cPickle.dump(param2,?write_file,?-1)??

????????cPickle.dump(param3,?write_file,?-1)??

????????cPickle.dump(param4,?write_file,?-1)??

????????write_file.close()????

如果在其他算法中，你要保存的參數(shù)有五個六個甚至更多，那么改一下這個函數(shù)的參數(shù)就行啦。

四、訓練結(jié)果以及參數(shù)設置的討論

ok，上面基本介紹完了CNN模型的構(gòu)建，以及模型的訓練，我將它們的代碼都放在train_CNN_olivettifaces.py這個源文件中，將Olivetti Faces這張圖片跟這個代碼文件放在同個目錄下，運行這個文件，幾分鐘就可以訓練完模型，并且在同個目錄下得到一個params.pkl文件，這個文件保存的就是最后的模型的參數(shù)，方便你以后直接使用這個模型。
好了，現(xiàn)在討論一下怎么設置參數(shù)，具體來說，程序中可以設置的參數(shù)包括：學習速率learning_rate、batch_size、n_epochs、nkerns、poolsize。下面逐一討論調(diào)節(jié)它們時對模型的影響。

調(diào)節(jié)learning_rate

學習速率learning_rate就是運用SGD算法時梯度前面的系數(shù)，非常重要，設得太大的話算法可能永遠都優(yōu)化不了，設得太小會使算法優(yōu)化得太慢，而且可能還會掉入局部最優(yōu)。可以形象地將learning_rate比喻成走路時步子的大小，想象一下要從一個U形的山谷的一邊走到山谷最低點，如果步子特別大，像巨人那么大，那會直接從一邊跨到另一邊，然后又跨回這邊，如此往復。如果太小了，可能你走著走著就掉入了某些小坑，因為山路總是凹凸不平的（局部最優(yōu)），掉入這些小坑后，如果步子還是不變，就永遠走不出那個坑。
好，回到本文的模型，下面是我使用時的記錄，固定其他參數(shù)，調(diào)節(jié)learning_rate：（1）kerns=[20, 50], batch_size=40，poolsize=（2，2），learning_rate=0.1時，validation-error一直是97.5%，沒降下來，分析了一下，覺得應該是學習速率太大，跳過了最優(yōu)。

（2）nkerns=[20, 50], batch_size=40，poolsize=（2，2），learning_rate=0.01時，訓練到epoch 60多時，validation-error降到5%，test-error降到15%

（3）nkerns=[20, 50], batch_size=40，poolsize=（2，2），learning_rate=0.05時，訓練到epoch 36時，validation-error降到2.5%，test-error降到5%

注意，驗證集和測試集都只有40張圖片，也就是說只有一兩張識別錯了，還是不錯的，數(shù)據(jù)集再大點，誤差率可以降到更小。最后我將learning_rate設置為0.05。

PS：學習速率應該自適應地減小，是有專門的一些算法的，本程序沒有實現(xiàn)這個功能，有時間再研究一下。

調(diào)節(jié)batch_size

因為我們采用minibatch SGD算法來優(yōu)化，所以是一個batch一個batch地將數(shù)據(jù)輸入CNN模型中，然后計算這個batch的所有樣本的平均損失，即代價函數(shù)是所有樣本的平均。而batch_size就是一個batch的所包含的樣本數(shù)，顯然batch_size將影響到模型的優(yōu)化程度和速度。

回到本文的模型，首先因為我們train_dataset是320，valid_dataset和test_dataset都是40，所以batch_size最好都是40的因子，也就是能讓40整除，比如40、20、10、5、2、1，否則會浪費一些樣本，比如設置為30，則320/30=10，余數(shù)時20，這20個樣本是沒被利用的。并且，如果batch_size設置為30，則得出的validation-error和test-error只是30個樣本的錯誤率，并不是全部40個樣本的錯誤率。這是設置batch_size要注意的。特別是樣本比較少的時候。

下面是我實驗時的記錄，固定其他參數(shù)，改變batch_size:
batch_size=1、2、5、10、20時，validation-error一直是97.5%，沒降下來。我覺得可能是樣本類別覆蓋率過小，因為我們的數(shù)據(jù)是按類別排的，每個類別10個樣本是連續(xù)排在一起的，batch_size等于20時其實只包含了兩個類別，這樣優(yōu)化會很慢。

因此最后我將batch_size設為40，也就是valid_dataset和test_dataset的大小了，沒辦法，原始數(shù)據(jù)集樣本太少了。一般我們都不會讓batch_size達到valid_dataset和test_dataset的大小的。

關于n_epochs

n_epochs也就是最大的訓練步數(shù)，比如設為200，那訓練過程最多遍歷你的數(shù)據(jù)集200遍，當遍歷了200遍你的dataset時，程序會停止。n_epochs就相當于一個停止程序的控制參數(shù)，并不會影響CNN模型的優(yōu)化程度和速度，只是一個控制程序結(jié)束的參數(shù)。

nkerns=[20, 50]

20表示第一個卷積層的卷積核的個數(shù)，50表示第二個卷積層的卷積核的個數(shù)。這個我也是瞎調(diào)的，暫時沒什么經(jīng)驗可以總結(jié)。
不過從理論上來說，卷積核的個數(shù)其實就代表了特征的個數(shù)，你提取的特征越多，可能最后分類就越準。但是，特征太多（卷積核太多），會增加參數(shù)的規(guī)模，加大了計算復雜度，而且有時候卷積核也不是越多越好，應根據(jù)具體的應用對象來確定。所以我覺得，CNN雖號稱自動提取特征，免去復雜的特征工程，但是很多參數(shù)比如這里的nkerns還是需要去調(diào)節(jié)的，還是需要一些“人工”的。

下面是我的實驗記錄，固定batch_size=40，learning_rate=0.05，poolsize=（2，2）：

（1）nkerns=[20, 50]時，訓練到epoch 36時，validation-error降到2.5%，test-error降到5%

（2）nkerns=[10, 30]時，訓練到epoch 46時，validation-error降到5%，test-error降到5%

（3）nkerns=[5, 10]時，訓練到epoch 38時，validation-error降到5%，test-error降到7.5%

poolsize=(2, 2)

poolzize在本程序中是設置為(2,2)，即從一個2*2的區(qū)域里maxpooling出1個像素，說白了就算4和像素保留成1個像素。本例程中人臉圖像大小是57*47，對這種小圖像來說，(2,2)時比較合理的。如果你用的圖像比較大，可以把poolsize設的大一點。

+++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++分割線+++++++++++++++++++++++++++++++++++++++++++

上面部分介紹完了CNN模型構(gòu)建以及模型訓練的過程，代碼都在train_CNN_olivettifaces.py里面，訓練完可以得到一個params.pkl文件，這個文件保存的就是最后的模型的參數(shù)，方便你以后直接使用這個模型。以后只需利用這些保存下來的參數(shù)來初始化CNN模型，就得到一個可以使用的CNN系統(tǒng)，將人臉圖輸入這個CNN系統(tǒng)，預測人臉圖的類別。

接下來就介紹怎么使用訓練好的參數(shù)的方法，這部分的代碼放在use_CNN_olivettifaces.py文件中。

五、利用訓練好的參數(shù)初始化模型

在train_CNN_olivettifaces.py中的LeNetConvPoolLayer、HiddenLayer、LogisticRegression是用隨機數(shù)生成器去隨機初始化的，我們將它們定義為可以用參數(shù)來初始化的版本，其實很簡單，代碼只需要做稍微的改動，只需要在LogisticRegression、HiddenLayer、LeNetConvPoolLayer這三個class的__init__()函數(shù)中加兩個參數(shù)params_W,params_b，然后將params_W,params_b賦值給這三個class里的W和b：

[python]?view plain?copy

self.W?=?params_W??

self.b?=?params_b??

params_W,params_b就是從params.pkl文件中讀取來的，讀取的函數(shù)：
[python]?view plain?copy

#讀取之前保存的訓練參數(shù)??

#layer0_params~layer3_params都是包含W和b的,layer*_params[0]是W，layer*_params[1]是b??

def?load_params(params_file):??

????f=open(params_file,'rb')??

????layer0_params=cPickle.load(f)??

????layer1_params=cPickle.load(f)??

????layer2_params=cPickle.load(f)??

????layer3_params=cPickle.load(f)??

????f.close()??

????return?layer0_params,layer1_params,layer2_params,layer3_params??

ok，可以用參數(shù)初始化的CNN定義好了，那現(xiàn)在就將需要測試的人臉圖輸入該CNN，測試其類別。同樣的，需要寫一個讀圖像的函數(shù)load_data()，代碼就不貼了。將圖像數(shù)據(jù)輸入，CNN的輸出便是該圖像的類別，這一部分的代碼在use_CNN()函數(shù)中，代碼很容易看懂。
這一部分還涉及到theano.function的使用，我把一些筆記記在了use_CNN_olivettifaces.py代碼的最后，因為跟代碼相關，結(jié)合代碼來看會比較好，所以下面就不講這部分，有興趣的看看代碼。
最后說說測試的結(jié)果，我仍然以整副olivettifaces.gif作為輸入，得出其類別后，跟真正的label對比，程序輸出被錯分的那些圖像，運行結(jié)果如下：

錯了五張，我標了三張：

六、一些需要說明的

首先是本文的嚴謹性：在文章開頭我就說這只是一個toy implement，400張圖片根本不適合用DL來做。當然我寫這篇文章，只是為了總結(jié)一下這個實現(xiàn)流程，這一點希望對讀者也有參考意義。
最后，我的代碼都放在這里：github地址，可以下載

@author：wepon

@blog：http://blog.csdn.net/u012162613/article/details/43277187

本文代碼下載地址：我的github

《本文目錄》

一、olivettifaces人臉數(shù)據(jù)庫介紹

二、CNN的基本“構(gòu)件”（LogisticRegression、HiddenLayer、LeNetConvPoolLayer）

三、組建CNN模型，設置優(yōu)化算法，應用于Olivetti Faces進行人臉識別

四、訓練結(jié)果以及參數(shù)設置的討論

五、利用訓練好的參數(shù)初始化模型

六、一些需要說明的

一、olivettifaces人臉數(shù)據(jù)庫介紹

本文所用的訓練數(shù)據(jù)就是這張圖片，400個樣本，40個類別，乍一看樣本好像比較小，用CNN效果會好嗎？先別下結(jié)論，請往下看。

[python]?view plain?copy

"""?

加載圖像數(shù)據(jù)的函數(shù),dataset_path即圖像olivettifaces的路徑?

加載olivettifaces后，劃分為train_data,valid_data,test_data三個數(shù)據(jù)集?

函數(shù)返回train_data,valid_data,test_data以及對應的label?

"""??

def?load_data(dataset_path):??

????img?=?Image.open(dataset_path)??

????img_ndarray?=?numpy.asarray(img,?dtype='float64')/256??

????faces=numpy.empty((400,2679))??

????for?row?in?range(20):??

???????for?column?in?range(20):??

????????faces[row*20+column]=numpy.ndarray.flatten(img_ndarray?[row*57:(row+1)*57,column*47:(column+1)*47])??

????label=numpy.empty(400)??

????for?i?in?range(40):??

????label[i*10:i*10+10]=i??

????label=label.astype(numpy.int)??

????#分成訓練集、驗證集、測試集，大小如下??

????train_data=numpy.empty((320,2679))??

????train_label=numpy.empty(320)??

????valid_data=numpy.empty((40,2679))??

????valid_label=numpy.empty(40)??

????test_data=numpy.empty((40,2679))??

????test_label=numpy.empty(40)??

????for?i?in?range(40):??

????train_data[i*8:i*8+8]=faces[i*10:i*10+8]??

????train_label[i*8:i*8+8]=label[i*10:i*10+8]??

????valid_data[i]=faces[i*10+8]??

????valid_label[i]=label[i*10+8]??

????test_data[i]=faces[i*10+9]??

????test_label[i]=label[i*10+9]??

????#將數(shù)據(jù)集定義成shared類型，才能將數(shù)據(jù)復制進GPU，利用GPU加速程序。??

????def?shared_dataset(data_x,?data_y,?borrow=True):??

????????shared_x?=?theano.shared(numpy.asarray(data_x,??

???????????????????????????????????????????????dtype=theano.config.floatX),??

?????????????????????????????????borrow=borrow)??

????????shared_y?=?theano.shared(numpy.asarray(data_y,??

???????????????????????????????????????????????dtype=theano.config.floatX),??

?????????????????????????????????borrow=borrow)??

????????return?shared_x,?T.cast(shared_y,?'int32')??

????train_set_x,?train_set_y?=?shared_dataset(train_data,train_label)??

????valid_set_x,?valid_set_y?=?shared_dataset(valid_data,valid_label)??

????test_set_x,?test_set_y?=?shared_dataset(test_data,test_label)??

????rval?=?[(train_set_x,?train_set_y),?(valid_set_x,?valid_set_y),??

????????????(test_set_x,?test_set_y)]??

????return?rval??

二、CNN的基本“構(gòu)件”（LogisticRegression、HiddenLayer、LeNetConvPoolLayer）

代碼太長，就不貼具體的了，只給出框架，具體可以下載我的代碼看看：

[python]?view plain?copy

#分類器，即CNN最后一層，采用邏輯回歸（softmax）??

class?LogisticRegression(object):??

????def?__init__(self,?input,?n_in,?n_out):??

????????self.W?=?....??

????????self.b?=?....??

????????self.p_y_given_x?=?...??

????????self.y_pred?=?...??

????????self.params?=?...??

????def?negative_log_likelihood(self,?y):??

????def?errors(self,?y):??

#全連接層，分類器前一層??

class?HiddenLayer(object):??

????def?__init__(self,?rng,?input,?n_in,?n_out,?W=None,?b=None,activation=T.tanh):??

????????self.input?=?input??

????????self.W?=?...??

????????self.b?=?...??

????????lin_output?=?...??

????????self.params?=?[self.W,?self.b]??

#卷積+采樣層（conv+maxpooling）??

class?LeNetConvPoolLayer(object):??

????def?__init__(self,?rng,?input,?filter_shape,?image_shape,?poolsize=(2,?2)):??

????????self.input?=?input??

????????self.W?=?...??

????????self.b?=?...??

????????#?卷積??

????????conv_out?=?...??

????????#?子采樣??

????????pooled_out?=...??

????????self.output?=?...??

????????self.params?=?[self.W,?self.b]??

三、組建CNN模型，設置優(yōu)化算法，應用于Olivetti Faces進行人臉識別

代碼很長，只貼框架，具體可以下載我的代碼看看：

[python]?view plain?copy

def?evaluate_olivettifaces(learning_rate=0.05,?n_epochs=200,??

????????????????????dataset='olivettifaces.gif',??

????????????????????nkerns=[5,?10],?batch_size=40):?????

????#隨機數(shù)生成器，用于初始化參數(shù)....??

????#加載數(shù)據(jù).....??

????#計算各數(shù)據(jù)集的batch個數(shù)....??

????#定義幾個變量，x代表人臉數(shù)據(jù)，作為layer0的輸入......??

????######################??

????#建立CNN模型:??

????#input+layer0(LeNetConvPoolLayer)+layer1(LeNetConvPoolLayer)+layer2(HiddenLayer)+layer3(LogisticRegression)??

????######################??

????...??

????....??

????......??

????#########################??

????#?定義優(yōu)化算法的一些基本要素：代價函數(shù)，訓練、驗證、測試model、參數(shù)更新規(guī)則（即梯度下降）??

????#########################??

????...??

????....??

????......??

????#########################??

????#?訓練CNN階段，尋找最優(yōu)的參數(shù)。??

????########################??

????...??

????.....??

????.......??

[python]?view plain?copy

save_params(layer0.params,layer1.params,layer2.params,layer3.params)??

這個函數(shù)具體定義為：

[python]?view plain?copy

#保存訓練參數(shù)的函數(shù)??

def?save_params(param1,param2,param3,param4):????

????????import?cPickle????

????????write_file?=?open('params.pkl',?'wb')?????

????????cPickle.dump(param1,?write_file,?-1)??

????????cPickle.dump(param2,?write_file,?-1)??

????????cPickle.dump(param3,?write_file,?-1)??

????????cPickle.dump(param4,?write_file,?-1)??

????????write_file.close()????

如果在其他算法中，你要保存的參數(shù)有五個六個甚至更多，那么改一下這個函數(shù)的參數(shù)就行啦。

四、訓練結(jié)果以及參數(shù)設置的討論

調(diào)節(jié)learning_rate

調(diào)節(jié)batch_size

關于n_epochs

nkerns=[20, 50]

poolsize=(2, 2)

接下來就介紹怎么使用訓練好的參數(shù)的方法，這部分的代碼放在use_CNN_olivettifaces.py文件中。

五、利用訓練好的參數(shù)初始化模型

self.W?=?params_W??

self.b?=?params_b??

params_W,params_b就是從params.pkl文件中讀取來的，讀取的函數(shù)：
[python]?view plain?copy

#讀取之前保存的訓練參數(shù)??

#layer0_params~layer3_params都是包含W和b的,layer*_params[0]是W，layer*_params[1]是b??

def?load_params(params_file):??

????f=open(params_file,'rb')??

????layer0_params=cPickle.load(f)??

????layer1_params=cPickle.load(f)??

????layer2_params=cPickle.load(f)??

????layer3_params=cPickle.load(f)??

????f.close()??

????return?layer0_params,layer1_params,layer2_params,layer3_params??

六、一些需要說明的

總結(jié)

以上是生活随笔為你收集整理的CNN框架的搭建及各个参数的调节的全部內(nèi)容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯，歡迎將生活随笔推薦給好友。

上一篇： skimage库需要依赖 numpy+m
下一篇：训练一个神经网络能让她认得我