5.1 神经元模型
5.1 神經元模型
-
神經網絡(neural networks)方面的研究很早就已經出現,今天“神經網絡”已經是一個相當大的,多學科交叉的學科領域,各相關學科對神經網絡的定義多種多樣,本書采用目前使用最廣泛的一種,即“神經網絡是由具有適應性的簡單單元組成的廣發并行的互聯網絡,它的組織能夠模擬生物神經系統對真實物體所作出的交互式的反應”。我們在機器學習中談論神經網絡指的是“神經網絡學習”,或者是,是機器學習和神經網絡這兩個學科的交叉的部分
-
神經網絡中最基本的成分是“神經元”模型,即上述定義的簡單單元。在生物神經網絡中,每個神經元和其他的神經元相連,當他“興奮”的時候,就會向相連的神經元發送化學物質,從而改變這些神經元的電位。如果某種神經元的電位超過了一個閾值(threshold),那么他就會被激活。即“興奮”起來,向其他的神經元發送化學物質
-
1943年,McCulloch and Pitts將上述的情形抽象為圖5.1所示的簡單模型,這就是一直沿用至今的“M-P神經元模型”,在這個模型中,神經元接受來自n個其他神經元傳遞過來的輸入信號,這些輸入信號通過帶權重的連接(connection)進行傳遞,神經元接收到的總輸入值將和神經元的閾值進行比較,然后通過“激活函數”處理以產生神經元的輸出。
-
理想中德軍ihuo函數是圖5.2的階躍函數,它將對應的輸入值對應為0或者是1.顯然1對應神經元興奮,0對應于神經元抑制。然而階躍函數具有不連續,不光滑等不太友好的性質。因此實際上我們用Sigmoid作為激活函數,典型的Sigmoid函數如下圖所示。它可以將較大范圍變化的輸入值壓縮在(0,1)的輸出范圍之內。因此有時候也叫擠壓函數
-
將許多這樣的神經元按照一定的層次結構連接起來,就得到了神經網絡
-
事實上,從計算機科學的角度來看,我們可以先不考慮神經網絡是否真的模擬了生物神經網絡,只需要將一個神經網絡視作為包含了很多參數的數學模型,這個模型是若干個函數,例如yj = f(求和(wixi -誰他j))相互嵌套帶入而得,有效的為神經網絡學習算法大多以數學證明為支撐
-
例如10個神經網絡兩兩連接,則有100個參數;90個連接權和10個閾值
總結
- 上一篇: 7.7 阅读材料
- 下一篇: 5.2 感知机和多层网络