當前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

机器学习中的向量

發布時間：2024/1/23 编程问答 45 豆豆

生活随笔收集整理的這篇文章主要介紹了机器学习中的向量小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

列向量

先說一個很重要的結論：機器學習中的向量是列向量。
另一個結論：用分號分隔不同的行，用逗號分隔同一行中的不同元素。

在線性代數中，列向量（Column vector）是一 $m \times 1$ 的矩陣，即矩陣由一個包含 $m$ 個元素的列組成。
書寫方式1：

$[x1x2?xm]\begin{bmatrix} x_1 \\ x_2 \\ \vdots\\ x_m \end{bmatrix}$

為簡化書寫、方便排版起見，有時會以加上轉置符號T的行向量表示列向量。
書寫方式2：
$X=[x_1,x_2,...,x_n]^T$

為進一步化簡，習慣上會把行向量和列向量都寫成行的形式。不過行向量的元素是用空格或逗號隔開，列向量則用分號隔開。
書寫方式3：

$[0?110]\begin{bmatrix} 0 & -1 \\ 1 & 0 \end{bmatrix}$

X=[x1; x2; x3; x4]
這種方式也可以用于矩陣的書寫。
兩行兩列的矩陣，可寫為

$A = [0, ? 1; 1, 0]$

注：有人使用()，而非[]。

機器學習中的向量

我們以最簡單的線性回歸為例：
$f(X)= w_1x_1+w_2x_2+w_3x_3+b$
我們令：
$W=[w1,w2,w3]TX=[x1,x2,x3]T\begin{aligned} W =& [w_1, w_2, w_3]^T \\ X =& [x_1, x_2, x_3]^T \end{aligned}$
則 $f(X) = W^T*X+b$

深度學習中的向量

我們以一個簡單大深度學習為例：
5個輸入節點—第一隱藏層3個節點----第二隱藏層4個節點----2個輸出節點。全連接。
輸入為(51)：
$X = [x1, x2, x3, x4, x5]^T$
第一隱層(35)：
$W1=[w11,w12,w13,w14,w15;w21,w22,w23,w24,w25;w31,w32,w33,w34,w35]B1=[b1,b2,b3]T\begin{aligned} W1&= [w11,w12,w13,w14,w15;w21,w22,w23,w24,w25;w31,w32,w33,w34,w35] \\ B1&=[b1,b2,b3]^T \end{aligned}$
第二隱層(43)：
$W2=[w11,w12,w13;w21,w22,w23;w31,w32,w33;w41,w42,w43]B2=[b1,b2,b3,b4]T\begin{aligned} W2&=[w11,w12,w13;w21,w22,w23;w31,w32,w33;w41,w42,w43] \\ B2&=[b1,b2,b3,b4]^T \end{aligned}$
輸出層節點(24)：
$W3=[w11,w12,w12,w14;w21,w22,w23,w24]B3=[b1,b2]T\begin{aligned} W3=&[w11,w12,w12,w14;w21,w22,w23,w24] \\ B3=&[b1,b2]^T \end{aligned}$

所以計算過程為（不考慮激活函數）：

$f 1 = W 1 ? X + B 1$ , 輸出維度為 $(3 ? 5) ? (5 ? 1) = 3 ? 1$

$f 2 = W 2 ? f 1 + B 2$ ，輸出維度為 $(4 ? 3) ? (3 ? 1) = 4 ? 1$

$f = W 3 ? f 2 + B 3$ , 輸出維度為 $(2 ? 4) ? (4 ? 1) = 2 ? 1$
最終輸出為[o1,o2]^T

總結：
每一層的W維度為：節點數量上一層的輸出數量
每一層的輸入維度為上一層的(輸出數量1)
B的維度為：節點數量1
每一層的輸出維度為：節點數量1

總結

以上是生活随笔為你收集整理的机器学习中的向量的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。