當(dāng)前位置：首頁(yè) > 前端技术 > javascript >内容正文

javascript

KL散度 JS散度熵

發(fā)布時(shí)間：2023/12/14 javascript 39 豆豆

生活随笔收集整理的這篇文章主要介紹了 KL散度 JS散度熵小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

KL散度 JS散度熵

1.自信息和熵
- 1.1 自信息self information
- 1.2 熵 entropy
2.KL散度 Kullback-Leibler divergence
- 2.1 定義
- 2.2 KL散度與熵、交叉熵之間的關(guān)系
- 2.3 python代碼實(shí)現(xiàn)
- - 2.3.1 定義兩個(gè)概率分布并可視化
  - 2.3.2 計(jì)算KL散度
  - - 2.3.2.1 自定義函數(shù)
    - 2.3.2.2 scipy自帶函數(shù)
3.JS散度 Jensen-Shannon divergence
- 3.1 定義
- 3.2 python代碼實(shí)現(xiàn)
4.交叉熵 cross-entropy
- 4.1 公式
- 4.2 python代碼實(shí)現(xiàn)
參考文獻(xiàn)

此blog可視為機(jī)器學(xué)習(xí)術(shù)語(yǔ)的部分內(nèi)容。

有些術(shù)語(yǔ)，耳熟能詳，但如果讓細(xì)致表述下，卻往往捉襟見(jiàn)肘，好似熟悉的陌生人，總結(jié)下時(shí)而溫故。

1.自信息和熵

1.1 自信息self information

自信息表示一個(gè)隨機(jī)事件包含的信息量，隨機(jī)事件發(fā)生概率越高，自信息越低；發(fā)生概率越低，自信息越高。

設(shè)一隨機(jī)變量X，事件x發(fā)生的概率為 $p (x)$ ，則自信息定義為：

$I(x)=?log?p(x)\qquad\qquad\qquad\qquad\qquad\qquad I(x)=-\log p(x)$ .

1.2 熵 entropy

熵是表示隨機(jī)變量不確定性的度量。

離散隨機(jī)變量X的概率分布為：

$P(X=xi)=pi,i=1,2,...,n\qquad\qquad\qquad P(X=x_i)=p_i,i=1,2,...,n$

其熵定義為：

$H(X)=?∑ipilog?pi\qquad\qquad\qquad H(X)=-\sum\limits_ip_i\log p_i$

可見(jiàn)熵只依賴于隨機(jī)變量的分布，與隨機(jī)變量的值無(wú)關(guān)，因此 $H (X)$ 也記作 $H (p)$ 。

若隨機(jī)變量X只有兩個(gè)取值，1和0，則X的分布為：

$P(X=1)=p,P(X=0)=1?p,p∈[0,1]\qquad\qquad\qquad P(X=1)=p, \ P(X=0)=1-p,p \in[0,1]$ ,此時(shí)熵為：

$H(X)=?plog?p?(1?p)log?(1?p)\qquad\qquad\qquad H(X)=-p\log p-(1-p)\log(1-p)$

該函數(shù)曲線如下圖所示：

可見(jiàn)當(dāng) $p = 0 或 1$ 時(shí)， $H (x)$ 均為0 ，即沒(méi)有不確定性。

$p = 0.5$ 時(shí)， $H (x) = 1$ ，取得最大值 ( $log?以2為底\log以2為底$ )。

2.KL散度 Kullback-Leibler divergence

2.1 定義

$KL(P∥Q)=∑xp(x)log?p(x)q(x)=?∑xp(x)log?q(x)p(x)\qquad\qquad KL(P \parallel Q) = \sum\limits_{x}p(x)\log\cfrac{p(x)}{q(x)}=- \sum\limits_{x}p(x)\log\cfrac{q(x)}{p(x)}$

其中 $p, q$ 是兩個(gè)概率分布，KL散度可用來(lái)衡量?jī)蓚€(gè)分布之間的差異。

KL散度滿足非負(fù)性，即 $\parallel Q)\ge0$ 。

當(dāng)這兩個(gè)分布完全一致時(shí)，KL散度值為0。

2.2 KL散度與熵、交叉熵之間的關(guān)系

$KL(P∥Q)=∑xp(x)log?p(x)q(x)=∑xp(x)log?p(x)?∑xp(x)log?q(x)=?H(P)+H(P,Q)\qquad\qquad KL(P \parallel Q) = \sum\limits_{x}p(x)\log\cfrac{p(x)}{q(x)}\\\qquad\qquad\qquad\quad\quad\quad\ =\sum\limits_{x}p(x)\log{p(x)}-\sum\limits_{x}p(x)\log{q(x)}\\\qquad\qquad\qquad\quad\quad\quad\ =-H(P)+H(P,Q)$

2.3 python代碼實(shí)現(xiàn)

代碼來(lái)自 https://machinelearningmastery.com/divergence-between-probability-distributions/。

2.3.1 定義兩個(gè)概率分布并可視化

import matplotlib.pyplot as plt import numpy as np events = ['red', 'green', 'blue'] p = [0.10, 0.40, 0.50] q = [0.80, 0.15, 0.05] plt.subplot(2,1,1) plt.bar(events, p) # plot second distribution plt.subplot(2,1,2) plt.bar(events, q) # show the plot plt.show()

2.3.2 計(jì)算KL散度

2.3.2.1 自定義函數(shù)

from math import log def kl_divergence(p, q):return sum(p[i] * log(p[i]/q[i]) for i in range(len(p)))# calculate (P || Q) kl_pq = kl_divergence(p, q) print('KL(P || Q): %.3f nats' % kl_pq) # calculate (Q || P) kl_qp = kl_divergence(q, p) print('KL(Q || P): %.3f nats' % kl_qp)#KL(P || Q): 1.336 nats #KL(Q || P): 1.401 nats

2.3.2.2 scipy自帶函數(shù)

from scipy.special import rel_entr kl_pq = rel_entr(p, q) print('KL(P || Q): %.3f nats' % sum(kl_pq)) # calculate (Q || P) kl_qp = rel_entr(q, p) print('KL(Q || P): %.3f nats' % sum(kl_qp))#KL(P || Q): 1.336 nats #KL(Q || P): 1.401 nats

可見(jiàn)scipy自帶KL散度函數(shù)中l(wèi)og是以10為底的。

3.JS散度 Jensen-Shannon divergence

JS散度也是一種衡量?jī)蓚€(gè)分布相似度的指標(biāo)。

3.1 定義

$JS(P∥Q)=12KL(P∥P+Q2)+12KL(Q∥P+Q2)\qquad\qquad JS(P \parallel Q) =\cfrac {1}{2}\ KL(P \parallel\cfrac {P+Q}{2})+\cfrac {1}{2}\ KL(Q \parallel\cfrac{P+Q}{2})$

從公式中可以看出，JS散度具有對(duì)稱性。

3.2 python代碼實(shí)現(xiàn)

使用與前例相同的概率分布：

# calculate the js divergence def js_divergence(p, q):m = 0.5 * (p + q)return 0.5 * kl_divergence(p, m) + 0.5 * kl_divergence(q, m)p = np.asarray(p) q = np.asarray(q)# calculate JS(P || Q) js_pq = js_divergence(p, q) print('JS(P || Q) divergence: %.3f nats' % js_pq)# calculate JS(Q || P) js_qp = js_divergence(q, p) print('JS(Q || P) divergence: %.3f nats' % js_qp)#JS(P || Q) divergence: 0.291 nats #JS(Q || P) divergence: 0.291 nats

結(jié)果表明JS散度具有對(duì)稱性。

scipy中實(shí)現(xiàn)的是jensen-shannon距離，即JS散度的平方根值。這里不再細(xì)述。

from scipy.spatial.distance import jensenshannon

4.交叉熵 cross-entropy

交叉熵是機(jī)器學(xué)習(xí)/深度學(xué)習(xí)中分類任務(wù)/語(yǔ)義分割中一種常用的損失函數(shù)。

4.1 公式

$H(P,Q)=?∑xp(x)log?q(x)\\\qquad\qquad H(P,Q)=-\sum\limits_{x}p(x)\log{q(x)}$

如KL散度一節(jié)介紹，
$H(P,Q)=H(P)+KL(P∥Q)\qquad\qquad H(P,Q)=H(P)+KL(P \parallel Q)$

4.2 python代碼實(shí)現(xiàn)

以下代碼引自https://machinelearningmastery.com/cross-entropy-for-machine-learning/。

使用與前例相同的概率分布：

# example of calculating cross entropy from math import log2# calculate cross entropy def cross_entropy(p, q):return -sum([p[i]*log2(q[i]) for i in range(len(p))])# define data p = [0.10, 0.40, 0.50] q = [0.80, 0.15, 0.05] # calculate cross entropy H(P, Q) ce_pq = cross_entropy(p, q) print('H(P, Q): %.3f bits' % ce_pq) # calculate cross entropy H(Q, P) ce_qp = cross_entropy(q, p) print('H(Q, P): %.3f bits' % ce_qp)#H(P, Q): 3.288 bits #H(Q, P): 2.906 bits

參考文獻(xiàn)

[1] 周志華，機(jī)器學(xué)習(xí)，附錄C.3 KL散度
[2] 李航，統(tǒng)計(jì)學(xué)習(xí)方法，5.2.2 信息增益及附錄E KL散度的定義和…
[3] 邱錫鵬，神經(jīng)網(wǎng)絡(luò)與深度學(xué)習(xí)，附錄E 信息論
[4] https://machinelearningmastery.com/divergence-between-probability-distributions/
[5] https://machinelearningmastery.com/cross-entropy-for-machine-learning/
[6] https://d2l.ai/chapter_appendix-mathematics-for-deep-learning/information-theory.html#cross-entropy

總結(jié)

以上是生活随笔為你收集整理的KL散度 JS散度熵的全部?jī)?nèi)容，希望文章能夠幫你解決所遇到的問(wèn)題。

如果覺(jué)得生活随笔網(wǎng)站內(nèi)容還不錯(cuò)，歡迎將生活随笔推薦給好友。

上一篇：计算机考试外贸出货单,史上最全订单跟进英
下一篇：如何理解熵、交叉熵、KL散度、JS散度

javascript

KL散度 JS散度 熵

KL散度 JS散度 熵

1.自信息和熵

1.1 自信息self information

1.2 熵 entropy

2.KL散度 Kullback-Leibler divergence

2.1 定義

2.2 KL散度與熵、交叉熵之間的關(guān)系

2.3 python代碼實(shí)現(xiàn)

2.3.1 定義兩個(gè)概率分布并可視化

2.3.2 計(jì)算KL散度

2.3.2.1 自定義函數(shù)

2.3.2.2 scipy自帶函數(shù)

3.JS散度 Jensen-Shannon divergence

3.1 定義

3.2 python代碼實(shí)現(xiàn)

4.交叉熵 cross-entropy

4.1 公式

4.2 python代碼實(shí)現(xiàn)

參考文獻(xiàn)

總結(jié)

KL散度 JS散度熵

KL散度 JS散度熵