日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

香农辅助定理、KL散度和Jensen不等式

發布時間:2024/8/1 编程问答 32 豆豆
生活随笔 收集整理的這篇文章主要介紹了 香农辅助定理、KL散度和Jensen不等式 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

香農輔助定理、KL散度和Jensen不等式

  • 香農輔助定理
  • KL散度
  • 琴生(Jensen)不等式

香農輔助定理

對于任意兩個信息數相同的信源XXXYYY。有
?∑i=1Np(xi)log?2p(xi)≤?∑i=1Np(xi)log?2p(yi)-\sum_{i=1}^N p(x_i)\log_2p(x_i) \leq -\sum_{i=1}^N p(x_i)\log_2p(y_i) ?i=1N?p(xi?)log2?p(xi?)?i=1N?p(xi?)log2?p(yi?)
其中∑i=1Np(xi)=∑i+1Np(yi)=1\sum_{i=1}^N p(x_i)=\sum_{i+1}^N p(y_i)=1i=1N?p(xi?)=i+1N?p(yi?)=1

通俗的來說,任一概率分布對其他概率分布的自信息量取數學期望,必大于等于本身的熵,當且僅當XXXYYY的概率分布完全相同時取等號。不等式的左邊是XXX的信源熵,即無損壓縮條件下的最短平均編碼長度。不等式的右側,以信源YYY的概率分布p(y)p(y)p(y)得到的最優編碼,來為概率分布為p(x)p(x)p(x)的信源XXX的字符進行編碼而計算得的平均碼長。

KL散度

KL散度又稱為相對熵,是用來體現兩個概率分布之間差別的非對稱性度量,即KL(P∣∣Q)≠KL(Q∣∣P)KL(P||Q)\neq KL(Q||P)KL(PQ)?=KL(QP)。相對熵可以作為一些優化算法的損失函數來度量模型概率分布和真實分布之間的差距。
P(x)P(x)P(x)Q(x)Q(x)Q(x)是隨機變量XXX上的兩個概率分布,則在離散和連續的情況下,KL散度的定義為:
KL(P∣∣Q)=∑P(x)ln?P(x)Q(x)KL(P∣∣Q)=∫P(x)ln?P(x)Q(x)dxKL(P||Q)=\sum P(x) \ln \frac{P(x)}{Q(x)}\\ KL(P||Q)=\int P(x)\ln\frac{P(x)}{Q(x)}dx KL(PQ)=P(x)lnQ(x)P(x)?KL(PQ)=P(x)lnQ(x)P(x)?dx
值得注意的是,香農輔助定理稍加變形就成為了KL散度的形式:
?∑i=1Np(xi)log?2p(xi)≤?∑i=1Np(xi)log?2p(yi)∑i=1Np(xi)log?2p(xi)p(yi)≥01ln?2×∑i=1Np(xi)ln?p(xi)p(yi)≥0∑i=1Np(xi)ln?p(xi)p(yi)≥0-\sum_{i=1}^{N} p(x_i)\log_2p(x_i) \leq -\sum_{i=1}^N p(x_i)\log_2p(y_i) \\ \sum_{i=1}^Np(x_i)\log_2\frac{p(x_i)}{p(y_i)} \geq 0\\ \frac{1}{\ln2} \times \sum_{i=1}^Np(x_i)\ln\frac{p(x_i)}{p(y_i)}\geq 0\\ \sum_{i=1}^Np(x_i)\ln\frac{p(x_i)}{p(y_i)}\geq 0 ?i=1N?p(xi?)log2?p(xi?)?i=1N?p(xi?)log2?p(yi?)i=1N?p(xi?)log2?p(yi?)p(xi?)?0ln21?×i=1N?p(xi?)lnp(yi?)p(xi?)?0i=1N?p(xi?)lnp(yi?)p(xi?)?0
所以,證明香農輔助定理等價于證明KL散度為正值。

琴生(Jensen)不等式

首先說明一點,本文所說的凸函數和凹函數采用的是國際上的習慣稱呼。以一元函數為例,曲線往下凸的函數稱為凸函數,曲線往上凸的稱為凹函數。這與國內教材的習慣相反。
Jensen不等式是關于凸函數性質的不等式,也可以類推得到關于凹函數性質的不等式。對于凸函數曲線f(x)f(x)f(x)而言,有
tf(x1)+(1?t)f(x2)≥f(tx1+(1?t)x2)0≤t≤1tf(x_1)+(1-t)f(x_2) \geq f(tx_1+(1-t)x_2)\\ 0\leq t\leq1 tf(x1?)+(1?t)f(x2?)f(tx1?+(1?t)x2?)0t1
這是Jensen不等式的兩點形式。

對于任意點集{xi}\{x_i\}{xi?},若λi≥0,∑λi=1\lambda_i\geq0,\sum \lambda_i=1λi?0λi?=1f(x)f(x)f(x)是凸函數,有
f(∑λixi)≤∑λif(xi)f(\sum\lambda_ix_i)\leq\sum\lambda_if(x_i) f(λi?xi?)λi?f(xi?)
此結論是Jensen不等式兩點形式的推廣,可以由數學歸納法簡單證明。當λi\lambda_iλi?p(xi)p(x_i)p(xi?)時,上式變為:
f(E(x))≤E(f(x))f(E(x))\leq E(f(x)) f(E(x))E(f(x))

應用微分的思想,可以由離散形式的Jensen不等式轉變為連續形式。若∫g(x)=1,g(x)≥0\int g(x)=1,g(x)\geq0g(x)=1,g(x)0f(x)f(x)f(x)是凸函數。有
f(∫g(x)h(x)dx)≤∫g(x)f(h(x))dxf(\int g(x) h(x) dx)\leq\int g(x)f(h(x))dx f(g(x)h(x)dx)g(x)f(h(x))dx
這是Jensen不等式的一般形式,對于凹函數只需要變號即可。

應用Jensen不等式可以快速證明KL散度非負,即香農輔助定理成立,無需贅言。

總結

以上是生活随笔為你收集整理的香农辅助定理、KL散度和Jensen不等式的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。