Jensen不等式简介及推导
目錄
- Jensen不等式
- Jensen的推導
Jensen不等式
Jensen不等式,又名琴森不等式或詹森不等式(均為音譯)。它是一個在描述積分的凸函數值和凸函數的積分值間的關系的不等式。它的一般形態是:
1.當且僅當f(x)f(x)f(x)為下凸函數時有
f(∑i=1nλixi)≤∑i=1nλif(xi),∑i=1nλi=1,λi≥0f(\sum_{i=1}^{n}\lambda_{i}x_{i})\leq \sum_{i=1}^{n}\lambda_{i}f(x_{i}) \quad ,\sum_{i=1}^{n}\lambda_{i}=1,\lambda_{i}\geq0f(i=1∑n?λi?xi?)≤i=1∑n?λi?f(xi?),i=1∑n?λi?=1,λi?≥0
2.當且僅當f(x)f(x)f(x)為上凸函數時有
f(∑i=1nλixi)≥∑i=1nλif(xi),∑i=1nλi=1,λi≥0f(\sum_{i=1}^{n}\lambda_{i}x_{i})\geq \sum_{i=1}^{n}\lambda_{i}f(x_{i}) \quad ,\sum_{i=1}^{n}\lambda_{i}=1,\lambda_{i}\geq0f(i=1∑n?λi?xi?)≥i=1∑n?λi?f(xi?),i=1∑n?λi?=1,λi?≥0
它的最簡單形態是:
1.當且僅當f(x)f(x)f(x)為下凸函數時有
f(x1+x22)≤12f(x1)+12f(x2)f( \frac{x_{1}+x_{2}}{2})\leq \frac{1}{2}f(x_{1})+\frac{1}{2}f(x_{2})f(2x1?+x2??)≤21?f(x1?)+21?f(x2?)
2.當且僅當f(x)f(x)f(x)為上凸函數時有
f(x1+x22)≥12f(x1)+12f(x2)f( \frac{x_{1}+x_{2}}{2})\geq \frac{1}{2}f(x_{1})+\frac{1}{2}f(x_{2})f(2x1?+x2??)≥21?f(x1?)+21?f(x2?)
Jensen的推導
一般采用數學歸納法進行Jensen不等式的推導和證明。
以下凸函數為例,先看n=2n=2n=2時的情形。
當n=2n=2n=2時,有
f(λ1x1+λ2x2)≤λ1f(x1)+λ2f(x2),λ1+λ2=1f(\lambda_{1}x_{1}+\lambda_{2}x_{2})\leq\lambda_{1}f(x_{1})+\lambda_{2}f(x_{2})\quad ,\lambda_{1}+\lambda_{2}=1f(λ1?x1?+λ2?x2?)≤λ1?f(x1?)+λ2?f(x2?),λ1?+λ2?=1(這個易證,在最后給出證明。)
假設在n?1n-1n?1時依然有f(∑i=1n?1λixi)≤∑i=1n?1λif(xi),∑i=1n?1λi=1,λi≥0f(\sum_{i=1}^{n-1}\lambda_{i}x_{i})\leq \sum_{i=1}^{n-1}\lambda_{i}f(x_{i}) \quad ,\sum_{i=1}^{n-1}\lambda_{i}=1,\lambda_{i}\geq0f(i=1∑n?1?λi?xi?)≤i=1∑n?1?λi?f(xi?),i=1∑n?1?λi?=1,λi?≥0成立
在nnn時
f(∑i=1nλixi)=f(∑i=1n?1λixi+λnxn)=f[(1?λn)xN+λnxn]≤(1?λn)f(xN)+λnf(xn),∑i=1nλi=1f(\sum_{i=1}^{n}\lambda_{i}x_{i})=f(\sum_{i=1}^{n-1}\lambda_{i}x_{i}+\lambda_{n}x_{n})=f[(1-\lambda_{n})x_{N}+\lambda_{n}x_{n}]\leq(1-\lambda_{n})f(x_{N})+\lambda_{n}f(x_{n})\quad ,\sum_{i=1}^{n}\lambda_{i} =1 f(i=1∑n?λi?xi?)=f(i=1∑n?1?λi?xi?+λn?xn?)=f[(1?λn?)xN?+λn?xn?]≤(1?λn?)f(xN?)+λn?f(xn?),i=1∑n?λi?=1
其中,
xN=∑i=1n?1mixi,∑i=1n?1mi=1;x_{N} =\sum_{i=1}^{n-1}m_{i}x_{i} ,\sum_{i=1}^{n-1}m_{i} =1;xN?=i=1∑n?1?mi?xi?,i=1∑n?1?mi?=1;
(1?λn)mi=λi,i=1,2,...,n?1;(1-\lambda_{n})m_{i} =\lambda_{i},i=1,2,...,n-1;(1?λn?)mi?=λi?,i=1,2,...,n?1;
從而,
(1?λn)∑i=1n?1mixi=∑i=1n?1λixi;(1-\lambda_{n})\sum_{i=1}^{n-1}m_{i}x_{i}=\sum_{i=1}^{n-1}\lambda_{i}x_{i};(1?λn?)i=1∑n?1?mi?xi?=i=1∑n?1?λi?xi?;
(1?λn)∑i=1n?1mif(xi)=∑i=1n?1λif(xi);(1-\lambda_{n})\sum_{i=1}^{n-1}m_{i}f(x_{i})=\sum_{i=1}^{n-1}\lambda_{i}f(x_{i}); (1?λn?)i=1∑n?1?mi?f(xi?)=i=1∑n?1?λi?f(xi?);
繼續,
(1?λn)f(xN)+λnf(xn)=(1?λn)f(∑i=1n?1mixi)+λnf(xn)≤(1?λn)∑i=1n?1mif(xi)+λnf(xn)=∑i=1n?1λif(xi)+λnf(xn)=∑i=1nλif(xi)(1-\lambda_{n})f(x_{N})+\lambda_{n}f(x_{n})=(1-\lambda_{n})f(\sum_{i=1}^{n-1}m_{i}x_{i})+\lambda_{n}f(x_{n})\\ \leq (1-\lambda_{n})\sum_{i=1}^{n-1}m_{i}f(x_{i}) +\lambda_{n}f(x_{n})=\sum_{i=1}^{n-1}\lambda_{i}f(x_{i}) +\lambda_{n}f(x_{n})=\sum_{i=1}^{n}\lambda_{i}f(x_{i})\qquad\qquad(1?λn?)f(xN?)+λn?f(xn?)=(1?λn?)f(i=1∑n?1?mi?xi?)+λn?f(xn?)≤(1?λn?)i=1∑n?1?mi?f(xi?)+λn?f(xn?)=i=1∑n?1?λi?f(xi?)+λn?f(xn?)=i=1∑n?λi?f(xi?)
從而得到,
當且僅當f(x)f(x)f(x)為下凸函數時有
f(∑i=1nλixi)≤∑i=1nλif(xi),∑i=1nλi=1,λi≥0f(\sum_{i=1}^{n}\lambda_{i}x_{i})\leq \sum_{i=1}^{n}\lambda_{i}f(x_{i}) \quad ,\sum_{i=1}^{n}\lambda_{i}=1,\lambda_{i}\geq0f(i=1∑n?λi?xi?)≤i=1∑n?λi?f(xi?),i=1∑n?λi?=1,λi?≥0
這一切的一切必須要在最開始n=2n=2n=2成立才可以得到這種結論。
現在證明n=2n=2n=2時的一般情形。
令g(λ)=λf(x1)+(1?λ)f(x2)?f[λx1+(1?λ)x2],λ∈[0,1]g(\lambda)=\lambda f(x_{1})+(1-\lambda) f(x_{2})-f[\lambda x_{1}+(1-\lambda)x_{2}]\quad ,\lambda \in [0,1]g(λ)=λf(x1?)+(1?λ)f(x2?)?f[λx1?+(1?λ)x2?],λ∈[0,1]
要證f(λ1x1+λ2x2)≤λ1f(x1)+λ2f(x2),λ1+λ2=1f(\lambda_{1}x_{1}+\lambda_{2}x_{2})\leq\lambda_{1}f(x_{1})+\lambda_{2}f(x_{2})\quad ,\lambda_{1}+\lambda_{2}=1f(λ1?x1?+λ2?x2?)≤λ1?f(x1?)+λ2?f(x2?),λ1?+λ2?=1
只需證:g(λ)≥0g(\lambda)\geq0g(λ)≥0即可。(這里λ=λ1,1?λ=λ2\lambda=\lambda_{1},1-\lambda=\lambda_{2}λ=λ1?,1?λ=λ2?)
現在來研究一下這個g(λ)g(\lambda)g(λ)函數
g′(λ)=f(x1)?f(x2)?f′[λx1+(1?λ)x2](x1?x2)g'(\lambda)=f(x_{1})-f(x_{2})-f'[\lambda x_{1}+(1-\lambda)x_{2}](x_{1}-x_{2})g′(λ)=f(x1?)?f(x2?)?f′[λx1?+(1?λ)x2?](x1??x2?)
如果令g′(λ0)=0,λ0∈[0,1]g'(\lambda_{0})=0,\lambda_{0} \in [0,1]g′(λ0?)=0,λ0?∈[0,1]
可以得到一個關系式f′[λ0x1+(1?λ0)x2]=f(x1)?f(x2)x1?x2f'[\lambda_{0} x_{1}+(1-\lambda_{0})x_{2}]=\frac{f(x_{1})-f(x_{2})}{x_{1}-x_{2}}f′[λ0?x1?+(1?λ0?)x2?]=x1??x2?f(x1?)?f(x2?)?
其實這個式子表述的意義就是拉格朗日中值定理
但還不夠,再求一階導試試。
g′′(λ)=?f′′[λx1+(1?λ)x2](x1?x2)2g''(\lambda)=-f''[\lambda x_{1}+(1-\lambda)x_{2}](x_{1}-x_{2})^{2}g′′(λ)=?f′′[λx1?+(1?λ)x2?](x1??x2?)2
我們知道,f(x)f(x)f(x)在這里是下凸的,意味著它的二階導數在它的定義域內有f′′(x)≥0f''(x)\geq 0f′′(x)≥0
從而可以知道g′′(λ)≤0g''(\lambda)\leq 0g′′(λ)≤0
這說明g′(λ)g'(\lambda)g′(λ)在它的定義域內是一個單調遞減函數
詳細一點,g′(λ)≥0,當且僅當λ∈[0,λ0]g′(λ)≤0,當且僅當λ∈[λ0,1]g'(\lambda)\geq0,當且僅當\lambda \in[0,\lambda_{0}] \\ g'(\lambda)\leq0,當且僅當\lambda \in[\lambda_{0},1]g′(λ)≥0,當且僅當λ∈[0,λ0?]g′(λ)≤0,當且僅當λ∈[λ0?,1]
那么說明λ0\lambda_{0}λ0?是g(λ)g(\lambda)g(λ)的極大值點,并且僅有這一個極大值點
則,
g(λ0)≥g(λ)≥min{g(0),g(1)}=0,λ∈[0,1]g(\lambda_{0}) \geq g(\lambda)\geq min\{g(0),g(1)\}=0\quad ,\lambda \in[0,1]g(λ0?)≥g(λ)≥min{g(0),g(1)}=0,λ∈[0,1]
到此證明完成。
總結
以上是生活随笔為你收集整理的Jensen不等式简介及推导的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: MSN下载2010最新版
- 下一篇: python3做答题器_现在很火的答题赢