幂律分布及性质
一、冪律分布及其檢驗
在上篇文章中說到,許多實際網絡的度分布曲線都具有長尾形狀。那么什么樣的分布函數具有長尾形狀呢?答案就是冪律分布。
1、冪律分布定義
很多實際網絡的度分布并不服從具有均勻特征的泊松分布,而是可以較好的用如下形式的冪律分布來表示:
其中λ\lambdaλ>0為冪指數,通常取值在2與3之間。
2、冪律分布的檢驗
2.1 雙對數坐標系中的直線
判斷一個網絡的度分布P(k)是否是冪律分布可以看雙對數坐標系中的直線。
假設我們要驗證是否存在比例常數C和冪指數λ\lambdaλ,使得近似的有
可以對上式兩邊取對數,則有
這說明lnP(k)是lnk的線性函數,斜率為-λ\lambdaλ,lnC為縱軸的截距。因此,直觀上,如果根據給定的數據,在雙對數坐標系中看到近似有一條直線,那么就可以推斷所處理的數據近似符合冪律,并且可以從該直線的斜率中得到對應的冪指數。
2.2 累積度分布
直接在雙對數坐標系的度分布圖中判斷是否存在冪律還有另外一個問題:即使我們說網絡的度分布在某段范圍內服從冪律,實際情形往往會在其中的一些度值處(特別是尾部的一些地方)有明顯的類似于噪聲擾動的偏差。一種常見的光滑化的處理方法是繪制累積度分布Pk_kk?,它表示的是度不小于k的節點在整個網絡中所占的比例,也就是網絡中隨機選取的一個節點的度不小于k的概率,即有
有些研究也把度小于k的節點在整個網絡中所占的比例1-Pk_kk?稱為累積度分布。
如果一個網絡的度分布為冪律分布,那么累積度分布函數近似符合冪指數為λ\lambdaλ-1的冪律:
注意到由于當k值較大時冪函數變化較為緩慢,所以上式中把離散的求和用連續的積分來近似。為了保證積分收斂 ,這里假設λ\lambdaλ>1。
二、冪律分布的性質
1、無標度性質
定理: 考慮一個概率分布函數 f(x),假設f(1)f’(1)≠0。如果對任意給定常數a,存在常數b使得函數f(x)滿足如下“無標度條件”:f(ax) = bf(x),那么必有f(x)=f(1)x?λ^{-\lambda}?λ,λ\lambdaλ=-f’(1)/f(1)。也就是說,冪律分布函數是唯一滿足無標度條件的概率分布函數。
2、歸一化
冪函數P(k)=CK?λ^{-\lambda}?λ要成為概率分布必須滿足如下基本條件:
此外,度值k不能為0,否則p0_00?為無窮大。因此,我們不妨假設冪律分布是當k>=kmin_{min}min?>0時才成立,于是有:
從而得到:
其中
成為廣義ζ\zetaζ函數,
稱為標準黎曼ζ\zetaζ函數。通過把求和用積分近似,我們可以用如下公式近似計算歸一化常數:
從而冪律律分布可以寫為:
相應的,累積度分布可以寫為:
3、矩的性質
定理:冪律分布P(k)=CK?λ^{-\lambda}?λ存在有限的m階矩的充要條件為λ\lambdaλ>m+1
總結