度相关性与同配性
一、高階度分布的引入
平均度< k >=2M/N可以視為網(wǎng)絡(luò)的0階度分布特性,它除了告訴我們網(wǎng)絡(luò)中有多少條邊之外,并沒有給出這些邊是如何安置在網(wǎng)絡(luò)中的任何信息。給定一個(gè)網(wǎng)絡(luò)的節(jié)點(diǎn)數(shù)N和邊數(shù)M,那么任一與該網(wǎng)絡(luò)具有相同節(jié)點(diǎn)數(shù)和邊數(shù)的網(wǎng)絡(luò)模型也具有相同的平均度。
網(wǎng)絡(luò)的度分布P(k) =n(k)/N可以視為網(wǎng)絡(luò)的1階度分布特性,它刻畫了網(wǎng)絡(luò)中不同度的節(jié)點(diǎn)各自所占的比例,這里n(k)是網(wǎng)絡(luò)中度為k的節(jié)點(diǎn)數(shù)。如果隨機(jī)地從網(wǎng)絡(luò)中選取一個(gè)節(jié)點(diǎn),那么該節(jié)點(diǎn)度為k的概率即為P(k)。顯然,度分布中已經(jīng)包含了平均度的信息:
具有相同度分布的兩個(gè)網(wǎng)絡(luò)可能具有非常不同的其它性質(zhì)或行為,例如上圖上圖是具有兩個(gè)完全相同度序列的網(wǎng)絡(luò),但結(jié)構(gòu)卻不同,為了進(jìn)一步刻畫網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu),需要考慮包含更多結(jié)構(gòu)信息的高階拓?fù)涮匦浴?/p>
二、聯(lián)合概率分布
1、聯(lián)合概率分布定義
聯(lián)合概率P(j,k)定義為網(wǎng)絡(luò)中隨機(jī)選取的一條邊的兩個(gè)端點(diǎn)的度分別為j和k的概率,即為網(wǎng)絡(luò)中度為j的節(jié)點(diǎn)和度為k的節(jié)點(diǎn)之間存在的邊數(shù)占網(wǎng)絡(luò)總邊數(shù)的比例:
其中,m(j,k)是度為j的節(jié)點(diǎn)和度為k的節(jié)點(diǎn)之間的連邊數(shù);如果j=k,那么μ\muμ(j,k) =2,否則μ\muμ(j,k) =1。
2、聯(lián)合概率分布性質(zhì)
(1)對(duì)稱性:
(2)歸一化:
(3)余度分布:
其中kmin_{min}min?和kmax_{max}max?分別為網(wǎng)絡(luò)中節(jié)點(diǎn)的度的最小值和最大值。Pn_nn?(k)表示網(wǎng)絡(luò)中隨機(jī)選取的一個(gè)節(jié)點(diǎn)隨機(jī)選取的一個(gè)鄰居節(jié)點(diǎn)度為k的概率。
這里要注意的是,Pn_nn?(k)與度分布P(k)是不同的。例如,我們無法從一個(gè)節(jié)點(diǎn)出發(fā)到達(dá)網(wǎng)絡(luò)中的孤立節(jié)點(diǎn)。因此,在網(wǎng)絡(luò)中存在孤立節(jié)點(diǎn)的情形:Pn_nn?(0)≡\equiv≡ 0<P(0)。
我們記
下式表明網(wǎng)絡(luò)的二階度分布特性包含了一階度分布特性:
若網(wǎng)絡(luò)中兩個(gè)節(jié)點(diǎn)是否有邊相連與這兩個(gè)節(jié)點(diǎn)的度值無關(guān),即網(wǎng)絡(luò)中隨機(jī)選擇的一條邊的兩個(gè)端點(diǎn)的度是完全隨機(jī)的,既有
那么就稱網(wǎng)絡(luò)不具有度相關(guān)性,或者稱網(wǎng)絡(luò)是中性的,否則,就稱網(wǎng)絡(luò)具有度相關(guān)性。
對(duì)于度相關(guān)的網(wǎng)絡(luò),如果總體上度大的節(jié)點(diǎn)傾向于連接度大的節(jié)點(diǎn),那么就稱網(wǎng)絡(luò)是度正相關(guān)的,或者稱網(wǎng)絡(luò)是同配的;如果總體上度大的節(jié)點(diǎn)傾向于連接度小的節(jié)點(diǎn),那么就稱網(wǎng)絡(luò)是度負(fù)相關(guān)的,或者稱網(wǎng)絡(luò)是異配的。 下圖表明,具有相同度序列(從而也具有相同度分布)的網(wǎng)絡(luò)可以具有完全不同的度相關(guān)性。
三、余平均度
1、定義
另一種更為簡(jiǎn)潔的判斷度相關(guān)性的方法是計(jì)算度為k的節(jié)點(diǎn)的鄰居節(jié)點(diǎn)的平均度,也稱度為k節(jié)點(diǎn)的余平均度。記為<knn_{nn}nn?>(k)。
2、計(jì)算
2.1 計(jì)算方式1
假設(shè)節(jié)點(diǎn)i的ki_ii?個(gè)鄰居節(jié)點(diǎn)的度為kij_{i_j}ij??,j=1,2,3,,,ki_ii?。我們可以計(jì)算節(jié)點(diǎn)i的余平均度<knn_{nn}nn?>(i)如下:
例如上圖的余平均度為:
2.2 計(jì)算方式2
假設(shè)網(wǎng)絡(luò)中度為k的節(jié)點(diǎn)為v1_11?,v2_22?,,,vi_ii?,那么度為k的節(jié)點(diǎn)的余平均度可計(jì)算如下:
3、余平均度與與條件概率和聯(lián)合概率的關(guān)系
<knn_{nn}nn?>(k)與田間概率和聯(lián)合概率的關(guān)系如下:
如果<knn_{nn}nn?>(k)是k的增函數(shù),那么就意味著平均而言,度大的節(jié)點(diǎn)傾向于與度大的節(jié)點(diǎn)連接,從而表明網(wǎng)絡(luò)是同配的;反之,如果<knn_{nn}nn?>(k)是k的減函數(shù),那么就意味著平均而言,度大的節(jié)點(diǎn)傾向于與度小的節(jié)點(diǎn)連接,從而表明網(wǎng)絡(luò)是異配的;如果網(wǎng)絡(luò)不具有度相關(guān)性,那么<knn_{nn}nn?>(k)是一個(gè)與k無關(guān)的常數(shù):
四、同配系數(shù)
我們介紹如何用一個(gè)指標(biāo)來刻畫網(wǎng)絡(luò)同配還是異配,由前面的式子我們知道網(wǎng)絡(luò)是度相關(guān)就意味著ejk_{jk}jk?與qj_jj?qk_kk?之間不恒等。可以考慮用兩者之間的差的大小刻畫網(wǎng)絡(luò)的同配或異配程度,即如下定義的度相關(guān)函數(shù):
一般來說,規(guī)模大的網(wǎng)絡(luò)根據(jù)上式計(jì)算的到的值的絕對(duì)值也越大,但可以通過歸一化處理消除這一影響,從而可以比較不同規(guī)模網(wǎng)絡(luò)同配或異配程度。當(dāng)網(wǎng)絡(luò)為完全同配時(shí),ejk_{jk}jk?=qk_kk?δjk\delta_{jk}δjk?,上式定義的度相關(guān)函數(shù)達(dá)到最大值,即為余度分布qk_kk?的方差:
于是得到歸一化的相關(guān)系數(shù),也稱同配系數(shù)如下:
其中r∈\in∈[-1,1],r>0時(shí)網(wǎng)絡(luò)同配,r<0時(shí)網(wǎng)絡(luò)異配。|r|的大小反應(yīng)了網(wǎng)絡(luò)中同配或異配的強(qiáng)弱程度。
五、實(shí)際網(wǎng)絡(luò)中的同配性質(zhì)
蛋白質(zhì)交互網(wǎng)絡(luò)和神經(jīng)網(wǎng)絡(luò)等生物網(wǎng)絡(luò)以及互聯(lián)網(wǎng)和www等技術(shù)網(wǎng)絡(luò)都是異配的,包括科研人員合作和電影演員合作在內(nèi)的許多現(xiàn)實(shí)社會(huì)網(wǎng)絡(luò)往往呈現(xiàn)較為明顯的同配性特征,而不同的在線社會(huì)網(wǎng)絡(luò)卻可能呈現(xiàn)不同的同配、異配或接近中性的特征。
六、同配概念的一般化
從更為一般的角度看,同配就是指屬性相近的節(jié)點(diǎn)傾向于互相連接。這里的屬性可以是節(jié)點(diǎn)的度值,但也可以是我們感興趣的其他特性,例如,社會(huì)網(wǎng)絡(luò)中個(gè)體的職業(yè)、年齡種族、信仰等等。
總結(jié)