无权无向和加权网络的聚类系数
一、無權無向網絡情形
1、聚類系數定義
我們可以用聚類系數刻畫某個節點相鄰的兩個節點彼此也相鄰的概率。
網絡中一個度為ki_ii?的節點i的聚類系數Ci_ii?定義為:
其中Ei_ii?是節點i的ki_ii?個鄰節點之間實際存在的邊數,即節點i的ki_ii?個鄰節點之間實際存在的鄰居對的數目。這里如果節點i只有一個鄰節點或沒有鄰節點,即ki_ii?=1或ki_ii?=0,那么Ei_ii?=0,此時上式分子分母全為零,我們記Ci_ii?=0,顯然0<=Ci_ii?<=1,并且Ci_ii?=0當且僅當節點i的任意兩個鄰節點都不互為鄰居或者節點i至多只有一個鄰節點。
一個網絡的聚類系數C定義為網絡中所有節點的聚類系數的平均值,即
顯然有0<=C<=1,C=0當且僅當網絡中所有節點的聚類系數都為零。C=1當且僅當網絡中所有節點的聚類系數都為1,此時網絡是全局耦合的,即網絡中任意兩個節點都相連。
2、聚類系數從集合角度定義
可以從另一個角度來闡述節點i的聚類系數的定義。Ei_ii?也可看做是以節點i為頂點之一的三角形的數目。因為節點i只有ki_ii?個鄰節點,包含節點i的三角形至多可能有ki_ii?(ki_ii?-1)/2個。如果用以節點i為中心的連通三元組表示包括節點i的3個節點并且至少存在從節點i到其他兩個節點的兩條邊,那么以節點i為中心的連通三元組的數目實際上就是包含節點i的三角形的最大可能的數目,即ki_ii?(ki_ii?-1)/2。因此,我們可以給出與節點聚類系數定義等價的節點i的聚類系數的幾何定義:
給定網絡的鄰接矩陣表示A=(aij_{ij}ij?)N?N_{N*N}N?N?,那么包含節點i的三角形的數目為:
因為aij_{ij}ij?ajk_{jk}jk?aki_{ki}ki?=1時當且僅當節點i、j、k構成一個三角形,否則必有aij_{ij}ij?ajk_{jk}jk?aki_{ki}ki?=0。
因此節點i的聚類系數可以表示為:
或者
一個網絡的聚類系數C定義為網絡中所有節點的聚類的平均值即
對C范圍的討論也同上。
3、從社會學角度看聚類系數
公式中的3是由于每個三角形對應于三個不同的連通三元組,它們分別以三角形的三個頂點為中心。
相對而言,聚類系數C的定義易于數值計算,因而被廣泛用于實際網絡數據分析,而聚類系數的社會寫定義則更適用于解析研究。
二、加權網絡情形
1、定義
人們提出了多種加權網絡的聚類系數的定義,其區別主要在于到底應該如何定量刻畫邊的權值對聚類特性的影響。
給定一個加權網絡及其鄰接矩陣A=(aij_{ij}ij?)和非負的權值矩陣W=ω\omegaω(ij_{ij}ij?),直觀上看,我們有無權網絡的節點聚類系數定義的加權形式:
現在的問題是如何根據加權網絡的非負權值矩陣W=ω\omegaω(ij_{ij}ij?)來合理確定ω\omegaωijk_{ijk}ijk?。
2、ω\omegaωijk_{ijk}ijk?的限制條件
ω\omegaωijk_{ijk}ijk?的限制條件:
(1)當節點i、j和k不構成一個三角形時,ω\omegaωijk_{ijk}ijk?可以任意取值(故不妨取為ω\omegaωijk_{ijk}ijk? =0)。這是因為aij_{ij}ij?ajk_{jk}jk?aki_{ki}ki?=1當且僅當節點i、j和k構成一個三角形,否則必有aij_{ij}ij?ajk_{jk}jk?aki_{ki}ki? =0。
(2)在無權網絡的特殊情形,上述加權形式的定義應該退化為無權網絡中節點的聚類系數定義。在此情形,當節點i、j和k構成一個三角形時應該有ω\omegaωijk_{ijk}ijk? =1。
(3)為了保證Ci~\widetilde{Ci}Ci∈\in∈[0,1],應該有ω\omegaωijk_{ijk}ijk?∈\in∈[0,1],這就意味著不管權值矩陣W如何選取,總有
3、ω\omegaωijk_{ijk}ijk?的取法
3.1 取法1
把ω\omegaωijk_{ijk}ijk?取為節點i與它的兩個鄰節點j和k之間的兩條邊的權值的歸一化的平均值,即
其中<ω\omegaωi_ii?>是以節點i為一個端點的所有邊的權值的平均值。即
把所選取的ω\omegaωijk_{ijk}ijk?的值帶入到聚類系數的加權形式中,可得
這一定義考慮了節點i與其鄰節點之間的邊的權值的影響,但是沒有考慮節點i的兩個鄰節點之間的邊(也稱為外邊)的權值的影響。對于無權網絡,當節點i、j和k構成一個三角形時,有ω\omegaωijk_{ijk}ijk?=1,上述定義即退化為無權網絡的節點聚類系數定義。
注意到結點i得強度si_ii?滿足
所以聚類系數加權形式的定義也可以寫為:
3.2 取法2
把ω\omegaωijk_{ijk}ijk?取為節點i與它的兩個相鄰節點j和k組成的三角形的三條邊的歸一化權值的幾何平均,即
其中ω^ij∈\widehat{\omega}_{ij}\inωij?∈[0.1]為如下定義的歸一化權值:
將ω\omegaωijk_{ijk}ijk?所取的值帶入到聚類系數的加權形式中,即得到加權網絡中結點i的聚類系數的另一種定義:
如果把兩個結點之間沒有變等價的定義為兩個結點之間的邊的權值為0,那么上式可以等價為:
該式可進一步寫為:
其中Ci_ii?是把該網絡看作無權網絡時結點i的聚類系數,Iiˉ\bar{I_i}Ii?ˉ?是包含結點i的三角形的歸一化平均密度:
這里Ei_ii?是包含結點i的三角形數目,即
從無權無向網絡從幾何角度定義聚類系數來看,節點i的聚類系數等于包含節點i的三角形數目除以包含節點i的三元組數目。基于這一定義的推廣,可以得到加權網絡中聚類系數的第三種定義:
分子即為包含節點i的三角形數目Ei_ii?的加權化形式,分母則為分子可能的上界。從而保證C~i(3)∈\widetilde{C}_i^{(3)}\inCi(3)?∈[0,1] ,上式也可以寫為:
4、基于ω\omegaωijk_{ijk}ijk?取值不同的三種定義的特征
(1)當加權網絡退化為無權網絡時,上述幾種定義都是等價的。即有C~i(1)\widetilde{C}_i^{(1)}Ci(1)?=C~i(2)\widetilde{C}_i^{(2)}Ci(2)?=C~i(3)\widetilde{C}_i^{(3)}Ci(3)?=Ci_ii?。
(2)與無權網絡中節點i的聚類系數Ci_ii?相同,有C~i(l)∈\widetilde{C}_i^{(l)}\inCi(l)?∈[0,1],l=1,2,3。
(3)與Ci_ii?相同C~i(l)\widetilde{C}_i^{(l)}Ci(l)?=0當且僅當不存在包含節點i的三角形。
(4)與Ci_ii?相同C~i(l)\widetilde{C}_i^{(l)}Ci(l)?=1的充要條件是節點i的任意兩個鄰節點都互為鄰居。但是,此條件只是C~i(2)\widetilde{C}_i^{(2)}Ci(2)?=C~i(3)\widetilde{C}_i^{(3)}Ci(3)?=1的必要條件,因為C~i(2)\widetilde{C}_i^{(2)}Ci(2)?=1還要求包含節點i的所有三角形的邊的權值都相同。C~i(3)\widetilde{C}_i^{(3)}Ci(3)?=1則要求包含節點i的每一個三角形的每一條外邊的權值都相同且為最大值,而與節點i相連的邊的權值無關。
總結
以上是生活随笔為你收集整理的无权无向和加权网络的聚类系数的全部內容,希望文章能夠幫你解決所遇到的問題。