日韩性视频-久久久蜜桃-www中文字幕-在线中文字幕av-亚洲欧美一区二区三区四区-撸久久-香蕉视频一区-久久无码精品丰满人妻-国产高潮av-激情福利社-日韩av网址大全-国产精品久久999-日本五十路在线-性欧美在线-久久99精品波多结衣一区-男女午夜免费视频-黑人极品ⅴideos精品欧美棵-人人妻人人澡人人爽精品欧美一区-日韩一区在线看-欧美a级在线免费观看

歡迎訪問 生活随笔!

生活随笔

當前位置: 首頁 > 编程资源 > 编程问答 >内容正文

编程问答

图或网络中的中心性:点度中心性、中介中心性、接近中心性、特征向量中心性、PageRank

發布時間:2024/3/12 编程问答 61 豆豆
生活随笔 收集整理的這篇文章主要介紹了 图或网络中的中心性:点度中心性、中介中心性、接近中心性、特征向量中心性、PageRank 小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

文章目錄

      • 點度中心性(degree centrality)
      • 中介中心性(betweenness centrality)
      • 接近中心性(closeness centrality)
      • 特征向量中心性(eigenvector centrality)
      • 有向圖與PageRank
      • 小結

網絡由節點(node)和連接它們的邊(edge)構成。例如,微信好友的關系是相互的,如果我是你的好友,你也是我的好友。這樣的網絡稱為無向網絡(undirected graph/network)。但超鏈接并非如此,如果我的網站可以鏈接到維基百科,并不表示維基百科會鏈接到我的網站。這樣的網絡稱為有向網絡(directed graph/network)

在圖論和網絡分析中,中心性(Centrality)是判斷網絡中節點重要性/影響力的指標。在社會網絡分析中,一項基本的任務就是鑒定一群人中哪些人比其他人更有影響力,從而幫助我們理解他們在網絡中扮演的角色。

那么,什么樣的節點是重要的呢?

對節點重要性的解釋有很多,不同的解釋下判定中心性的指標也有所不同。

點度中心性(degree centrality)

在無向網絡中,我們可以用一個節點的度數(相當于你的微信好友數)來衡量中心性。在微博中,謝娜的粉絲數9千多萬,她的點度中心性就很高。

這一指標背后的假設是:重要的節點就是擁有許多連接的節點。你的社會關系越多,你的影響力就越強。

圖1:使用networkx繪制的蝴蝶結網絡

在上面的蝴蝶結網絡中,節點D的連接數是6,和網絡中的所有人都建立了直接聯系,其他節點的連接數都是3,因此節點D的點度中心性最高。整個網絡一共有7個節點,意味著每個人最多可以有6個社會關系。因此,節點D的點度中心性是6/6=1,其他節點的點度中心性是3/6=0.5。

中介中心性(betweenness centrality)

網絡中兩個非相鄰成員之間的相互作用依賴于其他成員,特別是兩成員之間路徑上的那些成員。他們對兩個非相鄰成員之間的相互作用具有控制和制約作用。Freeman (1979)認為中間成員對路徑兩端的成員具有“更大的人際關系影響”。因此,中介中心性的思想是:如果一個成員位于其他成員的多條最短路徑上,那么該成員就是核心成員,就具有較大的中介中心性。

計算網絡中任意兩個節點的所有最短路徑,如果這些最短路徑中很多條都經過了某個節點,那么就認為這個節點的中介中心性高。回到上面的蝴蝶結網絡,假設我們要計算節點D的中介中心性。

首先,我們計算節點D之外,所有節點對之間的最短路徑有多少條,這里是15條(在6個節點中選擇兩個節點即節點對的個數)。
然后,我們再看所有這些最短路徑中有多少條經過節點D,例如節點A要想找到節點E,必須經過節點D。經過節點D的最短路徑有9條。
最后,我們用經過節點D的最短路徑除以所有節點對的最短路徑總數,這個比率就是節點D的中介中心性。節點D的中介中心性是9/15=0.6。

如果說點度中心性發現的是網絡中的“名人”,那么中介中心性的現實意義是什么呢?

Maksim Tsvetovat&Alexander Kouznetsov在《社會網絡分析》一書中有兩個例子:

  • 鮑勃徘徊在兩個女人之間,他貪戀愛麗絲的美麗和談吐,亦無法舍棄卡若琳娜的樂天和無憂無慮。但他必須小心謹慎,生怕自己在其中任何一個人面前露餡,這樣的關系充滿了壓力和焦慮
  • 銀行家以5%的利率接受A公司的存款,以7%的利率貸款給B公司,這樣的關系給銀行家帶來了巨大的利益。它的前提是,市場中的A公司和B公司不能直接接觸,或至少無法輕易地找到對方

鮑勃和銀行家的故事盡管截然不同,但他們都處于一種被稱為被禁止的三元組(forbidden triad)的關系中,需要確保三元組的末端不能直接聯系。沒有聯系就像網絡中出現了一個洞,因此也被稱為結構洞

當網絡中眾多成員的接觸或低成本接觸都依賴我時,我就對其他成員有了控制和制約作用。我可以利用這種關系控制信息的流動,套取巨大的利益。當然,這樣的關系也充滿著壓力和緊張。誠如Maksim Tsvetovat&Alexander Kouznetsov所言,商人的成功,不僅取決于他們對不對稱信息的利用和經營能力,也需要對創造和維持套利機會帶來的壓力的高度容忍。

接近中心性(closeness centrality)

點度中心性僅僅利用了網絡的局部特征,即節點的連接數有多少,但一個人連接數多,并不代表他/她處于網絡的核心位置。接近中心性和中介中心性一樣,都利用了整個網絡的特征,即一個節點在整個結構中所處的位置。如果節點到圖中其他節點的最短距離都很小,那么它的接近中心性就很高。相比中介中心性,接近中心性更接近幾何上的中心位置。

假設我們要計算節點D的接近中心性,首先我們計算從節點D到所有其他節點的最短距離。從圖中可以判斷,節點D到所有其他節點的距離均為1,距離之和為6。因此,節點D的接近中心性為(7-1)/6=1。分子為網絡中節點總數減去1。也就是說,如果一個人可以直接跟網絡中所有其他人聯系,那么他/她的接近中心性就是1。對于其他節點,如節點A的接近中心性為(7-1)/9=0.667。

接近中心性高的節點一般扮演的是八婆的角色(gossiper)。他們不一定是名人,但是樂于在不同的人群之間傳遞消息。

特征向量中心性(eigenvector centrality)

特征向量中心性的基本思想是,一個節點的中心性是相鄰節點中心性的函數。也就是說,與你連接的人越重要,你也就越重要。

特征向量中心性和點度中心性不同,一個點度中心性高即擁有很多連接的節點特征向量中心性不一定高,因為所有的連接者有可能特征向量中心性很低。同理,特征向量中心性高并不意味著它的點度中心性高,它擁有很少但很重要的連接者也可以擁有高特征向量中心性。

考慮下面的圖,以及相應的5x5的鄰接矩陣(Adjacency Matrix),A。

鄰接矩陣的含義是,如果兩個節點沒有直接連接,記為0,否則記為1。

現在考慮x,一個5x1的向量,向量的值對應圖中的每個點。在這種情況下,我們計算的是每個點的點度中心性(degree centrality),即以點的連接數來衡量中心性的高低。

矩陣A乘以這個向量的結果是一個5x1的向量:

A×x=(?11101?10011?10101?10001)(32331)=(0×3+1×2+1×3+1×3+0×11×3+0×2+1×3+0×3+0×11×3+1×2+0×3+1×3+0×11×3+0×2+1×3+0×3+1×10×3+0×2+1×3+0×3+0×1)=[86873]\mathbf{A} \times \mathbf{x}=\left(\begin{array}{cccc}{-1} & {1} & {1} & {0} \\ {1} & {-1} & {0} & {0} \\ {1} & {1} & {-1} & {0} \\ {1} & {0} & {1} & {-1} \\ {0} & {0} & {0} & {1}\end{array}\right)\left(\begin{array}{l}{3} \\ {2} \\ {3} \\ {3} \\ {1}\end{array}\right)=\left(\begin{array}{c}{0 \times 3+1 \times 2+1 \times 3+1 \times 3+0 \times 1} \\ {1 \times 3+0 \times 2+1 \times 3+0 \times 3+0 \times 1} \\ {1 \times 3+1 \times 2+0 \times 3+1 \times 3+0 \times 1} \\ {1 \times 3+0 \times 2+1 \times 3+0 \times 3+1 \times 1} \\ {0 \times 3+0 \times 2+1 \times 3+0 \times 3+0 \times 1}\end{array}\right)=\left[\begin{array}{c}{8} \\ {6} \\{8} \\ {7} \\ {3}\end{array}\right] A×x=????????11110?1?1100?10?110?000?11???????????????32331????????=???????0×3+1×2+1×3+1×3+0×11×3+0×2+1×3+0×3+0×11×3+1×2+0×3+1×3+0×11×3+0×2+1×3+0×3+1×10×3+0×2+1×3+0×3+0×1????????=???????86873????????
結果向量的第一個元素是用矩陣A的第一行去“獲取”每一個與第一個點有連接的點的值(連接數,點度中心性),也就是第2個、第3個和第4個點的值,然后將它們加起來。

換句話說,鄰接矩陣做的事情是將相鄰節點的求和值重新分配給每個點。這樣做的結果就是“擴散了”點度中心性。你的朋友的朋友越多,你的特征向量中心性就越高。

我們繼續用矩陣A乘以結果向量。如何理解呢?實際上,我們允許這一中心性數值再次沿著圖的邊界“擴散”。我們會觀察到兩個方向上的擴散(點既給予也收獲相鄰節點)。我們猜測,這一過程最后會達到一個平衡,特定點收獲的數量會和它給予相鄰節點的數量取得平衡。既然我們僅僅是累加,數值會越來越大,但我們最終會到達一個點,各個節點在整體中的比例會保持穩定。

現在把所有點的數值構成的向量用更一般的形式表示:

[?11101?10011?10101?10001?][x1x2x3x4x5]=[0?x1+1?x2+1?x3+1?x4+0?x51?x1+0?x2+1?x3+0?x4+0?x51?x1+1?x2+0?x3+1?x4+0?x51?x1+0?x2+1?x3+0?x4+1?x50?x1+0?x2+0?x3+1?x4+0?x5]\left[\begin{array}{ccccc}{-} & {1} & {1} & {1} & {0} \\ {1} & {-} & {1} & {0} & {0} \\ {1} & {1} & {-} & {1} & {0} \\ {1} & {0} & {1} & {-} & {1} \\ {0} & {0} & {0} & {1} & {-}\end{array}\right]\left[\begin{array}{l}{x_{1}} \\ {x_{2}} \\ {x_{3}} \\ {x_{4}} \\ {x_{5}}\end{array}\right]=\left[\begin{array}{c}{0 \cdot x_{1}+1 \cdot x_{2}+1 \cdot x_{3}+1 \cdot x_{4}+0 \cdot x_{5}} \\ {1 \cdot x_{1}+0 \cdot x_{2}+1 \cdot x_{3}+0 \cdot x_{4}+0 \cdot x_{5}} \\ {1 \cdot x_{1}+1 \cdot x_{2}+0 \cdot x_{3}+1 \cdot x_{4}+0 \cdot x_{5}} \\ {1 \cdot x_{1}+0 \cdot x_{2}+1 \cdot x_{3}+0 \cdot x_{4}+1 \cdot x_{5}} \\ {0 \cdot x_{1}+0 \cdot x_{2}+0 \cdot x_{3}+1 \cdot x_{4}+0 \cdot x_{5}}\end{array}\right] ????????1110?1?100?11?10?101?1?0001????????????????x1?x2?x3?x4?x5?????????=???????0?x1?+1?x2?+1?x3?+1?x4?+0?x5?1?x1?+0?x2?+1?x3?+0?x4?+0?x5?1?x1?+1?x2?+0?x3?+1?x4?+0?x5?1?x1?+0?x2?+1?x3?+0?x4?+1?x5?0?x1?+0?x2?+0?x3?+1?x4?+0?x5?????????
我們認為,圖中的點存在一個數值集合,對于它,用矩陣A去乘不會改變向量各個數值的相對大小。也就是說,它的數值會變大,但乘以的是同一個因子。用數學符號表示就是:

Mx=λx\mathbf{M} \mathbf{x}=\lambda \mathbf{x} Mx=λx

M×(x1x2?xn)=(λx1λx2?λxn)\mathbf{M} \times\left(\begin{array}{c}{x_{1}} \\ {x_{2}} \\ {\cdots} \\ {x_{n}}\end{array}\right)=\left(\begin{array}{c}{\lambda x_{1}} \\ {\lambda x_{2}} \\ {\cdots} \\ {\lambda x_{n}}\end{array}\right) M×?????x1?x2??xn???????=?????λx1?λx2??λxn???????
滿足這一屬性的向量就是矩陣M的特征向量。特征向量的元素就是圖中每個點的特征向量中心性。

特征向量中心性的計算需要讀者具備矩陣乘法和特征向量的知識,但不影響這里讀者對特征向量中心性思想的理解,不再贅述。

有向圖與PageRank

PageRank是衡量有向網絡中節點重要性的指標。

我們將萬維網抽象成有向圖:(1)每個網頁抽象成一個節點,假設有A、B、C、D四個節點;(2)用戶通過超鏈接在網頁之間跳轉,這種跳轉是有方向的(directed),從網頁A跳轉到網頁B不代表可以從網頁B鏈接到網頁A,這種節點之間的有方向的連接被抽象成有方向的邊。整個網絡構成一個有向圖。

你可以很輕易地找到最受歡迎的網頁。但是,PageRank的思想認為,指標最好還需要考慮到指向你的那些網頁。也就是說,來自受歡迎的網頁的跳轉應該重于不太受歡迎的網頁的跳轉。這就是PageRank思想的精華,Google就是利用這一思想來給網站排名的。這里的思想依據和特征向量中心性其實是一致的。

首先,我們假設用戶停留在一個頁面時,跳轉到每個鏈接頁面的概率是相同的。例如,用戶停留在頁面A,他可以跳轉到B、C、D三個頁面,我們假設用戶跳轉到每個頁面的概率相同,也就是說用戶跳轉到每個頁面的概率均為1/3。我們可以用下面的轉移矩陣(Transition Matrix)來表示整個有向圖的情況:

M=[01/201/21/3001/21/31/2001/3010]M=\left[\begin{array}{cccc}{0} & {1 / 2} & {0} & {1 / 2} \\ {1 / 3} & {0} & {0} & {1 / 2} \\ {1 / 3} & {1 / 2} & {0} & {0} \\ {1 / 3} & {0} & {1} & {0}\end{array}\right] M=?????01/31/31/3?1/201/20?0001?1/21/200??????

假設有向圖中有n個節點,那么M就是一個n行n列的矩陣,其中的第i行第j列代表從頁面j跳轉到頁面i的概率。例如,M矩陣的第一行代表從ABCD跳轉到頁面A的概率。

然后,我們設每個頁面的初始rank為1/4,4個頁面的初始rank構成向量v:

v=[1/41/41/41/4]v=\left[\begin{array}{c}{1 / 4} \\ {1 / 4} \\ {1 / 4} \\ {1 / 4}\end{array}\right] v=?????1/41/41/41/4??????
用M第一行乘以向量v,得到的就是頁面A最新rank的合理估計:0?1/4+1/2?1/4+0?1/4+1/2?1/4=1/40*1/4+1/2*1/4+0*1/4+1/2*1/4=1/40?1/4+1/2?1/4+0?1/4+1/2?1/4=1/4。Mv的結果就是ABCD四個頁面的新rank:

Mv=[1/45/245/241/3]M v=\left[\begin{array}{c}{1 / 4} \\ {5 / 24} \\ {5 / 24} \\ {1 / 3}\end{array}\right] Mv=?????1/45/245/241/3??????
然后用M再乘以新的rank向量,又會產生一個新的rank向量。迭代這一過程,Mv結果各個值的相對大小會保持穩定。也就是說,其結果等于用一個標量乘以v。

滿足這一屬性的向量就是矩陣M的特征向量。這里的結果會收斂在[1/4, 1/4, 1/5, 1/4],這就是A、B、C、D最后的PageRank。這一結果表明,相比于網頁C, ABD更為重要。

上述方程式假設上網者一定是通過網頁上的鏈接進行跳轉的,但實際上,上網者在每一步都有可能在地址欄隨機輸入一個網址,跳轉到其他頁面,而不是點擊網頁上的鏈接。或者,上網者可能到達一個沒有任何鏈出頁面的網頁,這時他會隨機到另外的頁面進行瀏覽。

想象有兩個網頁的簡單例子,網頁A鏈接到B,但B無法鏈接到A。轉移矩陣如下:

M=[0010]M=\left[\begin{array}{ll}{0} & {0} \\ {1} & {0}\end{array}\right] M=[01?00?]
不斷迭代,最后我們得到的是一個0矩陣:

Mv=[0010][1212]=[012]M v=\left[\begin{array}{ll}{0} & {0} \\ {1} & {0}\end{array}\right]\left[\begin{array}{l}{\frac{1}{2}} \\ {\frac{1}{2}}\end{array}\right]=\left[\begin{array}{l}{0} \\ {\frac{1}{2}}\end{array}\right] Mv=[01?00?][21?21??]=[021??]
考慮到B比A重要,這一結果是不合理的,它認為A和B同等重要。為了解決這個問題,我們引入 “心靈運輸”(Teleportation) 的概念。它意味著上網者每一步都有可能隨機輸入一個網址(心靈運輸),跳轉到其他頁面(這意味著每一步,網絡上的每個網頁都有一定的概率被訪問到,它的概率為(1-d)/N,即上網者心靈運輸的概率乘以每個網頁被訪問的概率),而不是點擊網頁上的鏈接。

我們假設上網者在任何頁面繼續向下瀏覽的概率為d=0.85。d也被稱為阻尼系數(damping factor)。1-d=0.15就是上網者停止點擊,隨機跳到新網址的概率,即心靈運輸的概率。設網頁總數為N,那么跳轉到任一網頁的概率為N。因此,調整后的方程式如下:

v′=dMv+e1?dNv^{\prime}=d M v+e \frac{1-d}{N} v=dMv+eN1?d?
其中的e為單位矩陣,這樣才能與方程式的前半部分相加。

v′=0.8×[0010][1212]+0.2×[1212]=[11012]v^{\prime}=0.8 \times\left[\begin{array}{ll}{0} & {0} \\ {1} & {0}\end{array}\right]\left[\begin{array}{l}{\frac{1}{2}} \\ {\frac{1}{2}}\end{array}\right]+0.2 \times\left[\begin{array}{l}{\frac{1}{2}} \\ {\frac{1}{2}}\end{array}\right]=\left[\begin{array}{c}{\frac{1}{10}} \\ {\frac{1}{2}}\end{array}\right] v=0.8×[01?00?][21?21??]+0.2×[21?21??]=[101?21??]
不斷迭代后,兩個網頁的rank會收斂為:

[11012]0.10.18]?[0.350.64]\left.\left[\begin{array}{c}{\frac{1}{10}} \\ {\frac{1}{2}}\end{array}\right] \begin{array}{l}{0.1} \\ {0.18}\end{array}\right] \cdots \left[\begin{array}{l}{0.35} \\ {0.64}\end{array}\right] [101?21??]0.10.18?]?[0.350.64?]

小結

  • 點度中心性:一個人的社會關系越多,他/她就越重要
  • 中介中心性:如果一個成員處于其他成員的多條最短路徑上,那么該成員就是核心成員
  • 接近中心性:一個人跟所有其他成員的距離越近,他/她就越重要
  • 特征向量中心性:與你連接的人社會關系越多,你就越重要
  • PageRank:來自受歡迎的網頁的跳轉應該重于不太受歡迎的網頁的跳轉

總結

以上是生活随笔為你收集整理的图或网络中的中心性:点度中心性、中介中心性、接近中心性、特征向量中心性、PageRank的全部內容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯,歡迎將生活随笔推薦給好友。

主站蜘蛛池模板: 国外成人在线视频 | 一区二区中文字幕在线观看 | 成人免费毛片糖心 | 日本一区二区三区在线免费观看 | 小泽玛利亚一区二区三区 | 国产成人无码AA精品区 | 中文字幕在线资源 | 免费看美女隐私网站 | 91高清免费| 成人在线免费看视频 | 中文字幕av一区二区三区谷原希美 | 国产精品乱码一区二三区小蝌蚪 | 国产成人91精品 | 91sao| 亚洲男人天堂av | 动漫女被黄漫免费视频 | 特黄视频免费看 | 欧洲性生活视频 | 成人免费淫片aa视频免费 | 香蕉久久久久久 | 在线观看污污网站 | 色戒未删节版 | 91欧美在线 | 亚洲国产日韩在线一区 | 四虎在线免费播放 | 麻豆传媒在线观看视频 | 大牛影视剧免费播放在线 | 伊人ab | av免费一区| 亚州黄色 | 黄色网址大全免费 | 毛片网站免费 | 小sao货水好多真紧h无码视频 | 中文字幕永久在线 | wwxx日本 | 神马午夜不卡 | 在线观看欧美视频 | 日本三级视频在线 | 91免费毛片| 亚洲资源网 | 一区二区三区小说 | 天天操夜夜草 | 草草在线免费视频 | 亚洲欧美另类在线视频 | 美女扒开屁股让男人捅 | 麻豆精品久久久久久久99蜜桃 | 天天综合网久久 | 亚洲国产日韩在线观看 | 污网站在线看 | 亚洲美女福利视频 | 在线观看99 | 国产又粗又大又爽视频 | 少妇熟女高潮流白浆 | av资源免费观看 | 欧美性色网站 | 久色99| 国产视频久久久久久 | 女儿的朋友5中汉字晋通话 欧美成人免费高清视频 | 视频久久 | 中文字幕一区二区三区视频 | 无码人中文字幕 | eeuss一区 | 国产大片一区二区 | 国产制服91一区二区三区制服 | 91在线视频网址 | 成年人免费看视频 | 国产成人精品一区二区三区四区 | 草逼网站| 麻豆视频国产精品 | 操你妹影院| 欧美绿帽合集videosex | 在线a天堂 | 国精产品一二三区精华液 | 亚洲欧美综合自拍 | jzzijzzij亚洲成熟少妇在线播放 狠狠躁日日躁夜夜躁2022麻豆 | 亚洲精品国产99 | 神马久久久久久 | 黄色骚视频 | 夜夜嗨网站| 日日草夜夜草 | 中文无码日韩欧 | 一区二区三区黄色录像 | 中日韩午夜理伦电影免费 | 国产精品免费av一区二区三区 | 亚洲熟女综合色一区二区三区 | 亚洲a在线观看 | 波多野结衣福利视频 | 婷婷色伊人 | 久夜精品 | 伊人婷婷久久 | 久久精品视频一区 | 91在线观看免费 | 九色蝌蚪视频 | 欧美成人一二三 | 玖玖爱免费视频 | 精人妻一区二区三区 | 五月天综合激情网 | 午夜精品无码一区二区三区 | 手机看片福利久久 |