當(dāng)前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

Exploratory Social Network Analysis with Pajek（第三版）12

發(fā)布時間：2024/3/24 编程问答 41 豆豆

生活随笔收集整理的這篇文章主要介紹了 Exploratory Social Network Analysis with Pajek（第三版）12 小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

第五部分建模

在??最后一部分，我們將注意力從純粹的網(wǎng)絡(luò)結(jié)構(gòu)探索性描述轉(zhuǎn)移到建模上。介紹了兩種類型的建模：塊模型（第 12 章）和隨機圖模型（第 13 章）。
內(nèi)聚性、中介和等級與社會角色相關(guān)：成為團體的成員、調(diào)解人或上級。這些角色中的每一個都與特定的關(guān)系模式相關(guān)聯(lián)。塊模型描述了整個網(wǎng)絡(luò)中的社會角色和相關(guān)聯(lián)的模式。塊模型對前面章節(jié)中討論的概念提供了不同的視角。
我們的網(wǎng)絡(luò)結(jié)構(gòu)可以是隨機的嗎？網(wǎng)絡(luò)探索會產(chǎn)生網(wǎng)絡(luò)結(jié)構(gòu)屬性的值，例如內(nèi)聚性、中心性和排名。我們假設(shè)結(jié)構(gòu)屬性是由網(wǎng)絡(luò)中代表的人做出的選擇產(chǎn)生的——與誰聯(lián)系，不與誰聯(lián)系——并且結(jié)構(gòu)屬性對他們的態(tài)度和行為產(chǎn)生影響。網(wǎng)絡(luò)結(jié)構(gòu)的社會原因和后果賦予結(jié)構(gòu)指數(shù)以意義。隨機圖模型向我們展示了我們對網(wǎng)絡(luò)屬性和影響來自社交而不是隨機過程。

十二、Blockmodels

12.1 簡介

在本書的前幾部分中，我們介紹了用于分析社會網(wǎng)絡(luò)的廣泛技術(shù)。我們發(fā)現(xiàn)，一個結(jié)構(gòu)概念通常可以通過多種方式來衡量（例如，中心性）。我們還沒有遇到相反的情況，即一種技術(shù)能夠檢測不同類型結(jié)構(gòu)（例如，內(nèi)聚性和中心性）。在最后一章中，我們介紹了一種稱為塊建模的技術(shù)。
塊建模是一種分析社會網(wǎng)絡(luò)的靈活方法。一些網(wǎng)絡(luò)概念對異常很敏感；例如，單個弧可以將有等級變成無等級群組（第 10 章）。經(jīng)驗數(shù)據(jù)很少是完美的，因此我們需要一個工具來檢查允許異常或錯誤的社會網(wǎng)絡(luò)的結(jié)構(gòu)特征。密切相關(guān)的塊建模和層次聚類就是這樣的工具。
盡管塊建模是一種能夠檢測內(nèi)聚力、核心-外圍結(jié)構(gòu)和排序的技術(shù)，但它并不能取代前面章節(jié)中介紹的技術(shù)。目前，塊建模僅對小型密集網(wǎng)絡(luò)可行且有效，而其他技術(shù)在大型或稀疏網(wǎng)絡(luò)上效果更好。此外，塊建模基于不同的結(jié)構(gòu)概念：對等和位置，這與社會角色和角色集的理論概念有關(guān)。塊模型將頂點分組并確定這些群組（Cluster）之間的關(guān)系（例如，一個群組（Cluster）是中心，另一個是外圍）。相比之下，前幾章討論的技術(shù)，例如中心性度量，分別計算每個頂點的結(jié)構(gòu)位置。
塊建模使用矩陣作為計算工具和結(jié)果的可視化。因此，我們先介紹矩陣作為表示社會網(wǎng)絡(luò)的一種手段，然后再討論等價的概念和塊建模的技術(shù)。

12.2 矩陣和排列

在社會網(wǎng)絡(luò)分析中，除了社會圖之外，矩陣已經(jīng)被使用了很長時間。矩陣是表示小型社會網(wǎng)絡(luò)和計算其結(jié)構(gòu)結(jié)果的有效工具。此外，矩陣提供了關(guān)于小型和密集網(wǎng)絡(luò)結(jié)構(gòu)的視覺線索，這就是我們在本節(jié)中使用它們的目的。

矩陣是包含行和列的雙向表。行和列的交點稱為矩陣的一個單元。圖 108 顯示了木材加工廠罷工員工的通信網(wǎng)絡(luò)矩陣（參見第 7 章）。在這個矩陣中，每一行和每一列都代表網(wǎng)絡(luò)的一個頂點，例如，第一（最高）行和第一（左）列特征為 Xavier。此行或列中的單元格顯示 Xavier 的關(guān)系。在圖 108 中，黑色單元格表示 Xavier 與另一名員工（或與他自己）通信，白色（空）單元格表示沒有通信。請注意，矩陣通常包含數(shù)字，例如，1 表示存在關(guān)系，0 表示沒有關(guān)系。在圖 108 中，我們將數(shù)字替換為黑色或白色方塊以突出顯示圖案
這種類型的矩陣稱為鄰接矩陣，因為我們可以從中看出哪些頂點是網(wǎng)絡(luò)中的鄰居（相鄰）；例如，第一行的黑色單元格表示 Xavier（頂點 1）與 Wendle（頂點 11）和 Sam（頂點 15）進行通信。更準(zhǔn)確地說，這些黑色單元格表明 Xavier 與 Wendle 和 Sam 之間存在聯(lián)系。行條目包含邊的發(fā)送者，列條目包含其接收者，因此第一行包含來自 Xavier 的邊，第一列顯示與 Xavier 的邊（例如，來自 Wendle 和 Sam）。 Xavier 在他的行和列中具有相同的鄰居并非巧合：網(wǎng)絡(luò)是無向的，因此 Xavier 與 Wendle 的通信意味著 Wendle 與 Xavier 進行通信，等等。一條邊相當(dāng)于一條雙向弧，因此一條邊由鄰接矩陣中的兩條弧表示。一般來說，無向網(wǎng)絡(luò)的鄰接矩陣是關(guān)于從矩陣的左上角到右下角的對角邊對稱的，該對角邊通常稱為矩陣的對角邊。
圖 108 的鄰接矩陣在對角線上不包含黑色單元格，因為這些單元格表示頂點與其自身的關(guān)系，并且不考慮員工與自己進行通信。鄰接矩陣對角線上的單元格通常會受到特殊處理，因為它們具有環(huán)。
因為相同的頂點定義了鄰接矩陣的行和列，所以鄰接矩陣根據(jù)定義是正方形的。相比之下，雙模網(wǎng)絡(luò)（例如第 5 章的蘇格蘭董事網(wǎng)絡(luò)）由矩形矩陣表示，但不一定是正方形。我們可以將公司放在行中，將董事放在列中，并且仍然包括該矩陣的單元格中的所有關(guān)系，因為公司只能與董事直接相關(guān)。這樣的矩陣稱為從屬矩陣。在從屬矩陣中，對角單元格不代表環(huán)。
矩陣中黑色單元格的模式提供了網(wǎng)絡(luò)結(jié)構(gòu)的視覺邊索，因為我們可以看到哪些邊存在（黑色）或不存在（白色）關(guān)系。然而，就像社會圖一樣，矩陣只有在仔細放置其頂點時才能揭示網(wǎng)絡(luò)結(jié)構(gòu)。例如，圖 108 顯示了看似隨機的黑色單元格圖案。它不會揭示網(wǎng)絡(luò)的結(jié)構(gòu)，因為員工是按任意順序列出的。如果我們按他們的語言（英語或西班牙語）和年齡（小于或大于 30 歲）對它們進行排序，黑色單元格會顯示出更加規(guī)則的模式（圖 109）。現(xiàn)在，很容易看出這些界邊主要出現(xiàn)在種族和年齡組中：各組之間不超過 3 條界邊（Karl-Ozzie、Bob-Norm 和 Bob-Alejandro）。

頂點的重新排序或排序稱為網(wǎng)絡(luò)排列。本質(zhì)上，排列是一個網(wǎng)絡(luò)的每個頂點都有一個條目、并指定其新的頂點編號的列表。換句話說，排列是網(wǎng)絡(luò)中頂點的重新編號。

網(wǎng)絡(luò)的排列是對其頂點的重新編號。

如果我們?yōu)轫旤c分配新的數(shù)字，網(wǎng)絡(luò)的結(jié)構(gòu)不會改變。例如，比較圖 110 中的網(wǎng)絡(luò) A 和 B。我們交換了頂點 2 和 4 的數(shù)量，但這并不影響網(wǎng)絡(luò)的結(jié)構(gòu)：網(wǎng)絡(luò) A 和 B 是同構(gòu)的；也就是說，它們具有相同的結(jié)構(gòu)。在矩陣中，我們交換了行和列中的頂點數(shù)，并對矩陣進行了重新排序，從而為相同的結(jié)構(gòu)獲得了不同的矩陣。

這些矩陣看起來不同，但它們描述了相同的結(jié)構(gòu)。這意味著我們可以用許多不同的矩陣來表示同一個網(wǎng)絡(luò)，就像我們可以為一個網(wǎng)絡(luò)繪制許多不同的社會圖一樣。置換重新排列矩陣就像能量命令重繪社會圖。因此，我們可以使用排列來找到揭示網(wǎng)絡(luò)結(jié)構(gòu)的矩陣。后續(xù)部分將展示如何執(zhí)行此操作。
按種族和年齡組排列的罷工網(wǎng)絡(luò)（圖 109）顯示了表征內(nèi)聚子組的模式：黑色（非空）條目聚集在矩陣的對角邊周圍，在那里它們形成團塊。這些團塊確定了主要在其群體內(nèi)保持聯(lián)系的行為者的子群體。在我們的示例中，這些團塊很好地反映了種族和年齡組。
應(yīng)用
由于矩陣可以表示網(wǎng)絡(luò)，因此可以以矩陣格式存儲網(wǎng)絡(luò)數(shù)據(jù)。對于小型網(wǎng)絡(luò)，矩陣是我們迄今為止用作網(wǎng)絡(luò)數(shù)據(jù)文件格式的弧和邊的傳統(tǒng)且有用的替代方案。 Pajek可以讀取矩陣格式的數(shù)據(jù)；有關(guān)詳細信息，請參閱附錄 1（第 A1.2 和 A1.3 節(jié)），其中還討論了矩陣格式的一些缺點。
在 Pajek 中，您可以通過在網(wǎng)絡(luò)下拉菜單中雙擊其名稱來顯示網(wǎng)絡(luò)矩陣。在出現(xiàn)的對話框中，如果要顯示二值矩陣，請輸入 1，即僅說明一條邊是存在 (#) 還是不存在 (.) 的矩陣。圖 111 顯示了原始罷工網(wǎng)絡(luò)的一部分（包含在 Pajek 項目文件strike.paj 中）顯示為二值矩陣。請注意，列表由未格式化的原始文本組成，因此應(yīng)該以固定的寬字體顯示，例如 Courier。如果要在鄰接矩陣中顯示行值，請在對話框中鍵入 2 以獲得值矩陣。在有值矩陣中，缺失的行由單元格中的 0 表示。

在 Pajek 中，不能以這種方式顯示 100 個或更多頂點的網(wǎng)絡(luò)，因為它們會產(chǎn)生巨大的矩陣。因此，選項“二值”和“邊值”不適用于大型網(wǎng)絡(luò)，她會自動報告為弧和邊的列表。在這些列表中，每一行代表一個頂點，由它的編號和標(biāo)簽標(biāo)識，后跟從它接收一條邊的所有頂點的編號。這種類型的列表也是顯示小型網(wǎng)絡(luò)的第三個選項（“列表”）。
原始文本矩陣不適合高質(zhì)量打印。為此，可以使用命令 File> Network> Export as Matrix to EPS> Original in PostScript （EPS是 Encapsulated PostScript的意思）格式保存矩陣。邊值會自動轉(zhuǎn)換為單元格的暗度。可以通過這種方式導(dǎo)出更大的網(wǎng)絡(luò)，但大型矩陣通常對于可視化檢測網(wǎng)絡(luò)結(jié)構(gòu)不是很有幫助。
正如我們所論證的，如果對矩陣進行重新排序，它通常會提供更多信息。在罷工網(wǎng)絡(luò)的示例中，我們必須根據(jù)他們在種族和年齡組中的成員資格對頂點進行重新排序，這可以作為一個partition 提供給我們（strike_groups.clu包含在項目文件strike.paj中）。很容易從一個partition 派生一個排列，使得同一類中的頂點接收連續(xù)的數(shù)字：在partition 下拉菜單中選擇partition 并執(zhí)行位于partition 菜單中的 Make Permutation 命令。
鑒于該命令經(jīng)常使用，您也可以通過按 F3 來運行它。 Pajek 創(chuàng)建一個新的排列，將最小的頂點數(shù)分配給partition 的第一類中的頂點，依此類推。
排列顯示在 Pajek 主屏幕的排列下拉菜單中。您可以以通常的方式檢查和編輯排列。當(dāng)你編輯一個排列時，你會看到每個頂點的一行包含兩個數(shù)字。第一個數(shù)字是新的頂點編號，第二個數(shù)字是原始的頂點編號。如果網(wǎng)絡(luò)下拉菜單中的適當(dāng)?shù)木W(wǎng)絡(luò)處于活動狀態(tài)，則還會顯示頂點標(biāo)簽。

在各自的下拉菜單中選擇網(wǎng)絡(luò)、partition 和排列后，您可以使用命令File> Network>Export as Matrix to EPS> Using Permutation + Partition （或快捷鍵 F4)。一個對話框提示輸入矩陣將要保存的文件的名稱。在能夠讀取 PostScript 的查看器中（可下載GhostScrip查看該文件），結(jié)果應(yīng)類似于圖 112。查看File> Network> Export as Matrix to EPS> Options 子菜單中還提供了一些其他選項，例如，將負值繪制為菱形（用于簽名圖）、以灰度繪制、在頂部/右側(cè)顯示標(biāo)簽、使用partition 顏色顯示標(biāo)簽。

種族和年齡組的排列也可以用來對網(wǎng)絡(luò)本身進行重新排序。如果在其下拉菜單中選擇了網(wǎng)絡(luò)和排列，則Operations> Network + Permutation> Reorder Network命令會創(chuàng)建一個新的排列網(wǎng)絡(luò)。通過雙擊下拉列表中（新生成的network)的名稱，（在彈出的對話框中填入1）將重新排序的網(wǎng)絡(luò)顯示為二值矩陣，您將看到四名西班牙裔員工收到了從 1 到 4 的頂點編號（圖 113）。請注意，根據(jù)種族和年齡的原始partition 與排列后的網(wǎng)絡(luò)不兼容，但也可以重新排序：確保原始partition 和排列在其下拉菜單中處于活動狀態(tài)并執(zhí)行命令Operations> Partition + Permutation> Reorder Partition 。以同樣的方式向量可以重新排序。

12.3 角色和位置：等價

在社會理論中，位置和角色是重要且相關(guān)的理論概念。一個位置，例如在大學(xué)擔(dān)任導(dǎo)師的位置，通常與社會角色或角色集相關(guān)，即輔導(dǎo)學(xué)生和與同事協(xié)商。假設(shè)這個角色或角色集涉及與學(xué)生、同事和上級的特定關(guān)系和關(guān)系模式。社會學(xué)家、社會心理學(xué)家和其他社會科學(xué)家通過觀察互動和采訪人們關(guān)于他們的動機和他們所扮演角色的看法來研究社會角色和角色集的性質(zhì)。
在社會網(wǎng)絡(luò)分析中，我們專注于關(guān)系的模式。我們想識別具有相似關(guān)系模式的參與者，以發(fā)現(xiàn)他們是否與特定角色或角色集相關(guān)聯(lián)，或者我們想檢查具有相似角色集的人是否參與了特征關(guān)系模式。在社會網(wǎng)絡(luò)分析中，位置等同于特定的關(guān)系模式。具有相似關(guān)系模式的參與者被認為是關(guān)系等價的，構(gòu)成一個等價類，或在網(wǎng)絡(luò)中占據(jù)等價位置。

圖 114 提供了一個簡單的示例來說明這些想法。一個系內(nèi)的兩名導(dǎo)師（i1 和 i2）指導(dǎo)三名學(xué)生（s1 到 s3）。他們聯(lián)系學(xué)生，學(xué)生聯(lián)系他們。教官互動，所以他們是一個有內(nèi)聚性的子組，他們間的互動可能會導(dǎo)致他們以類似的方式行事。然而，這三個學(xué)生并不一定互動。盡管如此，他們對于導(dǎo)師來說處于相同的位置；因此，他們可能會對他們采取類似的行動。盡管它們不是內(nèi)聚的子群，但它們在關(guān)系上是等價的。重要的是要注意，與其他位置成員的外部聯(lián)系、和“位置跟內(nèi)部的聯(lián)系等價”的概念同樣重要。
圖 114 是一個小型核心-外圍結(jié)構(gòu)的示例，其中兩名導(dǎo)師構(gòu)成核心（一個位置），學(xué)生構(gòu)成外圍（另一個位置）。聯(lián)系主要發(fā)生在核心內(nèi)部以及核心與外圍之間（外圍之間聯(lián)系不多），因此我們在排列矩陣中看到水平和垂直的關(guān)系帶（是條形，不是矩形）。
到目前為止，我們已經(jīng)大致描述了等價的概念。現(xiàn)在讓我們正式定義一種等價，即結(jié)構(gòu)等價：如果兩個頂點與自身、彼此以及所有其他頂點具有相同的聯(lián)系，則它們是結(jié)構(gòu)等價的。這個定義意味著可以交換結(jié)構(gòu)等價的頂點，而不會對網(wǎng)絡(luò)的結(jié)構(gòu)產(chǎn)生任何影響。

如果兩個頂點與自身、彼此以及所有其他頂點具有相同的聯(lián)系，則它們是結(jié)構(gòu)等價的。

在我們的示例中，弧要么存在要么不存在，讓我們比較核心中的兩個頂點（導(dǎo)師 i1 和 i2）。顯然，這兩位導(dǎo)師與他們自己和彼此之間有著相同的聯(lián)系：他們都沒有與自己交流（沒有環(huán)），并且他們之間的聯(lián)系是對稱的。此外，它們與另一個位置的頂點——學(xué)生——的聯(lián)系也是相同的。如果導(dǎo)師 i1 連接到學(xué)生（例如，學(xué)生 s2），則另一個導(dǎo)師也連接到該學(xué)生。結(jié)果，除了對角邊上的單元格之外，兩位導(dǎo)師的行是相同的，因為他們不應(yīng)聯(lián)系自己。他們的列也是如此，它們代表了導(dǎo)師收到的邊。我們可以在不改變網(wǎng)絡(luò)結(jié)構(gòu)的情況下交換兩位導(dǎo)師。
一般來說，我們可以說結(jié)構(gòu)等價的頂點在鄰接矩陣中具有相同的行和列（對角邊上的單元格除外）。考慮到這一點，很容易看出外圍的三個學(xué)生（s1、s2和s3）不是完全結(jié)構(gòu)等價的，因為頂點s2與頂點s1相關(guān)，但反過來不成立，所以他們沒有彼此相同的聯(lián)系。學(xué)生 s3 與 s1 無聯(lián)系，因此他或她在結(jié)構(gòu)上不等同于 s2。

結(jié)構(gòu)等價是基于頂點之間關(guān)于它們在鄰接矩陣中行和列的型（ profile）的相似性或不相似性。兩個頂點的不相似性可以通過一個范圍從 0（完全相似）到 1（完全不同）的指標(biāo)來計算和表示。在圖 114 中，導(dǎo)師 i1 的行和列與導(dǎo)師 i2 的行和列完全相似，因此它們的不相似性得分為 0（見表 23）。學(xué)生 s1、s2 和 s3 在這方面并不完全相似，因此他們的不相似性得分大于 0（范圍從 0.0625 到 0.125），但他們彼此之間的相似度高于核心導(dǎo)師（不相似性為 0.1875或 0.25）。
知道所有頂點對之間的不相似性，我們?nèi)绾螌?#xff08;幾乎）結(jié)構(gòu)等價的頂點在位置上聚集到一起？這可以通過一種眾所周知的統(tǒng)計技術(shù)來實現(xiàn)，這種技術(shù)稱為層次聚類。首先，該技術(shù)將最相似的頂點分組。在我們的示例中，導(dǎo)師 i1 和 i2 的關(guān)系完全相似，它們被合并到一個群組中。然后，層次聚類對下一對最相似的頂點或群組進行分組，并繼續(xù)進行，直到所有頂點都已連接。

圖 115 被稱為樹狀圖（ dendrogram），可視化了聚類過程。你必須從左到右閱讀它。首先，導(dǎo)師 i1 和 i2 被加入，因為它們完全相似：他們的不相似性為 0。然后，學(xué)生 s1 和 s3 被加入（不相似性為 0.06，參見表 23）。第三步，將學(xué)生 s2 添加到 s1 和 s3 的群組中。最后，在群組合并的最后一步中，將該群組與核心頂點群組i1 和 i2）合并。
在樹狀圖中，水平分支的長度代表了兩個頂點或群組在連接時的相異程度，因此您可以看到最后一步合并了兩個非常不同的群組。如果要將頂點劃分為兩個群組，則應(yīng)將導(dǎo)師與學(xué)生分開。通常，在分支進行大跳躍的地方拆分群組的層次結(jié)構(gòu)。通過這種方式，您可以檢測結(jié)構(gòu)等價或幾乎結(jié)構(gòu)等價的頂點群組（Cluster）。
應(yīng)用

讓我們將結(jié)構(gòu)等價的概念應(yīng)用于我們在第 2 章中介紹過的世界貿(mào)易網(wǎng)絡(luò)。Pajek 項目文件 world_trade.paj 包含網(wǎng)絡(luò)和標(biāo)識 1980 年世界系統(tǒng)位置的partition 。圖 116 展示包含1980 年已知世界系統(tǒng)位置的國家的矩陣（我們從網(wǎng)絡(luò)中提取partition 的第 1 到第 4 類，Operations>Network + Partition> Extract> SubNetwork Induced by Union of Selected Clusters。邊值表示金屬五金制品的進口總值；它們由 PostScript 矩陣中單元格的顏色表示：較高的值由較暗的單元格表示。由于幾個國家的商品貿(mào)易量非常大，因此進口總額的分布高度傾斜。我們將所有超過 10 億美元的進口商品更改為 10 億美元，以便為總價值較低的貿(mào)易關(guān)系獲得稍暗的單元格。請注意，這些調(diào)整只是為了更好地顯示矩陣。我們在本節(jié)的其余部分使用原始貿(mào)易網(wǎng)絡(luò)。
網(wǎng)絡(luò)是有向的，因此矩陣不是對稱的，盡管進口值通常與出口值在同一范圍內(nèi)。該矩陣揭示了我們之前提到的核心-外圍結(jié)構(gòu)的一些特征：核心內(nèi)部以及核心與半外圍之間的許多強聯(lián)系，但半外圍與外圍之間的聯(lián)系很少且弱。結(jié)果，聯(lián)系集中在與核心國家相關(guān)的水平和垂直條帶上。
Cluster> Create Complete Cluster
現(xiàn)在，讓我們計算原始貿(mào)易網(wǎng)絡(luò)中國家的行和列的不相似性。首先，我們必須做一個預(yù)備步驟。不相似性方法計算復(fù)雜，因此應(yīng)該用于小型網(wǎng)絡(luò)或大型網(wǎng)絡(luò)的一小部分。因此，該方法要求我們指出它應(yīng)該使用哪些頂點。我們必須在稱為群組的特殊數(shù)據(jù)對象中識別它們。在我們的示例中，我們想要包括所有國家，因此我們使用 Cluster> Create Complete Cluster 命令創(chuàng)建一個包含所有頂點的群組。網(wǎng)絡(luò)中的頂點總數(shù)默認顯示在該命令發(fā)出的對話框中，因此您只需按 OK 按鈕即可。由該命令創(chuàng)建的群組在群組下拉菜單中列出，并且可以按照通常的方式進行編輯。
Partition> Make Cluster> Vertices from selected Clusters
但是，如果要將分析限制在網(wǎng)絡(luò)的一部分，請確定要在partition 中計算不相似性的頂點，并將此partition 中所需的一個或多個類轉(zhuǎn)換為使用 Partition> Make Cluster> Vertices from selected Clusters 命令進行群組。對話框?qū)⑻崾灸斎氡仨氝x擇的partition 的類號或類號范圍。例如，您可以通過將世界系統(tǒng)位置partition 的第 1 類轉(zhuǎn)換為群組來限制對 1980 年核心國家的不相似性計算。在這種情況下，我們接下來討論的不相似性命令僅計算核心國家的不相似性，但它考慮了核心國家與非核心國家的聯(lián)系。
因為我們需要一個網(wǎng)絡(luò)和一個群組來計算 Pajek 中的不相似性，所以 Dissimilarity* 命令位于操作菜單中。不相似性是從網(wǎng)絡(luò)結(jié)構(gòu)中計算出來的：如果頂點有許多共同的鄰居，則它們是相似的。另一種可能性是根據(jù)向量值（基于向量）計算不相似性，這里將不討論。有幾個不同的指數(shù)，但我們只展示和使用指數(shù) d1。查閱數(shù)字分類手冊以了解有關(guān)其他指數(shù)的更多信息（參見本章末尾的“進一步閱讀”）。兩個頂點的不相似性d1 只是它們不共享的鄰居的數(shù)量（歸一化為 0-1 區(qū)間）。該索引可能僅限于輸入鄰居（輸入；比較列）或輸出鄰居（輸出；比較行），或者它可以同時考慮輸入和輸出鄰居（ All ）。除非您有充分的理由專注于輸入或輸出鄰居，否則請選擇 All 命令。
d1 不相似性指數(shù)檢查頂點的鄰居們，因此它不考慮邊的值。如果您希望不相似性分數(shù)反映邊值，您應(yīng)該選擇歐幾里得或曼哈頓距離指數(shù)（d5 和 d6）。在世界貿(mào)易的示例中，使用歐幾里得或曼哈頓距離將要求結(jié)構(gòu)等價國家不僅要向同一個國家出口和從同一個國家進口，而且除此之外，還需要具有可比強度的貿(mào)易聯(lián)系。然而，這可能是一個過于苛刻的標(biāo)準(zhǔn)，因為各國的進口價值差異很大。因此，我們在這里推薦 d1 指數(shù)。
現(xiàn)在執(zhí)行Operations> Network + Cluster> Dissimilarity? > Network based> d1> All 命令。如果先前已選擇選項Operations> Network + Cluster> Dissimilarity? > Network based> Options> Report Matrix ，則 Pajek 計算不相似性并在報告屏幕中報告它們（注意：不要選擇此子菜單中的其他選項）。該命令將不同之處存儲為新網(wǎng)絡(luò)中的行值，您可以以通常的方式列出或打印（參見第 12.2 節(jié)）。請注意，此網(wǎng)絡(luò)是有向的且非常密集，因為每對不完全相似的頂點（因此：不相似性大于 0）由一對弧連接。作為一項規(guī)則，不要對這個網(wǎng)絡(luò)嘗試繪制和應(yīng)用彈力布局。
在執(zhí)行一個 dissimilarities 命令時，Pajek 會自動嘗試將層次聚類應(yīng)用于新創(chuàng)建的不相似性網(wǎng)絡(luò)。它提示用戶指定存儲聚類樹狀圖的文件的名稱。樹狀圖已保存但未顯示，因為它采用EPS格式。您可以使用 PostScript 解釋器（參見附錄 2）查看它（圖 117），將其插入 Word 或其他文本編輯器，或在 PostScript 打印機上打印。此外，層次聚類的結(jié)果被保存為排列和層次。

世界貿(mào)易網(wǎng)絡(luò)的樹狀圖，如圖 117 所示，顯示了貿(mào)易網(wǎng)絡(luò)中兩個非常不同的群組：10個西歐國家、美國、日本和中國與其余67個國家明顯分開，其中大部分是較貧窮的國家。
這也可以從由 Dissimilarity* 命令創(chuàng)建的層次結(jié)構(gòu)中推斷出來，該命令標(biāo)記為“erarchical Clustering [Ward]”。請注意，“Ward”是指 Pajek 中默認的層次聚類方法。其他方法可從 Network>Create Hierarchy>Clustering* 對話屏幕訪問。在編輯屏幕中打開層次結(jié)構(gòu)（單擊層次結(jié)構(gòu)下拉菜單左側(cè)帶有放大鏡的按鈕），然后通過單擊展開根以及下一層群組以獲得在圖 118 中所描繪的列表。根將兩個主要群組聯(lián)合起來。方括號中的數(shù)字告訴您連接的群組或頂點的不同之處；較大的值意味著它們更不相似。十三個國家的群組在內(nèi)部比較大的群組（0.84）更相似（0.64），這對應(yīng)于樹狀圖中較大組內(nèi)的第一個拆分比較小組內(nèi)的拆分更準(zhǔn)確的事實（圖 117）。
[Hierarchy Edit screen] Edit> Show Subtree
我們?nèi)绾沃滥男﹪覍儆谀硞€特定群組？我們可以通過以下方式在 Hierarchy Edit 屏幕中找到國家的名稱，前提是網(wǎng)絡(luò)下拉菜單中的適當(dāng)網(wǎng)絡(luò)處于活動狀態(tài)。首先，確保在層次結(jié)構(gòu)的編輯屏幕的編輯菜單中選擇了Show Subtree選項。否則，Pajek 僅顯示在當(dāng)前層次聚類步驟中添加到聚類中的頂點的名稱。其次，通過左鍵單擊（選擇它）并隨后右鍵單擊它，在編輯屏幕中選擇一個群組。在一個新窗口中，列出了該群組及其所有子群組中的頂點的數(shù)量和標(biāo)簽。例如，如果將其應(yīng)用于標(biāo)記為“100071”的群組，您將看到它包含奧地利、瑞士、比利時/盧森堡、荷蘭、瑞典和西班牙。
層次聚類逐漸將頂點合并為群組，將小群組合并為較大的群組。哪些群組代表結(jié)構(gòu)等價類，哪些不代表？在結(jié)構(gòu)等價的嚴格方法下，不相似性為零的頂點是結(jié)構(gòu)等價的。然而，在真實的社會網(wǎng)絡(luò)中，很少發(fā)現(xiàn)這樣的頂點，所以我們考慮不是很相似的頂點群組來表示結(jié)構(gòu)等價類。
哪些頂點不是很不同？這個問題沒有一般的答案。由你決定你想要的等價類的數(shù)量，也就是說，你想要切割樹狀圖的次數(shù)，但你應(yīng)該總是從“右到左”切割它：首先分離最不相似的群組。在世界貿(mào)易示例中，您應(yīng)該首先將 13 個富裕國家與其他國家分開。然后，您可以在新的群組中進行細分，因為這些國家 (0.84) 比 13 個富裕國家 (0.64) 更加不同，依此類推，直到您達到所需的等價類數(shù)量或進一步細分似乎是任意或無意義。
讓我們將貿(mào)易網(wǎng)絡(luò)劃分為四個結(jié)構(gòu)等價類，因為我們劃分為四個世界系統(tǒng)位置（核心、強半外圍、弱半外圍和外圍）。我們拆分了 67 個國家的群組（相異度為 0.84）及其最大的子群組（相異度為 0.78）。現(xiàn)在，我們可以從標(biāo)識這四個群組的層次結(jié)構(gòu)中創(chuàng)建一個partition 。這分兩步完成。
首先，我們必須關(guān)閉層次結(jié)構(gòu)中不想進一步拆分的群組。通過在 Hierarchy Edit 屏幕中左鍵單擊群組來選擇群組，然后從 Hierarchy Edit 屏幕的 Edit 菜單中選擇 Change Type 或按 Ctrl-t。現(xiàn)在，消息（關(guān)閉）出現(xiàn)在所選群組的后面。對必須關(guān)閉的其他群組重復(fù)此操作，但不要將其應(yīng)用于任何必須細分的群組。
其次，從主屏幕的 Hierarchy 菜單中執(zhí)行 Make Partition 命令。此命令創(chuàng)建一個partition ，其中每個關(guān)閉的群組都由同一個類表示。當(dāng)您在原始世界貿(mào)易網(wǎng)絡(luò)中繪制此partition 時，您會注意到等價類代表貿(mào)易位置和地理位置的混合；核心國家是西歐國家、美國、日本和中國，從三個區(qū)域位置劃分：美洲、亞洲與大洋洲、歐洲（包括前殖民地）與中東。
File> Network> Export as Matrix to EPS> Using Permutation + Partition
到目前為止，我們已經(jīng)討論了由 Dissimilarities 命令創(chuàng)建的樹狀圖和層次結(jié)構(gòu)，但沒有討論排列。該排列被標(biāo)記為“分層聚類排列 [Ward]”，它標(biāo)識了樹狀圖中表示的頂點的順序。當(dāng)您要打印由層次聚類結(jié)果重新排序的矩陣時，可以使用此排列。它與從層次結(jié)構(gòu)中創(chuàng)建的Partition匹配，因此您可以獲得一個帶有藍色線的矩陣，指示您在群組層次結(jié)構(gòu)中所做的拆分（請參閱第 12.2 節(jié)）。

12.4 塊建模

在前面的部分中，我們用（藍色）線繪制了鄰接矩陣來劃分頂點類別，例如，罷工員工中的種族/年齡組（第 12.2 節(jié)）、小型網(wǎng)絡(luò)中的導(dǎo)師與學(xué)生以及世界系統(tǒng)位置貿(mào)易網(wǎng)絡(luò)中的國家位置（第 12.3 節(jié)）。至此，我們應(yīng)該注意到，這些線將鄰接矩陣劃分為矩形，這些矩形稱為塊。

一個塊包含屬于一個或兩個類的橫截面的鄰接矩陣的單元。

我們可以通過分析鄰接矩陣的塊來描述網(wǎng)絡(luò)的結(jié)構(gòu)（在位置內(nèi)和位置之間）。對角線上的塊表示一個位置內(nèi)的關(guān)系。在理想的核心-外圍結(jié)構(gòu)中（例如，圖 119），頂點在核心內(nèi)連接（頂點 i1 和 i2），而外圍頂點（s1 到 s3）間不直接鏈接。對角線以外的塊代表類之間的關(guān)系，即核心與外圍之間的關(guān)系。學(xué)生的身份來自他們對導(dǎo)師的依賴，而不是來自他們的內(nèi)在聯(lián)系（實際上，他們就是基于缺乏內(nèi)在聯(lián)系而被識別的）

12.4.1 塊模型

包含結(jié)構(gòu)等價類的網(wǎng)絡(luò)的鄰接矩陣有一個非常顯著的特征，即如果我們忽略對角線上的單元，它們的塊要么是完全的要么是空的（空塊）。這源于結(jié)構(gòu)等價標(biāo)準(zhǔn)，即等價頂點具有相同的行和列。
為了理解這一點，假設(shè)圖 119 的學(xué)生之間存在一條聯(lián)系，例如從 s2 到 s1。結(jié)構(gòu)等價頂點必須彼此具有相同的聯(lián)系，因此 s1 也必須連接到 s2。如果所有學(xué)生都是結(jié)構(gòu)等價的，則 s3 必須與 s1 和 s2 具有相同的關(guān)系，因此它必須與 s1 和 s2 鏈接。現(xiàn)在，除了對角線之外，該塊已完成。這也適用于位置之間的聯(lián)系。
現(xiàn)在我們知道具有結(jié)構(gòu)等價類的網(wǎng)絡(luò)的鄰接矩陣只包含完全塊和空塊，我們可以通過將每一類頂點收縮到一個新頂點（矩陣中的元素）來簡化鄰接矩陣并標(biāo)記塊新矩陣中每個單元格的類型，在結(jié)構(gòu)等價的情況下，它要么是完全的（com）要么是空的（- 或 null）。這個壓縮矩陣稱為鏡像矩陣（ image matrix），它包含原始鄰接矩陣中存在的所有信息。圖 120 顯示了一個簡單的核心-外圍結(jié)構(gòu)的鏡像矩陣和等價類（位置）內(nèi)部和之間的關(guān)系的圖形表示，其中弧表示完全的塊，而弧的缺失表示空塊。

塊模型將網(wǎng)絡(luò)的頂點分配給類，并指定類內(nèi)和類之間允許的關(guān)系類型。

鏡像矩陣是我們定義塊模型所需的最后一個要素。網(wǎng)絡(luò)的塊模型由partition 和鏡像矩陣組成。partition 將頂點分配給等價類，并將網(wǎng)絡(luò)的鄰接矩陣劃分為塊。鏡像矩陣指定了類內(nèi)和類之間的關(guān)系類型，因為它說明了允許哪些類型的塊以及它們可能出現(xiàn)的位置。例如，圖 119 的核心-外圍結(jié)構(gòu)的塊模型由一個partition 組成，該partition 把導(dǎo)師 i1 和 i2分配到一個類，把學(xué)生（s1、s2 和 s3）到另一個類，并指定塊之間關(guān)系的鏡像矩陣，如圖 120 所示。
塊模型描述了網(wǎng)絡(luò)的整體結(jié)構(gòu)以及該結(jié)構(gòu)中每個頂點的位置。在導(dǎo)師和學(xué)生的示例中，鏡像矩陣顯示了適用于網(wǎng)絡(luò)的等價類。該網(wǎng)絡(luò)包含結(jié)構(gòu)等價類，因為只有完全塊和空塊。此外，鏡像矩陣揭示了網(wǎng)絡(luò)的核心-外圍結(jié)構(gòu)，因為完全塊排列在一個水平帶和一個垂直帶內(nèi)。第 1 類代表核心，它是內(nèi)部鏈接的，第 2 類代表外圍。最后，partition 告訴我們哪些行為人是核心的一部分（兩名導(dǎo)師，他們構(gòu)成類 1），哪些行為人屬于外圍（類 2 的三個學(xué)生）。塊模型是表征網(wǎng)絡(luò)整體結(jié)構(gòu)和各個頂點位置的有效設(shè)備。

12.4.2 塊建模

到目前為止，我們假設(shè)我們知道網(wǎng)絡(luò)的塊模型，即頂點劃分為類和指定允許的塊類型的鏡像矩陣。在一個研究項目中，我們自然而然地反過來工作：我們有一個網(wǎng)絡(luò)，我們想找到捕捉網(wǎng)絡(luò)結(jié)構(gòu)的塊模型。
獲得此塊模型的技術(shù)稱為塊建模。一般來說，塊建模包括三個步驟。第一步，我們指定網(wǎng)絡(luò)中類的數(shù)量，例如，如果我們假設(shè)一個簡單的核心-外圍結(jié)構(gòu)，則為兩個類或位置。在第二步中，我們選擇允許出現(xiàn)的塊的類型，以及可選的鏡像矩陣中它們可能出現(xiàn)的位置。例如，在結(jié)構(gòu)等價的情況下，我們只允許出現(xiàn)完全塊和空塊，并且我們期望沿對角線出現(xiàn)一個完整塊（核心）和一個空塊（外圍）。最后，計算機根據(jù)模型指定的條件將頂點劃分為指定數(shù)量的類，并在必要時為模型選擇最終的鏡像矩陣。在第三步中，塊模型完成。
前兩步定義了鏡像矩陣：我們固定了類的數(shù)量和塊（關(guān)系）的類型，但我們還不知道哪些頂點屬于某個特定的類，有時我們不確切知道會找到哪種塊類型在鏡像矩陣的哪一部分。這是在第三步中解決的。不用說，我們必須對網(wǎng)絡(luò)有一些了解或期望，才能選擇適當(dāng)數(shù)量的類并指定有意義的類之間的關(guān)系類型。在導(dǎo)師和學(xué)生之間的聯(lián)系的示例中，我們應(yīng)該有理由或線索來期待一個核心-外圍結(jié)構(gòu)和結(jié)構(gòu)等價。
然而，經(jīng)驗網(wǎng)絡(luò)很少與鏡像矩陣所代表的構(gòu)想相匹配。會出現(xiàn)錯誤，但可以輕松檢查它們。假設(shè)你知道每個類有哪些頂點，那么你可以根據(jù)鏡像矩陣檢查鄰接矩陣的每個塊是否屬于正確的類型。事實上，您將理想矩陣（圖 119）與實際矩陣（圖 114）進行比較。在結(jié)構(gòu)等價的情況下，計算應(yīng)該為完全塊中缺少的行（在本例中沒有），并計算應(yīng)該為空塊中出現(xiàn)的行數(shù)（一個錯誤：弧從學(xué)生 s1 到學(xué)生 s2，請參見圖 121）以獲得一個誤差值，該分數(shù)表明理想矩陣與真實網(wǎng)絡(luò)的擬合程度。
在這種方法中，塊建模的第三步歸結(jié)為找到將頂點劃分為產(chǎn)生最低誤差值的等價類，即最適合理想矩陣。首先，計算機將頂點隨機分配給指定數(shù)量的類。然后，它通過將實際矩陣與由鏡像矩陣表示的理想矩陣進行比較來計算該解決方案的誤差值。接下來，它嘗試通過將隨機選擇的頂點從一個群組移動到另一個群組或通過交換不同群組中的兩個頂點來降低誤差值。它繼續(xù)這個過程，直到它不能再提高誤差值。
這種塊建模的優(yōu)化方法具有所有優(yōu)化技術(shù)（例如，Doreian-Mrvar 方法）的優(yōu)點和缺點，即如果重復(fù)應(yīng)用，它很可能找到最優(yōu)解，但大多數(shù)時候你不能確定是否存在更好的解決方案。此外，您必須意識到，其他數(shù)量的類或其他允許的塊類型可能會產(chǎn)生更適合的塊模型。通常，值得將幾個稍微不同的塊模型應(yīng)用于數(shù)據(jù)集，即對塊內(nèi)或塊之間的關(guān)系具有其他數(shù)量的類或其他約束。這強調(diào)了研究人員對假設(shè)的鏡像矩陣進行仔細考慮的重要性。此外，樹在探索性塊建模中很麻煩，因為它們包含很多頂點在類之間交換而不會對誤差值產(chǎn)生太大影響，因此僅將塊建模應(yīng)用于相當(dāng)密集的（部分）網(wǎng)絡(luò)。
在這種優(yōu)化技術(shù)中，可以對誤差進行加權(quán)并且可以使用邊值。我們在這里不做詳細介紹，但應(yīng)該注意的是，誤差值越低表示擬合越好，誤差值為 0 始終代表完美擬合。
應(yīng)用
如前所述，塊建模包括三個步驟。在前兩個步驟中，指定了鏡像矩陣：類的數(shù)量以及允許的類內(nèi)和類之間的塊或關(guān)系的類型。然后，計算機通過搜索將頂點劃分為與假設(shè)的鏡像矩陣最匹配的類來完成塊模型。如果可能有多個鏡像矩陣，它會選擇最適合的一個。誤差值顯示所選鏡像矩陣與網(wǎng)絡(luò)的匹配程度。
Pajek 的塊建模命令反映了這三個步驟。然而，在我們討論這些命令之前，我們必須警告您，該方法與所有優(yōu)化技術(shù)一樣，是耗時的，因此不應(yīng)將其應(yīng)用于具有超過數(shù)百個頂點的網(wǎng)絡(luò)，在這種情況下，計算機可能需要一個全天執(zhí)行命令。因此，該命令在菜單中用星號標(biāo)記。
Operations> Network + Partition> Extract> SubNetwork Induced by Union of Selected Clusters
在 Pajek 中，有兩種塊建模方法：一種從頭開始搜索最佳擬合partition （隨機開始），而另一種只嘗試改進現(xiàn)有partition （優(yōu)化partition）。讓我們從后一種方法開始，將其應(yīng)用到以 1980 年的世界系統(tǒng)位置為起始partition 的世界貿(mào)易網(wǎng)絡(luò)中。這兩個文件都在 Pajek 項目文件 world_trade.paj 中可用。從網(wǎng)絡(luò)中刪除 1980 年世界系統(tǒng)位置未知的國家（Operations> Network + Partition> Extract> SubNetwork Induced by Union of Selected Clusters classes 1-4，參見第 12.3 節(jié)）。因此，我們選擇了 80 個國家中的 52 個（生成新network文件）。該命令還創(chuàng)建了一個新的partition ，都包含其余 52 個國家的世界系統(tǒng)位置。
Network> Create Partition> Blockmodeling? > Restricted Options Network> Create Partition> Blockmodeling? > Short Report Network> Create Partition> Blockmodeling? > Optimize Partition
我們在這里只解釋塊建模的基本選項。因此，勾選 Network> Create Partition> Blockmodeling> Restricted Options 和 Network> Create Partition> Blockmodeling* > Short Report 以獲得與本章中重現(xiàn)的相同的對話框屏幕。

當(dāng)您對塊建模更加熟悉時，您可以稍后取消選中這些選項。當(dāng)您從 Network> Create Partition> Blockmodeling? 子菜單中選擇 Optimize Partition 命令時，活動partition 指定您正在尋找的等價類的數(shù)量，這是塊建模的第一步。選擇命令后，將打開一個對話框（圖 122）。選擇框顯示最后選擇的等價類型。我們是結(jié)構(gòu)等價，因此如果列表框尚未顯示“結(jié)構(gòu)等價”，請選擇這種類型的等價。不更改任何其他選項；只需按下 RUN – Standard 按鈕即可執(zhí)行命令。我們不會在這里討論第二種可能性（RUN – Fast）。
Pajek 列出了 Report 屏幕中的初始設(shè)置，以及初始鏡像矩陣、初始誤差矩陣和初始partition 的誤差值。

最終結(jié)果：

在我們的示例中，報告了 366 個初始錯誤：在（52 × 51 = 2652）中的 366 個單元格中，導(dǎo)入在它們應(yīng)該存在的地方不存在，反之亦然。默認情況下，Pajek 不考慮行值，因此這里不關(guān)注導(dǎo)入的值。接下來，Pajek 嘗試改進partition 并創(chuàng)建它找到的最佳擬合partition ，并報告最終鏡像矩陣、最終誤差矩陣和相關(guān)的誤差值（參見圖 123）。最佳partition 比 1980 年的世界系統(tǒng)位置更適合一點，因為誤差值已經(jīng)從 366 降低到 339。但是，我們不確定相對這樣規(guī)模的網(wǎng)絡(luò)、這是一個小的還是大的誤差值，也許其他數(shù)量的類或其他允許的塊類型會產(chǎn)生更好的解決方案。
請注意，最終的鏡像矩陣具有非常清晰的結(jié)構(gòu)：第一行的單元格都是完全的，而其他所有單元格都是空的。這意味著每個核心國家（第 1 類）都向所有其他國家出口各種金??屬制品，但在塊模型中沒有其他國家出口這些產(chǎn)品：它們的行僅包含空（NULL）單元格。誤差值表明其中一些國家確實出口了各種金屬制品，但塊模型假設(shè)它們不是。
最佳擬合partition 等于最初的世界系統(tǒng)partition ，除了一個國家從核心轉(zhuǎn)移到強外圍。您可以通過在 Partitions 菜單中分別選擇初始partition 和新partition 作為第一個和第二個partition ，并執(zhí)行 Partitions> Info> Cramer’s V, Rajski, Adjusted Rand Index 命令來檢查這一點。表 24 顯示了原始（列，Partitions下拉菜單中第二個文件默認為列）和優(yōu)化partition （行，Partitions下拉菜單中第二個文件默認為行）的交叉表。幾乎所有國家都在對角邊上，表明它們?nèi)蕴幱谠瓉淼念悇e中。只有第一列中一個國家從第一行（核心）移動到第二行（強半外圍）。

Network> Create Partition> Blockmodeling* > Random Start
第二種方法在不考慮程序用戶提供的初始partition 的情況下搜索最佳擬合partition 。因此，隨機啟動命令不需要初始partition 。該命令顯示的對話框提供了指定類數(shù)（第 1 步）、等價或塊模型類型（第 2 步）和重復(fù)次數(shù)的可能性（參見圖 124）。每次重復(fù)都使用一個新的隨機partition 作為起點，以避免陷入局部最優(yōu)。通過單擊按鈕并輸入所需的數(shù)字來更改這些選擇；例如，將群組（Cluster）數(shù)更改為 4（核心、強半外圍、弱半外圍和外圍）和重復(fù)次數(shù)100.

應(yīng)用于世界貿(mào)易網(wǎng)絡(luò)中的五十二個分類國家，尋找四個聚類和結(jié)構(gòu)等價，隨機開始命令找到一個有 281 個錯誤的partition 。與 1980 年世界系統(tǒng)位置為等價類的解決方案相比，這是一個相當(dāng)大的改進。現(xiàn)在，該過程并未確定最適合初始partition 的鏡像矩陣（圖 123），但它找到了另一個鏡像矩陣（表 25；請注意，您可能會得到該鏡像矩陣的排列），其中 1 類國家出口向除第 3 類國家以外的所有其他國家制造的金屬五金制品，而第 2 類國家則向所有其他國家出口。第 3 類和第 4 類國家只是進口而不是出口各種金??屬制品。

12.4.3 正則等價

結(jié)構(gòu)等價要求等價的參與者有相同的鄰居。在社會網(wǎng)絡(luò)分析的幾個應(yīng)用中，這個標(biāo)準(zhǔn)太嚴格了，因為它群組行為人在不同的地方扮演不同的角色，例如，不同大學(xué)的老師有不同的學(xué)生，因此他們與相似的人有聯(lián)系，但不是與同一個人聯(lián)系。
對于這些情況，定義了另一種等價類型：正則等價。正則等價的頂點不必連接到相同的頂點，但它們必須連接到相同類中的頂點。這聽起來像是一個循環(huán)論證，但事實并非如此。例如，在學(xué)生會討論網(wǎng)絡(luò)（第 10 章）中，所有顧問都應(yīng)該選擇部長來討論學(xué)生政治，因為他們應(yīng)該為部長提供建議。但是，他們不必為相同的部長提供建議，也不必為所有部長提供建議（例如，顧問 2 選擇部長 1 到部長 4，但顧問 3 選擇部長 5 和部長 7）（圖 125）。相反，每位部長都應(yīng)該使用至少一名顧問的服務(wù)，但他或她沒有義務(wù)聽取所有顧問的建議。這也適用于班級內(nèi)的關(guān)系：如果一位部長選擇另一位部長，則每位部長必須選擇一位同級，并且必須由一位同級選擇。然而，一個對等點就足夠了：它們不必與所有對等點相關(guān)，因此它們的塊不一定是完全的。
我們可以通過塊建模來檢測正則等價，因為有一種特殊的塊類型與正則等價相關(guān)聯(lián)，稱為正則塊。一個正則塊在每一行（每個人至少選擇一個行為人）和每一列（每個人至少被選擇一次）中包含至少一個弧。正則等價允許正則塊和空塊。請注意，完全塊始終是正則塊，所以，結(jié)構(gòu)等價是一種特殊的正則等價，或者換句話說，正則等價比結(jié)構(gòu)等價更普遍。

一個正則塊在每一行和每一列中至少包含一個弧。

在具有三個班級（每個正式位置一個班級——見圖 125）的學(xué)生會網(wǎng)絡(luò)中，有兩個塊是正則的：部長與顧問之間的選擇和部長之間的選擇。如果部長 3 和部長 6 也選擇了主席，那么包含從部長到主席的選擇的塊將是完全的（因此是常規(guī)的）。兩個缺失的選項在圖 125 中用黑色十字表示；他們?yōu)樵摼W(wǎng)絡(luò)的正則等價模型的誤差值貢獻了兩個單位。

在圖 125 中，有兩個塊是空的：從顧問到主席的選擇，反之亦然。這兩個階層之間的社會距離似乎太大，無法通過直接協(xié)商來跨越。其余三個塊既不是空也不是正則，因此它們至少包含一個違反正則等價模型的行為。如果我們假設(shè)這些塊是空的，那么誤差的值是最小的，所以這些塊中的所有六個選擇都是誤差（白色十字），我們假設(shè)理想矩陣在這里包含空塊。在我們的鏡像矩陣中，我們只是指定所有塊都應(yīng)該是空的或正則的。在評估誤差值時，我們發(fā)現(xiàn)在這里期望空塊的錯誤最小。因此，我們將這些塊的類型固定為空塊。
圖 126 顯示了鏡像矩陣和每個塊中的誤差數(shù)（誤差矩陣），它總結(jié)了結(jié)果。第 1 類包含主席，第 2 類包含部長，而顧問被分組在第 3 類中。
學(xué)生會討論網(wǎng)絡(luò)是一個包含特定區(qū)塊類型位置的等級結(jié)構(gòu)的示例。在等級結(jié)構(gòu)中，行為人應(yīng)該向上選擇。如果等級是這樣排序的，最高排名在第一行（和列），最低排名在最后一行（和列），我們應(yīng)該不會遇到矩陣對角線上方的塊的選擇，因為它們會從較高等級（行）指向較低等級（列）。實際上，我們僅在學(xué)生會網(wǎng)絡(luò)的鏡像矩陣中的對角邊上方發(fā)現(xiàn)空（null）塊，這是等級結(jié)構(gòu)的一般屬性。
除了使用特定類型的等價來定義允許的塊類型，我們可以使用允許的塊類型的任何組合來通過指定每個單獨塊允許的類型來表征網(wǎng)絡(luò)，例如，一個部長到主席的完全塊，部長自己的正則塊，以及部長到顧問塊的空塊。這稱為廣義塊建模。請注意，塊類型比這里介紹的三種類型要多。已知某些塊類型模式包含網(wǎng)絡(luò)類別，即核心-外圍模型和等級模型。這些類具有特定的實質(zhì)性含義，因此很容易解釋它們。在不久的將來，經(jīng)驗社會網(wǎng)絡(luò)的進一步應(yīng)用可能會揭示更多類別的塊模型。
在探索性社會網(wǎng)絡(luò)分析中，我們主要對檢測適合特定網(wǎng)絡(luò)的塊模型感興趣。塊模型告訴我們網(wǎng)絡(luò)的一般結(jié)構(gòu)，我們找到的等價類可以用作進一步統(tǒng)計分析中的變量。我們應(yīng)該在這里發(fā)出警告。即使在不應(yīng)該包含正則模式的隨機網(wǎng)絡(luò)上，我們也總能找到最合適的塊模型。因此，我們應(yīng)該將自己限制在理論或先前結(jié)果支持的塊模型上。我們應(yīng)該從關(guān)于網(wǎng)絡(luò)中塊的數(shù)量和類型的動機假設(shè)開始。與探索性網(wǎng)絡(luò)分析的其他情況一樣，我們應(yīng)該嘗試驗證結(jié)果，例如通過將等價類鏈接到外部數(shù)據(jù)，例如參與者屬性。如果參與者的等價類具有不同的屬性、任務(wù)或態(tài)度，這證實了塊模型識別社會角色或角色集的解釋。
應(yīng)用
在 Pajek 中，滿足正則等價的塊模型同樣滿足結(jié)構(gòu)等價塊模型（參見上一節(jié)）：只需在equivalence type下菜單將等價類型中的結(jié)構(gòu)等價替換為正則等價（參見圖 122 和 124）。如果我們將 Random Start 塊建模過程應(yīng)用于學(xué)生會討論網(wǎng)絡(luò)（可在 Pajek 項目文件 student_government.paj 中獲得），我們會找到 8 個具有 7 個誤差的解決方案（在具有三個類和數(shù)百次重復(fù)的正則等價條件下）。與前面討論的將正式角色作為等價類的解決方案相比，這是一個最小的改進，并且它的缺點是必須在七個替代解決方案中做出選擇。沒有一個方案匹配正式角色，但鏡像矩陣類似于圖 126 中的鏡像矩陣或其排列之一。
請注意，其他數(shù)量的類和另一種類型的等價可能會產(chǎn)生更好的解決方案，例如，我們在具有兩個類的正則等價解決方案中發(fā)現(xiàn)了四個誤差，但解釋很困難：在一個解決方案中，advisor2 與網(wǎng)絡(luò)的其余部分分離，這似乎是一個微不足道的解決方案；在另一個解決方案中，advisor1 和 advisor2 加入了 Minister4。因此，我們更傾向于根據(jù)學(xué)生會中的正式角色進行原始分類。
在塊建模中，Structural Equivalence 選項告訴 Pajek 每個塊必須是完全的（com）或空的（null）。在正則等價中，每個塊必須是完全的、空的或正則的。用戶無法控制鏡像矩陣中完全塊、空塊和規(guī)則塊的位置。相比之下，廣義塊建模提供了指定（和固定）鏡像矩陣中每個塊的等價類型的可能性。例如，我們可能想要測試一個正則等價塊模型是否與學(xué)生會討論網(wǎng)絡(luò)匹配三個類，其中每個類都向更高的征求意見（如果有的話），并且除了最低類之外的所有類都向他們自己類的成員建議。
所需的鏡像矩陣如圖 127 所示；如果在選擇框中選擇了用戶定義選項，它會顯示在“另存為 MDL 文件”按鈕下方。如果單擊該矩陣的其中一個單元格（塊），則會打開一個列表，其中顯示了 13 種等價項。在此列表中，您可以選擇一個或多個（按 Alt 鍵添加另一個）類型的、您為所選單元格規(guī)定的等價性。在示例中，五個單元格被強制為正則等價，其余四個單元格必須為空。此外，如果您認為一個單元格中的誤差比另一個單元格中的誤差更重要或更不重要，您可以提高或降低所選單元格中的誤差的約束。只需點擊“Penalty”后的數(shù)字并輸入一個新數(shù)字。

在圖 127 的右上角，您可以看到可以向塊模型添加額外的約束。約束涉及關(guān)于頂點或頂點對的先驗知識，您可以將其分配給特定塊或禁止包含在特定塊中，以及對塊（群組）的最小和最大大小的約束。要添加約束，請在可用約束下拉菜單中雙擊它。您必須為覆蓋約束提供參數(shù)和數(shù)值，之后約束將添加到 In Model Constraints 下拉菜單中。有關(guān)詳細信息，請參閱進一步閱讀部分中有關(guān)廣義塊建模的參考。
當(dāng)您定義了自己的塊模型后，您可以保存它以備將來使用。按“另存為 MDL 文件”按鈕并輸入必須存儲模型的文件的名稱。默認情況下，Pajek 為這些文件提供擴展名 .mdl（模型），我們強烈建議使用此文件擴展名。在另一個塊建模會話中，您可以通過在選擇框中選擇 Load MDL File 選項來打開此文件。加載模型后，您可以通過再次選擇“用戶定義”選項來檢查它。最后，您可以運行塊建模命令。
您可以嘗試適應(yīng)網(wǎng)絡(luò)的塊模型的數(shù)量是巨大的，尤其是當(dāng)您設(shè)計自己的通用塊模型時。因此，我們建議采用以下探索性塊建模策略：（1）使用其他分析和理論考慮的結(jié)果來組裝鏡像矩陣；（2）先嘗試更嚴格的塊模型和塊類型（結(jié)構(gòu)等價比正則等價更嚴格）； (3) 先嘗試較少數(shù)量的類。選擇誤差值最低的塊模型，但如果誤差值稍高的模型產(chǎn)生易于解釋的單一解決方案，您應(yīng)該更喜歡后者。

12.5 小結(jié)

本章再次回顧了本書前面部分介紹的網(wǎng)絡(luò)家庭：內(nèi)聚子網(wǎng)、核心-外圍結(jié)構(gòu)（經(jīng)紀）和等級制度。我們提出了一種能夠檢測這些結(jié)構(gòu)中的每一個的技術(shù)，即塊建模。
在塊建模的情況下，我們需要一個新的網(wǎng)絡(luò)表示：矩陣。網(wǎng)絡(luò)的鄰接矩陣包含它的結(jié)構(gòu)；每個頂點由一行和一列表示，弧位于矩陣的單元格中：第一行和第一列屬于第一個頂點，第二行和列屬于第二個頂點，依此類推。當(dāng)以正確的方式排序時，鄰接矩陣提供了網(wǎng)絡(luò)結(jié)構(gòu)的視覺線索。這種排序稱為網(wǎng)絡(luò)排列，實際上是對頂點的重新編號。
塊建模不是一種容易理解的技術(shù)。基本上，該技術(shù)將社會網(wǎng)絡(luò)與具有特定結(jié)構(gòu)特征的理想社會網(wǎng)絡(luò)（即模型）進行比較。研究人員必須提供模型，計算機檢查該模型與實際數(shù)據(jù)的擬合程度。
該模型稱為塊模型，包含兩部分：partition 和鏡像矩陣。partition 將網(wǎng)絡(luò)的頂點分配給類，這些類也稱為等價類或位置。在網(wǎng)絡(luò)的鄰接矩陣中，類劃分塊：單元組成的矩形。沿鄰接矩陣對角線的塊包含類內(nèi)的聯(lián)系，而非對角線的塊表示類之間的關(guān)系。
在作為塊模型的第二部分的鏡像矩陣中，每個單元代表鄰接矩陣的一個塊。它是鄰接矩陣的壓縮和簡化模型。如果一個類中的頂點在結(jié)構(gòu)上相似——我們說是等價的——鄰接矩陣中的塊具有特定的特征：它們是空的、完全的正規(guī)則的，這意味著在一個類中的每個頂點之間至少有一個聯(lián)系。存在更多類型的塊，但我們不在這里展示它們。
鏡像矩陣顯示了允許的塊類型，以及可能的預(yù)期位置。此外，鏡像矩陣中非空塊的分布揭示了網(wǎng)絡(luò)的整體結(jié)構(gòu)。如果網(wǎng)絡(luò)包含內(nèi)聚子組，則沿鏡像矩陣的對角線找到非空塊。如果網(wǎng)絡(luò)以核心-外圍結(jié)構(gòu)為主，我們會在鏡像矩陣的一個水平和一個垂直條帶中找到所有非空塊。最后，如果有一個等級群組系統(tǒng)，并且頂點根據(jù)它們的等級排序，我們在鏡像矩陣的下半部分或上半部分找到非空塊。
在探索性塊建模中，我們搜索最適合社會網(wǎng)絡(luò)的partition 和鏡像矩陣。經(jīng)驗社會網(wǎng)絡(luò)很少與塊模型完美匹配：應(yīng)該存在的弧不存在，或者應(yīng)該存在一些不存在的弧。誤差的數(shù)值表達了一個塊模型擬合網(wǎng)絡(luò)的狀況。此誤差值用于評估同一網(wǎng)絡(luò)的不同塊模型。
塊建模是一種用于分析相當(dāng)密集的網(wǎng)絡(luò)的強大技術(shù)，但它需要研究人員的正確輸入才能產(chǎn)生有趣的結(jié)果。可能適合社會網(wǎng)絡(luò)的塊模型的數(shù)量很大，因此在對網(wǎng)絡(luò)的整體結(jié)構(gòu)沒有明確概念和期望的情況下著手進行塊建模是不明智的。研究人員需要一個關(guān)于網(wǎng)絡(luò)結(jié)構(gòu)的知情假設(shè)塊建模的卓有成效的應(yīng)用。從這個意義上說，塊建模用于假設(shè)檢驗，而不是探索。

總結(jié)

以上是生活随笔為你收集整理的Exploratory Social Network Analysis with Pajek（第三版）12的全部內(nèi)容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯，歡迎將生活随笔推薦給好友。

上一篇：【Linux】/lib64/libstd
下一篇： teamviewer早期版本11-14