當(dāng)前位置：首頁(yè) > 编程资源 > 编程问答 >内容正文

编程问答

(一文读懂社交网络分析（附应用、前沿、学习资源）学习笔记)

發(fā)布時(shí)間：2024/8/1 编程问答 46 豆豆

生活随笔收集整理的這篇文章主要介紹了 (一文读懂社交网络分析（附应用、前沿、学习资源）学习笔记) 小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

一文讀懂社交網(wǎng)絡(luò)分析（附應(yīng)用、前沿、學(xué)習(xí)資源）學(xué)習(xí)筆記

一、社交網(wǎng)絡(luò)的結(jié)構(gòu)特性與演化機(jī)理
- 1、社交網(wǎng)絡(luò)結(jié)構(gòu)分析與建模
- - 1.1 統(tǒng)計(jì)特性
  - 1.2 網(wǎng)絡(luò)特性
  - 1.3 網(wǎng)絡(luò)模型
- 2、虛擬社區(qū)以及發(fā)現(xiàn)技術(shù)
- - 2.1 定義
  - 2.2 社區(qū)發(fā)現(xiàn)算法評(píng)估指標(biāo)
  - 2.3社區(qū)靜態(tài)發(fā)現(xiàn)算法
  - 2.4 社區(qū)動(dòng)態(tài)發(fā)現(xiàn)算法
- 3、虛擬社區(qū)演化分析
- - 3.1 虛擬社區(qū)的涌現(xiàn)
- 3.2 虛擬社區(qū)的演化
- - 3.3 演化虛擬社區(qū)的發(fā)現(xiàn)
二、社交網(wǎng)絡(luò)群體行為形成與互動(dòng)規(guī)律
- 1、用戶行為分析
- - 1.1 用戶采納與忠誠(chéng)
  - 1.2 用戶個(gè)體使用行為
  - 用戶群體互動(dòng)行為
- 2、社交網(wǎng)絡(luò)情感分析
- - 2.1 文本情感分析技術(shù)
  - 2.2 社交網(wǎng)絡(luò)情感分析技術(shù)
- 3. 個(gè)體影響力分析
- - 3.1 基于網(wǎng)絡(luò)結(jié)構(gòu)的個(gè)體影響力計(jì)算
  - 3.2 基于行為的個(gè)體影響力計(jì)算
  - 3.3 基于話題的個(gè)體影響力計(jì)算
- 4、群體聚集以及影響機(jī)制分析
三、社交網(wǎng)絡(luò)信息傳播與演化機(jī)理
- 1、在線社交網(wǎng)絡(luò)信息檢索
- - 1.1 社交網(wǎng)絡(luò)內(nèi)容搜索
  - 1.2 社交網(wǎng)絡(luò)內(nèi)容分類
  - 1.3 社交網(wǎng)絡(luò)推薦
- 2、社交網(wǎng)絡(luò)信息傳播規(guī)律
- - 2.1 基于網(wǎng)絡(luò)結(jié)構(gòu)的傳播模型
  - 2.2 基于群體狀態(tài)的傳播模型
  - 2.3 基于信息特征的傳播模型
- 3、話題發(fā)現(xiàn)與演化
- - 3.1 基于主題模型的話題發(fā)現(xiàn)
  - 3.2 基于向量空間模型的話題發(fā)現(xiàn)
  - 3.3 基于詞項(xiàng)關(guān)系圖的話題發(fā)現(xiàn)
  - 3.4 基于主題模型的話題演化
  - 3.5 基于相鄰時(shí)間片關(guān)聯(lián)的話題演化
- 4、影響力最大化
- - 4.1 貪心算法
  - 4.2 啟發(fā)式算法
四、社交網(wǎng)絡(luò)分析的應(yīng)用
- 1、社交推薦
- 2、輿情分析
- 3、隱私保護(hù)
- 4、用戶畫像
- 5、謠言檢測(cè)
- 6、可視化
五、社交網(wǎng)絡(luò)前沿研究
- 1. Negative Link Prediction in Social Media
- 2. Twitter Sentiment Analysis with Deep Convolutional Neural Networks
- 3. Social Recommendation with Strong and Weak Ties
- 4. Online Actions with Offline Impact: How Online Social Networks Influence Online and Offline User Behavior
- Intertwined Viral Marketing in Social Networks
- Who to Invite Next? Predicting Invitees ofSocial Groups
- 7. The Co-Evolution Model for Social NetworkEvolving and Opinion Migration

原文鏈接：http://mt.sohu.com/20171010/n516921964.shtml

一、社交網(wǎng)絡(luò)的結(jié)構(gòu)特性與演化機(jī)理

1、社交網(wǎng)絡(luò)結(jié)構(gòu)分析與建模

1.1 統(tǒng)計(jì)特性

社交網(wǎng)絡(luò)模型許多概念來(lái)自于圖論，因?yàn)樯缃痪W(wǎng)絡(luò)模型本質(zhì)上是一個(gè)由節(jié)點(diǎn)（人）和邊（社交關(guān)系）組成的圖。

度（Degree）：節(jié)點(diǎn)的度定義為與該節(jié)點(diǎn)相連的邊的數(shù)目。在有向圖中，所有指向某節(jié)點(diǎn)的邊的數(shù)量叫作該節(jié)點(diǎn)的入度，所有從該節(jié)點(diǎn)出發(fā)指向別的節(jié)點(diǎn)的邊的數(shù)量叫作該節(jié)點(diǎn)的出度。網(wǎng)絡(luò)平均度反應(yīng)了網(wǎng)絡(luò)的疏密程度，而通過(guò)度分布則可以刻畫不同節(jié)點(diǎn)的重要性。
網(wǎng)絡(luò)密度（Density）：網(wǎng)絡(luò)密度可以用于刻畫節(jié)點(diǎn)間相互連邊的密集程度，定義為網(wǎng)絡(luò)中實(shí)際存在邊數(shù)與可容納邊數(shù)上限的比值，常用來(lái)測(cè)量社交網(wǎng)絡(luò)中社交關(guān)系的密集程度及演化趨勢(shì)。
聚類系數(shù)（Clustering Coefficient）：用于描述網(wǎng)絡(luò)中與同一節(jié)點(diǎn)相連的節(jié)點(diǎn)間也互為相鄰節(jié)點(diǎn)的程度。其用于刻畫社交網(wǎng)絡(luò)中一個(gè)人朋友們之間也互相是朋友的概率，反應(yīng)了社交網(wǎng)絡(luò)中的聚集性。
介數(shù)（Betweeness）：為圖中某節(jié)點(diǎn)承載整個(gè)圖所有最短路徑的數(shù)量，通常用來(lái)評(píng)價(jià)節(jié)點(diǎn)的重要程度，比如在連接不同社群之間的中介節(jié)點(diǎn)的介數(shù)相對(duì)于其他節(jié)點(diǎn)來(lái)說(shuō)會(huì)非常大，也體現(xiàn)了其在社交網(wǎng)絡(luò)信息傳遞中的重要程度。

1.2 網(wǎng)絡(luò)特性

小世界現(xiàn)象：小世界現(xiàn)象是指地理位置相距遙遠(yuǎn)的人可能具有較短的社會(huì)關(guān)系間隔。早在1967年，哈佛大學(xué)心理學(xué)教授 Stanley Milgram 通過(guò)一個(gè)信件投遞實(shí)驗(yàn)，歸納并提出了“六度分割理論（Six Degrees of Separation）”, 即任意兩個(gè)都可通過(guò)平均五個(gè)人熟人相關(guān)聯(lián)起來(lái)。1998年，Duncan Watts 和 Steven Strogatz 在《自然》雜志上發(fā)表了里程碑式的文章《Collective Dynamics of “Small-World” Networks》，該文章正式提出了小世界網(wǎng)絡(luò)的概念并建立了小世界模型。
　　小世界現(xiàn)象在在線社交網(wǎng)絡(luò)中得到了很好地驗(yàn)證，根據(jù)2011年 Facebook 數(shù)據(jù)分析小組的報(bào)告， Facebook 約7.2億用戶中任意兩個(gè)用戶間的平均路徑長(zhǎng)度僅為4.74，而這一指標(biāo)在推特中為4.67。可以說(shuō)，在五步之內(nèi)，任何兩個(gè)網(wǎng)絡(luò)上的個(gè)體都可以互相連接。
無(wú)標(biāo)度特性：大多數(shù)真實(shí)的大規(guī)模社交網(wǎng)絡(luò)都存在著大多數(shù)節(jié)點(diǎn)有少量邊，少數(shù)節(jié)點(diǎn)有大量邊的特點(diǎn)，其網(wǎng)絡(luò)缺乏一個(gè)統(tǒng)一的衡量尺度而呈現(xiàn)出異質(zhì)性，我們將這種節(jié)點(diǎn)度分布不存在有限衡量分布范圍的性質(zhì)稱為無(wú)標(biāo)度。無(wú)標(biāo)度網(wǎng)絡(luò)表現(xiàn)出來(lái)的度分布特征為冪律分布，這就是此類網(wǎng)絡(luò)的無(wú)標(biāo)度特性。

1.3 網(wǎng)絡(luò)模型

WS 模型：WS 模型即小世界模型，通過(guò)小世界模型生成的小世界網(wǎng)絡(luò)是從規(guī)則網(wǎng)絡(luò)向隨機(jī)網(wǎng)絡(luò)過(guò)渡的中間形態(tài)。
BA 模型：BA模型考慮到現(xiàn)實(shí)網(wǎng)絡(luò)中節(jié)點(diǎn)的冪律分布特性，生成無(wú)標(biāo)度網(wǎng)絡(luò)。
其他模型：森林火災(zāi)模型，Kronecker 模型，生產(chǎn)模型。

2、虛擬社區(qū)以及發(fā)現(xiàn)技術(shù)

2.1 定義

虛擬社區(qū)基于子圖局部性的定義：社區(qū)結(jié)構(gòu)是復(fù)雜網(wǎng)絡(luò)節(jié)點(diǎn)集合的若干子集，每個(gè)子集內(nèi)部的節(jié)點(diǎn)之間的連接相對(duì)非常緊密，而不同子集節(jié)點(diǎn)之間的連邊相對(duì)稀疏。
在社交網(wǎng)絡(luò)中發(fā)現(xiàn)虛擬社區(qū)有助于理解網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)特點(diǎn)，揭示復(fù)雜系統(tǒng)內(nèi)在功能特性，理解社區(qū)內(nèi)個(gè)體關(guān)系。為信息檢索、信息推薦、信息傳播控制和公共事件管控提供有力支撐。虛擬社區(qū)發(fā)現(xiàn)存在著許多經(jīng)典的算法，這些算法用于挖掘不同規(guī)模的虛擬社區(qū)，算法在追求高精度的同時(shí)力求提高效率（降低時(shí)間復(fù)雜度）。

2.2 社區(qū)發(fā)現(xiàn)算法評(píng)估指標(biāo)

模塊度(Modularity)：通過(guò)比較現(xiàn)有網(wǎng)絡(luò)與基準(zhǔn)網(wǎng)絡(luò)在相同社區(qū)劃分下的連接密度差來(lái)衡量網(wǎng)絡(luò)社區(qū)的優(yōu)劣。
NMI (Normalized Mutual
Information)：利用信息熵來(lái)衡量預(yù)測(cè)社區(qū)結(jié)構(gòu)一直社區(qū)結(jié)構(gòu)的差異，該值越大，則說(shuō)明社區(qū)結(jié)構(gòu)劃分越好，最大值為1時(shí)，說(shuō)明算法劃分出的社區(qū)結(jié)構(gòu)和一直社區(qū)結(jié)構(gòu)一致，算法效果最好。
Rand Index：表示在兩個(gè)劃分中都屬于同一社區(qū)或者都屬于不同社區(qū)的節(jié)點(diǎn)對(duì)的數(shù)量的比值。
Jaccard Index：Jaccard 系數(shù)用來(lái)衡量樣本之間的差異性，是經(jīng)典的衡量指標(biāo)。

2.3社區(qū)靜態(tài)發(fā)現(xiàn)算法

模塊度最優(yōu)算法
Mark Newman 提出了針對(duì)模塊度的最大化的貪心算法FN。可參考文獻(xiàn)：Newman,Mark EJ. “Fast algorithm for detecting community structure innetworks.” Physical review E 69.6 (2004): 066133.
多目標(biāo)優(yōu)化算法
Zhao, Yuxin, et al. “Acellular learning automata based algorithm for detecting community structure incomplex networks.” Neurocomputing 151 (2015): 1216-1226.
Du, Jingfei, Jianyang Lai,and Chuan Shi. “Multi-Objective Optimization for Overlapping CommunityDetection.” International Conference on Advanced Data Mining andApplications. Springer, Berlin, Heidelberg, 2013.
基于概率模型的算法
Newman, Mark EJ, andElizabeth A. Leicht. “Mixture models and exploratory analysis innetworks.” Proceedings of the National Academy of Sciences104.23(2007): 9564-9569.
Ren,Wei, et al. “Simple probabilistic algorithm for detecting communitystructure.” Physical Review E 79.3 (2009): 036111.
信息編碼算法
Rosvall, Martin, and Carl T.Bergstrom. “Maps of random walks on complex networks reveal communitystructure.” Proceedings of the National Academy of Sciences 105.4(2008): 1118-1123.
Kim, Youngdo, and HawoongJeong. “Map equation for link communities.” Physical Review E 84.2(2011): 026110.

2.4 社區(qū)動(dòng)態(tài)發(fā)現(xiàn)算法

派系過(guò)濾算法
Palla, Gergely, et al.“Uncovering the overlapping community structure of complex networks innature and society.” arXiv preprint physics/0506133(2005).
Kumpula,Jussi M., et al. “Sequential algorithm for fast cliquepercolation.” Physical Review E 78.2 (2008): 026109.
基于相似度的聚合算法
Shen, Huawei, et al.“Detect overlapping and hierarchical community structure innetworks.” Physica A: Statistical Mechanics and its Applications388.8(2009): 1706-1712.
Huang,Jianbin, et al. “Density-based shrinkage for revealing hierarchical andoverlapping community structure in networks.” Physica A:Statistical Mechanics and its Applications 390.11 (2011): 2160-2171.
標(biāo)簽傳播算法
Raghavan, Usha Nandini, RékaAlbert, and Soundar Kumara. “Near linear time algorithm to detectcommunity structures in large-scale networks.” Physical review E 76.3(2007): 036106.
Gregory, Steve. “Finding overlapping communitiesin networks by label propagation.” New Journal of Physics 12.10(2010): 103018.
局部擴(kuò)展優(yōu)化算法
Lancichinetti, Andrea, andSanto Fortunato. “Benchmarks for testing community detection algorithms ondirected and weighted graphs with overlapping communities.” PhysicalReview E 80.1 (2009): 016118.
Lee,Conrad, et al. “Detecting highly overlapping community structure by greedyclique expansion.” arXiv preprint arXiv:1002.1827 (2010).

3、虛擬社區(qū)演化分析

在線社交網(wǎng)絡(luò)中存在著大量顯性或者隱性的虛擬社區(qū)結(jié)構(gòu)，這些虛擬社區(qū)結(jié)構(gòu)并不是永恒不變的，隨著事件變化，社區(qū)結(jié)構(gòu)也在不斷演變。分析動(dòng)態(tài)的虛擬社區(qū)結(jié)構(gòu)演化有助于理解整個(gè)社交網(wǎng)絡(luò)的演化過(guò)程，所以有著重要的研究?jī)r(jià)值。

3.1 虛擬社區(qū)的涌現(xiàn)

虛擬社區(qū)涌現(xiàn)即在社交網(wǎng)絡(luò)中虛擬社區(qū)從無(wú)到有的過(guò)程，其最重要的特征是網(wǎng)絡(luò)聚集現(xiàn)象。

周期閉包：所謂周期閉包，是指網(wǎng)絡(luò)節(jié)點(diǎn)傾向于和自己在網(wǎng)絡(luò)中鄰居的鄰居建立連接關(guān)系而形成的結(jié)構(gòu)，該機(jī)制是導(dǎo)致虛擬社區(qū)形成的主要因素。實(shí)驗(yàn)表明三元閉包的出現(xiàn)概率隨著兩個(gè)節(jié)點(diǎn)之間測(cè)地距離的增減呈指數(shù)遞減。相反地，焦點(diǎn)閉包和測(cè)地距離無(wú)關(guān)，其生成原因是兩個(gè)節(jié)點(diǎn)之間有共同的興趣或參與共同的活動(dòng)。
偏好連接：在很多真實(shí)網(wǎng)絡(luò)中，新增加的邊并不是隨機(jī)連接的，而是傾向于和具有較大度數(shù)的連接。

3.2 虛擬社區(qū)的演化

在線社交網(wǎng)絡(luò)虛擬社區(qū)演化過(guò)程非常復(fù)雜，影響因素很多。如何挖掘虛擬社區(qū)演化中的關(guān)鍵性因素成為社交網(wǎng)絡(luò)研究中一個(gè)重要而有挑戰(zhàn)性的課題，用戶個(gè)體的累積效應(yīng)、結(jié)構(gòu)多樣性和結(jié)構(gòu)平衡性三個(gè)基本因素對(duì)虛擬社區(qū)演化都存在影響。

3.3 演化虛擬社區(qū)的發(fā)現(xiàn)

基于相鄰時(shí)刻相似度直接比較的演化虛擬社區(qū)發(fā)現(xiàn)

Hopcroft, John, et al.“Tracking evolving communities in large linked networks.” Proceedingsof the National Academy of Sciences 101.suppl 1 (2004): 5249-5253.
Greene, Derek, Donal Doyle, and PadraigCunningham. “Tracking the evolution of communities in dynamic socialnetworks.” Advances in social networks analysis and mining (ASONAM), 2010international conference on. IEEE, 2010.

基于演化聚類分析的演化虛擬社區(qū)發(fā)現(xiàn)

Chakrabarti, Deepayan, Ravi Kumar,and Andrew Tomkins. “Evolutionary clustering.” Proceedings ofthe 12th ACM SIGKDD international conference on Knowledge discovery and datamining. ACM, 2006.
Lin, Yu-Ru, et al.“Facetnet: a framework for analyzing communities and their evolutions indynamic networks.” Proceedings of the 17th international conference onWorld Wide Web. ACM, 2008.

基于拉普拉斯動(dòng)力學(xué)方法的演化虛擬社區(qū)發(fā)現(xiàn)

Lambiotte, Renaud, J-C.Delvenne, and Mauricio Barahona. “Laplacian dynamics and multiscalemodular structure in networks.” arXiv preprint arXiv:0812.1770 (2008).
基于派系過(guò)濾算法的演化虛擬社區(qū)發(fā)現(xiàn)
Palla, Gergely, Albert-LaszloBarabasi, and Tamas Vicsek. “Quantifying social groupevolution.” Nature 446.arXiv: 0704.0744 (2007): 664.

基于節(jié)點(diǎn)行為趨勢(shì)分析的演化虛擬社區(qū)發(fā)現(xiàn)

Hopcroft, John, et al.“Tracking evolving communities in large linked networks.” Proceedingsof the National Academy of Sciences 101.suppl 1 (2004): 5249-5253.

二、社交網(wǎng)絡(luò)群體行為形成與互動(dòng)規(guī)律

1、用戶行為分析

社交網(wǎng)絡(luò)用戶行為是用戶對(duì)自身需求，社會(huì)影響和社交網(wǎng)絡(luò)技術(shù)進(jìn)行綜合評(píng)估的基礎(chǔ)上做出的使用社交網(wǎng)絡(luò)服務(wù)的意愿，以及由此引起的各種使用活動(dòng)的總和。用戶行為是在線社交網(wǎng)絡(luò)研究的重要內(nèi)容。現(xiàn)有研究主要基于如下兩種思路展開，一是將在線社交網(wǎng)絡(luò)作為一種特定的信息技術(shù)，研究用戶對(duì)在線社交網(wǎng)絡(luò)技術(shù)的采納行為、拒絕行為和用戶忠誠(chéng)；二是將在線社交網(wǎng)絡(luò)視為提供各種服務(wù)和應(yīng)用的平臺(tái)，研究用戶使用各種服務(wù)和應(yīng)用所表現(xiàn)出的特征與規(guī)律。

1.1 用戶采納與忠誠(chéng)

在線社交網(wǎng)絡(luò)用戶采納是指用戶在對(duì)自身需求、社會(huì)影響和在線社交網(wǎng)絡(luò)技術(shù)進(jìn)行綜合評(píng)估的基礎(chǔ)上做出的使用在線社交網(wǎng)絡(luò)服務(wù)的意愿或行為，在線社交網(wǎng)絡(luò)再出現(xiàn)初期能否被盡可能多的用戶采納和試用對(duì)于其后續(xù)的擴(kuò)散至關(guān)重要。目前已有多種理論被用于揭示在線社交網(wǎng)絡(luò)用戶采納行為機(jī)理。其中，技術(shù)接受模型和計(jì)劃行為理論是研究者們應(yīng)用最多的兩種理論。
在線社交網(wǎng)絡(luò)用戶忠誠(chéng)是指用戶在使用社交網(wǎng)絡(luò)服務(wù)之后，能夠繼續(xù)保持使用的習(xí)慣。各種層出不窮的新型網(wǎng)絡(luò)服務(wù)所帶來(lái)的競(jìng)爭(zhēng)壓力讓保持在線社交網(wǎng)絡(luò)用戶忠誠(chéng)度愈發(fā)困難。目前為止，已經(jīng)有多種理論被用于在線社交網(wǎng)絡(luò)的用戶忠誠(chéng)研究。其中，期望確認(rèn)理論和心流體驗(yàn)理論受到較多研究者青睞。

基于技術(shù)接受模型的在線社交網(wǎng)絡(luò)用戶采納模型

David Fred 提出技術(shù)接受模型是目前信息系統(tǒng)研究領(lǐng)域最經(jīng)典的模型之一。對(duì)模型詳細(xì)了解可參考：
Davis, Fred D. “Perceived usefulness, perceived ease of use, and user acceptance of information technology.” MIS quarterly (1989): 319-340.

基于計(jì)劃行為理論的在線社交網(wǎng)絡(luò)用戶采納模型
Icek Ajzen 提出的計(jì)劃行為理論已經(jīng)被廣泛用于人類行為研究。對(duì)理論詳細(xì)了解可參考：
Ajzen, Icek. “From intentions to actions: A theory of planned behavior.” Action control. Springer Berlin Heidelberg, 1985. 11-39.
基于期望確認(rèn)理論的在線社交網(wǎng)絡(luò)用戶忠誠(chéng)模型
由 Oliver 提出的期望確認(rèn)理論是研究消費(fèi)者滿意度的基本理論。 Anol Bhattacherjee 再該理論的基礎(chǔ)上結(jié)合信息系統(tǒng)的特點(diǎn)提出了信息系統(tǒng)持續(xù)使用的期望確認(rèn)模型（ECM-ISC）。對(duì)模型詳細(xì)了解可參考：
Bhattacherjee, Anol. “Understanding information systems continuance: an expectation-confirmation model.” MIS quarterly (2001): 351-370.
　　
基于心流體驗(yàn)理論的在線社交網(wǎng)絡(luò)用戶忠誠(chéng)模型
Mihaly Csikszentmihalyi等提出的心流體驗(yàn)理論是目前關(guān)于用戶體驗(yàn)研究的重要理論。對(duì)理論詳細(xì)了解可參考:Csikszentmihalyi, Mihaly. Beyond boredom and anxiety. Jossey-Bass, 2000.

1.2 用戶個(gè)體使用行為

-** 一般使用行為**：用戶可以在社交網(wǎng)絡(luò)上執(zhí)行各種各樣的行為，例如瀏覽，點(diǎn)擊，分享，點(diǎn)贊，收藏等等。具體的分類可參考：Benevenuto F,Rodrigues T, Cha M, Almeida V. Characterizing User Behavior in Online Social Networks. New York, New York, USA: ACM; 2009:49-62.doi:10.1145/1644893.1644900.

內(nèi)容創(chuàng)建行為：用戶在社交網(wǎng)絡(luò)通過(guò)寫博客微博，發(fā)帖評(píng)論等行為產(chǎn)生內(nèi)容，對(duì)內(nèi)容創(chuàng)建行為的研究主要研究創(chuàng)建內(nèi)容的動(dòng)機(jī)、創(chuàng)建內(nèi)容時(shí)的主題選擇偏好以及內(nèi)容創(chuàng)建時(shí)的語(yǔ)言表述等。關(guān)于主題，可通過(guò)搜索引擎搜索 LDA 模型。
內(nèi)容消費(fèi)行為：用戶在社交網(wǎng)絡(luò)中通過(guò)瀏覽，分享和評(píng)論來(lái)滿足他們的社交需求，對(duì)社交網(wǎng)絡(luò)內(nèi)容的消費(fèi)可分為主動(dòng)消費(fèi)和被動(dòng)消費(fèi)。被動(dòng)消費(fèi)即“瀏覽”，有研究表明，社交網(wǎng)絡(luò)中高達(dá)92%的行為都是瀏覽行為。主動(dòng)消費(fèi)即社交搜索，例如搜索朋友的信息以及向社交圈內(nèi)好友提問(wèn)等等。

用戶群體互動(dòng)行為

群體互動(dòng)關(guān)系選擇：對(duì)群體互動(dòng)關(guān)系的研究主要是識(shí)別用戶之間的關(guān)系，通過(guò)制定不同的衡量指標(biāo)，研究用戶之間的關(guān)系強(qiáng)弱。
群體互動(dòng)的內(nèi)容選擇：社交網(wǎng)絡(luò)中用戶對(duì)內(nèi)容選擇與其社交關(guān)系密不可分。例如有研究表明兩位維基百科編輯在互動(dòng)前后產(chǎn)生的編輯內(nèi)容的相似性有所不同。
群體互動(dòng)的時(shí)間規(guī)律：在線社交網(wǎng)絡(luò)中人類行為的時(shí)間特征研究主要集中于分析行為發(fā)生的時(shí)間間隔分布。研究發(fā)現(xiàn)在線社交網(wǎng)絡(luò)中用戶行為時(shí)間間隔分布不同于傳統(tǒng)的負(fù)指數(shù)分布，而是呈現(xiàn)冪律分布，即具有“長(zhǎng)尾效應(yīng)”。對(duì)群體互動(dòng)時(shí)間規(guī)律的研究可以應(yīng)用到公共管理和決策等場(chǎng)景中。

2、社交網(wǎng)絡(luò)情感分析

隨著互聯(lián)網(wǎng)技術(shù)的迅速發(fā)展，網(wǎng)絡(luò)已經(jīng)成為人們獲取信息，發(fā)表意見的主要途徑，根據(jù)文本內(nèi)容，我們可以將網(wǎng)絡(luò)中的文本分為兩種，一種是客觀描述信息，主要針對(duì)事件、產(chǎn)品等進(jìn)行客觀描述，另一種是主觀性信息，主要產(chǎn)生與用戶對(duì)人物、事件、產(chǎn)品進(jìn)行客觀性描述；另一種是主觀性信息，主要產(chǎn)生于用戶對(duì)人物、事件、產(chǎn)品等的評(píng)價(jià)信息。主觀性信息表達(dá)了人們的各種情感色彩和情感傾向，如“支持”、“反對(duì)”、“中立”等。
情感分析，在此等同于意見挖掘，是針對(duì)主觀性信息進(jìn)行分析、處理和歸納過(guò)程。情感分析最初起源于自然語(yǔ)言處理領(lǐng)域，主要從語(yǔ)法語(yǔ)義規(guī)則方面對(duì)文本的情感傾向性進(jìn)行研判。隨著社交網(wǎng)絡(luò)的興起與發(fā)展，情感分析逐漸涉及多個(gè)研究領(lǐng)域，如文本挖掘、Web 數(shù)據(jù)挖掘等，并延伸至管理學(xué)及社會(huì)科學(xué)等學(xué)科，并在產(chǎn)品評(píng)論、輿情監(jiān)控、信息預(yù)測(cè)等多個(gè)領(lǐng)域發(fā)揮著重要的作用。

2.1 文本情感分析技術(shù)

基于語(yǔ)義規(guī)則的情感分析技術(shù)：我們將一句話中的帶有感情的形容詞和副詞提取出來(lái)構(gòu)成一個(gè)情感詞典，這些詞語(yǔ)可以代表用戶的某種傾向性。基于語(yǔ)義規(guī)則的分析技術(shù)是計(jì)算評(píng)價(jià)詞和情感詞典中已經(jīng)標(biāo)注傾向性詞語(yǔ)的距離，從而達(dá)到情感分類的目的。其最經(jīng)典的算法是SO-PMI 算法。
基于監(jiān)督學(xué)習(xí)的情感分析方法：基于監(jiān)督學(xué)習(xí)的方法是首先通過(guò)人工標(biāo)注文本的情感極性，然后將此作為訓(xùn)練集，通過(guò)機(jī)器學(xué)習(xí)的方法對(duì)目標(biāo)文本進(jìn)行情感分類。常用方法：樸素貝葉斯，支持向量機(jī)。
基于話題模型的情感分析技術(shù)：有兩個(gè)話題模型，PLSA (Probabilistic Latent Semantic Analysis)和LDA (Latent Dirichlet Allocation) 模型，網(wǎng)絡(luò)上有大量的學(xué)習(xí)資料可供讀者進(jìn)一步了解。

2.2 社交網(wǎng)絡(luò)情感分析技術(shù)

面向短文本的情感分析技術(shù)：社交網(wǎng)絡(luò)產(chǎn)生大量的短文本，例如微博和新聞評(píng)論，論壇帖子等等，這些短文本不同于新聞報(bào)道，其語(yǔ)法不規(guī)則，充斥大量噪聲，因此對(duì)短文本的分析非常重要。
基于群體智能的情感分析技術(shù)：用戶在社交網(wǎng)絡(luò)中表達(dá)意見會(huì)受到其社交關(guān)系的影響，情感會(huì)沿著社交關(guān)系進(jìn)行傳播，因此可以通過(guò)研究社交用戶之間的關(guān)系來(lái)提高情感分析的準(zhǔn)確度。
社交網(wǎng)絡(luò)的垃圾意見挖掘技術(shù)：社交網(wǎng)絡(luò)中的垃圾意見，包括水軍與廣告等信息，通過(guò)對(duì)垃圾意見的挖掘，能夠有效區(qū)分有效信息和垃圾信息，從而提高社交網(wǎng)絡(luò)使用體驗(yàn)。

3. 個(gè)體影響力分析

發(fā)現(xiàn)社交網(wǎng)絡(luò)中的有影響力的個(gè)體是社交網(wǎng)絡(luò)研究中非常重要的研究分支，而且其有著重要的應(yīng)用價(jià)值。例如微博營(yíng)銷，謠言檢測(cè)，輿情管理等等。

3.1 基于網(wǎng)絡(luò)結(jié)構(gòu)的個(gè)體影響力計(jì)算

基于社交網(wǎng)絡(luò)的圖結(jié)構(gòu)特性，有幾個(gè)指標(biāo)用來(lái)衡量網(wǎng)絡(luò)中節(jié)點(diǎn)的中心度，即節(jié)點(diǎn)的影響力。除了以下三種外還有 PageRank 中心度等度量方法。

度中心度（Degree Centrality）：度中心度是指與該節(jié)點(diǎn)直接相連的節(jié)點(diǎn)的數(shù)量。
接近中心度 (Closeness Centrality)：指某節(jié)點(diǎn)與網(wǎng)絡(luò)中所有其他節(jié)點(diǎn)的最短距離之和。
介數(shù) (Betweenness Centrality)：介數(shù)用來(lái)衡量某節(jié)點(diǎn)在社交網(wǎng)絡(luò)中中介作用大小。網(wǎng)絡(luò)中某兩個(gè)節(jié)點(diǎn)所有最短路徑的數(shù)量除以這些路徑中經(jīng)過(guò) A節(jié)點(diǎn)路徑的數(shù)量便是 A 節(jié)點(diǎn)的介數(shù)，也叫中間中心度。

3.2 基于行為的個(gè)體影響力計(jì)算

社交網(wǎng)絡(luò)中用戶的行為決定用戶的影響力，以微博為例，用戶主要表現(xiàn)的行為是評(píng)論、轉(zhuǎn)發(fā)、回復(fù)、點(diǎn)贊、復(fù)制、閱讀等等，基于這些行為特征構(gòu)建多種網(wǎng)絡(luò)關(guān)系圖，可通過(guò)隨機(jī)游走等方法發(fā)現(xiàn)網(wǎng)絡(luò)中的影響力個(gè)體。

3.3 基于話題的個(gè)體影響力計(jì)算

在社交網(wǎng)絡(luò)中用戶在不同話題下的影響力不同，可以根據(jù)用戶的關(guān)注網(wǎng)絡(luò)和用戶興趣相似性來(lái)計(jì)算用戶在每個(gè)話題上的影響力。

4、群體聚集以及影響機(jī)制分析

本部分主要介紹群體極化的概念。群體極化是指在群體決策的情境中，個(gè)體意見或決定往往會(huì)受到群體間的彼此討論的影響，而產(chǎn)生一個(gè)群體性的結(jié)果。群體極化往往表現(xiàn)為群體內(nèi)的個(gè)體不經(jīng)過(guò)個(gè)人思考而同意大多數(shù)人的觀點(diǎn)。群體極化是一個(gè)社會(huì)心理學(xué)概念，在社會(huì)學(xué)名著《烏合之眾》中提到的大眾心理狀態(tài)就是群體極化的體現(xiàn)。
** 群體極化產(chǎn)生的條件可概括為四點(diǎn)：第一，必須有激發(fā)事件出現(xiàn)；第二，群體內(nèi)的個(gè)人能看到前人的選擇；第三，群體信息缺乏；第四，群體有一定的同質(zhì)性**。
在在線社交網(wǎng)絡(luò)分析中，人們通過(guò)建立分析模型和仿真來(lái)研究在線社交網(wǎng)絡(luò)中的群體極化現(xiàn)象。主要的分析模型有基于博弈論和委托—代理理論的從眾行為模型，基于信息瀑的群體一致性模型和基于元胞自動(dòng)機(jī)群決策和行為仿真。

三、社交網(wǎng)絡(luò)信息傳播與演化機(jī)理

1、在線社交網(wǎng)絡(luò)信息檢索

信息檢索(Information Retrieval) 是從大規(guī)模非結(jié)構(gòu)化數(shù)據(jù)中獲取信息的過(guò)程，例如搜索引擎就是典型的信息檢索技術(shù)的應(yīng)用。在線社交網(wǎng)絡(luò)數(shù)據(jù)結(jié)構(gòu)有其特殊性，以微博的“話題”（#話題名稱#）為例，這種新型的信息組織方式是傳統(tǒng)信息檢索研究沒(méi)有涉及的，所以對(duì)社交網(wǎng)絡(luò)信息的檢索成為了一門研究課題。

1.1 社交網(wǎng)絡(luò)內(nèi)容搜索

內(nèi)容搜索是指給定查詢，從大量信息中返回相關(guān)信息的過(guò)程。例如在微博上搜索相關(guān)熱點(diǎn)事件名稱，能夠返回關(guān)于熱點(diǎn)事件的微博。內(nèi)容搜索是信息檢索最經(jīng)典的應(yīng)用形式。經(jīng)典的信息檢索模型有向量空間模型（VSM），概率模型及 BM25檢索公式，基于統(tǒng)計(jì)建模檢索模型及查詢擬然模型，基于統(tǒng)計(jì)語(yǔ)言建模的檢索模型等。
針對(duì)微博的內(nèi)容檢索建模，目前有兩種主要的方法:

時(shí)間先驗(yàn)方法：時(shí)間先驗(yàn)是由于語(yǔ)料庫(kù)中的文檔具有不同的重要性，考慮語(yǔ)料庫(kù)背景定義不同的計(jì)算公式，再將計(jì)算結(jié)果用于檢索模型以期得到更好的檢索效果的一種檢索方法。目前考慮時(shí)間信息計(jì)算文檔先驗(yàn)的研究工作可分為兩種：一種定義文檔的時(shí)間變化關(guān)系；另一種為修改PageRank 的方法，在其中加入時(shí)間關(guān)系。具體細(xì)節(jié)可參考：
Li, Xiaoyan, and W. Bruce Croft. “Time-based language models.” Proceedings of the twelfth international conference on Information and knowledge management. ACM, 2003.
Yu, Philip S., Xin Li, and Bing Liu. “On the temporal dimension of search.” Proceedings of the 13th international World Wide Web conference on Alternate track papers & posters. ACM, 2004.
多特征組合的方法：多特征組合方法是通過(guò)組合多個(gè)微博特性來(lái)檢索微博內(nèi)容。下面的參考文獻(xiàn)中提到的微博特性有：微博個(gè)數(shù)，關(guān)注數(shù)，粉絲數(shù)，微博長(zhǎng)度，微博是否含有外鏈。具體細(xì)節(jié)可參考：
Li, Nagmoti, Rinkesh, Ankur Teredesai, and Martine De Cock. “Ranking approaches for microblog search.” Web Intelligence and Intelligent Agent Technology (WI-IAT), 2010 IEEE/WIC/ACM International Conference on. Vol. 1. IEEE, 2010.

1.2 社交網(wǎng)絡(luò)內(nèi)容分類

面向文本的分類稱為文本分類。分類包括訓(xùn)練和測(cè)試兩階段，簡(jiǎn)單地說(shuō)，訓(xùn)練是根據(jù)已標(biāo)注類別的語(yǔ)料來(lái)學(xué)習(xí)分類規(guī)則或規(guī)律的過(guò)程。而測(cè)試是將已訓(xùn)練好的分類器用于新文本的過(guò)程。不管是訓(xùn)練還是測(cè)試，都需要將分類對(duì)象進(jìn)行特征表示，然后利用分類算法進(jìn)行學(xué)習(xí)或者分類。以下社交網(wǎng)絡(luò)中內(nèi)容主題分類的相關(guān)參考文獻(xiàn)，讀者可自行查閱。
　　Liu, Zitao, et al. “Short text feature selection for micro-blog mining.” Computational Intelligence and Software Engineering (CiSE), 2010 International Conference on. IEEE, 2010.
　　Yuan, Quan, Gao Cong, and Nadia Magnenat Thalmann. “Enhancing naive bayes with various smoothing methods for short text classification.” Proceedings of the 21st International Conference on World Wide Web. ACM, 2012.
　　Ling, Xiao, et al. “Can chinese web pages be classified with english data source?.” Proceedings of the 17th international conference on World Wide Web. ACM, 2008.
　　Zhang, Dan, et al. “Transfer Latent Semantic Learning: Microblog Mining with Less Supervision.” AAAI. 2011.

1.3 社交網(wǎng)絡(luò)推薦

協(xié)同過(guò)濾推薦：傳統(tǒng)的協(xié)同過(guò)濾根據(jù)用戶（user）和物品（item）信息構(gòu)建矩陣，根本的原則是相似用戶的選擇也相似，例如 a 和 b 都喜歡m，其中 a 還喜歡 n，那么 b 也有可能喜歡m。在社會(huì)化協(xié)同過(guò)濾推薦中，我們可以利用用戶之間的社交關(guān)系，彌補(bǔ)協(xié)同過(guò)濾矩陣中缺失的內(nèi)容，從而使協(xié)同過(guò)濾的結(jié)果更加精準(zhǔn)。
基于模型的推薦：
鄰居模型：Ma, Hao, et al. “Sorec: social recommendation using probabilistic matrix factorization.” Proceedings of the 17th ACM conference on Information and knowledge management. ACM, 2008.
矩陣分解模型：Funk, Simon. “Netflix update: Try this at home.” (2006).
融入社交網(wǎng)絡(luò)信息:Jamali, Mohsen, and Martin Ester. “A matrix factorization technique with trust propagation for recommendation in social networks.” Proceedings of the fourth ACM conference on Recommender systems. ACM, 2010.

2、社交網(wǎng)絡(luò)信息傳播規(guī)律

信息傳播是人們通過(guò)符號(hào)、信號(hào)、傳遞、接收與反饋信息的活動(dòng)，是人們彼此交換意見、思想、情感，已達(dá)到互相了解和影響的過(guò)程。社交網(wǎng)絡(luò)信息傳播是指以社交網(wǎng)絡(luò)為媒介進(jìn)行信息傳播的過(guò)程。研究社交網(wǎng)絡(luò)信息傳播的規(guī)律，有助于我們加深對(duì)社交系統(tǒng)的認(rèn)識(shí)，理解社交現(xiàn)象。也有助于模式發(fā)現(xiàn)，大影響力節(jié)點(diǎn)識(shí)別和個(gè)性化推薦。下面主要介紹幾種社交網(wǎng)絡(luò)信息傳播模型。

2.1 基于網(wǎng)絡(luò)結(jié)構(gòu)的傳播模型

線性閾值模型（ Linear Threshold）：
　　Granovetter, Mark. “Threshold models of collective behavior.” American journal of sociology 83.6 (1978): 1420-1443.
獨(dú)立級(jí)聯(lián)模型（ Independent Cascade）：
　　Goldenberg, Jacob, Barak Libai, and Eitan Muller. “Talk of the network: A complex systems look at the underlying process of word-of-mouth.” Marketing letters 12.3 (2001): 211-223.

2.2 基于群體狀態(tài)的傳播模型

傳染病模型（SI, SIS, SIR）, 傳染病模型是經(jīng)典的信息傳播模型，網(wǎng)上有豐富的參考資料。
線性影響力模型（ Linear Influence Model）：
　　Yang, Jaewon, and Jure Leskovec. “Modeling information diffusion in implicit networks.” Data Mining (ICDM), 2010 IEEE 10th International Conference on. IEEE, 2010.

2.3 基于信息特征的傳播模型

在線社交網(wǎng)絡(luò)中的信息承載著用戶網(wǎng)上活動(dòng)的所有記錄，在信息傳播分析時(shí)起著不可或缺的重要作用。信息本身也具有一些特性，例如時(shí)效性，主體多樣性，多源觸發(fā)，信息合作與競(jìng)爭(zhēng)等。依據(jù)這些特征，可建立不同的模型。
對(duì)社交網(wǎng)絡(luò)信息傳播規(guī)律的研究還包括熱度預(yù)測(cè)和信息溯源。
Myers, Seth A., Chenguang Zhu, and Jure Leskovec. “Information diffusion and external influence in networks.” Proceedings of the 18th ACM SIGKDD international conference on Knowledge discovery and data mining. ACM, 2012.
Beutel, Alex, et al. “Interacting viruses in networks: can both survive?.” Proceedings of the 18th ACM SIGKDD international conference on Knowledge discovery and data mining. ACM, 2012.

3、話題發(fā)現(xiàn)與演化

在話題發(fā)現(xiàn)和演化的大部分研究中，話題是指一個(gè)引起關(guān)注的事件或活動(dòng)，及其所有相關(guān)事件和活動(dòng)。其中，事件或者活動(dòng)是指在一個(gè)特定的時(shí)間和地點(diǎn)，發(fā)生的一些事情。社交網(wǎng)絡(luò)語(yǔ)料庫(kù)中的數(shù)據(jù)和傳統(tǒng)話題發(fā)現(xiàn)語(yǔ)料庫(kù)的數(shù)據(jù)區(qū)別較大，所以我們必須使用新的方法或?qū)鹘y(tǒng)方法進(jìn)行改進(jìn)來(lái)適應(yīng)社交網(wǎng)絡(luò)數(shù)據(jù)特點(diǎn)。
一般社交網(wǎng)絡(luò)例如 Twitter 的數(shù)據(jù)有以下特點(diǎn)：數(shù)據(jù)規(guī)模大、內(nèi)容簡(jiǎn)短、噪聲多、數(shù)據(jù)特征豐富等。下面介紹幾種主要的話題發(fā)現(xiàn)和演化模型。

3.1 基于主題模型的話題發(fā)現(xiàn)

最具有代表性的主題發(fā)現(xiàn)模型——LDA
Blei, David M., Andrew Y. Ng, and Michael I. Jordan. “Latent dirichlet allocation.” Journal of machine Learning research 3.Jan (2003): 993-1022.

3.2 基于向量空間模型的話題發(fā)現(xiàn)

Salton, Gerard, Anita Wong, and Chung-Shu Yang. “A vector space model for automatic indexing.” Communications of the ACM 18.11 (1975): 613-620.
Becker, Hila, Mor Naaman, and Luis Gravano. “Beyond Trending Topics: Real-World Event Identification on Twitter.” ICWSM 11.2011 (2011): 438-441.

3.3 基于詞項(xiàng)關(guān)系圖的話題發(fā)現(xiàn)

詞項(xiàng)共現(xiàn)是自然語(yǔ)言處理技術(shù)在信息檢索中的成功應(yīng)用之一。它的核心思想是詞項(xiàng)之間的共現(xiàn)頻率在某種程度上反映了詞項(xiàng)的語(yǔ)義關(guān)聯(lián)。最初學(xué)者們利用詞項(xiàng)共現(xiàn)來(lái)計(jì)算文檔的相似性，隨后學(xué)者們利用該方法來(lái)完成話題詞提取，話題句提取和摘要生成任務(wù)。
　　Sayyadi, Hassan, Matthew Hurst, and Alexey Maykov. “Event detection and tracking in social streams.” Icwsm. 2009.

3.4 基于主題模型的話題演化

Yin, Zhijun, et al. “LPTA: A probabilistic model for latent periodic topic analysis.” Data Mining (ICDM), 2011 IEEE 11th International Conference on. IEEE, 2011.
Wang, Xiaolong, Chengxiang Zhai, and Dan Roth. “Understanding evolution of research themes: a probabilistic generative model for citations.” Proceedings of the 19th ACM SIGKDD international conference on Knowledge discovery and data mining. ACM, 2013.

3.5 基于相鄰時(shí)間片關(guān)聯(lián)的話題演化

Lin, Cindy Xide, et al. “The joint inference of topic diffusion and evolution in social communities.” Data Mining (ICDM), 2011 IEEE 11th International Conference on. IEEE, 2011.
Saha, Ankan, and Vikas Sindhwani. “Learning evolving and emerging topics in social media: a dynamic nmf approach with temporal regularization.” Proceedings of the fifth ACM international conference on Web search and data mining. ACM, 2012.

4、影響力最大化

影響力最大化是在社交網(wǎng)絡(luò)中選定信息初始傳播用戶，使得信息的傳播范圍能達(dá)到最大，即影響力最大。影響力最大化算法的目的就是找出一定數(shù)量的用戶作為影響力傳播的初始節(jié)點(diǎn)。對(duì)影響力最大化的問(wèn)題的建模是基于社交網(wǎng)絡(luò)信息傳播模型的。其中最經(jīng)典的模型是線性閾值和獨(dú)立級(jí)聯(lián)模型。
影響力最大化算法被證明為 NP-hard問(wèn)題，下面主要介紹兩種典型的影響力最大化算法。

4.1 貪心算法

貪心算法從單個(gè)節(jié)點(diǎn)開始，計(jì)算每選一個(gè)新節(jié)點(diǎn)作為初始節(jié)點(diǎn)對(duì)每個(gè)節(jié)點(diǎn)帶來(lái)的邊際收益，取能造成邊際收益最大的點(diǎn)加入初始節(jié)點(diǎn)集合。貪心算法的缺點(diǎn)是計(jì)算時(shí)間成本較大，但是計(jì)算精度較高。
　　Kempe, David, Jon Kleinberg, and éva Tardos. “Maximizing the spread of influence through a social network.” Proceedings of the ninth ACM SIGKDD international conference on Knowledge discovery and data mining. ACM, 2003.
　　Chen, Wei, Yajun Wang, and Siyu Yang. “Efficient influence maximization in social networks.” Proceedings of the 15th ACM SIGKDD international conference on Knowledge discovery and data mining. ACM, 2009.

4.2 啟發(fā)式算法

不同于貪心算法選擇任何一個(gè)點(diǎn)作為初始節(jié)點(diǎn)開始計(jì)算，啟發(fā)式算法先通過(guò)一定策略選取一定數(shù)量的初始節(jié)點(diǎn)，然后計(jì)算其影響力傳播。其優(yōu)點(diǎn)是速度快，缺點(diǎn)是精度低。
　　Chen, Wei, Yajun Wang, and Siyu Yang. “Efficient influence maximization in social networks.” Proceedings of the 15th ACM SIGKDD international conference on Knowledge discovery and data mining. ACM, 2009.
　　Chen, Wei, Yifei Yuan, and Li Zhang. “Scalable influence maximization in social networks under the linear threshold model.” Data Mining (ICDM), 2010 IEEE 10th International Conference on. IEEE, 2010.

四、社交網(wǎng)絡(luò)分析的應(yīng)用

1、社交推薦

社交推薦顧名思義是利用社交網(wǎng)絡(luò)或者結(jié)合社交行為的推薦，具體表現(xiàn)為推薦 QQ 好友，微博根據(jù)好友關(guān)系推薦內(nèi)容等。在線推薦系統(tǒng)最早被亞馬遜用來(lái)推薦商品，如今，推薦系統(tǒng)在互聯(lián)網(wǎng)已無(wú)處不在，目前大熱的概念“流量分發(fā)是互聯(lián)網(wǎng)第一入口”，支撐這個(gè)概念有兩點(diǎn)核心，其一是內(nèi)容，另外就是推薦，今日頭條在短短幾年間的迅速崛起便是最好的證明。
　　根據(jù)推薦系統(tǒng)推薦原理，社交推薦可定義為一種“協(xié)同過(guò)濾”推薦，即不依賴于用戶的個(gè)人行為，而是結(jié)合用戶的好友關(guān)系進(jìn)行推薦。對(duì)于互聯(lián)網(wǎng)上的每一個(gè)用戶，通過(guò)其社交賬戶能很快定義這個(gè)用戶眾多特點(diǎn)，再加之社交網(wǎng)絡(luò)用戶數(shù)之多，使得利用社交關(guān)系的推薦近些年備受關(guān)注。
　　筆者所了解到的研究有，根據(jù)不同社交網(wǎng)絡(luò)之間進(jìn)行信息信息匹配進(jìn)而進(jìn)行推薦，有根據(jù)社交關(guān)系解決新注冊(cè)用戶的冷啟動(dòng)問(wèn)題等。如果想了解這方面更多信息還可以關(guān)注推薦系統(tǒng)領(lǐng)域頂級(jí)會(huì)議 ACM RecSys。

2、輿情分析

輿情分析在互聯(lián)網(wǎng)出現(xiàn)之前就被廣泛應(yīng)用在政府公共管理，商業(yè)競(jìng)爭(zhēng)情報(bào)搜集等領(lǐng)域。在社交媒體出現(xiàn)之前，輿情分析主要是線下的報(bào)紙，還有線上門戶網(wǎng)站的新聞稿件，這些信息的特點(diǎn)是相對(duì)專業(yè)準(zhǔn)確，而且易于分析和管理；但隨著社交媒體出現(xiàn)，輿情事件第一策源地已經(jīng)不是人民日?qǐng)?bào)新華社這樣的大媒體，而是某一個(gè)名不見經(jīng)傳的微博用戶，一個(gè)個(gè)人微信公眾號(hào)。他們的特點(diǎn)是信息非常新鮮，缺點(diǎn)是真實(shí)度較低且傳播十分迅速，難以控制。所以在社交網(wǎng)絡(luò)下的輿情分析是一門新的學(xué)問(wèn)。

3、隱私保護(hù)

在隱私保護(hù)領(lǐng)域，一方面要設(shè)計(jì)足夠安全的機(jī)制，技術(shù)層面的，法律層面的，在保護(hù)個(gè)人隱私的前提下最大化商業(yè)利益和用戶的體驗(yàn)。
舉一個(gè)大家比較熟悉的例子，即許多網(wǎng)站注冊(cè)賬戶的時(shí)候使用微信、支付寶賬戶驗(yàn)證，即免去了大家填寫個(gè)人信息的煩惱，又保護(hù)了大家的隱私。同理，螞蟻金服提供的芝麻信用功能也有隱私保護(hù)的功能。

4、用戶畫像

用戶畫像，這是個(gè)營(yíng)銷術(shù)語(yǔ)，即通過(guò)研究用戶的資料和行為，將其劃分為不同的類型，進(jìn)而采取不同的營(yíng)銷策略。傳統(tǒng)的用戶畫像最常用的手段就是調(diào)查問(wèn)卷，訂閱過(guò)雜志和報(bào)紙的讀者都知道，會(huì)有各種各樣的有獎(jiǎng)問(wèn)卷，一方面用來(lái)獲得對(duì)于產(chǎn)品的反饋，另一方面就是對(duì)你進(jìn)行畫像，這些畫像資料甚至廣泛在黑市流通，這就是你為什么有時(shí)候會(huì)接到莫名其妙的電話的原因（又扯到了隱私保護(hù)問(wèn)題）。

5、謠言檢測(cè)

傳統(tǒng)辟謠方法無(wú)非是進(jìn)行試試檢驗(yàn)，用證據(jù)說(shuō)話，隨著現(xiàn)在機(jī)器學(xué)習(xí)技術(shù)的迅速發(fā)展，我們也可以通過(guò)信息傳播的軌跡，信息內(nèi)容等維度自動(dòng)判斷消息是否屬于謠言，而且判斷地越迅速，對(duì)于輿情管理的意義就越大。同理，這種技術(shù)也被應(yīng)用在社交網(wǎng)絡(luò)有害信息識(shí)別。

6、可視化

五、社交網(wǎng)絡(luò)前沿研究

搜集了幾篇近兩年來(lái)在社交網(wǎng)絡(luò)頂級(jí)會(huì)議上比較受關(guān)注的文章，將文章的摘要翻譯并陳列，以供各位讀者參考。

1. Negative Link Prediction in Social Media

Tang, Jiliang, et al. “Negative link prediction in social media.” Proceedings of the Eighth ACM International Conference on Web Search and Data Mining. ACM, 2015
　　近年來(lái)，符號(hào)網(wǎng)絡(luò)（signed network）越來(lái)越受到關(guān)注。對(duì)于符號(hào)網(wǎng)絡(luò)的研究表明，負(fù)關(guān)系（negative link）對(duì)分析過(guò)程有幫助。由于許多網(wǎng)絡(luò)中用戶無(wú)法指定這種負(fù)關(guān)系，這是其被有效利用的主要障礙。話句話說(shuō)，負(fù)關(guān)系的重要性與其在真實(shí)數(shù)據(jù)集之間的應(yīng)用存在著差距。因此，我們自然而然會(huì)探討是否能通過(guò)公開的社交網(wǎng)絡(luò)數(shù)據(jù)自動(dòng)預(yù)測(cè)用戶的負(fù)關(guān)系。在本文中，我們研究了在社交媒體中僅僅用正關(guān)系和內(nèi)容為中心的交互行為（content-centric interactions）來(lái)預(yù)測(cè)負(fù)關(guān)系的問(wèn)題。我們對(duì)負(fù)關(guān)系做了一些列觀測(cè)并且提出了一個(gè)原則性框架 NeLP，該框架可以利用正關(guān)系和以內(nèi)容為中心的交互來(lái)預(yù)測(cè)負(fù)關(guān)系。我們對(duì)在現(xiàn)實(shí)社交網(wǎng)絡(luò)的實(shí)驗(yàn)結(jié)果表明，NeLP框架可以準(zhǔn)確地預(yù)測(cè)具有正關(guān)系和以內(nèi)容為中心的交互關(guān)系的負(fù)關(guān)系。我們的詳細(xì)實(shí)驗(yàn)還說(shuō)明了各種因素對(duì)NeLP框架有效性的重要性。

2. Twitter Sentiment Analysis with Deep Convolutional Neural Networks

Severyn, Aliaksei, and Alessandro Moschitti. “Twitter sentiment analysis with deep convolutional neural networks.” Proceedings of the 38th International ACM SIGIR Conference on Research and Development in Information Retrieval. ACM, 2015
　　本文介紹了我們用于推特輿情分析的深度學(xué)習(xí)系統(tǒng)。我們工作主要的貢獻(xiàn)是提出了一個(gè)初始化卷積神經(jīng)網(wǎng)絡(luò)參數(shù)權(quán)重的模型，這對(duì)于準(zhǔn)確訓(xùn)練模型至關(guān)重要，同時(shí)避免增加新的特征。簡(jiǎn)而言之，我們用無(wú)監(jiān)督神經(jīng)語(yǔ)言模型來(lái)訓(xùn)練初始的詞嵌入（initial word embeddings），這個(gè)詞嵌入將被通過(guò)我們的基于遠(yuǎn)程監(jiān)督語(yǔ)料庫(kù)（distant supervised corpus）的深度學(xué)習(xí)模型進(jìn)一步調(diào)整。在最后階段，預(yù)先訓(xùn)練的參數(shù)將被用于初始化我們的模型，然后我們通過(guò)由Semeval-2015組織的Twitter情緒分析官方系統(tǒng)評(píng)價(jià)競(jìng)賽最近提供的監(jiān)督訓(xùn)練集對(duì)后者進(jìn)行培訓(xùn)。我們的方法得到的結(jié)果和參與競(jìng)賽的系統(tǒng)的結(jié)果之間的比較表明，我們的模型可以分別排在短語(yǔ)級(jí)別子任務(wù)A（11個(gè)團(tuán)隊(duì)）和消息級(jí)子任務(wù)B（40個(gè)團(tuán)隊(duì)）前兩位。這證明了我們解決方案的實(shí)際價(jià)值。

3. Social Recommendation with Strong and Weak Ties

Wang, Xin, et al. “Social Recommendation with Strong and Weak Ties.” Proceedings of the 25th ACM International on Conference on Information and Knowledge Management. ACM, 2016
　　隨著在線社交網(wǎng)絡(luò)的爆炸式增長(zhǎng)，現(xiàn)在人們普遍了解，社會(huì)信息對(duì)推薦系統(tǒng)非常有幫助。社會(huì)推薦方法能夠應(yīng)對(duì)關(guān)鍵的冷啟動(dòng)問(wèn)題，從而可以大大提高預(yù)測(cè)精度。主要的原因是，基于信任和影響，人們對(duì)其朋友購(gòu)買過(guò)的產(chǎn)品表現(xiàn)出更多的興趣。盡管在社交推薦領(lǐng)域已經(jīng)有大量工作，但是很少有人關(guān)注社交強(qiáng)關(guān)系和弱關(guān)系這兩個(gè)重要的社會(huì)學(xué)概念之間的區(qū)別。在這篇文章中，我們使用鄰域重疊來(lái)逼近關(guān)系強(qiáng)度，并擴(kuò)展受歡迎的貝葉斯個(gè)性化排名（BPR）模型并將其用于區(qū)別強(qiáng)弱關(guān)系。我們提出了一種基于 EM （EM-based）的算法，它可以根據(jù)最優(yōu)推薦準(zhǔn)確度（optimal recommendation accuracy）對(duì)強(qiáng)弱關(guān)系進(jìn)行分類并學(xué)習(xí)所有用戶和所有商品的潛在特征向量（latent feature vectors）。我們對(duì)四個(gè)現(xiàn)實(shí)世界數(shù)據(jù)集進(jìn)行廣泛的實(shí)驗(yàn)，并證明我們提出的方法在各種精度指標(biāo)中顯著優(yōu)于目前最好的成對(duì)排名（pairwise ranking）方法。

4. Online Actions with Offline Impact: How Online Social Networks Influence Online and Offline User Behavior

Althoff, Tim, P. Jindal, and J. Leskovec. “Online Actions with Offline Impact: How Online Social Networks Influence Online and Offline User Behavior.” Tenth ACM International Conference on Web Search and Data Mining ACM, 2016:537-546
　　如今許多應(yīng)用軟件都廣泛地利用了社交網(wǎng)絡(luò)功能并允許用戶互相連接、互相關(guān)注、分享內(nèi)容和評(píng)價(jià)動(dòng)態(tài)。盡管這些功能已經(jīng)被廣泛應(yīng)用，對(duì)于用戶在線時(shí)和離線后參與還是保留的行為卻很少有人理解。本文中，我們通過(guò)一個(gè)運(yùn)動(dòng)記錄 APP研究了社交網(wǎng)絡(luò)是如何影響用戶線下行為的。
　　我們分析了600萬(wàn)用戶五年間的七億九千一百萬(wàn)條線上和線下活動(dòng)記錄，結(jié)果表明社交網(wǎng)絡(luò)對(duì)用戶線上和線下的行為有著巨大的影響。具體來(lái)講，我們提出了社交網(wǎng)絡(luò)影響用戶行為的因果關(guān)系。我們發(fā)現(xiàn)新社交關(guān)系的建立能將用戶在 APP 中的活躍度提高30%，用戶保留率提高17%，線下活躍率提高7%（大約每天多走400步）。通過(guò)開展自然實(shí)驗(yàn)，我們將新社交關(guān)系對(duì)用戶的影響和用戶因?yàn)閷?duì) APP 的興趣而走更多步數(shù)作了區(qū)分。
　　我們發(fā)現(xiàn)社交影響占所有對(duì)用戶行為影響因素的55%，剩下的45%可以用用戶對(duì) APP 本身的興趣來(lái)解釋。此外我們還發(fā)現(xiàn)一連串的個(gè)人用戶之間的社交關(guān)系建立對(duì)每日步數(shù)的增加有顯著影響，用戶之間每增加一條邊都對(duì)會(huì)減弱這種影響，并且這些變化是基于邊屬性和用戶自己的資料屬性。最后我們用這些現(xiàn)象設(shè)計(jì)了一個(gè)模型，模型用來(lái)判斷哪些用戶最容易被新建立的社交網(wǎng)絡(luò)關(guān)系影響。

Intertwined Viral Marketing in Social Networks

Zhang, Jiawei, et al. “Intertwined viral marketing in social networks.” Advances in Social Networks Analysis and Mining (ASONAM), 2016 IEEE/ACM International Conference on. IEEE, 2016
　　傳統(tǒng)的病毒式營(yíng)銷問(wèn)題旨在為一個(gè)單一產(chǎn)品選擇一個(gè)種子用戶的子集，以最大限度地提高其在社交網(wǎng)絡(luò)中的知名度。而然在實(shí)際情況下，許多產(chǎn)品可以同時(shí)在社交網(wǎng)絡(luò)中進(jìn)行推廣。從產(chǎn)品層面來(lái)看，這些產(chǎn)品之間的關(guān)系是互相纏繞的，舉個(gè)例子，就是競(jìng)爭(zhēng)、互補(bǔ)且獨(dú)立的關(guān)系。
　　在這篇文章中，我們將研究“糾纏影響力最大化”問(wèn)題，它是基于一個(gè)目標(biāo)產(chǎn)品需要在社交網(wǎng)絡(luò)上進(jìn)行宣傳，而同時(shí)有多個(gè)競(jìng)爭(zhēng)/互補(bǔ)/獨(dú)立的產(chǎn)品在推廣這樣的場(chǎng)景。糾纏影響力最大化是一個(gè)非常具有挑戰(zhàn)性的問(wèn)題，首先是因?yàn)楹苌儆心Ｐ湍苣M多種產(chǎn)品同時(shí)宣傳時(shí)的信息擴(kuò)散形式；第二是對(duì)于目標(biāo)產(chǎn)品最優(yōu)種子集的選擇可能很大程度上取決于其它產(chǎn)品的營(yíng)銷策略。為了解決此問(wèn)題，我們提出了一種統(tǒng)一貪心算法框架（interTwined Influence EstimatoR， TIER），在四種不同類型現(xiàn)實(shí)社交網(wǎng)絡(luò)數(shù)據(jù)集的實(shí)驗(yàn)表明TIER 優(yōu)于所有的比較方法，在解決糾纏影響力最大化問(wèn)題上有著顯著優(yōu)勢(shì)。

Who to Invite Next? Predicting Invitees ofSocial Groups

Yu Han, and Jie Tang. "Who to Invite Next?Predicting Invitees of Social Groups " Proceedings of theTwenty-Sixth International Joint Conference on Artificial Intelligence (IJCAI-17).2017.
　　WhatsApp、Snapchat 和微信等社交即時(shí)通訊工具很大程度上改變了人們工作生活和交流的方式，也受到了多個(gè)領(lǐng)域例如計(jì)算機(jī)科學(xué)、心理學(xué)、社會(huì)學(xué)和物理學(xué)的關(guān)注。在社交即時(shí)消息工具中，社交群組在多用戶交流中扮演著重要的角色。一個(gè)有趣的問(wèn)題是，社交群組動(dòng)態(tài)演變的機(jī)制是什么？更具體來(lái)說(shuō)，在一個(gè)群組中，誰(shuí)將會(huì)被邀請(qǐng)加入？這篇文章中，我們研究社交群組潛在加入者這樣一個(gè)新穎的問(wèn)題。我們采用微信這個(gè)中國(guó)最大的社交軟件作為實(shí)驗(yàn)數(shù)據(jù)的來(lái)源。我們提出了一個(gè)概率圖模型用來(lái)計(jì)算影響用戶被邀請(qǐng)加入群組概率的因子。我們的實(shí)驗(yàn)預(yù)測(cè)結(jié)果表明我們的模型相比目前的其他模型有顯著的提高。

7. The Co-Evolution Model for Social NetworkEvolving and Opinion Migration

Gu,Yupeng, Yizhou Sun, and Jianxi Gao. “The Co-Evolution Model for SocialNetwork Evolving and Opinion Migration.” Proceedings of the 23rd ACMSIGKDD International Conference on Knowledge Discovery and Data Mining.ACM, 2017.
　　幾乎所有的真實(shí)社交網(wǎng)絡(luò)都是動(dòng)態(tài)且隨著時(shí)間演化的。新的鏈路的形成和舊的鏈路的消失很大程度上取決于社交網(wǎng)絡(luò)用戶的同質(zhì)性。同時(shí)，一些社交網(wǎng)絡(luò)用戶的隱性性質(zhì)例如用戶的觀點(diǎn)也隨著時(shí)間而變化。其中一部分原因是用戶從社交網(wǎng)絡(luò)中接收到影響力，這些改變進(jìn)而會(huì)影響社交網(wǎng)絡(luò)的結(jié)構(gòu)。社交網(wǎng)絡(luò)的演化和節(jié)點(diǎn)性質(zhì)的遷移通常被認(rèn)為是兩個(gè)獨(dú)立正交的問(wèn)題。
　　在這篇文章中，我們提出一種協(xié)演化模型，通過(guò)對(duì)兩種現(xiàn)象的建模形成閉環(huán)。模型有兩個(gè)主要部分：（1）一個(gè)已知節(jié)點(diǎn)性質(zhì)的網(wǎng)絡(luò)生成模型；（2）一個(gè)已知社交網(wǎng)絡(luò)結(jié)構(gòu)的節(jié)點(diǎn)性質(zhì)遷移模型。
　　通過(guò)模擬發(fā)現(xiàn)我們的模型有一些不錯(cuò)的特性：（1）它可以模擬一個(gè)大范圍現(xiàn)象，例如觀點(diǎn)的收斂和基于社群的觀點(diǎn)差異；（2）它可以通過(guò)一系列因子例如社交影響力范圍，意見領(lǐng)袖，噪聲等級(jí)來(lái)控制網(wǎng)絡(luò)的演化。
　　最后，我們模型的有效性通過(guò)在對(duì)議會(huì)立法議案支持者的預(yù)測(cè)中得到了驗(yàn)證，并且我們的模型優(yōu)于一些目前的方法。

總結(jié)

以上是生活随笔為你收集整理的(一文读懂社交网络分析（附应用、前沿、学习资源）学习笔记)的全部?jī)?nèi)容，希望文章能夠幫你解決所遇到的問(wèn)題。

如果覺(jué)得生活随笔網(wǎng)站內(nèi)容還不錯(cuò)，歡迎將生活随笔推薦給好友。