社交网络初探——链路预测
? ? ? ?社交網(wǎng)絡(luò)可以用來描述現(xiàn)實(shí)社會(huì)中的實(shí)際網(wǎng)絡(luò),它包括人與人之間的社會(huì)關(guān)系,物種之間的捕食關(guān)系,科學(xué)研究中的合作關(guān)系等。大量研究已經(jīng)表明在真實(shí)世界中各種不同社交網(wǎng)絡(luò)具有許多共同的結(jié)構(gòu)特征,例如小世界性質(zhì)、無標(biāo)度性、社團(tuán)結(jié)構(gòu)等。
? ? ? ?目前,社團(tuán)發(fā)現(xiàn)算法已比較成熟,具體的算法有:GN算法、譜平算法、Kernighan-Lin算法等。
? ? ? ?社團(tuán)劃分方法也有很多。
? ? ? ?以下是《基于鏈路預(yù)測的微博用戶關(guān)系分析》的一些學(xué)習(xí)筆記:
? ? ? ?微博用戶之間形成了復(fù)雜的社交網(wǎng)絡(luò)。在微博用戶之間有各種影響因素,鏈路預(yù)測是微博用戶關(guān)系分析的一種模型,該種方法引入了屬性特征,構(gòu)造了隨機(jī)森林的鏈路預(yù)測模型,并將模型應(yīng)用于新浪微博用戶數(shù)據(jù)集,進(jìn)行微博用戶關(guān)系的訓(xùn)練預(yù)測。通過比較引入微博屬性特征前后的預(yù)測性能以及特征的重要性分布,分析了各類特征對微博用戶關(guān)系形成的影響。
? ? ??網(wǎng)絡(luò)中的鏈路預(yù)測是指如何通過已知的網(wǎng)絡(luò)結(jié)構(gòu)等信息,預(yù)測網(wǎng)絡(luò)中尚未產(chǎn)生連接的兩個(gè)節(jié)點(diǎn)之間產(chǎn)生連接的可能性。網(wǎng)絡(luò)中的頂點(diǎn)代表用戶,邊代表用戶關(guān)系,鏈路預(yù)測問題正是對用戶未來關(guān)系的分析。目前,社會(huì)網(wǎng)絡(luò)鏈路預(yù)測模型主要發(fā)展為三大類:
? ? ?1)基于有監(jiān)督學(xué)習(xí)的分類模型,如決策樹、樸素貝葉斯、神經(jīng)網(wǎng)絡(luò)、SVM、KNN及集成方法中的bagging、boossting和隨機(jī)森林等。
? ? ?2)概率模型,該模型主要是建立一組可調(diào)參數(shù)的模型,然后使用優(yōu)化策略尋找最優(yōu)的參數(shù)值,使模型能夠達(dá)到最優(yōu),這時(shí)兩個(gè)未連邊的節(jié)點(diǎn)對的概率就是它們產(chǎn)生連邊的條件概率。概率模型的構(gòu)建方法有貝葉斯網(wǎng)絡(luò)模型和馬爾科夫網(wǎng)絡(luò)關(guān)系模型等。
? ? ?3)線性代數(shù)方法,該方法是通過降階相似矩陣來計(jì)算網(wǎng)絡(luò)中節(jié)點(diǎn)之間的相似性。Kuegis等人利用圖的鄰接矩陣,并定義一個(gè)函數(shù)F使得兩個(gè)時(shí)刻的鄰接矩陣的差異性最小,這樣就將鏈路預(yù)測問題轉(zhuǎn)換成線性代數(shù)優(yōu)化問題,之后再通過矩陣變換和降維的方法將問題轉(zhuǎn)換為一維的最小二乘曲線擬合問題。
? ? 該文章從網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)特征(度特征、共同朋友特征、朋友總數(shù)特征、中介朋友特征、優(yōu)先鏈接特征、Adamic-Adar特征、朋友評價(jià)特征、反向關(guān)系特征、鄰居子圖特征)、微博屬性特征(用戶的關(guān)注數(shù)、粉絲數(shù)、微博消息數(shù)、所在地)以及朋評價(jià)、鄰居子圖等特征分析了用戶關(guān)系的影響構(gòu)造出基于隨機(jī)森林(Random Forest)的鏈路預(yù)測模型,最后分析了預(yù)測模型中各特征的Gini指標(biāo),獲得了特征的重要性分布,從而驗(yàn)證了網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)特征和微博屬性特征對用戶關(guān)系的影響。
? ?數(shù)據(jù)集的獲取是通過中國爬盟的新浪微博用戶關(guān)系數(shù)據(jù)集作為微博研究數(shù)據(jù),數(shù)據(jù)使用之前要對數(shù)據(jù)進(jìn)行清洗。
? ?——————————————————————————————————————————————————————
? 歡迎各位交流探討,不吝賜教。轉(zhuǎn)載請注明出處。
總結(jié)
以上是生活随笔為你收集整理的社交网络初探——链路预测的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: java中的几种泛型类——HashSet
- 下一篇: 为啥动物界大部分雄性比雌性漂亮,而人类恰