从数学的视角看社交网络
生活随笔
收集整理的這篇文章主要介紹了
从数学的视角看社交网络
小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.
社交網(wǎng)絡(luò)是有趣(http://blog.csdn.net/wireless_com/article/details/50737928)而又令人迷惑的(http://blog.csdn.net/wireless_com/article/details/50534612)的,總希望希望從社交網(wǎng)絡(luò)本身找到一些對移動互聯(lián)網(wǎng)產(chǎn)品有啟發(fā)的東西,而自己的社交網(wǎng)絡(luò)有限,只得求助于專家們的著作了,這點(diǎn)文字是《社交網(wǎng)絡(luò)分析-方法與實(shí)踐》一書(地鐵閱讀時(shí)光)的筆記。
社交網(wǎng)絡(luò)分析(SNA)是探索關(guān)系背后的科學(xué)與技術(shù),從數(shù)學(xué)的角度看社交網(wǎng)絡(luò),用圖論的方法探查社交網(wǎng)絡(luò)。在技術(shù)上,通過python 以及相關(guān)包文件的支持,來完成可計(jì)算的社交網(wǎng)絡(luò)(http://www.github.com/maksim2042/SNABook?)。
什么是關(guān)系呢?在人際關(guān)系中,除了友誼,影響,情感,信任之外呢?關(guān)系可以是二元的,也可以被賦值,可以是對稱的,也可以是非對稱的,現(xiàn)實(shí)中更常見的是雙峰關(guān)系或者多模關(guān)系。
基于獨(dú)立性假設(shè),通過泊松過程或樸素貝葉斯可以建立一些模型進(jìn)行統(tǒng)計(jì)分析,進(jìn)而得到一些宏觀結(jié)果的概率。但如果拋開獨(dú)立性假設(shè),認(rèn)為所有的關(guān)系都是潛在的相依關(guān)系,著就是圖論的用武之地。節(jié)點(diǎn)表示網(wǎng)絡(luò)內(nèi)的獨(dú)立行動者,邊表示行動者直接的關(guān)系,進(jìn)而通過單模圖,雙模圖,多模圖來描述社交網(wǎng)絡(luò)。數(shù)學(xué)上表示社交網(wǎng)絡(luò)的基本方法是矩陣,但是鄰接矩陣過于疏松,可以采用邊列表的形式來存儲社交網(wǎng)絡(luò)。
用圖來描述社交網(wǎng)絡(luò),圖的距離是對圖進(jìn)行量化分析的一種方法,通過圖的遍歷可以獲得信息傳播中的最短路徑和距離。我們學(xué)過的軟件基礎(chǔ)來了,深度優(yōu)先和廣度優(yōu)先的搜索,在NetworkX 中有現(xiàn)成的算法dfs_edges 和bfs_edges. ?對于非加權(quán)圖,距離意味著最短路徑;對于加權(quán)圖,距離是最低成本路徑, 而歐幾里得距離是建立在節(jié)點(diǎn)相似性上的。
誰是社交網(wǎng)絡(luò)中重要的人?看一個節(jié)點(diǎn)的邊的個數(shù)——程度中心性。程度中心性是服從冪律分布的。 誰是社交網(wǎng)絡(luò)中的消息傳播者?看一個節(jié)點(diǎn)的平均距離的倒數(shù)——親近中心性,值越大黏度越大。 誰是傳播瓶頸?看每對節(jié)點(diǎn)的最短距離,然后歸一化處理——居間中心性,值越大越是精英群體。 誰是“灰衣主教”? 相當(dāng)于對程度中心性遞歸——特征向量中心性,它是隱形的核心。
google 的pagerank 算法可以說是將中心性理念發(fā)揮的淋漓盡致,面向移動產(chǎn)品的PageRank 很有空間呀?
對于社交網(wǎng)絡(luò)中可分析的單元,圖論中以子圖和組元來描述。子圖是一個以某一特定節(jié)點(diǎn)為核心的子網(wǎng)絡(luò),就象linkedin中“我的網(wǎng)絡(luò)”,分析一個網(wǎng)絡(luò)半徑大于3的自我中心網(wǎng)絡(luò)是一個錯誤。
關(guān)系來了: 1)不對稱連接,維系不超過兩周 2)對稱的連接,較穩(wěn)定 3)三元組隨著時(shí)間的推移是最穩(wěn)定的,然而存在著禁止進(jìn)入的三元組和結(jié)構(gòu)洞。
社交網(wǎng)絡(luò)分析(SNA)是探索關(guān)系背后的科學(xué)與技術(shù),從數(shù)學(xué)的角度看社交網(wǎng)絡(luò),用圖論的方法探查社交網(wǎng)絡(luò)。在技術(shù)上,通過python 以及相關(guān)包文件的支持,來完成可計(jì)算的社交網(wǎng)絡(luò)(http://www.github.com/maksim2042/SNABook?)。
什么是關(guān)系呢?在人際關(guān)系中,除了友誼,影響,情感,信任之外呢?關(guān)系可以是二元的,也可以被賦值,可以是對稱的,也可以是非對稱的,現(xiàn)實(shí)中更常見的是雙峰關(guān)系或者多模關(guān)系。
基于獨(dú)立性假設(shè),通過泊松過程或樸素貝葉斯可以建立一些模型進(jìn)行統(tǒng)計(jì)分析,進(jìn)而得到一些宏觀結(jié)果的概率。但如果拋開獨(dú)立性假設(shè),認(rèn)為所有的關(guān)系都是潛在的相依關(guān)系,著就是圖論的用武之地。節(jié)點(diǎn)表示網(wǎng)絡(luò)內(nèi)的獨(dú)立行動者,邊表示行動者直接的關(guān)系,進(jìn)而通過單模圖,雙模圖,多模圖來描述社交網(wǎng)絡(luò)。數(shù)學(xué)上表示社交網(wǎng)絡(luò)的基本方法是矩陣,但是鄰接矩陣過于疏松,可以采用邊列表的形式來存儲社交網(wǎng)絡(luò)。
用圖來描述社交網(wǎng)絡(luò),圖的距離是對圖進(jìn)行量化分析的一種方法,通過圖的遍歷可以獲得信息傳播中的最短路徑和距離。我們學(xué)過的軟件基礎(chǔ)來了,深度優(yōu)先和廣度優(yōu)先的搜索,在NetworkX 中有現(xiàn)成的算法dfs_edges 和bfs_edges. ?對于非加權(quán)圖,距離意味著最短路徑;對于加權(quán)圖,距離是最低成本路徑, 而歐幾里得距離是建立在節(jié)點(diǎn)相似性上的。
誰是社交網(wǎng)絡(luò)中重要的人?看一個節(jié)點(diǎn)的邊的個數(shù)——程度中心性。程度中心性是服從冪律分布的。 誰是社交網(wǎng)絡(luò)中的消息傳播者?看一個節(jié)點(diǎn)的平均距離的倒數(shù)——親近中心性,值越大黏度越大。 誰是傳播瓶頸?看每對節(jié)點(diǎn)的最短距離,然后歸一化處理——居間中心性,值越大越是精英群體。 誰是“灰衣主教”? 相當(dāng)于對程度中心性遞歸——特征向量中心性,它是隱形的核心。
google 的pagerank 算法可以說是將中心性理念發(fā)揮的淋漓盡致,面向移動產(chǎn)品的PageRank 很有空間呀?
對于社交網(wǎng)絡(luò)中可分析的單元,圖論中以子圖和組元來描述。子圖是一個以某一特定節(jié)點(diǎn)為核心的子網(wǎng)絡(luò),就象linkedin中“我的網(wǎng)絡(luò)”,分析一個網(wǎng)絡(luò)半徑大于3的自我中心網(wǎng)絡(luò)是一個錯誤。
關(guān)系來了: 1)不對稱連接,維系不超過兩周 2)對稱的連接,較穩(wěn)定 3)三元組隨著時(shí)間的推移是最穩(wěn)定的,然而存在著禁止進(jìn)入的三元組和結(jié)構(gòu)洞。
有向三元組有16種可能情況,哪些命名誕生于1972年,和我差不多大了。三元組形成了子圖,最大的完全子圖就是派系。建立子圖的方法一般是分層聚類。人們的想法,態(tài)度和社會關(guān)系是由個體在群體中的身份所決定的,而群體的形成源于成員的態(tài)度。
鑒于節(jié)點(diǎn)的類型不同,形成了多模網(wǎng)絡(luò)。從二模網(wǎng)絡(luò)中可以創(chuàng)建隸屬網(wǎng)絡(luò),以及同質(zhì)性網(wǎng)絡(luò)。對于多模網(wǎng)絡(luò),矩陣乘法可以得出很多有價(jià)值的結(jié)論。
如果可以對移動社交網(wǎng)絡(luò)進(jìn)行模擬仿真,是一件多么有意思的事呀??初始化一個空的網(wǎng)絡(luò)圖,并在其中增加n個數(shù)據(jù)類型的對象,然后循環(huán)遍歷每一個可能的節(jié)點(diǎn)之間的組合,當(dāng)概率等于密度的參數(shù)的時(shí)候,將在兩個節(jié)點(diǎn)間添加一個連接,這種生成圖的算法稱為Erdos-Renyi 算法,是一種生成隨機(jī)圖的最簡單方法,并產(chǎn)生一個正太分布的度分布,但實(shí)際上多數(shù)社交網(wǎng)絡(luò)符合一個長尾的度分布即冪律分布。
總結(jié)
以上是生活随笔為你收集整理的从数学的视角看社交网络的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 视频教程-2020年上半年 软考 系统分
- 下一篇: 【书】软件设计师教程(第4版)(百度云免