louvain算法python_【转载】LOUVAIN算法
Louvain 算法來源于文章2010年的論文Fast unfolding of communities in large networks,簡稱為Louvian [1]。
算法原理
Louvain算法是基于模塊度(Modularity)的社區發現算法,該算法在效率和效果上都表現比較好,并且能夠發現層次性的社區結構,其優化的目標是最大化整個圖屬性結構(社區網絡)的模塊度。
其中需要理解的核心點有:
模塊度Modularity的定義,這個定義是描述社區內緊密程度的值QQ;
模塊度增量ΔQ\Delta Q,即把一個孤立的點放入一個社區C后,計算Modularity的變化,其中計算過程的要點是,首先計算1個點的Modularity,和社區C的Modularity,再計算合并后新社區的Modularity,新社區的Modularity減去前兩個Modularity就是ΔQ\Delta Q。
對上述公式的理解是,將ΔQ\Delta Q展開其等價于1/2*(ki,in/m-Sumtot/m*ki/m)1/2 *( k_i,in / m - Sum_{tot} / m * ki / m ),其中kik_i,in/min/m表示的是將孤立的節點和社區C放在一起對整個網絡 Modularity 的影響,而?Sumtot/mSum_{tot} / m 和?ki/mki / m?分別表示孤立的節點和社區C分開式分別對整個網絡Modularity的影響,所以他們的差值就反應了孤立的節點放入社區C前后對整個網絡Modularity的影響。
算法的計算過程如下:每個點作為一個community,然后考慮每個community的鄰居節點,合并到community,然后看ΔQ\Delta Q;找到最大的正ΔQ\Delta Q,合并點到community;多進行幾輪,至不再變動,那么結束;
其中存在的問題是,不同的節點訪問順序將導致不同的結果,實驗中發現這個順序對結果影響不大,但是會在一定程度上影響計算時間。將新的community作為點,重復上述過程。那么如何確定新的點之前的權重呢?答案是將兩個community之間相鄰的點之間的權重和作為兩個community退化成一個點后的新的權重。
該算法的優點主要有3個:
易于理解
非監督
計算快速
最后我們可以得到的結果是層次化的社區發現結果。
Figure 1 Louvain結果示意圖1
Figure 2?Louvain結果示意圖2
算法的改進: 還有其加速實現的論文,例如[2], 其實現方式比較直接,就是考慮一個點周圍的百分之多少點進行歸并。可以在spark下面通過類似于多路歸并來實現。
參考資料:
總結
以上是生活随笔為你收集整理的louvain算法python_【转载】LOUVAIN算法的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: java多线程创建runnable_Ja
- 下一篇: python微信推送消息_Python编