node2vec简单总结
node2vec
參考博客:https://zhuanlan.zhihu.com/p/56542707
偽代碼
def node2vec_walk(G, u, walk_length):walk = [u]for l in range(walk_length):V = get_neighbors(G, walk[-1])s = alias_sample(V, pi) # 核心的采樣策略walk.append(s)return walk def node2vec(...):walks = []for r in range(walk_iter):for u in AllNodes:walk = node2vec_walk(G, u, walk_length)walks.append(walk)Word2Vec(walks)SGD()Alias Sampling
1、首先需要根據(jù)node2vec的轉(zhuǎn)移策略得到預(yù)處理的轉(zhuǎn)移概率。這樣,對(duì)于每個(gè)當(dāng)前節(jié)點(diǎn)u,我們都可以知道所有鄰居節(jié)點(diǎn)的轉(zhuǎn)移概率列表,并對(duì)這個(gè)列表進(jìn)行歸一化得到概率。
2、有了這個(gè)概率分布列表,我們就可以根據(jù)其進(jìn)行alias sample,得到本次需要選出的鄰居節(jié)點(diǎn)。
3、我們通過處理可以得到alias_table,時(shí)間復(fù)雜度是O(n)O(n)O(n)。這樣之后每次采樣的時(shí)間復(fù)雜度就是O(1)O(1)O(1)。
假設(shè)有N個(gè)鄰居節(jié)點(diǎn),轉(zhuǎn)移到節(jié)點(diǎn)i的概率為pip_ipi?,則可以將全部概率看作是1*N矩形的面積,這樣,qiq_iqi? 就可以寫成 pi?N∑k=1Npk\frac{p_i * N}{\sum_{k=1}^{N}p_k}∑k=1N?pk?pi??N?,如果進(jìn)行歸一化,那么分母就是1。有一些項(xiàng)乘N之后會(huì)>1,有一些會(huì)<1,那么再用>1的部分依次去補(bǔ)全<1的部分(最終剛好可以全部都補(bǔ)全)。最終隨機(jī)random一個(gè) r∈[0,1)r \in [0, 1)r∈[0,1)和 K∈[0,N)K \in [0, N)K∈[0,N),如果r<q[K]r<q[K]r<q[K],那么接受事件i,否則返回alias[i]。(參考:https://zhuanlan.zhihu.com/p/54867139)
總結(jié)
以上是生活随笔為你收集整理的node2vec简单总结的全部?jī)?nèi)容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: icem划分网格步骤_ICEM CFD教
- 下一篇: C语言-位段