日韩av黄I国产麻豆传媒I国产91av视频在线观看I日韩一区二区三区在线看I美女国产在线I麻豆视频国产在线观看I成人黄色短片

歡迎訪問 生活随笔!

生活随笔

當(dāng)前位置: 首頁 >

UA MATH567 高维统计III 随机矩阵8 社区发现 Spectral Clustering的理论分析

發(fā)布時間:2025/4/14 58 豆豆
生活随笔 收集整理的這篇文章主要介紹了 UA MATH567 高维统计III 随机矩阵8 社区发现 Spectral Clustering的理论分析 小編覺得挺不錯的,現(xiàn)在分享給大家,幫大家做個參考.

UA MATH567 高維統(tǒng)計(jì)III 隨機(jī)矩陣8 社區(qū)發(fā)現(xiàn) Spectral Clustering的理論分析

上一講我們完成了Stochastic Block Model與社區(qū)發(fā)現(xiàn)問題的建模,并描述了目標(biāo):Community detection in networks的目標(biāo)是給定一個某個隨機(jī)矩陣的樣本數(shù)據(jù)集,要還原隨機(jī)矩陣的期望的特征向量。同時我們明確了算法分析的基本方法是攝動方法,這里描述一個大致思路:

我們對社區(qū)發(fā)現(xiàn)算法進(jìn)行理論分析的目的是說明這樣的算法能夠提供一個一致的、誤差可以被控制的輸出,也就是要說明算法還原出來的特征向量(算法輸出)與隨機(jī)矩陣期望的特征向量(理論結(jié)果)之差的范數(shù)足夠小,在理論分析的時候,我們可以認(rèn)為算法與理論的區(qū)別在于算法計(jì)算特征向量時用的是帶噪聲的數(shù)據(jù),因此我們需要能分析矩陣噪聲對特征值的影響的工具,于是我們選擇了攝動方法。


Davis-Kahan定理 假設(shè)S,TS,TS,T是對稱矩陣,假設(shè)min?j≠i∣λi(S)?λj(S)∣=δ>0\min_{j \ne i}|\lambda_i(S)-\lambda_j(S)| = \delta>0minj?=i?λi?(S)?λj?(S)=δ>0,用vi(S)v_i(S)vi?(S)表示矩陣SSS的第iii個特征值對應(yīng)的標(biāo)準(zhǔn)化的特征向量,用θi(S,T)\theta_{i}(S,T)θi?(S,T)表示矩陣S,TS,TS,T的第iii個特征值對應(yīng)的特征向量形成的夾角,則
sin?θi(S,T)≤2∥S?T∥δ\sin \theta_i(S,T) \le \frac{2\left\| S-T \right\|}{\delta}sinθi?(S,T)δ2S?T?

評注
i) 雖然這個結(jié)果看起來只能說明當(dāng)S,TS,TS,T兩個矩陣相差不大時,它們的特征向量的夾角也不大,但我們可以進(jìn)一步得到它們特征向量之差的范數(shù)的結(jié)果:

因?yàn)?span id="ozvdkddzhkzd" class="katex--inline">θi(S,T)∈[0,π/2]\theta_i(S,T) \in [0,\pi/2]θi?(S,T)[0,π/2],于是
1≤∥vi(S)?vi(T)∥2sin?θi(S,T)≤21 \le \frac{\left\|v_i(S) - v_i(T) \right\|_2}{\sin \theta_i(S,T)} \le \sqrt{2}1sinθi?(S,T)vi?(S)?vi?(T)2??2?

所以
∥vi(S)?vi(T)∥2≤22∥S?T∥δ\left\|v_i(S) - v_i(T) \right\|_2 \le \frac{2\sqrt{2}\left\| S-T \right\|}{\delta}vi?(S)?vi?(T)2?δ22?S?T?


Spectral Clustering
假設(shè)我們使用Spectral Clustering來做Community detection in networks,根據(jù)上一講的簡單分析:

如果AAA表示一個隨機(jī)網(wǎng)絡(luò),計(jì)算它的v2(A)v_2(A)v2?(A),則v2(A)v_2(A)v2?(A)的某個元素的符號表示對應(yīng)節(jié)點(diǎn)所屬的社區(qū)。

定理 考慮隨機(jī)網(wǎng)絡(luò)G(n,p,q)G(n,p,q)G(n,p,q),如果min?(q,p?q)=μ>0\min(q,p-q)=\mu>0min(q,p?q)=μ>0,則?c>0\exists c>0?c>0,Spectral Clustering最多搞錯c/μ2c/\mu^2c/μ2個節(jié)點(diǎn)的概率至少是1?4e?n1-4e^{-n}1?4e?n

證明
AAA表示這個隨機(jī)網(wǎng)絡(luò)的伴隨矩陣,做分解
A=D+RA = D+RA=D+R

其中DDD是一個不含隨機(jī)性的矩陣,rankD=2rank D=2rankD=2, ∥D∥=λ1=(p+q)n2\left\| D \right\|=\lambda_1 = \frac{(p+q)n}{2}D=λ1?=2(p+q)n?并且λ2=(p?q)n2\lambda_2 = \frac{(p-q)n}{2}λ2?=2(p?q)n?P(∥R∥≤2CKn)≥1?4e?nP(\left\| R \right\| \le 2CK\sqrt{n}) \ge 1-4e^{-n}P(R2CKn?)1?4e?n

δ=min?(λ1?λ2,λ2)=nμ>0\delta = \min(\lambda_1-\lambda_2,\lambda_2)=n\mu>0δ=min(λ1??λ2?,λ2?)=nμ>0,于是我們可以使用Davis-Kahan定理以及上面這個概率不等式:?C′>0\exists C'>0?C>0
∥v2(D)?v2(A)∥2≤22C′nμn\left\| v_2(D)-v_2(A) \right\|_2 \le \frac{2\sqrt{2}C'\sqrt{n}}{\mu n}v2?(D)?v2?(A)2?μn22?Cn??

這個不等式成立的概率是1?e?4n1-e^{-4n}1?e?4n,要考慮搞錯的節(jié)點(diǎn)個數(shù),需要考慮n\sqrt{n}n?乘以特征向量,于是
n∥v2(D)?v2(A)∥2≤22C′μn∥v2(D)?v2(A)∥22≤8C′2μ2\sqrt{n}\left\| v_2(D)-v_2(A) \right\|_2 \le \frac{2\sqrt{2}C'}{\mu} \\ \sqrt{n}\left\| v_2(D)-v_2(A) \right\|^2_2 \le \frac{8C'^2}{\mu^2}n?v2?(D)?v2?(A)2?μ22?C?n?v2?(D)?v2?(A)22?μ28C2?

c=8C′2c = 8C'^2c=8C2,則定理得證。

總結(jié)

以上是生活随笔為你收集整理的UA MATH567 高维统计III 随机矩阵8 社区发现 Spectral Clustering的理论分析的全部內(nèi)容,希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網(wǎng)站內(nèi)容還不錯,歡迎將生活随笔推薦給好友。