陶哲轩论文解析:从特征值到特征向量
陶哲軒論文解析:從特征值到特征向量
- 背景
- 什么是特征值和特征向量
- 教科書版求解方法
- 舉個栗子
- 特征值和特征向量的主要性質
- 矩陣特征分解
- 陶哲軒論文內容
- 簡單摘要一下
- 定義一波
- 先看看結論
- 舉個栗子
- 來證明一下
- 第一種:用Cauchy-Binet引理
- 第二種:用伴隨矩陣證明
- 最后
背景
陶哲軒和三個物理學家張西寧、Peter Denton和Stephen Parke的論文《EIGENVECTORS FROM EIGENVALUES》。這篇論文寫了一種新的從特征值求解特征向量的方法并完成數學證明。用陶哲軒的話說:這個公式看起來好得令人難以置信,我完全沒想過,子矩陣的特征值編碼了原矩陣特征向量的隱藏信息。
論文地址:https://arxiv.org/abs/1908.03795
https://arxiv.org/pdf/1908.03795.pdf
什么是特征值和特征向量
對于一個n階方陣A,存在n維非零向量x和標量λ,使下式滿足:
Ax=λxAx=λx Ax=λx即:矩陣A乘以向量x,僅對x做了線性變換λx,而未改變向量的方向。這時,對于方陣A,滿足條件的λ就是特征值,x就是該特征值對應的特征向量。
教科書版求解方法
1.先求特征值
將上式改寫為
(A?λI)x=0(A-λI)x=0 (A?λI)x=0該式為x的線性方程組,x存在非零解需要滿足條件:
det(A?λI)=0det(A-λI)=0 det(A?λI)=0det指對行列式的求解。可以得到一個關于λ的一元n次方程,包括重根可得到n個解,即為A的特征值。
2.求解特征向量
將計算得到的某特征值λ代入方程:
(A?λI)x=0(A-λI)x=0 (A?λI)x=0可以解得非零向量x為λ的特征向量。
舉個栗子
太懶了不想打公式,找了個百度文庫的栗子截個圖
先求特征值,得到-2和7,然后分別求-2和7的特征向量。
比如求特征值-2的特征向量:
注意:特征向量是一個方向,如(4,-5),(8,-10) 都是特征值-2的特征向量,因此一般用單位向量來表示。
特征值和特征向量的主要性質
矩陣特征分解
矩陣對角化又稱為矩陣的特征分解,常常應用在Hermit矩陣中。
假設現在有一個NxN的矩陣A,如果這個矩陣A有N個線性無關的特征向量,那么A就可以分解為:A=VDV?1A=VDV^{-1} A=VDV?1其中,D是以n個特征值為對角元素的n*n的對角陣diag{λ},V是n個特征值對應的n個線性無關的列特征向量組成的方陣
V=[v(1),v(2),v(3),...,v(n)]V=[v^{(1)},v^{(2)},v^{(3)},...,v^{(n)}] V=[v(1),v(2),v(3),...,v(n)]
該分解常常用于實對稱矩陣的分解,因為實對稱的矩陣的特征值和特征向量一定為實數。
陶哲軒論文內容
下面進入正題。
陶哲軒這篇被傳的神乎其神的論文到底講了個啥。
簡單摘要一下
一般的求解特征值特征向量的方法是求解特征值后將特征值帶回特征方程求解線性方程組。這篇論文針對Hermitian矩陣論證了存在于特征值和特征向量信息之間的聯系,提出了一種不需要知道矩陣元素,僅通過特征值和主子矩陣的特征值求解平方賦范特征向量的方法。
定義一波
先看看結論
這篇文章主要就是證明了一個公式。即:特征值和特征向量之間存在著的一個普遍的規律。
稍微解釋一下。
AAA是需要求特征向量的Hermitian矩陣。
λi(A)λ_{i}(A)λi?(A)是方陣A的特征值,共n個。
MjM_{j}Mj?是A的(n-1)階的主子矩陣,共n個,每個有n-1個特征值,表示為λk(Mj)λ_{k}(M_{j})λk?(Mj?)
∣vi,j∣2|v_{i,j}|^{2}∣vi,j?∣2是特征值λi對應的n維的特征向量vi的第j個值的平方。
那么,我們就得到了求解平方賦范特征向量的方法。
舉個栗子
因為筆者過于懶惰,例子抄自https://blog.csdn.net/FnqTyr45/article/details/103104824
來證明一下
陶提供了兩種證法,一種是用柯西-binet引理,另一種用伴隨矩陣證明。
第一種:用Cauchy-Binet引理
先證引理
對存在特征值為 0的矩陣A,不失一般性的假設λn=0λ_{n}=0λn?=0,那么(1)成立。
證明:
右邊=det(B* AB), B表示B的共軛對稱。
將A特征分解為A=VDV,其中,D是對角陣,V是n個線性無關的向量組成的正交矩陣,因此VV*=I(單位矩陣)
右邊=det(B* VDV* B)
因為B是大小為n*(n-1)的任意矩陣,我們令B=V*B,并把B的前n-1行寫作B’,最后一行寫作任意的n-1維向量x.
右邊=det(B?DB)det(B^{*}DB)det(B?DB) 大小為(n?1)?n(n-1)*n(n?1)?n,n?nn*nn?n ,n?(n?1)n*(n-1)n?(n?1)
由于D的特征值組成的對角陣,且λn=0λ_{n}=0λn?=0,因此第n行,第n列為0。
因此,右邊=det(B?DB)=det(B′?D′B)det(B^{*}DB)=det(B'^{*}D'B)det(B?DB)=det(B′?D′B),D’表示去掉第n行和第n列的0.
應用一個特征值的性質: 所有n個特征值包括重根的乘積等于該方陣的行列式值。得到右邊=∏i=1n?1λi(A)∣det(B′)∣2右邊=\prod_{i=1}^{n-1}λ_{i}(A)|det(B')|^{2} 右邊=i=1∏n?1?λi?(A)∣det(B′)∣2
對比左邊,只需證明|det(B vnv_{n}vn?)|=|det(B’)|,其中(B vnv_{n}vn?)是拼接得到的nxn矩陣.
因為A=D,那么vn=env_{n}=e_{n}vn?=en?,是λn=0λ_{n}=0λn?=0的特征向量,滿足Den=0en。en是列向量(0,0,0…1)
因此對于(B vnv_{n}vn?)第n列只有最后一個值是1,其他都是0
根據行列式計算法則得到|det(B vnv_{n}vn?)|=|det(B’)|,得到
左邊=∏i=1n?1λi(A)∣det(B′)∣2左邊=\prod_{i=1}^{n-1}λ_{i}(A)|det(B')|^{2} 左邊=i=1∏n?1?λi?(A)∣det(B′)∣2
證明結論
非常簡單。
我們的上面的引理的A有一個特征值是0,那普通的沒有怎么辦?沒有特征值創造特征值也要上啊。假設A的最后一個特征值是 λn,那么,A=A?λnIA=A-λ_{n}IA=A?λn?I,這樣就得到了一個存在特征值 λn=0的hermitian矩陣A。
我們再假設要求第n個特征向量的第一個元素,即i=n,j=1。要證明的式子就變成了(3)
右邊我們再應用連乘的性質,知道了右邊=det(Mj)
最后我們應用Cauchy-Binet引理,令B=第一行是全0,下面n-1維方陣是單位矩陣。代入這個式子
計算行列式可得右邊det(B*AB)=det(Mj)
左邊|det(B vnv_{n}vn?)|=∣vn,1∣|v_{n,1}|∣vn,1?∣
證明完畢。
第二種:用伴隨矩陣證明
先上圖
先翻譯關鍵詞
adj():伴隨矩陣
vjvj?vjvj^{*}vjvj?我¥們只需要知道它的對角元素是我們要求的平方賦范向量就可以了。
進入證明:
(4)是伴隨矩陣的性質。
兩邊同乘以特征向量vj
(λIn?A)?vj=λvj?λjvj(λI_{n}-A)*v_{j}=λv_{j}-λ_{j}v_{j}(λIn??A)?vj?=λvj??λj?vj?
(λIn?A)?1?vj=(λ?λj)?1vj(λI_{n}-A)^{-1}*v_{j}=(λ-λ_{j})^{-1}v_{j} (λIn??A)?1?vj?=(λ?λj?)?1vj?再應用det(方陣)=特征值連乘,det(λI-A)=∏i=1n(λ?λi)\prod^{n}_{i=1}(λ-λ_{i})∏i=1n?(λ?λi?)得到(5)
取特征向量v1,v2,…vn作為標準正交基,Σn(vjvj?)=I\Sigma_n(v_{j}v_{j}^{*})=IΣn?(vj?vj??)=I.對(5)乘以vj*后連加,得到(6)
取λ為λj得到(7)成立。因此,(7)左邊伴隨矩陣的對角元素也等于右邊的對角元素(就是我們想要的平方賦范特征向量)
根據伴隨矩陣的定義:
得到(7)左邊伴隨矩陣的對角元素Aii=det(Mi)=∏k=1n?1λk(Mi)\prod^{n-1}_{k=1}λ_{k} (M_{i})∏k=1n?1?λk?(Mi?)
證明完畢。
最后
稍微劃一下重點:
那么這個發現有什么意義呢?
引用一下我同學的發言:對我們這個水平的人來說就沒什么用。
總結
以上是生活随笔為你收集整理的陶哲轩论文解析:从特征值到特征向量的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: ZZULIOJ 1188: 选票统计(一
- 下一篇: mindmanager2020许可密钥永