《基于张量网络的机器学习入门》学习笔记5
《基于張量網(wǎng)絡的機器學習入門》學習筆記5
- 量子概率體系
- 事件
- 互斥事件
- 概率與測量
- 不相容屬性對
- 相容屬性對
- 量子概率與經(jīng)典概率的區(qū)別
- 量子測量
量子概率體系
我們將經(jīng)典的實數(shù)概率擴展到復數(shù)概率,從而論述了一整套新的概率體系,我們將其稱為量子概率。現(xiàn)在,我們從較粗糙的公理化角度顯現(xiàn)地論述整個量子概率公理體系。
事件
在經(jīng)典概率論中,我們用集合表示事件,用交、并、補等運算來組合出更多的事件。同時定義了兩個特殊的事件,一個是不可能事件對應集合空集,另一個是必然事件對應全集。
在量子概率中,我們用復線性空間(希爾伯特空間)HHH作為基本事件的集合。任意一個事件都是該線性空間中的一個子空間(直線、平面或者超平面)。在量子概率中,不可能事件對應000向量,即000維的線性空間。必然事件對應整個線性空間HHH。同時,量子概率中也有基本的三種運算。
定義:否運算——設事件AAA對應的子空間為LAL_ALA?,那么Aˉ\bar{A}Aˉ事件則對應著垂直于LAL_ALA?的子空間記做LA⊥L_A^ \botLA⊥?
例如,事件AAA對應的子空間LAL_ALA?為三維空間中的一條直線lll,那么非AAA這個事件對應的子空間就是垂直于lll的整個平面。
定義:與運算——設事件AAA對應的子空間為LAL_ALA?,事件BBB對應的子空間為LBL_BLB?,那么事件AAA且BBB對應的子空間就是這兩個線性子空間的交集,即:LA∩B=LA∧LBL_{A\cap B}=L_A\land L_BLA∩B?=LA?∧LB?
例如LAL_ALA?和LBL_BLB?都是三維空間中的兩張平面,那么LA∩BL_{A\cap B}LA∩B?就是這兩張平面的交線。如果LAL_ALA?和LBL_BLB?都是三維空間中的直線,則它們的交LA∩BL_{A\cap B}LA∩B?必然是一個點,這個點就是000維線性空間。
定義:或運算——設事件AAA對應的子空間為LAL_ALA?,事件BBB對應的子空間為LBL_BLB?,那么事件AAA或BBB對應的子空間就是由著兩個空間所張成的更大的空間,即:LA∪B=Span(LA,LB)L_{A\cup B}=Span(L_A,L_B)LA∪B?=Span(LA?,LB?)
注意:量子概率中的或運算與經(jīng)典概率中事件或運算的本質是不同的,它不是兩個子空間的并集,而是線性擴展SpanSpanSpan。例如設LAL_ALA?和LBL_BLB?分別是兩條相交于一點的直線,那么LA∪BL_{A\cup B}LA∪B?就是這兩條直線所張成的平面。
量子概率的運算性質雖然大多與經(jīng)典事件的運算性質相同,但是有一個本質的區(qū)別,就是量子概率中的事件的運算不一定滿足分配律,即:
LA∧(LB∨LC)≠(LA∧LB)∨(LA∧LC)L_A\land(L_B\vee L_C)\neq(L_A\land L_B)\vee(L_A\land LC)LA?∧(LB?∨LC?)?=(LA?∧LB?)∨(LA?∧LC)
例如,在如圖所示的空間中,有三條同在一個平面內的直線LA,LB,LCL_A,L_B,L_CLA?,LB?,LC?,分別對應事件A,B,CA,B,CA,B,C,則LB∨LCL_B\vee L_CLB?∨LC?就是整個平面,而LA(LB∨LC)L_A(L_B\vee L_C)LA?(LB?∨LC?)就是LAL_ALA?這根直線。但反過來,由于LA∧LBL_A\land L_BLA?∧LB?和LA∧LCL_A\land L_CLA?∧LC?都是點,所以(LA∧LB)∨(LA∧LC)(L_A\land L_B)\vee(L_A\land L_C)(LA?∧LB?)∨(LA?∧LC?)還是點。所以量子事件不一定滿足分配律。
互斥事件
在傳統(tǒng)概率論中,一枚硬幣要么朝上,要么朝下,不可能同時發(fā)生,每拋一次必然有一個發(fā)生,那么這兩個事件構成了互斥事件。
定義:互斥事件——給定一組事件A1,A2,?,AnA_1,A_2,\cdots,A_nA1?,A2?,?,An?,它們分別對應子空間L1,L2,?,LnL_1,L_2,\cdots,L_nL1?,L2?,?,Ln?,則這些子空間滿足:
Li∧Lj=OL_i\land L_j=OLi?∧Lj?=O,andandand Li⊥Lj,for?i,jL_i\bot L_j,for \forall i,jLi?⊥Lj?,for?i,j
并且:
Span(L1,L2,?,Ln)=HSpan(L_1,L_2,\cdots,L_n)=HSpan(L1?,L2?,?,Ln?)=H
那么,我們稱這組事件互斥。
在經(jīng)典概率論中,互斥事件往往表現(xiàn)為一條線上的不同點對應的不同取值。但是,在量子概率中,每一個屬性值都對應著一條直線,這樣,nnn組屬性值就對應著nnn條直線,并且這些屬性值都是兩兩互斥的,即這些直線兩兩垂直,所有這些可能的直線張成了一個nnn維希爾伯特空間。
概率與測量
在量子概率中,我們可以采用三個步驟來計算任意一個事件的概率。首先,確定一個狀態(tài)來表示系統(tǒng)所處的環(huán)境和條件,我們用∣z?\mathinner{|z\rangle}∣z?來表示該狀態(tài),它是希爾伯特空間HHH中的一個向量,并且這個向量的長度必須是111,即:?z∣z?=1\mathinner{\langle z|z\rangle}=1?z∣z?=1。這里,?z∣\mathinner{\langle z|}?z∣表示向量∣z?\mathinner{|z\rangle}∣z?的共軛,而?z∣z?\mathinner{\langle z|z\rangle}?z∣z?則表示向量?z∣\mathinner{\langle z|}?z∣和∣z?\mathinner{|z\rangle}∣z?的內積。
其次,我們需要定義投影算子的概念。
定義:投影算子——每個事件AAA都對應了一個投影算子PAP_APA?,我們可以把狀態(tài)向量∣z?\mathinner{|z\rangle}∣z?通過PAP_APA?的作用投影到事件AAA對應的子空間LAL_ALA?上,因此,投影算子表示為:PA:H→LAP_A:H\to L_APA?:H→LA?
在幾何上,投影算子就是求向量∣z?\mathinner{|z\rangle}∣z?到子空間LAL_ALA?上的投影向量,因此,這個投影就構成了一個向量:PA∣z?P_A\mathinner{|z\rangle}PA?∣z?,這個概念可以用下圖清晰地表達。
在圖中,原向量為∣z?\mathinner{|z\rangle}∣z?,投影空間LAL_ALA?為一個平面,則∣z?\mathinner{|z\rangle}∣z?在其上的投影為紅色向量。
最后,我們計算該投影向量的模平方即為事件AAA的發(fā)生概率:
Pr(A)=∣PA∣z?∣2=?z∣PA∣z?Pr(A)=\mathinner{|P_A|z\rangle|}^2=\mathinner{\langle z|P_A|z\rangle}Pr(A)=∣PA?∣z?∣2=?z∣PA?∣z?(注:Pr(A)Pr(A)Pr(A)表達AAA事件發(fā)生的概率)
在量子概率中,測量是一個十分重要的過程,它不僅決定了一個事件發(fā)生的概率,而且也改變了系統(tǒng)的狀態(tài)。也就是說,如果我們測量過狀態(tài)是zzz的量子系統(tǒng),并且得到了事件AAA發(fā)生的結果,那么該量子系統(tǒng)的狀態(tài)將變成:z′=PAz∣PAz∣z^{'}=\frac{P_Az}{|P_Az|}z′=∣PA?z∣PA?z?
也就是說,我們將用AAA事件的概率∣PAz∣|P_Az|∣PA?z∣去重新歸一化向量∣PAz∣|P_Az|∣PA?z∣,這樣測量之后的狀態(tài)∣z′∣|z^{'}|∣z′∣又是一個長度為111的單位向量了。加入我們對狀態(tài)z′z^{'}z′再進行一次完全相同的測量,就會得到:Pr(A)=∣PAz′∣2=∣PAPAz∣PAz∣∣2=∣PAPAz∣2∣PAz∣2=∣PAz∣2∣PAz∣2=1Pr(A)=|P_Az^{'}|^2=|P_A\frac{P_Az}{|P_Az|}|^2=\frac{|P_AP_Az|^2}{|P_Az|^2}=\frac{|P_Az|^2}{|P_Az|^2}=1Pr(A)=∣PA?z′∣2=∣PA?∣PA?z∣PA?z?∣2=∣PA?z∣2∣PA?PA?z∣2?=∣PA?z∣2∣PA?z∣2?=1
所以一旦測量PAP_APA?,得到AAA發(fā)生的概率之后,系統(tǒng)將會一直呈現(xiàn)出AAA事件的狀態(tài)保持不變。
在量子概率中,一次測量就是將某一個投影算子作用到一個狀態(tài)向量上,測量的結果是讓觀察者得到一個確定的事件,同時也會讓被測向量完成一次投影,形成一個新向量。
不相容屬性對
量子概率和經(jīng)典概率最大的不同就是存在著不相容的屬性對,也就是不能同時進行兩個屬性的測量。
定義:不相容屬性對——假設屬性MMM有mmm個不同屬性值{M1,M2,?,Mm}\{M_1,M_2,\cdots,M_m\}{M1?,M2?,?,Mm?},這些屬性值張成了mmm維線性空間HHH,并且每兩個屬性對所對應的子空間彼此垂直。另有一個屬性NNN,它也有mmm個屬性值{N1,N2,?,Nm}\{N_1,N_2,\cdots,N_m\}{N1?,N2?,?,Nm?},這些屬性值的子空間也張成一個mmm維的線性空間H′H^{'}H′,如果H=H′H=H^{'}H=H′,則稱MMM和NNN著兩個屬性不相容
例如:假設m=2m=2m=2,這樣MMM屬性的兩個屬性值就張成了一個平面HHH。若MMM與NNN是不相容屬性對,那么NNN屬性的兩個屬性值張成的二維空間H′H^{'}H′也是HHH,這就意味著,NNN對應的是HHH中的另外一個坐標系;如下圖所示,黑色的坐標系就表示MMM屬性,藍色的坐標系表示NNN屬性。
下面考慮兩組不同的測量。第一組是先測量事件M1M_1M1?是否發(fā)生,在測量事件N1N_1N1?是否發(fā)生;第二組先測量N1N_1N1?再測量M1M_1M1?。按照前面定義的測量規(guī)則,第一組測量相當于先把向量∣z?\mathinner{|z\rangle}∣z?投影到M1M_1M1?直線上,然后將M1M_1M1?上的單位向量投影到x′x^{'}x′上。這兩種結果最終得到的系統(tǒng)狀態(tài)是完全不同的。第一組測量最終得到的是∣N1?\mathinner{|N_1\rangle}∣N1??上的單位向量,而第二組測量將得到∣M1?\mathinner{|M_1\rangle}∣M1??上的單位向量。不同的測量順序所導致不同的結果也會體現(xiàn)在投影算符上,即存在不等式:PNiPMj≠PMjPNiP_{Ni}P_{Mj}\neq P_{Mj}P_{Ni}PNi?PMj??=PMj?PNi?
不同的測量順序會導致不同的測量結果,這正是量子概率不兼容屬性的一種特別的性質之一。
相容屬性對
如果兩個屬性MMM和NNN可以被同時測量,則它們就構成了相容的屬性對。在數(shù)學上,相容的屬性對可以用復合系統(tǒng)來表示。
定義:相容屬性對——假設屬性MMM有mmm個不同屬性值{M1,M2,?,Mm}\{M_1,M_2,\cdots,M_m\}{M1?,M2?,?,Mm?},另有一個屬性NNN,它有nnn個屬性值{N1,N2,?,Nn}\{N_1,N_2,\cdots,N_n\}{N1?,N2?,?,Nn?},那么如果這兩組屬性值可以張成m×nm\times nm×n維空間HHH,并且每兩個屬性對的復合,即:Mi?Nj?i,jM_i\otimes N_j\forall i,jMi??Nj??i,j都構成m×nm\times nm×n維空間HHH中的一組基,那么這兩個屬性值就是相互兼容的。
所以,這m×nm\times nm×n位的希爾伯特空間就可以寫成:
H=Span(?,Mi?Nj,?),?i<m,j<nH=Span(\cdots,M_i\otimes N_j,\cdots),\forall i<m,j<nH=Span(?,Mi??Nj?,?),?i<m,j<n
下面,我們對相容屬性對進行測量。
假設有兩個相容屬性對,每個屬性對都具有222個可能的屬性值(我們都用000和111來表示)。因此,全空間HHH就可以寫成這兩個屬性對中任意兩個屬性值的組合張成的空間。
H=Span(∣00?,∣01?,∣10?,∣11?)H=Span(\mathinner{|00\rangle},\mathinner{|01\rangle},\mathinner{|10\rangle},\mathinner{|11\rangle})H=Span(∣00?,∣01?,∣10?,∣11?)
在這些基中,寫在左側的表示第一個屬性值。下面對第一個屬性值等于000進行測量:當?shù)谝粋€屬性值等于000,第二個屬性還有000和111兩種可能,因此二者結合就張成了一個二維的線性空間,并且∣00?\mathinner{|00\rangle}∣00?和∣01?\mathinner{|01\rangle}∣01?構成了這個二維子空間的基向量。所以,對第一個屬性值測量就相當于把一個思維空間投影到二維的平面上面。所以,對第一個屬性值測量就相當于把一個思維空間中的向量投影到二維的平面上。
相容屬性對的測量是不區(qū)分順序的。如果先對第一個屬性值000進行測量,就會把444維投影到∣00?\mathinner{|00\rangle}∣00?和∣01?\mathinner{|01\rangle}∣01?構成的二維平面上,然后再對第二個屬性值是否為000經(jīng)行測量,相當于把向量投影到∣00?\mathinner{|00\rangle}∣00?這個向量上面。反過來,如果先對第二個屬性是否為000進行測量,最終也會把向量投影到∣00?\mathinner{|00\rangle}∣00?這個向量上面。所以,這兩種不同順序的測量是完全相同的。
實際上,對相容屬性對的測量就是一個將為的過程,系統(tǒng)中的向量會被逐漸壓縮到一條直線上。但是,對不相容屬性的測量不會產生降維的現(xiàn)象。
量子概率與經(jīng)典概率的區(qū)別
| 聯(lián)合概率 | Pr(A∧B)Pr(A\land B)Pr(A∧B) | Pr(A∧B)=Pr(B∧A)Pr(A\land B)=Pr(B\land A)Pr(A∧B)=Pr(B∧A) | 無定義 |
| 條件概率 | Pr(A∣B)Pr(A\mid B)Pr(A∣B) | Pr(A∣B)=Pr(A∧B)P(B)Pr(A\mid B)=\frac{Pr(A\land B)}{P(B)}Pr(A∣B)=P(B)Pr(A∧B)? | ∣PAPB∣z?∣2∣PB∣z?∣2\frac{\mid P_AP_B\mathinner{\mid z\rangle}\mid ^2}{\mid P_B\mathinner{\mid z\rangle}\mid ^2}∣PB?∣z?∣2∣PA?PB?∣z?∣2? |
| 條件概率 | Pr(B∣A)Pr(B\mid A)Pr(B∣A) | Pr(B∣A)=Pr(A∧B)P(A)Pr(B\mid A)=\frac{Pr(A\land B)}{P(A)}Pr(B∣A)=P(A)Pr(A∧B)? | ∣PBPA∣z?∣2∣PA∣z?∣2\frac{\mid P_BP_A\mathinner{\mid z\rangle}\mid ^2}{\mid P_A\mathinner{\mid z\rangle}\mid ^2}∣PA?∣z?∣2∣PB?PA?∣z?∣2? |
| 全概率公式 | 無 | Pr(A)=∑iPr(A∣Bi)Pr(Bi)Pr(A)=\sum\limits_{i}Pr(A\mid B_i)Pr(B_i)Pr(A)=i∑?Pr(A∣Bi?)Pr(Bi?) | 不成立 |
| 條件概率互易性 | Pr(A∣B)=Pr(B∣A)Pr(A\mid B)=Pr(B\mid A)Pr(A∣B)=Pr(B∣A) | 不滿足 | 滿足 |
| 雙向隨機性 | ∑iPr(Ai∣Bj)=∑jPr(Ai∣Bj)\sum\limits_{i}Pr(A_i\mid B_j)=\sum\limits_{j}Pr(A_i\mid B_j)i∑?Pr(Ai?∣Bj?)=j∑?Pr(Ai?∣Bj?) | 不滿足 | 滿足 |
雖然經(jīng)典概率系統(tǒng)的性質都可以在量子概率的兼容屬性測量中找到對應,但是反過來,量子概率中的不兼容屬性對具備的性質則具有特殊性,所以說量子概率是比經(jīng)典概率蘊含了更多東西的概率運算系統(tǒng)。
量子測量
對于一個由狀態(tài)∣ψ?\mathinner{|\psi\rangle}∣ψ?描述的量子系統(tǒng),可以由一組測量算符{Mm}\{M_m\}{Mm?}描述,這里的算符本質都是一些比較特殊的矩陣,當他們作用在被測量系統(tǒng)的態(tài)空間上,可能的測量結果之一mmm發(fā)生的可能性為:
p(m)=?∣Mm?Mm∣?p(m)=\mathinner{\langle|M_m^{\dagger}M_m|\rangle} p(m)=?∣Mm??Mm?∣?
測量后系統(tǒng)的狀態(tài)為:
Mm∣ψ??∣Mm?Mm∣?\frac{M_m\mathinner{|\psi\rangle}}{\sqrt{\mathinner{\langle|M_m^{\dagger}M_m|\rangle}}} ?∣Mm??Mm?∣??Mm?∣ψ??
測量算子需要滿足完備性方程∑mMm?Mm=1\sum\limits_{m}M_m^{\dagger}M_m=1m∑?Mm??Mm?=1,即:
∑mp(m)=∑m?ψ∣Mm?Mm∣ψ?\sum\limits_{m}p(m)=\sum\limits_{m}\mathinner{\langle\psi|M_m^{\dagger}M_m|\psi\rangle} m∑?p(m)=m∑??ψ∣Mm??Mm?∣ψ?
這幾個式子非常的復雜,也難懂,希望我們能通過下面的例題理解到它的原理。
例111 用{∣0?,∣1?}\{\mathinner{|0\rangle},\mathinner{|1\rangle}\}{∣0?,∣1?}測量量子態(tài)∣φ?=α∣0?+β∣1?(∣α∣2+∣β∣2=1)\mathinner{|\varphi\rangle}=\alpha\mathinner{|0\rangle}+\beta\mathinner{|1\rangle}(|\alpha|^2+|\beta|^2=1)∣φ?=α∣0?+β∣1?(∣α∣2+∣β∣2=1)
解:M0=∣0??0∣=[1000],M1=∣1??1∣=[0001]M_0=\mathinner{|0\rangle}\mathinner{\langle0|}=\begin{bmatrix} 1 & 0 \\ 0 & 0 \end{bmatrix},M_1=\mathinner{|1\rangle}\mathinner{\langle1|}=\begin{bmatrix} 0 & 0 \\ 0 & 1 \end{bmatrix}M0?=∣0??0∣=[10?00?],M1?=∣1??1∣=[00?01?],顯然M02=M0,M12=M1M_0^2=M_0,M_1^2=M_1M02?=M0?,M12?=M1?,所以根據(jù)歸一化原理可得:I=M0?M0+M1?M1I=M_0^{\dagger}M_0+M_1^{\dagger}M_1I=M0??M0?+M1??M1?。且∣φ?=α∣0?+β∣1?\mathinner{|\varphi\rangle}=\alpha\mathinner{|0\rangle}+\beta\mathinner{|1\rangle}∣φ?=α∣0?+β∣1?,故有
p(0)=?ψ∣M0?M0∣ψ?=?ψ∣M0∣ψ?=∣α∣2,p(1)=?ψ∣M1?M1∣ψ?=?ψ∣M1∣ψ?=∣β∣2p(0)=\mathinner{\langle\psi|M_0^{\dagger}M_0|\psi\rangle}=\mathinner{\langle\psi|M_0|\psi\rangle}=|\alpha|^2,p(1)=\mathinner{\langle\psi|M_1^{\dagger}M_1|\psi\rangle}=\mathinner{\langle\psi|M_1|\psi\rangle}=|\beta|^2p(0)=?ψ∣M0??M0?∣ψ?=?ψ∣M0?∣ψ?=∣α∣2,p(1)=?ψ∣M1??M1?∣ψ?=?ψ∣M1?∣ψ?=∣β∣2。即以∣α∣2|\alpha|^2∣α∣2的概率得到∣0?\mathinner{|0\rangle}∣0?,以∣β∣2|\beta|^2∣β∣2的概率得到∣1?\mathinner{|1\rangle}∣1?。
例222 用{∣+?,∣??}\{\mathinner{|+\rangle},\mathinner{|-\rangle}\}{∣+?,∣??}測量上述態(tài)時,可先變形為
∣φ?=α2(∣+?+∣??)+β2(∣+??∣??)=α+β2∣+?+α?β2∣??\mathinner{|\varphi\rangle}=\frac{\alpha}{\sqrt{2}}(\mathinner{|+\rangle}+\mathinner{|-\rangle})+\frac{\beta}{\sqrt{2}}(\mathinner{|+\rangle}-\mathinner{|-\rangle})=\frac{\alpha+\beta}{\sqrt{2}}\mathinner{|+\rangle}+\frac{\alpha-\beta}{\sqrt{2}}\mathinner{|-\rangle}∣φ?=2?α?(∣+?+∣??)+2?β?(∣+??∣??)=2?α+β?∣+?+2?α?β?∣??
將以∣(α+β)2∣2|\frac{(\alpha+\beta)}{\sqrt{2}}|^2∣2?(α+β)?∣2的概率得到∣+?\mathinner{|+\rangle}∣+?,以∣(α?β)2∣2|\frac{(\alpha-\beta)}{\sqrt{2}}|^2∣2?(α?β)?∣2的概率得到∣??\mathinner{|-\rangle}∣??
這周就學到這里了。
總結
以上是生活随笔為你收集整理的《基于张量网络的机器学习入门》学习笔记5的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 《基于张量网络的机器学习入门》学习笔记4
- 下一篇: 《基于张量网络的机器学习入门》学习笔记6