线代 [3]|从增广矩阵漫谈矩阵转置对向量在四个向量子空间内的“飞舞”(第三篇)
原創首發于CSDN,轉載請注明出處,謝謝!
文章目錄
- 前言
- 增廣矩陣(Augmented matrix)
- |從QR分解的角度重構增廣矩陣
- 轉置(Transpose)
- 向量子空間(subspace)
- 以MIT線性代數習題公開課第11題為串聯脈絡
- 參考資料
- 文章更新記錄
前言
該篇文章以非齊次線性方程組為例題引出增廣矩陣(A,b)的解集,配合矩陣的QR分解對增廣矩陣(A,b)重新構造。在轉置方面從代數的角度切入,但這個角度比較淺顯。我們需要真正明白的是轉置在向量空間層面發揮了什么作用。 重要提醒,在閱讀該文章之前,必須將MIT線性代數習題公開課第11題的習題觀看完畢并消化理解,這是串聯所有知識點的脈絡,其余只是模塊組成。
增廣矩陣(Augmented matrix)
e.g.1 求出非齊次方程組的通解 {x1+2x2=32x1+4x2=6\left\{\begin{array}{c}x_1+2x_2=3\\2x_1+4x_2=6\\ \end{array}\right.{x1?+2x2?=32x1?+4x2?=6?
解: 特解
X?=(11)X^*=\begin{pmatrix}1\\1\\ \end{pmatrix} X?=(11?)
零解
N(A)={c(?21)∣c∈R}N(A)=\lbrace c\begin{pmatrix}-2\\1\\ \end{pmatrix} |c\in R\rbrace N(A)={c(?21?)∣c∈R}
故原方程組解集為
S(A,b)={(11)+c(?21)∣c∈R}S(A,b)=\lbrace \begin{pmatrix}1\\1\\\end{pmatrix}+c\begin{pmatrix}-2\\1\\\end{pmatrix}|c \in R \rbrace S(A,b)={(11?)+c(?21?)∣c∈R}
可以看出任意解都可以被分解成 特解和零解 。
那么對于線性方程組 x1a1+?+xnan=β\displaystyle{x_1a_1+\cdots+x_na_n=\beta}x1?a1?+?+xn?an?=β 有解到底意味著什么呢?結合本人第二篇博文,我們對于方程式
x1a1+?+xnan=βx_1a_1+\cdots+x_na_n=\beta x1?a1?+?+xn?an?=β
有解可以獲得以下結論:
?\ast?注以上幾條結論可互相推導。
對于增廣矩陣,有以下結構圖:
(高等代數學習指導書(第二版上冊)第14頁)
|從QR分解的角度重構增廣矩陣
首先我們來看一下什么是QR分解。
定理 如果 m×n\mathsf{m \times n}m×n 矩陣 A\mathsf{A}A 的列線性無關,那么A可以分解為A=QRA=QRA=QR,其中QQQ是一個m×nm \times nm×n矩陣,其列形成ColACol AColA的一個標準正交基,R是一個n×nn \times nn×n上三角矩陣且在對角線上的元素為正數。若Q是一個方陣,則Q?1=QTQ^{-1}=Q^TQ?1=QT,Q為正交陣。令Q=(q1,…,qn)Q=(q_1,\ldots,q_n)Q=(q1?,…,qn?),故
QTQ=(q1T?qnT)(q1…qn)=(10?001?0????00?1)n×n=InQ^TQ= \begin{pmatrix} q_1^T\\ \vdots\\ q_n^T\\ \end{pmatrix} \begin{pmatrix} q_1&\ldots&q_n\\ \end{pmatrix}=\begin{pmatrix} {1}&{0}&{\cdots}&0\\ {0}&{1}&{\cdots}&0\\ {\vdots}&{\vdots}&{\ddots}&{\vdots}\\ {0}&{0}&{\cdots}&{1}\\ \end{pmatrix}_{n \times n}=I_n QTQ=???q1T??qnT?????(q1??…?qn??)=???10?0?01?0??????00?1????n×n?=In?
應用方面:
P=∑i=1n(aiTbaiTai)ai\mathsf{\color{red}P=\displaystyle\sum_{i=1}^n(\frac{a_i^Tb}{a_i^Ta_i})a_i}P=i=1∑n?(aiT?ai?aiT?b?)ai?
上述從基的角度細細的梳理了QR分解,請多看幾遍并配合相關題目理解。
轉置(Transpose)
定義 設A為m×n\mathsf{m \times n}m×n階矩陣,第iii行jjj 列的元素是a(i,j)\mathsf{a(i,j)}a(i,j),即:A=(aij)m×nA=(a_{ij})_{m \times n}A=(aij?)m×n?,把m×nm \times nm×n矩陣A的行換成同序數的列得到一個n×m\mathsf{n \times m}n×m矩陣,此矩陣叫做A的轉置矩陣,記做AT=(aji)n×m\mathsf{A^T=(a_{ji})_{n \times m}}AT=(aji?)n×m?。
代數式表達:A=(aij)m×n<f:T>AT=(aji)n×m\mathsf{A=(a_{ij})_{m\times n}<f:T>A^T=(a_{ji})_{n \times m}}A=(aij?)m×n?<f:T>AT=(aji?)n×m?
絕大多數人運算的時候也只是在計算稿上將矩陣沿主對角線進行翻轉,如A=(12?21)A=\begin{pmatrix}1&2\\-2&1\\\end{pmatrix}A=(1?2?21?)轉置有AT=(1?221)A^T=\begin{pmatrix}1&-2\\2&1\\\end{pmatrix}AT=(12??21?)。我們再從代數層面深入一點,來看下面兩個運算。
e.g.2 A∈Fm×nA \in F^{m \times n}A∈Fm×n,X∈Fn×1X\in F^{n\times 1}X∈Fn×1,B∈Fn×pB\in F^{n\times p}B∈Fn×p,則
(Ax)T=(x1A1+?+xnAn)T=x1A1T+?+xnAnT=(x1x2?xn)(A1TA2T?AnT)=xTAT(Ax)^T=(x_1A_1+\cdots+x_nA_n)^T=x_1A_1^T+\cdots+x_nA_n^T=\begin{pmatrix}x_1&x_2&\cdots&x_n\\\end{pmatrix}\begin{pmatrix}A_1^T\\A_2^T\\\vdots\\A_n^T\\\end{pmatrix}=x^TA^T(Ax)T=(x1?A1?+?+xn?An?)T=x1?A1T?+?+xn?AnT?=(x1??x2????xn??)???A1T?A2T??AnT?????=xTAT (數xxx轉置仍然為xxx。)
e.g.3 (AB)T=(AB1,AB2,?,ABP)T=((AB1)T?(ABp)T)=(B1AT?BpTAT)=(B1T?BpT)AT=BTAT(AB)^T=(AB_1,AB_2,\cdots,AB_P)^T=\begin{pmatrix}(AB_1)^T\\\vdots\\(AB_p)^T\\\end{pmatrix}=\begin{pmatrix}B_1A^T\\\vdots\\B_p^TA^T\\\end{pmatrix}=\begin{pmatrix}B_1^T\\\vdots\\B_p^T\\\end{pmatrix}A^T=B^TA^T(AB)T=(AB1?,AB2?,?,ABP?)T=???(AB1?)T?(ABp?)T????=???B1?AT?BpT?AT????=???B1T??BpT?????AT=BTAT
筆者在這里可以肯定,絕大多數人對轉置的認知都停留在以上定義層面以及上述的代數運算層面。那轉置在幾何層面起什么作用呢?容筆者在這埋下一個伏筆,下面我們來快速的過一遍向量子空間。
向量子空間(subspace)
筆者清華線性代數公開課筆記第一部分第27頁四個基本子空間的基的代數表達:
- C(A)={y∈Rm∣y=Ax,?X∈RN}C(A)=\lbrace y\in R^m | y=Ax,\exists X\in R^N\rbraceC(A)={y∈Rm∣y=Ax,?X∈RN}
- N(AT)={x∈Rm∣xTA=0}N(A^T)=\lbrace x\in R^m | x^TA=0\rbraceN(AT)={x∈Rm∣xTA=0}
- N(A)={x∈Rn∣Ax=0}N(A)=\lbrace x\in R^n | Ax=0\rbraceN(A)={x∈Rn∣Ax=0}
- C(AT)={y∈Rn∣y=ATx,?X∈Rm}C(A^T)=\lbrace y\in R^n | y=A^Tx, \exists X \in R^m\rbraceC(AT)={y∈Rn∣y=ATx,?X∈Rm}
小貼士:在學習的數學的過程你需要很多固定的元認知模塊,以便在學習的過程中像搭積木一樣隨取隨用。比如上面四個子空間的代數表達式,心里知道核心圖僅是第一步,第二步更重要,將其用數學語言代數化表達出來,這對于任何一個科目的學習都是通用的。類似的還有數乘,加法,乘法等。(如果有個“倉庫”隨時進行查找,也沒有問題。)
以MIT線性代數習題公開課第11題為串聯脈絡
在開始閱讀之前,請確保你已經看完MIT線代習題公開課第11題,而且有了略微的理解。
(筆者2019.11.30的線代習題公開課摘錄筆記第7頁)在計算的過程中,我們已經的得到了四個子空間的基底,下一步我們來看它是如何經過轉置產生聯系的。(直接上圖)
習題公開課視頻的講解非常清晰,行空間(基底{(503),(011)}\lbrace \begin{pmatrix}5\\0\\3\\\end{pmatrix},\begin{pmatrix}0\\1\\1\\\end{pmatrix}\rbrace{???503????,???011????})和零空間(基底{(?35?11)}\lbrace \begin{pmatrix}-\frac{3}{5}\\-1\\1\\\end{pmatrix}\rbrace{????53??11????})經過轉置被投射到列空間(基底{(1?21),(010)}\lbrace \begin{pmatrix}1\\-2\\1\\\end{pmatrix},\begin{pmatrix}0\\1\\0\\\end{pmatrix}\rbrace{???1?21????,???010????})和左零空間(基底{(101)}\lbrace \begin{pmatrix}1\\0\\1\\\end{pmatrix} \rbrace{???101????})。在這里可以清晰明了的看到矩陣的數值計算僅僅是流于表面的現象,向量空間與向量空間之間經由轉置發生的變化才是真正的核心。
小貼士:引申一個問題,向量“↗\nearrow↗”究竟是什么?經過以上的講解,再將其理解為有方向、有長度的箭頭是否已經有點太“低端”了呢?你必須理解,初次學習線性代數,引入一個“有方向、有長度的箭頭”作為向量僅僅是為了讓你建立幾何直觀方便入門,在學習的過程中,你要逐漸摒棄這個概念,真正從空間變化的角度來理解線性變換。更多時候,你要把向量看作是空間變化的線性載體。(觀點啟蒙于課程「線性代數的本質」)
參考資料
文章更新記錄
- 文章版面微微調整,修改了幾個錯別字以及數學符號樣式調整。「2020.12.4 15:22」
- 文章內容調整。 「2021.4.2 18:58」
- 文章部分內容調整。 「2021.5.19 16:21」
- 修改標題。「2022.11.5 9:53」
P.S.1 學業中斷后一兩年方知讀書好,在學校真幸福呀。真的很希望那段時間有一個長輩、學者做個引導指點個人學習的方向。太多人尤其是剛進大一的學子不知那幾年的歲月對當時的他們意味著什么。分數不得,真正的學問也無,后悔者不在少數呀。「2021.5.19 16:27」
總結
以上是生活随笔為你收集整理的线代 [3]|从增广矩阵漫谈矩阵转置对向量在四个向量子空间内的“飞舞”(第三篇)的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 计算机网络原理(第一章)课后题答案
- 下一篇: 中兴面试题1