线性映射¶

代数系统¶

在非空集合上定义代数运算和运算法则

环
- 加法:4 条法则(交换律, 结合律, 加法零元, 加法负元)
- 乘法:2 条法则(结合律, 分配律)
- 例子:\(\mathbb{Z}, \mathbb{Z}_7, K[x], M_n(K), K[A], KI\)
域
- 在环的基础上有乘法单位元(幺元), 且非零元有乘法逆元
- 例子:数域\(K\), (有理数域, 实数域, 复数域), \(\mathbb{Z}_p\)
域\(F\)上的线性空间
- 把数域\(K\)上线性空间的概念推广到域\(F\)上, 把对应数量乘法的运算称为纯量乘法
- 例子:\(F^n := \{(x_1, x_2, \cdots, x_n)|x_i\in F\}\), \(M_{m\times n}(F), F[x]\)

线性映射¶

定义 1¶

设\(V, V'\)是域\(F\)上的线性空间, \(\underline{A}:V\to V'\)是\(V\)到\(V'\)的映射, 若满足
- \(\underline{A}(x+y)=\underline{A}(x)+\underline{A}(y), \forall x, y\in V\)
  - 保持加法
- \(\underline{A}(\lambda x)=\lambda \underline{A}(x), \forall x\in V, \lambda\in F\)
  - 保持纯量乘法
- 那么称\(\underline{A}\)是\(V\)到\(V'\)的线性映射
- \(V\)到自身的线性映射称为\(V\)上的线性变换
例
- 任取\(k\in F, \underline{k}(\alpha):=k\alpha, \alpha\in V\)称为\(V\)上的数乘变换
- \(\underline{0}(\alpha):=0, \alpha\in V\)称为\(V\)上的零变换
- \(\underline{I}(\alpha):=\alpha, \alpha\in V\)称为\(V\)上的恒等变换

性质¶

设\(\underline{A}:V\to V'\)
- \(\underline{A}(\vec{0})=\vec{0}\)
- \(\underline{A}(-\alpha)=-\underline{A}(\alpha)\)
- \(\underline{A}(\sum\limits\limits_{i=1}^n\lambda_i\alpha_i)=\sum\limits_{i=1}^n\lambda_i\underline{A}(\alpha_i)\)
- \(\alpha_1, \alpha_2, \cdots, \alpha_n\)在\(V\)中线性相关\(\implies \underline{A}(\alpha_1), \underline{A}(\alpha_2), \cdots, \underline{A}(\alpha_n)\)在\(V'\)中线性相关
  - 线性无关不能推出像线性无关, 比如零映射
- 设\(\dim V=n\)且\((\alpha_1, \alpha_2, \cdots, \alpha_n)\)是\(V\)的一个基, 则若\(\alpha = k_1\alpha_1+k_2\alpha_2+\cdots+k_n\alpha_n\), 则\(\underline{A}(\alpha)=k_1\underline{A}(\alpha_1)+k_2\underline{A}(\alpha_2)+\cdots+k_n\underline{A}(\alpha_n)\)
  - 从而\(\underline{A}\)由\(\underline{A}(\alpha_1), \underline{A}(\alpha_2), \cdots, \underline{A}(\alpha_n)\)唯一确定
  - 即若\(\underline{B}(\alpha_i)=\underline{A}(\alpha_i), i=1, 2, \cdots, n\), 则\(\underline{A}=\underline{B}\)
- 若\(\underline{A}\)是同构映射\(\iff \underline{A}\)是可逆线性映射

定理 1¶

设\(V, V'\)是域\(F\)上的线性空间, 且\(\dim V=n < \infty, \alpha_1, \alpha_2, \cdots, \alpha_n\)是\(V\)的一个基, 则对任意的\(\beta_1, \beta_2, \cdots, \beta_n\in V'\)有
- \(\underline{A}:V\to V', \underline{A}(\alpha)=\underline{A}(\sum k_i\alpha_i)=\sum k_i\beta_i\)是\(V\)到\(V'\)的线性映射
  - 保持加法, 纯量乘法
- 且\(\underline{A}(\alpha_i)=\beta_i, i=1, 2, \cdots, n\)
  - 如此定义的\(\underline{A}\)是唯一的

[!NOTE] 用\(\text{Hom}(V, V')\)表示\(V\)到\(V'\)的线性映射全体(Homomorphism同态), 同理称\(\text{Hom}(V, V)\)为\(V\)上的线性变换全体

在\(\text{Hom}(V, V')\)上定义加法和纯量乘法
- \((\underline{A}+\underline{B})(\alpha)=\underline{A}(\alpha)+\underline{B}(\alpha)\)
- \((k\underline{A})(\alpha)=k\underline{A}(\alpha)\)
  - \(\forall k\in F, \alpha\in V\)
  - \(\forall \underline{A}, \underline{B}\in \text{Hom}(V, V)\)
- \(0\)映射是\(\text{Hom}(V, V')\)的加法单位元
- 定义负元\(\underline{-A}(\alpha)=-\underline{A}(\alpha)\)
- 则\(\text{Hom}(V, V')\)是域\(F\)上的线性空间
\(\text{Hom}(V, V)\)上对于加法和乘法是一个有单位元的环(不是交换的)
- 而且有\(k(\underline{A}\underline{B})=(k\underline{A})\underline{B}=\underline{A}(k\underline{B})\)
- 若\(\underline{A}\in \text{Hom}(V, V)\)是可逆线性变换, 那么\(\underline{A}^{-1}\)也是可逆线性变换
- 定义幂: \(\underline{A}^0=\underline{I}, \underline{A}^n=\underline{A}\;\underline{A}^{n-1}, n\in \mathbb{N}\)
- 若\(\underline{A}\)是可逆线性变换, 则\(\underline{A}^{-n}=(\underline{A}^{-1})^n, n\in\mathbb{N}\)

定义 1¶

设\(V\)是域\(F\)上的线性空间, 且有直和分解\(V=U\oplus W\), 那么\(\forall \alpha\in V, \exists !\beta\in U, \gamma\in W, s.t.\;\alpha = \beta + \gamma\), 那么称
- \(\underline{P}_U(\alpha)=\beta\)为\(\alpha\)在\(U\)上的投影
- \(\underline{P}_U\)称为\(V\)到\(U\)的投影映射

性质¶

\(\underline{P}_U\)是\(V\)上的一个线性变换
\(\underline{P}_U(\alpha)=\begin{cases} \alpha, \alpha\in U \\ 0, \alpha\in W \end{cases}\)
若线性映射\(\underline{A}:V\to V\)满足上一条性质, 那么\(\underline{A}=\underline{P}_U\)
\(\underline{P}_U^2=\underline{P}_U\) (幂等\(\implies \underline{P}_U^n=\underline{P}_U\))

定义 2¶

若\(\underline{A}\in \text{Hom}(V, V)\)满足\(\underline{A}^2=\underline{A}\), 那么称\(\underline{A}\)是\(V\)上的幂等变换

线性映射的秩¶

定义 1¶

设\(\underline{A}:V\to V'\)是线性映射, 那么称\(V\)的子集\(\{\alpha:\underline{A}(\alpha)=\vec{0}\}\)为\(\underline{A}\)的核
- 记为\(\text{Ker} \underline{A}\)

性质 1¶

\(\text{Ker} \underline{A}\)是\(V\)的子空间
- 定义只说是子集, 实际上是子空间(显然对加法和纯量乘法封闭)

[!IMPORTANT]

性质 2¶

\(\underline{A}\)是单射\(\iff \text{Ker} \underline{A}=\{\vec{0}\}\)

定义 2¶

设 \(\underline{A}:V\to V'\) 是线性映射, 那么称 \(V'\) 的子集 \(\{\beta:\beta=\underline{A}(\alpha), \alpha\in V\}\) 为 \(\underline{A}\) 的 像空间
- 记为\(\text{Im} \underline{A}\)

性质 3¶

\(\text{Im} \underline{A}\)是\(V'\)的子空间

性质 4¶

\(\underline{A}\)是满射\(\iff \text{Im} \underline{A}=V'\)

定理 1 ¶

设\(V\)是域\(F\)上的线性空间, \(\underline{A}:V\to V'\)是线性映射, 那么
- \[V/\text{Ker} \underline{A}\cong \text{Im} \underline{A}\]
证明
- 记\(W=\text{Ker} \underline{A}\) , 令
  - \[\sigma : V/W \to \text{Im} \underline{A}\]
  - \[\sigma(\alpha+W)=\underline{A}(\alpha)\]
- 若\(\alpha + W = \beta +W\), 那么\(\alpha-\beta\in W\), 即\(\underline{A}(\alpha-\beta)=\vec{0}\), 所以\(\underline{A}(\alpha)=\underline{A}(\beta)\), 从而这是良定义的
- 并且可以证明\(\sigma\)是双射并且保持加法和纯量乘法, 所以是同构映射
- 从而\(V/\text{Ker} \underline{A}\cong \text{Im} \underline{A}\)

定理 2¶

若\(\dim V=n< \infty\), 设\(\underline{A}\)是\(V\)上的线性映射, 则 \(\dim V=\dim \text{Ker} \underline{A}+\dim \text{Im} \underline{A}\)
把\(\text{Im} \underline{A}\)的维数记为线性映射\(\underline{A}\)的秩, 记为\(\text{rank}(\underline{A})\)
- 记\(\dim \text{Ker} \underline{A}\)为线性映射\(\underline{A}\)的零度

推论 1¶

设\(\underline{A}\in \text{Hom}(V, V')\), 若\(\dim V=\dim V'\), 则\(\underline{A}:V\to V'\)是单射\(\iff \underline{A}\)是满射\(\iff \underline{A}\)是同构映射
证明:
- \(\underline{A}\)是单射\(\iff \text{Ker} \underline{A}=\{\vec{0}\}\iff \dim \text{Ker} \underline{A}=0, \dim V=\dim \text{Im}\underline{A} \iff \underline{A}\text{是满射} \iff \underline{A}\)是同构映射
类比有限集合到自身的映射\(f\)为:单射\(\iff\)满射\(\iff\)双射

推论 2¶

设\(\underline{A}\in \text{Hom}(V, V), \dim V=n<\infty\), 那么\(\underline{A}\)是单射\(\iff \underline{A}\)是满射
- 这样如果\(\underline{A}\)是单射, 那么\(\underline{A}\)是双射(简化证明)

线性映射的矩阵和线性映射的矩阵¶

线性变换的矩阵¶

设\(V\)是域\(F\)上的\(n\)维线性空间, \(\underline{A}\)是\(V\)上的一个线性变换, 在\(V\)中取一个基\(\alpha_1, \alpha_2, \cdots, \alpha_n\), 则\(\exists !a_{ij}, i, j=1, 2, \cdots, n, s.t.\)
- \[\begin{cases} \underline{A}(\alpha_1)=a_{11}\alpha_1+a_{21}\alpha_2+\cdots+a_{n1}\alpha_n \\ \underline{A}(\alpha_2)=a_{12}\alpha_1+a_{22}\alpha_2+\cdots+a_{n2}\alpha_n \\ \cdots \\ \underline{A}(\alpha_n)=a_{1n}\alpha_1+a_{2n}\alpha_2+\cdots+a_{nn}\alpha_n \end{cases}\]
- 记\(\alpha = (\alpha_1, \alpha_2, \cdots, \alpha_n), \underline{A}(\alpha_1, \alpha_2, \cdots, \alpha_n) = (\underline{A}(\alpha_1), \underline{A}(\alpha_2), \cdots, \underline{A}(\alpha_n)), A= (a_{ij})_{n\times n}\), 则上式可记为\(\alpha A = \underline{A}(\alpha_1, \alpha_2, \cdots, \alpha_n)\)
- 记\(\underline{A}\)在基\(\alpha_1, \alpha_2, \cdots, \alpha_n\)下的矩阵为\(A\), 记为\(A=[\underline{A}]_{\alpha}\)
  - \(A\)的第\(j\)列是\(\underline{A}(\alpha_j)\)在基下的坐标

线性映射的矩阵¶

设\(\underline{A}\in \text{Hom}(V, V'), \dim V=n, \dim V'=s\), 取\(V\)的基\(\alpha_1, \alpha_2, \cdots, \alpha_n, V'\)的基\(\beta_1, \beta_2, \cdots, \beta_s\), 则有:
- \[(\underline{A}(\alpha_1), \underline{A}(\alpha_2), \cdots, \underline{A}(\alpha_n))=(\beta_1, \beta_2, \cdots, \beta_s) \begin{pmatrix} a_{11} & a_{12} & \cdots & a_{1n} \\ a_{21} & a_{22} & \cdots & a_{2n} \\ \vdots & \vdots & \ldots & \vdots \\ a_{s1} & a_{s2} & \cdots & a_{sn} \end{pmatrix}\]
- 记为\(\underline{A}(\alpha)=\beta A\), 其中\(A\)是\(s\times n\)矩阵, 称为\(\underline{A}\)在\(V\)的基\(\alpha\)和\(V'\)的基\(\beta\)下的矩阵, 记为\(A=[\underline{A}]_{\alpha}^{\beta}\)

[!NOTE] - 容易验证 - 线性映射和的矩阵等于线性映射的矩阵的和 - 纯量乘法也是类似的

令\(\sigma:\text{Hom}(V, V')\to M_{s\times n}(F)\)
- \[\sigma(\underline{A})=[\underline{A}]_{\alpha}^{\beta}\]
- \(\sigma\)是一个同构映射
- 证明:
  - \(\sigma(\underline{A}+\underline{B})=[\underline{A}+\underline{B}]_{\alpha}^{\beta}=[\underline{A}]_{\alpha}^{\beta}+[\underline{B}]_{\alpha}^{\beta}=\sigma(\underline{A})+\sigma(\underline{B})\)
    - \((\underline{A}+ \underline{B})(\alpha)=(\underline{A}(\alpha)+\underline{B}(\alpha))=\alpha A+\alpha B=\alpha (A+B)\)
  - \(\sigma(k\underline{A})=[k\underline{A}]_{\alpha}^{\beta}=k[\underline{A}]_{\alpha}^{\beta}=k\sigma(\underline{A})\)
    - 同理
      - 从而\(\sigma\)对加法和纯量乘法保持运算
  - 由上文线性映射:定理1 知道, 任给\(C \in M_{s\times n}(F)\), 存在唯一的\(\underline{C}\in \text{Hom}(V, V')\), 使得\(C=[\underline{C}]_{\alpha}^{\beta}\), 所以\(\sigma\)是双射(存在说明是满射, 唯一说明是单射)
- 从而\(\text{Hom}(V, V')\cong M_{s\times n}(F)\)
- 因此\(\dim \text{Hom}(V, V')=\dim M_{s\times n}(F)=sn=\dim V\dim V'\)
  - 特别的, 若\(V=V'\), 则\(\dim \text{Hom}(V, V)=(\dim V)^2=n^2=\dim M_n(F)\)
令\(\sigma:\text{Hom}(V, V)\to M_n(F)\):
- \[\sigma(\underline{A})=[\underline{A}]_{\alpha}\]
- \(\sigma\)还保持乘法, 即\(\sigma(\underline{A}\underline{B})=\sigma(\underline{A})\sigma(\underline{B})\))
  - 也就是线性映射\(\underline{A}\;\underline{B}\)的矩阵等于线性映射\(\underline{A}\)和\(\underline{B}\)的矩阵的乘积
- \(\underline{A}\)可逆\(\iff A\)可逆, 且\([\underline{A}^{-1}]_{\alpha}=A^{-1}\)
- 线性变换是幂等变换当且仅当其矩阵是幂等矩阵\(, i.e.\underline{A}^2=\underline{A}\iff A^2=A\)
- 若\(\beta = (\alpha_1, \alpha_2, \cdots, \alpha_n)X\), 则\(\underline{A}(\beta)=(\alpha_1, \alpha_2, \cdots, \alpha_n)AX\)
  - 即若\(\beta\)在\(\alpha\)下的坐标为\(X\), 那么\(\underline{A}(\beta)\)在\(\alpha\)下的坐标为\(AX\)

[!NOTE] 对向量做矩阵乘法后做线性变换可以先做线性变换再做矩阵乘法, 也就是 \(\(\underline{A}(\alpha S)=[\underline{A}(\alpha_1, \alpha_2, \cdots, \alpha_n)]S=\alpha AS\)\)

线性映射在不同的基下的矩阵之间的关系¶

定义 1 过渡矩阵¶

设\(\underline{A}\in \text{Hom}(V, V), \alpha, \beta\)是\(V\)的两个不同的基, 并且\(\exists !S\in M_n(F), s.t. \beta = \alpha S\), 称\(S\)是基\(\alpha\)到基\(\beta\)的过渡矩阵

性质 1¶

\(\det S\neq 0\), 即\(S\)可逆
\(S^{-1}\)是基\(\beta\)到基\(\alpha\)的过渡矩阵
\(\underline{A}\)在基\(\alpha\)下的矩阵\(A\)和在基\(\beta\)下的矩阵\(B\)之间有关系\(B=S^{-1}AS\)

定义 2¶

设\(A, B\in M_n(F)\), 若\(\exists S\in M_n(F), \text{且可逆}, s.t. B=S^{-1}AS\), 则称\(A\)和\(B\)是相似的
显然相似是等价关系, 与\(A\)相似的矩阵构成\(A\)的相似类

[!NOTE] 从而线性映射在不同基下的矩阵是相似的

性质 2¶

\(A\sim B \implies \text{rank}(A)=\text{rank}(B), \det(A)=\det(B)\)

定义 3 迹¶

设\(A\in M_n(F)\), 则\(A\)的对角线元素之和称为\(A\)的迹, 记为\(\text{tr}(A)\)
- \(\text{tr}(A)=a_{11}+a_{22}+\cdots+a_{nn}\)

命题 1¶

\(\text{tr}(A+B)=\text{tr}(A)+\text{tr}(B)\)
\(\text{tr}(kA)=k\text{tr}(A)\)
\(\text{tr}(AB)=\text{tr}(BA)\)

性质 3¶

\(A\sim B \implies \text{tr}(A)=\text{tr}(B)\)
- 证明:\(\text{tr}(A)=\text{tr}(S^{-1}BS)=\text{tr}(S^{-1}(BS))=\text{tr}(BS^{-1}S)=\text{tr}(B)\)

[!IMPORTANT] \(n\)级矩阵的行列式, 秩, 迹是矩阵的相似不变量

定义 4¶

把线性变换\(\underline{A}\)在基\(\alpha\)下的矩阵\(A\)的行列式, 秩, 迹称为线性变换\(\underline{A}\)的行列式, **秩, 迹**
- 我们定义过\(\text{rank}(\underline{A})=\dim \text{Im} \underline{A}\), 需要验证\(\dim \text{Im} \underline{A}=\text{rank}(A)\)

命题 2¶

\(\text{rank}(\underline{A})=\text{rank}(A)\)
- \(\text{Im} \underline{A} = span(\underline{A}(\alpha_1), \underline{A}(\alpha_2), \cdots, \underline{A}(\alpha_n))\), 而\(\text{rank}(A)=\dim span(A_1, \cdots, A_n)\), 其中\(A_i\)是\(A\)的列向量
  - 注意到\(\sigma:V\to F^n, \sigma(\sum a_i\alpha_i)=(a_1, a_2, \cdots, a_n)^T\)是同构映射, 从而\(span(\underline{A}(\alpha_1), \underline{A}(\alpha_2), \cdots, \underline{A}(\alpha_n)) \cong span(A_1, A_2, \cdots, A_n)\)(子空间同构)
  - 从而维数相等(同构的充要条件), 从而\(\text{rank}(\underline{A})=\text{rank}(A)\)

线性变换的特征值和特征向量¶

定义 1 特征值和特征向量¶

若存在\(\lambda\in F, \xi\neq \vec{0}, s.t.\)
- \[\underline{A}(\xi)=\lambda \xi\]
- 则称\(\lambda\)是线性变换\(\underline{A}\)的一个特征值, \(\xi\)是\(\underline{A}\)的对应\(\lambda\)的特征向量

定义 2 特征子空间¶

\(V_\lambda :=\{\xi\in V:\underline{A}(\xi)=\lambda \xi\}\)称为\(\underline{A}\)的属于特征值\(\lambda\)的特征子空间
- 可以证明\(V_\lambda\)是\(V\)的子空间

定理 1¶

设\(\lambda_1, \lambda_2\)是不同的特征值, 若在\(V_{\lambda_1}\)中\(\xi_1, \xi_2, \cdots, \xi_k\)线性无关, 在\(V_{\lambda_2}\)中\(\eta_1, \eta_2, \cdots, \eta_l\)线性无关, 则\(\xi_1, \xi_2, \cdots, \xi_k, \eta_1, \eta_2, \cdots, \eta_l\)线性无关

推论 1¶

设\(\lambda_1, \lambda_2, \cdots, \lambda_s\)是\(\underline{A}\)的不同特征值, 则若在每个特征子空间中取线性无关的向量, 这些向量和起来也是线性无关的

定理 2¶

设\(\underline{A}\)是 \(n\)维 线性空间\(V\)上的线性变换, 取\(V\)中一个基\(\alpha\), 设\(A=[\underline{A}]_\alpha, \text{且非零向量}\xi\)在\(\alpha\)下的坐标是\(X, i.e.\xi = \alpha X\)则
- \(\xi\)是\(\underline{A}\)的属于特征值\(\lambda\)的特征向量
- \(\iff\underline{A}(\xi)=\lambda \xi\)
  - \(LHS = \underline{A}(\alpha X)=\underline{A}(\alpha)X=AX\)
- \(\iff AX=\lambda X\)
- \(\iff \lambda\)是矩阵\(A\)的特征值, 且\(X\)是\(A\)的属于\(\lambda\)的特征向量
  - 这里\(\alpha = (\alpha_1, \alpha_2, \cdots, \alpha_n), X\)是列向量

[!NOTE] - 矩阵特征值特征向量的定义由下面定义3给出

这就把线性变换的特征值和特征向量的问题转化为矩阵的特征值和特征向量的问题
这里线性空间是有限维的

定义 3¶

设\(A\in M_n(F)\), 若\(\exists \lambda\in F, \vec{0}\neq \xi\in F^n, s.t.\)
- \[A\xi=\lambda \xi\]
- 则称\(\lambda\)是矩阵\(A\)的一个特征值, \(\xi\)是\(A\)的属于特征值\(\lambda\)的一个特征向量

定义 4 特征多项式¶

设\(A\in M_n(F)\), 则\(\det(\lambda I-A)\)称为\(A\)的特征多项式
- \(\det(\lambda I-A)=0\)的根称为\(A\)的特征值

[!NOTE]

计算\(A\)的特征值, 就是求\(\det(\lambda I-A)=0\)的根

然后代入\(\lambda\)求对应的特征向量(非零)

定义:\(V_{\lambda_s}:=\{\xi| \underline{A}(\xi)=\lambda_s \xi\}\), 可以证明这是\(V\)的一个子空间, 称为特征子空间

命题 1¶

相似矩阵的特征多项式相等, 从而有相同的特征值和特征向量
- \(A\sim B\implies \exists S\in M_n(F), s.t. B=S^{-1}AS\)
- \(\det(\lambda I-B)=\det(\lambda I-S^{-1}AS)=\det(S^{-1}(\lambda I-A)S)=\det(\lambda I-A)\)
从而对同一个特征变换取不同的基得到不同的基下的矩阵得到的特征多项式是不变的

命题 2¶

\(\det(\lambda I-A)=\lambda^n - \text{tr}(A)\lambda^{n-1}+\cdots+(-1)^n\det(A)\)

线性变换可对角化的条件¶

定义 1¶

设\(\underline{A}\)是域\(F\)上\(n\)维线性空间\(V\)上的线性变换, 若存在\(V\)的一个基\(\alpha\), 使得\(\underline{A}\)在\(\alpha\)下的矩阵是对角矩阵, 则称\(\underline{A}\)是可对角化的

定理 1¶

\(\underline{A}\)可对角化
\(\iff \exists \alpha_i, i=1, 2, \cdots, n, s.t.\underline{A}(\alpha_i)=\lambda_i\alpha_i \iff V\text{中存在由}\underline{A}\text{的特征向量组成的基}\)
\(\iff \underline{A}\)有\(n\)个线性无关的特征向量
\(\iff\)若\(\lambda_1, \lambda_2, \cdots, \lambda_s\)是\(\underline{A}\)的不同特征值, 则\(\underline{A}\)的特征子空间\(V_{\lambda_1}, V_{\lambda_2}, \cdots, V_{\lambda_s}\)的特征向量和起来是\(V\)的一个基
\(\iff V = V_{\lambda_1}\oplus V_{\lambda_2}\oplus\cdots\oplus V_{\lambda_s}\)
\(\iff \dim V_{\lambda_1}+\dim V_{\lambda_2}+\cdots+\dim V_{\lambda_s}=\dim V = n\)
\(\iff f(\lambda)=\det(\lambda I-A)=(\lambda-\lambda_1)^{m_1}(\lambda-\lambda_2)^{m_2}\cdots(\lambda-\lambda_s)^{m_s}\), 其中\(m_i\)是\(\lambda_i\)的重数:\(m_1+m_2+\cdots+m_s=n\)
\(\iff\)特征值\(\lambda_i\)的代数重数(作为特征多项式根的重数)等于几何重数(特征子空间的维数)
- 在实数域中, 特征多项式不一定能分解成一次因式的乘积, 所以在实数域上一个矩阵不一定是可对角化的
- 有理数域上任意次数的多项式都是存在的, 因此也不一定可对角化

[!IMPORTANT] 几何重数小于等于代数重数

[!NOTE] 复数域上的矩阵也不一定能对角化, 比如\(\begin{pmatrix} 1 & 1 \\ 0 & 1 \end{pmatrix}\) 有特征值\(\lambda = 1\), 但是只有一个特征向量\(\xi = \begin{pmatrix} 1 \\ 0 \end{pmatrix}\), \(\lambda=1\)的代数重数为2, 但是\(\dim \mathbb{C}_\lambda = \dim \text{span}(\xi) = 1\)

定义 2¶

设\(A\in M_n(F)\), 如果\(A\)相似于一个对角矩阵, 那么\(A\)是可对角化的
- \(\iff\exists P=(\alpha_1, \alpha_2, \cdots, \alpha_n), s.t. P^{-1}AP=D\), 其中\(D\)是对角矩阵, 即
- \(A(\alpha_1, \alpha_2, \cdots, \alpha_n)=(\alpha_1, \alpha_2, \cdots, \alpha_n)D=(\lambda_1\alpha_1, \lambda_2\alpha_2, \cdots, \lambda_n\alpha_n)\)
- 那么有\(A\alpha_i=\lambda_i\alpha_i, i=1, 2, \cdots, n\), 从而\(A\)有\(n\)个线性无关的特征向量\(\alpha_1, \alpha_2, \cdots, \alpha_n\), 而且\(P=(\alpha_1, \alpha_2, \cdots, \alpha_n)\)是由特征向量组成的矩阵恰好是可逆的并且使得\(P^{-1}AP=\text{diag}(\lambda_1, \cdots, \lambda_n)\)

[!NOTE] 证明出现的\(A(\alpha_1, \alpha_2, \cdots, \alpha_n)\)需要和\(\underline{A}(\alpha_1, \alpha_2, \cdots, \alpha_n)\)区分开来, 后者等于\((\alpha_1, \alpha_2, \cdots, \alpha_n)A\), 前者是矩阵的分块乘法

线性变换的不变子空间¶

定义 1¶

\(\underline{A}\in \text{Hom}(V, V), W\in \text{subspace}(V)\), 若\(\forall \alpha\in W, \underline{A}(\alpha)\in W\), 则称\(W\)是\(\underline{A}\)的不变子空间
- 显然特征子空间\(V_{\lambda}\)是\(\underline{A}\)-不变子空间
- \(V\)和\(\{\vec{0}\}\)也是\(\underline{A}\)-不变子空间(平凡的)

命题 1¶

\(\text{Ker}\underline{A}, \text{Im}\underline{A}\)是\(\underline{A}\)-不变子空间

命题 2¶

\(\underline{A}, \underline{B}\in \text{Hom}(V, V)\), 若\(\underline{A}\underline{B}=\underline{B}\underline{A}\), 则\(\text{Ker}\underline{B}, \text{Im}\underline{B}, \underline{B}\)的特征子空间是\(\underline{A}\)-不变子空间

命题 3¶

不变子空间的交, 和依旧是不变子空间

命题 4¶

设\(W=span(\alpha_1, \alpha_2, \cdots, \alpha_s)\)
- \(W\)是不变子空间\(\iff \forall \alpha_i, \underline{A}(\alpha_i)\in W\)

[!NOTE] 定义限制映射\(\underline{A}|_W:W\to W\), 是一个线性映射, 称为\(\underline{A}\)在\(W\)上的限制

定理 1¶

设\(\underline{A}\)是\(n\)维线性空间\(V\)上的线性变换, 则
- 存在\(V\)的一组基, 使得\(\underline{A}\)在这组基下的矩阵是块对角矩阵, 换句话说
  - \(\underline{A}(\alpha_{11}, \alpha_{12}, \cdots, \alpha_{1r_1}, \alpha_{21}, \alpha_{22}, \cdots, \alpha_{2r_2}, \cdots, \alpha_{s1}, \alpha_{s2}, \cdots, \alpha_{sr_s})=(\alpha_{11}, \alpha_{12}, \cdots, \alpha_{1r_1}, \alpha_{21}, \alpha_{22}, \cdots, \alpha_{2r_2}, \cdots, \alpha_{s1}, \alpha_{s2}, \cdots, \alpha_{sr_s}) \text{diag}(A_1, A_2, \cdots, A_s)\)
  - 其中\(A_i\)是\(r_i\)级矩阵
- \(\iff W_i=span(\alpha_{i1}, \alpha_{i2}, \cdots, \alpha_{ir_i})\)是\(\underline{A}\)的非平凡不变子空间, 且\(V = \oplus_{i=1}^s W_i\)
也就是说如果找到一组\(V\)的不变子空间, 使得\(V\)是这些不变子空间的直和, 那就能对\(\underline{A}\)做块对角化
- 由上述命题2 启发, 先研究和\(\underline{A}\)可交换的线性变换

[!NOTE] 任意\(\underline{A}\)的多项式\(f(\underline{A})\)和\(\underline{A}\)可交换, 并且可以验证\(F[\underline{A}]:=\{\underline{A}\text{的多项式}\}\)是域\(F\)上的线性空间

这样我们可以得到很多不变子空间\(\text{Ker} f(\underline{A})\), 下面研究直和的问题

定理 2¶

设\(\underline{A}\)是域\(F\)上线性空间\(V\)上的线性变换, 在\(F[x]\)中, 若\(f(x)=f_1(x)f_2(x), \gcd (f_1(x), f_2(x))=1\), 那么有
- \[\text{Ker} f(\underline{A})=\text{Ker} f_1(\underline{A})\oplus \text{Ker} f_2(\underline{A})\]
证明:注意到\(\exists !u, v\in F[x], s.t. u(x)f_1(x)+v(x)f_2(x)=1\), 用\(\underline{A}\)代入并作用到\(\alpha\in \text{Ker}f(\underline{A})\)上就有
- \(\alpha = u(\underline{A})f_1(\underline{A})(\alpha)+v(\underline{A})f_2(\underline{A})(\alpha)\), 令\(\alpha_1 = v(\underline{A})f_2(\underline{A})(\alpha), \alpha_2 = u(\underline{A})f_1(\underline{A})(\alpha)\), 可以验证\(\alpha_1\in \text{Ker} f_1(\underline{A}), \alpha_2\in \text{Ker} f_2(\underline{A})\), 且容易证明\(\text{Ker} f_1(\underline{A})\cap \text{Ker} f_2(\underline{A})=\{\vec{0}\}\)
- 实际上这就对\(\alpha\)做了唯一分解
可用数学归纳法推广

推论 1¶

若\(f(x)=\prod_{i=1}^s f_i(x)\), 其中\(f_i(x)\)两两互素, 那么
- \[\text{Ker} f(\underline{A})=\text{Ker} f_1(\underline{A})\oplus \text{Ker} f_2(\underline{A})\oplus\cdots\oplus \text{Ker} f_s(\underline{A})\]

现在需要\(\text{Ker} f(\underline{A})=V\).也就是\(f(\underline{A})\)是零变换

定义 2 零化多项式(线性变换)¶

设 \(\underline{A}\in \text{Hom}(V, V), f(x)\in F[x]\) ,若 \(f(\underline{A})=\underline{0}\), 则称\(f(x)\)是\(\underline{A}\)的一个零化多项式

定义 3 零化多项式(矩阵)¶

\(A\in M_n(F), f(x)\in F[x], s.t. f(A)=0\), 则称\(f(x)\)是\(A\)的一个零化多项式

[!NOTE] \(f(x)\)是线性变换的零化多项式\(\iff f(x)\)是矩阵的零化多项式

定理 3 Hamilton-Cayley定理¶

设\(A\in M_n(F)\), 则\(A\)的特征多项式是\(A\)的零化多项式

定理 4 Hamilton-Cayley定理‘¶

设\(\underline{A}\in \text{Hom}(V, V)\), 则\(\underline{A}\)的特征多项式是\(\underline{A}\)的零化多项式

[!NOTE] 由唯一因式分解定理:\(f(\lambda) = \prod\limits_{i=1}^s p_i^{r_i}(\lambda)\), 那么\(V=\text{Ker} f(\underline{A})= \oplus_{i=1}^s \text{Ker} p_i^{r_i}(\underline{A})=\oplus_{i=1}^s \text{Ker} (\underline{A}-\lambda_i I)^{r_i}\), 称这些空间为根子空间

线性变换的最小多项式¶

定义 1¶

在\(\underline{A}\)的零化多项式中次数最低的首一多项式称为\(\underline{A}\)的最小多项式, 记为\(m(\lambda)\)

命题 1¶

最小多项式唯一

命题 2¶

\(g(\lambda)\)是\(\underline{A}\)的零化多项式\(\iff m(\lambda)\mid g(\lambda)\)
- 换句话说最小多项式是任何零化多项式的因式

命题 3¶

特征多项式\(f(\lambda)\)和最小多项式\(m(\lambda)\)有相同的根(重数不一定相同)
- 任取\(m(\lambda)\)的一个根\(\lambda_0\), 显然\(f(\lambda_0)=0\)
- 反过来设\(m(\lambda)=c_0+c_1\lambda+\cdots+c_{r-1}\lambda^{r-1}+\lambda^r\), 任取\(\lambda_0\)是\(f(\lambda)\)的一个根, 则\(\exists \xi, s.t.\underline{A}(\xi)=\lambda_0\xi\)那么\(\vec{0}=\underline{0}(\xi) = m(\underline{A})(\xi) = (c_0\underline{I}+\cdots \underline{A}^r)(\xi)=m(\lambda_0)\xi\), 从而\(\lambda_0\)也是\(f(\lambda)\)的根

定义 2¶

域\(F\)上\(n\)级矩阵的次数最低的首一零化多项式称为矩阵的最小多项式

推论 1¶

矩阵的最小多项式和特征多项式有相同的根(重数不一定相同)

推论 2¶

相似的矩阵有相同的最小多项式

定理 1¶

若\(V = \oplus_{i=1}^s W_i\), 其中\(W_i\)是\(\underline{A}\)-不变子空间, 则\(\underline{A}\)的最小多项式是\(W_i\)的最小多项式的最小公倍式

推论 2¶

设\(A=\text{diag}(A_1, A_2, \cdots, A_s)\)是分块对角矩阵, 每个子矩阵\(A_j\)的最小多项式是\(m_j(\lambda)\), 则\(A\)的最小多项式是\(m(\lambda)=\text{lcm}(m_1(\lambda), m_2(\lambda), \cdots, m_s(\lambda))\)

定义 3 幂零变换¶

若\(\exists k\in \mathbb{N}, s.t.\underline{A}^k=\underline{0}\), 则称\(\underline{A}\)是幂零变换
- 使得\(\underline{A}^k=\underline{0}\)的最小正整数\(k\)称为\(\underline{A}\)的幂零指数

命题 4¶

设\(\underline{A}\)是幂零指数为\(l\)的幂零变换, 则\(\underline{A}^l\)的最小多项式\(m(\lambda)=\lambda^l\)

[!NOTE] \(V_{\lambda_j}=\text{Ker}(\underline{A}-\lambda_jI)\)

定理 2¶

\(\underline{A}\)可对角化\(\iff m(\lambda)\)在\(F[x]\)上可以分解为不同的一次因式的乘积
- 可对角化的又一充要条件
- 只要存在一个零化多项式可以分解成不同的一次因式的乘积即可, 这样因为最小多项式整除零化多项式, 那么最小多项式一定可以分解成不同的一次因式的乘积

推论 3¶

幂零指数\(l\)大于\(1\)的幂零变换不可对角化
- 由命题 4 和定理 2 立即得到

推论 4¶

幂等变换一定可对角化
- \(m(\lambda)\mid \lambda^2-\lambda=\lambda(\lambda-1)\)

幂零变换的\(\text{Jordan}\)标准型¶

[!NOTE] 若\(\underline{A}\)是幂零指数为 \(l\) 的幂零变换, 则存在\(\xi, s.t.\underline{A}^{l-1}(\xi) \neq 0, \underline{A}^l(\xi)=0\), 那么向量组\(\xi, \underline{A}(\xi), \cdots, \underline{A}^{l-1}(\xi)\)线性无关\(\\\) 从而\(\text{span}(\xi, \underline{A}(\xi), \cdots, \underline{A}^{l-1}(\xi))\)是\(\underline{A}\)的一个不变子空间, 在这个空间中, \(\underline{A}\)在基\(\xi, \underline{A}(\xi), \cdots, \underline{A}^{l-1}(\xi)\)下的矩阵恰好是

\[\begin{pmatrix} 0 & 1 & 0 & \cdots & 0 \\ 0 & 0 & 1 & \cdots & 0 \\ \vdots & \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & 0 & \cdots & 1 \\ 0 & 0 & 0 & \cdots & 0 \end{pmatrix}\]

定义 1 \(\text{Jordan}\)块¶

形如 \(\begin{pmatrix} a & 1 & 0 & \cdots & 0 \\ 0 & a & 1 & \cdots & 0 \\ \vdots & \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & 0 & \cdots & 1 \\ 0 & 0 & 0 & \cdots & a \end{pmatrix}\) 的\(k\)阶矩阵称为一个 \(k\) 级\(\text{Jordan}\)块, 记为\(J_k(a)\)

定义 2¶

由若干个\(\text{Jordan}\)块组成的分块对角矩阵称为一个 \(\text{Jordan}\)形矩阵

定义 3¶

若存在\(\alpha\in V, s.t.(\alpha, \underline{A}(\alpha), \cdots, \underline{A}^{l-1}(\alpha))\)线性无关, 且\(\forall r, \underline{A}^r(\alpha)\in \text{span}(\alpha, \underline{A}(\alpha), \cdots, \underline{A}^{l-1}(\alpha))\) ( 或 \(\underline{A}^l(\alpha)=\vec{0}\) ), 则称 \(\text{span}(\alpha, \underline{A}(\alpha), \cdots, \underline{A}^{l-1}(\alpha))\) 是一个 \(\underline{A}\)-循环子空间( 或 \(\underline{A}\)-强循环子空间 )

命题 1¶

\(\underline{A}\) 是幂零指数为 \(l\) 的幂零变换, 则 \(\text{span}(\alpha, \underline{A}(\alpha), \cdots, \underline{A}^{l-1}(\alpha))\) 是一个 \(\underline{A}\)- 强循环子空间
且 \(\underline{A}\) 在基 \(\alpha, \underline{A}(\alpha), \cdots, \underline{A}^{l-1}(\alpha)\) 下的矩阵是 \(J_l(0)\)

定理 1¶

设 \(\underline{A}\) 是域 \(F\) 上 \(r\) 维线性空间 \(V\) 上的幂零指数为 \(l\) 的幂零变换, 则 \(V\) 可以分解为 \(\dim W_0\) 个 \(\underline{A}\)-强循环子空间的直和, 其中 \(W_0\) 是 \(\underline{A}\) 的属于特征值 0 的特征子空间

定理 2¶

设 \(\underline{A}\) 是域 \(F\) 上 \(r\) 维线性空间 \(V\) 上的幂零指数为 \(l\) 的幂零变换, 则 \(V\) 存在一组基, 使得 \(\underline{A}\) 在这组基下的矩阵是 \(\text{Jordan}\) 形矩阵, 且 \(\text{Jordan}\) 块的总数为 \(\dim W_0=\dim \text{Ke}r(\underline{A})=\dim V-\text{rank}(\underline{A}) = r-\text{rank}(\underline{A})\) , 且每个 \(\text{Jordan}\) 块的主对角元为 \(0\) , 级数不大于 \(r\)
\(t\) 级 \(\text{Jordan}\) 块的个数 \(N(t) = \text{rank}(\underline{A}^{t-1}) + \text{rank}(\underline{A}^{t+1}) - 2\text{rank}(\underline{A}^t)\)
这个 \(\text{Jordan}\) 形矩阵称为 \(\underline{A}\) 的 \(\text{Jordan}\) 标准型
- 在不考虑 \(\text{Jordan}\) 块的顺序的情况下, \(\text{Jordan}\) 标准型是唯一的

推论 1¶

设 \(A\) 是域 \(F\) 上 \(r\) 级幂零指数为 \(l\) 的幂零矩阵, 则 \(A\) 相似于一个 \(\text{Jordan}\) 形矩阵, \(\text{Jordan}\) 块总数等于 \(r-\text{rank}(A)\), 且每个 \(\text{Jordan}\) 块的主对角元为 \(0\) , 级数不大于 \(r\)
\(t\) 级 \(\text{Jordan}\) 块的个数 \(N(t) = \text{rank}(A^{t-1}) + \text{rank}(A^{t+1}) - 2\text{rank}(A^t)\)
这个 \(\text{Jordan}\) 形矩阵称为矩阵 \(A\) 的 \(\text{Jordan}\) 标准型
- 在不考虑 \(\text{Jordan}\) 块的顺序的情况下, \(\text{Jordan}\) 标准型是唯一的

线性变换的\(\text{Jordan}\)标准型¶

定理 1¶

若 \(\underline{A}\) 的最小多项式 \(m(\lambda)= (\lambda-\lambda_1)^{r_1}(\lambda-\lambda_2)^{r_2}\cdots(\lambda-\lambda_s)^{r_s}\) , 则 \(V\) 中存在一个基, 使得 \(\underline{A}\) 在这个基下的矩阵是 \(\text{Jordan}\) 形矩阵, 其全部主对角元是 \(\underline{A}\) 的全部特征值;特征值 \(\lambda_j\)在主对角线上出现的次数等于 \(\lambda_j\) 的 代数重数 , 主对角元为 \(\lambda_j\) 的 \(\text{Jordan}\) 块的总数 \(N_j\) 为
- \(\(N_j=n-\text{rank}(\underline{A}-\lambda_j\underline{I})\)\) 其中 \(t\) 级 \(\text{Jordan}\) 块 \(J_t(\lambda_j)\) 的个数 \(N_j(t)\) 为
- \(\(N_j(t)= \text{rank}{(\underline{A}-\lambda_j\underline{I})^{t+1}} + \text{rank}{(\underline{A}-\lambda_j\underline{I})^{t-1}}- 2\text{rank}{(\underline{A}-\lambda_j\underline{I})^{t}}\)\) 其中 \(1\leq t\leq r_j;j=1, 2\cdots, s\), 这个 \(\text{Jordan}\) 形矩阵 \(A\) 称为线性变换 \(\underline{A}\) 的 \(\text{Jordan 标准形}\)
- 除去 \(\text{Jordan}\) 块的排列次序, 线性变换的标准形是唯一的

推论 1¶

设 \(A\) 是域 \(F\) 上的 \(n\) 级矩阵, 如果 \(A\) 的最小多项式为 \(m(\lambda) = (\lambda-\lambda_1)^{r_1}(\lambda-\lambda_2)^{r_2}\cdots(\lambda-\lambda_s)^{r_s}\), 那么 \(A\) 相似于一个 \(\text{Jordan}\) 形矩阵, 其全部主对角元是 \(A\) 的全部特征值;特征值 \(\lambda_j\)在主对角线上出现的次数等于 \(\lambda_j\) 的 代数重数 , 主对角元为 \(\lambda_j\) 的 \(\text{Jordan}\) 块的总数 \(N_j\) 为
- \(\(N_j=n-\text{rank}(A-\lambda_jI)\)\) 其中 \(t\) 级 \(\text{Jordan}\) 块 \(J_t(\lambda_j)\) 的个数 \(N_j(t)\) 为
- \(\(N_j(t)= \text{rank}{(A-\lambda_jI)^{t+1}} + \text{rank}{(A-\lambda_jI)^{t-1}}- 2\text{rank}{(A-\lambda_jI)^{t}}\)\) 其中 \(1\leq t\leq r_j;j=1, 2\cdots, s\), 这个 \(\text{Jordan}\) 形矩阵 \(J\) 称为矩阵 \(A\) 的 \(\text{Jordan 标准形}\)
- 除去 \(\text{Jordan}\) 块的排列次序, 矩阵的标准形是唯一的

[!NOTE] 由于复数域上的一元多项式都可以分解为一次因式的乘积, 所以复数域上有限维线性空间上的线性变换都有 \(\text{Jordan}\) 标准形, 从而复数域上的每个方阵都有 \(\text{Jordan}\) 标准形

推论 2¶

域 \(F\) 上 \(n\) 维线性空间 \(V\) 上的线性变换 \(\underline{A}\) 有 \(\text{Jordan}\) 标准形 \(\iff\) \(\underline{A}\) 的 最小多项式 在 \(F[\lambda]\) 上可以分解为不同的一次因式的乘积

推论 3¶

域 \(F\) 上 \(n\) 维线性空间 \(V\) 上的线性变换 \(\underline{A}\) 有 \(\text{Jordan}\) 标准形 \(\iff\) \(\underline{A}\) 的 特征多项式 在 \(F[\lambda]\) 上可以分解为不同的一次因式的乘积

推论 4¶

域 \(F\) 上 \(n\) 级矩阵 \(A\) 相似于一个 \(\text{Jordan}\) 标准形 \(\iff\) \(A\) 的 最小多项式(或特征多项式) 在 \(F[\lambda]\) 上可以分解为不同的一次因式的乘积

推论 5¶

设 \(A, B\in M_n(F)\), 如果它们的 最小多项式(或特征多项式) 在 \(F[\lambda]\) 上可以分解为一次因式的乘积, 那么:
- \(A\) 和 \(B\) 相似 \(\iff A, B\) 的 \(\text{Jordan}\) 标准形相同

推论 6¶

两个 \(n\) 级复矩阵相似当且仅当它们有相同的 \(\text{Jordan}\) 标准形