前言
本文以《线性代数应该这样学》为基础,同时参考了蓝以中先生的《高等代数简明教程》、崔建伟先生的《数学物理方法基础——线性代数》。出于整合自己的知识,写了这篇笔记。
- 预备
- 第一章 矩阵
- 第二章 向量空间
- 第三章 线性映射
- 第四章 内积空间
- 第五章 算子的本征值
- 第六章 内积空间上的算子
- 第七章 复向量空间上的算子
- 第八章 实向量空间上的算子
- 第九章 线性代数
- 第十章 线性方程组
预备
集合和映射
定义 0.1.1 集合:把一些明确的、彼此有区别的、具体的或抽象的事物看作一个整体,称之为集合。
定义 0.1.2 组和长度:设$n$为非负整数,则长度为$n$的组是指由$n$个有顺序的元素构成的对象,形如
两个组相等当且仅当它们的长度相等,所含元素相同且顺序相同。
以上给出了我们将会用到一些基础对象。为了研究集合之间的关系,我们还需给出一些有关映射的定义。
定义 0.1.3 集合的直积:设$A$和$B$都是集合,其直积$A\times B$为有序组的集合
定义 0.1.4 单射、满射和双射:设有集合$A$和$B$,映射$f:A\to B$,
- 若对于$B$内所有元素都有一个$A$中的元素与之对应,即$f(A)=B$,则称$f$是一个满射,或称其为满的;
- 若$f(a)=f(b)$当且仅当$a=b$,则称$f$是一个单射,或称之为单的;
- 若映射$f$既是满的又是单的,则称$f$是一个双射。
关系和分类
定义 0.2.1 关系:定义在集合$A$上一个关系是指一种判断法则,由此判断$A\times A$内的元素是满足该关系还是不满足该关系。
定义 0.2.2 次序关系:集合$X$上的一个关系,若满足
- $\forall a\in X,a\sim a$
- $a\sim b\ \&\ b\sim a\Rightarrow a=b$
- $a\sim b\ \&\ b\sim c\Rightarrow a\sim c$
则称$\sim$是一个次序关系,记作$\leq$。定义有次序关系的集合称为有序集合,记作$(X,\leq)$。
定义 0.2.3 等价关系:集合$X$上的一个关系,若满足
- 自反律:$\forall a\in X,a\sim a$
- 对称律:$a\sim b\ \Rightarrow b\sim a$
- 传递律:$a\sim b\ \&\ b\sim c\Rightarrow a\sim c$
则称$\sim$是一个等价关系,记作$=$。
定义 0.2.4 集合的分类:集合$X$的一个分类,是指这样一个子集族$u$:
- $A,B\in u\Rightarrow A=B\ \mathrm{or}\ A\bigcap B=\varnothing$
- $\underset{A\in u}{\bigcup}A=X$
定理 0.2.1 等价关系和分类:集合$X$上的一个分类给出$X$上的一个等价关系,同时$X$上的一个等价关系也给出一个分类。因此,分类又称为等价类。
常见代数系统
定义 0.3.1 代数运算:集合$A$上的一个代数运算是指一个映射$f:A\times A\to A$。
定义 0.3.2 群:设有非空集合$G$,我们称之为群,若其中定义有一种代数运算,称为群乘法,满足
- 封闭性:$\forall a,b \in G,ab\in G$
- 结合律:$\forall a,b,c\in G,a(bc)=(ab)c$
- 存在单位元:$\exists e \in G,$使得$\forall a\in G $有$ea = ae = a $
- 存在逆元:$\forall a\in G,\exists a^{-1}\in G使得aa^{-1}=e$
以上四个条件称为群公理。若群乘法还满足交换律:$\forall a,b\in G,ab=ba$,则称为阿贝尔群。
定义 0.3.3 群的同态:设有群$G,G’$,若存在一个映射$f:G\to G’$满足
则称$G’$与$G$同态,$f$称为它们的同态映射。
同态映射实际上是在群间保群乘法的映射。可以视作在映射是保持了系统的代数结构。
定义 0.3.4 群的同构:设$f$是群$G$和$G’$的同态映射。若$f$还是一个双射,则称$G$和$G’$同构,$f$是它们的同构映射。
若两个群同构,则意味着它们的对应元素相同,群乘法也相同,所以两个同构的群实际上是同一个群。
定义 0.3.5 半群:
定义 0.3.6 环:
定义 0.3.7 域:
指标计算规则
对于矩阵的元素,指标为两个英文字母并列置于右下角,前一个表示行指标,后一个表示列指标。
矢量的分量带有上指标,向量组用带括号的下指标区分
对偶矢量的分量带下指标,对偶向量组用带括号的上指标区分
线性映射的分量的通常有两个指标,不仅有上下之分,也有左右之分。上下指标对齐爱因斯坦求和约定,左右指标分别对齐对应的行或是列。将指标运算转化成矩阵运算时,所遵循的准则是“相邻、从左下到右上相消”,即($M(R)_{ik}$表示矩阵元素)
第一章 矩阵
§1 矩阵的定义及运算
1.1 矩阵
定义 1.1.1 矩阵:数域$F$上的一个$m\times n$型矩阵是指由$F$的$mn$个元素排成的数表
$a_{ij}$指代矩阵第$i$行、第$j$列的元素。其中,$m=n$的矩阵也称为方阵。方阵中$i=j$的元素称为方阵主对角线上的元素,$i+j=n$的元素称为副对角线上的元素。
所有元素都是0的矩阵称为零矩阵。只有对角线上元素不为零的矩阵称为对角矩阵,常记作
对角元全为1的对角矩阵称为单位矩阵。
若一个矩阵的对角线下方的元素全为0,则称为上三角矩阵。类似的,若上方的元素全为0,则称为下三角矩阵。
1.2 矩阵的线性运算
定义 1.1.2 同型矩阵:两个矩阵同型,若它们的行数和列数分别相等。
定义 1.1.3 矩阵相等:两个矩阵相等,若它们是同型矩阵且对应位置的元素都相等,记为$A=B$。
定义 1.1.4 矩阵的和:两个同型矩阵$A$和$B$的和定义为一个新的矩阵$A+B$,且与它们同型。$A+B$的对应元素为$A$和$B$对应元素的和,即
只有同型矩阵才有和。
定义 1.1.5 矩阵的数乘:一个数和一个矩阵的乘积定义为
即每个元素都乘$k$。
1.3 矩阵的乘法
定义 1.1.6 矩阵乘法:设$A$和$B$分别为$m\times p$型矩阵和$p\times n$。则它们的乘积定义为$m\times n$型矩阵$C$,满足
只有当$A$的列数等于$B$的行数时,$AB$才有意义。其次,矩阵的乘法不满足交换律,即
如果$AB=BA$,则称$A$和$B$对易。
定理 1.1.1 矩阵乘法满足如下性质(假设以下乘法都有意义):
- 乘法结合律:$A(BC)=(AB)C$;
- 左右分配律:$A(B+C)=AB+AC,(A+B)C=AC+BC$;
- 设$k\in F$,则$k(AB)=(kA)B=A(kB)$。
- 向量组的线性相关性由方程
判定。设$a_{(i)}$是使得$\lambda^i\neq0$且标号最大的那个向量,则有$\lambda^{i+1}=\cdots=\lambda^m=0$,所以
即$a_{(i)}\in \mathrm{span}(a_{(i-1)})$。
- 对于$\mathrm{span}(a_{(m)})$中的所有向量,有
即$\forall v\in \mathrm{span}(a_{(m)}),v\in \mathrm{span}(a_{(1)},\cdots,a_{(i-1)},a_{(i+1)},\cdots,a_{(m)})$。
定理 2.3.4 在有限维向量空间中,所有线性无关组的长度都小于等于向量空间中每一个张成组的长度。
证明:设$\{a_{(m)}\}$是线性无关组,$\{b_{(n)}\}$是张成组。则有
所以向量组$\{a_{(1)},b_{(m)}\}$线性相关,由引理(2.3.3)可知,我们可以从中去掉$b_{(i)}$而不改变其张成空间,于是得到新的张成组。对新的张成组重复这个操作。每次操作的结果是将一个$b_{(i)}$变为$a_{(j)}$,得到的仍是一个张成组。直到将所有的$a_{(j)}$被添加进去之后这个过程才会终止。于是有$m\leq n$。
定理 2.3.5 有限维空间的子空间都是有限维的。
§4 基与维数
4.1 基
定义 2.4.1 基:一个既线性无关又张成$V$的向量组称为$V$的基。
定理 2.4.1 $V$中的向量组$\{\epsilon_{(n)}\}$是$V$的基当且仅当$\forall a\in V$都能被唯一地写成$\{\epsilon_{(n)}\}$的线性组合。
证明:充分性。若$\{\epsilon_{(n)}\}$是基,则它是$V$的张成组。所以$\forall a\in V$都能被写成$\{\epsilon_{(n)}\}$的线性组合。假设这种线性组合有两种,则
由于$\{\epsilon_{(n)}\}$是线性无关的,则$a^i-b^i=0\to a^i=b^i$。
必要性:由线性组合的唯一性可推得$\{\epsilon_{(n)}\}$是线性无关组(同充分性的证明),易得$\{\epsilon_{(n)}\}$也是张成组,所以$\{\epsilon_{(n)}\}$是基。
定理 2.4.2 有限维向量空间的所有张成组都可以化简成一个基。
证明:根据线性相关性引理,对于张成组$\{a_{(m)}\}$的每个向量,如果它可以写为前面向量的线性组合,则将其去掉,否则保留。这个过程不改变向量组的张成空间。最后得到一个线性无关组。则这个线性无关组张成向量空间,则它是基。
定理 2.4.3 每个有限维向量空间都有基。
证明:每个有限维向量空间都有张成组,而张成组可以化简成基。
定理 2.4.4 线性无关组可以扩充为一个基。
证明:对于一个线性无关组,可以通过定理(2.3.4)证明中的过程来向其中加入几个张成组中的元素来使其成为张成组,继而成为基。
4.3 维数
定理 2.4.5 不同基的长度相等。
证明:由定理(2.4.2)、(2.4.4),有(记组的长度为$[$组$]$)$[$线性无关组$]\leq\leq[$张成组$]$。而对于另一个基,它既是线性无关组又是张成组。所以,$[$基2$]\leq\leq[$基2$]$,则$[$基1$]=$$[$基2$]$。
定义 2.4.2 维数:有限维向量空间的任意基的长度称为它的维数,记为$\mathrm{dim}V$。
定理 2.4.6 若$U$是$V$的子空间,则$\mathrm{dim}U\leq \mathrm{dim}V$。
证明:$U$的基是$V$的线性无关组,则由定理(2.4.5)的证明过程可知有$\mathrm{dim}U\leq \mathrm{dim}V$。
定理 2.4.7 每个长度等于$\mathrm{dim}V$的线性无关组都是基。
证明:由于定理(2.4.4),线性无关组可以扩充为基,而一个长度为$\mathrm{dim}V$的线性无关组的扩充是平凡的:不需要添加任一元素。
定理 2.4.8 每个长度等于$\mathrm{dim}V$的张成组都是基。
证明:由定理(2.4.2)易证。
定理 2.4.9 设$U,W$都是有限维向量空间的子空间,则有
证明:设$\{\epsilon_{(m)}\}$是$U\cap W$的基,则$\mathrm{dim}(U\cap W)=m$。$\{\epsilon_{(m)}\}$可扩充为$U$的基$\{\epsilon_{(m)},\xi_{(p)}\}$,则$\mathrm{dim}U=m+p$;$\{\epsilon_{(m)}\}$可扩充为$W$的基$\{\epsilon_{(m)},\eta_{(q)}\}$,则$\mathrm{dim}W=m+q$。显然$\{\epsilon_{(m)},\xi_{(p)},\eta_{(q)}\}$张成$U+W$。下证该向量组的线性无关性。设
则
所以$b^j\xi_{(j)}\in U\cap W$,$b^j\xi_{(j)}=d^l\epsilon_{(l)}$,于是有
但是$\{\epsilon_{(m)},\xi_{(p)}\}$是线性无关组,所以
$b^j=0$。同理有$c^k=0$。于是有$a^i=0$。总的来说,$\{\epsilon_{(m)},\xi_{(p)},\eta_{(q)}\}$是线性无关组,于是是$U+W$的基。所以
4.3 坐标
定义 2.4.3 坐标:若$V$中的一个向量$a$关于基$\{\epsilon_{(n)}\}$的线性组合为
则称矩阵
为$a$在基$\{\epsilon_{(n)}\}$下的坐标。
于是向量$a$又可以写为
易得向量的线性组合的坐标是坐标的线性组合,即
坐标是随基变换的,我们现在来找同一个向量在不同基下的坐标的关系。设有两组基$\{\epsilon_{(n)}\}$和$\{\xi_{(n)}\}$,$\eta_i$在$\{\epsilon_{(n)}\}$下的坐标设为$\Xi_i$
于是有
定义 2.4.4 过渡矩阵:设有两组基$\{\epsilon_{(n)}\}$和$\{\xi_{(n)}\}$,以$\{\xi_{(n)}\}$在$\{\epsilon_{(n)}\}$下的坐标按列顺序排列成的矩阵称为从$\{\epsilon_{(n)}\}$到$\{\xi_{(n)}\}$的过渡矩阵
定理 2.4.10 过渡矩阵可逆。
证明:设从$\{\epsilon_{(n)}\}$到$\{\xi_{(n)}\}$的过渡矩阵为$P$,从$\{\xi_{(n)}\}$到$\{\epsilon_{(n)}\}$的过渡矩阵为$Q$,则
同理有$PQ=I$。于是$P$和$Q$互为逆。
定理 2.4.11 向量$a$在$\{\epsilon_{(n)}\}$下的坐标为$X$,在$\{\xi_{(n)}\}$下的坐标为$Y$,从$\{\epsilon_{(n)}\}$到$\{\xi_{(n)}\}$的过渡矩阵为$P$,则有
或者
证明:
注意,这里的最后一步依赖于基$\{\epsilon_{(n)}\}$的线性无关性。
可见,基变换与坐标变换是互逆的。
第三章 线性映射
§1 线性映射
1.1 线性映射
定义 3.1.1 线性映射:从$V$到$W$的线性映射是满足以下性质的映射$T:V\to W$
- 加性:$\forall a,b\in V,T(a+b)=Ta+Tb$;
- 齐性:$\forall a\in V,\lambda\in F,T(\lambda a)=\lambda Ta$。
记所有从$V$到$W$的线性映射构成的集合为$\mathcal{L}(V,W)$。
下面介绍一些线性映射的例子
零映射$\hat{0}:V\to W$
恒等映射$\hat{I}:V\to V$
矩阵$T_{n\to m}:F^n\to F^m$
定义 3.1.2 $\mathcal{L}(V,W)$上的代数运算:
加法 $\forall T,S \in \mathcal{L}(V,W),a\in V$,和$T+S$是映射
数乘 $\forall T\in \mathcal{L}(V,W),\lambda \in F$,它们的乘积$\lambda T$是映射
验证:以验证上述定义的和是合适的线性映射为例。数乘定义是合适的同样是易证的。
和$T+S$
加性
齐性
定理 3.1.1 线性映射将$0$映为$0$。$T\in \mathcal{L}(V,W)$
其中$0_V$和$0_W$分别是$V$和$W$的零元。
证明:$\forall a\in V$
定义 3.1.3 相等的线性映射:设$T,S\in \mathcal{L}(V,W)$,若$\forall a\in V$,有
即$T-S=\hat{0}$,则称$T$与$S$是相等的线性映射,$T=S$。
定理 3.1.2 若$\forall a\in V$,有
则$T=S$。
证明:
定理 3.1.3 $\mathcal{L}(V,W)$是向量空间。
证明:
- 加法交换性:
- 加法、数乘结合性:
剩余性质同样是易证的。
定理 3.1.4 设$\{\epsilon_{(n)}\}$是$V$的基,$\{\xi_{(n)}\}$是$W$的基,则存在唯一的线性映射$T:V\to W$使得$\forall j=1,\cdots,n$都有
证明:
- 存在性。设$T$是这样的映射
若$\lambda^i=\delta_{ij}$,则有$T\epsilon_{(j)}=\xi_{(j)}$。易证它是一个线性映射。
- 唯一性。设有两个线性映射$T$和$S$都有$T\epsilon_{(j)}=\xi_{(j)}$,$S\epsilon_{(j)}=\xi_{(j)}$。则由线性映射的性质可知
由于$\{\epsilon_{(n)}\}$是$V$的基,则有$\forall a=\mu^i\epsilon_{(i)}\in V$有$Ta=Sa$,所以$T=S$。
1.2 线性映射的乘积
定义 3.1.4 线性映射的乘积:设$T\in\mathcal{L}(V,U),S\in\mathcal{L}(U,W)$,则它们的乘积$ST$是映射$ST:V\to W$
定理 3.1.5 线性映射的乘积是线性映射。
证明:设$T\in\mathcal{L}(V,U),S\in\mathcal{L}(U,W)$。
加性
齐性
线性映射的乘积有如下三个性质(假设乘积都有意义)。
定理 3.1.6 结合性
证明:$\forall a\in V$
定理 3.1.7 与恒等映射的乘积,$T\in\mathcal{L}(V,W)$
其中$I_V\in\mathcal{L}(V,V),I_W\in\mathcal{L}(W,W)$。
证明:$\forall a\in V$
定理 3.1.8 左右分配性质。
证明:$\forall a\in V$
1.3 线性映射的矩阵表示
设$T\in\mathcal{L}(V,W)$,$\{\epsilon_{(n)}\}$是$V$的基,$\{\eta_{(m)}\}$是$W$的基,则有
定义 3.1.5 线性映射的矩阵:称第$(i,j)$个元素是$T^i_{\ \ j}$的矩阵是线性映射$T$在$V$的基$\{\epsilon_{(n)}\}$和$W$的基$\{\eta_{(m)}\}$下的矩阵,即
记作$M(T,\{\epsilon_{(n)}\},\{\eta_{(m)}\})$。若指明了基,则在不产生歧义的情况下可以简记为$M(T)$。
定理 3.1.9 线性映射的线性组合的矩阵是矩阵的线性组合
证明:设$T,S\in\mathcal{L}(V,W)$,$\{\epsilon_{(n)}\}$是$V$的基,$\{\eta_{(m)}\}$是$W$的基
定义 3.1.6 $F^{m,n}$:对于$m,n\in N^+$,所有元素取自于$F$的$m\times n$矩阵构成的集合为$F^{m,n}$,即
定理 3.1.10 $F^{m,n}$在矩阵的加法和数乘定义下是向量空间。
证明从略。
定理 3.1.11 线性映射乘积的矩阵是矩阵的乘积
证明:设$T\in\mathcal{L}(V,W)$,$S\in\mathcal{L}(W,U)$,$\{\epsilon_{(n)}\}$是$V$的基,$\{\eta_{(m)}\}$是$W$的基,$\{\xi_{(p)}\}$是$U$的基。
在不引起歧义的情况下,有时直接用相同的字母来指代线性映射和它的一个矩阵表示,通过上下文应该可以判别。
§2 零空间与值域
2.1 零空间与值域
定义 3.2.1 零空间:对于$T\in\mathcal{L}(V,W)$,$T$的零空间是由被$T$映射为$0$的那些向量构成的集合,记为$\mathrm{null}\ T$
定理 3.2.1 零空间是子空间。
证明:
线性运算封闭性。$a,b\in \mathrm{null}\ T$
由定理(3.1.1)可知零元存在。所以$\mathrm{null}\ T$是子空间。
定理 3.2.2 对于$T\in\mathcal{L}(V,W)$,$T$是单的当且仅当$\mathrm{null}\ T=\{0\}$。
证明:
- 充分性。若$T$是单的,则
即$\mathrm{null}\ T=\{0\}$。
- 必要性。设$Ta=Tb$,则
定义 3.2.2 值域(像空间):对于$T\in\mathcal{L}(V,W)$,$T$的值域是由$W$中那些可以写为$Ta,a\in V$的那些向量组成的集合,记作$\mathrm{range}\ T$
定理 3.2.3 值域是$W$的子空间。
证明:
- 由定理(2.1.1)可知零元存在。
- 线性运算封闭性。设$a,b \in V$
对于$T\in\mathcal{L}(V,W)$,$T$是满的当且仅当$\mathrm{range}\ T=W$。
2.2 线性映射基本定理
定理 3.2.4 若$V$是有限维的,$T\in\mathcal{L}(V,W)$,则$\mathrm{range}\ T$是有限维的且
证明:设$\{\eta_{(p)}\}$为$\mathrm{null}\ T$的基,$\mathrm{dim}\ \mathrm{null}\ T=p$。$\mathrm{null}\ T$是$V$的子空间,则它的基是线性无关组,可以扩充为$V$的基$\{\eta_{(p)},\epsilon_{(q)}\}$,$\mathrm{dim}V=p+q$。$\forall a\in V$,设
将$T$作用与上式两边,则有
左边不含有关于$\eta_{(i)}$的项,因为它们的线性组合是$\mathrm{null}\ T$中的元素,作用后的结果为0。因此,$\mathrm{range}\ T=\mathrm{span}(T\epsilon_{(q)})$,所以$\mathrm{range}\ T$是有限维的。接下来再证明这个张成组也是线性无关组。设
因为它们是基,所以有$d^j=0$。再次用$T$作用于两边得
因此$\{T\epsilon_{(q)}\}$是线性无关组,所以是基。则$\mathrm{dim}\ \mathrm{range}\ T=q$。所以有
§3 向量空间的同构
3.1 可逆的线性映射
定义 3.3.1 线性映射的逆:对于$T\in\mathcal{L}(V,W)$,存在线性映射$S\in\mathcal{L}(W,V)$使得$ST=I_V,TS=I_W$,则称$S$为$T$的逆,称$T$是可逆的。
定理 3.3.1 可逆线性映射的逆是唯一的。
证明:设$T$有逆$S_1$,$S_2$,则
于是我们可以无歧义地将$T$的逆记作$T^{-1}$。
定理 3.3.2 一个线性映射是可逆的当且仅当它是双射。
证明:
1.充分性。设$T$为可逆映射。设$a\in V$满足$Ta=0$。则
所以$\mathrm{null}\ T=\{0\}$,即$T$是一个单射。
3.2 同构的向量空间
定义 3.3.2 向量空间的同构:若两个向量空间$V$与$W$之间存在可逆映射$T\in\mathcal{L}(V,W)$,则称$V$与$W$同构,记作$V=W$。$T$称为同构映射。
定理 3.3.3 $V=W$当且仅当$\mathrm{dim}V=\mathrm{dim}W$。
证明:
充分性。由于定理(2.3.2),$T$是一个双射,则
必要性。设$\mathrm{dim}V=\mathrm{dim}W=n$,$\{\epsilon_{(n)}\}$为$V$的基,$\{\eta_{(n)}\}$为$W$的基。由定理(2.1.4),存在线性映射使得$T\epsilon_{(i)}=\eta_{(i)}$。设$a=a^i\epsilon_{(i)}$,则
则$T$是满的。设$Tb=0=T(b^i\epsilon_{(i)})$,所以
所以$b^i=0$,于是$b=0$。所以$T$是单的。则$T$是双射,于是是可逆映射。所以$V=W$。
定理 3.3.4 $\mathcal{L}(V,W)=F^{m,n}$,$\mathrm{dim}\ \mathcal{L}(V,W)=\mathrm{dim}\ V\cdot \mathrm{dim}\ W=mn$。
如果两个线性空间之间存在自然的同构映射,于是这二者可以说是完全等同的,只是元素的称呼可能不同。自然的意思是这个同构映射是不依赖于基的选择的。
可以证明,由所有列向量构成的集合也是一个线性空间。而定义2.4.3可以看作是一般线性空间到列向量空间的同构映射,于是二者是同构的。但要注意的是,这个同构映射并非是自然的,而是依赖于线性空间的基的选择,所以不能说二者是等同的。
3.3 线性算子
定义 3.3.3 线性算子:当$V=W$时,$\mathcal{L}(V,W)$可记为$\mathcal{L}(V)$,其中的元素可称为线性算子。
定理 3.3.5 若$T\in\mathcal{L}(V)$,则下列命题等价:
- $T$是可逆的;
- $T$是单的;
- $T$是满的。
证明:利用循环论证。由定理(2.3.2)可知$1\Rightarrow2$。
假设2成立,则
所以$\mathrm{range}\ T=V$,$2\Rightarrow3$。假设3成立,容易证明$T$也是单的。则$T$是双射,于是是可逆映射。$3\Rightarrow1$。
在选定了向量空间$V$的基后,可以写出在这个基下的线性算子的矩阵,即
定理 3.3.6 线性算子在不同基下的矩阵相似。
证明:设$\{\epsilon_{(n)}\}$和$\{\eta_{(n)}\}$都是$V$的基,$T\in\mathcal{L}(V)$。$T$在这两个基下的矩阵元分别为$T^{i}_{\ \ j}$和$T’^{i}_{\ \ \ j}$。设两个基间的过渡矩阵为$P$,则有
所以将$T$作用于第一个式子两边可得
根据基的线性无关性消去基,于是有
由于过渡矩阵是可逆的,则
所以$T$和$T’$相似。
§4 向量空间的积和商
4.1 向量空间的积
定义 3.4.1 向量空间的积:$V_1,V_2,\cdots,V_n$均为定义在$F$上的向量空间,它们的积定义为它们的笛卡尔积,即
按组之间的加法,$V_1\times\cdots\times V_n$是$F$上的向量空间。
定理 3.4.1 若$V_1,V_2,\cdots,V_n$是有限维的,则$V_1\times\cdots\times V_n$也是有限维的,且有
证明:设$\{\epsilon_{i(n_i)}\}$为$V_i$的基,$\mathrm{dim}\ V_i=n_i$。$a_{(j)}=a^{\ i}_{(j)}\epsilon_{j(i)}\in V_j$,
则$V_1\times\cdots\times V_n$的一个基为$(\epsilon_{1(i)},0,\cdots,0),\cdots,(0,\cdots,0,\epsilon_{n(i)})$,所以
4.2 向量空间的积和直和
定理 3.4.2 设$U_1,\cdots,U_m$是$V$的子空间。$U_1+\cdots+U_m$是直和当且仅当$U_1+\cdots+U_m$与$U_1\times\cdots\times U_m$同构。
证明:
- 充分性。设$U_1+\cdots+U_m$是直和,设$\{\epsilon_{i(n_i)}\}$是$U_i$的基,$u_{(j)}=u^i_{(j)}\epsilon_{j(i)}\in U_j$。设$u_{(1)}+\cdots+u_{(m)}=0$。由定理(2.2.4)可知,$u_{(i)}=0$。所以$u^i_{(j)}=0$。则$\{\epsilon_{1(n_1)},\cdots,\epsilon_{m(n_m)}\}$是$U_1\oplus\cdots\oplus U_m$的基,则
则$U_1\oplus\cdots\oplus U_m$与$U_1\times\cdots\times U_m$同构。
- 必要性。由于二者同构,则$\mathrm{dim}\ U_1+\cdots+ U_m=\sum_{i=1}^mn_i$。易知$\{\epsilon_{1(n_1)},\cdots,\epsilon_{m(n_m)}\}$是张成组。由定理(2.4.8)可知,这个有合适长度的张成组是基。则$\forall u\in U_1+\cdots+ U_m$,可以唯一表示为$\{\epsilon_{1(n_1)},\cdots,\epsilon_{m(n_m)}\}$的线性组合。而$\forall u_i\in U_i$表示为$\epsilon_{i(n_i)}$的线性组合也唯一。则和中的所有元素都可以唯一表示为$u_1+\cdots+u_m$。所以$U_1+\cdots+ U_m$是直和。
推论 3.4.3 设$U_1,\cdots,U_m$是$V$的子空间。$U_1+\cdots+U_m$是直和当且仅当
4.3 商空间
定义 3.4.2 仿射子集:对于$v\in V$,设$U$是$V$的子空间,则$V$的子集$v+U$定义为
称之为$V$的一个仿射子集。我们称仿射子集$v+U$平行$U$。
定理 3.4.4 设$a,b\in V$,$U$是$V$的子集。则下列命题等价:
- $a-b\in U$;
- $a+U=b+U$;
- $(a+U)\cap(b+U)\neq \varnothing$。
证明:假设1成立。则$\forall u\in U$
于是$a+U\subset b+U$。同理有$a+U\supset b+U$。所以$a+U=b+U$,即2成立。
显然有$2\Rightarrow 3$。假设3成立,则$\exists u_1,u_2\in U$使得$a+u_1=b+u_2$。则
即$3\Rightarrow 1$。循环证明完毕,所以3个命题等价。
定理(3.4.4)说明了两个平行于$U$的仿射子集要么相等,要么交集为空。
定义 3.4.3 仿射子集平行:若两个仿射子集都平行于$U$,则说这两个仿射子集平行。否则称它们相交。
容易证明,平行是仿射子集间的一个等价关系,于是根据定理(0.2.1),我们可以给出向量空间上的一个等价类。
定义 3.4.4 商空间:设$U$是向量空间$V$的子空间,则商空间$V/U$是由那些平行于$U$的仿射子集构成的集合,即
商空间$V/U$是$V$在$U$下所有等价类的集合。
定义 3.4.5 商空间上的加法和数乘:1. $(a+U)+(b+U)=(a+b)+U$;
- $\lambda(v+U)=(\lambda v)+U$。
定理 3.4.5 商空间是向量空间。
证明:封闭性可由上述运算在$V$上的封闭性证明。
交换性。
结合性。
存在加法单位元$0+U$。
存在加法逆元$-a+U$。
存在数乘单位元$1$。
分配律。
定理 3.4.6 $\mathrm{dim}\ V/U=\mathrm{dim}\ V-\mathrm{dim}\ U$。
证明:我们构造这样的一个映射$\pi:V\to V/U$,称为商映射。容易证明商映射是线性映射。$\forall u\in U,u+U=U$,因此$\mathrm{null}\ \pi=U$。易知$\pi$是满的。于是由定理(2.2.4)
即$\mathrm{dim}\ V/U=\mathrm{dim}\ V-\mathrm{dim}\ U$。
§5 对偶向量
5.1 对偶向量
定义 3.5.1 线性泛函:$\mathcal{L}(V,F)$中的元素称为线性泛函。
定义 3.5.2 对偶空间:$\mathcal{L}(V,F)$称为$V$的对偶空间,记作$V’$。
定理 3.5.1 若$V$是有限维的,则它的对偶空间$V’$也是有限维的,且
证明:
定义 3.5.3 对偶基:设$\{\epsilon_{(n)}\}$是$V$的一个基,则它的对偶基是对偶空间$V’$中的元素组$\{\sigma^{(n)}\}$,满足
定理 3.5.2 对偶基是对偶空间的基。
证明:对偶空间的加法单位元是映射$\hat{0}$。设$a_i\sigma^{(i)}=\hat{0}$。设$\{\epsilon_{(n)}\}$是$V$的一个基,则
所以$\{\sigma^{(n)}\}$线性无关。而这个组的长度等于对偶空间的维数,于是它是基。
定义 3.5.4 对偶向量:设$a=a^i\epsilon_{(i)}\in V$,则它的对偶向量是线性泛函$\varphi=\varphi_i\sigma^{(i)}$,满足$a^i=\varphi_i$。其中$\sigma^{(i)}$是$\epsilon_{(i)}$的对偶基。
定理 3.5.4 设$\varphi$是$a$的对偶向量,$\varphi$的坐标是$1\times n$型行矩阵$\varPhi$,满足$\varPhi=X^T$。
定义 3.5.5 对偶空间的对偶空间:$V’’$是$V’$的对偶空间,它的元素定义为
其中的$\varphi\in V’$。
$V’’$当然与$V$同构。而且我们可以找到一个自然的同构映射满足以上定义:$V$上的恒等映射。用一个矢量作用于$V’$中的任意元素,我们都可以得到一个数,那么这个矢量就与$V’’$中的元素等同。“自然”的意思是这个同构映射是不依赖于基的选择的。
但$V$与$V’$之间就找不到。例如我们定义的对偶矢量,我们要先选定一个基,然后我们才能确定$V’$的对偶基,才能给出对偶向量。这个映射是依赖于基的选择的。
因此,我们可以将$V$和$V’’$等同起来,即
定理 3.5.5 $V$的对偶空间的对偶空间是其本身,即
定理 3.5.6 对偶空间的过渡矩阵为$P^{-1}$,其中$P$为$V$中两个基间的过渡矩阵。
证明:设$\{\epsilon_{(n)}\}$和$\{\eta_{(n)}\}$是$V$的两个基,过渡矩阵为$P$;对应的对偶基为$\{\sigma^{(n)}\}$和$\{\pi^{(n)}\}$,过渡矩阵为$Q$。有
于是
所以
即$Q=P^{-1}$。
5.2 对偶映射
定义 3.5.6 对偶映射:若$T\in\mathcal{L}(V,W)$,则它的对偶映射为$T’\in\mathcal{L}(W^*,V’)$
定理 3.5.7 对偶映射有如下性质:$S,T\in\mathcal{L}(V,W),\lambda\in F$
- $(S+T)’=S’+T’$;
- $(\lambda T)’=\lambda T’$;
- $(ST)’=T’S’$
证明:
定理 3.5.8 对偶映射的矩阵与对应线性映射的矩阵相同,即
证明:设$T\in\mathcal{L}(V,W)$,$\{\epsilon_{(n)}\}$是$V$的一个基,$\{\eta_{(n)}\}$是$W$的基;它们的对偶基为$\{\sigma^{(n)}\}$和$\{\pi^{(n)}\}$。对偶映射的矩阵满足
同时有
所以
于是有
第四章 内积空间
§1 内积与范数
1.1 内积
三维空间中的内积指的是矢量间的点积
而在一般的向量空间上,我们将其推广。
定义 4.1.1 内积(dot product):内积是一个映射:$V\times V\to F$作为上述运算的推广,记作$(v,u)\in F,a,b\in V$。这个映射满足:
- $\forall a\in V,(a,a)\geq 0$;
- $\forall a\in V,(a,a)=0$当且仅当$a=0$;
- $\forall a,b,c\in V,(a,c)+(b,c)=(a+b,c)$;
- $\forall a,b\in V,\lambda\in F,( a,\lambda b)=\lambda(a,b)$;
- $\forall a,b\in V,(a,b)=\overline{(b,a)}$。
在定义了内积后,$V$称为内积空间。满足上述要求的内积空间称为酉空间。有些内积空间定义的内积满足的性质与上述的不同。
定理 4.1.1
- $(a,0)=(0,a)=0$;
- $(a,b+c)=(a,b)+(a,c)$;
- $(\lambda a, b)=\overline{\lambda}(a,b)$
证明:
- $\forall a,b\in V,(0,a)=(b-b,a)=(b,a)-(b,a)=0,(0,a)=\overline{(a,0)}=0=(a,0)$。
- $(a,b+c)=\overline{(b+c,a)}=\overline{(b,a)}+\overline{(c,a)}=(a,b)+(a,c)$
- $(\lambda a, b)=\overline{( b,\lambda a)}=\overline{\lambda(b,a)}=\overline{\lambda}(a,b)$
根据内积的定义,我们可以构造一个线性泛函$T:b\in V,\forall a\in V,Ta=(b,a)\in F$。证明从略。
定义 4.1.2 正交(orthogonality):正交是内积空间中两个向量间的一个关系。若对于$a,b\in V$,有$(a,b)=0$,则说向量$a,b$正交,记作$a\perp b$。
1.2 范数
三维空间中的矢量具有“长度”这一特征量,或称为“模”:
范数正是这一概念的推广,它赋予每个向量“长度”这一概念。
定义 4.1.3 范数(norm):范数是一个函数$||\cdot||:V\to R$,向量的范数记作$||a||$。它满足:
- $\forall a\in V,||a||\geq 0$;
- $\forall a\in V,\lambda \in F,||\lambda a||=|\lambda|\ ||a||$;
- $\forall a,b\in v,||a+b||\leq|a|+|b|$,$a$是$b$的正实数倍时取等。
其中第三个条件称为三角不等式。定义有范数的向量空间称为赋范空间。
如果向量空间上定义有内积,那么通常可以定义对应的范数。
定义 4.1.4 内积空间上的范数:$\forall a\in V,||a||=\sqrt{(a,a)}$。
证明:验证上述定义确实是一个合适的范数。
- $(a,a)\geq 0,||a||=\sqrt{(a,a)}\geq 0$;
- $||\lambda a||=\sqrt{(\lambda a,\lambda a)}=\sqrt{\lambda \overline{\lambda}}\sqrt{(a,a)}=|\lambda|\ ||a||$;
所以$||a+b||\leq||a||+||b||$。其中第二个不等号的成立依赖于称为柯西-施瓦茨不等式的定理。该定理的证明见下文。$b$是$a$的正实数倍,设$b=\lambda a,\lambda>0$,则
这样定义的范数称为由内积诱导的范数。但范数不一定可以诱导出内积,除非这个范数满足如下等式:
定理 4.1.2 平行四边形等式:$a,b\in V$
为什么有这个条件范数就可以诱导出内积的证明从略。下面证明由内积诱导出的范数(由于我们后面用到的范数都是由内积诱导出的范数,所以以下简称范数)满足平行四边形等式。
证明:
除了平行四边形等式之外,范数还满足几个(不)等式。
定理 4.1.3 勾股定理:和它的名字一致,这个定理正是一般的勾股定理的推广。设$a,b\in V,a\perp b$,则有
证明:设$a \perp b$,则
定理 4.1.4 柯西-施瓦茨不等式:设$a,b\in V$,则有
当$a$是$b$的实数倍时取等。
证明:在证明这个不等式之前,先介绍正交分解的操作。设$a,b\in V,b\neq 0$。令$k=\frac{(a,b)}{||b||^2},c=a-kb$,则有$a=kb+c$且$(b,c)=0$,因为
于是
定理 4.1.5 里斯表示定理:设$V$是有限维酉空间,$\varphi\in V’$。则存在唯一的向量$a\in V$使得$\forall b\in V$有
1.3 度量
三维空间中两点的距离为
度量是这一概念的推广,它赋予向量空间“距离”。
定义 4.1.5 度量:设$a,b\in V$,度量是函数$d(a,b):V\times V\to R$,满足
- $d(a,b)\geq 0$;
- $d(a,b)=d(b,a)$;
- $d(a,b)\leq d(a,c)+d(c,b)$,当$a-c$是$c-b$的实数倍时取等。
第三个条件也称为三角不等式。
赋范空间中可以自然诱导度量。
定义 4.1.6 赋范空间空间中的度量:$\forall a,b\in V,d(a,b)=||a-b||$。
证明:验证上述度量的定义是合适的。
- $d(a,b)=||a-b||\geq 0$。
- $d(a,b)=||a-b||=|-1|\ ||b-a||=||b-a||=d(b,a)$。
由内积自然诱导出范数后,可以再诱导出内积空间的度量。
定义 4.1.7 内积空间上的度量:$\forall a,b\in V,d(a,b)=||a-b||=\sqrt{(a-b,a-b)}$。
设$\{\epsilon_{(i)}\}$为内积空间的一个基,向量$a,b$在这个基下的坐标矩阵为$A,B$,则内积可写为
其中的矩阵$G$称为内积空间在这个基下的度规矩阵
1.4 标准正交基
定义 4.1.8 标准正交组:标准正交组是由范数为1、互相正交的向量构成的组。即
推论 4.1.5 设向量$a=a^i\epsilon_{(i)}$,其中的$\epsilon_{(i)}$为标准正交组,则有
证明:反复使用勾股定理
定理 4.1.6 正交组都是线性无关组
证明:设$\{\epsilon_{(i)}\}$是一个标准正交组,设$a^i\epsilon_{(i)}=0$。则$(a^i\epsilon_{(i)},\epsilon_{(i)})=a^i(\epsilon_{(i)},\epsilon_{(i)})=a^i||\epsilon_{(i)}||^2=0$,所以该正交组是线性无关组。
定义 4.1.8 标准正交基:一个长度为$\mathrm{dim}V$的标准正交组构成内积空间$V$的一个基,称为标准正交基。
推论 4.1.7 一个向量在标准正交基下的可写为
证明:设$a=a^i\epsilon_{(i)}$,则$ (a,\epsilon_{(i)})=a^i(\epsilon_{(i)},\epsilon_{(i)})=a^i $。
在标准正交基下,内积具有简单的形式。设$a=a^i\epsilon_{(i)},b=b^j\epsilon_{(j)}$,则
因此标准正交基下的度规矩阵是单位矩阵。
1.5 格拉姆-施密特正交化过程
对于向量空间内任意一个基,可以通过格拉姆-施密特正交化过程构造出一个标准正交基。过程如下。
对基$\{a_{(i)}\}$,第一步,先构造正交基$\{b_{(i)}\}$,再进行标准化。
再进行标准化:$\epsilon_{(i)}=\frac{b_{(i)}}{||b_{(i)}||}$。则$\{\epsilon_{(i)}\}$是一个标准正交基。
证明:仅证明$b_{(i)}$与$b_{(j)}(i>j)$正交。
推论 4.1.8 每个有限维内积空间都有标准正交基
证明:有限维内积空间都有一个基,对其使用标准正交化过程即得一个标准正交基。
推论 4.1.9 每个标准正交组都可以扩充为一个标准正交基
证明:每个标准正交组都是线性无关组,而线性无关组都可以扩充为一个基,对这个基使用标准正交化过程即得一个标准正交基。而标准正交化过程对标准正交组无影响,则该标准正交基包含原标准正交组,即由原标准正交组扩充而成。
1.6 标准正交基间的基变换
设有两组标准正交基$\{\eta_{(i)}\},\{\epsilon_{(i)}\}$,它们之间满足
$P_i^{\ \ j}$为二者的基变换。易得基变换的矩阵表示在基$\{\epsilon_{(i)}\}$下写为
§2 正交补
2.1 正交补
2.2 正交投影
§3 欧氏空间
3.1 欧式空间
定义 4.3.1 欧氏空间:定义在实数域上的酉空间称为欧氏空间。
3.2 正交变换
3.3 正交变换群
3.4 对称变换
§4 闵可夫斯基空间
4.1
§5 辛空间
5.1
§6 希尔伯特空间
6.1
第五章 算子的本征值
§1 本征值
1.1 不变子空间
定义 5.1.1 不变子空间:设$U$是向量空间$V$的子空间,$T\in\mathcal{L}(V)$。若$\forall u\in U$,有$Tu\in U$,则称$U$为$T$的一个不变子空间。定义域限制在$U$上的对应算子称为$T$的限制算子。
定义 5.1.2 一维不变子空间:任取$V$中的一个非零向量$v$,$U=\mathrm{span}(v)$是$V$的一维子空间。设$T\in\mathcal{L}(V)$,若$U$在$T$下不变,则称$U$为$T$的一维不变子空间。则有
1.2 本征值
定义 5.1.3 本征值:设$T\in\mathcal{L}(V)$,若存在$\lambda\in F,v\in V$使得
则称$\lambda$为算子$T$的一个本征值,$v$为$T$对应这个本征值的本征向量。
定理 5.1.1 下列命题等价:
- $\lambda$是$T$的本征值;
- $T-\lambda I$不是单的;
- $T-\lambda I$不是满的;
- $T-\lambda I$不是可逆的;
证明:设1成立,则有
由于$v\neq 0$,所以$T-\lambda I$不是单的,$1\Rightarrow 2$。若$T-\lambda I$不是单的,于是存在非零向量使得$(T-\lambda I)v=0$成立,则$\lambda$是$T$的一个本征值。所以1和2等价。根据定理(3.3.5)可知,2、3、4等价,于是1、2、3、4等价。
推论 5.1.2 $v$是$T$的相应于$\lambda$的本征向量当且仅当$v\in \mathrm{null}\ (T-\lambda I)$。
定理 5.1.3 相应于不同本征值的本征向量线性无关。
证明:设$T\in \mathcal{L}(V),\lambda_1,\cdots,\lambda_m$是$T$的$m$个本征值,$v_1,\cdots,v_m$是相应于不同本征值的本征向量。
假设$v_1,\cdots,v_m$线性相关,
§3 算子的多项式
§4 本征空间
§5 对角化
第六章 内积空间上的算子
§1 伴随与厄米算子
§2 正规算子
§3 谱定理
§4 正算子
§5 等距同构
§6 极分解
§7 奇异值分解
第七章 复向量空间上的算子
§1 算子幂的零空间
§2 广义本征向量
§3 幂零算子
§4 复向量空间上算子的刻画
§5 若尔当形
第八章 实向量空间上的算子
§1 复化
§2 实向量空间上的正规算子
第九章 线性代数
§1 双线性函数
§2 二次型
§3 正定二次型
§4 厄米型
§5 多重线性映射
§6 张量积
§7 张量
§8 外代数
§9 克利福德代数
§10 格拉斯曼代数
第十章 线性方程组
§1 线性方程组
1.1 线性方程组的基本概念
含$m$个方程和$n$个未知数的线性方程组的基本形式是
若所有的$b_i=0$,则称为齐次方程组,否则称为非齐次方程组。
线性方程组的解为一个列向量$[c_1\ \cdots\ c_n]^t$,将其代入后方程变为恒等式。线性方程组的解的全体称为解集。齐次方程组有一个平庸解:所有$x_i=0$,后面的讨论不再特别指出。如果两个线性方程组的解集相同,那么称它们为同解方程组。
我们想问的是下面三个问题:
- 对于一个线性方程组,它有没有解?有解或无解的条件是什么?
- 如果方程有解,那么它有几个解?如何求解?
- 当解不只一个时,不同解之间的关系是什么?
用矩阵可以简化线性方程组的记法。
定义 10.1.1 系数矩阵:$m\times n$型矩阵
称为线性方程组$(1)$的系数矩阵。
将未知数和非齐次项写为$X=[x_1\ \cdots \ x_n]^t$和$b=[b_1\ \cdots\ b_m]^t$,那么方程组$(1)$可以写为
定义 10.1.2 增广矩阵:线性方程组$(1)$的增广矩阵为
定理 10.1.1 线性方程组有解的充要条件是列向量$b$可以写为系数矩阵$A$的列向量的线性组合。
证明:将$AX=b$按$A$的列展开
因此如果方程组存在解,$b$就可以写为$A$的列向量的线性组合。反过来也一样。
1.2 Gauss消元法
我们很早就熟悉线性方程组,例如二元一次方程组、三元一次方程组等等。而我们最常用的方法就是消元法。即通过下面三种操作:
- 交换两个方程的位置;
- 用非零的数乘某一个方程;
- 用一个数乘某一方程后将其加到另一个方程上,
之后将某一个方程化为一元一次方程后解出这个未知数。上面这三种操作称为线性方程组的初等变换。
定理 10.1.2 初等变换将线性方程组变为一个同解方程组。
证明:注意到线性方程组的初等变换对应着系数矩阵和常数矩阵的行初等变换。设变换后的线性方程组的系数矩阵为$A’=EA$,常数矩阵为$b’=Eb$,其中$E$为初等矩阵。设$C$为一个解,那么有
于是$C$也是方程组$A’X=b’$的解,即两个方程组是同解的。
将增广矩阵化作行标准型,对应的同解方程组是较为好解的。这个过程称为Gauss消元法。