在线性代数中,我们花了3篇讲解(双)线性函数的相关结论。这里我想把核心内容再阐述一遍,在忽略一些细节的同时,希望对整体结构有更深刻的理解。需要注意的是,这里双线性函数只是起点,后面的内积、酉变换、正规变换,都在不断地打破和拓展之前的概念,最终还是为了讨论特殊线性变换的标准型。

1. 双线性函数

1.1 双线性函数与正交

  在有了双线性函数的定义后,可知在任意选定的一组基下,双行线函数\(f\)可由其度量矩\(A\)完全确定。站在矩阵的角度,相关概念也变得更加直观。比如固定左向量\(\alpha\)而得到的线性函数\(\alpha_L\),可以对应到\(A\)的行向量的线性组合(系数为\(\alpha\)坐标)。而全体\(\alpha_L\)组成的线性函数空间\(W_L\),则同构于\(A\)的行向量生成的线性空间。那些使得\(\alpha_L=0\)的全体\(\alpha\)(双线性函数的左根\(\text{rad}_Lf\)),则同构于\(\alpha A=0\)的解空间。对应右边的向量\(\beta\),也有定义\(W_R\)和右根\(\text{rad}_Rf\)。当\(A\)满秩时,左右根皆为空,这时称双线性函数是非退化的。

  不同基下的度量矩阵\(A,B\)也不相同,并且与两组基的变换矩阵\(P\)有关系式\(B=PAP'\),这样的矩阵\(A,B\)称为合同矩阵。反之,同一组基下度量矩阵合同的变换,可以认为是同构的。为了讨论同构意义下双线性函数空间的结构,我们熟悉的方法是“不变”子空间的分割,为此还要规定式(1)左的正交性。可以证明,满足正交性的双线性函数必然是对称或反对称的,即\(A=A'\)或\(A=-A'\)。而双线性函数空间\(T_2(V)\)是对称\(S_2(V)\)和反对称\(A_2(V)\)双线性函数空间的直和,故而有些讨论可以集中在后两个空间上。

\[f(\alpha,\beta)=0\;\Leftrightarrow\;f(\beta,\alpha)=0\;\Leftrightarrow\;\alpha\perp\beta\tag{1}\]

  正交性自然地引出了向量或子空间正交补(子空间)\(\alpha^\perp,\,W^\perp\)的概念。然后根据线性方程组的理论,容易推导\(W,W^\perp\)维度之间的关系(行列向量维数与解空间的关系)。特别地有,双线性函数的左右根相同,可以记作\(V^\perp=\text{rad}\,f\)。还有如果\(f\)在子空间\(W\)下非退化,易证\(W\)和\(W^\perp\)无交集、且维度之和是\(n\),从而它们是\(V\)的正交分割(式(2))。

\[\text{rad}\,f|_W=0\;\Rightarrow\;W\oplus W^\perp=V\tag{2}\]

  式(2)可直接用于对称和反对称双线性函数(矩阵)的标准型讨论上。若是对称矩阵,先任选\(f(\alpha,\alpha)\neq 0\),根据式(2)先将\(V\)分解成\(\alpha\oplus\alpha^\perp\),然后依此继续分解\(\alpha^\perp\),直至剩下一个\(\text{rad}\,f\)。在选定的基下(根空间任意选),函数的度量矩阵是一个对角矩阵(合同标准型)。再看反对称矩阵,先任选\(f(\alpha,\beta)=1\),根据式(2)从\(W=\left<\alpha,\beta\right>\)开始正交分解,最终得到\(\begin{bmatrix}0&1\\-1&0\end{bmatrix}\)和\(0\)组成的分块对角矩阵。

  合同矩阵的秩是不变的,对称矩阵和反对称矩阵的秩在标准型上有明显的表现。反对称矩阵的秩一定是偶数,且标准型在任何域上的形式都是最简的。对称矩阵在不同域上还可以进一步讨论,以下先假定它的秩为\(r\)。在复数域上,通过调整基的系数,可得到标准型\(\text{diag}\{I_r,0_{n-r}\}\)。在实数域上则可以得到标准型\(\text{diag}\{I_p,-I_q,0_{n-r}\}\),其中\(p+q=r\)。依次记三个子空间为\(V^+,V^-,V^\perp\),注意前两者并不唯一,而后者就是根空间。另外不难证明,任何“正”子空间都与\(V^-\oplus V^\perp\)无交集,这就可以证得:\(p,q\)在任何标准型中都是一样的(惯性定律),它们被称为正(负)惯性指数

1.2 内积与酉空间

  实数域(或其子域)有更多实际的场景,把函数限定在实数域上还可以度量线性空间。为了引出长度的概念,还要对函数增加一个限定,即有\(f(\alpha,\alpha)>0\)恒成立。这时\(f\)只能选择对称函数,且正惯性指数就是\(n\)(称为正定的),这样的函数也叫内积,记作\(\alpha\cdot\beta\)。引入内积后的实线性空间也叫欧几里得空间。接下来自然就是定义向量的长度\(\left\|\alpha\right\|\)、距离\(d(\alpha,\beta)\)、角度(式(3)),以及得到三角不等式勾股定理(式(4,5),这里不再重复讲述。

\[\theta=\arccos{\frac{\alpha\cdot\beta}{\left\|\alpha\right\|\cdot\left\|\beta\right\|}}\tag{3}\]

\[\left|\:\left\|\alpha\right\|-\left\|\beta\right\|\:\right|\leqslant\left\|\alpha+\beta\right\|\leqslant\left\|\alpha\right\|+\left\|\beta\right\|\tag{4}\]

\[\left\|\alpha\right\|^2+\left\|\beta\right\|^2=\left\|\alpha+\beta\right\|^2\tag{5}\]

  有时候也需要在复数域空间上定义度量的概念,但双线性函数显然不能满足要求,这时要将实内积的定义进行扩展。首先第一元仍然是线性的,然后交换变量满足式(6)左的Hermite性(可推导出第二元的半线性)。这样的二元函数在选定的基下也有式(6)右的合同矩阵(共轭对称矩阵),同样也能定义正交性以及解析其标准合同矩阵。最后如果加上正定性的要求,这样的二元函数就是复内积,或简称内积。引入内积后的复线性空间也叫酉空间,其上也可以定义长度(模)、距离、角度,以及有三角不等式和勾股定理。

\[f(\beta,\alpha)=\overline{f(\alpha,\beta)}\;\Rightarrow\;A'=\overline{A}\tag{6}\]

  Hermite性可以兼容实空间的线性,且复内积也是兼容实空间的实内积的,进而酉空间其实是阿基米德空间的母空间。所以如果不特别强调,以下我们都在复数域上讨论。另外,在定义了正交的空间中(不限定为内积),如果二元函数是非退化的,则使用Schmidt正交化总可以找到一组正交基。在内积空间中,还可以找到单位向量组成的标准正交基,这时内积空间同构于向量对于基的系数组成的坐标空间,而内积就等于坐标向量的内积(式(7))。

\[\alpha\cdot\beta=x_1\overline{y_1}+x_2\overline{y_2}+\cdots+x_n\overline{y_n}\tag{7}\]

1.3 正规变换与对角化

  在内积限制下的线性变换(映射)比较常见,这里有必要讨论一下它的标准型。首先限定变换下向量间的距离是不变的(保距变换),不难证明它是一个双射的线性变换,而且等价于:将一组标准正交基变换为另一组标准正交基。也就是说变换矩阵满足\(P\overline{P'}=I\),这样的矩阵叫酉矩阵(实数域下叫正交矩阵),这样的变换则叫酉变换(实数域叫正交变换)。酉矩阵是名副其实的“单位矩阵”,它的行列式的模为1(利用特征式),所有特征值的模也为1(利用单位向量的变换),所有行(列)向量是正交的单位向量。

  当我们讨论酉变换\(A\)(酉矩阵)的标准型时,其实并不一定有内积空间的定义,但如果补齐这部分定义,就能利用其独有的结构特点。正交性可以使空间分割变得非常方便,结合线性变换需要的\(A\)-子空间,容易想到去寻找一组正交的特征向量。先随意找到一个特征向量\(\eta\),并生成\(A\)-子空间\(W\),容易证得\(V=W\oplus W^\perp\)。接下来利用双射性可知\(W^\perp\)也是\(A\)-子空间(式(8),这一步不可缺少),从而可以在\(W^\perp\)中继续寻找特征向量,最终得到式(9)的标准型。由于寻找的特征向量是正交的,\(P\overline{P'}\)一定是一个对角矩阵,如果把特征向量单位化,\(P\)也可以是酉矩阵。

\[\alpha\cdot A\beta=A\alpha'\cdot A\beta=\alpha'\cdot\beta=0\tag{8}\]

\[PAP^{-1}=\text{diag}\,\{\lambda_1,\lambda_2,\cdots,\lambda_n\}\tag{9}\]

  任意变换矩阵\(A\)都定义在某组基下,如果将这组基定义为标准正交基,该定义便可扩展成整个域上的内积空间。刚才我们看到了正交在对角化中的作用,现在来继续榨取这个工具的威力,把对角化的范围尽量扩大。值得提醒的是,这里的讨论需借助内积的概念,因此线性空间被限定在数域上,对角化也只讨论正交对角化。现在回顾上面的讨论,最关键的一个条件是:如果\(W\)是\(A\)-子空间,则\(W^\perp\)也是\(A\)-子空间。为此就要有\(\alpha\cdot A\beta=\alpha'\cdot\beta\),其中\(\alpha,\alpha'\in W;\;\beta\in W^\perp\)。如果不限定向量的范围,等式中的\(\alpha'\)总是有解的,记\(A^*:\alpha\rightarrow\alpha'\),不难证明它是线性变换,且满足\(A^*=\overline{A'}\),它也称为\(A\)的伴随变换

  伴随变换的矩阵关系\(A^*=\overline{A'}\),使得它的定义可以更加自由灵活,比如教材上一般定义为\(A\alpha\cdot\beta=\alpha\cdot A^*\beta\)。这里还会发现一个简单事实,如果\(W\)是\(A\)-子空间,那么\(W^\perp\)就是\(A^*\)-子空间。想要从特征空间\(W=\left<\eta\right>\)开始构造对角化,就要证明\(W^\perp\)是\(A\)-子空间,这也等价于\(W\)是\(A^*\)-子空间。不过在此之前,我们先从\(A\)可正交对角化出发,看看变换还有什么必要条件。记正交对角化\(A=PDP^{-1}\),则有\(A^*=P\bar{D}P^{-1}\),这时\(AA^*=A^*A\)。 反之,可交换性使得\(A,A^*\)能像标量一样在表达式里“自由穿梭”,比如容易有\(\left\|A\alpha\right\|=\left\|A^*\alpha\right\|\),更一般的还有\(\left\|f(A)\alpha\right\|=\left\|f(A^*)\alpha\right\|\)。

  特别地,则有我们需要的\(\left\|(A-\lambda I)\alpha\right\|=\left\|(A^*-\overline\lambda I)\alpha\right\|=0\),即\(W\)是\(A^*\)-子空间。综合这两段的讨论便有,数域上的线性变换\(A\)可正交对角化的充要条件是:\(A\)有\(n\)个特征值且\(AA^*=A^*A\)(或式(10)的等价条件),满足式(10)的变换也称为正规变换。然后就可以构造一些常见的正规变换,比如上面讨论的酉变换,再比如复数域上的共轭对称变换\(A=\overline{A'}\),也被称为Hermite变换,实数域上就是熟知的对称变换。酉变换和Hermite变换天然有\(n\)个特征值,而注意到Hermite变换的特征值都是实数,所以对称变换也有\(n\)个特征值(放到复数域看),它们都可以正交对角化。

\[AA^*=A^*A\;\Leftrightarrow\;\left\|A\alpha\right\|=\left\|A^*\alpha\right\|\tag{10}\]

2. 多重线性函数

(暂且搁置)