Shur定理

在研究一个数学对象时,我们经常会对它进行分类。比如我们通常把数分为:实数,虚数;实数又分成有理数,无理数;当然也有按照正负来分的。还有整数分成素数(也叫质数)和合数,等等。现在我们谈谈矩阵的分类,以下默认矩阵是方的。

数学中分类一般是按照等价关系划分等价类的。

所谓等价关系其实就是满足反身性,对称性,传递性的二元关系(总结一下我们等于号的全部性质就知道了)
矩阵中最常见的三种等价关系分别是

  1. 相抵等价—初等变换
  2. 合同等价—合同变换
  3. 相似等价—相似变换

相抵等价完全由秩确定,合同变换我们一般只针对实对称矩阵处理。相似变化是我们讨论最多的也是最复杂的,我们总想把复杂的东西变简单,对于一个矩阵我们总想做变换把它变成最简单形式(称为标准型),相抵等价的标准型和对称矩阵合同等价的标准型都十分简单,但是很不幸的也是最幸运的是,并非所有的矩阵都可以相似于对角阵,相似变换标准型称为若尔当标准型,以纪念若尔当对矩阵相似变换所做的贡献。

然而今天主题并不是上面的任何一种,而是由伟大的数学家Issai Schur提出的酉相似,酉变换的概念和相应定理。

任意复方阵酉相似于上三角矩阵

酉矩阵和酉相似

一个矩阵称为酉矩阵,如果它的共轭转置是它的逆。
复矩阵A与B称为酉相似的,如果存在酉矩阵U使得$B=U^ AU$
这里$U^
$表示U的共轭转置。

定理1. 对任意复方阵A,存在酉矩阵U使得
$$A = U \left( \begin{matrix} \lambda_1 & * & * & * \\ & \lambda_2 & * & * \\ & & \ddots & * \\ & & & \lambda_n \end{matrix} \right)U^*$$

其中 $\lambda_1,\lambda_2,\cdots,\lambda_n$ 为A的全部特征值。
Proof:设 $\alpha_1$ 是A的特征值 $\lambda_1$ 对应的特征向量,将 $\alpha_1$ 扩充为$\mathbf{C}^n$的一组标准正交基 $P=(\alpha_1,\alpha_2,\cdots,\alpha_n)$ ,则$A = P \left( \begin{matrix} \lambda_1 & * \\ \mathbf{0} & B \end{matrix} \right)P^*$ 。对复矩阵的阶数应用数学归纳法,存在n-1阶酉矩阵Q使得
$$B = Q \left( \begin{matrix} \lambda_2 & * & * \\ & \ddots & * \\ & & \lambda_n \end{matrix} \right)Q^*$$
因此
$$A = U \left( \begin{matrix} \lambda_1 & * & * & * \\ & \lambda_2 & * & * \\ & & \ddots & * \\ & & & \lambda_n \end{matrix} \right)U^*$$
其中$U = P \left( \begin{matrix} 1 & \\ & Q \end{matrix} \right)$是n阶酉矩阵。证毕。

矩阵酉相似于对角阵当且仅当它是正规矩阵

正规矩阵

矩阵A称为正规矩阵(normal matrix),如果$ A^ A=AA^ $。显然酉矩阵,Hermite阵,反Hermite阵都是正规矩阵。
定理2(Issai Schur)矩阵A酉相似于对角阵的充分必要条件是A是正规矩阵。
Proof:必要性显然,下证明充分性,
由定理1知,存在酉矩阵U使得:

$$A = U \left( \begin{matrix} \lambda_1 & * & * & * \\ & \lambda_2 & * & * \\ & & \ddots & * \\ & & & \lambda_n \end{matrix} \right)U^*$$

若A是规范矩阵,则
$$A^* A = U \left( \begin{matrix} \overline{\lambda_1} & & & \\ * & \overline{\lambda_2} & & \\ * & * & \ddots & \\ * & * & * & \overline{\lambda_n} \end{matrix} \right) \left( \begin{matrix} \lambda_1 & * & * & * \\ & \lambda_2 & * & * \\ & & \ddots & * \\ & & & \lambda_n \end{matrix} \right)U^* = U \left( \begin{matrix} \lambda_1 & * & * & * \\ & \lambda_2 & * & * \\ & & \ddots & * \\ & & & \lambda_n \end{matrix} \right) \left( \begin{matrix} \overline{\lambda_1} & & & \\ * & \overline{\lambda_2} & & \\ * & * & \ddots & \\ * & * & * & \overline{\lambda_n} \end{matrix} \right) U^* =AA^*$$
因此
$$\left( \begin{matrix} \overline{\lambda_1} & & & \\ * & \overline{\lambda_2} & & \\ * & * & \ddots & \\ * & * & * & \overline{\lambda_n} \end{matrix} \right) \left( \begin{matrix} \lambda_1 & * & * & * \\ & \lambda_2 & * & * \\ & & \ddots & * \\ & & & \lambda_n \end{matrix} \right) = \left( \begin{matrix} \lambda_1 & * & * & * \\ & \lambda_2 & * & * \\ & & \ddots & * \\ & & & \lambda_n \end{matrix} \right) \left( \begin{matrix} \overline{\lambda_1} & & & \\ * & \overline{\lambda_2} & & \\ * & * & \ddots & \\ * & * & * & \overline{\lambda_n} \end{matrix} \right)$$
考虑矩阵两端(1,1)位置得到
$$\overline{\lambda_1}\lambda_1 = \lambda_1 \overline{\lambda_1}+\sigma^2$$
其中$ \sigma^2 $是上三角矩阵
$$\left( \begin{matrix} \lambda_1 & * & * & * \\ & \lambda_2 & * & * \\ & & \ddots & * \\ & & & \lambda_n \end{matrix} \right)$$
的第一行的非对角元绝对值之平方和,因此由$ \sigma^2 $可知上三角矩阵的第一行非对角元全为0,类似的考察矩阵两端(2,2)的位置,一直到(n,n)的位置即可知道上面矩阵是对角阵,证毕。

上述定理给出了酉相似于对角型的充分必要条件,而且条件十分易于判断。整个过程简洁优美。另外由于酉矩阵条件数恒定为1,有其数值稳定性,因此经常用于实际计算中,例如QR方法涉及的两个矩阵变换Househoulder变换和Givens变换都是酉变换。