Cayley-Hamilton定理
在线性代数当研究一个特定的矩阵时,人们通常对这个矩阵所满足的多项式关系感兴趣。例如,矩阵\[A = \begin{pmatrix} 1 & 2\ \ 3 & 1 \end{pmatrix}\]满足\(A^2 - 2A= 5I\),其中\(I\)表示\(2\)-by-\(2\)单位矩阵:\[A^2 - 2A= \begin{pmatrix} 7 & 4 \\ 6 & 2\ end{pmatrix} = \begin{pmatrix} 5 & 0 \\ 0 & 5 \end{pmatrix} = 5I。知道这种关系在矩阵计算(例如矩阵的计算能力)中是有用的,以及在研究特征值和特征向量矩阵的。
的Cayley-Hamilton定理产生一个由给定矩阵满足的显式多项式关系。特别地,如果\(M\)是一个矩阵,\(p_{M} (x) = \det(M- xi)\)是它的特征多项式时,Cayley-Hamilton定理指出\(p_{M} (M) = 0\)。
动机
考虑上面介绍中给出的矩阵A。假设有人想计算它的四次方\(A^{4}\)。这可以通过使用多项式关系\(A^2 - 2A = 5I\)作为表达式中约简指数的方法来实现:\[A^{4} = (2A+5I) ^2 = 4A^2 + 20A + 25I = 4(2A+5I) + 20A + 25I = 28A + 45I。更一般地,可以使用递归式\(A^n = 2A^{n-1} +5A^{n-2}\)将\(A\)的任意次幂写成\(A\)和\(I\)的整数线性组合。
至少为了做这样的计算,我们有兴趣找到一个给定矩阵所满足的多项式。在符号中,对于一个矩阵\(M\),我们寻找多项式\(p(x)\)使\(p(M) = 0\)。注意这里,\(p(M)\)本身就是a矩阵,不是数字;这个表达式中的\(0\)表示元素都为零的矩阵。
找到一个由\(n\)-by \(n\)矩阵\(M\)满足的多项式的一种方法是利用向量空间所有\(n\)-by-\(n\)矩阵集合上的结构。设\(M_n (F)\)表示有a项的\(n\)-by-\(n\)矩阵的向量空间场\(F\)(例如,\(F\)可以是实数\(\mathbb{R}\)或复数\(\mathbb{C}\))。由于\(n\)-by-\(n\)矩阵有\(n^2\)项,空间\(M_n (F)\)具有维数\(n^2\)。这意味着矩阵\(1,M, M^2, \ldots, M^{n^2}\)是线性依赖于\(F\)的(因为在这个集合中有\(n^2 + 1\)矩阵)。因此,有\ F (ai \ \) \ (0 le n ^ 2 \ le我\ \),\ [a_0 + a₁M + a₂M ^ 2 + \ cdots +现代{n ^ 2} M ^ {n ^ 2} = 0。因此,\(M\)满足多项式\(q(x) = a_0 + a_1 x + \cdots + a_{n²}x^{n²}\)。
然而,这种方法的不足之处在于它是非建设性;系数\(a_i\)显示存在,但不产生/计算。另一方面,Cayley-Hamilton定理是有建设性的;\(M\)满足一个显式且易于计算的多项式,即\(M\)的特征多项式。这个多项式是\[p_{M} (x) = \det(M - x \cdot I),\],而Cayley-Hamilton定理指出\(p_{M} (M) = 0\)。证明这是不就像做替换\(p_{M} (M) = \det(M - M \cdot I) = \det(0) = 0\)一样简单,因为特征多项式定义中的变量\(x\)表示一个数字,而不是一个矩阵。
假设\(M\)在\(\mathbb{C}\)中有条目的证明
假设\(M\)是一个\(n\)-by-\(n\)矩阵。当\(M\)在\(\mathbb{C}\)中有项时,可以证明Cayley-Hamilton定理如下:
一个矩阵\(M \in M_n (\mathbb{C})\)被调用对角化的如果存在可逆\(B \in M_n (\mathbb{C})\)使\(BMB^{-1}\)为对角线。回想一下对角矩阵是一个矩阵,其中主对角线(从左上到右下的对角线)以外的所有元素都为零。对角矩阵有一个非常简单的乘法结构;当两个对角线矩阵相乘时,两个主对角线上的元素按项相乘。特别地,我们可以看到为什么对角线矩阵应该满足它自己的特征多项式:主对角线上的每一项都是矩阵的特征值。因此,它遵循任何可对角化矩阵也满足其自身的特征多项式,因为\[0 = p(BMB^{-1}) = Bp(M)B^{-1} \暗示p(M) = 0。因此,Cayley-Hamilton的证明通过用可对角化的矩阵近似任意矩阵来进行(当矩阵的项是复杂的时,这将是可能的,利用代数基本定理).要做到这一点,首先需要一个矩阵对角化的准则:
引理:如果\(M\in M_{n} (\mathbb{C})\)有\(n)个不同的特征值,则\(M\)是可对角化的。
假设特征多项式\(p_{M} (x)\)的根都是不同的,即特征值\(\lambda_i\)和\(1\le i\ le n\)对\(i \neq j\)有\(\lambda_i\ neq \lambda_j\)。设\(v_i\)表示与\(\lambda_i\)相关的特征向量。
假设有\(a_i \in \mathbb{C}\)的系数\[a_1 v_1 + \cdots + a_n v_n = 0。\]对这个方程应用\(M^k \),得到关系\[a_1 \lambda_{1}^{k} v_1 + \cdots + a_n \lambda_{n}^{k} v_n = 0。\]为\(j\neq i\)选择一个多项式\(q_i (\lambda_i) = 1\和\(q_i (\lambda_j) = 0\)(例如,使用拉格朗日插值).上述方程隐含\(a_i q_i (\lambda_i) v_i = 0\隐含a_i = 0\)。因此,特征向量\(\{v_i\}\)是线性无关的。
由于有\(n\)个特征向量,集合\(\{v_i\}\)必然形成a基础对于向量空间\(\mathbb{C}^n\)。在此基础上,对应\(M\)的线性变换的矩阵是对角线的。设\(B\)表示将\(v_i\)发送到\(i^\text{th}\)标准基向量\(\big(\)即。\ cdots \ ((0, 0, 1, 0 \ cdots, 0), \) \中\(1 \)是(我^ \文本{th} \)槽\大)(\ \)然后\ (BMB ^{1} \)是斜的,。
推论:如果\(M\ in M_n (\mathbb{C})\),对于任意\(\epsilon > 0\),存在一个可对角矩阵\(N\ in M_n (\mathbb{C})\),使得\(M\)中的项在\(\epsilon\)中对应项的范围内。
\(p_{M} (x)\)的根是\(M\)中的项的连续函数。因此,对这些项进行任意小的扰动就足以使所有这些根都是不同的。这个推理之所以有效,是因为代数基本定理,它保证了\(p_{M} (x)\)的所有根都在\(\mathbb{C}\)中。
为了完成证明,让\(\{N_k\}_{k\in\mathbb{N}} \)是一个可对角化的矩阵序列,收敛到\(M\)(其中收敛是矩阵入口)。由于\(p_{N_k} (N_k) = 0\)对于所有\(k\ in \mathbb{N}\)和\(N \mapsto p_{N}(N)\)作为矩阵项的函数是连续的,取\(k\to\infty\)意味着\(p_{M} (M) = 0\),这是Cayley-Hamilton定理的结果。
例子和问题
证明一个\(2\)-by-\(2\)矩阵的逆由下式给出:
\[开始\ {pmatrix} & b \ \ c & d \ {pmatrix}结束^{1}= \压裂{1}{ad-bc} \ d {pmatrix}开始& - b \ \ - c & \ {pmatrix}结束。\]
设\(A\)表示给定矩阵;其特征多项式\ [p_{一}(x) = (ax) (dx)公元前= x ^ 2 - (+ d) x + (ad-bc)。\]由Cayley-Hamilton定理可知,\ [A^2 - (A +d)A + (ad-bc) I = 0,\]其中\(I)是\(2\)- By -\(2\)单位矩阵。因此,\[一个\大((+ d) I - \大)= (ad-bc)我\意味着^{1}= \压裂{1}{ad-bc} \大((+ d) I - \大)= \压裂{1}{ad-bc} \ d {pmatrix}开始& - b \ \ - c & \结束{pmatrix} \ _ \广场\]。
设\(M\)是一个\(n\)-by-\(n\)矩阵。\(M\)被称为幂零如果存在某个整数\(k\)使得\(M^k = 0\)。证明如果\(M\)是幂零的,则\(M^n = 0\)。
假设\(v\)是\(M\)的非零特征向量,其特征值为\(\lambda\)。那么\[0 = M^k v = \lambda^k v \意味着\lambda = 0。由于(度\(n\))特征多项式\(p_{M} (x)\)的所有根都是特征值,因此可以得到\(p_{M} (x) = x^n\)。根据Cayley-Hamilton定理,我们现在可以得出\(M^n = 0\)。\ \(_ \广场)
考虑\(n\)-by-\(n\)矩阵的集合,其项是对某个素数\(p\)求模的整数。这个集合中行列式非零的矩阵是可逆的,因此在矩阵乘法下形成一个群;这个组被命名为\(\text{GL}(n,p)\),其中“GL”代表“一般线性”。
给定一个矩阵\(M \in \text{GL}(n,p)\),其订单定义为最小的整数\(k\),使得\(M^k = I\),其中\(I \in \text{GL}(n,p)\)表示单位矩阵。在这个问题中,您将计算\(\text{GL}(n,p)\)中矩阵的最大可能阶数。也就是说,你将回答这样一个问题:“在\mathbb{N}\中,最大的整数\(m\)是什么,使得\(m\)是\(\text{GL}(N,p)中的矩阵的阶?\)?”
\ (\)
提示和证明草图:
设\(A\)是\(\text{GL}(n,p)\)中的一个矩阵。考虑由\(A\)的幂生成的向量空间\(V(A,p)\),其系数在\(p\)元素场中。也就是说,\ (V(A,p)\)是线性组合\[a_0 + a_1 A + a_2 A^2 + a_3 A^3 + \cdots,\]的向量空间,其中系数\(a_i\)是对\(p\)求模的整数。Cayley-Hamilton定理认为\(V(A,p)\)是有限维的;当\(A\)范围超过组\(\text{GL}(n,p)\big)时,其维度\(\big(\)的最大可能值是多少?\)
假设\(\dim\big(V(A,p)\big) = k\)。这意味着\(A\)在\(\text{GL}(n,p)中的阶数是什么?\)要回答这个问题,请注意\(A\)的任何次幂都必须在\(V(A,p)\)中,因为\(A\)的幂的指数可以用Cayley-Hamilton给出的多项式关系约简。
设\(K\)表示当\(A\)超过\(\text{GL}(n,p)\)时,\(\dim\big(V(A,p)\)的最大可能值。你能找到一个矩阵\(B \in \text{GL}(n,p)\),它的顺序至少是\(K?\)根据前面的两步,这意味着什么?
作为你对这个问题的答案,在\(\text{GL}(4,5)\)中提交一个矩阵的最大可能顺序,即:\[\max_{A \in \text{GL}(4,5)} \text{Order}(A).\]