【矩阵论】Chapter 7—Hermite矩阵与正定矩阵知识点总结复习

2023-12-13 15:35:42

1 Hermite矩阵

  • 定义

    A A A n n n阶方阵,如果称 A A A为Hermite矩阵,则需满足 A H = A A^H=A AH=A,其中 A H A^H AH表示 A A A的共轭转置,也称Hermite转置,具体操作如下:

    1. 将矩阵的每个元素取共轭。对于复数 a + b i a+bi a+bi,它的共轭是 a ? b i a-bi a?bi,其中 a a a b b b 是实部和虚部
    2. 将矩阵的行和列互换

    Hermite矩阵与实对称矩阵的性质和证明方法都十分相似

  • Hermite矩阵性质

    A , B A,B A,B n n n阶Hermite矩阵,则

    1. A A A的所有特征值全是实数
    2. A A A的不同特征值所对应的特征向量是相互正交的
    3. 对正整数 k k k A k A^k Ak也是Hermite矩阵
    4. A A A可逆,则 A ? 1 A^{-1} A?1也是Hermite矩阵
    5. 对实数 k , p , k A + p B k,p,kA+pB k,p,kA+pB也是Hermite矩阵
  • Hermite矩阵充分必要条件

    A ∈ C n × n , B ∈ C n × n A\in C^{n\times n},B\in C^{n\times n} ACn×n,BCn×n

    1. A A A是Hermite矩阵的充要条件是存在酉矩阵 U U U使得
      U H A U = Λ = d i a g ( λ 1 , . . . , λ n ) U^HAU=\Lambda =diag(\lambda_1,...,\lambda_n) UHAU=Λ=diag(λ1?,...,λn?)
      其中 λ 1 , . . . , λ n \lambda_1,...,\lambda_n λ1?,...,λn?均为实数。实对称矩阵则是存在正交矩阵 U . . . U... U...

    2. A是Hermite矩阵的充要条件是对任意方阵 S S S S H A S S^HAS SHAS是Hermite矩阵

    3. 如果 A , B A,B A,B是Hermite阵,则 A B AB AB是Hermite矩阵的充要条件是 A B = B A AB=BA AB=BA

  • 相合标准形

    A A A n n n阶Hermite矩阵,则 A A A相合矩阵
    D 0 = ( I s 0 0 0 ? I r ? s 0 0 0 O n ? r ) D_0=\begin{pmatrix} I_s & 0 & 0 \\ 0 & -I_{r-s} & 0 \\ 0 & 0 & O_{n-r} \end{pmatrix} D0?= ?Is?00?0?Ir?s?0?00On?r?? ?
    其中 r = r a n k ( A ) r=rank(A) r=rank(A) s s s A A A的正特征值(重特征值按重数计算)的个数。矩阵 D 0 D_0 D0?则称为 n n n阶Hermite矩阵 A A A的相合标准形。

  • Sylvester惯性定律

    A , B A,B A,B n n n阶Hermite矩阵,则 A A A B B B相合的充要条件是
    I n ( A ) = I n ( B ) In(A)=In(B) In(A)=In(B)
    其中 I n ( A ) In(A) In(A)称为 A A A的惯性, I n ( A ) = { π ( A ) , v ( A ) , δ ( A ) } In(A)=\{\pi(A),v(A),\delta(A)\} In(A)={π(A),v(A),δ(A)}。其中 π ( A ) \pi(A) π(A), v ( A ) v(A) v(A), δ ( A ) \delta(A) δ(A)分别表示 A A A的正、负和零特征值的个数(重特征值按重数计算)。则 A A A非奇异的充要条件为 δ ( A ) = 0 \delta(A)=0 δ(A)=0 π ( A ) + v ( A ) = r a n k ( A ) \pi(A)+v(A)=rank(A) π(A)+v(A)=rank(A)

2 Hermite二次型

  • Hermite二次型定义

    n n n个复变量 x 1 , . . . , x n x_1,...,x_n x1?,...,xn?,系数为负数的二次齐式
    f ( x 1 , . . . , x n ) = ∑ i = 1 n ∑ j = 1 n a i j x i ˉ x j ˉ f(x_1,...,x_n)=\sum_{i=1}^{n}\sum_{j=1}^{n}a_{ij}\bar{x_i}\bar{x_j} f(x1?,...,xn?)=i=1n?j=1n?aij?xi?ˉ?xj?ˉ?
    其中 a i j = a j i a_{ij}=a_{ji} aij?=aji?,称为Hermite二次型。Hermite二次型可写为 f ( x ) = x H A x f(x)=x^HAx f(x)=xHAx,我们称 A A A的秩就为Hermite二次型的秩。

  • Hermite二次型的标准形定理

    对Hermite二次型 f ( x ) = x H A x f(x)=x^HAx f(x)=xHAx,存在酉线性变换 x = U y x=Uy x=Uy(其中 U U U是酉矩阵)使得Hermite二次型 f ( x ) f(x) f(x)变成标准形(只包含平方项的二次型)
    f ( x ) = λ 1 y 1 ˉ y 1 + . . . + λ n y n ˉ y n f(x)=\lambda_1\bar{y_1}y_1+...+\lambda_n\bar{y_n}y_n f(x)=λ1?y1?ˉ?y1?+...+λn?yn?ˉ?yn?
    其中 λ 1 , . . . , λ n \lambda_1,...,\lambda_n λ1?,...,λn? A A A的特征值。

  • Hermite二次型化标准形(酉线性变换)

    f ( x ) = x H A x f(x)=x^HAx f(x)=xHAx,其中 A A A n n n阶Hermite矩阵

    1. 求出二次型矩阵 A A A的特征值 λ 1 , . . . λ n \lambda_1,...\lambda_n λ1?,...λn?和特征向量 v 1 , . . . , v n v_1,...,v_n v1?,...,vn?,并将特征向量 v 1 , . . . , v n v_1,...,v_n v1?,...,vn?规范正交

    2. U = ( v 1 , . . . , v n ) , x = U y U=(v_1,...,v_n),x=Uy U=(v1?,...,vn?),x=Uy,则
      f ( x ) = ( U y ) H A ( U y ) = y H U H A U y = y H ( U H A U ) y = y H Λ y = λ 1 ∣ y 1 ∣ 2 + . . . + λ n ∣ y n ∣ 2 f(x)=(Uy)^HA(Uy)=y^HU^HAUy=y^H(U^HAU)y\\=y^H\Lambda y=\lambda_1|y_1|^2+...+\lambda_n|y_n|^2 f(x)=(Uy)HA(Uy)=yHUHAUy=yH(UHAU)y=yHΛy=λ1?y1?2+...+λn?yn?2

  • Hermite二次型规范形定理

    对二次型 f ( x ) = x H A x f(x)=x^HAx f(x)=xHAx,存在可逆线性变换 x = P y x=Py x=Py使得Hermite二次型 f ( x ) f(x) f(x)化为
    f ( x ) = y 1 ˉ y 1 + . . . + y s ˉ y s ? y s + 1 ˉ y s + 1 ? . . . ? y r ˉ y r f(x)=\bar{y_1}y_1+...+\bar{y_s}y_s-\bar{y_{s+1}}y_{s+1}-...-\bar{y_r}y_r f(x)=y1?ˉ?y1?+...+ys?ˉ?ys??ys+1?ˉ?ys+1??...?yr?ˉ?yr?
    其中 r = r a n k ( A ) , s = π ( A ) r=rank(A),s=\pi(A) r=rank(A),s=π(A)。上式则为Hermite二次型 f ( x ) f(x) f(x)的规范形,其中 s s s ( r ? s ) (r-s) (r?s)分别称为Hermite二次型的正惯性指数和负惯性指数。

  • 二次型化规范形

    f ( x ) = x H A x f(x)=x^HAx f(x)=xHAx,其中 A A A n n n阶Hermite矩阵

    1. 将二次型化为标准形,得到标准形 f ( x ) = y H Λ y f(x)=y^H\Lambda y f(x)=yHΛy和酉矩阵 U U U

    2. 将对角线元素提取出来,即只保留 λ i \lambda_i λi?的正负性,则
      f ( x ) = y H Λ y = y H ( Λ 1 D 0 Λ 1 ) y = y H ( Λ 1 H D 0 Λ 1 ) y = ( Λ 1 y ) H D 0 ( Λ 1 y ) f(x)=y^H\Lambda y=y^H(\Lambda_1 D_0 \Lambda_1)y=y^H(\Lambda_1^HD_0\Lambda_1)y\\ =(\Lambda_1y)^HD_0(\Lambda_1y) f(x)=yHΛy=yH(Λ1?D0?Λ1?)y=yH(Λ1H?D0?Λ1?)y=(Λ1?y)HD0?(Λ1?y)
      其中 Λ 1 \Lambda_1 Λ1?为对角矩阵,对角线元素为 ∣ λ i ∣ ( 1 ≤ i ≤ n ) \sqrt {|\lambda_i}|(1\leq i \leq n) λi? ?(1in)

    3. y = Λ 1 ? 1 z y=\Lambda_1^{-1} z y=Λ1?1?z,则
      f ( x ) = ( Λ 1 Λ 1 ? 1 z ) H D 0 ( Λ 1 Λ 1 ? 1 z ) = z H D 0 z = z 1 ˉ z 1 + . . . + z s ˉ y s ? z s + 1 ˉ z s + 1 ? . . . ? z r ˉ z r f(x)=(\Lambda_1\Lambda_1^{-1}z)^HD_0(\Lambda_1\Lambda_1^{-1}z)=z^HD_0z\\=\bar{z_1}z_1+...+\bar{z_s}y_s-\bar{z_{s+1}}z_{s+1}-...-\bar{z_r}z_r f(x)=(Λ1?Λ1?1?z)HD0?(Λ1?Λ1?1?z)=zHD0?z=z1?ˉ?z1?+...+zs?ˉ?ys??zs+1?ˉ?zs+1??...?zr?ˉ?zr?

    4. x = U Λ ? 1 z x=U\Lambda^{-1}z x=UΛ?1z,可逆矩阵 P = U Λ ? 1 P=U\Lambda^{-1} P=UΛ?1

  • 正定相关概念

    f ( x ) = x H A x f(x)=x^HAx f(x)=xHAx为Hermite二次型

    1. 如果 f ( x ) > 0 f(x)>0 f(x)>0(等价 s = r = n s=r=n s=r=n),则称 f ( x ) f(x) f(x)为正定的;
    2. 如果 f ( x ) ≥ 0 f(x)\geq0 f(x)0(等价 s = r < n s=r<n s=r<n),则称 f ( x ) f(x) f(x)为半正定(非负定的)的;
    3. 如果 f ( x ) < 0 f(x)<0 f(x)<0(等价 s = 0 , r = n s=0,r=n s=0,r=n),则称 f ( x ) f(x) f(x)为负定的;
    4. 如果 f ( x ) ≤ 0 f(x)\leq0 f(x)0(等价 s = 0 , r < n s=0,r<n s=0,r<n),则称 f ( x ) f(x) f(x)为半负定的;
    5. 如果 f ( x ) f(x) f(x)有时为正有时为负(等价 0 < s < r ≤ n 0<s<r\leq n 0<s<rn),则称 f ( x ) f(x) f(x)为不定的;

3 Hermite正定(非负定矩阵)

  • 定义

    根据Hermite二次型的正定(非负定)可以定义Hermite矩阵的正定(非负定)。

    A A A n n n阶Hermite矩阵, f ( x ) = x H A x f(x)=x^HAx f(x)=xHAx

    1. 如果 f ( x ) > 0 f(x)>0 f(x)>0,则称 A A A为正定的,记作 A > 0 A>0 A>0
    2. 如果 f ( x ) ≥ 0 f(x)\geq0 f(x)0,则称 A A A为半正定(非负定的)的,记作 A ≥ 0 A\geq 0 A0
    3. 如果 f ( x ) < 0 f(x)<0 f(x)<0,则称 A A A为负定的,记作 A < 0 A<0 A<0
    4. 如果 f ( x ) ≤ 0 f(x)\leq0 f(x)0,则称 A A A为半负定的,记作 A ≤ 0 A\leq 0 A0
    5. 如果 f ( x ) f(x) f(x)有时为正有时为负,则称 A A A为不定的;
  • 判断 n n n阶Hermite矩阵 A A A正定

    1. 通过正定矩阵的定义
    2. A A A n n n个特征值均为正数
    3. A A A的顺序主子式 Δ k = A ( 1 … k 1 … k ) > 0 , ( k = 1 , . . . , n ) \Delta_k=A\begin{pmatrix}1&\dots&k\\1&\dots&k\end{pmatrix}>0,(k=1,...,n) Δk?=A(11??kk?)>0,(k=1,...,n)均为正数
    4. A A A的所有主子式全大于 0 0 0
    5. 存在 n n n阶非奇异下三角矩阵 L L L,使得 A = L L H A=LL^H A=LLH(该分解称为Cholesky分解)
    6. 存在 n n n阶非奇异矩阵,使得 A = B H B A=B^HB A=BHB
    7. 存在 n n n阶非奇异Hermite矩阵 A = S 2 A=S^2 A=S2
  • 判断 n n n阶Hermite矩阵 A A A半正定

    1. 通过半正定矩阵的定义
    2. A A A n n n个特征值均为非负数
    3. A A A的所有主子式均非负
  • 定理证明

    A , B A,B A,B均为 n n n阶Hermite矩阵,且 B > 0 B>0 B>0,则存在非奇异矩阵 P P P使得
    P H A P = d i a g ( λ 1 , . . . , λ n ) , P H B P = I P^HAP=diag(\lambda_1,...,\lambda_n),P^HBP=I PHAP=diag(λ1?,...,λn?),PHBP=I
    其中 λ 1 , . . . , λ n \lambda_1,...,\lambda_n λ1?,...,λn?是广义特征值问题的特征值

    证明:

    ∵ B > 0 \because B >0 B>0

    $\therefore 存在非奇异矩阵 存在非奇异矩阵 存在非奇异矩阵P_1 使得 使得 使得P_1^HBP_1=I$

    ∵ P 1 H A P 1 \because P_1^HAP_1 P1H?AP1?仍为Hermite矩阵

    ∴ \therefore 酉矩阵 U U U使得
    U H ( P 1 H A P 1 ) U = d i a g ( λ 1 , . . . , λ n ) U^H(P_1^HAP_1)U=diag(\lambda_1,...,\lambda_n) UH(P1H?AP1?)U=diag(λ1?,...,λn?)
    P = P 1 U P=P_1U P=P1?U

    ∵ P \because P P非奇异,根据定理 P H B P = I P^HBP=I PHBP=I

    ∴ P H B P = ( P 1 U ) H B ( P 1 U ) = U H P 1 H B P 1 U = I \therefore P^HBP=(P_1U)^HB(P_1U)\\=U^HP_1^HBP_1U=I PHBP=(P1?U)HB(P1?U)=UHP1H?BP1?U=I

    ∵ P 1 \because P_1 P1?非奇异,使得 P 1 H B P 1 = I P_1^HBP_1=I P1H?BP1?=I

    ∴ \therefore
    P H B P = U H P 1 H B P 1 U = U H ( P 1 H B P 1 ) U = U H I U = U H U = I P^HBP= U^HP_1^HBP_1U=U^H(P_1^HBP_1)U\\=U^HIU=U^HU=I PHBP=UHP1H?BP1?U=UH(P1H?BP1?)U=UHIU=UHU=I
    ∴ \therefore
    P H A P = U H P 1 H A P 1 U = d i a g ( λ 1 , . . . , λ n ) P^HAP=U^HP_1^HAP_1U=diag(\lambda_1,...,\lambda_n) PHAP=UHP1H?AP1?U=diag(λ1?,...,λn?)
    ∴ \therefore 我们可以对上式右乘 P ? 1 P^{-1} P?1 B ? 1 B^{-1} B?1,得到
    P H B P = I P H = P ? 1 B ? 1 P^HBP=I \\ P^H=P^{-1}B^{-1} PHBP=IPH=P?1B?1
    ∴ \therefore 得到
    P ? 1 B ? 1 A P = d i a g ( λ 1 , . . . , λ n ) P^{-1}B^{-1}AP=diag(\lambda_1,...,\lambda_n) P?1B?1AP=diag(λ1?,...,λn?)
    B ? 1 A B^{-1}A B?1A相似于对角矩阵,故 λ 1 , . . . , λ n \lambda_1,...,\lambda_n λ1?,...,λn?是矩阵 B ? 1 A B^{-1}A B?1A的特征值,即 λ 1 , . . . , λ n ) \lambda_1,...,\lambda_n) λ1?,...,λn?)是广义特征值问题的特征值。

    广义特征值问题 A x = λ B x Ax=\lambda Bx Ax=λBx,左乘 B ? 1 B^{-1} B?1,即为 B ? 1 A x = λ x B^{-1}Ax=\lambda x B?1Ax=λx

4 矩阵不等式

  • 定义

    A , B A,B A,B都是 n n n阶Hermite矩阵,如果 A ? B ≥ 0 A-B\geq 0 A?B0则称 A A A大于或等于 B B B(或称 B B B小于等于 A A A),记作 A ≥ B A\geq B AB(或 B ≤ A B\leq A BA), A ? B A-B A?B半正定;如果 A ? B > 0 A-B>0 A?B>0,则称 A A A大于 B B B(或称 B B B小于 A A A),记作 A > B A>B A>B(或 B < A B<A B<A),即== A ? B A-B A?B正定==。

  • 性质

    A , B , C A,B,C A,B,C均为 n n n阶Hermite矩阵,则

    1. A ≥ B ( A > B ) ? ? A ≤ ? B ( ? A < ? B ) ? A\geq B(A>B) \Longleftrightarrow-A\leq -B(-A<-B)\Longleftrightarrow AB(A>B)??A?B(?A<?B)?对任意 n n n阶可逆矩阵 P P P都有 P H A P ≥ P H B P ( P H A P > P H B P ) P^HAP\geq P^HBP(P^HAP>P^HBP) PHAPPHBP(PHAP>PHBP)
    2. A > 0 ( A ≥ 0 ) , C > 0 ( C ≥ 0 ) A>0(A\geq 0),C>0(C\geq 0) A>0(A0),C>0(C0),且 A C = C A AC=CA AC=CA,则 A C > 0 ( A C ≥ 0 ) AC>0(AC\geq 0) AC>0(AC0)
    3. A > B A>B A>B P P P n × m n\times m n×m列满秩矩阵,则 P H A P > P H B P P^HAP>P^HBP PHAP>PHBP
    4. A ≥ B A\geq B AB P P P n × m n\times m n×m矩阵,则 P H A P ≥ P H B P P^HAP\geq P^HBP PHAPPHBP
  • 定理

    A , B A,B A,B都是 n n n阶Hermite矩阵,且 A ≥ 0 , B > 0 A\geq 0,B>0 A0,B>0,则

    1. B ≥ A B\geq A BA的充要条件是 ρ ( A B ? 1 ) ≤ 1 \rho(AB^{-1})\leq 1 ρ(AB?1)1
    2. B > A B>A B>A的充要条件是 ρ ( A B ? 1 ) < 1 \rho(AB^{-1})<1 ρ(AB?1)<1

    A A A n n n阶Hermite矩阵,则 λ m i n ( A ) I ≤ A ≤ λ m a x I \lambda_{min}(A)I\leq A\leq\lambda_{max}I λmin?(A)IAλmax?I,这时 λ m i n \lambda_{min} λmin? λ m a x \lambda_{max} λmax?分别表示 A A A的最大和最小特征值。

    A , B A,B A,B均为 n n n阶Hermite正定矩阵,则

    1. A ≥ B > 0 A\geq B>0 AB>0,则 B ? 1 ≥ A ? 1 > 0 B^{-1}\geq A^{-1}>0 B?1A?1>0
    2. A > B > 0 A>B>0 A>B>0,则 B ? 1 > A ? 1 > 0 B^{-1}>A^{-1}>0 B?1>A?1>0

    A , B A,B A,B均为 n n n阶Hermite正定矩阵,且 A B = B A AB=BA AB=BA,则

    1. A ≥ B A\geq B AB,则 A 2 ≥ B 2 A^2\geq B^2 A2B2

      证明: A 2 ? B 2 = ( A ? B ) ( A + B ) = ( A + B ) ( A ? B ) A^2-B^2=(A-B)(A+B)=(A+B)(A-B) A2?B2=(A?B)(A+B)=(A+B)(A?B),易知 ( A ? B ) ≥ 0 , A + B > 0 (A-B)\geq0,A+B>0 (A?B)0,A+B>0,则克制

    2. A ≥ B A\geq B AB,则 A 2 > B 2 A^2> B^2 A2>B2

      同理得证

    A A A m × n m\times n m×n行满秩矩阵, B B B n × k n\times k n×k矩阵,则
    B H B ≥ ( A B ) H ( A A H ) ? 1 ( A B ) B^HB\geq (AB)^H(AA^H)^{-1}(AB) BHB(AB)H(AAH)?1(AB)
    等号成立当且仅当存在一个 m × k m\times k m×k矩阵 C C C使得 B = A H C B=A^HC B=AHC

文章来源:https://blog.csdn.net/hzf0701/article/details/134824086
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。