MIT_线性代数笔记:第 24 讲 马尔可夫矩阵;傅里叶级数
本讲学习马尔可夫矩阵和傅里叶级数,两者是关于特征值和投影矩阵的应用。
马尔可夫矩阵 Markov matrices
 
      
       
        
        
          A 
         
        
          = 
         
         
         
           [ 
          
          
           
            
             
             
               0.1 
              
             
            
            
             
             
               0.01 
              
             
            
            
             
             
               0.3 
              
             
            
           
           
            
             
             
               0.2 
              
             
            
            
             
             
               0.99 
              
             
            
            
             
             
               0.3 
              
             
            
           
           
            
             
             
               0.7 
              
             
            
            
             
             
               0 
              
             
            
            
             
             
               0.4 
              
             
            
           
          
         
           ] 
          
         
        
       
         A = \begin{bmatrix} 0.1 & 0.01 & 0.3 \\ 0.2 & 0.99& 0.3\\ 0.7 & 0& 0.4 \end{bmatrix} 
        
       
     A= 
              ?0.10.20.7?0.010.990?0.30.30.4? 
              ?
 形如矩阵 A,任何元素非负,且每列的元素加和为 1 的矩阵被称为马尔可夫矩阵。马尔可夫矩阵主要应用在概率领域。将一个马尔可夫矩阵进行方幂运算得到的仍旧是马尔可夫矩阵。
当处理一个微分方程问题时,特征值 0 意味着得到一个稳态。当进行矩阵的方幂运算时,特征值给出稳态的条件包括:
- λ 1 λ_1 λ1?=1 是特征值之一。
- 其它特征值的绝对值都比 1 小, ∣ λ i ∣ \begin{vmatrix} λ_i \end{vmatrix} ?λi?? ? <1。
如我们所知,如果矩阵具有 n 个线性无关的特征向量,则有:
  
      
       
        
         
         
           U 
          
         
           k 
          
         
        
          = 
         
         
         
           A 
          
         
           k 
          
         
         
         
           U 
          
         
           0 
          
         
        
          = 
         
         
         
           c 
          
         
           1 
          
         
         
         
           λ 
          
         
           1 
          
         
           k 
          
         
         
         
           X 
          
         
           1 
          
         
        
          + 
         
         
         
           c 
          
         
           2 
          
         
         
         
           λ 
          
         
           2 
          
         
           k 
          
         
         
         
           X 
          
         
           2 
          
         
        
          + 
         
        
          . 
         
        
          . 
         
        
          . 
         
        
          . 
         
        
          . 
         
        
          . 
         
        
          + 
         
         
         
           c 
          
         
           n 
          
         
         
         
           λ 
          
         
           n 
          
         
           k 
          
         
         
         
           X 
          
         
           n 
          
         
        
       
         U_k = A^kU_0 =c_1λ_1^kX_1 + c_2λ_2^kX_2 + ...... +c_nλ_n^kX_n 
        
       
     Uk?=AkU0?=c1?λ1k?X1?+c2?λ2k?X2?+......+cn?λnk?Xn?
如果 λ 1 λ_1 λ1?=1 并且其他的特征值都小于 1,则系统在 k 增大过程中趋近于 u 0 u_0 u0?的分量 c 1 x 1 c_1x_1 c1?x1?,即给出了一个稳态状况。这里特征向量 x 1 x_1 x1?的每一分量都是正的,因此若初始值为正,则最终的稳态也是正的。
Markov 矩阵每一列的元素加和为 1 这个条件,保证了矩阵具有 1 这个特征值。
  
      
       
        
        
          A 
         
        
          ? 
         
        
          I 
         
        
          = 
         
         
         
           [ 
          
          
           
            
             
              
              
                ? 
               
              
                0.9 
               
              
             
            
            
             
             
               0.01 
              
             
            
            
             
             
               0.3 
              
             
            
           
           
            
             
             
               0.2 
              
             
            
            
             
              
              
                ? 
               
              
                0.09 
               
              
             
            
            
             
             
               0.3 
              
             
            
           
           
            
             
             
               0.7 
              
             
            
            
             
             
               0 
              
             
            
            
             
              
              
                ? 
               
              
                0.6 
               
              
             
            
           
          
         
           ] 
          
         
        
       
         A - I = \begin{bmatrix} -0.9 & 0.01 & 0.3 \\ 0.2 & -0.09& 0.3\\ 0.7 & 0& -0.6 \end{bmatrix} 
        
       
     A?I= 
              ??0.90.20.7?0.01?0.090?0.30.3?0.6? 
              ?
 从每一列减去 1,则每列的加和都从 1 变为 0。这时候行向量相加的结构就是 0向量,因此行向量线性相关,矩阵为奇异矩阵。矩阵 A 有特征向量在 A-I 的零空间中,其对应的特征值为 1。回带计算可得 
     
      
       
        
        
          x 
         
        
          1 
         
        
       
      
        x_1 
       
      
    x1? = 
     
      
       
       
         [ 
        
        
         
          
           
           
             0.6 
            
           
          
         
         
          
           
           
             33 
            
           
          
         
         
          
           
           
             0.7 
            
           
          
         
        
       
         ] 
        
       
      
        \begin{bmatrix} 0.6\\33\\0.7 \end{bmatrix} 
       
      
     
             ?0.6330.7? 
             ?
我们用马尔可夫矩阵来研究人口流动问题。
  
      
       
        
         
          
          
            [ 
           
           
            
             
              
               
               
                 u 
                
                
                
                  c 
                 
                
                  a 
                 
                
                  l 
                 
                
               
              
             
            
            
             
              
               
               
                 u 
                
                
                
                  m 
                 
                
                  a 
                 
                
                  s 
                 
                
                  s 
                 
                
               
              
             
            
           
          
            ] 
           
          
          
          
            t 
           
          
            = 
           
          
            k 
           
          
            + 
           
          
            1 
           
          
         
        
          = 
         
         
         
           [ 
          
          
           
            
             
             
               0.9 
              
             
            
            
             
             
               0.2 
              
             
            
           
           
            
             
             
               0.1 
              
             
            
            
             
             
               0.8 
              
             
            
           
          
         
           ] 
          
         
         
          
          
            [ 
           
           
            
             
              
               
               
                 u 
                
                
                
                  c 
                 
                
                  a 
                 
                
                  l 
                 
                
               
              
             
            
            
             
              
               
               
                 u 
                
                
                
                  m 
                 
                
                  a 
                 
                
                  s 
                 
                
                  s 
                 
                
               
              
             
            
           
          
            ] 
           
          
          
          
            t 
           
          
            = 
           
          
            k 
           
          
         
        
       
         \begin{bmatrix} u_{cal} \\ u_{mass} \end{bmatrix}_{t=k+1} = \begin{bmatrix} 0.9 & 0.2 \\ 0.1 & 0.8 \end{bmatrix} \begin{bmatrix} u_{cal} \\ u_{mass} \end{bmatrix}_{t=k} 
        
       
     [ucal?umass??]t=k+1?=[0.90.1?0.20.8?][ucal?umass??]t=k?
方程中 u 的分量分别代表加利福尼亚州和马萨诸塞州的人口,矩阵中的每一列中元素代表着人口去留比例,比如第一列 0.9 表示留在加州的人口占加州人口的90%,而 10%进入麻省,第二列中由麻省进入加州的人口占麻省的 20%,而 80%选择留在麻省。可以看到列向量分量的加和为 1 保证了整体人数不会变化,而在这种问题中矩阵也不会出现负的元素。
如果取初值 [ u c a l u m a s s ] 0 \begin{bmatrix} u_{cal} \\ u_{mass} \end{bmatrix}_{0} [ucal?umass??]0? = [ 0 1000 ] \begin{bmatrix} 0 \\ 1000 \end{bmatrix} [01000?]
则经过一次迁徙 [ u c a l u m a s s ] 1 \begin{bmatrix} u_{cal} \\ u_{mass} \end{bmatrix}_{1} [ucal?umass??]1? = [ 0.9 0.2 0.1 0.8 ] \begin{bmatrix} 0.9 & 0.2 \\ 0.1& 0.8 \end{bmatrix} [0.90.1?0.20.8?] [ 0 1000 ] \begin{bmatrix} 0 \\ 1000 \end{bmatrix} [01000?] = [ 200 800 ] \begin{bmatrix} 200 \\ 800 \end{bmatrix} [200800?]
为了获取长时间后的人口分布,我们需要了解矩阵的特征值和特征向量。因为这是马尔可夫矩阵,所以有一个特征值 1,则另一个特征值为
0.9+0.8-1=0.7。可以求得 x1= [ 2 1 ] \begin{bmatrix} 2\\1 \end{bmatrix} [21?],x2= [ 1 ? 1 ] \begin{bmatrix} 1\\-1 \end{bmatrix} [1?1?]。从 [ 2 1 ] \begin{bmatrix} 2\\1 \end{bmatrix} [21?],可知最后的稳态为加州人口 2/3,麻省人口 1/3。
通解为: u k = c 1 [ 2 1 ] + c 2 ( 0.7 ) k [ ? 1 1 ] u_k = c_1 \begin{bmatrix} 2 \\ 1 \end{bmatrix} + c_2(0.7)^k \begin{bmatrix} -1 \\ 1 \end{bmatrix} uk?=c1?[21?]+c2?(0.7)k[?11?] ,可以从 u0解得 c1=1000/3,c2=2000/3。
傅里叶级数 Fourier series
如果有一组标准正交基 q 1 , q 2 … … q n q_1,q_2……q_n q1?,q2?……qn?为则任意向量 v 可以写成:
 
      
       
        
        
          v 
         
        
          = 
         
         
         
           x 
          
         
           1 
          
         
         
         
           q 
          
         
           1 
          
         
        
          + 
         
         
         
           x 
          
         
           2 
          
         
         
         
           q 
          
         
           2 
          
         
        
          … 
         
        
          … 
         
         
         
           x 
          
         
           n 
          
         
         
         
           q 
          
         
           n 
          
         
        
       
         v = x_1q_1+x_2q_2……x_nq_n 
        
       
     v=x1?q1?+x2?q2?……xn?qn?
 因为当 i,j 不相等时有  
     
      
       
        
        
          q 
         
        
          i 
         
        
          T 
         
        
        
        
          q 
         
        
          j 
         
        
       
      
        q_i^Tq_j 
       
      
    qiT?qj?=0。因此有  
     
      
       
        
        
          q 
         
        
          i 
         
        
          T 
         
        
       
         v 
        
       
         = 
        
        
        
          x 
         
        
          1 
         
        
        
        
          q 
         
        
          i 
         
        
          T 
         
        
        
        
          q 
         
        
          1 
         
        
       
         + 
        
        
        
          x 
         
        
          2 
         
        
        
        
          q 
         
        
          i 
         
        
          T 
         
        
        
        
          q 
         
        
          2 
         
        
       
         … 
        
       
         … 
        
        
        
          x 
         
        
          n 
         
        
        
        
          q 
         
        
          i 
         
        
          T 
         
        
        
        
          q 
         
        
          n 
         
        
       
         = 
        
        
        
          x 
         
        
          i 
         
        
       
      
        q_i^Tv=x_1q_i^Tq_1+x_2q_i^Tq_2……x_nq_i^Tq_n=x_i 
       
      
    qiT?v=x1?qiT?q1?+x2?qiT?q2?……xn?qiT?qn?=xi?。
 我们得到了分量 xi的公式: 
     
      
       
        
        
          x 
         
        
          i 
         
        
       
         = 
        
        
        
          q 
         
        
          i 
         
        
          T 
         
        
       
         v 
        
       
      
        x_i=q_i^Tv 
       
      
    xi?=qiT?v。
 因为 
     
      
       
       
         v 
        
       
         = 
        
        
        
          [ 
         
         
          
           
            
             
             
               q 
              
             
               1 
              
             
            
           
           
            
             
             
               . 
              
             
               . 
              
             
               . 
              
             
            
           
           
            
             
             
               q 
              
             
               n 
              
             
            
           
          
         
        
          ] 
         
        
        
        
          [ 
         
         
          
           
            
             
             
               x 
              
             
               1 
              
             
            
           
          
          
           
            
             
             
               . 
              
             
               . 
              
             
               . 
              
             
            
           
          
          
           
            
             
             
               x 
              
             
               n 
              
             
            
           
          
         
        
          ] 
         
        
       
      
        v=\begin{bmatrix} q_1&...& q_n\end{bmatrix}\begin{bmatrix} x_1\\...\\ x_n\end{bmatrix} 
       
      
    v=[q1??...?qn??] 
             ?x1?...xn?? 
             ?,即 
     
      
       
       
         v 
        
       
         = 
        
       
         Q 
        
       
         x 
        
       
      
        v=Qx 
       
      
    v=Qx,所以 
     
      
       
       
         x 
        
       
         = 
        
        
        
          Q 
         
         
         
           ? 
          
         
           1 
          
         
        
       
         v 
        
       
      
        x =Q^{-1}v 
       
      
    x=Q?1v
因为 Q 为正交矩阵,所以有 Q ? 1 = Q T Q^{-1}=Q^T Q?1=QT。 x = Q T v x=Q^Tv x=QTv,这与我们之前得到的 x i = q i T v x_i=q_i^Tv xi?=qiT?v 完全相同。这里给出了求分量的思路就是用空间的一组标准正交基去点乘目标向量,利用其标准正交的性质得到所求。
标准正交是此处的核心概念。而傅里叶级数也是在这个概念上构建的。我们可以对任意函数做傅里叶展开,得到表达式:
  
      
       
        
        
          f 
         
        
          ( 
         
        
          x 
         
        
          ) 
         
        
          = 
         
         
         
           a 
          
         
           0 
          
         
        
          + 
         
         
         
           a 
          
         
           1 
          
         
        
          c 
         
        
          o 
         
        
          s 
         
        
          x 
         
        
          + 
         
         
         
           b 
          
         
           1 
          
         
        
          s 
         
        
          i 
         
        
          n 
         
        
          x 
         
        
          + 
         
         
         
           a 
          
         
           2 
          
         
        
          c 
         
        
          o 
         
        
          s 
         
        
          2 
         
        
          x 
         
        
          + 
         
         
         
           b 
          
         
           2 
          
         
        
          s 
         
        
          i 
         
        
          n 
         
        
          2 
         
        
          x 
         
        
          + 
         
        
          . 
         
        
          . 
         
        
          . 
         
        
       
         f(x) = a_0 + a_1cosx +b_1sinx +a_2cos2x +b_2sin2x +... 
        
       
     f(x)=a0?+a1?cosx+b1?sinx+a2?cos2x+b2?sin2x+...
与之前的有限个标准正交向量组成的正交矩阵不同,这个空间是无限维,它的一组基是 1,cosx,sinx,cos2x,sin2x……
 此处的正交概念与 Rn空间不同,点积的概念也不同。
  
      
       
        
        
          向量 
         
         
         
           V 
          
         
           T 
          
         
        
          W 
         
        
          = 
         
         
         
           v 
          
         
           1 
          
         
         
         
           w 
          
         
           1 
          
         
        
          + 
         
         
         
           v 
          
         
           2 
          
         
         
         
           w 
          
         
           2 
          
         
        
          + 
         
        
          . 
         
        
          . 
         
        
          . 
         
        
          + 
         
         
         
           v 
          
         
           n 
          
         
         
         
           w 
          
         
           n 
          
         
        
       
         向量 V^TW =v_1w_1+v_2w_2+...+v_nw_n 
        
       
     向量VTW=v1?w1?+v2?w2?+...+vn?wn?
  
      
       
        
        
          函数 
         
         
         
           f 
          
         
           T 
          
         
        
          g 
         
        
          = 
         
         
         
           ∫ 
          
         
           0 
          
          
          
            2 
           
          
            π 
           
          
         
         
         
           f 
          
         
           ( 
          
         
           x 
          
         
           ) 
          
         
           g 
          
         
           ( 
          
         
           x 
          
         
           ) 
          
         
        
          d 
         
        
          x 
         
        
       
         函数 f^Tg =\int^{2π}_0{f(x)g(x)}{\rm d}x 
        
       
     函数fTg=∫02π?f(x)g(x)dx
 
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。 如若内容造成侵权/违法违规/事实不符,请联系我的编程经验分享网邮箱:veading@qq.com进行投诉反馈,一经查实,立即删除!