【动态规划】矩阵连乘问题Python实现

2023-12-13 05:35:50

问题描述

  • 给定 n n n个矩阵 A 1 A_{1} A1? A 2 A_{2} A2? ? \cdots ? A n A_{n} An?,其中 A i A_{i} Ai? A i + 1 A_{i + 1} Ai+1?是可乘的( i = 1 , 2 , ? ? , n ? 1 i = 1 , 2 , \cdots , n - 1 i=1,2,?,n?1), A i A_{i} Ai?的维数为 p i ? 1 × p i , i = 1 , 2 , ? ? , n p_{i - 1} \times p_{i} , i = 1 , 2 , \cdots , n pi?1?×pi?,i=1,2,?,n,确定这 n n n个矩阵的连乘积 A 1 A 2 ? A n A_{1} A_{2} \cdots A_{n} A1?A2??An?的计算次序,使得以此计算矩阵连乘积需要的数乘次数最少

穷举搜索法

  • 对于 n n n个矩阵的连乘积,设有不同的计算次序 P ( n ) P(n) P(n)
  • 可以先在第 k k k个( k = 1 , 2 , ? ? , n ? 1 k = 1 , 2 , \cdots , n - 1 k=1,2,?,n?1)和第 k + 1 k + 1 k+1个矩阵之间将原矩阵序列分为两个矩阵子序列,然后分别对这两个矩阵子序列完全加括号,最后对所得的结果加括号,得到原矩阵序列的一种完全加括号方式
  • P ( n ) P(n) P(n)递归方程

P ( n ) = { 1 , n = 1 ∑ k = 1 n ? 1 P ( k ) P ( n ? k ) , n > 1 P(n) = \begin{cases} 1 , & n = 1 \\ \displaystyle\sum\limits_{k = 1}^{n - 1}{P(k) P(n - k)} , & n > 1 \end{cases} P(n)=? ? ??1,k=1n?1?P(k)P(n?k),?n=1n>1?

    • P ( n ) P(n) P(n)实际上是 C a t a l a n Catalan Catalan数,即 P ( n ) = C ( n ? 1 ) P(n) = C(n - 1) P(n)=C(n?1) C ( n ) = 1 n + 1 ( 2 n n ) = Ω ( 4 n / n 3 / 2 ) C(n) = \cfrac{1}{n + 1} \left(\begin{matrix} 2n \\ n \end{matrix}\right) = \Omega(4^{n} / n^{3 / 2}) C(n)=n+11?(2nn?)=Ω(4n/n3/2) P ( n ) P(n) P(n)是随 n n n的增长呈指数增长的

动态规划法

分析最优解的结构
  • 考察计算 A [ 1 : n ] A[1:n] A[1:n]的最优计算次序
  • 设这个计算次序在矩阵 A k ( 1 ≤ k < n ) A_{k} (1 \leq k < n) Ak?(1k<n) A k + 1 A_{k + 1} Ak+1?之间将矩阵链断开
  • 计算 A [ 1 : n ] A[1:n] A[1:n]的最优次序所包含的计算矩阵子链 A [ 1 : k ] A[1:k] A[1:k] A [ k + 1 : n ] A[k + 1:n] A[k+1:n]的次序也是最优的
    • 如果计算 A [ 1 : k ] A[1:k] A[1:k]的次序需要的计算量更少,则用此次序替换原来计算 A [ 1 : k ] A[1:k] A[1:k]的次序,得到的计算 A [ 1 : n ] A[1:n] A[1:n]的计算量将比最优次序所需计算量更少,这是一个矛盾
  • 矩阵连乘积计算次序问题的最优解包含其子问题的最优解,这种性质称为最优子结构性质
建立递归关系
  • 设计算 A [ i : j ] ( 1 ≤ i ≤ j ≤ n ) A[i:j] (1 \leq i \leq j \leq n) A[i:j](1ijn)所需的最少数乘次数为 m [ i ] [ j ] m[i][j] m[i][j]
  • i = j i = j i=j时, m [ i ] [ i ] = 0 ( i = 1 , 2 , ? ? , n ) m[i][i] = 0 (i = 1 , 2 , \cdots , n) m[i][i]=0(i=1,2,?,n)
  • i < j i < j i<j时,若计算 A [ i : j ] A[i:j] A[i:j]的最优次序在 A k ( i ≤ k < j ) A_{k} (i \leq k < j) Ak?(ik<j) A k + 1 A_{k + 1} Ak+1?之间断开,则 m [ i ] [ j ] = m [ i ] [ k ] + m [ k + 1 ] [ j ] + p i ? 1 p k p j m[i][j] = m[i][k] + m[k + 1][j] + p_{i - 1} p_{k} p_{j} m[i][j]=m[i][k]+m[k+1][j]+pi?1?pk?pj?
  • 将对应 m [ i ] [ j ] m[i][j] m[i][j]的断开位置 k k k记为 s [ i ] [ j ] s[i][j] s[i][j]
m [ i ] [ j ] m[i][j] m[i][j]递归方程

m [ i ] [ j ] = { 0 , i = j min ? i ≤ k < j { ? m [ i ] [ k ] + m [ k + 1 ] [ j ] + p i ? 1 p k p j ? } , i < j m[i][j] = \begin{cases} 0 , & i = j \\ \min\limits_{i \leq k < j}{\set{m[i][k] + m[k + 1][j] + p_{i - 1} p_{k} p_{j}}} , & i < j \end{cases} m[i][j]=? ? ??0,ik<jmin?{m[i][k]+m[k+1][j]+pi?1?pk?pj?},?i=ji<j?

计算最优值
  • 对于 1 ≤ i ≤ j ≤ n 1 \leq i \leq j \leq n 1ijn不同的有序对( i , j i , j i,j)对应不同的子问题
  • 不同子问题的个数最多只有 ( n 2 ) + n = θ ( n 2 ) \left(\begin{matrix} n \\ 2 \end{matrix}\right) + n = \theta(n^{2}) (n2?)+n=θ(n2)
  • 三重循环的总次数为 O ( n 3 ) O(n^{3}) O(n3),计算时间上界为 O ( n 3 ) O(n^{3}) O(n3)
构造最优解
  • s [ i ] [ j ] s[i][j] s[i][j]中的数表明,计算矩阵链 A [ i : j ] A[i:j] A[i:j]的最佳方式是在矩阵 A k A_{k} Ak? A k + 1 A_{k + 1} Ak+1?之间断开,即最优加括号方式为 ( A [ i : k ] ) ( A [ k + 1 : j ] ) (A[i:k]) (A[k + 1:j]) (A[i:k])(A[k+1:j])
Python实现
def matrix_chain_order(p):
    n = len(p) - 1  # 矩阵的数量
    m = [[float('inf')] * (n + 1) for _ in range(n + 1)]  # 存储最小乘法次数的矩阵
    s = [[0] * (n + 1) for _ in range(n + 1)]  # 存储最佳分割位置的矩阵

    # 对角线上的子问题, 乘法次数为 0
    for i in range(1, n + 1):
        m[i][i] = 0

    # l 表示子问题的规模
    for l in range(2, n + 1):
        for i in range(1, n - l + 2):
            j = i + l - 1

            for k in range(i, j):
                # 计算 m[i][j] 的值
                q = m[i][k] + m[k + 1][j] + p[i - 1] * p[k] * p[j]

                if q < m[i][j]:
                    m[i][j] = q
                    s[i][j] = k

    return m, s


def print_optimal_parens(s, i, j):
    if i == j:
        print(f'A{i}', end='')
    else:
        print('(', end='')

        print_optimal_parens(s, i, s[i][j])
        print_optimal_parens(s, s[i][j] + 1, j)

        print(')', end='')


matrix_sizes = [30, 35, 15, 5, 10, 20, 25]

m, s = matrix_chain_order(matrix_sizes)

n = len(matrix_sizes) - 1

print('最佳乘法顺序:', end='')
print_optimal_parens(s, 1, n)
print()

minimum_multiplications = m[1][n]
print('最小乘法次数:', minimum_multiplications)

文章来源:https://blog.csdn.net/from__2023_11_28/article/details/134920563
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。