动态规划——背包问题

那些年那些有趣的数学

2018-02-10

背包问题是一类经典的动态规划问题，本节只介绍两类最简单的背包问题：01背包问题和完全背包问题。

一、多阶段动态规划问题

有一类动态规划可解的问题，它可以描述成若干个有序的阶段，且每个阶段的状态只和上一阶段的状态有关，一般把这类问题称为多阶段动态规划问题。如下图所示，该问题被分为 5个阶段，其中状态 F属于阶段 3，它由状态 2的状态 C和状态 D推得。01背包问题就是这样一个例子。

二、01背包问题

01背包问题是这样的：

下面介绍动态规划的方法。

令 dp[i][v]表示前 i件物品 (1≤i≤n, 0≤v≤V)恰好装入容量为 v的背包中所能获得的最大价值。考虑对第 i件物品的选择策略，有两种策略：

1. 不妨第 i件物品，那么问题转化为前 i-1件物品恰好装入容量为 v的背包中所能获得最大价值，也即 dp[i-1][v]。
2. 放第 i件物品，那么问题转化为前 i-1件物品恰好装入容量为 v-w[i]的背包中所能获得的最大价值，也即 dp[i-1][v-w[i]] + c[i]。

由此可以写出状态转移方程：

$dp[i][v]=max\left \{ dp[i-1][v], dp[i-1][v-w[i]]+c[i] \right \}$

$1\leqslant i\leqslant n,w[i]\leqslant v\leqslant V$

注意到 dp[i][v]只与之前的状态 dp[i-1][]有关，所以可以枚举 i从 1到 n ，v从 0到 V，通过边界 dp[0][v]（0≤v≤V）（即前 0件物品放入任何容量 v的背包中都只能获得价值 0）就可以把整个 dp数组递推出来。而由于 dp[i][v]表示的是恰好为 v的情况，所以需要枚举 dp[n][v]（0≤v≤V），取最大值才是最后的结果。

代码如下：

1 int i, v;
2 for(i=1; i<=n; ++i) {
3     for(v=w[i]; v<=V; ++v) {
4         dp[i][v] = max(dp[i-1][v], dp[i-1][v-w[i]]+c[i]);
5     }
6 }

此时时间复杂度和空间复杂度都为 O(nV)，空间复杂度还可以再优化。

注意到状态转移方程中计算 dp[i][v]时总是只需要 dp[i-1][v]左侧部分的数据，因此可以直接开一个一维数组 dp[v]，枚举方向改变为 i从 1到 n， v从 V到 0（逆序！），这样状态转移方程为：

$dp[v]=max(dp[v],dp[v-w[i]]+c[i])$

$1\leqslant i\leqslant n,w[i]\leqslant v\leqslant V$

代码如下：

int i, v;
 // 滚动数组形式
 for(i=; i<=n; ++i) {
     for(v=V; v >= w[i]; --v) {        // 逆序枚举 v 
         dp[v] = max(dp[v], dp[v-w[i]] + c[i]);
     }
 }

特别说明：如果用二维数组存放，v的枚举是顺序还是逆序都无所谓；如果使用一维数组存放，则 v的枚举必须是逆序！

完整的求解 01背包问题的代码如下：

1 /*
 2     01背包问题 
 3 */
 4 
 5 #include <stdio.h>
 6 #include <string.h>
 7 #include <math.h>
 8 #include <stdlib.h>
 9 #include <time.h>
10 #include <stdbool.h>
11 
12 #define maxn 100
13 #define maxv 1000 
14 int w[maxn], c[maxn], dp[maxv];
15 
16 // 求较大值 
17 int max(int a, int b) {
18     return (a>b ? a : b);
19 }
20 
21 int main() {
22     int i, v, n, V;
23     scanf("%d %d", &n, &V);
24     for(i=1; i<=n; ++i) {
25         scanf("%d", &w[i]);                // 输入物品重量 
26     }
27     for(i=1; i<=n; ++i) {
28         scanf("%d", &c[i]);                // 输入物品价值 
29     }
30     // 边界
31     for(v=0; v <= V; ++v) {
32         dp[v] = 0;
33     } 
34     // 状态转移方程 
35     for(i=1; i<=n; ++i) {
36         for(v=V; v >= w[i]; --v) {        // 逆序枚举 v 
37             dp[v] = max(dp[v], dp[v-w[i]] + c[i]);
38         }
39     } 
40     // 寻找最大值即为答案
41     int maxc = 0;
42     for(v=0; v<=V; ++v) {
43         if(dp[v] >= maxc) {
44             maxc = dp[v];
45         }
46     }
47     printf("%d\n", maxc);                // 输出 
48 
49     return 0;
50 }

另外，01背包中的每个物品都可以看作一个阶段，这个阶段中的状态有 dp[i][0]~dp[i][v]，它们均由上一个阶段的状态得到。事实上，对能够划分阶段的问题来说，都可以尝试把阶段作为状态的一维，这可以使我们更方便地得到无后效性的状态。从中也可以得到这么一个技巧，如果当前设计的状态不满足无后效性，那么不妨把状态进行升维，即增加一维或若干维来表示相应的消息，这样可能就能满足无后效性。

三、完全背包问题

完全背包问题的叙述如下：

同样令 dp[i][v]表示前i件物品恰好放入容量为 v的背包中能获得的最大价值。和 01背包问题一样，考虑对第 i件物品的选择策略，有两种策略：

1. 不放第 i件物品，那么 dp[i][v] = dp[i-1][v]。
2. 放第 i件物品。这里的处理与 01背包问题有所不同，完全背包问题如果选择放第 i件物品之后并不是转移到 dp[i-1][v-w[i]]这个状态，而是转移到 dp[i][v-w[i]]，这是因为每种物品可以放任意件，放了第 i件物品后还可以继续放第 i件物品，直到第二维的 v-w[i]无法保持大于等于 0为止。

因此可以写出状态转移方程：

$dp[i][v]=max\left \{ dp[i-1][v], dp[i][v-w[i]]+c[i] \right \}$

$1\leqslant i\leqslant n,w[i]\leqslant v\leqslant V$

边界：dp[0][v]=0（0≤v≤V）

而这个状态转移方程同样可以改写成一维形式，即状态转移方程：

$dp[v]=max(dp[v],dp[v-w[i]]+c[i])$

$1\leqslant i\leqslant n,w[i]\leqslant v\leqslant V$

边界：dp[v]=0（0≤v≤V）

写成一维形式之后和 01背包完全相同，唯一的区别在于这里 v的枚举顺序是正向枚举，而 01背包的一维形式中 v必须是逆向枚举。代码如下：

int i, v;
 for(i=; i<=n; ++i) {
     for(v=w[i]; v <= V; ++v) {    // 正向枚举 v 
         dp[v] = max(dp[v], dp[v-w[i]]+c[i]);
     }
 }

动态规划背包问题背包问题动态规划

安科网

动态规划——背包问题

那些年那些有趣的数学

一、多阶段动态规划问题

二、01背包问题

三、完全背包问题

那些年那些有趣的数学

相关推荐

动态规划解决0-1背包问题

PHP动态规划解决0-1背包问题实例分析

动态规划题解（转）

【LeetCode-动态规划】单词拆分

Leetcode算法初学——动态规划算法“打家劫舍”

动态规划的引入 P4017 最大食物链计数【拓扑排序的条数计算】

五大常用算法（二）动态规划算法

53-最大子序和（动态规划与分治法）

leetcode 62. 不同路径-动态规划及优化，双100%

算法<初级> - 第五章递归与动规相关问题（完结）

算法思想__动态规划

91.解码方法（动态规划）

快速上手leetcode动态规划题

动态规划

动态规划-Minimum Distance to Type a Word Using Two Fingers

算法期末备考-第5练-动态规划

算法动态规划

贪心算法

【动态规划专题】1：斐波拉契数列问题的递归和动态规划

102页PPT，DeepMind强化学习最新进展，含图文、公式和代码

那些年那些有趣的数学