动态规划基本思想

心理学哲学批判性思维

2018-01-16

背包问题九讲非常有助于入门动态规划，但是来源出处不可考，以下仅列出个人认为其中很有帮助的节选：

背包问题与动态规划的基本思想

网上有很多关于背包问题和动态规划的代码实现文章，但是如何理解动态规划的思想才是最关键的，尤其如何理解成这是一个多阶段的决策过程尤为重要，下面的这个动态规划讲解非常好，主要从两个思路来讲解动态规划，一个是利用物品个数和背包容量来说明阶段间关系，即“前i-1件物品放入剩下的容量为v-c[i]的背包中”；另一个就是直接从背包容量角度去考虑价值，新增的容量所带来的不同价值，记录各个物品新增所造成的价值变化，虽然抽象，但空间复杂度少很多。很多组合优化问题都可以归结背包问题，因为很多问题本质是因设备能力有限所造成的的瓶颈带来求解困难。

题目

有N件物品和一个容量为V的背包。第i件物品的费用是c[i]，价值是w[i]。求解将哪些物品装入背包可使价值总和最大。

基本思路

这是最基础的背包问题，特点是：每种物品仅有一件，可以选择放或不放。

用子问题定义状态：即f[i][v]表示前i件物品恰放入一个容量为v的背包可以获得的最大价值。则其状态转移方程便是：

f[i][v]=max{f[i-][v],f[i-][v-c[i]]+w[i]}

这个方程非常重要，基本上所有跟背包相关的问题的方程都是由它衍生出来的。所以有必要将它详细解释一下：“将前i件物品放入容量为v的背包中”这个子问题，若只考虑第i件物品的策略（放或不放），那么就可以转化为一个只牵扯前i-1件物品的问题。如果不放第i件物品，那么问题就转化为“前i-1件物品放入容量为v的背包中”，价值为f[i-1][v]；如果放第i件物品，那么问题就转化为“前i-1件物品放入剩下的容量为v-c[i]的背包中”，此时能获得的最大价值就是f[i-1][v-c[i]]再加上通过放入第i件物品获得的价值w[i]。

优化空间复杂度

以上方法的时间和空间复杂度均为O(VN)，其中时间复杂度应该已经不能再优化了，但空间复杂度却可以优化到O。

先考虑上面讲的基本思路如何实现，肯定是有一个主循环i=1..N，每次算出来二维数组f[i][0..V]的所有值。那么，如果只用一个数组f[0..V]，能不能保证第i次循环结束后f[v]中表示的就是我们定义的状态f[i][v]呢？f[i][v]是由f[i-1][v]和f[i-1][v-c[i]]两个子问题递推而来，能否保证在推f[i][v]时（也即在第i次主循环中推f[v]时）能够得到f[i-1][v]和f[i-1][v-c[i]]的值呢？事实上，这要求在每次主循环中我们以v=V..0的顺序推f[v]，这样才能保证推f[v]时f[v-c[i]]保存的是状态f[i-1][v-c[i]]的值。伪代码如下：

for i=..N for v=V.. f[v]=max{f[v],f[v-c[i]]+w[i]};

其中的f[v]=max{f[v],f[v-c[i]]}一句恰就相当于我们的转移方程f[i][v]=max{f[i-1][v],f[i-1][v-c[i]]}，因为现在的f[v-c[i]]就相当于原来的f[i-1][v-c[i]]。如果将v的循环顺序从上面的逆序改成顺序的话，那么则成了f[i][v]由f[i][v-c[i]]推知，与本题意不符，但它却是另一个重要的背包问题P02最简捷的解决方案，故学习只用一维数组解01背包问题是十分必要的。

事实上，使用一维数组解01背包的程序在后面会被多次用到，所以这里抽象出一个处理一件01背包中的物品过程，以后的代码中直接调用不加说明。

过程ZeroOnePack，表示处理一件01背包中的物品，两个参数cost、weight分别表明这件物品的费用和价值。

procedure ZeroOnePack(cost,weight) for v=V..cost f[v]=max{f[v],f[v-cost]+weight}

注意这个过程里的处理与前面给出的伪代码有所不同。前面的示例程序写成v=V..0是为了在程序中体现每个状态都按照方程求解了，避免不必要的思维复杂度。而这里既然已经抽象成看作黑箱的过程了，就可以加入优化。费用为cost的物品不会影响状态f[0..cost-1]，这是显然的。

有了这个过程以后，01背包问题的伪代码就可以这样写：

for i=1..N ZeroOnePack(c[i],w[i]);初始化的细节问题

我们看到的求最优解的背包问题题目中，事实上有两种不太相同的问法。有的题目要求“恰好装满背包”时的最优解，有的题目则并没有要求必须把背包装满。一种区别这两种问法的实现方法是在初始化的时候有所不同。

如果是第一种问法，要求恰好装满背包，那么在初始化时除了f[0]为0其它f[1..V]均设为-∞，这样就可以保证最终得到的f[N]是一种恰好装满背包的最优解。

如果没有要求必须把背包装满，而是只希望价格尽量大，初始化时应该将f[0..V]全部设为0。

可以这样理解：初始化的f数组事实上就是在没有任何物品可以放入背包时的合法状态。如果要求背包恰好装满，那么此时只有容量为0的背包可能被价值为0的nothing“恰好装满”，其它容量的背包均没有合法的解，属于未定义的状态，它们的值就都应该是-∞了。如果背包并非必须被装满，那么任何容量的背包都有一个合法解“什么都不装”，这个解的价值为0，所以初始时状态的值也就全部为0了。

这个小技巧完全可以推广到其它类型的背包问题，后面也就不再对进行状态转移之前的初始化进行讲解。

一个常数优化

前面的伪代码中有 for v=V..1，可以将这个循环的下限进行改进。

由于只需要最后f[v]的值，倒推前一个物品，其实只要知道f[v-w[n]]即可。以此类推，对以第j个背包，其实只需要知道到f[v-sum{w[j..n]}]即可，即代码中的

for i=1..N for v=V..0

可以改成

for i=..n bound=max{V-sum{w[i..n]},c[i]} for v=V..bound

这对于V比较大时是有用的。

小结

01背包问题是最基本的背包问题，它包含了背包问题中设计状态、方程的最基本思想，另外，别的类型的背包问题往往也可以转换成01背包问题求解。故一定要仔细体会上面基本思路的得出方法，状态转移方程的意义，以及最后怎样优化的空间复杂度。

动态规划背包问题动态规划背包问题

安科网

动态规划基本思想

心理学哲学批判性思维

心理学哲学批判性思维

相关推荐

动态规划解决0-1背包问题

PHP动态规划解决0-1背包问题实例分析

动态规划题解（转）

【LeetCode-动态规划】单词拆分

Leetcode算法初学——动态规划算法“打家劫舍”

动态规划的引入 P4017 最大食物链计数【拓扑排序的条数计算】

五大常用算法（二）动态规划算法

53-最大子序和（动态规划与分治法）

leetcode 62. 不同路径-动态规划及优化，双100%

算法<初级> - 第五章递归与动规相关问题（完结）

算法思想__动态规划

91.解码方法（动态规划）

快速上手leetcode动态规划题

动态规划

动态规划-Minimum Distance to Type a Word Using Two Fingers

算法期末备考-第5练-动态规划

算法动态规划

贪心算法

【动态规划专题】1：斐波拉契数列问题的递归和动态规划

102页PPT，DeepMind强化学习最新进展，含图文、公式和代码

心理学哲学批判性思维