「Python」LSTM时序预测状态种子初始化

gad

2017-04-11

关注关注

长短期记忆网络（LSTM）是一种强大的递归神经网络，能够学习长观察值序列。

LSTM的一大优势是它们能有效地预测时间序列，但是作这种用途时配置和使用起来却较为困难。

LSTM的一个关键特性是它们维持一个内部状态，该状态能在预测时提供协助。这就引出了这样一个问题：如何在进行预测之前在合适的 LSTM 模型中初始化状态种子。

在本教程中，你将学习如何设计、进行试验并解释从试验中得出的结果，探讨是用训练数据集给合适的 LSTM 模型初始化状态种子好还是不使用先前状态好。

在完成本教程的学习后，你将了解：

关于如何为合适的 LSTM 预测模型预置状态的开放式问题。
如何开发出强大的测试工具，用于评测 LSTM 模型解决单变量时间序列预测问题的能力。
如何判断在解决您的时间序列预测问题时，于预测前为LSTM状态种子初始化是否适当。

让我们开始吧。

「Python」LSTM时序预测状态种子初始化

Python中如何为LSTM 初始化状态种子进行时间序列预测

教程概览

该教程分为 5 部分；它们分别为：

LSTM状态种子初始化
洗发水销量数据集
LSTM 模型和测试工具
代码编写
试验结果

环境

本教程假设您已安装 Python SciPy 环境。您在学习本示例时可使用Python 2 或 3。

您必须使用TensorFlow或Theano后端安装Keras（2.0或更高版本）。

本教程还假设您已安装scikit-learn、Pandas、 NumPy和Matplotlib。

如果您在安装环境时需要帮助，请查看这篇文章：

如何使用Anaconda安装机器学习和深度学习所需的 Python 环境
http://machinelearningmastery.com/setup-python-environment-machine-learning-deep-learning-anaconda/

LSTM状态种子初始化

当在Keras中使用无状态LSTM时，您可精确控制何时清空模型内部状态。

这是通过使用model.reset_states()函数实现的。

当训练时有状态的LSTM时，清空训练epoch之间的模型状态很重要。这样的话，每个epoch在训练期间创建的状态才会与该epoch的观察值序列相匹配。

假定我们能够实现这种精确控制，还有这样一个问题：是否要以及如何在进行预测前预置LSTM的状态。

选择有：

在预测前重置状态。
在预测前使用训练数据集预置状态。

假定下，使用训练数据集预置模型状态更好，但是这需要用试验进行验证。

另外，状态初始化的方法还有很多种；例如：

完成一个训练epoch，包括权重更新。例如，在最后一个训练epoch结束后不重置状态。
完成训练数据的预测。

一般认为两种方法在某种程度上相当。预测训练数据的后者更好，因为这种方法不需要对网络权重进行任何修改，并且对于存入文件夹的不变网络而言它可以作为可重复步骤。

在本教程中，我们将考虑一下两种方法之间的差别：

使用无状态的合适 LSTM 预测测试数据集（例如在重置之后）。
在预测完训练数据集之后使用有状态的合适LSTM预测测试数据集。

下面，让我们看一下我们将在本试验中使用的标准时间序列数据集。

洗发水销量数据集

该数据集描述某洗发水在3年内的月度销量。

数据单位为销售量，共有36个观察值。原始数据集由Makridakis、Wheelwright和Hyndman（1998）提供。

您可通过此链接下载和进一步了解该数据集：https://datamarket.com/data/set/22r0/sales-of-shampoo-over-a-three-year-period。

下方示例代码加载并生成已加载数据集的视图。

「Python」LSTM时序预测状态种子初始化

运行该示例，以Pandas序列的形式加载数据集，并打印出头5行。

「Python」LSTM时序预测状态种子初始化

然后就可生成显示明显增长趋势的序列线图。

「Python」LSTM时序预测状态种子初始化

洗发水销量线图

接下来，我们将看一下本试验中使用的LSTM配置和测试工具。

LSTM模型和测试工具

数据划分

我们将把洗发水销量数据集分为两个集合：一个训练集和一个测试集。

前两年的销售数据将作为训练数据集，最后一年的数据将作为测试集。

我们将使用训练数据集创建模型，然后对测试数据集进行预测。

模型评测

我们将使用滚动预测的方式，也称为步进式模型验证。

以每次一个的形式运行测试数据集的每个时间步。使用模型对时间步作出预测，然后收集测试组生成的实际预期值，模型将利用这些预期值预测下一时间步。

这模拟了现实生活中的场景，新的洗发水销量观察值会在月底公布，然后被用于预测下月的销量。

训练数据集和测试数据集的结构将对此进行模拟。我们将一步生成所有的预测。

最后，收集所有测试数据集的预测，计算误差值总结该模型的预测能力。采用均方根误差（RMSE）的原因是这种计算方式能够降低粗大误差对结果的影响，所得分数的单位和预测数据的单位相同，即洗发水月度销量。

数据准备

在将为数据集匹配LSTM模型前，我们必须对数据进行转化。

在匹配模型和进行预测之前须进行以下三种数据转化。

转化序列数据使其呈静态。具体来说，就是使用 lag=1差分移除数据中的增长趋势。
将时间序列问题转化为监督学习问题。具体来说，就是将数据组为输入和输出模式，上一时间步的观察值可作为输入用于预测当前时间步的观察值。
转化观察值使其处在特定区间。具体来说，就是将数据缩放带 -1至1的区间内，以满足LSTM模型默认的双曲正切激活函数。

LSTM模型

使用的 LSTM模型将能有效进行预测但是未经调整。

这意味着该模型将与数据匹配，并且能够作出有效预测，但不是匹配该数据集的最优模型。

该网络拓扑包含一个输出、一个4单位的隐藏层和一个1输出值的输出层。

该模型将匹配batch大小为4，epoch为3000的数据集。训练数据集在完成数据准备之后将减少至20个观察值。这样batch大小就可以均匀地分配给训练数据集和测试数据集（作为一项要求）。

试验运行

每种方案将进行30次试验。

这意味着每个方案将创建并评测30个模型。从每次试验收集的均方根误差（RMSE）给出结果分布，然后可使用描述统计学（如平均偏差和标准偏差）方法进行总结。

必须这样做的原因在于，与LSTM类似的神经网络会受其初始条件影响（例如它们的初始随机权重）。

这表示，每个方案的结果将使我们能够解释每个方案的平均性能以及它们的对比情况。

让我们研究一下这些结果。

代码编写

为了使你能重复利用这个试验设置，关键的模块化行为被分为可读性好的函数和可测试性好的函数。

experiment()函数描述了各方案的参数。

完整的代码编写如下方所示：

「Python」LSTM时序预测状态种子初始化

试验结果

运行试验需要花费一些时间或者消耗CPU或GPU硬件。

打印每次试验的均方根误差以表现出进行状态。

在每次试验结束时，计算并打印每种方案的总结数据，包括均值偏差和标准偏差。

完整的输出结果如下所示：

「Python」LSTM时序预测状态种子初始化

另外生成一个盒须图并保存至文件夹，如下所示：

「Python」LSTM时序预测状态种子初始化

初始化和未初始化的LSTM的盒须图

结果很令人意外。

它们表明，在预测测试数据集之前未置入LSTM状态的方案得出的结果更好。

将这种方案预测的平均误差（146.6005050）和另一种方案（初始化状态种子）预测的平均误差（186.432143）做对比即可得出上结论。通过盒须图可以看得更加清楚。

也许选择的模型配置使创建的模型过小而使得预测前初始化状态种子的优点无法在序列和内部状态上显示出来。也可能需要进行更大型的试验。

延伸

令人意外的结果为进一步试验创造了条件。

评测在每次训练epoch结束之后清空和不清空状态产生的影响。
评测一次性预测训练集和测试集对比每次预测一个时间步的影响。
评测在每个epoch结束后重置和不重置LSTM状态的影响。

你尝试过这些延伸试验吗？

总结

通过学习本教程，你学会了如何在解决单变量时间序列预测问题时用试验的方法确定初始化LSTM状态种子的最佳方法。

具体而言，你学习了：

关于在预测前初始化LSTM状态种子的问题和解决该问题的方法。
如何开发出强大的测试工具，评测LSTM模型解决时间序列问题的性能。
如何确定是否在预测前使用训练数据初始化LSTM模型状态种子。

本文作者 Jason Brownlee 博士是一位学术研究员、作家、专业开发者和机器学习从业人员。他致力于帮助开发者开始学习并掌握机器学习应用。

本文由 AI100 编译，转载需得到本公众号同意。

编译：AI100

原文链接：http://machinelearningmastery.com/seed-state-lstms-time-series-forecasting-python/

关于AI100

AI100致力于打造人工智能技术和产业社区。为人工智能开发者提供信息和技术交流的平台；为人工智能创业者提供行业数据及智能应用的商业场景；为行业提供人工智能化的技术商业应用。请快快关注AI100公众号吧！

初始化 lstm 深度学习 python

gad

0 关注 0 粉丝 0 动态

关注关注

三分钟完成 ubuntu16.04初始化,Java,maven,docker环境的部署问题

Linux初始化和一些常用环境的搭建是一个虽简单但费时的工作，尤其是你的Linux由于某种不可控的因素宕机了，这意味着你又要从头开始部署一遍环境，有些令人抓狂，因此我有了搭建这个Linux初始化脚本库的想法，不管小白还是大佬，只需一键运行，然后喝杯咖啡，环

worldsnow 2020-11-06

spring容器内置的事件的顺序和说明

spring容器内置的事件的顺序和说明。refresh() --- 具体的注入bean

xuejianbest 2020-11-11

面试官：讲讲类的加载、链接和初始化？

作者个人研发的在高并发场景下，提供的简单、稳定、可扩展的延迟消息队列框架，具有精准的定时任务和延迟队列处理功能。自开源半年多以来，已成功为十几家中小型企业提供了精准定时调度方案，经受住了生产环境的考验。为使更多童鞋受益，现给出开源框架地址：。这不，一名读者

csdnxingyuntian 2020-11-02

SpringBoot Web 应用源码解析：综合实战和整体总结

关于 Web 方面的配置比较多，值得庆幸的是，Spring Boot 已经帮我们预置初始化了很多基础组件。但在实践的过程中，某些基础的组件并不能满足我们的实际需求,这时就需要我们重新初始化相应组件，甚至在某些极端的情况下需要完全接管 Spring Boot

丽丽 2020-10-30

一篇读懂Linux 是如何管理内存的

每个 Linux 进程都会有地址空间，这些地址空间由三个段区域组成：text 段、data 段、stack 段。数据段分为两部分，已经初始化的数据和尚未初始化的数据。所有 BSS 部分中的变量在加载后被初始化为 0 。和代码段不一样，data segme

bluecarrot 2020-09-17

详解Go语言中关于包导入必学的 8 个知识点

在 Go 语言中，一个包可包含多个 .go 文件，只要这些 .go 文件的头部都使用 package 关键字声明了同一个包。如你所见，Go 语言中导入的包，必须得用双引号包含，在这里吐槽一下。防止导入的包名和本地的变量发生冲突，比如 path 这个很常用

哈嘿Blog 2020-08-16

golang 进度条功能实现示例

最近在做一个需求，功能很简单，就是开发一个轻量级客户端，将一个指定文件中的内容通过 TCP 发送到服务器。由于该文件特别大，有可能到达100G的数量级，因此处理起来会比较慢，为了给用户提供比较友好的展示界面，因此，在其中加入了进度条显示功能。在这里，说一下

qidiantianxia 2020-08-16

proxmox ve 6.2.1 初始化脚本

apt update && apt upgrade -y && apt dist-upgrade -y. apt install -y vim net-tools wget curl htop git axel aria2

84931231 2020-07-30

JVM(类加载机制,虚拟机栈,)

类加载器子系统负责从文件系统或者网络中加载Class文件，class文件在文件开头有特定的文件标识。ClassLoader只负责class文件的加载，至于它是否可以运行，则由Execution Engine决定。主要包括四种验证，文件格式验证，元数据验证，

ChenRuiyz 2020-07-26

Spark 源码解读（五）SparkContext的初始化之创建和启动DAGScheduler

DAGScheduler主要用于在任务正式提交给TaskSchedulerImpl提交之前做一些准备工作，包括：创建job,将DAG中的RDD划分到不同的Stage,提交Stage等等。SparkContext中创建DAGScheduler的代码如下所示：

yanqianglifei 2020-07-07

自描述C++部分面试题集

在类中定义的数据成员一般都是基本的数据类型。C++中对对象的初始化时非常重要的操作，当创建一个对象的适合，C++编译器必须确保调用了所有子对象的构造函数。如果所有的子对象有默认构造函数，编译器可以自动调用他们。也就是说，先调用对象成员的构造函数，再调用本身

wbczyh 2020-07-05

嵌入式Linux系统的几大组件！

本文概述了Linux系统的几大组件，描述了这些组件之间的关系。文章解释了术语，并描述看似很基础的细节。其中一个组件从技术上讲是Linux之外的，常常不被谈论。其余组件都是共同打造整个Linux系统的所有软件元素。因此，Linux内核仅启动一个程序，并让该程

BOBShe 2020-07-03

redis集群

　　第一次进行全量复制，即将主服务器的数据通过rdb保存起来，然后复制到从服务器中，以后通过sync命令不断复制主服务器执行的命令来完成数据的同步。　　　　启动过程初始化服务器，替换sentinel代码，初始化sentinel状态，根据配置文件初始化监

yang0cs 2020-06-28

c/c++内存分区

主要用于存储函数的参数和局部变量。栈区由系统进行内存管理，在函数执行完成时，系统自动释放栈区的内存，而不需要用户的参与，整个程序的栈区的大小可以在编译器中由用户自行设定。如果用户忘记对所申请的内存资源进行释放，该内存资源可能会在程序结束时由操。初始化的全局

fushilin 2020-06-28

APP——自动化——python——关闭和打开初始化（desired_caps中设置的的app

‘platformVersion‘: ‘8.0.0‘, #待测手机系统版本。"unicodeKeyboard":"true", #支持中文输入，会自动安装unico

清水寺小僧 2020-06-25

paddle设计思想

　　python被组织成一个ProgramDesc，用户通过调用paddle提供算子来向Program添加tensor以及对变量的操作Operators，用户只需描述前向计算，原始的programDesc转化为一个中间语言Transplier。　　一个pa

uileader 2020-06-21

Dubbo-服务提供者初始化

事件发布，执行onApplicationEvent，开始执行ServiceBean暴露export操作。当Spring容器处理完<dubbo:service>标签后，会在Spring容器中生成一个ServiceBean ，服务的发布也会在Ser

wangyangsoftware 2020-06-16

Go语言变量（三）

变量是几乎所有的编程语言中最基本的组成元素。在Go语言中，变量和其它的C语言系的语言都是不同的，看下面的声明就知道了。Go语言的变量的声明和 js 和像，也是使用var来进行标识的。但是Go语言是静态类型语言，因些，变量是具有明确类型的，编译器也会检查变

cleanerxiaoqiang 2020-06-16

6、Go语言基础之数组

数组是同一种数据类型元素的集合。在Go语言中，数组从声明时就确定，使用时可以修改数组成员，但是数组大小不可变化。比如：var a [5]int，数组的长度必须是常量，并且长度是数组类型的一部分。一旦定义，长度不能变。数组可以通过下标进行访问，下标是从0开

xuguiyi00 2020-06-14

centos7下安装mysql6初始化安装密码的方法

# Remove leading # and set to the amount of RAM for the most important data. # cache in MySQL. Start at 70% of total RAM for ded

Accpcjg 2020-06-14

安科网

「Python」LSTM时序预测状态种子初始化

gad

教程概览

LSTM状态种子初始化

洗发水销量数据集

LSTM模型和测试工具

代码编写

试验结果

延伸

总结

gad

相关推荐

三分钟完成 ubuntu16.04初始化,Java,maven,docker环境的部署问题

spring容器内置的事件的顺序和说明

面试官：讲讲类的加载、链接和初始化？

SpringBoot Web 应用源码解析：综合实战和整体总结

一篇读懂Linux 是如何管理内存的

详解Go语言中关于包导入必学的 8 个知识点

golang 进度条功能实现示例

proxmox ve 6.2.1 初始化脚本

JVM(类加载机制,虚拟机栈,)

Spark 源码解读（五）SparkContext的初始化之创建和启动DAGScheduler

自描述C++部分面试题集

嵌入式Linux系统的几大组件！

redis集群

c/c++内存分区

APP——自动化——python——关闭和打开初始化（desired_caps中设置的的app

paddle设计思想

Dubbo-服务提供者初始化

Go语言变量（三）

6、Go语言基础之数组

centos7下安装mysql6初始化安装密码的方法

gad

「Python」LSTM时序预测状态种子初始化

教程概览

LSTM状态种子初始化

洗发水销量数据集

LSTM模型和测试工具

代码编写

试验结果

延伸

总 结

相关推荐

总结