手把手教你用Python库Keras做预测（附代码）

Himaxin

2018-05-30

关注关注

翻译：张逸

校对：冯羽

本文约2804字，建议阅读7分钟。

本文将教你如何使用Keras这个Python库完成深度学习模型的分类与回归预测。

当你在Keras中选择好最合适的深度学习模型，就可以用它在新的数据实例上做预测了。但是很多初学者不知道该怎样做好这一点，我经常能看到下面这样的问题：

“我应该如何用Keras对我的模型作出预测？”

在本文中，你会学到如何使用Keras这个Python库完成深度学习模型的分类与回归预测。

看完这篇教程，你能掌握以下几点：

如何确定一个模型，为后续的预测做准备
如何用Keras对分类问题进行类及其概率的预测
如何用Keras进行回归预测

现在就让我们开始吧

手把手教你用Python库Keras做预测（附代码）

本文结构

教程共分为三个部分，分别是：

模型确定
分类预测
回归预测

模型确定

在做预测之前，首先得训练出一个最终的模型。你可能选择k折交叉验证或者简单划分训练/测试集的方法来训练模型，这样做的目的是为了合理估计模型在样本集之外数据上的表现（新数据）

当评估完成，这些模型存在的目的也达到了，就可以丢弃他们。接下来，你得用所有的可用数据训练出一个最终的模型。关于这方面的内容，你可以在下面这个文章中得到更多的信息：

https://machinelearningmastery.com/train-final-machine-learning-model/

分类预测

对于分类问题，模型学习的是一个输入特征到输出特征之间的映射，这里的输出即为一个标签。比如“垃圾邮件”和“非垃圾邮件”

下边是Keras中为简单的二分类问题开发的神经网络模型的一个例子。如果说你以前没有接触过用Keras开发神经网络模型的话，不妨先看看下边这篇文章：

https://machinelearningmastery.com/tutorial-first-neural-network-python-keras/

# 训练一个最终分类的模型

from keras.models import Sequential

from keras.layers import Dense

from sklearn.datasets.samples_generator import make_blobs

from sklearn.preprocessing import MinMaxScaler

# 生成一个二分类问题的数据集

X, y = make_blobs(n_samples=100, centers=2, n_features=2, random_state=1)

scalar = MinMaxScaler()

scalar.fit(X)

X = scalar.transform(X)

# 定义并拟合模型

model = Sequential()

model.add(Dense(4, input_dim=2, activation='relu'))

model.add(Dense(4, activation='relu'))

model.add(Dense(1, activation='sigmoid'))

model.compile(loss='binary_crossentropy', optimizer='adam')

model.fit(X, y, epochs=200, verbose=0)

建立好这个模型后，可能需要将它保存到文件中（比如通过Keras的相关API）。以后你就可以随时加载这个模型，并用它进行预测了。有关这方面的示例，可以参考下边的文章：

https://machinelearningmastery.com/save-load-keras-deep-learning-models/

为了本文的结构更简洁，我们的例子中省去了这个步骤。

继续说回到分类预测的问题。我们希望最终得到的模型能进行两种预测：一是判断出类别，二是给出属于相应类别概率。

类预测

一个类别预测会给定最终的模型以及若干数据实例，我们利用模型来判断这些实例的类别。对于新数据，我们不知道输出的是什么结果，这就是为什么首先需要一个模型。

在Keras中，可以利用predict_class()函数来完成我们上述所说的内容----即利用最终的模型预测新数据样本的类别。

需要注意的是，这个函数仅适用于Sequential模型，不适于使用功能式API开发的模型。（not those models developed using the functional API.）

比如，我们在名为Xnew的数组中有若干个数据实例，它被传入predict_classes()函数中，用来对这些数据样本的类别进行预测。

Xnew = [[...], [...]]

ynew = model.predict_classes(Xnew)

让我们用一个更具体的例子来说明：

# 建立一个新的分类模型

from keras.models import Sequential

from keras.layers import Dense

from sklearn.datasets.samples_generator import make_blobs

from sklearn.preprocessing import MinMaxScaler

# 生成二分类数据集

X, y = make_blobs(n_samples=100, centers=2, n_features=2, random_state=1)

scalar = MinMaxScaler()

scalar.fit(X)

X = scalar.transform(X)

# 定义并拟合最终模型

model = Sequential()

model.add(Dense(4, input_dim=2, activation='relu'))

model.add(Dense(4, activation='relu'))

model.add(Dense(1, activation='sigmoid'))

model.compile(loss='binary_crossentropy', optimizer='adam')

model.fit(X, y, epochs=500, verbose=0)

# 新的未知数据实例

Xnew, _ = make_blobs(n_samples=3, centers=2, n_features=2, random_state=1)

Xnew = scalar.transform(Xnew)

# 作出预测

ynew = model.predict_classes(Xnew)

# 显示输入和输出

for i in range(len(Xnew)):

print("X=%s, Predicted=%s" % (Xnew[i], ynew[i]))

下面是对三个实例预测的结果，我们将数据和预测结果一并输出：

X=[0.89337759 0.65864154], Predicted=[0]

X=[0.29097707 0.12978982], Predicted=[1]

X=[0.78082614 0.75391697], Predicted=[0]

如果你只有一个新的实例，那就需要将它包装一下，变成一个数组的形式。以便传给predict_classes()函数，比如这样：

from keras.models import Sequential

from keras.layers import Dense

from sklearn.datasets.samples_generator import make_blobs

from sklearn.preprocessing import MinMaxScaler

from numpy import array

# 生成一个二分类数据集

X, y = make_blobs(n_samples=100, centers=2, n_features=2, random_state=1)

scalar = MinMaxScaler()

scalar.fit(X)

X = scalar.transform(X)

# 定义并拟合最终的新模型

model = Sequential()

model.add(Dense(4, input_dim=2, activation='relu'))

model.add(Dense(4, activation='relu'))

model.add(Dense(1, activation='sigmoid'))

model.compile(loss='binary_crossentropy', optimizer='adam')

model.fit(X, y, epochs=500, verbose=0)

# 未知的新实例

Xnew = array([[0.89337759, 0.65864154]])

# 作出预测

ynew = model.predict_classes(Xnew)

# 显示输入输出

print("X=%s, Predicted=%s" % (Xnew[0], ynew[0]))

运行上边这个例子，会得到对这个单独实例的预测结果

X=[0.89337759 0.65864154], Predicted=[0]

关于类别标签的注意事项

准备数据时，应该将其中的类别标签转换为整数表示（比如原始数据类别可能是一个字符串），这时候你就可能会用到sklearn中的LabelEncoder。

http://scikitlearn.org/stable/modules/generated/sklearn.preprocessing.LabelEncoder.html#sklearn.preprocessing.LabelEncoder

当然，在我们使用LabelEcoder中的函数inverse_transform()时，还可以将那些整数表示的类别标签转换回去。

因为这个原因，在拟合最终模型时，你可能想要保存用于编码y值的LabelEncoder结果。

概率预测

另外一种是对数据实例属于某一类的可能性进行预测。它被称为“概率预测”，当给定一个新的实例，模型返回该实例属于每一类的概率值。（0-1之间）

在Keras中，我们可以调用predict_proba()函数来实现。举个例子：

Xnew = [[...], [...]]

ynew = model.predict_proba(Xnew)

在二分类问题下，Sigmoid激活函数常被用在输出层，预测概率是数据对象属于类别1的可能性，或者属于类别0的可能性（1-概率）

在多分类问题下，则是softmax激活函数常被用在输出层。数据对象属于每一个类别的概率作为一个向量返回。

下边的例子对Xnew数据数组中的每个样本进行概率预测。

from keras.models import Sequential

from keras.layers import Dense

from sklearn.datasets.samples_generator import make_blobs

from sklearn.preprocessing import MinMaxScaler

# 生成二分类数据集

X, y = make_blobs(n_samples=100, centers=2, n_features=2, random_state=1)

scalar = MinMaxScaler()

scalar.fit(X)

X = scalar.transform(X)

# 定义并拟合出最终模型

model = Sequential()

model.add(Dense(4, input_dim=2, activation='relu'))

model.add(Dense(4, activation='relu'))

model.add(Dense(1, activation='sigmoid'))

model.compile(loss='binary_crossentropy', optimizer='adam')

model.fit(X, y, epochs=500, verbose=0)

# 新的未知数据

Xnew, _ = make_blobs(n_samples=3, centers=2, n_features=2, random_state=1)

Xnew = scalar.transform(Xnew)

# 做预测

ynew = model.predict_proba(Xnew)

# 显示输入输出

for i in range(len(Xnew)):

print("X=%s, Predicted=%s" % (Xnew[i], ynew[i]))

我们运行这个实例，并将输入数据及这些实例属于类别1的概率打印出来：

X=[0.89337759 0.65864154], Predicted=[0.0087348]

X=[0.29097707 0.12978982], Predicted=[0.82020265]

X=[0.78082614 0.75391697], Predicted=[0.00693122]

回归预测

回归预测是一个监督学习问题，该模型学习一个给定输入样本到输出数值的映射。比如会输出0.1或0.2这样的数字。

下边是一个Keras回归的模型。

# 训练一个回归模型的例子

from keras.models import Sequential

from keras.layers import Dense

from sklearn.datasets import make_regression

from sklearn.preprocessing import MinMaxScaler

# 生成回归数据集

X, y = make_regression(n_samples=100, n_features=2, noise=0.1, random_state=1)

scalarX, scalarY = MinMaxScaler(), MinMaxScaler()

scalarX.fit(X)

scalarY.fit(y.reshape(100,1))

X = scalarX.transform(X)

y = scalarY.transform(y.reshape(100,1))

# 定义并拟合模型

model = Sequential()

model.add(Dense(4, input_dim=2, activation='relu'))

model.add(Dense(4, activation='relu'))

model.add(Dense(1, activation='linear'))

model.compile(loss='mse', optimizer='adam')

model.fit(X, y, epochs=1000, verbose=0)

我们可以在最终的模型中调用predict()函数进行数值的预测。该函数以若干个实例组成的数组作为输入参数。

下面的例子演示了如何对未知的多个数据实例进行回归预测。

from keras.models import Sequential

from keras.layers import Dense

from sklearn.datasets import make_regression

from sklearn.preprocessing import MinMaxScaler

# 生成回归数据集

X, y = make_regression(n_samples=100, n_features=2, noise=0.1, random_state=1)

scalarX, scalarY = MinMaxScaler(), MinMaxScaler()

scalarX.fit(X)

scalarY.fit(y.reshape(100,1))

X = scalarX.transform(X)

y = scalarY.transform(y.reshape(100,1))

# 定义并拟合模型

model = Sequential()

model.add(Dense(4, input_dim=2, activation='relu'))

model.add(Dense(4, activation='relu'))

model.add(Dense(1, activation='linear'))

model.compile(loss='mse', optimizer='adam')

model.fit(X, y, epochs=1000, verbose=0)

# 未知的新数据

Xnew, a = make_regression(n_samples=3, n_features=2, noise=0.1, random_state=1)

Xnew = scalarX.transform(Xnew)

# 作出预测

ynew = model.predict(Xnew)

# 显示输入输出

for i in range(len(Xnew)):

print("X=%s, Predicted=%s" % (Xnew[i], ynew[i]))

运行上面那个多分类预测实例，然后将输入和预测结果并排打印，进行对比。

X=[0.29466096 0.30317302], Predicted=[0.17097184]

X=[0.39445118 0.79390858], Predicted=[0.7475489]

X=[0.02884127 0.6208843 ], Predicted=[0.43370453]

同样的，这个函数可以用于单独实例的预测，前提是它们包装成适当的格式。

举例说明：

from keras.models import Sequential

from keras.layers import Dense

from sklearn.datasets import make_regression

from sklearn.preprocessing import MinMaxScaler

from numpy import array

# 生成回归数据集

X, y = make_regression(n_samples=100, n_features=2, noise=0.1, random_state=1)

scalarX, scalarY = MinMaxScaler(), MinMaxScaler()

scalarX.fit(X)

scalarY.fit(y.reshape(100,1))

X = scalarX.transform(X)

y = scalarY.transform(y.reshape(100,1))

# 定义并拟合模型

model = Sequential()

model.add(Dense(4, input_dim=2, activation='relu'))

model.add(Dense(4, activation='relu'))

model.add(Dense(1, activation='linear'))

model.compile(loss='mse', optimizer='adam')

model.fit(X, y, epochs=1000, verbose=0)

# 新的数据

Xnew = array([[0.29466096, 0.30317302]])

# 作出预测

ynew = model.predict(Xnew)

# 显示输入输出

print("X=%s, Predicted=%s" % (Xnew[0], ynew[0]))

运行实例并打印出结果：

X=[0.29466096 0.30317302], Predicted=[0.17333156]

延伸阅读

这部分提供了一些相关的资料，如果你想更深入学习的话可以看一看。

How to Train a Final Machine Learning Model：

https://machinelearningmastery.com/train-final-machine-learning-model/

Save and Load Your Keras Deep Learning Models：

https://machinelearningmastery.com/save-load-keras-deep-learning-models/

Develop Your First Neural Network in Python With Keras Step-By-Step：

https://machinelearningmastery.com/tutorial-first-neural-network-python-keras/

The 5 Step Life-Cycle for Long Short-Term Memory Models in Keras：

https://machinelearningmastery.com/5-step-life-cycle-long-short-term-memory-models-keras/

How to Make Predictions with Long Short-Term Memory Models in Keras：

https://machinelearningmastery.com/make-predictions-long-short-term-memory-models-keras/

总结：

在本教程中，你知道了如何使用Keras库通过最终的深度学习模型进行分类和回归预测。

具体来说，你了解到：

如何确定一个模型，为后续的预测做准备
如何用Keras对分类问题进行类及其概率的预测
如何用Keras进行回归预测

对本文的内容有什么问题吗？在下面的评论中提出来，我将尽我所能来回答。

原文链接：

https://machinelearningmastery.com/how-to-make-classification-and-regression-predictions-for-deep-learning-models-in-keras/

译者简介

手把手教你用Python库Keras做预测（附代码）

张逸，中国传媒大学大三在读，主修数字媒体技术。对数据科学充满好奇，感慨于它创造出来的新世界。目前正在摸索和学习中，希望自己勇敢又热烈，学最有意思的知识，交最志同道合的朋友。

keras python 预测模型

Himaxin

0 关注 0 粉丝 0 动态

关注关注

Python中读取图片的6种方式

Python进行图片处理，第一步就是读取图片，这里给大家整理了6种图片的读取方式，并将读取的图片装换成numpy.ndarray()格式。首先需要准备一张照片，假如你有女朋友的话，可以用女朋友的，没有的话，那还学啥Python，赶紧找对象去吧!#将图片转换

xiaoxiaokeke 15评论 2020-11-04

比Keras更好用的机器学习“模型包”：0代码上手做模型

做机器学习模型时，只是融合各种算法，就已经用光了脑细胞？一位毕业于哥廷根大学、做机器学习的小哥也发现了这个问题：原本只是想设计个模型，结果“实现比设计还麻烦”。也就是说，用户只需要知道各种机器学习模型的原理，但不需要再自己动手写代码。相比于Keras，这个

KyrieHe 2020-10-04

Keras创始人：过去6个月，深度学习岗位已崩溃

深度学习岗位在这6个月以来已经崩溃。对于那些投资深度学习的小企业来说，目前的情形已经很清楚了：深度学习岗位不是必须的，随着疫情的到来，它们将可能被裁撤。需要澄清一下，我个人认为这只是一个疫情期间经济衰退的现象，而不是又一个AI寒冬。知情网友在针对这场话题的

davidsmith 2020-09-04

2020年深度学习框架对比速读

TensorFlow于2015年11月面世，基于Apache License 2.0协议发布，由Google Brain团队研发。到目前为止也是github上热度最高、使用人数最多的深度学习框架，业界很多招聘要求中也提到了它。2019年3月推出Tenso

GDGYZL 2020-08-28

TensorFlow 2入门指南，初学者必备！

TensorFlow是谷歌推出的深度学习框架，于2019年发布了第二版。它是世界上最著名的深度学习框架之一，被行业专家和研究人员广泛使用。Tensorflow v1难以使用和理解，因为它的Pythonic较少，但是随着Keras发行的v2现在与Tenso

comwayLi 2020-08-16

机器学习带你横扫乐坛，你就是下一个方文山

我太爱北极猴子乐队了，但他们已经很久没有发行新单曲了。久久欠缺精神食粮的我某天晚上突然灵机一动，我可以自给自足呀!于是我写了个简单的代码，用Keras和TensorFlow训练了一个文本生成模型，写出一首全新的北极猴子的歌。不过条件有限，这玩意儿无法跟真正

xiaoxiaokeke 2020-08-04

Keras调用LSTM之函数接口介绍

activation: 要使用的激活函数，如果传入None，则不使用激活函数。默认分段线性近似 sigmoid 。use_bias: 布尔值，该层是否使用偏置向量。如果为 True，初始化时，将忘记门的偏置加 1。将其设置为 True 同时还会强制bi

xiaoxiaokeke 2020-07-28

Tensorflow-gpu训练SSD时遇到的问题及解决方法

问题一：使用GTX2080的显卡，在batch_size只有8的情况下，训练速度只有2-3秒每步。重新执行你的训练指令就可以了。在我的训练中，成功启动cuda后，速度提升了10倍。

诗蕊 2020-07-20

Keras之对鸢尾花识别

鸢尾花数据集是一个经典的机器学习数据集，非常适合用来入门。这四个特征确定了单株鸢尾花的下列植物学特征：。机器学习中，为了保证测试结果的准确性，一般会从数据集中抽取一部分数据专门留作测试，其余数据用于训练。One-Hot编码是分类变量作为二进制向量的表示。O

dataastron 2020-07-18

TensorFlow被曝存严重bug，搭配Keras可能丢失权重，至今仍未修复

每个在自定义层中使用Keras函数式API的用户都要注意了！使用用Keras的Functional API创建的权重，可能会丢失。这一话题在Reddit机器学习板块上被热议，引起不少TensorFlow用户共鸣。也就是说，原本需要训练的权重现在被冻结了。让

Niteowl 2020-07-15

利用Keras中的权重约束减少深度神经网络中的过拟合

权重约束提供了一种方法，用于减少深度学习神经网络模型对训练数据的过度拟合，并改善模型对新数据的性能。有多种类型的权重约束，例如最大和单位向量规范，有些需要必须配置的超参数。如何使用Keras API创建向量范数约束。约束是按层指定的，但是在层中应用和强制执

zhongkeli 2020-07-14

python中Keras下载mnist数据集

直接写代码进行加载数据集，如果没有下载数据集，它会自动进行下载。等待下载完成即可。首先我们直接访问链接进行下载，官方下载地址，将下载好的文件，复制到..\.keras\datasets 文件夹下即可。然后就可以直接使用上面的load_data()函数进行

xiaoxiaokeke 2020-06-27

随机森林 {Keras 由浅入深}

随机森林是集成学习中的一种方法。

KyrieHe 2020-06-25

Keras安装 {Keras 由浅入深}

dependencies:cuDNN .HDF5 and h5py .graphviz and pydot .用tensorflow能够使得传统的keras程序有较好的扩展性。

dataastron 2020-06-25

决策树 {Keras 由浅入深}

决策树是基于区域的机器学习方法，是非线性的。构建决策树最重要的环节其实就是选择分类变量，分类变量的存在使得产生非线性解，决策树能够很好的解决非线性分类，但是树的生成的终止条件很难把握，并且由于生成的随机性，往往使得决策树过于敏感，容易发生过拟合。所以对于一

xiaoxiaokeke 2020-06-25

目标检测算法-YOLO-V4代码详解

Yolo-V4算法中对网络进行了改进，使用CSPDarknet53。对主干网络进行了修改，将原先的Darknet53改为CSPDarknet53，其中是将激活函数改为Mish激活函数，并且在网络中加入了CSP结构。对特征提取过程的加强，添加了SPP，PAN

CodeWang 2020-06-21

使用GPU在AIStudio服务器进行猫狗分类 Keras框架

　　本地没有GPU环境，今天在百度AIStudio的GPU服务器上竟然跑起来了Keras版本的猫狗分类，服务器配置如图：　　具体操作步骤。　　1.首先打开百度AI Studio，并建立自己的工程。　　2.数据准备，下载猫狗分类数据集在本地电脑，选取猫狗各2

xiaoxiaokeke 2020-06-16

使用Keras实现简单线性回归模型操作

神经网络可以用来模拟回归问题，实质上是单输入单输出神经网络模型，例如给下面一组数据，用一条线来对数据进行拟合，并可以预测新输入 x 的输出值。然后用 Sequential 建立 model，再用 model.add 添加神经层，添加的是 Dense 全连

zhongkeli 2020-06-14

keras 读取多标签图像数据方式

其中label包括两类标签，label1第一类：上衣，裤子，外套。label2第二类，蓝色，黑色，红色。这样两个输出label1，label2都是是分类，我们可以直接把label1和label2整合为一个label，直接编码，比如[蓝色，上衣]编码为[01

lujiandong 2020-06-14

浅谈cv2.imread()和keras.preprocessing中的image.load_img()区别

#image.load_img()只是加载了一个文件，没有形成numpy数组，[108. 108. 110. 115. 119. 120. 122. 125. 127. 127. 129. 131. 132. 134.76 72 68 68 67 66 6

Himaxin 2020-06-14

安科网

手把手教你用Python库Keras做预测（附代码）

Himaxin

本文将教你如何使用Keras这个Python库完成深度学习模型的分类与回归预测。

Himaxin

相关推荐

Python中读取图片的6种方式

比Keras更好用的机器学习“模型包”：0代码上手做模型

Keras创始人：过去6个月，深度学习岗位已崩溃

2020年深度学习框架对比速读

TensorFlow 2入门指南，初学者必备！

机器学习带你横扫乐坛，你就是下一个方文山

Keras调用LSTM之函数接口介绍

Tensorflow-gpu训练SSD时遇到的问题及解决方法

Keras之对鸢尾花识别

TensorFlow被曝存严重bug，搭配Keras可能丢失权重，至今仍未修复

利用Keras中的权重约束减少深度神经网络中的过拟合

python中Keras下载mnist数据集

随机森林 {Keras 由浅入深}

Keras安装 {Keras 由浅入深}

决策树 {Keras 由浅入深}

目标检测算法-YOLO-V4代码详解

使用GPU在AIStudio服务器进行猫狗分类 Keras框架

使用Keras实现简单线性回归模型操作

keras 读取多标签图像数据方式

浅谈cv2.imread()和keras.preprocessing中的image.load_img()区别

Himaxin