轻松体验TensorFlow 第一个神经网络:基本分类(Part 2)

关于 Jupyter Notebook的使用,可以参考如下链接,有详细的步骤和截图:

Jupyter Notebook神器-免费体验来自微软的Azure Notebook

基于Jupyter Notebook 快速体验Python和plot()绘图方法

基于Jupyter Notebook 快速体验matplotlib.pyplot模块中绘图方法

TensorFlow 基本分类(basic classification)演示的完整代码,可以访问:

https://notebooks.azure.com/rickiechina/projects/pythontutorial/html/Tensorflow-Tutorial.ipynb

轻松体验TensorFlow 第一个神经网络:基本分类(Part 2)

本文是第二部分(Part 2),上一篇文章(Part 1),请访问:

轻松体验TensorFlow 第一个神经网络:基本分类(Part 1)

6. 构建模型

构建神经网络需要配置模型(model)的层,然后再编译模型。

(1)设置层(Setup the layers)

一个神经网络最基本的组成部分便是层(layer)。层从提供给他们的数据中提取表示结果( representations),并期望这些表示结果有助于解决当前问题。

大多数深度学习是由串连在一起的层所组成。大多数层,例如tf.keras.layers.Dense,具有在训练期间要学习的参数。

model = keras.Sequential([

keras.layers.Flatten(input_shape=(28, 28)),

keras.layers.Dense(128, activation=tf.nn.relu),

keras.layers.Dense(10, activation=tf.nn.softmax)

])

第一层 tf.keras.layers.Flatten,将图像格式从一个二维数组(包含着28x28个像素)转换成为一个包含着28 * 28 = 784个像素的一维数组。可以将该层视为图像中像素未堆叠的行,并排列这些行。该层没有要学习的参数;它只改动数据的格式。

在扁平化像素之后,该网络包含两个 tf.keras.layers.Dense 层的序列。这些层是密集连接或全连接神经层。第一个 Dense 层具有 128 个节点(或神经元)。第二个(也是最后一个)层是具有 10 个节点的 softmax 层,该层会返回一个具有 10 个概率得分的数组,这些得分的总和为 1。每个节点包含一个得分,表示当前图像属于 10 个类别中某一个的概率。

(2)编译模型

模型还需要再进行几项设置才可以开始训练。这些设置会添加到模型的编译步骤:

  • 损失函数 - 衡量模型在训练期间的准确率。我们希望尽可能缩小该函数,以“引导”模型朝着正确的方向优化。
  • 优化器 - 根据模型看到的数据及其损失函数更新模型的方式。
  • 指标 - 用于监控训练和测试步骤。以下示例使用准确率(accuracy),即图像被正确分类的比例。

model.compile(optimizer=tf.train.AdamOptimizer(),

loss='sparse_categorical_crossentropy',

metrics=['accuracy'])

7. 训练模型

训练神经网络模型需要执行以下步骤:

  • 将训练数据馈送到模型中,在本示例中为 train_images 和 train_labels 数组。
  • 模型学习将图像与标签相关联。
  • 我们要求模型对测试集进行预测,在本示例中为 test_images 数组。我们会验证预测结果是否与 test_labels 数组中的标签一致。

要开始训练,请调用 model.fit 方法,使模型对训练数据“拟合”:

model.fit(train_images, train_labels, epochs=5)

轻松体验TensorFlow 第一个神经网络:基本分类(Part 2)

在模型训练期间,系统会显示损失和准确率指标。该模型在训练数据上的准确率达到约0.88(即 88%)。

8. 评估准确率

接下来,比较一下模型在测试数据集上的表现:

test_loss, test_acc = model.evaluate(test_images, test_labels)

print('Test accuracy:', test_acc)

轻松体验TensorFlow 第一个神经网络:基本分类(Part 2)

结果表明,模型在测试数据集上的准确率略低于在训练数据集上的准确率。训练准确率和测试准确率之间的这种差异表示出现过拟合。如果机器学习模型在新数据上的表现不如在训练数据上的表现,就表示出现过拟合。

9. 进行预测

通过训练模型,我们可以使用它来预测某些图像。

predictions = model.predict(test_images)

在此,模型已经预测了测试集中每个图像的标签。我们来看看第一个预测:

predictions[0]

轻松体验TensorFlow 第一个神经网络:基本分类(Part 2)

预测是10个数字的数组。这些描述了模型的"信心",即图像对应于10种不同服装中的每一种。我们可以看到哪个标签具有最高的置信度值:

np.argmax(predictions[0])

输出为:9

轻松体验TensorFlow 第一个神经网络:基本分类(Part 2)

查看9 对应的类别 -- class_names[9],输出 Ankle boot。

接着,我们检查测试标签,看看预测是否正确:

test_labels[0]

输出为:9(说明预测结果正确)

进一步使用图表来显示全部10个类别。

首先,定义2个函数,分别为:

  • plot_image 显示预测的图像;
  • plot_value_array 显示针对图像预测的结果,也就是10个类别的概率值;

具体代码如下:

def plot_image(i, predictions_array, true_label, img):

predictions_array, true_label, img = predictions_array[i], true_label[i], img[i]

plt.grid(False)

plt.xticks([])

plt.yticks([])

plt.imshow(img, cmap=plt.cm.binary)

predicted_label = np.argmax(predictions_array)

if predicted_label == true_label:

color = 'blue'

else:

color = 'red'

plt.xlabel("{} {:2.0f}% ({})".format(class_names[predicted_label],

100*np.max(predictions_array),

class_names[true_label]),

color=color)

def plot_value_array(i, predictions_array, true_label):

predictions_array, true_label = predictions_array[i], true_label[i]

plt.grid(False)

plt.xticks([])

plt.yticks([])

thisplot = plt.bar(range(10), predictions_array, color="#777777")

plt.ylim([0, 1])

predicted_label = np.argmax(predictions_array)

thisplot[predicted_label].set_color('red')

thisplot[true_label].set_color('blue')

让我们看看第0个图像,预测图像和预测数组。从下图来看,预测结果正确(蓝色代码真实的类别)。

i = 0

plt.figure(figsize=(6,3))

plt.subplot(1,2,1)

plot_image(i, predictions, test_labels, test_images)

plt.subplot(1,2,2)

plot_value_array(i, predictions, test_labels)

plt.show()

轻松体验TensorFlow 第一个神经网络:基本分类(Part 2)

让我们看看第12个图像,预测图像和预测数组。从下图来看,预测结果不正确(红色代表预测类别,蓝色代表真实类别)。

i = 12

plt.figure(figsize=(6,3))

plt.subplot(1,2,1)

plot_image(i, predictions, test_labels, test_images)

plt.subplot(1,2,2)

plot_value_array(i, predictions, test_labels)

plt.show()

轻松体验TensorFlow 第一个神经网络:基本分类(Part 2)

让我们绘制几个图像及其预测结果。正确的预测标签是蓝色的,不正确的预测标签是红色的。该数字给出了预测标签的百分比(满分100)。请注意,即使非常自信,也可能出错。

# 绘制前X个测试图像,预测标签和真实标签

# 以蓝色显示正确的预测,红色显示不正确的预测

num_rows = 5

num_cols = 3

num_images = num_rows*num_cols

plt.figure(figsize=(2*2*num_cols, 2*num_rows))

for i in range(num_images):

plt.subplot(num_rows, 2*num_cols, 2*i+1)

plot_image(i, predictions, test_labels, test_images)

plt.subplot(num_rows, 2*num_cols, 2*i+2)

plot_value_array(i, predictions, test_labels)

plt.show()

轻松体验TensorFlow 第一个神经网络:基本分类(Part 2)

最后,使用训练的模型对单个图像进行预测。

# 从测试数据集中获取图像

img = test_images[0]

print(img.shape)

tf.keras模型经过优化,可以一次性对批量,或者一个集合的数据进行预测。因此,即使我们使用单个图像,我们也需要将其添加到列表中:

# 将图像添加到批次中,即使它是唯一的成员。

img = (np.expand_dims(img,0))

print(img.shape)

轻松体验TensorFlow 第一个神经网络:基本分类(Part 2)

现在来预测图像:

predictions_single = model.predict(img)

print(predictions_single)

轻松体验TensorFlow 第一个神经网络:基本分类(Part 2)

上图输出了单个预测结果的图形化显示,比较直观。

model.predict 返回一个包含列表的列表,每个图像对应一个列表的数据。获取批次中第0个图像的预测:

prediction_result = np.argmax(predictions_single[0])

print(prediction_result)

轻松体验TensorFlow 第一个神经网络:基本分类(Part 2)

和上一步,我们的预测结果(9)是一样的 - Ankle boot。

上述操作步骤和完整的代码,可以访问如下链接:

https://notebooks.azure.com/rickiechina/projects/pythontutorial/html/Tensorflow-Tutorial.ipynb

好啦 ... 应该感谢一下自己的坚持和努力!!!

对TensorFlow 有兴趣的同学,可以访问如下链接:

参考链接:

训练您的第一个神经网络: 基本分类

https://tensorflow.google.cn/tutorials/keras/basic_classification

zalandoresearch/fashion-mnist

https://github.com/zalandoresearch/fashion-mnist/blob/master/README.zh-CN.md

Train your first neural network: basic classification

https://www.ziiai.com/docs/tensorflow/tutorials/keras/basic_classification

相关推荐