基于PIMA糖尿病数据集的Keras实用深度神经网络

cetrolchen

2018-09-05

关注关注

今天我们将学习如何在实际数据集上编写神经网络。

当我们过去学习深度神经网络(DNN)时，我们直接使用在训练和测试中准备好数据，例如(MNIST手写数据集)通过我们的神经网络，但在这里，我们将准备使用PIMA糖尿病数据集，来创建我们的神经网络模型。

获取数据

这里我们将得到CSV数据集。数据可以从这里下载（https://github.com/vidit0210/PIMA-Diabetes-DNN/blob/master/diabetes.csv）。

现在让我们研究一下这个数据是关于什么:

数据集是关于一个二元分类分类数据集。在从更大的数据库中选择实例时，设置了一些约束。特别值得一提的是，这里所有的病人都是21岁以上的印度皮玛人后裔的女性。数据集是在UCI存储库中使用的。

基本上，我们得到了女性的数据集，我们必须预测她是否患有糖尿病。

Python编码

在这里，我将向您介绍如何制作DNN的Python教程。

首先，我们需要导入我们需要处理的所有有用的Python库

import pandas as pd

from keras.models import Sequential

from keras.layers import Dense

import numpy as np

from sklearn.model_selection import train_test_split

在这里，我们使用pandas读取数据集并执行行和列操作。用于构建我们的DNN，用于制作数组的numpy和sklearn将我们的数据分成训练和测试

现在让我们查看数据的前几行，Python代码如下：

dataframe = pd.read_csv("diabetes.csv")

dataframe.head()

基于PIMA糖尿病数据集的Keras实用深度神经网络

现在我们需要拆分我们的特征和标签。

我们可以看到结果列确定患者是否患有糖尿病（1-是，0-否）。其他列确定了预测必不可少的特征。

我们将数据拆分为特征[X]和标签[Y]，并删除数据集中的缺失值。下面的Python代码完成所需的任务。

df_label = dataframe['Outcome']

df_features = dataframe.drop('Outcome', 1)

df_features.replace('?', -99999, inplace=True)

现在我们将对所有类型的标签进行one hot编码。例如，我们将1转换为[1,0]，将0转换为[0,1]。Python代码如下：

label = []

for lab in df_label:

if lab == 1:

label.append([1, 0]) # class 1

elif lab == 0:

label.append([0, 1]) # class 0

基于PIMA糖尿病数据集的Keras实用深度神经网络

example of one hot encoding

现在我们将数据分成训练和测试集。Python代码如下：

data = np.array(df_features)

label = np.array(label)

x_train, x_test, y_train, y_test = train_test_split(data, label, test_size=0.2, random_state=42)

建立我们的神经网络

现在让我们看看构建神经网络的Python代码

model = Sequential()

model.add(Dense(500, input_dim=8, activation='sigmoid'))

model.add(Dense(100, activation='sigmoid'))

model.add(Dense(2, activation='softmax'))

model.compile(loss='mean_squared_error', optimizer='adam', metrics=['accuracy'])

model.fit(x_train,y_train, epochs=1000, batch_size=70, validation_data=(x_test, y_test))

在这里，我们已经创建简单的Keras神经网络，其中2个隐藏层(500和100），具有8个输入特征和2个标签来预测。

其他参考示例代码

feature_try = np.array([x_train[0]])

feature_try2 = np.array([x_train[1]])

result =model.predict_classes(feature_try2)

if result==0:

print("NO Diabetes")

else:

print("Diabetes")

keras 深度神经网络 python神经网络 dataframe python

cetrolchen

0 关注 0 粉丝 0 动态

关注关注

利用Keras中的权重约束减少深度神经网络中的过拟合

权重约束提供了一种方法，用于减少深度学习神经网络模型对训练数据的过度拟合，并改善模型对新数据的性能。有多种类型的权重约束，例如最大和单位向量规范，有些需要必须配置的超参数。如何使用Keras API创建向量范数约束。约束是按层指定的，但是在层中应用和强制执

zhongkeli 2020-07-14

Python中读取图片的6种方式

Python进行图片处理，第一步就是读取图片，这里给大家整理了6种图片的读取方式，并将读取的图片装换成numpy.ndarray()格式。首先需要准备一张照片，假如你有女朋友的话，可以用女朋友的，没有的话，那还学啥Python，赶紧找对象去吧!#将图片转换

xiaoxiaokeke 15评论 2020-11-04

比Keras更好用的机器学习“模型包”：0代码上手做模型

做机器学习模型时，只是融合各种算法，就已经用光了脑细胞？一位毕业于哥廷根大学、做机器学习的小哥也发现了这个问题：原本只是想设计个模型，结果“实现比设计还麻烦”。也就是说，用户只需要知道各种机器学习模型的原理，但不需要再自己动手写代码。相比于Keras，这个

KyrieHe 2020-10-04

Keras创始人：过去6个月，深度学习岗位已崩溃

深度学习岗位在这6个月以来已经崩溃。对于那些投资深度学习的小企业来说，目前的情形已经很清楚了：深度学习岗位不是必须的，随着疫情的到来，它们将可能被裁撤。需要澄清一下，我个人认为这只是一个疫情期间经济衰退的现象，而不是又一个AI寒冬。知情网友在针对这场话题的

davidsmith 2020-09-04

2020年深度学习框架对比速读

TensorFlow于2015年11月面世，基于Apache License 2.0协议发布，由Google Brain团队研发。到目前为止也是github上热度最高、使用人数最多的深度学习框架，业界很多招聘要求中也提到了它。2019年3月推出Tenso

GDGYZL 2020-08-28

TensorFlow 2入门指南，初学者必备！

TensorFlow是谷歌推出的深度学习框架，于2019年发布了第二版。它是世界上最著名的深度学习框架之一，被行业专家和研究人员广泛使用。Tensorflow v1难以使用和理解，因为它的Pythonic较少，但是随着Keras发行的v2现在与Tenso

comwayLi 2020-08-16

机器学习带你横扫乐坛，你就是下一个方文山

我太爱北极猴子乐队了，但他们已经很久没有发行新单曲了。久久欠缺精神食粮的我某天晚上突然灵机一动，我可以自给自足呀!于是我写了个简单的代码，用Keras和TensorFlow训练了一个文本生成模型，写出一首全新的北极猴子的歌。不过条件有限，这玩意儿无法跟真正

xiaoxiaokeke 2020-08-04

Keras调用LSTM之函数接口介绍

activation: 要使用的激活函数，如果传入None，则不使用激活函数。默认分段线性近似 sigmoid 。use_bias: 布尔值，该层是否使用偏置向量。如果为 True，初始化时，将忘记门的偏置加 1。将其设置为 True 同时还会强制bi

xiaoxiaokeke 2020-07-28

Tensorflow-gpu训练SSD时遇到的问题及解决方法

问题一：使用GTX2080的显卡，在batch_size只有8的情况下，训练速度只有2-3秒每步。重新执行你的训练指令就可以了。在我的训练中，成功启动cuda后，速度提升了10倍。

诗蕊 2020-07-20

Keras之对鸢尾花识别

鸢尾花数据集是一个经典的机器学习数据集，非常适合用来入门。这四个特征确定了单株鸢尾花的下列植物学特征：。机器学习中，为了保证测试结果的准确性，一般会从数据集中抽取一部分数据专门留作测试，其余数据用于训练。One-Hot编码是分类变量作为二进制向量的表示。O

dataastron 2020-07-18

TensorFlow被曝存严重bug，搭配Keras可能丢失权重，至今仍未修复

每个在自定义层中使用Keras函数式API的用户都要注意了！使用用Keras的Functional API创建的权重，可能会丢失。这一话题在Reddit机器学习板块上被热议，引起不少TensorFlow用户共鸣。也就是说，原本需要训练的权重现在被冻结了。让

Niteowl 2020-07-15

python中Keras下载mnist数据集

直接写代码进行加载数据集，如果没有下载数据集，它会自动进行下载。等待下载完成即可。首先我们直接访问链接进行下载，官方下载地址，将下载好的文件，复制到..\.keras\datasets 文件夹下即可。然后就可以直接使用上面的load_data()函数进行

xiaoxiaokeke 2020-06-27

随机森林 {Keras 由浅入深}

随机森林是集成学习中的一种方法。

KyrieHe 2020-06-25

Keras安装 {Keras 由浅入深}

dependencies:cuDNN .HDF5 and h5py .graphviz and pydot .用tensorflow能够使得传统的keras程序有较好的扩展性。

dataastron 2020-06-25

决策树 {Keras 由浅入深}

决策树是基于区域的机器学习方法，是非线性的。构建决策树最重要的环节其实就是选择分类变量，分类变量的存在使得产生非线性解，决策树能够很好的解决非线性分类，但是树的生成的终止条件很难把握，并且由于生成的随机性，往往使得决策树过于敏感，容易发生过拟合。所以对于一

xiaoxiaokeke 2020-06-25

目标检测算法-YOLO-V4代码详解

Yolo-V4算法中对网络进行了改进，使用CSPDarknet53。对主干网络进行了修改，将原先的Darknet53改为CSPDarknet53，其中是将激活函数改为Mish激活函数，并且在网络中加入了CSP结构。对特征提取过程的加强，添加了SPP，PAN

CodeWang 2020-06-21

使用GPU在AIStudio服务器进行猫狗分类 Keras框架

　　本地没有GPU环境，今天在百度AIStudio的GPU服务器上竟然跑起来了Keras版本的猫狗分类，服务器配置如图：　　具体操作步骤。　　1.首先打开百度AI Studio，并建立自己的工程。　　2.数据准备，下载猫狗分类数据集在本地电脑，选取猫狗各2

xiaoxiaokeke 2020-06-16

使用Keras实现简单线性回归模型操作

神经网络可以用来模拟回归问题，实质上是单输入单输出神经网络模型，例如给下面一组数据，用一条线来对数据进行拟合，并可以预测新输入 x 的输出值。然后用 Sequential 建立 model，再用 model.add 添加神经层，添加的是 Dense 全连

zhongkeli 2020-06-14

keras 读取多标签图像数据方式

其中label包括两类标签，label1第一类：上衣，裤子，外套。label2第二类，蓝色，黑色，红色。这样两个输出label1，label2都是是分类，我们可以直接把label1和label2整合为一个label，直接编码，比如[蓝色，上衣]编码为[01

lujiandong 2020-06-14

浅谈cv2.imread()和keras.preprocessing中的image.load_img()区别

#image.load_img()只是加载了一个文件，没有形成numpy数组，[108. 108. 110. 115. 119. 120. 122. 125. 127. 127. 129. 131. 132. 134.76 72 68 68 67 66 6

Himaxin 2020-06-14

安科网

基于PIMA糖尿病数据集的Keras实用深度神经网络

cetrolchen

获取数据

Python编码

建立我们的神经网络

cetrolchen

相关推荐

利用Keras中的权重约束减少深度神经网络中的过拟合

Python中读取图片的6种方式

比Keras更好用的机器学习“模型包”：0代码上手做模型

Keras创始人：过去6个月，深度学习岗位已崩溃

2020年深度学习框架对比速读

TensorFlow 2入门指南，初学者必备！

机器学习带你横扫乐坛，你就是下一个方文山

Keras调用LSTM之函数接口介绍

Tensorflow-gpu训练SSD时遇到的问题及解决方法

Keras之对鸢尾花识别

TensorFlow被曝存严重bug，搭配Keras可能丢失权重，至今仍未修复

python中Keras下载mnist数据集

随机森林 {Keras 由浅入深}

Keras安装 {Keras 由浅入深}

决策树 {Keras 由浅入深}

目标检测算法-YOLO-V4代码详解

使用GPU在AIStudio服务器进行猫狗分类 Keras框架

使用Keras实现简单线性回归模型操作

keras 读取多标签图像数据方式

浅谈cv2.imread()和keras.preprocessing中的image.load_img()区别

cetrolchen