python实现随机梯度下降（SGD）

拾毅者

2017-12-14

使用神经网络进行样本训练，要实现随机梯度下降算法。这里我根据麦子学院彭亮老师的讲解，总结如下，（神经网络的结构在另一篇博客中已经定义）：

def SGD(self, training_data, epochs, mini_batch_size, eta, test_data=None):
  if test_data:
    n_test = len(test_data)#有多少个测试集
    n = len(training_data)
    for j in xrange(epochs):
      random.shuffle(training_data)
      mini_batches = [
        training_data[k:k+mini_batch_size] 
        for k in xrange(0,n,mini_batch_size)]
      for mini_batch in mini_batches:
        self.update_mini_batch(mini_batch, eta)
      if test_data:
        print "Epoch {0}: {1}/{2}".format(j, self.evaluate(test_data),n_test)
      else:
        print "Epoch {0} complete".format(j)

其中training_data是训练集，是由很多的tuples（元组）组成。每一个元组（x，y）代表一个实例，x是图像的向量表示，y是图像的类别。
epochs表示训练多少轮。
mini_batch_size表示每一次训练的实例个数。
eta表示学习率。
test_data表示测试集。
比较重要的函数是self.update_mini_batch，他是更新权重和偏置的关键函数，接下来就定义这个函数。

def update_mini_batch(self, mini_batch,eta): 
  nabla_b = [np.zeros(b.shape) for b in self.biases]
  nabla_w = [np.zeros(w.shape) for w in self.weights]
  for x,y in mini_batch:
    delta_nabla_b, delta_nable_w = self.backprop(x,y)#目标函数对b和w的偏导数
    nabla_b = [nb+dnb for nb,dnb in zip(nabla_b,delta_nabla_b)]
    nabla_w = [nw+dnw for nw,dnw in zip(nabla_w,delta_nabla_w)]#累加b和w
  #最终更新权重为
  self.weights = [w-(eta/len(mini_batch))*nw for w, nw in zip(self.weights, nabla_w)]
  self.baises = [b-(eta/len(mini_batch))*nb for b, nb in zip(self.baises, nabla_b)]

这个update_mini_batch函数根据你传入的一些数据进行更新神经网络的权重和偏置。

以上就是本文的全部内容，希望对大家的学习有所帮助，也希望大家多多支持安科网。

梯度下降 python算法图像梯度 python

拾毅者

0 关注 0 粉丝 0 动态

相关推荐

Tensorflow--梯度下降解决线性回归

plt.plot # 红色星形的点。W = tf.Variable # 初始化 Weight. b = tf.Variable # 初始化 Bias. y = W * x_data + b

源式羽语 2020-02-19

机器学习：梯度下降算法原理讲解

学习机器学习时作为基础概念。梯度下降在机器学习中应用十分的广泛，不论是在线性回归还是Logistic回归中，它的主要目的是通过迭代找到目标函数的最小值，或者收敛到最小值。本文将从一个下山的场景开始，先提出梯度下降算法的基本思想，进而从数学上解释梯度下降算法

yishujixiaoxiao 2020-01-10

Tensorflow快餐教程(7) - 梯度下降

trY = 2 * trX + np.random.randn * 0.33 # 创建一些线性值附近的随机值。求极值的这个函数我们称为损失函数loss function，或代价函数cost function，或者误差函数error function。那么这

woshigzp 2019-06-27

关于Resnet残差网络的一些理解

足够深就是网络层数足够深，足够广就意味着不能从传统尺度来解决问题，而应该是多尺度，也就是multi-scale。但是随着网络的深入，一些经典的问题也就随之出现，例如梯度弥散和梯度爆炸。这两种问题都是由于神经网络的特殊结构和特殊求参数方法造成的，也就是链式求

sjzhahalala 2019-06-27

令人着迷的无梯度神经网络优化方法

梯度下降是机器学习中最重要的思想之一：给定一些代价函数以使其最小化，该算法迭代地采取最大下降斜率的步骤，理论上在经过足够的迭代次数后才达到最小值。柯西于1847年首次发现，在1944年针对非线性优化问题在Haskell Curry上得到扩展，梯度下降已用

wenxuegeng 2020-08-03

无梯度强化学习：使用Numpy进行神经进化

学习统计学你会学到很多关于基于梯度的方法，但是不久前我读了Uber AI的人写的一篇非常有趣的文章，他表明在解决Atari游戏时，简单的遗传算法与最复杂的基于梯度的RL方法是挺有竞争力的。首先，对于那些还不知道的人，神经进化描述了进化和遗传算法在训练神经网

83153251 2020-06-21

机器学习算法原理与实践-正规方程、梯度下降（文章迁移）

文章迁移说明：此文已由lightinglei于2019-02-18发布，是本人的另外一个账号，现同步迁移至本账号。假设真实值为y取值为0或1,0代表不会消费，1代表会消费；如果我们能与预测值f无限接近这真实值y的一组w和b，那就可以进行判断了，如何判断两者

zhaorui0 2020-06-06

Python 梯度下降实现逻辑回归

theta = np.zeros #theta = array,构造全为零的行向量。grad[0,j] = np.sum/len #∑term / m. return value > threshol

Kwong 2020-04-26

深度神经网络与梯度下降法

神经元可以理解为一个具有多个输入、单个输出的模型，输入和输出的关系可以用一个函数来表示。如果用\表示输入，\(y\)表示输出，那么这个函数可以表示为:. 其中，\称做神经元的权重，\(b\)称作神经元的偏置，\(a\)是一个非线性函数，称作神经元的激活函数

wenxuegeng 2020-03-05

简单例子说明梯度下降、momentum和学习率衰减

一：快速教程、Python简易实现以及对学习率的探讨

zhouhaihua00 2020-02-23

CS231n-反向传播算法BP(2)

在前几篇文章中，我们学习到如何在训练集上设置权重，并由此计算出损失，其中loss是有两部分组成，分别是数据损失项和正则化项目。我们最终想要得到损失函数关于权重矩阵w的梯度表达式，然后进行优化。我们采用梯度下降算法，进行迭代运算，计算梯度进行权重的更新，并一

Happyunlimited 2020-02-02

梯度下降算法&线性回归算法

**机器学习的过程说白了就是让我们编写一个函数使得costfunction最小，并且此时的参数值就是最佳参数值。通过不断地调整\和\是函数\取得最小值。梯度下降就是使J不断通过导数下降的一种算法\\(a\)是学习率，也就是梯度下降的效率。如果学习效率过小，

清溪算法 2020-01-24

随机梯度下降法（Stochastic gradient descent, SGD）

BGD批量梯度下降法：每次迭代使用所有的样本 Mold 一直在更新。而SGD算法是从样本中随机抽出一组，训练后按梯度更新一次，然后再抽取一组，再更新一次，在样本量及其大的情况下，可能不用训练完所有的样本就可以获得一个损失值在可接受范围之内的模型了。

yedaoxiaodi 2020-01-06

梯度下降的分布式训练简介

梯度下降法是目前最常用的优化算法之一，也是目前最常用的神经网络优化方法。同时，每个最先进的深度学习库都包含各种优化梯度下降算法的实现。但大多数都是针对单个节点的训练——假设训练发生在单个GPU/CPU上。随着神经网络规模的日益增大，一些分布式和并行的训练算

frommymind 2019-12-13

[ch04-05] 梯度下降的三种形式

点击star加星不要吝啬，星越多笔者越努力。我们比较一下目前我们用三种方法得到的w和b的值，见表4-2。但是使用梯度下降和神经网络两种方式，都得到1.71、3.19这样的值，准确程度很低。从图4-6的神经网络的训练结果来看，拟合直线是斜着穿过样本点区域的，

liqing 2019-12-10

【机器学习】机器学习入门05 - 梯度下降法

在多元函数微分学中，我们都接触过梯度的概念。这是百度百科给出的解释。以二元函数f(x,y)为例。fx, fy分别表示f对x，y的偏导数。不难理解，对于损失函数，其梯度的方向指向误差增加最快的方向，大小为该点误差的增加率。因此，要找到损失最小的点，也就是找到

playoffs 2019-12-03

代码详解：运用Numpy实现梯度下降优化算法的不同变体

想了解如何使用numpy在tensorflow或pytorch中实现优化算法，以及如何使用matplotlib创建精美的动画？本文将讨论如何实现梯度下降优化技术的不同变体，以及如何使用matplotlib将用于这些变体更新规则的运作可视化出来。本文的内容和

rainchxy 2019-11-05

机器视觉学习笔记：理解机器学习中的梯度反方向

当初学习机器学习算法的时候，接触到了梯度下降的方法，它经常作为训练器的训练算法，因为梯度反方向是局部下降最快的，很容易收敛。应注意的是，很多人认为梯度反方向是下降最快的，这种说法和理解是片面的，不准确的，它只是局部最快，而不是全局最快，因此我们可以观察到，

qinrui 2019-07-29

神经网络中的梯度下降与反向传播的关系（大白话，通俗易懂版本）

神经网络就是一个”万能的模型+误差修正函数“，每次根据训练得到的结果与预想结果进行误差分析，进而修改权值和阈值，一步一步得到能输出和预想结果一致的模型。机器学习可以看做是数理统计的一个应用，在数理统计中一个常见的任务就是拟合，也就是给定一些样本点，用合适的

aaJamesJones 2019-09-06

梯度下降是最好的程序员：Julia未来将内嵌可微编程系统

近日，Julia Computing 团队发表论文表示他们构建了一种可微编程系统，它能将自动微分内嵌于 Julia 语言，从而将其作为第一级的语言特性。也就是说，我们以后直接用 Julia 语言及可微编程就能写模型了？都不需要再调用 TensorFlow

zhaoyinghuan 2019-07-21

拾毅者

W3CSchool教程: HTML 教程; CSS 教程; Bootstrap 教程; Javascript 教程; jQuery 教程

后端教程: C 教程; Java 教程; PHP 教程; Python 教程; Go 教程

移动开发: Android 教程; Swift 教程; Kotlin 教程; jQuery Mobile 教程; ionic 教程

关于我们: 新闻动态; 联系方式; 招聘英才; 安科实验室; 帮助与反馈

安科网(Ancii)，中国第一极客网

Copyright © 2013 - 2019 Ancii.com

京ICP备18063983号京公网安备11010802014868号