使用sklearn线性回归（Linear Regression）

ResysChina

2017-11-29

一、Linear Regression

线性回归是相对简单的一种，表达式如下

使用sklearn线性回归（Linear Regression）

其中，θ0表示bias，其他可以看做weight，可以转换为如下形式

使用sklearn线性回归（Linear Regression）

为了更好回归，定义损失函数，并尽量缩小这个函数值，使用MSE方法（mean square equal）

使用sklearn线性回归（Linear Regression）

缩小方法采用梯度下降法，即不断地向现在站立的山坡往下走，走的速度就是学习速率η（learning rate），太小耗尽计算资源，太大走过了山谷。

（1）Normal Equation

使用sklearn线性回归（Linear Regression）

from sklearn.linear_model import LinearRegression
 import numpy as np
 import matplotlib.pyplot as plt
 
 # 数据集
 X = 2*np.random.rand(100, 1)
 y = 4+3*X+np.random.randn(100,1)
 
 # X每个元素加1
 X_b = np.c_[np.ones((100,1)), X]
 theta_best = np.linalg.inv(X_b.T.dot(X_b)).dot(X_b.T).dot(y)
 
 # 训练
 lin_reg = LinearRegression()
 lin_reg.fit(X, y)
 print(lin_reg.intercept_, lin_reg.coef_)
 
 # 测试数据
 X_new = np.array([[0],[2]])
 X_new_b = np.c_[np.ones((2,1)), X_new]
 y_predict = X_new_b.dot(theta_best)
 print(y_predict)
 
 # 画图
 plt.plot(X_new, y_predict, "r-")
 plt.plot(X, y, "b.")
 plt.axis([0,2,0,15])
 plt.show()

使用sklearn线性回归（Linear Regression）

（2）Batch Gradient Descent

基本算是遍历了所有数据，不适用于数据规模大的数据

使用sklearn线性回归（Linear Regression）

# BGD梯度下降
 eta = 0.1
 n_iterations = 1000
 m = 100
 theta = np.random.randn(2,1)
 for iteration in range(n_iterations):
     gradients = 2/m * X_b.T.dot(X_b.dot(theta) - y)
     theta = theta - eta*gradients
 print(theta)

使用sklearn线性回归（Linear Regression）可以看出，结果是差不多的

（3）Stochastic Gradient Descent

可以避免局部最优结果，但是会震来震去。为了防止这种震荡，让学习速率η不断减小（类似模拟退火）

# SGD梯度下降
m = 100
n_epochs = 50
t0, t1 = 5, 50 # η初始值0.1
def learning_schedule(t):
    return t0 / (t + t1)

theta = np.random.randn(2,1) # random initialization
for epoch in range(n_epochs):
    for i in range(m):
        random_index = np.random.randint(m)
        xi = X_b[random_index:random_index+1]
        yi = y[random_index:random_index+1]
        gradients = 2 * xi.T.dot(xi.dot(theta) - yi)
        eta = learning_schedule(epoch * m + i)
        theta = theta - eta * gradients
print(theta)

# sklearn 提供了SGDRegressor的方法
from sklearn.linear_model import SGDRegressor
sgd_reg = SGDRegressor(max_iter=50, penalty=None, eta0=0.1)
sgd_reg.fit(X, y.ravel())
print(sgd_reg.intercept_, sgd_reg.coef_)

（4）Min-batch Gradient Descent

使用小批随机数据，结合SGD与BGD优点

以下是各种方法对比

使用sklearn线性回归（Linear Regression）

二、Polynomial Regression

但有的时候，y本身是由x取平方所得，无法找出来一条合适的线性回归线来拟合数据，该怎么办呢？

我们可以尝试将x取平方，取3次方等方法，多加尝试

线性回归 linear

ResysChina

0 关注 0 粉丝 0 动态

相关推荐

Python - 线性回归（Linear Regression) 的 Python 实现

学习 Linear Regression in Python – Real Python，前面几篇文章分别讲了“regression怎么理解“，”线性回归怎么理解“，现在该是实现的时候了。导入 Python 包: 有哪些包推荐呢？以最简单的线性回归为例，代

lhxxhl 2020-01-14

Python 用5行代码学机器学习—线性回归

我准备使用scikit-learn给大家介绍一些模型的基础知识，今天就来讲讲线性回归模型。开始之前，你要确保Python和pip已经成功安装在电脑上噢，如果没有，请访问这篇文章：超详细Python安装指南进行安装。如果你用Python的目的是数据分析，

机器学习之家 2020-11-10

27场机器学习面试后，来划个概念重点吧

机器学习面试宝典，有这一本就够了。在机器学习和数据科学岗位的面试中，机器学习领域的概念是经常考察的内容。一位近期经过 27 次 AI 领域面试的开发者根据自己的面试实战经验撰写了一份机器学习资料。这份资料适用于机器学习初学者，包含机器学习中经典常用的基础概

lgblove 2020-10-26

95后哈佛小哥撰写从零开始的机器学习入门必备，书籍资源已开放

机器学习怎么入门最简单？今年刚刚从哈佛大学统计专业毕业的 Danny Friedman 写了一本「转专业学生专用教材」，无基础也可轻松入门，资源现已全部开放。说起机器学习入门书，大概有成百上千种选择。这些书籍大多是由具备丰富研究经验的学者撰写的，涵盖各种主

Pokemogo 2020-10-05

用Python进行多元线性回归分析（附代码）

很多人在做数据分析时会经常用到一元线性回归，这是描述两个变量间统计关系的最简单的回归模型。但现实问题中，我们往往会碰到多个变量间的线性关系的问题，这时就要用到多元线性回归，多元线性回归是一元回归的一种推广，其在实际应用中非常广泛，本文就用python代码来

meylovezn 2020-08-25

11种比较常见的机器学习算法简介

近年来，由于对技术的高需求和进步，机器学习的普及已大大增加。机器学习可以从数据中创造价值的潜力使其吸引了许多不同行业的企业。大多数机器学习产品都是使用现成的机器学习算法进行设计和实现的，并且需要进行一些调整和细微更改。然后，使用该模型使用特征预测新观测的标

竭尽全力 2020-07-28

机器学习中算法与模型的区别

机器学习中的“算法”是什么？机器学习中的“算法”是在数据上运行以创建机器学习“模型”的过程。机器学习算法执行“模式识别”。算法从数据中“学习”，或者对数据集进行“拟合”。比如，我们有分类的算法，如 K- 近邻算法；回归的算法，如线性回归；聚类的算法，如 K

竭尽全力 2020-07-13

5.线性回归算法

回归算法是监督型算法的一种，通过利用测试集数据来建立模型，再利用这个模型训练集中的数据进行处理的算法。线性回归旨在寻找到一根线，这个线到到达所有样本点的距离的和是最小的。常用在预测和分类领域。

rainchxy 2020-06-16

数据预测,制做线性回归方程

pyplot.title #得出线性回归方差。pyplot.xticks #sale.index确定刻度大小,sale.date确定刻度上的数据

wndong 2020-06-14

5线性回归算法

2答：可以获取天气网站的数据，就是包括温度湿度，晴天或者阴天等，获取一个季度的数据，例如获取今年春季的数据，利用线性回归，预测明年同时期春季的天气。

nurvnurv 2020-06-08

机器学习实战基础（七）：创建多项式回归器

线性回归模型有一个主要的局限性，那就是它只能把输入数据拟合成直线，而多项式回归模型通过拟合多项式方程来克服这类问题，从而提高模型的准确性。从图1-6中可以看到，数据点本身的模式中带有自然的曲线，而线性模型是不能捕捉到这一点的。图1-7中的虚线表示线性回归模

Hannah 2020-05-28

教你轻松选择合适的机器学习算法！

答案取决于许多因素，比如问题陈述、预期的输出类型、数据的类型和大小、可用的计算时间、特征数量以及数据中的观测点等。选择算法时，有几个重要因素要考虑。通常建议收集大量数据以获得可靠的预测。模型的准确性意味着函数可预测特定观测点的响应值，该响应值接近该观测点的

sayhaha 2020-05-26

[Python初级应用]线性回归

博主是高中生，前几天学到了初级的线性回归方程。总用卡西欧敲然后带入公式实在有些麻烦。于是心血来潮用Python实现了一下~#计算总偏差平方和。#计算决定系数结束。通过getlist函数将输入进行转换字符→浮点。通过numpy的mean函数求取平均数。如何

PythonMaker 2020-05-09

机器学习基础---过拟合问题及正则化技术

到现在为止，我们已经学习了几种不同的学习算法，包括线性回归和逻辑回归，它们能够有效地解决许多问题，但是当将它们应用到某些特定的机器学习应用时，会遇到过拟合的问题，可能会导致它们效果很差。继续使用线性回归来预测房价的例子，我们通过建立以住房面积为自变量的函数

playoffs 2020-05-01

python实现线性回归之弹性网回归

由此可知，弹性网的惩罚系数恰好为岭回归罚函数和Lasso罚函数的一个凸线性组合．当α=0时，弹性网回归即为岭回归；当α=1时，弹性网回归即为Lasso回归．因此，弹性网回归兼有Lasso回归和岭回归的优点，既能达到变量选择的目的，又具有很好的群组效应。&q

HMHYY 2020-04-30

机器学习666

线性回归要求因变量必须是连续性数据变量；逻辑回归要求因变量必须是分类变量，二分类或者多分类的；比如要分析性别、年龄、身高、饮食习惯对于体重的影响，如果这个体重是属于实际的重量，是连续性的数据变量，这个时候就用线性回归来做；如果将体重分类，分成了高、中、低这

CYJ0go 2020-04-26

机器学习6 逻辑归回

逻辑回归是一种广义的线性回归分析模型，它的输入可以连续型输入，输出为离场型输出；线性回归要求因变量必须是连续性数据变量；逻辑回归要求因变量必须是分类变量，二分类或者多分类的；

playoffs 2020-04-24

机器学习之线性回归算法

　　回归是统计学中最有力的工具之一。机器习监督学习算法分为分类算法和回归算法两种，其实就是根据类别标签分布类型为离散型、连续性而定义的。回归算法用于连续型分布预测，针对的是数值型的样本，使用回归，可以在给定输入的时候预测出一个数值，这是对分类方法的提升，因

playoffs 2020-04-22

5.线性回归算法

线性回归在假设特证满足线性关系，根据给定的训练数据训练一个模型，并用此模型进行预测。用线性回归算法来模拟正弦函数。

yedaoxiaodi 2020-04-22

机器学习——05线性回归算法

线性回归就是对大量的观测数据进行处理，从而得到比较符合事物内部规律的数学表达式。解决的就是通过已知的数据得到未知的结果。简而言之就是通过大量数据的分析来寻找规律，如果是线性关系就利用线性回归算法模型来预测某一数据。真实值与预测值之间的误差为损失值，可以用梯

troysps 2020-04-22

ResysChina

W3CSchool教程: HTML 教程; CSS 教程; Bootstrap 教程; Javascript 教程; jQuery 教程

后端教程: C 教程; Java 教程; PHP 教程; Python 教程; Go 教程

移动开发: Android 教程; Swift 教程; Kotlin 教程; jQuery Mobile 教程; ionic 教程

关于我们: 新闻动态; 联系方式; 招聘英才; 安科实验室; 帮助与反馈

安科网(Ancii)，中国第一极客网

Copyright © 2013 - 2019 Ancii.com

京ICP备18063983号京公网安备11010802014868号