LWLR 局部加权线性回归——Python实现

Ghero

2018-08-27

关注关注

局部加权线性回归 — LWLR

算法介绍

线性回归的一个问题是可能出现欠拟合，因为它求的是具有最小均方误差的无偏估计，可以通过引入一些偏差，从而降低均方误差。

LWLR： 算法中给待预测点附近的每个点都赋予一定的权重，在这段区间上基于最小均方误差来进行普通线性回归。即分区间线性回归，局部拟合来得到全局拟合。

加权函数：

LWLR 局部加权线性回归——Python实现

损失函数：

LWLR 局部加权线性回归——Python实现

其中k为用户指定的参数。

LWLR 局部加权线性回归——Python实现

Python程序

# 局部加权线性回归

from numpy import *

import matplotlib.pyplot as plt

#import line_regression

from line_regression import loadDataSet

# 局部加权线性回归函数

def lwlr(testPoint,xArr,yArr,k=1.0):

# 读入数据并创建所需矩阵

xMat = mat(xArr); yMat = mat(yArr).T

# np.shape()函数计算传入矩阵的维数

m = shape(xMat)[0]

# 权重，创建对角矩阵，维数与xMat维数相同

weights = mat(eye((m))) # m维的单位对角矩阵

'''

权重矩阵是一个方阵,阶数等于样本点个数。也就是说,该矩阵为每个样本点初始

化了一个权重。接着,算法将遍历数据集,计算每个样本点对应的权重值,

'''

for j in range(m):

diffMat = testPoint - xMat[j,:]

# 采用高斯核函数进行权重赋值，样本附近点将被赋予更高权重

weights[j,j] = exp(diffMat*diffMat.T/(-2.0*k**2))

xTx = xMat.T * (weights * xMat) ## (2*2) = (2*n) * ( (n*n)*(n*2) )

if linalg.det(xTx) == 0.0:

print ("This matrix is singular,cannot do inverse")

return

ws = xTx.I * (xMat.T * (weights * yMat)) ##(2*1) = (2*2) * ( (2*n) * (n*n) * (n*1))

#print(ws)

return testPoint * ws

# 样本点依次做局部加权

def lwlrTest(testArr,xArr,yArr,k=1.0):

m = shape(testArr)[0]

yHat = zeros(m)

for i in range(m): # 为样本中每个点，调用lwlr()函数计算ws值以及预测值yHat

yHat[i] = lwlr(testArr[i],xArr,yArr,k)

return yHat

# 载入数据，进行局部加权线性回归计算

xArr,yArr = loadDataSet('ex1.txt')

# 不同k值得到的y值

yHat1 = lwlrTest(xArr,xArr,yArr,0.01)

yHat2 = lwlrTest(xArr,xArr,yArr,0.04)

yHat3 = lwlrTest(xArr,xArr,yArr,0.1)

xMat = mat(xArr);yMat = mat(yArr)

srtInd = xMat[:,1].argsort(0) # print(srtInd) (n*1)数列，值从0---n-1

xSort = xMat[srtInd][:,0,:]

fig = plt.figure()

ax = fig.add_subplot(131)

ax.plot(xSort[:,1],yHat1[srtInd])

ax.scatter(xMat[:,1].flatten().A[0],mat(yArr).T.flatten().A[0],)

plt.title('k=0.01')

ax = fig.add_subplot(132)

ax.plot(xSort[:,1],yHat2[srtInd])

ax.scatter(xMat[:,1].flatten().A[0],mat(yArr).T.flatten().A[0],)

plt.title('k=0.04')

ax = fig.add_subplot(133)

ax.plot(xSort[:,1],yHat3[srtInd])

ax.scatter(xMat[:,1].flatten().A[0],mat(yArr).T.flatten().A[0],)

plt.title('k=0.1')

plt.show()

#print(corrcoef(yHat.T,yMat))

运行结果：

LWLR 局部加权线性回归——Python实现

线性回归 python算法矩阵 python 权重

Ghero

0 关注 0 粉丝 0 动态

关注关注

Python 用5行代码学机器学习—线性回归

我准备使用scikit-learn给大家介绍一些模型的基础知识，今天就来讲讲线性回归模型。开始之前，你要确保Python和pip已经成功安装在电脑上噢，如果没有，请访问这篇文章：超详细Python安装指南进行安装。如果你用Python的目的是数据分析，

机器学习之家 2020-11-10

27场机器学习面试后，来划个概念重点吧

机器学习面试宝典，有这一本就够了。在机器学习和数据科学岗位的面试中，机器学习领域的概念是经常考察的内容。一位近期经过 27 次 AI 领域面试的开发者根据自己的面试实战经验撰写了一份机器学习资料。这份资料适用于机器学习初学者，包含机器学习中经典常用的基础概

lgblove 2020-10-26

95后哈佛小哥撰写从零开始的机器学习入门必备，书籍资源已开放

机器学习怎么入门最简单？今年刚刚从哈佛大学统计专业毕业的 Danny Friedman 写了一本「转专业学生专用教材」，无基础也可轻松入门，资源现已全部开放。说起机器学习入门书，大概有成百上千种选择。这些书籍大多是由具备丰富研究经验的学者撰写的，涵盖各种主

Pokemogo 2020-10-05

用Python进行多元线性回归分析（附代码）

很多人在做数据分析时会经常用到一元线性回归，这是描述两个变量间统计关系的最简单的回归模型。但现实问题中，我们往往会碰到多个变量间的线性关系的问题，这时就要用到多元线性回归，多元线性回归是一元回归的一种推广，其在实际应用中非常广泛，本文就用python代码来

meylovezn 2020-08-25

11种比较常见的机器学习算法简介

近年来，由于对技术的高需求和进步，机器学习的普及已大大增加。机器学习可以从数据中创造价值的潜力使其吸引了许多不同行业的企业。大多数机器学习产品都是使用现成的机器学习算法进行设计和实现的，并且需要进行一些调整和细微更改。然后，使用该模型使用特征预测新观测的标

竭尽全力 2020-07-28

机器学习中算法与模型的区别

机器学习中的“算法”是什么？机器学习中的“算法”是在数据上运行以创建机器学习“模型”的过程。机器学习算法执行“模式识别”。算法从数据中“学习”，或者对数据集进行“拟合”。比如，我们有分类的算法，如 K- 近邻算法；回归的算法，如线性回归；聚类的算法，如 K

竭尽全力 2020-07-13

5.线性回归算法

回归算法是监督型算法的一种，通过利用测试集数据来建立模型，再利用这个模型训练集中的数据进行处理的算法。线性回归旨在寻找到一根线，这个线到到达所有样本点的距离的和是最小的。常用在预测和分类领域。

rainchxy 2020-06-16

数据预测,制做线性回归方程

pyplot.title #得出线性回归方差。pyplot.xticks #sale.index确定刻度大小,sale.date确定刻度上的数据

wndong 2020-06-14

5线性回归算法

2答：可以获取天气网站的数据，就是包括温度湿度，晴天或者阴天等，获取一个季度的数据，例如获取今年春季的数据，利用线性回归，预测明年同时期春季的天气。

nurvnurv 2020-06-08

机器学习实战基础（七）：创建多项式回归器

线性回归模型有一个主要的局限性，那就是它只能把输入数据拟合成直线，而多项式回归模型通过拟合多项式方程来克服这类问题，从而提高模型的准确性。从图1-6中可以看到，数据点本身的模式中带有自然的曲线，而线性模型是不能捕捉到这一点的。图1-7中的虚线表示线性回归模

Hannah 2020-05-28

教你轻松选择合适的机器学习算法！

答案取决于许多因素，比如问题陈述、预期的输出类型、数据的类型和大小、可用的计算时间、特征数量以及数据中的观测点等。选择算法时，有几个重要因素要考虑。通常建议收集大量数据以获得可靠的预测。模型的准确性意味着函数可预测特定观测点的响应值，该响应值接近该观测点的

sayhaha 2020-05-26

[Python初级应用]线性回归

博主是高中生，前几天学到了初级的线性回归方程。总用卡西欧敲然后带入公式实在有些麻烦。于是心血来潮用Python实现了一下~#计算总偏差平方和。#计算决定系数结束。通过getlist函数将输入进行转换字符→浮点。通过numpy的mean函数求取平均数。如何

PythonMaker 2020-05-09

机器学习基础---过拟合问题及正则化技术

到现在为止，我们已经学习了几种不同的学习算法，包括线性回归和逻辑回归，它们能够有效地解决许多问题，但是当将它们应用到某些特定的机器学习应用时，会遇到过拟合的问题，可能会导致它们效果很差。继续使用线性回归来预测房价的例子，我们通过建立以住房面积为自变量的函数

playoffs 2020-05-01

python实现线性回归之弹性网回归

由此可知，弹性网的惩罚系数恰好为岭回归罚函数和Lasso罚函数的一个凸线性组合．当α=0时，弹性网回归即为岭回归；当α=1时，弹性网回归即为Lasso回归．因此，弹性网回归兼有Lasso回归和岭回归的优点，既能达到变量选择的目的，又具有很好的群组效应。&q

HMHYY 2020-04-30

机器学习666

线性回归要求因变量必须是连续性数据变量；逻辑回归要求因变量必须是分类变量，二分类或者多分类的；比如要分析性别、年龄、身高、饮食习惯对于体重的影响，如果这个体重是属于实际的重量，是连续性的数据变量，这个时候就用线性回归来做；如果将体重分类，分成了高、中、低这

CYJ0go 2020-04-26

机器学习6 逻辑归回

逻辑回归是一种广义的线性回归分析模型，它的输入可以连续型输入，输出为离场型输出；线性回归要求因变量必须是连续性数据变量；逻辑回归要求因变量必须是分类变量，二分类或者多分类的；

playoffs 2020-04-24

机器学习之线性回归算法

　　回归是统计学中最有力的工具之一。机器习监督学习算法分为分类算法和回归算法两种，其实就是根据类别标签分布类型为离散型、连续性而定义的。回归算法用于连续型分布预测，针对的是数值型的样本，使用回归，可以在给定输入的时候预测出一个数值，这是对分类方法的提升，因

playoffs 2020-04-22

5.线性回归算法

线性回归在假设特证满足线性关系，根据给定的训练数据训练一个模型，并用此模型进行预测。用线性回归算法来模拟正弦函数。

yedaoxiaodi 2020-04-22

机器学习——05线性回归算法

线性回归就是对大量的观测数据进行处理，从而得到比较符合事物内部规律的数学表达式。解决的就是通过已知的数据得到未知的结果。简而言之就是通过大量数据的分析来寻找规律，如果是线性关系就利用线性回归算法模型来预测某一数据。真实值与预测值之间的误差为损失值，可以用梯

troysps 2020-04-22

5.线性回归算法

3.自主编写线性回归算法，数据可以自己造，或者从网上获取。

rainchxy 2020-04-21

安科网

LWLR 局部加权线性回归——Python实现

Ghero

局部加权线性回归 — LWLR

Ghero

相关推荐

Python 用5行代码学机器学习—线性回归

27场机器学习面试后，来划个概念重点吧

95后哈佛小哥撰写从零开始的机器学习入门必备，书籍资源已开放

用Python进行多元线性回归分析（附代码）

11种比较常见的机器学习算法简介

机器学习中算法与模型的区别

5.线性回归算法

数据预测,制做线性回归方程

5线性回归算法

机器学习实战基础（七）：创建多项式回归器

教你轻松选择合适的机器学习算法！

[Python初级应用]线性回归

机器学习基础---过拟合问题及正则化技术

python实现线性回归之弹性网回归

机器学习666

机器学习6 逻辑归回

机器学习之线性回归算法

5.线性回归算法

机器学习——05线性回归算法

5.线性回归算法

Ghero