SIGAI机器学习第十九集随机森林

shawsun

2019-12-15

关注关注

讲授集成学习的概念，Bootstrap抽样，Bagging算法，随机森林的原理，训练算法，包外误差，计算变量的重要性，实际应用

大纲：

集成学习简介

Boostrap抽样

Bagging算法

随机森林的基本原理

训练算法

包外误差

计算变量的重要性

实验环节

实际应用

随机森林是一种集成学习的算法，构建在bootstrap采样基础之上的，bagging算法基于boostrap采样，与之对应的是boosting算法。随机森林是多颗决策树的集成，由于采用了bootstrip采样，在训练时有一部分样本是没有被选中的，这些样本称为包外样本，训练完一个决策树之后可以测试这个样本集的误差，称为包外误差。

集成学习简介：

集成学习（ensemble learning）是机器学习中的一种哲学思想，它通过多个模型的组合形成一个精度更高的模型，参与组合的模型称为弱学习器（weaker learner），组合之后的模型称为强学习器。

在预测时使用这些弱学习器模型联合进行预测。

训练时需要用训练样本依次训练出这些弱学习器，如将训练集D分为D1、D2、...，分别用于训练弱学习器1、弱学习器2、...。

基于Bagging

机器学习随机森林随机算法训练集

安科网

SIGAI机器学习第十九集随机森林

shawsun

shawsun

相关推荐

TensorFlow为新旧Mac特供新版本，速度最高提升7倍

如何通过7个步骤构建机器学习模型

机器学习新风暴：如何用ML模型预测房价？

关于机器学习管道需要了解什么?

为什么所有的机器学习模型有90％从没有投入生产

LinkedIn开源Dagli，发布Java机器学习函数库

关于机器学习算法的16个技巧

全面解读谷歌云人工智能如何为机器学习提供帮助

关于感知器的故事：机器学习是如何发展到如今这一程度的呢？

需要知识的后深度学习时代，如何高效自动构建知识图谱

10个丰富自我的机器学习项目

机器学习如何颠覆金融行业

24个提高知识和技能极限的机器学习项目

IT自动化和人工智能将在2021年走向何方？

无监督机器学习的重要指南

机器学习概念和经典算法，我用大白话给你讲清楚了！入门必看

理解AI：为什么要在人工智能系统中寻求可解释性呢？

机器学习的未来就在这里：高斯过程和神经网络是等价的

Python 用5行代码学机器学习—线性回归

微软和谷歌分别开源分布式深度学习框架，各自厉害在哪？

shawsun

SIGAI机器学习第十九集 随机森林

相关推荐

SIGAI机器学习第十九集随机森林