什么时候以及为什么基于树的模型可以超过神经网络模型？

zhaoyin

2020-09-16

导读

基于树的模型和神经网络其实并没有太多的不同。

什么时候以及为什么基于树的模型可以超过神经网络模型？

神经网络通常被认为是机器学习的圣杯，无所不知，解决一切问题，主要是因为它们很复杂。另一方面，基于树的方法并没有被同样的敬畏和炒作，主要是因为它们看起来很简单。虽然它们看起来如此不同，但它们只是一枚硬币的两面。

基于树的方法通常比神经网络更好。任何Kaggler都知道XGBoost是到目前为止最受欢迎的最佳竞赛提交选择。本质上，基于树的方法和神经网络之所以属于同一类，是因为它们是通过逐条分解来解决问题的，而不是像支持向量机(SVM)或逻辑回归(Logistic Regression)那样，通过寻找一个复杂的边界来分离整个数据集。

很明显，基于树的方法沿着不同的特征逐步分割特征空间以优化信息增益。不太明显的是，神经网络在处理这一任务时也是类似的。每个神经元监视特征空间的特定部分(有各种重叠)。如果一个输入落到那个空间，某些神经元就会被激活。

神经网络采用概率的观点来进行逐块模型拟合，而树则采用确定性的观点。无论如何，它们的性能都依赖于模型的深度，因为它们的组件与特征空间的部分相关。

一个包含太多组件的模型 —— 树是节点，网络是神经元——会过拟合，而组件太少的模型根本无法给出有意义的预测。(两者都开始记忆数据点，而不是学习归纳。)

关于神经网络如何分割特征空间的更多直觉，请看一般性逼近定理。

尽管决策树有许多强大的变种，如随机森林、梯度提升、自适应提升和深度森林，但通常基于树的方法本质上是神经网络的简化版本。

基于树的方法通过垂直和水平分割逐条处理问题，以最小化熵(优化器和损失)。神经网络通过操纵激活函数的形状来逐步解决这个问题。
基于树的方法是确定性的，而不是概率性的。这导致了一些很好的简化，比如自动特性选择。
在决策树中被激活的条件节点类似于被激活的神经元(信息流)。
神经网络拟合参数对输入进行变换，直接或间接的激活后续的神经元。决策树显式地拟合参数来引导信息流。(这是确定性而非概率性的结果。)

什么时候以及为什么基于树的模型可以超过神经网络模型？

信息在这两个模型中类似地流动，只是在树中以更简单的方式流动。

当然，这是一个抽象的甚至是有争议的主张。建立这种联系有许多心理障碍。无论如何，这对于理解基于树的方法何时以及为什么比神经网络更好是很重要的。

表格数据，或以表形式出现的结构化数据，对于决策树来说是很自然的。大多数人都同意，神经网络对于表格数据回归和预测来说是多余的，所以我们做了一些简化。我们选择1和0，而不是概率，这是两种算法差异的主要根源。因此，树可以在不需要概率的细微差别的情况下成功，比如结构化数据。

例如，基于树的方法在MNIST数据集上执行得很好，因为每个数字都有几个可定义的特征。概率不是一个必要的计算。这根本不是一个非常复杂的问题，这就是为什么精心设计的集成树可以达到相同的水平，甚至比现代卷积神经网络更好。

通常，人们会倾向于说“树只是记住规则”，这是正确的。这与神经网络是一样的，它记忆更复杂的，基于概率的规则。神经网络不会对x>3这样的条件显式地给出真/假，而是将输入放大到一个很高的值，以产生一个s型的1的值或产生一些连续的表达式。

另一方面，由于神经网络非常复杂，有很多事情可以用它们来做。卷积层和递归层都是神经网络出色的变体，它们工作得很好，因为它们处理的数据通常需要细微的概率计算。

很少有图像可以用1和0来建模。决策树值不能处理有许多中间值的数据集(例如0.5)，这就是为什么它在像素值几乎都是黑色或白色的MNIST上工作得很好。类似地，文本有太多的信息和太多的异常，只能用确定性术语来表示。

这也是神经网络主要用于这些领域的原因，也是神经网络研究在早期(21世纪初)由于无法获得大量图像和文本数据而停滞不前的原因。神经网络的其他常见用途仅限于大量预测，比如YouTube的视频推荐算法，其规模如此之大，必须涉及到概率。

去公司的任何一个数据科学团队看看，他们很可能使用的是基于树的模型，而不是神经网络。除非他们是在构建一个重量级的模型，比如在Zoom中模糊视频的背景，树的确定性本质使得日常的分类任务变得轻量级，使用与神经网络相同的一般方法。

在许多现实世界中，确定性建模比概率建模更自然，这也是有争议的。例如，用树来预测用户是否从电子商务网站购买商品的一个很好的选择，因为用户自然会遵循一个基于规则的决策过程。它可能看起来是这样的:

我以前在这个平台上有过愉快的经历吗?如果是，继续。
我现在需要这件物品吗?冬天我应该买太阳镜和泳裤吗?如果是，继续。
根据我的人口统计数据，这是一个我有兴趣购买的产品吗?如果是，继续。
这件东西太贵了吗?如果不是，继续。
其他顾客对这个产品的评价是否达到了一定的临界值，使我觉得可以放心地购买它?如果是，继续。

一般来说，人类遵循非常基于规则和结构化的决策制定过程。在这些情况下，概率建模是不必要的。

总之，

基于树的方法最好被认为是神经网络的缩小版本，用更简单的术语来接近特征分类、优化、信息流等。

神经网络模型决策树

zhaoyin

0 关注 0 粉丝 0 动态

相关推荐

神经网络？决策树？都做不到！谁能解决可解释性AI？

来自IEEE研究员Cuntai Guan这样认为：“许多机器决策仍然没有得到很好的理解”。大多数论文甚至提出在准确性和可解释性之间进行严格区分。神经网络是准确的，但无法解释;在计算机视觉中，决策树是可解释的，但不准确。这意味着金融和医学等应用领域的从业者

WFRainn 2020-05-14

卷积神经网络模型可解释性

缺乏可解释性仍然是在许多应用中采用深层模型的一个关键障碍。在这项工作中，明确地调整了深层模型，这样人类用户可以在很短的时间内完成他们预测背后的过程。具体地说，训练了深度时间序列模型，使得类概率预测具有较高的精度，同时被节点较少的决策树紧密地建模。使用直观的

wenxuegeng 2020-05-04

决策树的复兴？结合神经网络，提升ImageNet分类准确率且可解释

鱼和熊掌我都要！BAIR公布神经支持决策树新研究，兼顾准确率与可解释性。然而，深度神经网络缺乏可解释性也是出了名的，这就带来了一种矛盾。决策树是一种用于分类的经典机器学习方法，它易于理解且可解释性强，能够在中等规模数据上以低难度获得较好的模型。之前很火的微

WhiteHacker 2020-04-26

机器学习的未来就在这里：高斯过程和神经网络是等价的

高斯进程已经存在了一段时间，但它只是在过去5-10年，有一个大的复苏，其兴趣。部分原因是求解的计算复杂：由于他们的模型需要矩阵反转，复杂性是 O，很难更快地获得。高斯过程最酷的特征之一是它们非常非常相似的神经网络。中央极限定理可以统一明显复杂的现象，在这

lemonade 12评论 2020-11-10

面向深度学习的五大神经网络模型及其应用

深度学习是机器学习的重要组成部分，深度学习算法基于神经网络。有几种功能不同的神经网络架构，最适合特定的应用场景。本文介绍一些最知名的架构，尤其是深度学习方面的架构。MLP使用一种称为反向传播的监督式学习技术进行训练。反向传播有助于调整神经元权重，以获得更接

fengzhimohan 14评论 2020-11-02

【干货】图神经网络的十大学习资源分享

本文转自雷锋网，如需转载请至雷锋网官网申请授权。图神经网络是深度学习的一个相对较新的领域，从最近开始越来越流行。Twitter、Google或Facebook等大公司都会开始对于GNN投入研究，事实证明了GNN优于其他使用图数据的机器学习模型。由于此领域的

walegahaha 2020-10-20

神经网络：高深莫测又妙趣横生的完整历史！

在翻阅各种资料之后，我对神经网络的历史深深入迷了。这是个非常有趣的研究主题，我从中获得了不少快乐。自上个世纪以来，神经网络和人工智能一直是热门话题。在流行文化电影中，人工智能机器人风靡全球，吸引着大量猎奇之士。神经网络的灵感来源于生物神经元是一种受编程范式

WFRainn 2020-10-19

建神经网络模型，哪种优化算法更好？35000次测试告诉你

想要优化自己的神经网络，却不知道哪种优化器更适合自己？又或者，想知道深度学习中梯度下降的算法到底都有哪些？现在，最全面的优化算法分析来了。它整理了自1964年以来，几乎所有的优化方法，将它们进行了分类。此外，它还给出了几种基准测试方法，并用它分析了1344

WhiteHacker 2020-10-14

图神经网络快速爆发，最新进展都在这里了

近年来，图神经网络发展迅速，最近的会议上发表了大量相关的研究论文。本文作者正在整理一个GNN的简短介绍和最新研究报告的摘要。希望这对任何准备进入该领域或试图赶上最新技术进展的人有所帮助。在典型的GNN中，消息传递是由边在相邻节点之间上执行的。在任何神经层，

雜貨鋪 2020-10-13

神经网络“炼丹炉”内部构造长啥样？牛津大学博士小姐姐论文解读

神经网络就像“炼丹炉”一样，投喂大量数据，或许能获得神奇的效果。然而，这种情况下，神经网络其实成了“黑匣子”——具有一定的功能，但看不见是怎么起作用的。如果只做简单的图像分类，其实还好；但如果用在医学方向，对疾病进行预测，那么神经网络下的“判断”就不可轻信

zyhzyh 2评论 2020-10-09

2019年Philip S. Yu团队的图神经网络综述

使用graph来表示对象之间的复杂关系和依赖关系，然而graph数据的复杂已有的机器学习算法很难处理，所以使用深度学习方法来处理。此外还讨论图神经网络跨各种领域的应用、总结开源代码、数据集和图神经网络评价指标。最后给出可能的研究方向。然而graph与图像不

cherry0 2020-09-23

9大主题卷积神经网络（CNN）的PyTorch实现

大家还记得这张图吗？深度系统介绍了 52 个目标检测模型，纵观 2013 年到 2020 年，从最早的 R-CNN、OverFeat 到后来的 SSD、YOLO v3 再到去年的 M2Det，新模型层出不穷，性能也越来越好！上文聚焦于源码和论文，对于各种卷

demm 2020-09-18

当支持向量机遇上神经网络：SVM、GAN距离之间的关系

SVM 是机器学习领域的经典算法之一。给定一组训练实例，每个训练实例被标记为属于两个类别中的一个或另一个，SVM 训练算法创建一个将新的实例分配给两个类别之一的模型，使其成为非概率二元线性分类器。SVM 模型将实例表示为空间中的点，这样映射就使得单独类别的

绝望的乐园 2020-09-02

浅谈CNN和RNN

在上一篇文稿中主要对深度学习的基础做了一个阐述，对于其中的神经网络和BP算法进行额外的延伸与拓展。但作为日前最为火热的人工智能技术，掌握这些内容远远还不够。因为深度学习面临的实际问题往往不是线性可分的问题，有时甚至超出了分类的问题，这就必须对深度学习模型加

Site 2020-08-20

图神经网络的究竟有多强大？道翰天琼认知智能机器人平台API接口大脑为您揭秘。

图神经网络的究竟有多强大？道翰天琼认知智能机器人平台API接口大脑为您揭秘。认知智能CI机器人是杭州道翰天琼智能科技有限公司旗下产品。具有突破性，创新性，领航性。认知智能机器人技术体系更加先进，更加智能，是新一代智能，认知智能领域世界范围内唯一的认知智能机

CristianoJason 2020-08-19

谷歌用算力爆了一篇论文，解答有关无限宽度网络的一切

无限宽度神经网络是近来一个重要的研究课题，但要通过实证实验来探索它们的性质，必需大规模的计算能力才行。近日，谷歌大脑公布的一篇论文介绍了他们在有限和无限神经网络方面的系统性探索成果。该研究通过大规模对比实验得到了 12 条重要的实验结论并在此过程中找到了一

cetrolchen 2020-08-18

Pytorch_第十篇_卷积神经网络（CNN）概述

卷积神经网络，简称CNN。卷积神经网络相比于人工神经网络而言更适合于图像识别、语音识别等任务。本文主要涉及卷积神经网络的概念介绍，首先介绍卷积神经网络相比于人工神经网络的优势，其次介绍卷积神经网络的基本结构，最后我们分别介绍神经网络的各个部件从而完整的了解

walegahaha 2020-08-15

一文了解卷积神经网络基础，建议收藏

今天给大家讲一下卷积神经网络，主要包括四个部分：卷积神经网络的历史、全连接层、卷积层和池化层。CNN的英文全称是Convolutional Neural Network，雏形是LeCun在1998年发明的LeNet网络结构。那么到底什么是神经网络呢？198

georgesale 2020-08-14

用神经网络给照片补光，谷歌这项研究却实现了「鬼片」效果

打光是图像处理过程中的重要步骤，打光的好坏可能会影响整体效果的展示。打光方法也各有不同，MIT、谷歌等的一项新研究另辟蹊径，通过神经光传输方法进行图像的二次打光和视图合成，实现了相当不错的效果。图像合成早已不是新鲜话题，但是「打光」可是所有照片的难题。对于

XiaotingCheng 2020-08-13

图神经网络越深，表现就一定越好吗？

数十层甚至数百层神经网络的应用，是深度学习的重要标志之一。但现实情况却远非如此：比如今年被视作机器学习领域最火热的研究方向之一——图神经网络，大多数都只运用了寥寥几层网络。众所周知，深度图神经网络的训练过程非常艰难。近日来，人们致力于解决图神经网络中的深度

码猿同学 2020-08-07

zhaoyin

W3CSchool教程: HTML 教程; CSS 教程; Bootstrap 教程; Javascript 教程; jQuery 教程

后端教程: C 教程; Java 教程; PHP 教程; Python 教程; Go 教程

移动开发: Android 教程; Swift 教程; Kotlin 教程; jQuery Mobile 教程; ionic 教程

关于我们: 新闻动态; 联系方式; 招聘英才; 安科实验室; 帮助与反馈

安科网(Ancii)，中国第一极客网

Copyright © 2013 - 2019 Ancii.com

京ICP备18063983号京公网安备11010802014868号