「解析」现代机器学习算法优劣势一览

当谈到今天的机器学习算法时,它们正在以各种方式在不同的领域使用。医疗保健、商业、研究只是几个例子,人工智能被用来解决人类无法自行解决或需要大量时间解决的问题。

「解析」现代机器学习算法优劣势一览

然而,生活中的一切都有其优点和缺点,现代机器学习算法这条规则当然也不例外。今年早些时候,发表在Elite Data Science网站上的一篇文章集中讨论了当今几种现代机器学习算法的几种类型,以及它们的优缺点。

「解析」现代机器学习算法优劣势一览

基本上,没有一个超级算法可以解决所有问题,而且尝试用各种算法来解决手头的问题是一个创新的想法。以下是机器学习任务的几个例子,以及每个例子都有哪些优缺点?

回归机器学习任务

回归被称为监督学习任务,用于预测和建模连续的数字变量,这方面的例子包括预测学生考试成绩、房地产价格和股价变动。虽然线性回归是回归任务中最常见的算法,但是另一种形式被称为回归树(又名决策树)。在决策树学习中,它利用决策树作为预测模型,从使用关于项目(在分支中描绘)的观察开始,以完成关于项目的目标值的结论。

回归树以分层的方式获取他们的知识,因为它反复将数据集分成不同的分支;这最大化了每个分割获得的信息。使用这个方法的优势在于决策树可以理解非线性关系,并且可以对异常值进行强大的处理;然而,这种算法的一个弱点是它是不受约束的,并且树可能容易过度拟合,因为它可以保持分支直到它记住训练数据。

分类机器学习任务

当涉及到分类时,这是一个用于预测和建模分类变量的监督学习任务。这包括预测学生信件成绩、员工流失、财务欺诈和垃圾邮件。参考分类树(UNK bles),它们是前面提到的回归树的分类对应物。

他们通常都与决策树或称为分类和回归树(CART)的统称相关联。就像回归一样,分类树在实际中的集合也表现得很好,但是,它们也可以不受限制,因为树也可能变得易于过度拟合。

「解析」现代机器学习算法优劣势一览

选择算法时需要考虑的因素

在决定要使用哪种类型的算法时,需要考虑变量以及希望实现的任务。如果在选择要使用的算法时忽略考虑因素,可能会导致使用错误类型的算法并导致比开始时更多的问题。

「解析」现代机器学习算法优劣势一览

准确性很重要的考虑因素,因为有些时候近似值是足够好的。这会节省资源而不是浪费它们。另一个要考虑的事情是与算法相关的训练时间。大量的数据积累需要更多的时间和资源来解决,而不是更小的信息集合。还有一个要考虑的问题是线性度问题,很多机器学习算法都使用,这种算法的分类假设可以通过使用直线来隔离类别。

人工智能。机器学习和算法都意味着人类要么不能自己解决问题,要么自行解决会需要很长的时间。虽然算法不断演化取决于需要解决什么问题,但没有超级算法可以解决所有情况。因此,了解现代机器学习算法的优缺点,解决当今尤其是未来的问题是非常重要的。

相关推荐