最前卫的小众机器学习模型——保序回归,你造吗?
全文共1279字,预计学习时长4分钟
图源:Unsplash
有这么一个好用又前卫的机器学习模型,然而因其复杂性,它常常被人们所忽视,居于“小众行列”。
它就是保序回归。
“保序”(Isotonic)源于希腊语词根iso和tonos。
iso除了作为一种文档格式,还有平等之意。tonos意为延展。Isotonic一词可以指代从材料科学到物理学再到人文科学等领域的一系列事物。
等延展回归(保序回归,IsotonicRegression)是一种用于统计推论的模型,它优良的性能和前卫的分析方法引起了我的强烈兴趣。
保序回归是一种形式自由、广泛用于预测观察序列的线性模型。
然而,保序回归及类似模型(例如加权最小二乘回归)之间存在差异。保序回归属于单调函数,即与给定调性持续相同或相反的函数,所以任一保序函数都是非递减的。
保序回归因子应用了一种叫做“排序理论”的概念。
排序理论负责处理实数归纳中有关偏序集合和有序集合的问题。这意味着,保序回归一直向同一方向偏斜,并使用统计推论预测下面的走向。有趣的是,大多数数学模型并没有做到这一点,从而证实了保序回归的独特性。尽管贝叶斯数学模型与保序回归分析法有些相似,但它们遵循的数学原理大不相同。
排序理论是使得保序回归能够高效处理多维尺度分析的概念之一。
多维尺度分析是将特征间的关联可视化的一种方法。这种方法十分适合展现距离矩阵内的数据的信息。
保序回归其实完全基于另一种模型:
加权最小二乘回归
但与此同时,它与最小二乘回归完全不同。不幸的是,保序回归背后的数学原理对我来说实在难以理解。如果可行,我会把保序回归应用于我的Julia数据包Lathe之中。
好在有优秀的统计学家已经发现了其中的奥秘——Fabian Pegregosa将保序回归应用于Python,尽管保序回归早就可以应用于R了。
不论保序回归如何小众、晦涩、重要,你都必须承认:
它真的很酷。
但愿我能补充相关的知识,将保序回归应用到Lathe之中,这样以后Julia数据包就能兼容它了!
敢相信?目前只有三种编程语言包含保序回归的开源代码包!希望保序回归模型能在将来得到扩充,也希望以后人们能不计较它的复杂程度,更加严肃认真地将其纳入更多的编程语言之中。
让“小众”的保序回归,走向“大众”,相信不会后悔,它会在机器学习中熠熠生辉,助你一臂之力。
图源:Unsplash
留言点赞关注
我们一起分享AI学习与发展的干货
如转载,请后台留言,遵守转载规范