不重视模型偏差？你就是给ML模型戴上有色眼镜的“元凶”

itaquestion

2019-03-14

点击上方关注，All in AI中国

作者——Will Badr

在本文，我们将介绍一些工具，以方便评估和审核机器学习模型的公平和偏差。

不重视模型偏差？你就是给ML模型戴上有色眼镜的“元凶”

评估机器学习模型的偏差正成为不同行业和数据研究人员共同关注的焦点。模型公平性是机器学习中一个相对较新的子领域。过去，对偏差的研究是通过分析人为驱动决策以及这些决策背后的理由/原理而产生的。因为当初我们使用机器学习预测模型是为了帮助不同行业的人做出决策，比如保险业和银行业。我们需要实施策略来确保这些模型的公平性，并检测/预测过程中可能出现的偏差（带有歧视性的）行为。

随着机器学习模型变得越来越复杂，解释它们变得越来越困难。预测模型通常是一个黑盒函数，它通过一个确定的输入(x)输出一个预测(y)。在这里，我们举例说明，假设一家保险公司希望使用一个预测模型来衡量客户所能带来的回报/风险。输入(x)可以包括种族、年龄、性别、民族、教育程度和收入等特征或属性。他们可以根据模型的预测结果来决定是否要求客户支付更高的保险费（从而规避风险）。这样做对美国的银行和金融业而言，是违法的，因为它违反了《平等信贷机会法》(公平贷款)，其原因在于怕承担风险而不批准那些符合信贷要求的申请人。

随着人们对预测模型的大量使用，我们发现了一些问题。尤其在银行贷款、信誉、就业等方面的问题甚至有些"尖锐"，所以我们现在要做的是重修审核，并弄清楚这些模型为何会做出某种决策，并争取在设计初期就做好公平方面的建设。在本文中，我将讨论5个工具，它们可用于探索和审核预测模型的公平性。

1- FairML：

FairML是一个用python编写的工具箱，用于审核机器学习模型的公平性和偏差。这是一种相对简单的用来量化模型输入重要性的方法。它使用四种输入排序算法来量化模型中输入（x）和预测（y）的相对关系。

不重视模型偏差？你就是给ML模型戴上有色眼镜的“元凶”

源自：https://github.com/adebayoj/fairml

对于安装和演示代码，你可以参考库Github repo：https://github.com/adebayoj/fairml。

2- Lime

Lime是一个开源项目，旨在解释机器学习模型是如何工作的。Lime的伟大之处在于它可以解释多种机器学习或深度学习模型。具体来说，它能解释文本分类、多类分类、图像分类和回归模型。

下面是一个通过Lime来理解和探索预测模型是如何做出决策的快速演示。在本例中，我训练了一个包括20类新闻数据集的文本分类器。下面的文本被分类为com .windows.xcategory。

不重视模型偏差？你就是给ML模型戴上有色眼镜的“元凶”

现在，让我们使用 Lime 来探究这篇文章中哪些具体的词语让预测模型做出了这个决定。换言之，我们要找到哪些词语在预测模型"心中"更有"分量"。

不重视模型偏差？你就是给ML模型戴上有色眼镜的“元凶”

正如你所看到的，客户端、应用程序这两个词具有极大的权重。让我们来做个小实验。我打算从上面的文字中去掉这两个词，再加上另外一个词，然后再试着预测。

不重视模型偏差？你就是给ML模型戴上有色眼镜的“元凶”

你可以看到，"space"这个词让预测产生了偏差，完全改变了之前的结果，尽管文本的其他处仍然是相同的。

要理解代码是如何工作的，你可以参考下面链接中的代码库和示例代码：https://github.com/marcotcr/lime。

3- IBM AI Fairness 360

AI Fairness 360是一个开源的库，它使用一组偏差缓解算法来检测并缩小机器学习模型中的偏差。这个库非常全面，有一套相对详细的偏差评估标准。

开发人员创造了一种较新互动的体验（http://aif360.mybluemix.net/data），通过AI Fairness 360你可以看到评估的标准并测试部分功能。

他们还创建了一个Guidance Material（http://aif360.mybluemix.net/resources#guidance），提醒你在一些特定案例中哪些指标是必不可少的（https://github.com/IBM/AIF360）。

这个库依赖的缓解偏差算法主要有三个：

1）.Optimized Preprocessing (Calmon et al., 2017)：提出了一种学习数据转换的优化方法。该方法主要有三方面：控制偏差、限制单个数据样本的失真、效用的保留（http://papers.nips.cc/paper/6988-optimized-pre-processing-for-discrimination-prevention）。

2）.Disparate Impact Remover (Feldman et al., 2015)（https://doi.org/10.1145/2783258.2783311）

3）.Equalized Odds Postprocessing (Hardt et al., 2016)

（https://papers.nips.cc/paper/6374-equality-of-opportunity-in-supervised-learning）

4- SHAP

Shap通过将博弈论与局部解释相结合，可以解释任何机器学习模型的输出。它使用了"漂亮的"JS可视化来解释模型。

有关详细说明及指引，请参阅以下链接：https://github.com/slundberg/shap

5- Google What-If Tool

不重视模型偏差？你就是给ML模型戴上有色眼镜的“元凶”

微笑检测示例

谷歌的WIF是一个tensorboard插件，通过它你可以了解黑盒分类或回归机器学习模型。它支持多种演示、交互式体验等方式（https://github.com/tensorflow/tensorboard/tree/master/tensorboard/plugins/interactive_inference）。

总之，ML模型中的任何偏差都是由于注释数据人员存在某种错误认知，或者是科研人员对数据的调查不够详实，以及数据本身缺少某种必要特征让数据不够完美等多种情况造成的。

未能捕捉这些特征并概括数据来训练模型，可能会导致模型偏差。有偏差的机器学习模型可能会做出不公平/有偏见的决策，从而影响用户。因此，相关负责人应该集中精力检测他们开发的模型中是否存在偏差，这一点非常重要。

不重视模型偏差？你就是给ML模型戴上有色眼镜的“元凶”

编译出品

机器学习

安科网

不重视模型偏差？你就是给ML模型戴上有色眼镜的“元凶”

itaquestion

itaquestion

相关推荐

TensorFlow为新旧Mac特供新版本，速度最高提升7倍

如何通过7个步骤构建机器学习模型

机器学习新风暴：如何用ML模型预测房价？

关于机器学习管道需要了解什么?

为什么所有的机器学习模型有90％从没有投入生产

LinkedIn开源Dagli，发布Java机器学习函数库

关于机器学习算法的16个技巧

全面解读谷歌云人工智能如何为机器学习提供帮助

关于感知器的故事：机器学习是如何发展到如今这一程度的呢？

需要知识的后深度学习时代，如何高效自动构建知识图谱

10个丰富自我的机器学习项目

机器学习如何颠覆金融行业

24个提高知识和技能极限的机器学习项目

IT自动化和人工智能将在2021年走向何方？

无监督机器学习的重要指南

机器学习概念和经典算法，我用大白话给你讲清楚了！入门必看

理解AI：为什么要在人工智能系统中寻求可解释性呢？

机器学习的未来就在这里：高斯过程和神经网络是等价的

Python 用5行代码学机器学习—线性回归

微软和谷歌分别开源分布式深度学习框架，各自厉害在哪？

itaquestion