THU数据说 基于大数据的信用评估体系—百融金服CEO张韶峰
2017年1月5日,由清华大学数据科学研究院主办,清华大数据产业联合会、清华大学学生大数据研究协会、THU数据派承办的第三届清华大学大数据人才新春交流会成功召开。本次交流会相比以往两届,受到了校内外相关人士更广泛的关注。为了更广泛地传播数据思维理念、展现数据魅力,“THU数据说”正式启动。
活动上,清华大数据产业联合会理事单位、百融(北京)金融信息服务股份有限公司创始人、CEO张韶峰做了《基于大数据的信用评估体系》的演说,他从消费金融崛起的大背景和特点讲起,并结合五个维度具体介绍个人行为与信贷违约率之间的关系,最后给出了百融信用评分决策建议。
观看演讲视频,请点击:https://v.qq.com/x/page/b0366qbwzzq.html
张韶峰的演讲从“裸条”说起,给出了他对消费金融崛起原因分析:政府鼓励消费金融发展和85后人群的消费观念转变。他提到,消费金融产品有如下特点:
-小额
-分散
-无抵押(90%是纯信用贷,只能依靠数据进行审批)
-利息跨度极大
使用消费金融产品的人群有如下特点:
-年轻(大多数年龄都在35岁以下)
-消费观念超前(月光族,愿意透支未来)
-无信用记录
-学历跨度大
-对利率不敏感
目前中国最官方的征信数据库是人民银行征信中心,大概涵盖了2亿多人的信用数据。但是全中国有14亿人口,除去老人小孩,大概有10亿人是可以借钱的。也就是说,还有8亿人群的信用信息没有被人民银行所覆盖,他们要是想去银行借钱是比较困难的。目前,有科技公司试图用大数据的方法来建立中国的个人信用体系。通过大数据的方法,我们可以发现的一些现象,这些现象就是用大数据建立个人信用评估体系的原料。
例如:
财经媒体浏览行为与信贷违约率的关系:最近12个月内财经媒体访问天数越多,违约率风险越低。
手机号使用时长与信贷违约率的关系:总体来看随着手机号使用年数的增加,客户稳定性增加,违约风险逐步降低。
网络游戏消费行为与信贷违约率的关系:整体趋势上看最近12个月网络游戏消费金额越多,违约风险越高。
本地生活消费行为与信贷违约率的关系:整体趋势上看,过去12个月内所有类目本地生活消费等级越高,违约风险越低。
贷款申请次数与信贷违约率的关系:3个月之内申请过至少5次贷款(不管是在一家机构还是多家机构)的申请者,欺诈率是其它群体的3.2倍。
最后,张韶峰介绍了百融金服的评分模型。它是基于个人最客观的行为偏好数据,利用机器学习和大数据技术,从海量原始的强弱变量中提取出能够有效识别好坏客户的强变量,再运用基于深度学习的信用评分模式,以使模型具备有效性、稳定性和高预测能力。它在保证数据真实、客观、全面的前提下,综合评估身份匹配数据、用户行为数据、收入负债数据、航旅行为数据、支付消费数据、社交行为数据等,以更加准确的评价个人的信用风险。它的分值在300~1000分之间,分数越高代表信用风险越低,违约的可能性越小。
不同的评分区间与信用风险等级对应如下:
[300,500) 高风险建议拒绝
[500,550) 中风险建议关注
[550,1000] 低风险建议通过