构建中央数据团队与业务部门的良性生态

构建中央数据团队与业务部门的良性生态

原标题:《对话Capital One纽约总部数据中心负责人:构建中央数据团队与业务部门的良性生态》

大数据文摘作品,转载请注明来源

大数据文摘记者 | 魏子敏

*本文为清华数据科学研究院联合大数据文摘发起的《数据团队建设全景报告》系列专访内容。

“我们不是一家传统意义上的银行,我们也不把自己看作银行。我们是一家以信息/数据作为基础战略的公司,只不过我们第一个成功的产品碰巧出现在银行领域罢了。”(“We are not a traditional bank. We do not see ourselves as a bank. We are a company with an information-based strategy, whose first successful product offerings happen to be in banking.”)

Capital One创始人Nigel Morris在创始之初就为这家金融机构奠定了数据化战略的基调,他认为,强调数据和信息技术的战略不止可以成就一家Capital One,也完全适用于其他行业。而数据化运营的血液也从创立之时就注入在这家公司的文化中。

5月初,大数据文摘跟随上海大数据联盟一行,到访了位于纽约的Capital One总部,并对话其数据服务部负责人Mike Walters。之后,团队还到访了其位于纽约市中心联合广场的第一家Capital One 360咖啡馆,身临其境地感受了其以数据为中心的企业文化。

构建中央数据团队与业务部门的良性生态

Capital One数据服务部负责人Mike Walters介绍相关业务

构建中央数据团队与业务部门的良性生态

考察团在Capital One 360 café与工作人员合影

Capital One的逆袭:比互联网公司还注重大数据的金融大佬

自1988年创立之初,Capital One就坚信银行的竞争力是对金融信息的收集与处理能力,应该运用信息科技与高频测试来开发最适合客户需求的金融产品。在那个甚至互联网普及率都很低的年代,Capital One管理层已经把数据搜集和分析做到了极致,这一信条帮助 Capital One成为一家“互联网时代之前的大数据公司”,并成功跻身全球财富五百强。

构建中央数据团队与业务部门的良性生态

Capital One发家自美国弗吉尼亚州Signet银行(Signet Bank)的信用卡部门。通过不断寻求技术创新,现在,Capital One已跻身全美最大的银行之一。截至2015年9月末,资产规模已经超过3000亿美元,名列财富世界500强。

以数据为中心的企业文化和员工培养机制,公司高层对数据化运营的支持,都是这家金融企业成功逆袭的必要条件。

中央数据团队:为业务部门提供技术支持

Capital One作为一家庞大的金融机构,有着多条业务线,而数据化运营渗透进了公司的每一条业务线中。除了在每个业务部门内配有自己的数据团队外,Capital One还设置了专门的中央数据服务中心来为商业组的决策和工作提供数据技术支持。

数据服务中心负责人Mike Walters告诉大数据文摘,中心会为整个商业部门服务,“团队组织是按照商业线、产业群组织的,就像多数的技术公司那样,我们的团队、机器学习工程师和数据工程师从业务部门获得业务需求,并为他们寻求解决方案。”

Capital One的数据服务中心4年前成立,目前有超过30位成员,包括数据工程师、数据科学家、机器学习工程师、系统架构工程师、产品经理、敏捷专家等职位,并且团队还在不断扩大。

“我们一开始也是想建立一个以数据为中心的部门,主要的想法就是解决部门之间的数据交互问题,”Mike如此定义数据服务中心的职能,“虽然各部门都用类似的数据,但是信用卡数据在信用卡部门,银行数据在银行部门,还有车贷数据在车贷部门,我们想把这些数据放到一个中心。”

Ivy是Capital One信用卡部门的一位数据科学家,她所在的部门也有一支20人左右的数据团队。类似这样嵌入在业务部门中的数据团队在Capital One的不同部门也始终存在。Ivy称他们和数据中心一般是进行项目制合作,数据中心为业务部门提供“工程师支持(engineer support)”。“数据科学家、工程师、产品经理大家会一起参加项目相关的会,但我们不会参加他们大组组会,他们也不会参加我们大组组会。”

Mike认为垂直业务线上的数据团队与中央数据中心各有存在必要。“部门内的数据团队离业务更近,相关问题更好反馈;而对于平行中心化数据团队,最大的优点是可以将不同业务线的问题集中解决,比如我们的信用卡业务和银行业务部门,虽然数据不同,但可以用一套架构解决,通过一个类似“委员会”的机构与各个业务部门的负责人形成良好沟通关系,工作也更好开展。

Mike介绍,在美国,中央数据团队和业务部门内部的垂直数据团队都曾出现过,“当经济好的时候,大家都有些闲钱,所以每个部门就会自己养一个数据部门来做数据工作,当经济不好的时候,没有这样的闲钱,大家就一起共享,中央数据团队更常见。”

拥抱新技术:建立起数据部门与业务部门的良性循环

“美国的传统大型金融机构中,像Capital One这样愿意全身心拥抱新技术的不多。”上海诚数信息科技有限公司首席数据官薛瑞东曾在PayPal工作多年,他认为,在美国,很多金融大佬由于体量大,转型都比较艰难。“在其他银行的Shared Tech还只是负责解决IT Support这些基础工作的时候,Capital One最为坚决地拥抱技术并邀请技术部门深度介入业务决策和运营。”薛瑞东说。

Capital One的数据服务中心目前几个核心项目都是把机器学习应用到业务领域,从数据出发,把每个产品放到实际应用当中。“我们组里的很多成员都是程序员,程序员关注的就是写代码,大家认为把产品放到实际应用中也是一件非常有趣有意义的事。”Mike希望建立起一个技术部门和业务部门沟通的良性循环,“当我们这样做的时候,也赢得到业务部门的信任,愿意把这样的项目交给我们组来一起做。”

Mike举了一个利用机器学习帮助业务部门处理脏数据的例子。“数据远比你想象的更脏。”Mike及其服务的业务团队也跟所有使用数据的团队一样,需要解决的最头疼问题就是数据杂乱无章的问题。

“比如用户最后得到的信用卡账单上,商家的名字有可能是非常混乱的,有可能显示不是很清晰,所以在星巴克消费就有可能不会显示Starbucks,有可能显示的是SBUS,然后写一堆乱码和数据,用户看到这样的账单就会非常的困惑。”

这个不止是客户,也是Capital One其他业务团队非常头疼的事情,“所以我们用一些模糊匹配,看到SBUS这样比较混乱的信息匹配到非常干净的商家表里面。而这些商家有时候可能不是一对一的匹配,所以我们有可能得到很多的结果,因为一个街区里有可能有很多的星巴克。最后我们就要用到机器学习的方法,找出对应的星巴克,然后把结果放到数据库里面。之后如果用户或者其他业务部门需要,就可以直接去查询这些数据。”

“没有哪个数据源是完美的。”关于数据质量问题,Mike的团队解决办法是建立起了一套数据源评分系统,在对数据使用后对其进行事后评估,下一次购买的时候优先购买高分数据。

开放思维和金融生态:把银行开成咖啡馆和实验室

位于纽约市中心联合广场的Capital One 360 cafe是Capital One提供银行服务的咖啡馆,或者叫提供咖啡馆的银行。它颠覆了一般金融机构正襟危坐的禁锢感,这家“金融咖啡馆”明亮且温暖,提供咖啡、充电设备、定期讲座,工作人员在轻松的氛围下和用户互动,人们可以轻松惬意地享受各种定制化的金融服务。

构建中央数据团队与业务部门的良性生态

位于纽约联合广场的Capital One 360 café,人们可以在惬意地享受咖啡的同时了解金融服务。

构建中央数据团队与业务部门的良性生态

Capital One 360 café的工作人员

薛瑞东认为,尽管这种苹果风格的银行是否会取得经济上的成功还很难说,但Capital One这种勇于变革、始终走在银行创新第一线的开放思维依然值得所有人深思。

“对技术的拥抱和始终走在变革前列的文化可能就是Capital One仅仅用了30年之内就脱胎换骨成为全美十大银行之一的秘诀吧。当年在经济危机之后其他美国大银行都在收缩战线整理羽翼,唯有Capital One继续逆势成长,技术、数据科学和革新功不可没。”

《数据团队建设全景报告》系列专访

数据驱动时代,数据团队作为一家公司的核心竞争力所在,正受到越来越多的关注。清华数据科学研究院联合大数据文摘,发起了一次数据团队全行业调研,对国内外数据团队发展现状进行盘点和趋势预测,我们将在7月初发布《数据团队建设全景报告》。

如果你是——

· 相关领域数据科学团队负责人:

希望分享自己的团队建设经验给更多读者,我们诚挚的邀请您作为深度访谈嘉宾,与我们的记者和研究员就相关话题深入沟通。相关专访内容将作为重点专题,在《数据团队建设全景报告》中呈现。请将您的需求和团队介绍发给我们。

· 对数据科学有自己的见解、具备一定的采访报道技能:

希望接触到一线的数据科学大咖,也欢迎加入我们的专访团队,请将简历和相关作品发给我们。

· 数据团队的一员、和数据团队一起工作,或者希望了解其他数据团队的发展现状和未来:

那么恳请你花费5分钟时间点击“阅读原文”填写相关调研问卷,帮助我们完成这次调研。参与者均可获得:最终详细数据报告完整版;2017年度大数据文摘电子杂志。

联系邮箱:[email protected]

相关推荐