专访领英副总裁张仁辉：如何驯服算法，打造世界级职位推荐系统？

qwerdf00

2019-07-09

专访领英副总裁张仁辉：如何驯服算法，打造世界级职位推荐系统？

大数据文摘出品

作者：魏子敏、宋欣仪

作为全球最大的职业社交网络，创建于2003年的LinkedIn在过去 6 年间，从一个 7000万左右年营收的企业，增长至30亿美元营业额的企业。五年间LinkedIn业务增长超过40倍，这种增长速度在企业服务领域是惊人的。

专访领英副总裁张仁辉：如何驯服算法，打造世界级职位推荐系统？

领英改变了传统的先由企业发布职位信息然后求职者响应投简历接着企业通过简历筛选，面试甄别，求职者单向信息不对称、主动性不对称的流程，让企业可以主动对中高端人才进行邀约，人才可以享受到被动的求职服务。

通过信息工具主动挖掘到更多符合自身特点的人才，结合社交关系、档案资料、人脉评价等比简历更立体的信息，对候选人进行考核甄别，再进行邀约面试的考核。

但是人力资源管理中的场景非常复杂，并且常常面对数据不对称、有偏见的各种问题。6月20日，在北京召开的O’Reilly AI Conference上，LinkedIn的工程副总裁张仁辉作了题为《人工智能对未来招聘和人才市场的影响》的演讲，并在会后向大数据文摘介绍了领英在训练自己的算法模型中遇到的各种难题及应对之道。

专访领英副总裁张仁辉：如何驯服算法，打造世界级职位推荐系统？

LinkedIn的工程副总裁张仁辉作了题为《人工智能对未来招聘和人才市场的影响》的演讲

人力资源管理中使用数据科学技术的挑战

专访领英副总裁张仁辉：如何驯服算法，打造世界级职位推荐系统？

曾担任雅虎工程副总裁、Tinder 首席技术官，张仁辉对于传统的搜索和推荐系统非常了解。她告诉大数据文摘，与传统的搜索和推荐系统只关注如何评估一条内容和给定查询的相关度不同，人才搜索领域需要招聘人员和候选人就本岗位互相彼此感兴趣。

换句话说，不仅需要所显示的候选人必须与招聘人员的查询相契合，而且需要招聘人员联系的候选人必须对岗位机会表现出兴趣。因此，使用适当的指标来优化模型以及在线的 A/B 测试至关重要。

此外，人才搜索系统的底层查询可能非常复杂，它结合了一些结构化字段（如规范化头衔、规范化技能和公司名称）和非结构化字段（例如自由文本式关键字）。

最后，个性化对于人才搜索系统而言非常重要，网站需要根据招聘人员所寻找应聘者的类型来模拟他们的意图和偏好，这也是人力资源中人工智能应用需要跨过的一道门槛。

人力资源数据的偏见与担忧

除了这些未知的挑战，在人力资源领域，人工智能还出现了许多已经有的偏见。

最为人熟知的可能是亚马逊被关闭的自动化招聘算法。据路透社报道，自2014年以来，亚马逊就专门成立了团队开发电脑程序以审查求职者的简历，以将寻找顶尖人才的任务自动化。

这一试验性招聘工具使用AI给应聘者打分，分数从一星到五星不等，直到2015年，亚马逊意识到其新系统对于软件开发人员和其他技术职位求职者存在性别偏见判断。这是因为，亚马逊的电脑模型经过了培训，通过观察过去10年被提交给该公司的简历找出固有模式，并以此来审查应聘者。

亚马逊立刻关闭了这一系统，但依然暴露了人工智能的一大缺陷：基于历史数据，算法会把人类世界无意识的偏见进一步扩大。

驯服算法，打造无偏见个性化的职位推荐系统

“在消除偏见方面，领英一直在试图在算法中提升透明度、可建性和个人意识。”

张仁辉向大数据文摘介绍了领英通过相关产品LinkedIn Talent Insights，把统计数据跟决策者、人力资源部和招聘部门进行分享，让他们了解团队的薪酬水平和整体的市场情况，使情况更加透明，这样大家可以了解到当前的AI系统和实际的差距所在，并尽量缩小这样的差距。

此外，张仁辉表示，为了实现个性化服务，领英采用了能够从多角度理解内容的机器学习算法。通过将机器学习与会员意图信号、档案数据和会员人脉网络信息结合起来，实现会员推荐和搜索结果的高度个性化。

专访领英副总裁张仁辉：如何驯服算法，打造世界级职位推荐系统？

领英的职位推荐系统是世界级领先的，其基础是通过大量用户数据建立的知识图谱和研发针对自然语言的标准化技术。领英针对每位用户的简历，都使用基于深度学习模型的标准化技术来实现信息抓取，比如LSTM, CNN等等。对于工作职位也做了同样的事情。

六七年前，领英的职位推荐是一个线性模型，比如说求职者是一个软件工程师，系统就会推荐一个软件工程师的职位。但后来使用中发现，根据用户简历和工作职位的描述来做推荐，不一定能够完全实现个性化，领英还希望根据用户之前的职位申请，为他推荐更多类似的职位，即深度的个性化。之后又研发了Generalized Linear Mixed Model（GLMix），针对每个用户和每个职位建立一个单独为他们服务的模型，这样使得模型的参数量达到了上百亿的规模。同时也成功地把职位申请的数量提高了30%。领英中国团队把这个模型用在中国的数据上，又将职位申请的数量额外提高了11%。

进一步地，领英还建立了一个Deep & Wide的模型，其中整合了深度学习，树状结构模型，以及GLMix，极大地提升了领英的用户体验。为了实时更新上百亿的模型参数以及在毫秒级别内满足用户的职位推荐需求，领英搭建了大规模运算平台来实现人工智能模型的技术。这个平台包括线下和线上两个模块——线下模块自动收集用户的反馈、基于Spark自动训练，之后把模型结果和参数上传到线上。线上使用实时数据传输和搜索引擎技术来实现低延迟的模型运算。

并且，领英专门研发了一个叫做Pro-ML的“人工智能自动化”系统，为所有工程团队集中管理特征和机器学习模型。这一系统为机器学习模型的整个开发、培训、部署、测试提供单一化平台，已经极大加快了领英开发及上线新产品的速度。

就这样一步步，领英打造了如今的复杂高效的世界级推荐系统。

专访领英副总裁张仁辉：如何驯服算法，打造世界级职位推荐系统？

正如张仁辉在6月20日的演讲《人工智能对未来招聘和人才市场的影响》中提到的，“我们拥有同理心、创造力、道德标准和伦理感，而人工智能会从重复性的工作和危险的工作中解放我们，让我们得以更好、更自由地表达并发展自己，让我们更好地相互连接，从而让世界更加美好。”

虽然现在人工智能的算法虽然非常的先进，可以下棋、打败电竞选手、玩视频游戏，但是人工智能没有同理心的能力，它没有办法了解另外一个人的情感。招聘工具可以取代重复的工作，比如每天要重复看简历来找候选人或者安排面试，但是这个工具永远不会取代人。

我们可以通过握手，直视面试者并微笑，听他们的故事，进而了解他们，但人工智能不可以。所以人工智能是不会取代我们，而是会让招募人员可以有更多的时间来和候选人进行人与人之间的交流，进行彼此的了解。

各行各业向AI招聘的转变创造了一个就业搜索环境，而这种环境将会持续下去。对于应聘者来说也有启示，企业将越来越多地使用基于AI的软件来对求职者进行分类。这意味着求职者需要用直白的语言来描述他们的背景，使用通用的语言来展示相关的工作经历。申请者还应准备进入招聘程序，让AI试图将他们理解为“人”，而不是作为一份成就清单。未来我们都应该学会如何与AI合作，如何与AI沟通。

qwerdf00

0 关注 0 粉丝 0 动态

相关推荐

LinkedIn开源Dagli，发布Java机器学习函数库

近年来，越来越多的优秀的机器学习工具不断涌现，如 TensorFlow、 PyTorch、 Caffee 和 CNTK、用于大规模数据的 Spark 和 Kubeflow，以及用于各种通用模型的 scikit-learn、 ML.NET 和最近的 Trip

lgblove 2020-11-16

LinkedIn 定制 Kafka，互联网大厂是如何每天处理 7 万亿条消息

Apache Kafka 是 LinkedIn 基础设施的核心组件，最初是作为内部流式处理平台而诞生的，后来被开源出来，并得到了外部的广泛采用。虽然有很多公司和项目在使用 Kafka，但他们的数据规模很少能够达到 LinkedIn 这样。Kafka 被广泛

guicaizhou 2019-11-08

敏捷开发之LinkedIn的高效代码评审技巧

阅读和代码评审是每个工程师在日常工作中都要做的事情，然而一个标准的code review流程，实际上很难落地，它要求每次代码变更在部署到生产环境前，甚至是在提交合并前，都需要被另外一个小组成员进行正式的评审。在LinkedIn公司，自从2011年起code

SusanXu 2019-09-07

伊朗国家黑客对LinkedIn用户使用恶意软件和网络钓鱼攻击

美国及其盟国和伊朗之间的网络战造成的紧张局势加剧了。一些信息安全专家认为，伊朗黑客在能力和资源方面远远落后于美国政府，但美国私营公司的技术基础设施并不像美国政府那么强大。信息安全公司FireEye表示，与伊朗政府有关的APT34黑客组织已开始为社交平台Li

zhanliming 2019-07-24

大规模采用 Kotlin 替代 Java？我们应该知道这些利弊

当大规模采用一门新语言时，有许多不同的因素需要考虑，因为事情可能会发生巨大的变化。对于许多人来说，选择一门语言可以说是取决于个人偏好，但在 LinkedIn，我们有一个基础团队，负责评估这些基本技术决策的影响。最近，我们经历了评估 Android 开发

带你装逼带你飞 2019-08-28

美国所有技术类新兴职业都涉及软件工程！

在过去5年里，由于技术在各个领域的影响，科技岗位呈现爆炸式增长，比如目前在美国有超过1600个机器学习工程师的空缺职位。我们知道，美国有超过1.43亿的员工拥有LinkedIn的个人资料，有2万多家公司使用LinkedIn招聘，每月在LinkedIn上发布

夏未眠秋风起 2018-02-05

HtmlUnit实现Linkedin网站登录认证

oauth_token=";type=SHAR&scope=self";.build();System.out.println(requestURL);finalHtmlPagepage=webClient.getPage(re

loverlucky 2011-07-18

LinkedIn数据基础设施简介

来自LinkedIn的Jay Kreps在近日举办的Hadoop峰会上详细介绍了LinkedIn对数据的处理方式。Kreps介绍了LinkedIn每天是如何处理1.2千亿个关系并通过高容量、低延迟的站点服务来混合大量的数据计算的。LinkedIn的很多重要

strongyoung 2010-12-25

超千人的庞大数据团队如何运作？对话LinkedIn数据科学负责人许亚

作为全球成立最早的数据科学团队之一，LinkedIn对于“数据科学和数据科学家”都有着不一样的认识。目前，LinkedIn拥有超千人的庞大数据团队，“嵌入式”的工作模式和强大的数据驱动文化也使得领英在数据团队建设方面独树一帜。另一方面从市场的角度上来说，我

小王 2019-07-05

著名社交网站LinkedIn的Java架构技术

在JavaOne 2008的会议上，著名社交网站LinkedIn的开发者做了2个关于LinkedIn. 每天25万邀请发送6。在Cloud中缓存所有network图，Cloud是用来做缓存的独立server。WebApp仍然提供用户界面给用户，但是，通过s

qiuzhiming0 2013-07-10

LinkedIn用Node替代Rails：减少了27台服务器速度提升20倍

摘要：这不是代表孰优孰劣，但LinkIn从Node替换Rails取得了不俗的性能提升，硬件的利用率提升了10倍。客观的说，将2008年与2012年的产品进行对比本身就不公平，曾经在LinkedIn工作的工程师蓝奕凯发表了博文，对使用Rails那段历史进行了

hooopo 2012-10-09

饶军：Apache Kafka的过去，现在，和未来

欢迎大家前往腾讯云+社区，获取更多腾讯海量技术实践干货哦~说起Kafka的话，那就要回朔到2010年，在这个领域，我是在2010年加入领英，可能很多人都熟悉，这是一个提供人才和机会的社交平台。在2010年的时候，领英初具了一点规模，这也是领英高速成长的一个

jiaomrswang 2019-06-27

「AI间谍」扰乱美国政坛，众议院提出法案打击Deepfake换脸技术

人工智能工具 Deepfake 可以生成逼真图像和视频，现在竟有人拿它来进行间谍活动了。美国民主党众议员 Adam Schiff 在本周四的众议院情报委员会听证会上发出警告称，由 Deepfake 生成的视频可能会对 2020 年美国大选产生灾难性影响。S

wesay 2019-06-14

从知名专业社交网站linkedin数据库泄漏事件中引发的思考(图文)

根据Venturebeat的报道，650w被偷窃的LinkedIn账户密码列表已经被上传至一家俄罗斯黑客服务器，但目前尚不能确认是否只是650w的用户帐号被窃。Linkedin目前用户过亿，平均每一秒钟都有一个新会员的加入。在上述每个行为都会有自己的特征行

jianzhandaren 2012-06-20

揭秘LinkedIn！全球最大的招聘推荐系统如何被机器学习驱动？

LinkedIn是迄今为止市面上极受欢迎的招聘平台之一。来自世界各地的招聘者每天会从LinkedIn上网罗挑选适合他们招人岗位的候选人。像LinkedIn Recruiter这款产品，就可以帮助招聘者创建并管理一个人才库，最大限度地提高招人成功率。招聘产品

NeverStop 2019-05-29

独家｜一文读懂LinkedIn个性化推荐模型及建模原理

本文将重点关注个性化推荐模型，并解释建模原理以及如何通过Photon-ML来实现，使其能够惠及数亿用户。为了实现这个目标，通过机器学习模型从收集的反馈信息中估计用户偏好至关重要。这是大数据行业最令人兴奋的应用之一。一个全局模型，用来捕获用户申请工作的常规行

zhongjunlang 2017-12-18

全新角度总结Twitter Facebook和LinkedIn业务模型与架构

通常一个网站系统的架构设计取决于其业务特点，Twitter Facebook和LinkedIn业务特点是：大量不断动作事件写入的同时，需要实时更新各种不同汇总页面。属于并发编程中大量并发写和大量并发读同时存在的场景。and making sense of

TWITTER自行车符R 2018-09-11

领英开源TonY：构建在Hadoop YARN上的TensorFlow框架

领英用户超过 5.75 亿，其 Hadoop 集群中存储了数百 PB 的数据，因此需要一种可扩展的方式处理所有这些信息。TensorFlow 支持分布式训练，但构建分布式 TensorFlow 框架并非易事，因此需要将分布式 TensorFlow 的分析能

wangyjbk 2018-09-20

香港也抢AI人才了！科技人才入境计划1年引进1000人，最快2周审批

继北京推出高科人才落户计划后，香港也来抢AI人才了！而且矛头直指BATJ。5月8日，香港特区政府正式公布“科技人才入境计划”，为引入海外和内地科技人才实施快速处理安排，以配合香港科技公司及机构在延揽人才方面的需要。在这一背景下，香港此次公布的“科技人才入

AI启蒙研究院 2018-05-10

LinkedIn联合创始人：人工智能改变公司管理方式

这方面将取得重大突破，我们正处在变革的风口浪尖。这是委托文章系列的第二篇，该系列的每篇文章都是作者对以下问题给出的回答：「在未来五年内，技术将如何以一种我们尚未见过的方式改变管理实践？」MIT 斯隆管理评论将这些文章发表在了2016 年春夏季的Fronti

huangjie0 2016-06-15

qwerdf00

W3CSchool教程: HTML 教程; CSS 教程; Bootstrap 教程; Javascript 教程; jQuery 教程

后端教程: C 教程; Java 教程; PHP 教程; Python 教程; Go 教程

移动开发: Android 教程; Swift 教程; Kotlin 教程; jQuery Mobile 教程; ionic 教程

关于我们: 新闻动态; 联系方式; 招聘英才; 安科实验室; 帮助与反馈

安科网(Ancii)，中国第一极客网

Copyright © 2013 - 2019 Ancii.com

京ICP备18063983号京公网安备11010802014868号