IJCAI2018|中科大、百度:面向智能面试评估的一种联合学习方法
作者:申大忠
IJCAI 2018
面向智能面试评估的一种联合学习方法
A Joint Learning Approach to Intelligent Job Interview Assessment
中国科学技术大学、百度TIC
University of Science and Technology of China、Baidu Talent Intelligence Center (TIC)
本文是作者在百度TIC团队实习期间完成
【摘要】作为人才招聘中一个最重要的任务,工作面试相当于在候选人与雇主之间构建了一个桥梁,从而为工作岗位匹配合适的候选人。虽然人们已经付出了大量的努力去提升面试效果,但传统面试中的评估仍是不可避免的存在着偏差或者不一致的现象。这可能是由于不同的面试官具有不同的技术背景与经验水平,同时面试官的喜好也会一定程度对其决策造成影响。为改善这种现象,提供更客观的面试,我们创新性地提出了一种基于大量真实世界的面试数据的方法进行智能面试评估Joint Learning Model on Interview Assessment(JLMIA),具体来说,JLMIA通过对工作描述,候选人简历,和面试评估三者进行联合的建模,可以有效地从历史上成功的面试记录中学习到不同面试过程的表征。其次,我们也基于JLMIA提出了一些面试中的实际应用,例如可以使用JLMIA进行人岗匹配度量与面试问题推荐。
1 模型构建
通过分析大量的招聘面试数据,我们发现在模型构建过程中,需要特别关注三个现象:
1.简历预面试评语之间存在着很强的相关性。
2.岗位描述与简历之间同样也存在着强相关性,但与岗位描述文本信息相比,简历文本内容更加多样化。
3.技术类面试与综合类面试在面试中的关注点具有很大的区别。
综合考虑上面三种现象,我们设计了模型JLMIA,如图,来联合学习面试中的岗位描述,简历与面试评语三类文本之间的关系。
具体地,大致可以分为三部分,
这一行用于生成岗位描述,
这一行用于生成简历,
这一行是生成面试评语。其中
表示对应文档中的一个单词,
表示这个单词的主题,
为文档主题分布,
为各文档库中主题库,每个主题为一个在词表上的概率分布。
为了很好地刻画上面提出的三种现象,我们在模型中分别设计了以下三点:
1.面试评语与简历文本共享主题分布
。
2.
由岗位描述的主题分布
生成,但简历与面试评语的主题数要比岗位描述多,具体的是岗位描述主题数K的C倍。
3.不同类别的面试评语由不同的主题库生成。
对于模型中其他部分生成过程都与经典主题模型LDA类似。同时,类似于LDA,我们又根据变分推断的思路设计了一个EM算法进一步求解我们的模型。
2 两个应用
2.1 人岗匹配
给定一对岗位描述
与简历
,我们希望度量两者的匹配度。使用JLMIA可以推断出两个文本的各自主题分布
与
,作为各自的表征向量,有两类方法可以度量匹配度:
无监督方法:利用
与
间的相似度作为度量标准,例如 Cosine 相似度, KL距离等。
有监督方法:把
与
相连,作为一个匹配对的特征,把录取与否作为标签,训练分类器。训练后分类器对于新输入的所预测概率作为匹配度量。
2.2 面试问题推荐
假设我们有一个面试问题集
,给定一个query
我们希望推荐一个相关的问题子集。这个问题子集一方面要与query相关,另一方面问题覆盖的知识点要尽可能多,即问题彼此之间要有差异性。 问题可以被看作面试评语的一部分,从而推断其主题分布
作为问题
的表征向量。结合query的表征向量
我们设计了如下优化函数,在候选问题集中找寻最优的问题集。
3 实验结果分析
我们所使用的实验数据包含,4816个应聘成功的候选人所对应的面试记录,涉及409个不同的岗位。为了后续人岗匹配实验,我们也人工制造了相同数量的投递失败的岗位与简历匹配对,当作负例。同时还有1085个从以往面试中抽取出来的问题作为面试问题集。
3.1 人岗匹配的效果
使用LDA与 bag-of-word作为baselines 做对比实验,我们发现无论是监督方法还是非监督方法,我们的模型效果一直最好。证实了我们的模型可以有效的帮助面试官评估候选人。
3.2 面试问题推荐效果
选择100条候选人的经历条目作为query,每个query推荐10个问题,然后我们让3位经验丰富的面试官评估推荐的问题,三个指标:
Relevance 表示10个问题中有多少个与query相关。
Diversity 这些相关的问题中有多少类不同的技术问题。
Personal Quality 表示又有多少与人文素养考查相关。
我们可以发现,JLMIA 推荐给问题Relevance 与Diversity都较高,而且推荐给综合面试的问题Person Quality要比技术面试高的多。而baselines BM25 效果比较差。更具体的,我们展示了一个例子。可以发现这个query 是与HTMLCSS 编程web开发相关,JLMIA 推荐的问题大多涉及” HTMLCSS编程”问题,还有一些Web开发需要的具体知识, 比如 “TCP/IP”协议等,同时也会向综合面试官推荐类似于C3的问题考察综合能力。而BM25推荐算法基于字符匹配很难发掘query中的潜在知识点。
4 总结
本文原创性的提出了一种面向智能招聘的联合学习方法 JLMIA。JLMIA可以通过对大量真实面试记录数据的学习,对岗位描述,简历与面试评语进行联合建模。JLMIA可以有效地从历史上成功的面试记录中学习到不同面试过程的表征。其次,本文基于JLMIA提出了两个应用,人岗匹配度量与面试问题推荐。最后, 丰富的实验充分验证了模型的有效性。