雷锋网 AI 开发者按:美国时间 8月4号,数据挖掘领域的国际最高级别会议 KDD 2019 在美国阿拉斯加州的安克雷奇市举行。自 1995 年以来,KDD 大会连续举办了二十余届,每年的论文接收率不超过 20%,即便如此,来自我国的众多成果依旧获得了评委们的青睐。
今年,BOSS 直聘以一篇名为《Interview Choice Reveals Your Preference on the Market: To ImproveJob-Resume Matching through Profiling Memories》的论文成功入选会议科研类论文单元,今年此单元论文录取率仅为14%。在这份论文中,BOSS直聘提出针对求职者与招聘者双方偏好进行建模的新型匹配模型,此模型能有效地提升求职者与招聘者的匹配效率。
为此,我们采访了本篇论文的作者之一,来自BOSS直聘NLP中心的宋洋博士,聊了本次论文对于现实招聘场景的价值,以及BOSS直聘在相关领域的规划。
在BOSS直聘NLP中心负责人宋洋博士看来,招聘场景里无论是求职者还是招聘者,在提交了一份简历或职位描述时,都认为这已经能够非常清楚表达自己的实际需求,然而事实上,静态文本无法充分表达你内心最深层的需求。
“其一,你写的东西不一定充分代表你的需求。很多时候岗位文本表述的信息,与实际所需求的特征不相匹配。”宋洋博士进一步补充道,“这也是很多时候导致匹配效果变差的原因,因为大家没有办法很好的去表达自己真正想要的东西,所以在这篇论文中,我们加入了动态交互行为的文本偏好信息来辅助系统进行更高效的匹配。”
目前的当务之急,是要不断基于静态文本、动态行为、以及更多丰富的场景数据资源来收敛双边的需求。“我们需要不断地收敛需求,这是系统匹配变得高效的前提。”宋洋博士如此说道。
用户过往的求职招聘行为体现了个人偏好
在过去,传统的双边推荐系统主要基于人工构建的特征,通过训练模型来拟合是否匹配。近几年随着深度学习的发展,才开始出现基于深度匹配模型来学习简历文本与职位描述文本是否匹配的工作。
宋洋博士介绍道,BOSS直聘本次的工作相当于过往工作的延伸。“我们认为,求职招聘场景除了简历文本和职业描述的静态文本信息外,还包括双方曾经产生的交互行为——求职者面试过的岗位,以及相关岗位过往面试的候选人。”
宋洋博士表示,用户过往的应聘经历体现了个人偏好,而这些偏好又会影响用户后续的决策,包括点击或沟通哪些职位、是否促成面试等行为。为此,BOSS直聘团队提出了一个全新模型,通过在职位侧和简历侧两端分别引入记忆模块学习包含交互行为的文本偏好表示,接着基于记忆模块迭代职位和简历的文本向量表示,最终通过一个多层感知器来拟合是否匹配。
本文提出的模型由招聘者与求职者双边对称的表示学习网络,以及匹配网络三部分组成。在岗位描述表示学习网络中,模型利用岗位描述文档以及该岗位历史上曾经面试过的求职者的简历文档,通过引入记忆模块来计算带有偏好的岗位向量表示。对称地,可以得到带有偏好信息的简历文档表示。以上述两个文档表示为输入,模型利用MLP网络计算匹配分数。优化的目标是极大化发生面试的岗位描述与简历文档之间的得分,极小化不匹配样本对之间的得分。
将“用户历史交互行为”加入整个推荐匹配模型是本论文最大的创新点,以岗位描述文档结合“历史交互行为”的文本表示为例,主要分为初始化阶段和记忆模块迭代两个处理阶段:
初始化阶段:
模型首先对岗位描述文档里的各个句子,以及该岗位历史面试过求职者的简历文档内的各个句子经过层级GRU网络进行编码,得到各个带有上下文信息的句子表示。
同时,模型将岗位文档各个句子带有上下文信息的句子表示作为记忆模块的初始化。
记忆模块迭代:
给定一个岗位描述文档J按照时间顺序遍历与该岗位发生过面试的简历文档R,对记忆模块M进行更新与读取的迭代:
a)利用J和各个R对M进行更新(记忆模块更新)。
b)J从M中读取偏好信息(记忆模块读取)。
最终,团队基于BOSS直聘真实场景数据集进行的实验结果显示,该方法优于传统的机器学习方法以及其他基于深度文本匹配的方法。
宋洋博士介绍,未来该论文提出的模型将会被运用到BOSS直聘的线上搜索推荐系统提高推荐匹配效率。“ 核心还是在于提高推荐的匹配效率,以节约招聘者以及求职者的时间成本。”
与北大合作机缘
谈到本次研究的初衷,宋洋博士表示,近年来,以BAT为代表的国内互联网公司频频在国际顶会上发表论文 ,在企业技术取得进步的同时,也为学术界做出了相应贡献。他进一步表示,求职招聘场景一直以来都未获得工业界与学术界的重视,作为国内大型互联网招聘公司之一,宋洋博士认为BOSS直聘有责任推进该领域的研究工作,以引起更多同行的关注,共同推动招聘行业的发展。
为何合作单位选择了北大?宋洋博士与北大严睿老师曾是同学,两人在聊天时会经常聊到双边匹配的可能性,所以一拍即合,最终促成本次合作。“过往学界在推进相关研究时,更多集中于单边推荐系统,而求职招聘场景是天然双边匹配推荐场景,拥有广泛的文本数据资源,如简历/招聘描述、双方交互行为等。”宋洋博士如此说道。
据了解,为了更好地推进该工作,双方团队一起碰撞了四个多月。最终,将成果投稿于KDD大会,负责评审论文的三位评委肯定了该工作的创新性。
“BOSS直聘是第一个提出将静态的文本信息与动态的行为交互偏好信息结合到一个深度文本匹配框架下,用于解决求职招聘场景的双边推荐匹配问题。”宋洋博士补充道,“问题的解决思路足够直观、实验部分比较扎实充分、实验效果也很好,这些都是加分项。”
此外,宋洋博士认为还有一个潜在的原因。“由于求职招聘目前尚属于小众的问题领域,对于看了特别多电商推荐、图网络方面论文的评审来说,看到双边匹配推荐模型应用于人力资源行业,让人眼前一亮。”
BOSS 直聘 NLP 中心
BOSS直聘NLP中心成立于2017年7月,主要职能是面向BOSS直聘全场景的文本数据资源开展基础算法研究以及应用服务开发。
根据 AI 开发者了解,该中心负责研究求职期望文本信息与岗位描述文本信息之间的双边匹配算法,比如求职期望解析、职位描述的结构化信息提取、双方交互行为信息挖掘、知识图谱、智能客服等等。
宋洋博士表示,除了与NLP相关的工作外,中心还会涉及图像算法以及安全风控方面的工作。未来,BOSS直聘NLP中心将继续围绕求职招聘的场景,聚焦于迁移学习、异构信息网络推荐等多个方向做更深入的探索实践。在本次采访中,宋洋博士也对这两个方向的研究做了详细介绍:
迁移学习试图解决的是部分岗位求职者信息不足所导致匹配效率低的问题,通过将某个文本信息更加丰富的岗位/行业场景迁移到文本信息相对匮乏的岗位/行业场景,提高双边匹配推荐效率。
异构信息网络推荐是近几年在推荐算法领域比较前沿的研究方向,所以希望能沿着该方向做一些探索实践。
宋洋博士告诉 AI 开发者,BOSS直聘NLP中心将近40人,目前团队在NLP算法、图像算法、安全风控算法、知识图谱、智能客服、图数据库等方面都有招人需求,对此感兴趣的同学,可以密切保持关注。
在问及有何建议给到年轻的 AI 开发者们,宋洋博士表示,“尽量多做一些与工业界实际业务场景相关的核心问题,才能做出更多具有工业价值的贡献。”
封面图来源:https://www.enago.cn/academy/tips-on-writing-a-resume-for-an-industrial-research-job/
雷锋网 AI 开发者雷锋网(公众号:雷锋网)
雷锋网原创文章,未经授权禁止转载。详情见转载须知。