关于美团:KDD-2022-美团技术团队精选论文解读

38次阅读

共计 4849 个字符,预计需要花费 13 分钟才能阅读完成。

往年,美团技术团队有多篇论文被 KDD 2022 收录,这些论文涵盖了图谱预训练、抉择算法、用意主动发现、成果建模、策略学习、概率预测、处分框架等多个技术畛域。本文精选了 7 篇论文做简要介绍(附下载链接),心愿能对从事相干钻研方向的同学有所帮忙或启发。

ACM SIGKDD 国内会议(简称 KDD)是由 ACM 的数据挖掘及常识发现专委会主办的数据挖掘钻研畛域的顶级年会,属于 CCF A 类会议。因为 KDD 的交叉学科性和宽泛应用性,其影响力也越来越大,吸引了来自统计、机器学习、数据库、万维网、生物信息学、多媒体、自然语言解决、人机交互、社会网络计算、高性能计算及大数据挖掘等泛滥畛域的从业者和钻研学者。第 28 届 KDD 会议于 2022 于 8 月 14 日至 18 日在美国华盛顿举办。

论文 01:Mask and Reason: Pre-Training Knowledge Graph Transformers for Complex Logical Queries(反对常识推理的图谱预训练)

| 下载地址:KG-Transformer

| 论文作者:刘潇(清华大学)、赵时予(清华大学)、苏凯(清华大学)、岑宇阔(美团)、裘捷中(清华大学)、东昱晓(清华大学)、张梦迪(美团)、武威(美团)、唐杰(清华大学)

| 论文简介:面向简单逻辑查问的常识图谱预训练。论文钻研了常识图谱中简单逻辑查问问题,探讨了支流的基于常识图谱嵌入的推理器的固有缺点,并提出了基于 KGTransformer 的新型图神经网络推理器,及其对应的预训练与微调办法。KGTransformer 在两个次要的常识图谱推理数据集上获得了最优的后果,尤其是在域外工作上获得了良好的泛化性能,证实了这一思路利用于常识图谱推理的宽泛前景。

论文 02:AutoFAS: Automatic Feature and Architecture Selection for Pre-Ranking System(粗排场景主动特色与构造抉择算法)

| 下载地址 :AutoFAS
| 论文作者:李想(美团)、周晓江(美团)、肖垚(美团)、黄培浩(美团)、陈达遥(美团)、陈胜(美团)、仙云森(美团)

| 论文简介:工业级别的搜寻举荐零碎次要遵循召回、粗排、精排、重排的算法体系。为了满足粗排微小的打分规模和严格的时延要求,双塔模型依然被宽泛应用。为了进步模型的成果,一些计划会额定应用精排的打分常识进行蒸馏。但仍有两大挑战亟待解决:

  1. 如果不把时延真正作为一个变量放到模型中进行联结优化,成果必然大打折扣;
  2. 如果把精排的打分常识蒸馏给一个手工设计的粗排构造,模型的体现也必定不是最优。

本文应用了神经网络框架搜寻 (Neural Architecture Search) 的办法,开创性地提出了 AutoFAS (Automatic Feature and Architecture Selection for Pre-Ranking System) 的算法框架,对立解决了以上两个问题:在给定时延限度和精排打分常识领导的条件下,同时选出最优的粗排特色与构造组合计划,达到了 SOTA 的成果。本计划曾经在美团主搜场景下全量应用,获得了显著的线上晋升。

论文 03:Automatically Discovering User Consumption Intents in Meituan(用户生产用意主动发现)

| 下载地址:Automatically Discovering User Consumption Intents

| 论文作者:李银峰(清华大学)、高宸(清华大学)、杜小毅(美团)、韦华周(美团)、罗恒亮(美团)、金德鹏(清华大学)、李勇(清华大学)

| 论文简介:城市中用户的消费行为往往由特定用意驱动。生产用意作为用户具体消费行为的决策驱动力,对于晋升城市中用户行为建模的可解释性和准确性至关重要,可能广泛应用于举荐零碎和精准化营销等多种业务场景。然而,生产用意难以获取,从用户生产数据和评论中只能开掘到非常无限的用意类型。因而,从生产数据中主动地发现新的未知用意是一项至关重要但极具挑战性的工作,次要面临以下两点关键性挑战:(1)如何对不同类型偏好下的生产用意进行编码;(2)如何仅用大量的已知用意实现对未知用意的发现。为了应答上述挑战,本文提出了基于超图神经网络和半监督学习的用意发现模型 AutoIntent(包含解纠缠的用意编码器和用意发现解码器两局部),实现对美团用户生产用意的主动发现。

具体而言,在解纠缠用意编码器中,本文构建了三组对偶超图来别离捕捉三种不同类型偏好(工夫相干偏好、地点相干偏好和外在偏好)下的高阶关系,并通过超图上的信息流传机制为用户学习解纠缠的用意表征。在用意发现解码器中,本文基于去噪后的用意表征相似性来构建成对样本的用意伪标签,通过半监督学习的形式实现从已知用意到未知用意的常识迁徙,实现用意发现。本文在美团大规模的工业数据集上与多种先进基准算法进行比拟,试验结果表明,提出的 AutoIntent 办法相比于已有最佳计划能够获得 15% 以上的显著性能晋升。总的来说,本文为了解并建模城市中的用户消费行为提供了一种新的钻研思路。

论文 04:Modeling Persuasion Factor of User Decision for Recommendation(压服因素成果建模)

| 下载地址:Modeling the Effect of Persuasion Factor

| 论文作者:刘畅(清华大学)、苑苑(清华大学)、高宸(清华大学)、白琛(美团)、罗灵锐(美团)、杜小毅(美团)、史鑫磊(美团)、罗恒亮(美团)、金德鹏(清华大学)、李勇(清华大学)

| 论文简介:在实在城市生存中,对于餐饮、出行等理论需要,用户会综合依据品牌、价格等多个方面的因素做出决策。现有的举荐系统对这些因素建模往往出现“黑盒”模式,未能答复具体决策因子如何影响用户决策行为的迷信问题,从而导致举荐性能受限。本文基于真实世界的餐饮生产、出行数据,利用用户交互行为数据与对应不同因素的压服文案数据,显式建模各类因素对用户决策的影响,晋升举荐零碎准确率与可解释性。

具体而言,首先构建用户 - 商品交互图,将不同类别的压服文案作为图中的异质边,利用多层图卷积网络生成用户、商品与文案的表征;其次,思考到不同用户对压服文案的敏感水平不同,在交互概率预测过程中个性化地为每个用户的敏感性进行自适应建模,进步预测置信度。进一步地,为解决普遍存在的用户交互记录稠密性的问题,提出基于反事实推断的数据加强形式,正当生成了大量高质量数据,无效辅助了表征学习的过程,实现精准举荐。本文在美团大规模业务数据集上与多种先进基准算法比拟,获得了显著的性能晋升;进一步的分析表明,提出的模型可能无效表白用户对不同因素的偏好,同时精确建模了不同用户之间的行为差别。总的来说,本文为钻研城市中用户决策行为的可解释机理提供了根底。

论文 05:Practical Counterfactual Policy Learning for Top-K Recommendations(用于 Top-K 举荐的反事实策略学习)

| 下载地址:Counterfactual_Top-K/xcf

| 论文作者:刘亚旭(台湾大学 & 美团实习生)、颜瑞楠(台湾大学)、原博文(台湾大学 & 美团实习生)、史润东(美团)、燕鹏(美团)、林智仁(台湾大学)

| 论文简介:对于训练机器学习模型,一项要害工作是通过收集的反馈(例如,评分、点击)来构建训练数据。然而,从实践和理论教训中能够发现,收集的反馈中抉择偏差会导致训练失去的模型有偏,从而导致训练后果是不是最优策略。为了解决这个问题,反事实学习受到了很多关注,现有的反事实学习办法能够分为 Value Learning 办法和 Policy Learning 办法。

本文钻研了具备较大决策空间的 Top-𝐾排序模型的 Policy Learning 办法,提出了一个实用的学习框架,解决了较大决策空间学习中存在的 Importance Weight 爆炸、样本较少导致方差较大、训练效率低等问题。开源数据试验验证了所提出框架的有效性和效率。

论文 06:Applying Deep Learning Based Probabilistic Forecasting to Food Preparation Time for On-Demand Delivery Service(深度学习订单出餐工夫概率预测)

| 下载地址:Applying Deep Learning

| 论文作者:高成良(美团)、张凡(美团)、周越(美团)、冯榕根(美团)、茹强(美团)、边凯归(北京大学)、何仁清(美团)、孙致钊(美团)

| 论文简介:在即时配送零碎中,精确预估订单的商家出餐工夫对用户和骑手体验都十分有价值。该问题次要有两个技术挑战,即样本标签不残缺(局部订单只有出餐工夫的大抵范畴)和数据不确定性大,惯例的点估计回归办法很难解决。

本工作首次利用概率预计刻画订单出餐工夫的不确定性,提出了一种基于深度学习的非参数化办法,并在特色构建和模型设计中充分利用范畴标签的数据样本。在概率预计中,本文提出了 S -QL 损失函数,并证实了其与 S -CRPS 的数学关系,基于此对 S -CRPS 进行分位数离散化以优化模型参数。基于实在的配送数据评估以及线上 A / B 试验均证实了该办法的劣势和有效性,该办法的预估后果已在美团即时配送零碎中的多个外围模块中利用。

论文 07:A Framework for Multi-stage Bonus Allocation in Meal Delivery Platform(多阶段送餐处分框架)

| 下载地址:A Framework for Multi-stage Bonus Allocation

| 论文作者:吴卓林(美团)、黄方胜(美团)、周琳钧(美团)、宋宇(美团)、叶成鹏(美团)、聂鹏宇(美团)、任昊(美团)、郝井华(美团)、何仁清(美团)、孙致钊(美团)

| 论文简介:美团配送旨在为顾客和餐厅提供优质稳固的服务,但每天依然有数十万订单因为无人接单而被勾销,订单的勾销对用户体验和美团的名誉造成了极大的侵害。为了解决这个问题,美团提供了一笔专项资金来进步尾部订单的用户体验。未被接起的订单将继续地曝光给骑手,因而咱们须要继续地决策订单的额定处分金额,直到订单被勾销或被接单。因为订单上一时刻的激励计划会显著影响后续阶段订单的存续与勾销概率,因而这一问题是简单的多阶段时序决策问题。为了更好地晋升用户体验,咱们提出了一个新的框架来解决这一问题。这一框架包含三个局部:

  1. 半参数化的订单实现概率与勾销概率模型;
  2. 基于拉格朗日对偶的动静布局算法;
  3. 在线的实时调配算法。

其中半参数化的订单实现(勾销)概率模型用于预测调配给订单的处分金额与订单在这一时刻接起并最终实现(勾销)的概率的关系、拉格朗日对偶动静布局算法次要通过历史订单数据计算每个调配时序的拉格朗日乘子解,在线调配算法应用离线局部取得的后果为每个订单计算出相应的激励计划。咱们在实在配送场景上进行了 A / B 试验,试验结果表明新算法相较于基线算法的勾销订单量降落了 25%,显著晋升了用户体验。

写在前面

以上这些论文是美团技术团队与各高校、科研机构通力合作的成绩。本文次要介绍了美团在图谱预训练、抉择算法、用意主动发现、成果建模、策略学习、概率预测、处分框架等技术畛域一些科研工作。心愿能对大家有所帮忙或启发,也欢送大家跟咱们进行交换。

浏览美团技术团队更多技术文章合集

前端 | 算法 | 后端 | 数据 | 平安 | 运维 | iOS | Android | 测试

| 在公众号菜单栏对话框回复【2021 年货】、【2020 年货】、【2019 年货】、【2018 年货】、【2017 年货】等关键词,可查看美团技术团队历年技术文章合集。

| 本文系美团技术团队出品,著作权归属美团。欢送出于分享和交换等非商业目标转载或应用本文内容,敬请注明“内容转载自美团技术团队”。本文未经许可,不得进行商业性转载或者应用。任何商用行为,请发送邮件至 tech@meituan.com 申请受权。

正文完
 0