关于美团:图技术在美团外卖下的场景化应用及探索

5次阅读

共计 11950 个字符,预计需要花费 30 分钟才能阅读完成。

在外卖广告 CTR 预估建模中,咱们依靠图技术在场景化上进行了一系列摸索。本文首先介绍了应用图网络技术的出发点,而后从特色层面的形象图关系到子图扩大以及场景感知子图,逐渐介绍如何应用图技术建模业务问题,并针对联结训练的线上服务细节及成果进行解释和剖析,心愿能给从事相干工作的同学带来一些帮忙或启发。

1. 引言

外卖曾经成为公众生存中十分的重要组成部分,大家也逐渐感触到外卖带来的便当。大数据和深度学习时代的到来,使点击率(Click Through Rate, CTR)/ 转化率(Conversion Rate, CVR)预估技术失去了长足的倒退,深度学习技术曾经成为业界的支流办法。美团外卖也通过利用深度模型,在线上获得了显著的收益。预估模型所做的事件,是建模蕴藏在数据中、在特定场景下用户和商品之间的关联性(即“人 - 货 - 场”)。以点击率预估为例,能够对画像特色、上下文特色、行为特色等进行建模,模型可能感知在该场景下用户和商品之间的关联。

美团外卖是一个场景化业务:用户以后决策是受不同场景因素独特影响的后果,这些场景因素包含但不限于 LBS 地理位置、商家营业状况、工夫餐段。比方在热闹商圈 / 小城市(LBS)下的工作日 / 非工作日 / 正餐 / 下午茶(工夫餐段),依据商家营业状况圈选商家。相比于传统电商业务来说,减少了 LBS 和时段的限度,其场景化因素更为丰盛。同时,外卖具备很强的即时需要性质,用户的决策链路会很短,长时间“逛”外卖 App 的状况较少,故单次用户决策具备短时性的特点,这也进一步对外卖场景化减少了更多的建模因素。

因而,如何将用户的外卖需要进行场景化建模,从而晋升用户在应用外卖时的下单体验,成为外卖预估模型须要重点解决的问题。

1.1 问题与挑战

相较于传统电子商务,用户趣味在外卖业务下呈现出更加显著的场景化特点,具备【用户 - 场景 - 趣味 - 决策】链路:即用户在特定场景下,联合本身需要与集体饮食趣味,产生决策。

场景化建模在实质上,是在给定场景条件下,比方地理位置、餐段时间、天气等,基于用户趣味为用户匹配出最佳商品。围绕场景化建模这一指标,业界从不同角度进行了一系列技术摸索:

  • 特色 建模:结构用户 - 商品 - 场景交互的统计特色 / 穿插特色,例如:用户在午餐时段的品类偏好、用户夜宵时段点击商户数量统计等。
  • 序列 建模:分场景行为序列,精细化刻画在不同场景下的用户趣味,例如:用户在不同蜂窝下的 Session 行为,在不同时间段的 Session 行为。

以上建模办法可能建模场景因素在用户决策商品时的影响,但存在一些问题:

  • 特色建模,尤其是特色穿插的过程中,容易引入噪声,会对模型学习产生负面影响。
  • 序列建模,依赖于用户行为的丰盛水平,在分场景行为划分下对低频用户的趣味刻画不敌对,同时高频用户的趣味刻画容易陷入个人兴趣关闭圈。
  • 穿插和序列范式对场景的刻画并不残缺,穿插范式存在维度下限,序列范式局限于用户已有行为偏好。

因而,场景化建模存在以下挑战:

  • 如何抽取无效场景特色穿插。
  • 如何突破序列建模下的趣味封闭性。
  • 如何残缺地对用户决策场景进行无效刻画。

针对上述问题特点,通过逐层合成,咱们发现须要一种更加残缺、高效的信息表达方式,可能具备:关系预测能力、全局信息流传能力、高阶表达能力,而咱们在图技术的畛域中找到相应的解决方案,后文会针对这些问题和图技术的解法顺次进行开展,心愿这些思考和实践经验能对大家有所帮忙或者启发。

1.2 图技术介绍

近些年来,随着图神经网络(Graph Neural Networks)的疾速倒退[1],越来越多的人开始关注起图数据。工业界也呈现了图技术的相继落地,很多利用场景都能够形象为节点向量化示意、分类、聚类、链接预测等图工作模式。

  • 对于召回场景来说,基于多种实体间人造存在的关联交互图,构建深度匹配模型学习到的 Embedding 表白能够间接用来度量用户 - 商品的偏好、商品 - 商品关联。
  • 对于预估模型来说,最奢侈的视角,即是在用户 - 商品这个二部图上进行链接预测。

在美团外部业务中,Graph Embedding/GNN 技术在多个技术团队落地;如美团平台 [2],[4],[10] 相干工作以及外卖技术 Represent-Learning 我的项目等,都获得了不错的正向收益。

相比传统欧式空间结构类型数据,图构造数据具备以下特点:

  • 结构化:图网络具备拓扑结构性,这种结构化个性往往代表了一些法则。例如节点重要性,社区构造等。
  • 关联化:图网络提供了一种简单关系和交互的度量办法。例如关联关系、依赖关系能够通过图表征学习进行度量。
  • 全局化:图网络构建采纳全域数据,相比私域化的序列数据,图构造数据更加可能体现出群体偏好信息。
  • 强泛化:利用图网络的音讯流传机制,图上节点丰盛信息更容易流传到冷门节点上,进步冷门节点表达能力。

从业界信息示意的发展趋势来看,信息示意是在升维的:从手工特色,到序列建模,再到图建模,背地是对更加残缺信息的无效刻画的诉求。

  • 手动特色时代:基于行为日志统计开掘用户 / 商家 / 商品画像。毛病是刻画粒度较粗、不精准、表达能力无限。
  • Neural Network(NN)序列模型时代:基于原始行为序列设计用户趣味提取模块端到端学习用户趣味。长处是肯定水平从多峰和动静演变方面晋升了用户趣味表白的准确性。毛病是较难学习到结构化信息,对于行为数据强依赖,头部用户行为密集,中长尾用户行为稠密。
  • Graph Neural Network(GNN)时代:万物皆图。序列能够看做是一个子图,相比于序列,图构造数据对于信息的表白,更加结构化、残缺、丰盛。

在日常业务优化中咱们也发现,如果说要找到一种形式化的建模语言可能精确、残缺的翻译出咱们的业务场景,那么出现进去的建模语言就是“图”。

因而,咱们期待通过图技术手段,实现外卖场景下的场景建模。以下咱们将从图算法摸索和具体工程实际落地两大方面,论述咱们在图技术场景建模上的尝试及教训。

2. 图技术的场景化摸索

外卖场景化是指基于用户 - 商家 / 商品残缺交互信息(< User、POI、Time、Location >)中开掘到的共性 Pattern。咱们通过构建用户 - 商家 / 商品交互场景图来刻画和提取这个 Pattern,并将场景先验常识引入到预估模型当中辅助决策。业界曾经有前沿摸索将 GNN 利用于 LBS 场景建模,如美团平台的 STGCN[2]从时空联合的角度形容了 LBS 场景下 GNN 利用,外卖数据组的“门控超图 GNN”[3]形容了超图在外卖 LBS 场景化建模的利用;比照一般 GNN 办法都获得了 SOTA 的成果。

针对美团外卖的场景化建模特点,咱们在图算法上也进行了一系列摸索,别离在场景特色穿插、子图拓展感知、元门路场景图三个方面,围绕着在不同场景下的用户 -POI 建模的指标,进行了多方面的摸索,在离线评估、线上业务上均获得了不错的成果。

2.1 基于特色图的场景特色穿插建模

2.1.1 场景特色穿插

特色是机器学习模型的源能源,业界常言“特色的下限决定了模型的下限”。NN 时代以前,模型成果的晋升有很大一部分来自于特色工程。随着模型进入 NN 时代,NN 模型具备的拟合能力以及在数据红利的加持下,极大地缩小了算法工程师们在特色工程上的精力开销,工作重点开始聚焦于模型构造。尽管实践上 NN 能够拟合所有函数,但在无限的数据和训练周期内,无奈疾速地迫近成果下限。在这种背景下,显式特色穿插重新得到大家的关注,围绕主动穿插特色,业界陆续迭代出 FM/xDeepFM/DCN/CAN 等模型,并获得了十分好的成果。

在美团外卖场景,也经验了第一阶段的手动穿插特色,以及第二阶段的主动穿插特色。但在场景化建模中咱们发现:穿插特色带来了信息增益,但往往也会带来“噪声”问题;比方具体到样本粒度来说,不同类型的样本所须要的无效穿插特色并不是完全一致,存在差异性。近两年业界的一些工作,如 Fi-GNN、L0-SIGN、阿里 FIVES 等,也都在对应的业务中发现全量信息穿插引入噪声问题。

因而,从迭代思路来看,心愿可能引入更多的穿插特色,同时也缩小噪声信息的引入,实现在样本粒度的“个性化”穿插特色。

2.1.2 图视角的特色穿插

特色穿插,能够形象为“从全量特色集中,抉择出 K 组特色两两组合,实现给模型带来高效非线性表达能力的目标”。实质上能够看做是特色 - 特色之间二部图的关系预测:将特色看作节点,特色之间的关联关系看作边,则能够将所有特色之间的关联关系形成一张图网络。两个节点连边的权重,可看作对应特色之间穿插关系的强弱。通过将此关系图嵌入到模型训练过程中,关系图中不同边权即反映了不同特色穿插的重要水平。

每个样本中 N 个特色相互之间形成一个全连通图记为 M,图中的每个顶点示意特色 F,顶点之间的边示意任意两个特色 Fi 和 Fj 的关联度,记为 M <i, j>。通过联结训练关系图和预估模型,更新参数矩阵 M,使关系图的语义信息与预估模型放弃相关性和一致性,次要过程如下图 3 所示:

次要步骤可形容如下:

  • Step1. 建设参数矩阵(随机初始化失去),对特色所对应的向量示意做点积,后果作为关联系数。
  • Step2. 对矩阵施加 L0 惩办,用于限度矩阵 M 的参数尽量靠近 0,缩小无用的场景穿插。
  • Step3. 参数矩阵 0,1 化,用于确定须要参加聚合的节点。
  • Step4. 图聚合,对于每个特色来说,与其存在交互的多个特色进行聚合操作,聚合形式应用 Attention。
  • Step5. 将聚合后的特征向量示意,做为该特色新的向量示意,用在上游 CTR 预估的联结训练中。

通过特色穿插系数形象为图的边权重要性评估问题,使模型具备了对场景特色之间关联强弱的预测能力,从而可能更加高效地引入穿插特色,为用户的场景化建模提供更多的信息输出。

2.2 基于子图扩大的行为图建模

2.2.1 场景序列建模的痛点和图解决思路

在外卖算法模型迭代中,序列建模也经验了较长时间的迭代,从单场景短期 Session 建模到多场景用户长期行为趣味建模,在多个方向上都做出了详尽的摸索。序列建模可能在用户历史行为中,充沛挖掘用户的趣味偏好,然而因为用户行为序列自身是“有偏采样”的反馈:不同用户所处的地理位置、商家供应状况、应用频次等方面存在着较大差别;且高低频用户的点击行为散布差别显著,呈现出高频用户行为丰盛汇集、低频用户行为稠密的特点。

对于高频用户,可能会导致趣味圈关闭导致模型建模无奈跳脱既有的趣味圈;对于低频用户,因为信息的不足导致其趣味刻画不残缺。因而,咱们须要具备拓展用户趣味边界的信息扩大能力、对单点信息的裁减能力;即寻找一种新的数据结构,突破二维线性限度,实现三维平面扩大,基于此种想法,咱们从图的角度来从新思考用户行为建模:以私域线性行为序列作为趣味刻画根底,以公域全局互联关系图作为趣味补充,建设个体差异性与群体共性的连贯。

2.2.2 行为 POI 子图设计

用户行为信息是指用户在平台的点击 / 下单流动记录,是最原始最间接的对于用户趣味的刻画,尤其是针对行为稠密用户来说,行为 POI 序列中任意节点都值得器重。但对于这部分用户,仅仅依附个人行为 POI 很难建模趣味,如果可能通过图的形式扩大用户行为,可能有机会跳脱集体私域行为限度,透过全局行为图捕获不同场景下的潜在趣味。

咱们基于用户 Session 行为构建了 POI 网络:在同一个 Session 里,用户所点击过的 POI 存在关联,那么能够将每个 Session 里的 POI 构建一个连通图;因为不同用户行为的 POI 是有重叠的,整个外卖场景下的不同 POI 簇之间通过这些重叠的 POI 链接,就能够造成一张 POI 网络。对于任意一个 POI,咱们都能够从 POI 行为网络中,寻找到该 POI 的一跳、二跳街坊,这些街坊能够作为 POI 信息的相干补充。这样,对于用户的行为趣味刻画,不仅仅局限在用户已有的序列上,而是能够通过子图进一步扩大。

相比传统序列建模办法,图网络建模能够利用全局用户行为互联的高阶网络结构,借助 POI 序列扩大用户趣味:

  • 对于行为稠密用户,通过全局行为互联图,补充用户趣味建模线索。
  • 缓解基于密集用户行为建模产生的马太效应,跳出历史行为摸索潜在趣味,晋升举荐后果泛化性。

具体的,针对用户行为序列中的每一个 POI,都能够通过子图进行扩大,扩大后的子图通过卷积的形式造成 POI 的向量示意,如下图(左)所示。通过行为序列的扩大,使用户行为失去补充,从而得以跳出用户个人兴趣局限,丰盛用户和 POI 的信息表白。

在 POI 子图的根底上,咱们进一步思考如何无效地聚合不同 POI,达到子图信息更加残缺的表白。

  • 建模不同 POI 之间强弱不同的关联关系,应用 Attention 构造动态分配确定 POI 在所属子图中的贡献度。
  • 思考到 POI 子图是由 Session 构建的,用户的行为序列存在差别,相应地 POI 信息表白在不同用户序列中也存在差别,POI 子图信息应该在不同行为上下文序列中自适应表白。
  • 为了捕获这种差异性,在子图卷积的过程中,咱们将核心节点与以后行为序列中其余节点做聚合,从而建模行为上下文场景关联性。

核心节点不仅受到序列和子图影响,也受到以后候选 POI 的影响。因而在联结上游训练的过程中,咱们将核心节点与样本 Target POI 进行聚合。

离线训练时,是基于用户行为序列,对序列中每个 POI 作趣味子图拓展;而子图生成时采纳预采样(Message Passing)+ 联结训练聚合的形式;通过以上三种聚合形式,失去属于行为序列中 POI 对应的向量示意。因为这个过程不仅是扩大了 POI,还将序列信息、候选 POI 信息思考到了每个节点的示意中,咱们称这种为子图感知卷积。通过子图感知卷积,使卷积的过程中,POI 的向量示意与上下文信息产生关联,从而使 POI 的嵌入示意交融了更准确的趣味信息。

2.3 基于元门路的场景图建模

2.3.1 从业务特点登程 - 元门路建模的初衷

咱们对用户决策过程进行形象,将用户 User 与商户 POI 在给定 Context 环境下的一次交互定义为一个事件(Event),多个用户和 POI 交互的后果定义为事件链(EventChain)。对于多个强相干的事件链(不同事件链通过公共节点连贯),就形成了一个场景,而场景之间的 User、POI 主体又存在连贯,这样延开展,实际上就形成了一个“场景”拓扑网络图,如下图所示:

能够看到,实际上事件链组成的“场景”是一种异构图:比方具备某些属性(生产频率、餐饮偏好等)的用户 U,在某个上下文 C 下(工夫、地点等),点击 / 购买了具备某些属性(品类、主营菜品等)的商户 P,这个决策过程实际上是个最简略的 U -C- P 元门路。事件链是在这个元门路的根底上持续扩大,失去的更长的元门路实例(U-C1-P2-C2-U’)。通过事件链,能够建设起场景因素的关系链接,而对场景的残缺刻画,就是对场景因素示意和因素关系的抽取。

至此,咱们将场景化建模,形象为异构图上元门路建模问题。接下来,咱们将介绍如何在这个场景图上,实现对用户决策场景的建模。

2.3.2 到业务中去 - 元门路建模的实现

元门路 UCPCU 表白的语义为:不同用户在不同时空场景下,点了同一家商户,当然不同场景需要能够定义不同的元门路。为了进一步交融元门路中丰盛的语义表白,仅仅依赖繁多的元门路的话,所表白的语义会受到限制。咱们从用户 U 登程,通过该元门路能够扩大出一系列的元门路实例,这些实例刻画了不同场景下,用户和 POI 的跨时空关联。整个建模过程分为以下几步:

  • Step1. 用户和商户节点存在较多属性,相比节点拓扑构造蕴含更多语义信息。咱们将属性信息看作节点,通过 GraphSAGE 的形式聚合到用户和商户示意中。
  • Step2. 从用户 U 登程,基于元门路,扩大出多条元门路的实例(事件链)。下图展现多条实例,包含:U-C1-P1, U-C2-P2-C3-U’,U-C2-P3-C4-U”-C5-P4;通过扩大可能建设起用户 U 和商户 P4 的关联。
  • Step3. 元门路实例查问向量示意后进行拼接,并与样本中的用户(Target User)进行交互。多条候选元门路的设计,能够冲破繁多元门路依赖信息裁剪造成的信息缺失。交互的形式采取 Attention,即计算以后用户与所有候选元门路的关联,并最终作用于上游预估中。

对于线上申请,检索同场景下 Emie。

通过图网络技术,咱们扩大了不同场景下的用户潜在趣味,借助注意力机制捕获以后决策,与不同元门路对应场景的关联性,从而实现场景化建模。

3. 工程实际落地

3.1 场景图 CTR 模型主构造

在模型结构设计的过程中,咱们依照”低耦合、高内聚、可插拔、无依赖“的准则,将“行为子图拓展模块”、“元门路场景子图模块”、“特色图穿插模块”三个子方向迭代作为独立模块接入到模型中。

3.2 基于子图扩大的行为图联结训练

在“基于子图扩大的行为图建模”中,对于每个申请在线模块都须要进行“行为序列长度 * 街坊数”次向量查问和计算,当行为序列较长时对在线 CTR 预估服务来说会存在较大的 RT 挑战。

思考 POI 之间的 ” 全局行为互联图 ” 和用户的长期趣味较为稳固,因而针对长期行为子图拓展采纳基于行为 POI 和采样子图进行聚合不依赖候选 Target POI,短期行为子图拓展计划依然采纳 2.2.2 中计划依据序列和候选 Target POI 动静计算,长短期 POI 应用不同的 Embedding 空间。基于此上线计划采取长期行为子图离线计算 + 在线查问的思维,离线计算用户长期行为序列子图 Embedding 并灌库,在线查问 Redis 获取子图 Embedding 参加后续计算。

基于子图拓展的长期行为模块如下图所示:

咱们将整个过程分为三步,保障线上耗时不减少的外围在于 Step2 的子图拆分重构。因为线上 Serving 过程中行为子图 Embedding 示意不会发生变化,因而应用子图查问或聚合后查表,其后果是统一的。

  • Step1. 端到端训练

在原有 CTR 模型的根底上,针对 POI 行为序列进行子图查问扩大:每个 POI 申请从图引擎中进行邻域卷积采样操作,即从二阶街坊聚合到一阶街坊,再聚合到 POI 自身。

  • Step2. 拆分子图查问模块,聚合 Embedding,灌库

训练实现后,将原有子图查问模块拆分,再对长期行为中全量 POI 做一次子图 POI-Embedding 聚合操作,失去行为 POI 的子图 Embedding。灌库阶段,将长期行为子图 POI 的 Embedding 和其余特色的 Embedding 写入 Redis 存储中。

  • Step3. 对联结训练的模型进行重构导出生成新的线上 Serving 模型

将长期行为“子图扩大的行为图模块”中子图聚合计算重构为间接查问 Embedding 表征,线上从 Step2 灌库的后果中查取 Embedding。

这样防止线上大量卷积操作的耗时,线上试验验证,高峰期 TP99 与 TP999 新增模块耗时根本持平。

3.3 场景子图模块

基于元门路的场景图建模是采纳元门路 Metapath 的形式来示意 CTR 工作样本中的用户子图和商家子图,采样子图来自预选构建好的 User、POI、Context(Context 节点蕴含了蜂窝、餐段信息)异构行为场景图。

3.3.1 离线异构图构建

因为 Context 会同时连贯 User 与 POI,在异构图上 Context 节点会成为超级节点(可能连贯一个蜂窝内简直全副的 User 和 POI),POI 类型节点也可能成为超级节点(连贯区域内所有 Context 节点);当呈现了广泛的超级节点后,会导致图上游走采样艰难、噪声加剧。咱们在设计构建 Context 节点以及异构边时避免了这一问题:

  • Step1. Context 节点作为时空上下文,贯通用户和门店;细化 Context 节点(比方蕴含蜂窝、餐段、品类),那么 User 与 Context 的连贯边、Context 与 POI 的连贯边都会大大减少。
  • Step2. 不同 User 可能通过 Context 节点跳转到不同 POI 上,为了避免采样时从 User 节点登程的 Path 跳转到不相干的 POI 上,Context 节点最好可能体现用户趣味(品类信息其实就是一种)。
  • Step3. 对于边权有所限度,可能防止 Context 类型节点成为超级节点,POI 的问题也会解决。

3.3.2 元门路采样建模

用户趣味、行为绝对是扩散的,从 User 节点登程,沿着边可能跳转到不同 Context 下来,失去绝对宽泛的实例,而 Metapath 采样失去的实例能够视作是 User 决策场景表征汇合,具体过程如下:

  • Step1. 以用户子图中 U -C-P-C- U 这样的门路为例,采样出 N 份实例,按用户节点扩散的第一个 Context 分类存储,如失去 M 组实例,公式如下。其中 Ci 是每个分组的实例数,Uuid: <Context1: [Metapath1, Metapath2]; Context2: [Metapath3, Metapath4]; ··· ; ContextM: [Metapath5, Metapath6]>。
  • Step2. 对于一个用户申请,按 Uuid 与以后申请 Context 查问 User 子图,失去可能匹配以后场景决策信息的用户决策场景子图表白。
  • Step3. 借助注意力机制捕获以后决策,计算不同 Metapath instance 与对应场景的关联性,从而实现场景化建模。

3.4 成果收益

子图拓展联结训练离线 AUC+ 2 千分点;特色穿插子图模块离线 AUC+ 1 千分点;场景子图交互离线 AUC+2.5 千分点。

3.4.1 高低频场景感知

通过图建模设计,咱们的模型可能对高低频场景感知,从而晋升场景下对应用户的成果。

具体地,在外卖展现广告 CTR 预估业务中,剖析场景化图算法在不同频次的用户体现状况:统计高频(过来一个月在美团外卖点击 POI 次数 >150 次)和低频(过来一个月在外卖点击 POI 次数 <15 次)用户,比拟实验组相比对照组(与未采纳场景图的 Base 模型 AB 试验)的线上指标(点击率, CTR/ 商品交易额(Gross Merchandise Volume, GMV)。同时,咱们还依照高低频用户别离统计了三级品类的人均曝光数量,比照基线的人均曝光数量。

CTR GMV 人均曝光品类数量
低频用户 +1.58% +1.08% +0.02 品类
高频用户 +2.68% +1.94% +0.3 品类

从上表后果能够看出:

  • 低频和高频用户的 CTR 和 GMV 均有晋升,证实感知子图卷积可能无效捕获高低频场景,实现场景化下用户趣味刻画。
  • 低频和高频用户人均曝光品类数量均有晋升,并且高频用户的人均品类减少更多,阐明具备更好的趣味开掘摸索能力,可能帮忙高频场景用户跳脱已有的趣味圈。

3.4.2 特定时空场景感知

为验证场景图模型对于不同场景的辨认和刻画能力,进一步比照引入场景图联结建模比照无场景图在工夫品类和空间需要下的感知变动(以下多组统计后果均为多天 / 同时段累计后果)。

3.4.2.1 工夫品类场景

奶茶品类是下午时段的热销品类,从曝光转化比来看在下午茶时段较高且时段效应显著,咱们统计了某业务奶茶品类上多天同时段,曝光数量占该时间段总曝光数量的比例,并比拟实验组相比基线的涨幅状况,从时段上看,实验组在下午茶时间段(14-16 时)奶茶曝光比例回升,而晚间正餐期间曝光比例缩小,阐明场景图模型的品类时段感知能力失去增强并且在流量抉择上趋势优质流量,模型上线后在奶茶品类上的整体后验 CTR 指标体现正向。

3.4.2.2 空间需要场景

外卖上的用户需要和行为具备显著的周期效应:即工作日和非工作日,用户的行为具备较大差别。例如,在非工作日,用户少数是在家(小区)而不是写字楼,会有更大的偏向在美团外卖上选购菜品、添置生活用品等(转化曝光比更高)。

咱们以某业务超市便当的品类曝光为例,咱们统计了从周一到周日间断 7 天,超市便当曝光占当天的总曝光量占比,依照实验组和对照组比照曝光占比状况。从图中能够看出,实验组曝光在周一、周二缩小,周末回升,阐明模型捕捉到了工作日和非工作日下,超市便当的购物场景区别,模型上线后在超时便当品类的整体后验 CTR 指标也体现正向。

4. 总结和瞻望

与传统电商举荐不同,外卖举荐呈现出场景化的特点:供应受 LBS 强束缚、用户决策链路短、易受所处环境影响,因而场景化建模是外卖举荐亟需解决的问题。图网络技术曾经在学术界和工业界进行了较为深刻的摸索,在美团外卖场景化建模中遇到的挑战,咱们也通过图技术进行了相应的优化求解,别离通过场景特色图穿插、场景序列子图扩大、元门路场景图,在穿插特色去噪、冲破用户趣味关闭圈、残缺场景图刻画方面进行了摸索。

在算法落地上,思考到线上的耗时问题,咱们在 Serving 阶段拆分重构长期行为子图,在不扭转模型后果的状况下缩小了计算复杂度,满足了线上的性能要求。图技术的场景化落地尽管获得了肯定的收益,但依然存在一些问题须要解决,例如特色图穿插在算力束缚下,只能满足局部特色穿插;对于场景的元门路刻画依然依赖于先验人工定义,尚未走上“主动驾驶”之路,将来咱们会继续进行摸索。

5. 作者简介

任建、张伟、雨枫、黄坤、慧楠、鹏业、张波,均来自美团外卖广告技术团队。

6. 参考资料

  • [1] Li F, Chen Z, Wang P, et al. Graph intention network for click-through rate prediction in sponsored search[C]//Proceedings of the 42nd international ACM SIGIR conference on research and development in information retrieval. 2019: 961-964.
  • [2] Han H, Zhang M, Hou M, et al. STGCN: a spatial-temporal aware graph learning method for POI recommendation[C]//2020 IEEE International Conference on Data Mining(ICDM). IEEE, 2020: 1052-1057.
  • [3] Yang T, Zhang L, Shi C, et al. Gated Hypergraph Neural Network for Scene-Aware Recommendation[C]//International Conference on Database Systems for Advanced Applications. Springer, Cham, 2022: 199-215.
  • [4] Wu L, Li Z, Zhao H, et al. Learning the implicit semantic representation on graph-structured data[C]//International Conference on Database Systems for Advanced Applications. Springer, Cham, 2021: 3-19.
  • [5] Xie Y, Wang Z, Li Y, et al. Fives: Feature interaction via edge search for large-scale tabular data[C]//Proceedings of the 27th ACM SIGKDD Conference on Knowledge Discovery & Data Mining. 2021: 3795-3805.
  • [6] Chang J, Gao C, Zheng Y, et al. Sequential recommendation with graph neural networks[C]//Proceedings of the 44th International ACM SIGIR Conference on Research and Development in Information Retrieval. 2021: 378-387.
  • [7] Shao Z, Xu Y, Wei W, et al. Heterogeneous Graph Neural Network with Multi-view Representation Learning[J]. arXiv preprint arXiv:2108.13650, 2021.
  • [8] Li Z, Cui Z, Wu S, et al. Fi-gnn: Modeling feature interactions via graph neural networks for ctr prediction[C]//Proceedings of the 28th ACM International Conference on Information and Knowledge Management. 2019: 539-548.
  • [9] Fu X, Zhang J, Meng Z, et al. Magnn: Metapath aggregated graph neural network for heterogeneous graph embedding[C]//Proceedings of The Web Conference 2020. 2020: 2331-2341.
  • [10] Wang Y, Xu H, Yu Y, et al. Ensemble Multi-Relational Graph Neural Networks[J]. arXiv preprint arXiv:2205.12076, 2022.

浏览美团技术团队更多技术文章合集

前端 | 算法 | 后端 | 数据 | 平安 | 运维 | iOS | Android | 测试

| 在公众号菜单栏对话框回复【2021 年货】、【2020 年货】、【2019 年货】、【2018 年货】、【2017 年货】等关键词,可查看美团技术团队历年技术文章合集。

| 本文系美团技术团队出品,著作权归属美团。欢送出于分享和交换等非商业目标转载或应用本文内容,敬请注明“内容转载自美团技术团队”。本文未经许可,不得进行商业性转载或者应用。任何商用行为,请发送邮件至 tech@meituan.com 申请受权。

正文完
 0