关于美团:异构广告混排在美团到店业务的探索与实践

在 LBS（Location Based Services, 基于地位的服务）间隔束缚下，候选较少制约了整个到店广告排序零碎的后劲空间。本文介绍了咱们从候选类型角度进行候选扩大，通过高性能的异构混排网络来应答性能的挑战，从而晋升了本地生存场景排序零碎的潜能下限。心愿能给从事相干方向的同学以启发。

美团到店广告负责美团搜寻流量的商业变现，服务于到店餐饮、休娱亲子、丽人医美、酒店游览等泛滥本地生存服务商家。品质预估团队负责广告零碎中 CTR/CVR 以及客单价 / 交易额等品质分预估，在过来几年中，咱们通过位次上下文建模 ^[1]、时空超长序列建模^[2] 等翻新技术，在 CTR 预估问题中的用户、上下文等方向都获得了一些冲破^[3]，并整顿成论文发表在 SIGIR、ICDE、CIKM 等国内会议上。

不过以上论文重在模型精度，而模型精度与广告候选独特决定着排序零碎的品质。但在广告候选角度，相比于传统电商的候选汇合，美团搜寻广告因 LBS（Location Based Services, 基于地位的服务）的限度，所以在某些类目上门店候选较少，而候选较少又重大制约了整个排序零碎的后劲空间。当用传统形式来减少候选数量的办法无奈获得收益时，咱们思考将广告候选进行扩大与优化，以期晋升本地生存场景排序零碎的潜能下限。

繁多的门店广告不足以满足用户找商品、找服务的细粒度用意诉求。局部场景将商品广告作为门店广告的候选补充，两者以竞争形式来确定展现广告款式；此外，还有局部场景商品广告以下挂模式同门店广告进行组合展现。多种形式的异构广告展现款式，给到店广告技术团队带来了时机与挑战，咱们依据业务场景特点，针对性地对异构广告进行了混排优化。下文以美团结婚频道页和美团首页搜寻为例，别离介绍两类典型异构混排广告：竞争关系异构广告和组合关系异构广告。

竞争关系异构广告：门店和商品两种类型广告竞争混排，通过比拟混排模型中 pCTR 确定广告展现类型。如下图 1 所示，左列首位为门店类型广告胜出，展现内容为门店图片、门店题目和门店星级评论数；右列首位为商品类型广告胜出，展现内容为商品图片、商品题目和对应门店。广告零碎决定广告的排列程序和展现类型，当商品类型广告获胜时，零碎确定展现的具体商品。

组合关系异构广告：门店广告和其商品广告组合为一个展现单元（蓝色框体）进行列表排序，商品从属于门店，两种类型异构广告组合混排展现。如下图 2 所示，门店广告展现门店的头图、题目价格等信息；两个商品广告展现商品价格、题目和销量等信息。广告零碎确定展现单元的排列程序，并在门店的商品汇合中确定展现的 Top2 商品。

目前，搜寻广告模型线上为基于 DNN（深度神经网络）^[4-6]的门店粒度排序模型，门店候选数量受限（约 150）且缺失商品等更间接且重要的决策信息。因而，咱们将商品广告作为门店的候选补充，通过门店与门店下多商品的混排关上候选空间，候选量能够达到 1500+。此外，思考广告上下文影响，同时进一步扩大打分候选以晋升排序下限，咱们将门店粒度降级为异构广告组合粒度的排序，基于此构建生成式广告组合预估零碎，候选极限达到了 1500X（思考线上性能咱们最终抉择 1500X)。而在摸索过程中，咱们遇到了以下三大挑战：

商品粒度预估性能压力：下沉到商品粒度后减少至多 10 倍的候选量，造成线上预估服务无奈接受的耗时减少。
组合间关系建模艰难：门店同组合商品的上下文关系应用 Pointwise-Loss 建模难以刻画。
商品广告冷启动问题：仅应用通过模型抉择后曝光的候选，容易造成马太效应。

针对上述挑战，技术团队通过思考与实际，别离进行如下针对性的优化：

高性能异构混排零碎：通过 bias 网络对门店信息迁徙学习，从而实现高性能商品粒度预估。
生成式广告组合预估零碎：将商品预估流程降级为列表组合预估，并提出上下文联结模型，建模商品上下文信息。
异构广告冷启动优化：基于汤姆森采样算法进行 E &E（Exploit&Explore, 摸索与利用）优化，深度摸索用户的趣味。

目前，高性能异构混排和生成式广告组合预估曾经在多个广告场景落地，视场景业务不同，在掂量广告营收的千次广告展现收益 (RPM，Revenue Per Mille) 指标上晋升了 4%~15%。异构广告冷启动优化在各业务失效，在精度不降落的前提下给予流量 10% 随机性。下文将会对咱们的具体做法进行具体的介绍。

打分粒度从门店下沉为商品后，排序候选量从 150 减少到 1500+，带来排序后劲晋升的同时，如果应用门店模型间接进行商品预估，则会给线上带来无奈承当的耗时减少。通过剖析，咱们发现门店下所有商品共享门店根底特色，占用了 80% 以上的网络计算，但对于多个商品只须要计算一次，而商品独有的、须要独立计算的商品特色只占用 20% 的网络计算。所以基于这个个性，咱们参照组合预估 ^[7] 的做法，来实现异构混排网络。主网络的高复杂性门店表征通过共有表白的迁徙学习，实现对门店网络输入层的复用，从而防止在进行商品预估时对门店网络的反复计算。

如下图 4 所示，整个网络分为门店网络和商品网络。在离线训练阶段，门店网络（主网络）以门店特色作为输出，失去门店的输入层，计算门店 Loss，更新门店网络；商品网络（bias 网络）以商品特色为输出，失去商品输出层，与门店网络的输入层门店向量作 CONCAT 操作，而后计算最终的商品 Loss，并同时更新门店网络和商品网络。

为了实现线上预估时对门店网络输入层的复用，咱们将商品以 List 的形式喂入模型，实现申请一次打分服务，取得 1(门店)+n（商品）个预估值。另外，对于门店的商品数不固定这一问题，咱们通过维度动静转换的形式保障维度对齐。实现放弃网络规模状况下扩充了 10 倍打重量，同时申请耗时仅减少了 1%。

通过异构混排网络，咱们在性能束缚下失去了门店和各个商品的预估值，然而因为广告进口依然以门店作为单元进行计费排序，所以咱们须要依据不同业务场景特点进行预估值利用。为了形容不便，下文中用“P 门店”代表门店的预估值，“P 商品_i”代表第 i 个商品的预估值。

筛选频道页的竞争关系异构广告

筛选频道页内有门店和商品两种展现类型进行竞争，获胜的广告类型将最终失去展现。训练阶段，每一次曝光为一条样本，一条样本为商品和门店其中一种类型。门店样本只更新门店网络，商品样本同时更新门店网络和商品网络。
预估阶段，门店和商品产生点击概率互斥，咱们应用 Max 算子：通过 Max(P 门店 ,P 商品_1 ,…,P 商品_n)，如果门店获胜，则展现门店信息，门店的预估值用于上游计费排序；如果任一商品获胜，则展现该商品信息，该商品的预估值用于上游。

首页搜寻的组合关系异构广告

首页搜寻的排序列表页中每个展现单元由门店和两个商品组成，机制模块对这一个展现单元进行计费排序。训练阶段，每一次曝光为多条样本：一条门店样本和多条商品样本。门店样本只更新门店网络，商品样本同时更新门店网络和商品网络。
预估阶段，因为用户点击【更多优惠】前，默认展现 Top2 商品，所以能够抉择商品预估值最高的 Top2 作为展现商品，其余商品按预估值排序。咱们须要预估 pCTR(门店 | 商品 1 | 商品 2)。从数学角度剖析，咱们在预估门店或商品 1 或商品 2 被点击的概率，因而咱们应用概率加法法令算子：pCTR(门店 | 商品 1 | 商品 2) = 1 – (1- P 门店) (1- P 商品_1) (1- P 商品_2）。所以在失去门店和商品预估值之后，首先要对商品按预估值进行排序，失去商品商品的展现程序，并抉择 Top2 的商品预估值和门店预估值进行概率加法法令计算，失去展现单元的预估值用于门店排序计费。

尽管零碎整体架构类似，然而因应用场景不同，样本生成形式也不同，模型最终输入的 P 商品有着不同的物理含意。在竞争关系广告中，P 商品作为和门店并列的另一种展现类型；组合关系广告中，P 商品则为门店广告展现信息的补充，因而也有着不同预估值的利用形式。最终高性能异构混排零碎在多个广告场景落地，视场景业务不同，RPM 晋升范畴在 2%~15% 之间。

在商品列表中，商品的点击率除了受到其自身品质的影响外，还会受到其高低展现商品的影响。例如，当商品的上下文品质更高时，用户更偏向于点击商品的上下文，而当商品上下文品质较低时，用户则偏向于点击该商品，这种决策差别会累积到训练数据中，从而造成上下文偏置。而打消训练数据中存在的上下文偏置，有利于更好地定位用户用意以及保护广告零碎的生态，因而咱们参照列表排序的思路^[8-9]，构建生成式商品排序零碎，建模商品上下文信息。

获取上下文信号能够通过预估商品列表的全排列，然而全排列的打重量极大（商品候选数 10 的全排列打分数为 10!=21,772,800）。为了在耗时容许的状况下获取上下文信号，咱们采纳二次预估的形式对全排列后果进行剪枝。首次预估时采纳 Base 模型打分，仅取 Top N 商品进行排列，二次预估时再利用上下文模型对排列的所有后果进行打分。将全排列的打重量从 10! 缩小到 N!（在线上，咱们抉择的 N 为 3）。

然而二次预估会给服务带来无奈接受的 RPC 耗时，为了在性能的束缚下上线，咱们在 TensorFlow 外部实现了二次预估模块。如下图 5 所示，咱们最终实现了基于剪枝的高性能组合预估零碎，整体耗时和基线持平。

通过剪枝和 TF 算子，任一商品输出能够感知其上下文信号。为了建模上下文信息，咱们提出基于 Transformer 的上下文自适应感知模型。模型构造如图 6 所示：

咱们首先将门店特色及商品特色别离过 Embedding 层失去门店 Emb 及商品 Emb，再通过全链接层失去无位次商品向量和无位次的预估值；
将无位次商品向量与商品位次信号进行拼接，通过 Transformer 建模商品的上下文信息，失去蕴含上下文信息的商品 Emb；
将蕴含上下文信息的商品 Emb 与位次信号再次拼接，通过 DNN 非线性穿插，失去蕴含上下文信息及位次信息的最终输入商品预估值。通过强化商品间的穿插，达到建模商品上下文的目标，最终生成式广告组合预估在首页搜寻获得了 RPM+2% 的成果晋升。

为了防止马太效应，咱们也会被动试探用户新的趣味点，被动举荐新的商品来挖掘有后劲的优质商品。咱们在模型上线前，通过随机展现的形式来开掘用户感兴趣的商品。然而给用户展现的机会是无限的，展现用户历史喜爱的商品，以及摸索用户新趣味都会占用贵重的展现机会，此外，齐全的随机展现从 CTR/PRS 等成果上看会有较为显著的降落，所以咱们思考通过更正当的形式来解决“摸索与利用”问题。

绝对于传统随机展现的 E &E 算法，咱们采纳基于汤普森采样的 Exploration 算法 ^[10]，这样能够正当地控制精度损失，防止因局部流量进行 Exploration 分桶的 bias 问题。汤普森采样是一种经典启发式 E &E 算法，外围思路能够详情为，给历史曝光数（HI，Historical Impressions）较多的商品较低的随机性，历史曝光较少的商品给予较高的随机性。具体的做法是咱们使商品的预估值（pCTR）遵从一个 beta(a,b) 散布，其中：

$${\frac{{a}}{{a+b}}=p}，a + b = n $$

其中 p 是以 pCTR 为自变量的函数，n 是以 EI 为自变量的函数。依据教训，咱们最终应用的函数为：

$${n=hyperN*\text{(}log\mathop{{}}\nolimits_{{10}}\text{(}HI+10\text{))}\mathop{{}}\nolimits^{{2}}}，p = hyperP * pCTR$$

咱们通过调节 hyperP 和 hyperN 两个参数来管制最终出现后果的随机性。如下图 7 所示，action1 相比 action2 散布的均值更高，action3 相比另外两个散布的随机性更强。较高的随机性可能会带来准确性的降落，咱们通过参数离线模仿，确定全量版本的超参数。最终上线的模型在精度和成果没有降落的前提下，展现的商品有 10% 的随机性。

异构混排和广告组合预估无效地解决了 LBS 限度下门店候选较少的问题。对于前文介绍的两类典型异构广告：竞争关系异构广告和组合关系异构广告，咱们依据其展现款式和业务特点，将相应的技术摸索均进行了落地，并获得了肯定的成果。如下图 8 所示：

本文介绍了美团到店搜寻广告业务中异构广告混排的摸索与实际，咱们通过高性能的异构混排网络来应答性能挑战，并依据业务特点对异构预估进行了利用。为了建模广告的上下文信息，咱们将商品预估流程由单点预估降级为组合预估模式，并提出上下文组合预估模型，建模商品位次及上下文信息，而后，通过基于汤普森算法的 E &E 策略对商品冷启动问题进行了优化，在多个场景均获得了肯定的成绩。近期，曾经有越来越多业务场景开始了展现款式的降级，例如美食类目由门店调整为菜品广告，酒店类目由门店调整为房型展现，本文提到的计划与技术也在逐渐的推广落地过程中。

值得一提的是，相比于美团以门店作为广告主体，业界的广告主体以商品和内容为主，本文提到的共有表白迁徙和生成式组合预估的技巧，能够利用在商品和创意的组合问题上，更进一步拓展候选规模。

广告异构混排我的项目也是从业务视角登程，敢于突破原来迭代框架下的一次重要尝试。咱们心愿该我的项目可能通过技术手段来解决业务问题，而后再通过业务了解反推技术的提高。此外，咱们也将在广告候选问题上进行更多的摸索，寻找新的突破点，从而进一步设计更欠缺的网络结构，一直开释排序零碎的后劲空间。

[1] Huang, Jianqiang, et al. “Deep Position-wise Interaction Network for CTR Prediction.” Proceedings of the 44th International ACM SIGIR Conference on Research and Development in Information Retrieval. 2021.
[2] Qi, Yi, et al. “Trilateral Spatiotemporal Attention Network for User Behavior Modeling in Location-based Search.” Proceedings of the 30th ACM International Conference on Information & Knowledge Management. 2021.
[3] 胡可，刚强等. 广告深度预估技术在美团到店场景下的冲破与畅想
[4] Cheng, Heng-Tze, et al. “Wide & deep learning for recommender systems.” Proceedings of the 1st workshop on deep learning for recommender systems. 2016.
[5] Zhou, Guorui, et al. “Deep interest network for click-through rate prediction.” Proceedings of the 24th ACM SIGKDD international conference on knowledge discovery & data mining. 2018.
[6] Ma, Jiaqi, et al. “Modeling task relationships in multi-task learning with multi-gate mixture-of-experts.” Proceedings of the 24th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining. 2018.
[7] Gong, Yu, et al. “Exact-k recommendation via maximal clique optimization.” Proceedings of the 25th ACM SIGKDD international conference on knowledge discovery & data mining. 2019.
[8] Guo, Huifeng, et al. “PAL: a position-bias aware learning framework for CTR prediction in live recommender systems.” Proceedings of the 13th ACM Conference on Recommender Systems. 2019.
[9] Feng, Yufei, et al. “Revisit Recommender System in the Permutation Prospective.” arXiv preprint arXiv:2102.12057 (2021).
[10] Ikonomovska, Elena, Sina Jafarpour, and Ali Dasdan. “Real-time bid prediction using thompson sampling-based expert selection.” Proceedings of the 21th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. 2015.

美团到店事业群广告平台算法团队全面负责所有到店相干业务的广告算法优化，在保障用户体验和广告商户 ROI 的前提下，继续晋升商业流量的变现效率。次要技术方向包含触发策略、品质预估、机制设计、创意生成、创意优选、反作弊、商家策略等。团队的技术气氛浓重，通过对前沿技术一直冲破，以驱动业务继续倒退。团队视人才培养，具备欠缺成熟的造就机制，帮忙大家疾速成长。

两年以上相干工作教训，相熟常见机器学习原理和深度学习模型，具备 CTR/CVR/NLP/CV/RL 等模型实践经验。
具备优良的剖析问题和解决问题的能力，放弃对新事物的学习能力和好奇心，对解决挑战性问题充斥激情。
具备良好的编程能力，扎实的数据结构和算法根底，相熟 Python/Java/Scala/C++ 两种或以上语言。
计算机、自动化、电子信息、数学或相干专业本科及以上学历。

互联网广告 / 搜寻 / 举荐某一畛域相干工作教训。

感兴趣的同学可投递简历至：chengxiuying@meituan.com（邮件题目请注明：广平算法团队）。

浏览美团技术团队更多技术文章合集

前端 | 算法 | 后端 | 数据 | 平安 | 运维 | iOS | Android | 测试

| 在公众号菜单栏对话框回复【2021 年货】、【2020 年货】、【2019 年货】、【2018 年货】、【2017 年货】等关键词，可查看美团技术团队历年技术文章合集。

| 本文系美团技术团队出品，著作权归属美团。欢送出于分享和交换等非商业目标转载或应用本文内容，敬请注明“内容转载自美团技术团队”。本文未经许可，不得进行商业性转载或者应用。任何商用行为，请发送邮件至 tech@meituan.com 申请受权。

关于美团:异构广告混排在美团到店业务的探索与实践

1 背景与简介

1.1 背景

1.2 场景介绍

1.3 挑战与做法简介

2 技术摸索与实际

2.1 高性能异构混排零碎

2.2 生成式广告组合预估零碎

2.3 异构广告冷启动优化

2.4 业务实际

3 总结

4 参考资料

招聘信息

岗位要求

具备以下条件优先

Just My Socks（注册教程内含优惠码）

关于美团:异构广告混排在美团到店业务的探索与实践

1 背景与简介

1.1 背景

1.2 场景介绍

1.3 挑战与做法简介

2 技术摸索与实际

2.1 高性能异构混排零碎

2.2 生成式广告组合预估零碎

2.3 异构广告冷启动优化

2.4 业务实际

3 总结

4 参考资料

招聘信息

岗位要求

具备以下条件优先

Just My Socks（注册教程 内含优惠码）

Just My Socks（注册教程内含优惠码）