关于美团:美团智能客服核心技术与实践

23次阅读

共计 9052 个字符,预计需要花费 23 分钟才能阅读完成。

客服是在用户服务体验不完满的状况下,尽可能帮忙体验顺畅进行上来的一种解决办法,是问题产生后的一种兜底计划。而智能客服能让大部分简略的问题得以疾速自助解决,让简单问题有机会被人工高效解决。在用户服务的全旅程中,美团平台 / 搜寻与 NLP 部提供了问题举荐、问题了解、对话治理、答案供应、话术举荐和会话摘要等六大智能客服外围能力,以期达到低成本、高效率、高质量地与用户进行沟通的目标。本文次要介绍了美团智能客服核心技术以及在美团的实际。

1 背景

目前,美团的年交易用户量为 6.3 亿,服务了 770 万生存服务类商家。此外,在美团优选业务中还有一个很大的团长群体。美团平台涵盖吃、住、行、游、购、娱等 200 多个生存服务品类,在平台服务的售前、售中、售后各个环节,都有大量信息征询、订单状态获取以及申述投诉等沟通诉求。另外,作为一家领有几万名员工的上市企业,员工之间亦有大量的沟通诉求。面对以上这些需要,如果都是通过人力进行实现,显然不合乎公司久远倒退的指标,这就须要引入智能客服。

1.1 面对不同场景的智能客服落地

首先,咱们看看日常生活中几种最为常见的客服场景。

  • 售前场景 :比方消费者在平台抉择入住酒店,对房型价格、酒店设施、入退房政策等,下单前都有很强的信息征询诉求。
  • 售中场景 :比方外卖催单还没到,增加备注不要辣、加开发票等征询等等,售前和售中场景次要产生在消费者和商家或平台之间。
  • 售后场景 :比方外卖场景投诉菜品少送、骑手送餐超时、要求退款等,酒店场景投诉酒店到店无奈入住等,售后往往波及到客服座席、消费者、骑手和商家,须要多方协同解决。
  • 办公场景 :比方 IT、人力资源、财务、法务等征询,产运研对提供的接口产品的征询答疑,产品对销售参谋的答疑,以及销售参谋对商家的答疑等等。

1.2 面对不同人群的智能客服落地

沟通是人类的一项根本需要,在绝大多数场景下,咱们对沟通的谋求都是以低成本、高效率和高质量为指标,而对话机器人也须要同时满足这三点要求。目前咱们依照服务的群体进行划分,智能客服落地场景大体能够分为以下四类:

  • 面向用户 :提供智能客服机器人,来帮忙他们自助解决大部分的问题。
  • 面向座席 :用话术举荐或者会话摘要等能力来晋升人工座席的工作效率,改善人工座席的工作体验。
  • 面向商家 :打造商家助手来升高商家回复的费力度,改善消费者和商家的沟通体验。
  • 面向员工 :通过对话机器人,能够自助给员工进行答疑,从而晋升办公效率。

1.3 智能客服是什么

要答复智能客服是什么,能够先看看客服是什么。咱们的了解是,客服是在用户服务体验不完满的时候,来帮忙体验顺畅进行上来的一种解决办法,是问题产生后的一种兜底计划。而智能客服能让大部分简略的问题得以疾速自助解决,让简单问题有机会被人工高效解决。

上图展现的是用户服务旅程。首先,用户会通过在线打字或者拨打热线电话的形式进线寻求服务,其中在线征询流量占比在 85% 以上。当用户进入到服务门户后,先是用户表白需要,而后是智能机器人响应需要,过程中机器人先要了解问题,比方是追加备注或是批改地址,还是申请退款等等,继而机器人尝试自助解决。如果解决不了,再及时地流转到人工进行兜底服务。最初,当用户来到服务时,零碎会发送考察问卷,期待用户对本次服务进行评估。

2 智能客服核心技术

2.1 对话交互技术概述

智能客服背地的技术次要是以对话交互技术为外围。常见的对话工作可分为闲聊型、工作型和问答型:

  • 闲聊型 :通常是不关注某项特定工作,它的次要的指标是和人进行凋谢畛域的对话,关注点是生成晦涩、正当且天然的回复。
  • 工作型 :通常是帮忙用户实现某项工作指令,如查找酒店、查问订单状态、解决用户的退款申请等等。用户的需要通常比较复杂,须要通过多轮交互来一直收集工作所需的必要信息,进而依据信息进行决策,执行不同的动作,最终实现用户的指令。
  • 问答型 :侧重于一问一答,即间接依据用户的问题给出精准答案。问答型和工作型最实质的区别在于,零碎是否须要保护一个用户指标状态的示意和是否须要一个决策过程来实现工作。

在技术实现上,通常又能够划分为检索式、生成式和工作式:

  • 检索式 :次要思路是从对话语料库中找出与输出语句最匹配的回复,这些回复通常是事后存储的数据。
  • 生成式 :次要思路是基于深度学习的 Encoder-Decoder 架构,从大量语料中习得语言能力,依据问题内容及相干实时状态信息间接生成答复话术。
  • 工作式 :就是工作型对话,通常要保护一个对话状态,依据不同的对话状态决策下一步动作,是查询数据库还是回复用户等等。

闲聊、问答、工作型对话实质都是在被动地响应用户需要。在具体业务中还会有问题举荐、商品举荐等来被动疏导用户交互。在美团的业务场景里次要是工作型和问答型,两头也会交叉一些闲聊,闲聊次要是打招呼或者简略情绪安抚,起到光滑人机对话的作用。

如后面用户服务流程所介绍的那样,用户的沟通对象可能有两个,除了跟机器人沟通外,还可能跟人工沟通。如果是找客服场景人工就是客服座席,如果是找商家场景人工就是商家。机器人的能力次要包含问题举荐、问题了解、对话治理以及答案供应。

目前,掂量机器人能力好坏的外围输入指标是不满意度和转人工率,别离掂量问题解决的好坏,以及能帮人工解决多少问题。而在人工辅助方面,咱们提供了话术举荐和会话摘要等能力,外围指标是 ATT 和 ACW 的升高,ATT 是人工和用户的均匀沟通时长,ACW 是人工沟通后的其它解决时长。

2.2 智能机器人——多轮对话

这是一个实在的多轮对话的例子。当用户进入到服务门户后,先抉择了一个举荐的问题“如何分割骑手”,机器人给出了联系方式致电骑手。同时为了进一步厘清场景,询问用户是否收到了餐品,当用户抉择“还没有收到”的时候,联合预计送达工夫和以后工夫,发现还未超时,给出的计划是“好的,帮用户催一下”,或者是“我再等等吧”,这时候用户抉择了“我再等等吧”。

这个例子背地的机器人是怎么工作的呢?首先当用户输出“如何分割骑手”的时候,问题了解模块将它与知识库中的拓展问进行匹配,进而失去对应的规范问即用意“如何分割骑手”。而后对话治理模块依据用意“如何分割骑手”触发相应的工作流程,先查问订单接口,获取骑手电话号码,进而输入对话状态给到答案生成模块,依据模板生成最终后果,如左边的红框内容所示。在这个过程中波及到要先有用意体系、定义好 Task 流程,以及订单的查问接口,这些都是业务强相干的,次要由各业务的经营团队来保护。那么,对话零碎要做的是什么呢?一是将用户的输出与用意体系中的规范问进行匹配,二是实现多轮交互外面的调度。

问题了解是将用户问题与用意体系进行匹配,匹配到的拓展问所对应的规范问即用户用意。机器人的工作过程理论是要做召回和精排两件事件。召回更多地是用现有检索引擎实现,技术上更多地关注精排。

美团自研的智能客服零碎是从 2018 年开始搭建的,在建设的过程中,咱们一直地将业界最先进的技术引入到咱们的零碎中来,同时依据美团业务的特点,以及问题了解这个工作的特点,对这些技术进行适配。

比如说,当 2018 年底 BERT(参见《美团 BERT 的摸索和实际》一文)呈现的时候,咱们很快全量应用 BERT 替换原来的 DSSM 模型。前面,又依据美团客服对话的特点,咱们将 BERT 进行了二次训练及在线学习革新,同时为了防止业务之间的烦扰,以及通过减少常识辨别性升高乐音的烦扰,咱们还做了多任务学习(各业务在下层为独立工作)以及多域学习(Query 与拓展问匹配,改为与拓展问、规范问和答案的整体匹配),最终咱们的模型为 Online Learning based Multi-task Multi-Field RoBERTa。通过这样一系列技术迭代,咱们的辨认准确率也从最后不到 80% 到当初靠近 90% 的程度。

了解了用户用意后,有些问题是能够间接给出答案解决的,而有些问题则须要进一步厘清。比如说“如何申请餐损”这个例子,不是间接通知申请的办法,而是先厘清是哪一个订单,是否影响食用,进而厘清一些用户的诉求是局部退款还是想安顿补送,从而给出不同的解决方案。这样的一个流程是跟业务强相干的,须要由业务的经营团队来进行定义。如左边工作流程树所示,咱们首先提供了可视化的 TaskFlow 编辑工具,并且把外呼、地图以及 API 等都组件化,而后业务经营人员能够通过拖拽的形式来实现 Task 流程设计。

对话引擎在与用户的实在交互中,要实现 Task 内各步骤的匹配调度。比方这个例子里用户如果不是点选”能够但影响就餐了…”这条,而是本人输出说“还行,我要局部退款”,怎么办?这个用意也没有提前定义,这就须要对话引擎反对 Task 内各步骤的含糊匹配。咱们基于 Bayes Network 搭建的 TaskFlow Engine 恰好能反对规定和概率的联合,这里的含糊匹配算法复用了问题了解模型的语义匹配能力。

这是另外一个例子,在用户问完“会员是否退订”后,机器人回复的是“无奈退回”,尽管答复了这个问题,但这个时候用户很容易不称心,转而去寻找人工服务。如果这个时候咱们除了给出答案外,还去厘清问题背地的实在起因,疏导询问用户是“外卖红包无奈应用”或者是“因换绑手机导致的问题”,基于顺承关系建模,用户大概率是这些状况,用户很有可能会抉择,从而会话能够进一步进行,并给出更加精密的解决方案,也缩小了用户间接转人工服务的行为。

这个疏导工作称为多轮话题疏导,具体做法是对会话日志中的事件共现关系以及顺承关系进行建模。如左边图所示,这里本来是要建模句子级之间的疏导,思考到句子稠密性,咱们是将其形象到事件之间的疏导,共现关系咱们用的是经典的协同过滤形式建模。另外,思考到事件之间的方向性,咱们对事件之间的顺承关系进行建模,公式如下:

并通过多指标学习,同时思考点击指标和工作指标,如在非转人工客服数据和非不称心数据上别离建模顺承关系,公式如下:

最终,咱们在点击率、不满意度、转人工率层面,都获得了十分正向的收益。

美团平台涵盖吃、住、行、游、购、娱等 200 多个生存服务品类,当用户是从美团 App 或点评 App 等综合服务门户入口进入服务时,须要后行确定用户要征询的是哪个业务,这里的一个工作是“判断用户 Query 是属于哪个业务”,该工作咱们叫做畛域辨认。若能明确判断畛域时,则间接用该畛域常识来解答;当不能明确判断时,则还须要多轮对话交互与用户进行廓清。比方用户输出“我要退款”,在多个业务里都存在退款用意,这个时候就须要咱们先判断是哪个业务的退款用意,如果判断置信度不高,则给出业务列表让用户自行抉择来进行廓清。

畛域辨认模型次要是对三类数据建模:各畛域知识库的有标数据、各畛域大量弱监督无标数据和个性化数据。

  1. 根据从各畛域知识库的有标数据中学习失去的问题了解模型信号,能够判断用户输出属于各业务各用意的可能性。
  2. 咱们留神到除了美团 App、点评 App 等综合服务入口波及多个业务外,还有大量可能明确业务的入口,比如说订单入口,从商品详情页进来的入口,这些入口进来的对话数据是有明确业务标签信息的。因而,咱们能够失去大量的弱监督的各业务畛域的数据,基于这些数据咱们能够训练一个一级分类模型。
  3. 同时,有些问题是须要联合用户订单状态等个性化数据能力进一步明确的。比方“我要退款”,多个业务里都会有。因而,又要联合用户状态特色一起来训练一个二级模型,最终来判断用户的输出属于哪个业务。

最终,该二级畛域辨认模型在满意度、转人工率以及胜利转接率指标上都获得了十分不错的收益。

2.3 智能机器人——问题举荐

在介绍完多轮对话根底模块问题了解和对话治理后,接下来咱们介绍一下智能机器人的另外两个模块:问题举荐和答案供应。如后面多轮对话的例子所示,当用户进入服务门户后,机器人首先是要如何疏导用户精准地表白需要,这样即可升高用户迷失或者间接转人工服务,也升高了若机器人不能正确理解时带来的多轮廓清等有效交互。

该问题是一个规范的曝光点击问题,它的实质是举荐问题。咱们采纳了 CTR 预估工作经典的 FM 模型来作为根底模型,同时联合业务指标,冀望用户点击的问题的解决方案可能解决用户问题,该问题最终定义为“曝光、点击、解决”问题,最终的模型是联合多指标学习的 ESSM-FM,对无效交互的转化率、转人工率和不满意度等指标上都带来了晋升。

2.4 智能机器人——答案供应

售后客服场景通常问题较集中,且问题的解决多依赖业务外部零碎数据及规定,通常是业务部门保护知识库,包含用意体系、Task 流程和答案等。但在售前场景,常识多来自于商户或商品自身、用户体验及评估信息等,具备用户问题凋谢、常识密度高、人工难以整顿答案等特点。比方去哪个城市哪个景点玩耍,左近有哪些酒店,酒店是否有浴缸,酒店地址在哪里等,都须要征询”决策”,针对这些诉求,咱们通过智能问答来解决征询以及答案供应问题。

智能问答就是从美团数据中习得答案供应,来疾速答复用户的问题,基于不同的数据源,咱们建设了不同的问答技术。

  • 针对商家根底信息,比方问营业时间、地址、价格等,咱们通过图谱问答(KBQA)来解决。利用商家根底信息构建图谱,通过问题了解模型来了解问题,进而查问图谱获取精确的答案。
  • 针对社区数据,即商户详情页中“问大家”模块的用户问用户答的社区数据,构建社区问答(Community QA)能力,通过对用户问题与问大家中的”问答对”的类似度建模,抉择类似度最高的作为答案,来答复用户的一些开放性问题。
  • 针对 UGC 评论数据以及商户政策等无结构化数据,构建文档问答(Document QA)能力,针对用户问题利用机器浏览了解技术从文档中抽取答案,相似咱们小时候语文考试中的浏览了解题,进一步答复用户的一些开放性问题。

最初,针对多个问答模块给出的答案,进行多答案起源的答案交融排序,来筛选最终的答案,此外这里还考查了答案真实性,即对“置信少数认为正确的则正确”建模。这部分的具体介绍大家能够参考《美团智能问答技术摸索与实际》一文。

3 人工辅助核心技术

3.1 人工辅助——话术举荐

前文介绍的都是智能机器人技术,用户除了跟机器人沟通外,还可能是跟人工沟通。咱们在客服座席职场调研过程中发现,座席在与用户的对话聊天中常常回复类似甚至雷同的话术,他们统一冀望提供话术举荐的能力来提高效率。此外,除了申请客服座席帮忙外,很多状况下用户与商家间接沟通会使得解决问题更高效,而沟通效率不仅影响到消费者的体验,也影响到了商家的经营。比方在外卖业务中,消费者的下单率和商家的回复时长有较为显著的正比关系,无论是客服座席还是商家,都有很强的话术举荐诉求。

那么,话术举荐具体要怎么做呢?常见的做法是先筹备好罕用通用话术库,局部座席或商家也会筹备集体常见话术库,而后零碎依据用户的 Query 及上下文来检索最合适的话术来举荐。咱们依据考察发现,这部分知识库保护得很不好,既有业务知识变更频繁导致已保护的常识很快不可用因素,也有座席或商家自身志愿不强的因素等。另外,针对新客服座席或者新商家,可用的教训更少。因而咱们采纳了主动记忆每个座席及其同技能组的历史聊天话术,商家及其同品类商家的历史聊天话术,依据以后输出及上下文,预测接下来可能的回复话术,无需人工进行整顿,大大晋升了效率。

咱们将历史聊天记录构建成“N+1”QA 问答对的模式建模,前 N 句看作问题 Q,后 1 句作为回复话术 A,整个框架就能够转化成检索式的问答模型。在召回阶段,除了文本信息召回外,咱们还退出了上文多轮槽位标签,Topic 标签等召回优化,排序为基于 BERT 的模型,退出角色信息建模,角色为用户、商家或者座席。

整个架构如上图所示,分为离线和在线两局部。另外上线后咱们也退出了一层 CTR 预估模型来晋升驳回率。以后多个业务的话术举荐均匀驳回率在 24% 左右,覆盖率在 85% 左右。话术举荐特地是对新座席员工价值更大,新员工通常难以组织话术,通过驳回举荐的话术能够来缩减纯熟周期,观测发现,3 个月内座席员工的均匀驳回率是 3 个月以上座席员工的 3 倍。

3.2 人工辅助——会话摘要

在客服场景座席跟用户沟通完后,还须要对一些必要信息进行工单纪要,包含是什么事件,事件产生的背景是什么,用户的诉求是什么,最初的处理结果是什么等等。而填写这些内容对座席来说其实是很不敌对,通常需进行总结演绎,特地是有些沟通进行的工夫还比拟长,须要来回翻看对话历史能力正确总结。另外,为了继续对于服务产品进行改善,也须要对会话日志进行相应事件抽取及打上标签,从而不便经营剖析。

这里有些问题是选择题,有些问题是填空题,比方这通会话具体聊的是哪个事件,咱们提前整顿有比拟残缺的事件体系,能够看成是个选择题,能够用分类或者语义类似度计算模型来解决。又比如说事件产生的背景,如外卖退款的背景是因餐撒了、酒店退款的背景是到店没有房间等,是个开放性问题,剖析发现能够很好地从对话内容中抽取,能够用摘要抽取模型来解决。而对于处理结果,不仅仅依赖对话内容,还包含是否外呼,外呼了是否商家接通了,后续是否须要回访等等,咱们试验发现生成模型更无效。具体应用的模型如上图所示,这里事件抉择思考到常常有新事件的增加,咱们转成了双塔的类似度计算工作,背景抽取采纳的是 BERT-Sum 模型,处理结果采纳的是谷歌的 PEGASUS 模型。

04 小结与下一步打算

4.1 小结——交互立方

后面介绍了美团智能客服实际中的一些核心技术,过程中也穿插着介绍了客服座席与消费者 / 商家 / 骑手 / 团长等之间的沟通提效,以及消费者与商家之间的沟通提效。除了这两局部之外,在企业办公场景,其实还有员工之间、销售参谋与商家之间的大量沟通。如果一个个去做,老本高且效率低,解决方案是把智能客服中积淀的能力进行平台化,最好“一揽子”进行解决,以固定成本来反对更多的业务需要。于是咱们搭建了美团的对话平台 - 摩西对话平台,用“一揽子”计划以固定成本来解决各业务的智能客服需要。

4.2 小结——对话平台“摩西”

构建一个怎么样的对话平台,能力提供冀望的没有 NLP 能力的团队也能领有很好的对话机器人呢?首先是把对话能力工具化和流程化。如上图所示,零碎可分为四层:利用场景层、解决方案层、对话能力层、平台性能层。

  • 利用场景层 :在售前利用场景,一类需要是商家助手,如图中所列的美团闪购 IM 助手和到综 IM 助手,须要辅助商家输出和机器人局部接管高频问题能力;还有一类需要是在没有商家 IM 的场景须要智能问答来填补征询空缺,比方图中所列的酒店问一问和景点问答搜寻;另外售中、售后以及企业办公场景,各自需要也不尽相同。
  • 解决方案层 :这就要求咱们有几套解决方案,大略能够分为智能机器人、智能问答、商家辅助、座席辅助等。每个解决方案的对话能力要求也有所不同,这些解决方案是须要很不便地对根底对话能力进行组装,对应用方是通明的,能够拿来即用。
  • 对话能力层 :后面也进行了相应的介绍,六大外围能力包含问题举荐、问题了解、对话治理、答案供应、话术举荐和会话摘要。
  • 平台性能层 :此外,咱们须要提供配套的经营能力,提供给业务方的经营人员来日常保护知识库、数据分析等等。

其次,提供“一揽子”的解决方案,还须要针对处在不同阶段的业务提供不同阶段的解决方案。

  • 有些业务只心愿保护好罕用的问答,能答复高频的问题就好,那么他们只须要保护一个入门级的机器人,只须要在用意治理模块来保护它的用意,用意的常见说法以及答案就能够了。
  • 而对于有经营资源的团队,他们心愿一直地去丰盛知识库来晋升问答能力,这个时候能够应用常识发现模块,能够主动地从每天的日志外面发现新用意及用意的新说法,经营人员只须要每天花一点工夫来确认增加及保护答案即可,这是一个进阶的业务方。
  • 还有一些高级的业务方心愿调用他们业务中的 API 来实现简单问题的求解。这个时候他们能够应用 TaskFlow 编辑引擎,在平台上间接注册业务的 API,通过可视化拖拽的形式来实现 Task 编辑。

此外,为了进一步不便更多的业务染指,咱们也提供了一些闲聊、通用指令、地区查问等官网技能包,业务方能够间接勾选应用。另外,随着咱们一直在业务中积淀,也会有越来越多的官网行业技能包。整体方向上是逐渐让业务方应用的门槛变得越来越低。

4.3 下一步打算

前文所介绍的对话零碎是一种 Pipeline 式对话零碎,依照性能划分为不同的模块,各个模块独自建模,顺次串联。这种形式的益处是能够做到不同团队职责的无效分工,比方研发同学专一于建设好问题举荐模型、问题了解模型和 Task 引擎等;业务经营同学专一于用意体系保护、Task 流程设计以及答案设计等等。它的劣势也很显著,模块耦合,误差累积,很难联结优化,进而各模块负责的同学可能会去修修补补,容易导致动作变形。

另一类建模形式是 End-to-End,将 Pipeline 式对话零碎的各个模块联结建模成一个模型,间接实现语言到语言的转变,此类办法最后利用在闲聊式对话零碎外面,近期随着大规模预训练模型的疾速倒退,学术上也逐步开始钻研基于预训练模型的端到端工作型对话零碎。它的长处是模型能够充分利用无监督人人会话,用数据驱动能够疾速迭代;毛病是模型的可控性差,不易解释且不足干涉能力。目前次要以学术研究为主,未见成熟的利用案例。

除了应用这种大量无监督的人人会话日志外,还有一种思路是基于 Rule-Based TaskFlow 构建规定的用户模拟器,进行交互以生成大量的对话数据,进而训练对话模型。为了保障对话零碎的鲁棒性,也可应用相似反抗攻打的办法优化,能够模仿 Hard User 的行为,不按程序执行 TaskFlow,随机打断、跳转某个对话节点等等。

此外,通过比照剖析人机对话日志和人人对话日志,人机对话比拟生硬死板,无奈无效捕获用户的情绪,而人就很善于这方面。这在客服场景十分重要,用户往往进来就是带着负面情绪的,机器人须要有共情能力。而端到端数据驱动的对话和对话共情能力建设,也将是接下来一段时间咱们尝试的重点方向。

浏览美团技术团队更多技术文章合集

前端 | 算法 | 后端 | 数据 | 平安 | 运维 | iOS | Android | 测试

| 在公众号菜单栏对话框回复【2020 年货】、【2019 年货】、【2018 年货】、【2017 年货】等关键词,可查看美团技术团队历年技术文章合集。

| 本文系美团技术团队出品,著作权归属美团。欢送出于分享和交换等非商业目标转载或应用本文内容,敬请注明“内容转载自美团技术团队”。本文未经许可,不得进行商业性转载或者应用。任何商用行为,请发送邮件至 tech@meituan.com 申请受权。

正文完
 0