谭安林:大数据在智能外呼系统的应用

54次阅读

共计 5804 个字符,预计需要花费 15 分钟才能阅读完成。

欢迎大家前往腾讯云 + 社区,获取更多腾讯海量技术实践干货哦~
本文由云加社区技术沙龙发表于云 + 社区专栏谭安林,腾讯高级工程师,2015 年加入腾讯,8 年互联网从业经历,从事大数据平台与产品开发相关工作;先后参与广告、金融等领域产品项目,目前负责行为预测解决方案,帮助客户盘活现有客群、挖掘潜在高价值新客。目前我们的产品包括:智能客服、大数据套件、腾讯移动分析、腾讯移动推送等。

商业是一个价值交换的事情,并不是一个等价交换的事情,我们因为信息不对称,很有可能导致一些效应:赢者通吃。大家买一个什么东西,可能比较关注的是市场知名度比较高的,这种会导致有一些同样的质量,甚至质量更高更便宜的产品,他们曝光度没有那么高,他们销售的时候并不占优势。我们作为一个数据团队,希望基于通信技术,大数据技术提供数字化智能化的服务,提升我们营销的价值点。

大家目的都是赚钱。我们要去解决这种沟通的一致性,信息的不对称。我们去淘宝或者京东买一个东西,如果质量出现问题就会找他们人工客服,出现什么问题帮我们解决。还有一种大家在订机票订酒店的时候会用到线上的服务,就是人工呼叫,还有越来越多文本类或者语音类机器人持续提供这种福利。

我们现在这种工具,并不能直接解决营销上的问题。比如教育行业,每一个学生成绩模型是不一样的,有些数学比较好,有些语文比较差,我们需要因材施教,为标准化产品对接,也就是说教育行业会有很多细分场景,我们要去做一个具体场景的推销,一个宣传,以及让我们用户可以从注册到转化。这一块流程非常长,假如我们打电话给一个客户,用户说我们有一个数据产品非常不错,你孩子听了之后可能从 80 分变成 90 后,刚开始听的时候会很感兴趣,过了一天或者晚上,他的邻居说有个张老师他的课程还不错,这时候就会导致你整个营销链路断了,在整个过程之中,我们希望能够解决一些数据能力,通信的能力,去持续的为我们客户解决服务,从售前到售中售后都可以贯穿。
我们在做的一个事情,有相应的客户在用,我们从售前给我们客户寻找到一个高价值的人群,可以让他针对性的做一些营销,本来是有 30 万的营销经费,如果说直接找到一批可以转换的一批人,可以定点的做相应的短信投放,去做呼叫,提高我们的 ROI,我们行业客户就会去买单。
在这里我们可以看到售前主要是行为的预测,行为预测我们会支持两种模式,一种模式是对线索的评分,我们在做一些线下宣传,线下活动推广的时候,我们会收集到一些用户一些联系方式,通过这些联系方式电话号码给他做一个评分,根据大数据上面一些特征判断他是否可能被我们转化,是否会在我们产品上面进行付费。还有一块是大家也去投过广告,不管是 2B 还是 2C,大家都会投一些广告,给到曝光人群,点击你目标网站的人群也是线索人群。
另外一个就是大盘,我们会告诉你互联网上可能存在某些人群,哪些人是你的潜在人群。这里我们第一个阶段做的是售前行为预测,包括一些挖掘,评分了之后就会告诉客户,高价值的这些人可以拿去做直接的外呼,一对一的外呼,这个成功率非常高。我们其他的高价值转换只占 10%,最多占 20%。那么有人想问了,还有 70%、80% 的用户群体是直接放弃吗,当然不是,这些人群我们希望可以结合短信,还有外呼渠道做一个渐进式的立项评估,以及促进转化意愿的提升。
如果说一个用户已经转化了,他掏钱了,买了十节课,在十节课过程中会去学,我们后面会给他提供售后客服服务,所以这不仅仅是一个被动服务。我们后面会讲到怎样反哺前面两个环节,融合数据的能力。

刚才一直在提教育,今天也是会主要以教育这个行业讲这个事情。我们在教育行业做行为预测,预测一个用户发生注册,或者是购买某一类产品。我们会从两大维度,一个是付费的意愿,一个是付费能力来进行评估。大家可以看到,我们的期望留学型和素质教育型还有望子成龙型人群,他们付费意愿会非常高,实际上在我们一些案例里面表现出来付费转换率也是很好的,还有一个就是打拼江山型,这种付费意愿并不那么高,但是他有钱,只要成一单,客单价相对来说比较高。对我们客单价比较高的产品来说,打拼江山型的人群对他们来说非常有价值,我们也是对不同行业,不同具体客户进行这种不同的定制化的建模,进一步做支持。

刚才说的线索评分部分,会结合线上线下两个环节,我们以前做的更多是线上,当前也在做线下这部分。

另外一块是潜客挖掘。我们客户比如教育、金融的很多企业,他们有一批已经买过产品的用户种子,包括有电话号码,有身份证这样一些信息,他们希望根据这个包,能够找到更多的人,相似的人去做一些扩散,去分道他的用户盘,这里我们集成大数据的相关特征,去做一个人群扩散。这里做的方式可以简单分享一下,因为只有种子,正向的样本,没有副样本,就是从大盘里面随机抽一部分出来做,这种方式效果不太好,我们后面用标签抽取方式,抽取一些种子人群,比较负向标签关联的人群,这种方式做出来,评估上会非常好看,但是在具体落地的时候稳定性差。后面就是做了一个 Pulearing,会先从种子用户,放进副样本里面去先做一个种子筛选模型,再真正抽取出来的正负样本去做预测建模,最后我们会达到一个比较好的效果。

整个行为预测这块在售前这部分能力,在做机器学习的时候,会对自己数据进行处理,先有数据,进行数据的预处理,这部分耗时会非常久,同时我们要去把数据实验各种不同的算法,去调参,去做模型在线调试,去上线,我们不同的行业,不同的客户有不同的模型,需要去做针对性的上线服务,我们时间开销很大,而且要上线一个新的东西,本来需要改一些参数,甚至有一些模块需要重启。

这里我们用了腾讯云上面一个 TI One 大数据平台,在上面是可以支持各类的机器学习的框架,我们在上面是用到了像 CNN,GBDT 这样一些算法。

给大家介绍一个 TI One 好用的点,我写一些计算任务,可以串起来,做一个任务流,像我们要做一个模型的训练,训练好了之后可以再形成一个算法结果的评估节点。我们可以看到一个简单的评估,算法评测效果,在发布的时候不同的客户有模型迭代,这个迭代可能是一个小的迭代,可能是大的迭代,很多环节都需要做更新,甚至有些环节会强依赖;TI One 实现了一定的解耦,让算法同学直接做,通过 TI One 开放出来,再在工程上面做集成。

介绍一下我们行为预测的一些模型样板,当前我们是在四个行业,可以先分享一下这两个行业的案例,我们的匹配率在市场上还是很有优势的,假如用户提供 100 万的号码包,我们可以识别出来在我们体系内有画像有特征的可能就是在教育这里有 93%,在房地产有 87%,比其他友商高很多。在模型效果上面我们会做预测上面的意向分级,我们高意向的拿去做营销效果会更好,模型的排序能力也比较好。

我们刚才提到售前,怎么去挖潜在的人群,潜在高价的人群,形成人工外呼流程的功能。但是对于我们对他的意向评估不是太完善,对这样一些人可以走短信营销,在这里我们还可以从短信营销链路里面把他意向拆分出来是强意向还是中意向,在对短信营销做二次过滤意向的人群做一个外呼,经过外呼,在座可能有很多做这方面的东西同学,我们外呼或者呼叫之间通讯的基础能力,或者在这个接入能力之上加上我们数据能力,我们可以希望做到一个点是我们一个电话在呼叫的时候可以辨别性别、学历、收入、兴趣。根据不同的类型选择不同的模板,走相应的剧本。同时我们也基于这样一些机制做了一些后面的营销。

这是一个短信投放的案例,我们在短信投放整个过程里面,会用断链服务,到监测,监测整个转换链路上面数据变化,用户走到哪一步,在这里可以看一下下面这个案例,两个包,第一个包 42 万,高意向的,可以看到分成三个小包做投放,效果比较好,。在这个基础上可以提供不同营销方案,或者你发送的时间,周期的不同可以做一些营销方案的对比。

这里面是我们当前外呼这一块的服务框架,我们能力是偏向于在后端链路逻辑处理,像 FS 软交换服务器,我们当前也是在建设中,更多会希望外部的合作伙伴建立一些合作的机制,我们更希望借助与智能设备做整体大数据方面的解决方案。

这是当前的一个 ASR 识别和 TS 流程,我们引入话术,这样是有特征的逻辑在里面,进入之后我们会进行调用 AI 引擎。

这是一个当前的产品页面,这个页面上可以支持相应话术,可以有多个话术入口,以及特别的特征组合,我们可以有不同的针对性入口,他进来的话可以去到他相应不同的节点,在这上面我们对每一个节点也可以有多个下游,比如肯定意向,否定意向,未知意向。

这是我们的一个 Demo,我们以后可以对望子成龙型的不同客户群体,根据他的特征做不同的话术营销,像期望留学型用户他们更偏重外教优势,会介绍有多种外教经验,如果是可能意向就会走到说给你提供相应体验课程,去体验体一下,下面会有转人进行跟进。像望子成龙型他们希望自己小学学习成绩好,可以在周围有一定地位,在这里会给他推出某个教育产品,如果方便的话,我们的师资配备或者我们历史经验会比较丰富。对于否定的意向,我们再进行一些挽留,并询问原因,希望在这一点让他们可以看到,可以把他们顾虑,他们关注的点抛给我们,我们可以做后续的分析。假如是费用顾虑,我们可能会自动做一些打折的模板去进行专门的呼叫进行服务。我们提供一个被动预语料库,我们很难预估到客户会说什么话,在这种情况下我们需要保证这样服务完整性,比较好的体验,我们增加被动语料库,这一部分是我们智能客服的能力。

这里刚才提到了客服,我们是用客服来做沟通,做技术支持相关东西,我们其实希望客服可以承担更多的角色,比如承担一些营销的任务,可以在产品售后让营销的触达之后,可以做一个营销的二次触达,产品售后之后可以做回访跟进,刚才提到一个点,我们一个用户在买一个课程之后,这个课程可能是十个课时,他只上了两三个课时,后面没有上,这个时候客服可以做后面的跟进,这种方式可以把我们用户关系稳定维护起来,也可以提高我们用户满意度,从而可以提高我们复购率的指标。

客户服务平台。当前其实我们很多客户端的渠道,像网页版或者 APP,像 H5,企业微信也打通了,还有微信公众号这块也比较成熟,我们是把多渠道可以提供客服售后给到最终 C 端用户,进行客服系统使用,这在一块汇集了这些数据,不仅仅是客服数据,还可以用来做后续其他的分析,整合出来之后可以做市场、销售、新的功能研发点一些启示,可以找到一些新的机会。
这是我们一个机器人 AI 客服的案例,当前是像我们公安、政企一些企业,还有像运营商的一些公众号。我们把微信的公众号和人工客服服务台数据进行打通,客服可以看到这个用户近期和机器人交互的环节,可以做出更精准的一些问答。

这是整个技术框架,在这里包括我们机器人客服和人工客服这两块,会有一些 AI 人工状态管理,多轮问答,上下文管理,在这里我们人工客服这块的数据扭转使用了。首先是说和微信 H5 或者网页端,这在块集成之后给用户侧数据会到服务器,到服务器和人工客服台是通过 websocket 做一个实时机制,外加异步消息处理提供高效能,更稳定性的保障。

整个客服 AI 机器人的架构,我们会从接入层接入不同渠道,在问答层当前是支持四种类型机器人,有相应的单轮问答,多轮交互,任务和闲聊的机器人,我们也是提供相应的服务工具,像知识图谱,数据运营分析的工具。后面是常规的两个,一个是后台引擎,会做向所有系统,像分布式的缓存系统,后面是算法,算法引擎,还有深度学习等等。

整个客服算法框架,是采取了检索平台方式。一开始我们会对每一个问题进行一个纠错,文本的纠错,一个用户在发一个问题的时候,可能会发送错别字,这时候先把错别字做识别,会根据我们分词做分析上成相应的 top1,去索引系统查出来相关的问题,查出来之后要计算相似度,计算相部分我们原来是直接把一个文本分拆成相应特征变量,用这种方式做相似度的计算,后面我们采用深度学习 CNN,效果也有一个提升。

我们一开始给客服是提供一个 7X24 小时落地保障。但是别人在问我们问题的时候,我们自己员工不可能全天候服务,这时候我们就有一些常规问题希望可以给他们进行一些回答。在这里我们一开始做的满足基本需求,后面我们希望提升工作效率,节省技术支持的能力。创新这一点,就是当前做的事情,其实客服这一块的兴趣是可以反哺行为预测。一个用户他来投诉或者他来咨询更多东西的时候,他是表示有兴趣的,这些点会加入到营销体系里面去,他的转化率是有一些提升的。后面做文本分析,做数据分析,会发现很多客户行为里面沉淀下来数据,用户相关提问数据,跟客服的交互数据,可以做一些产品新的规划。

我们以前一直是一个被动的客服服务,后来很多场景都是做主动服务,在营销上面看还是需要做更主动化部分营销的切入服务。

这是教育这个行业在加入大数据的能力之后,我们可以做到更精准,更智能,还可以把售后和售前进行连通,提供全栈式的服务,这在教育行业,还有汽车、房地产、金融行业是类似的,我们都有相应行业不同解决方案。
Q&A
Q:我们做这个语音还有人工客服这块整个系统的风控是怎么处理的。
A:我们会考虑避免电话骚扰,让用户觉得体验不好,简单来说去给他做一些限频,还有我们可以在呼叫时候做一些预判。有一些用户在广告上面他的行为可能就会不太去点击,不太关注这一点,这些在我们其他应用,我们还有其他渠道,也可以判断出来他们会对我们发出的东西比较抵触,我们把他们加到一些灰名单和黑名单;当然,其他更多的措施也在持续落实中。
Q:您好我想问一下,我现在手机每天也在不断被各种短信和电话骚扰,当然咱们这个系统方面比如说可以把一些没有意向的加入黑名单。我想问一下,除了短信和电话这种方式,还有没有其他的方式维系客户,您刚才就是指了两种,这两种方式我们客群不是很接受的。
A:我们还有其他方式,但是其他方式和这个场景不是太切合,比如说广告曝光方式,但这种方式会和我们当前这些营销链路不契合,因为我们做的这套营销链路是为了在有线索,或者有这样一些意向再去做事情;因为主要是一些有意向的用户群,骚扰的频次频率就会相对较低些。
附件如下:
9.15 谭安林 大数据在智能外呼系统的应用.pdf

问答如何追赶如此之火的大数据 AI 热潮?相关阅读郭律: 论机器学习平台与人工智能的关系罗冬日:深度学习在语音识别上的应用 7 分钟读懂《科技驱动教育,AI 连接未来》沙龙重点【每日课程推荐】机器学习实战!快速入门在线广告业务及 CTR 相应知识

正文完
 0