共计 3669 个字符,预计需要花费 10 分钟才能阅读完成。
摘要:华小唯是谁?——华为云 AI 的首席“聊天官”。
华小唯是谁?
华为云 AI 的首席“聊天官”,旨在向公众展现咱们的对话 AI 能力,帮忙公众更好的理解咱们,同时也在各个群内沉闷氛围。你能够通过关注“华为云 AI”公众号来找到 TA。
筹备工作
1、确定人设
为了让用户能够跟机器人继续的聊天,机器人须要满足跟用户在对话层面的平等关系,想一想咱们本人在生存里跟谁聊得最多,为什么?所以咱们须要给他定义一个人设,人设是面向角色语言行为及其他表达形式的框架束缚。通过人设来让用户有聊天的真实感,进而拉近用户与咱们的间隔,加强黏性,甚至衍生成“小助手”。来看看咱们在设计初期,都备选了哪些人设吧。
通过上述的角色性情及图片,想必,他们不谈话,你也能够设想他们聊起天来是什么样子的,每个人身边都有这些角色的锚点。这也是为后续多人合作撰写语料,对立人设对话格调做的筹备。最终咱们抉择了哪个人设,能够通过理论的对话来体验哦:)
2、匹配人设找写手
有了人设后,依据人设的个性找匹配的写手,即为机器人奉献语料的人。性情、表白越相近的人,越容易写出符合要求的语料。如果各方面条件无限,找不到完全符合的写手,咱们也能够制订各种表白标准,包含但不限于口头语、禁用语、句式等,来管制写手的语料品质。
3、细化人物画像,让写手同感
为了让写手更多的感触到这个人设,须要从细颗粒度上定义人设,比方不同对话类别的规范答复,喜爱听什么歌,穿衣格调,喜爱的明星,团聚时的角色等。比方上面这个截取了局部激情男的人设:
【人物画像】
大叔,家里的经济支柱,有肯定人生经历,经验过人生低谷,后从新站了起来。自信,自来熟,邻里关系不和,业委会组织者,乐于帮忙别人。满嘴鸡汤,被动承担责任,不推卸。
【规范答复】
4、对话场景确定
不同场景对话语料范畴不一样。比方语音交互场景会说“闭嘴”“没听清”,设施交互场景会说“关机”,文字交互场景会说“你好,在么”等。
不同气氛对话场景不一样。比方群聊会说“咱们谁最难看”,单聊会说“我难看么”。
不同隐衷水平下对话场景不一样。比方公开的会说“你咋这么笨”,私密的会说“你 tm 是不是 sb”。
而咱们此次定义的场景,是以公众号的文字聊天为主场景(业界发声),兼以公司外部沉闷氛围为辅(外部发声),这就限度了一些用户基于场景的问法,当然用户为了 debug 可能还是会对着一个文本机器人说关机,此时,做好兜底,会让机器人看起来更智慧,这个前面还会提到。
5、指标用户画像剖析
在以后的技术背景下,咱们做不到《钢铁侠》中贾维斯,或是《Her》中萨曼莎那种天然的对话。所以咱们有个认知前提,用户在当下不可能把机器人当成“人”来交换,咱们还在承受跟机器人聊天的这个阶段,更多的是调戏测试机器人,看机器人的笑话,或是解决一些简略的工作,查天气、查工夫等。所以,为了让用户在此时此刻能够感触到机器人的智(zhi)能(zhang)和乏味,咱们要利用要用户的心态,上面是咱们针对指标用户的画像剖析:
那么他们别离须要个怎么的机器人呢?咱们一个一个来看:
【女经营】熟知互联网热点,懂梗,能够有些沙雕对话,让他们想分享进来,如果机器人是个男性角色,咱们也能够适当加一些“撩妹”话术。机器人定位:沙雕网友
【男程序员】体现真挚,能够绕过他们的 debug 测试问题,反对更多的个性,比方 上下文记忆等。机器人定位:直男杀手,测试陪练
【传统行业老板】反对一些功能性对话,展现更多 AI+ 对话的利用,能够让他本人联想 AI 在本人行业的利用。机器人定位:贴心秘书
晓得了他们想要什么,咱们就能够在撰写话术的时候,针对性的写一些语料了。
开始整活!
筹备了这么多,终于要开始写语料了,可是对话范畴这么广,咱们从何写起?
1、闲聊问答分类
依据日常对话的类型,咱们定义了闲聊的类型,并做了如下优先级的排序
确定好撰写范畴后,就是写手的分工,依据写手不同的性情会调配不同的类别给他们写。后续可能会呈现一个人对某个类别写的厌倦了,此时会再进行从新分工,以保障语料是在纵向和横向同时扩大,进而进步语料品质。
2、利用规定扩大语料
为了能命中用户的不同问法,写手们要尽可能多的写一些扩大问,然而面对你爸爸是谁,你妈妈是谁,你哥哥是谁。。。等查户口式的问题,光把家里七大姑八大姨都写完就很费劲了,还要给每个亲戚配上问题,这活咱们可不干!还好 CBS 服务(华为云对话机器人服务)提供了规定的录入形式,反对咱们按“你 [爸爸 | 妈妈 | 哥哥 | 妹妹] 是谁“的形式,节俭了大量的工作。当然前提是,这些问题咱们筹备有一种答案来回复。
3、形象对话场景,封装技能
所谓技能,就是把某一场景的对话能力封装起来的汇合,比方查天气、订车票等。除了此类功能性的对话能够作为技能以外,一些能够形象的句式同样能够做为技能,比方比拟抉择的问法,A 和 B 谁更厉害,你喜爱 A 还是 B。因为用户会拿任何事物进行比拟,咱们无奈穷举,这时对话技能就能够很好的解决这个问题,此处再次感激 CBS 服务(华为云对话机器人服务)。下图是咱们在对话机器人中设计订票技能时,配置的对话流程,很清晰,不懂算法的人也能配的进去。
对了,千万不要跟机器人说,我要去你心里这样的话哦:)。为了能让机器人的对话范畴更丰盛,更长尾,咱们也引入了内部的一些内容,比方查星座运势,常识问答,甚至还能让他给你作诗,更多技能欢送来找小唯解锁。
4、兜底话术
兜底话术,既在机器人不晓得怎么答复时,应用的默认回复。好的兜底能够让人觉察不到机器人的“愚昧”。上面是咱们总结的在人工编写兜底话术时的一些准则。
(1)不要机械化,不要说我不晓得,我不分明。想想咱们常见的智能客服,答复不上时,就会回复我还不理解,我听不懂你在说什么,就很机械,增强了与用户之间的“异类”感,用户体验也不会好,甚至还想骂他。
(2)戳穿用户 debug 心里。既然你想测试我,挖个坑想看我往里面跳,那我就站在坑里面看着你,嗯,就是这种感觉。比方:你这是在测试我;我晓得你就是想看我出丑,等等。
(3)转移话题。这可是咱们生存中,回避话题的常见伎俩,当然,机器人也一样实用。比方:你方才是不是说过这个;你对这个这么感兴趣么,等等。
(4)疏导至可聊天范畴。这跟转移话题差不多,更近一步的是,疏导用户去问机器人能够答复的问题上。比方:尽管我不是百科大全,但我能帮你查查天气;聊这些不如我给你讲个笑话,等等。
(5)疏导用户廓清。一些难于辨别场景的回复,比方用户问“再来一个”,目前咱们无奈判断用户想要再来一个什么,唱歌、跳舞、还是讲笑话,所以咱们回复,“好的,那你再问我一次”
(6)装作了解了用户的样子。学习一下咱们鼻祖 ELIZA 的回复形式,化身一个心理医生,让用户来主导对话,咱们只是个聆听者,只对发问这个行为进行回复,而不是对问题内容进行回复,比方:那你感觉呢;你为什么会这么想,等等。
这些形式岂但能够让机器人看起来聪慧,甚至还能向下疏导对话,缩短用户的对话工夫,进一步达成咱们可继续对话的目标。除了人工编写兜底话术外,咱们还引入了生成式的对话模型的能力,此处还要 @CBS 服务(华为云对话机器人服务),来帮忙咱们主动生成回复。依据人工编写的语料,学习人设的回复格调,来答复一些人工无奈笼罩的长尾问题。上面这个对话,对着小唯赌咒,可都是生成的,没有一句是人工写的,来品品吧。
5、体现出上下文的理解能力
后面讲到要驯服技术男,机器人少不了一些上下文的理解能力,为了解决这个问题,咱们同样是人工 + 智能的联合。
首先,从对话场景登程,机器人难免会呈现答复不上的状况,这时用户,个别会换种问法再持续提问,因为个别人和人之间的对话,也会呈现一句话解释不分明的状况,须要再次廓清。但如果用户重复问了屡次,机器人还答复不上,不是又裸露了咱们的“愚昧”了么。不能够!所以咱们会在对话中做一些逻辑,比方当用户间断 X 次问同一问题时,机器人会有固定的回复;当用户反复机器人的回复时(毕竟,人类的实质是复读机),机器人也会有固定的回复。不信你看:
其次,在技能内,咱们也能够通过了解用户的用意来达到上下文的了解,比方在查天气时:
审核与测试优化
语料和技能都 ready 了,还须要通过一道审核,再次确认对话格调是否对立,是否合乎人设。这个环节,更重要的是,提炼规定教训,把写手们写的不适合的语料形象出规定,再向大家同步。规定越积越多,写手们的限度也会越多,语料品质也会越来越高。
测试同样是十分重要的环节,为了能让大家能有趣味来跟机器人谈话,咱们是想破了头,无论是群里有人过生日,还是有新同学入群,还是过节、下午茶、分享例会,作为机器人的父母,都要把她 @进去遛一遛,抓住每一次能让她曝光的时刻。大家的对话过程,咱们会找到那些机器人答复不上的场景,剖析高频的问法,再针对的写回复,这样咱们就能够笼罩更多轮的对话。上面这个是上线一个月左右的命中分类统计,跟咱们料想的状况也差不多。
同时,为了加强机器人黏性,咱们也在设计一些群游戏,能够让用户在空闲的时候,想着来玩一玩,也同时能够带动群氛围,大家敬请期待吧!
点击关注,第一工夫理解华为云陈腐技术~