关于算法:智能客服闲聊模块三种方案对比

以后市场上智能客服及其NLP畛域，闲聊模块是其十分重要的钻研畛域。目前业界针对于闲聊模块的计划个别以下三个计划

咱们都晓得业务问答通用计划是基于模板式问答，同理模板式问答也实用于闲聊零碎，这种形式的劣势在于易于控制，用大量的模板满足多种问题需要，劣势在于呈现答非所问的概率比拟大

基于语料库
这种做法是先收集-整顿一批闲聊库，个别状况是一个用意对于一个规范问题及相应问题的泛化，针对问题有多个答案，造成相似一问多答的成果，这种做法的劣势在于答复内容是可控，不会呈现意料之外的答案，目前市场上闲聊语料库作法是比拟宽泛，如针对于金融保险行业做的比拟好的竹间机器人、安全等，针对儿童畛域做的比拟好北京光年的图灵机器人、狗尾草的公子小白等都是应用这种形式，劣势在于答复的内容十分无限，毕竟都是在设计的语料库内的答案。
基于生成式
生成式始终都是NLP畛域钻研的前沿方向，晚期的微软小冰及各大研究院推出的闲聊零碎都是生成式的，生成式对话零碎的劣势在于基于无限的语料，通过深度学习/神经网络能够取得额定的答案，从而实现无中生有的成果，劣势在于答复的内容不可控，谁都无奈预估到会呈现什么样的答案，目前该种形式只能应用钻研及局部真正的“闲聊”中，无奈应用到企业业务中，毕竟没人能真正管制的了答复的是什么内容，如果呈现性别，种族歧视呐？

总结，这三种形式各有各的劣势，在咱们理论应用，须要依据业务需要采取相应的设施，以下是三种计划的比照
1、答复内容可控性：基于语料库 > 基于固定模板> 基于生成式
2、答复内容丰盛度：基于生成式 > 基于固定模板 > 基于语料库
3、答复内容的牢靠度性：基于语料库 > 基于固定模板> 基于生成式

目前企业生产的应用度来看，大多数企业采纳的是语料库+模板两种计划联合一起，既能达到内容的可控性，又能在肯定水平上满足丰盛度。

评论