关于算法:智能客服闲聊模块三种方案对比

60次阅读

共计 757 个字符,预计需要花费 2 分钟才能阅读完成。

以后市场上智能客服及其 NLP 畛域,闲聊模块是其十分重要的钻研畛域。目前业界针对于闲聊模块的计划个别以下三个计划

  • 基于固定模板

咱们都晓得业务问答通用计划是基于模板式问答,同理模板式问答也实用于闲聊零碎,这种形式的劣势在于易于控制,用大量的模板满足多种问题需要,劣势在于呈现答非所问的概率比拟大

  • 基于语料库
    这种做法是先收集 - 整顿一批闲聊库,个别状况是一个用意对于一个规范问题及相应问题的泛化,针对问题有多个答案,造成相似一问多答的成果,这种做法的劣势在于答复内容是可控,不会呈现意料之外的答案,目前市场上闲聊语料库作法是比拟宽泛,如针对于金融保险行业做的比拟好的竹间机器人、安全等,针对儿童畛域做的比拟好北京光年的图灵机器人、狗尾草的公子小白等都是应用这种形式,劣势在于答复的内容十分无限,毕竟都是在设计的语料库内的答案。
  • 基于生成式
    生成式始终都是 NLP 畛域钻研的前沿方向,晚期的微软小冰及各大研究院推出的闲聊零碎都是生成式的,生成式对话零碎的劣势在于基于无限的语料,通过深度学习 / 神经网络能够取得额定的答案,从而实现无中生有的成果,劣势在于答复的内容不可控,谁都无奈预估到会呈现什么样的答案,目前该种形式只能应用钻研及局部真正的“闲聊”中,无奈应用到企业业务中,毕竟没人能真正管制的了答复的是什么内容,如果呈现性别,种族歧视呐?

总结,这三种形式各有各的劣势,在咱们理论应用,须要依据业务需要采取相应的设施,以下是三种计划的比照
1、答复内容可控性:基于语料库 > 基于固定模板 > 基于生成式
2、答复内容丰盛度:基于生成式 > 基于固定模板 > 基于语料库
3、答复内容的牢靠度性:基于语料库 > 基于固定模板 > 基于生成式

目前企业生产的应用度来看,大多数企业采纳的是语料库 + 模板两种计划联合一起,既能达到内容的可控性,又能在肯定水平上满足丰盛度。

正文完
 0