共计 1472 个字符,预计需要花费 4 分钟才能阅读完成。
什么是常识问答
基于常识的问答是以知识库为认知源,在知识库的根底上答复自然语言问题。
知识库(KB)是一个结构化数据库,其中蕴含模式 < 主题,关系,对象 > 的事实汇合,每个事实都能够随附所谓的属性。
例如,“Barack Obama got married to Michelle Obama on 3 October 1992 at Trinity United Church”,会被解析为以下的汇合
个别罕用的的知识库有 DBpedia 和 WikiData。
简略问题 vs 简单问题
KBQA 的晚期工作专一于简略的问题答复,其中只波及一个事实。例如,“JK 罗琳在哪里出世?”这是一个简略的问题,能够用《J.K. 罗琳》这个事实来答复罗琳,出生地,英国 >。
最近人们的注意力转向了答复简单的问题。所谓的简单的问题就是波及到在 KB 上的多跳推理、束缚关系、数值操作或上述的某种组合。
让咱们来看一个简单的 KBQA 问题:“Who is the first wife of the TV producer that was nominated for The Jeff Probst Show?”
这个问题须要找到以下的组合:
束缚关系: 咱们正在寻找 The Jeff Probst Show 提名的电视制片人,因而须要找到一个与 The Jeff Probst Show 提名链接的实体,并且是一个 TV producer。
多跳推理: 一旦咱们找到电视制作人,咱们须要找到他的妻子(wife)。
数值运算: 一旦咱们找到电视制作人的妻子,咱们就会寻找第一任(first)妻子,因而须要比拟数字并生成一个排名。
KBQA 办法
对于简单的 KBQA,有两种支流办法。这两种办法都是从辨认问题中的主题开始,并将其链接到知识库中的实体 (称为主题实体)。而后,他们在主题实体的知识库左近取得答案:
通过执行解析后逻辑构造,典型的基于语义解析的办法(基于 SP 的办法)。会剖析执行范式并通过在从 KB 中提取的特定于问题的图中进行推理,依据其与问题的相关性对提取图中的所有实体进行排名,这是典型的基于信息检索的办法(基于 IR 的办法)。
基于语义解析的办法
该办法通常将自然语言转化为两头的语义示意,而后将其转化为能够在 KG 中执行的描述性语言。具体有 4 种办法:1)语义解析(Semantic Parser)过程转化为 query map 生成问题的各类办法;2)仅在畛域数据集实用的 Encoder-Decoder 模型化解析办法;3)基于 Transition-Based 的状态迁徙可学习的解析办法;4)利用 KV-MemoryNN 进行解释性更强的深度 KBQA 模型。
基于信息检索的办法
该办法首先会确定用户 Query 中的 Entity Mention,而后链接到 KG 中的主题实体(Topic Entity),并将与 Topic Entity 相干的子图(Subgraph)提取进去作为候选答案汇合,而后别离从 Query 和候选答案中抽取特色。最初利用排序模型对 Query 和候选答案进行建模并预测。
两种办法的优缺点
基于语义解析的办法因为逻辑模式而产生了更可解释的推理过程然而它们重大依赖于两头的语义示意的解析设计,这通常是性能改良的瓶颈。
基于信息检索的办法适宜风行的端到端训练,然而推理模型的黑盒式使得两头推理的可解释性升高。
论断
在本文中,咱们理解了什么是基于常识的问答 (KBQA),以及解决简单问题的两种次要办法。
如果你对 KBQA 比拟感兴趣,能够从上面两个次要的数据集开始。
https://avoid.overfit.cn/post/ba9af18863ca42d38cac4401606f0070
作者:Fabio Chiusano