共计 2098 个字符,预计需要花费 6 分钟才能阅读完成。
摘要: 本文从常识推理的基本概念登程,通俗易懂得介绍了常识图谱常识推理的利用和办法。
本文分享自华为云社区《0 根底入门常识图谱的超能力——常识推理》,作者:Cheri Chen。
一、常识推理的概念
推理是使用逻辑思维能力,从已有的常识登程,得出未知的、隐性的常识。
具体到常识图谱中,所谓的常识推理,就是利用图谱中现有的常识(三元组),失去一些新的实体间的关系或者实体的属性(三元组)。如下图所示:如果原来的常识图谱中有这样两个三元组,< 姚明,妻子,叶莉 > 和 < 姚明,女儿,姚沁蕾 >,通过常识推理,能够失去 < 姚明,女儿,姚沁蕾 >。
二、常识推理的利用
常识补全
理论构建的常识图谱,通常存在不齐备的问题,即局部关系或属性会缺失。常识补全呢,就是通过算法,补全常识图谱中缺失的属性或者关系。
如下图所示,以“姚沁蕾的妈妈是谁”为例。有一条常识是“父亲的妻子是妈妈”,则可根据该常识,推理出姚沁蕾的妈妈是叶莉,进而补全“姚沁蕾”和“叶莉”之间的关系,晋升咱们这个简略的人物关系常识图谱的齐备性。
常识纠错
理论构建的常识图谱还可能存在谬误常识。其中,实体的类型、实体间的关系、实体属性值均可能存在谬误。常识图谱的纠错是一个极具挑战的工作。这些谬误会影响常识图谱品质,进而影响基于常识图谱的利用。
咱们能够通过推理进行常识图谱纠错(如下图)。比方,在某个影视常识图谱中,虚线框中的实体《春光璀璨猪八戒》,其类型为“电影“。它的属性有集数,主题曲、片尾曲等。而其余同为”电影“类别的实体,其属性多蕴含上映期间、票房,且大多没有集数这个属性。则推理可知,《春光璀璨猪八戒》这个实体的类型大概率存在谬误,其正确类型应该是电视剧。
推理问答
基于常识图谱的推理问答也是常识图谱推理的典型利用。基于常识图谱的问答,个别简称为 KBQA。与传统的信息检索式问答相比,KBQA 能够具备肯定的推理能力,这是它的劣势。基于常识图谱的推理问答,通常利用于波及多个实体,多个关系,多跳,比拟等绝对简单的问答场景中。
比方,“刘德华主演的电影中豆瓣评分大于 8 分的有哪些?“这样的问题。须要机器对该问题进行解析、了解,在常识图谱中实现查问、推理、比拟动作,找到《天下无贼》和《无间道》作为答案返回(如下图所示)。
三、常识推理的办法
基于本体的推理
本体是对畛域中概念和概念之间关系的形容。基于本体的推理是利用本体曾经蕴含的语义和逻辑,来对实体类型以及实体之间的关系进行推理。本体的形容模式是有标准的。RDFS、OWL 等是一类满足特定标准和考究的用来表述本体的语言。
以 RDFS 为例:RDFS 定义了一组用于资源形容的词汇:包含 class,domain,range 等。其自身就蕴含了简略的语义和逻辑。咱们能够利用这些语义和逻辑进行推理。
如下图中左侧的例子,谷歌的类型是一家人工智能公司,而人工智能公司又是高科技公司的子类,那么可推理,谷歌的也是一家高科技公司。右侧例子中,定义了投资这种关系的 domain 是投资人,range 是公司。能够简略的认为,投资这种关系的头节点都是投资人这种类型、尾节点都是公司这种类型。假如当初有一条事实是大卫 切瑞顿 投资 谷歌。则能够推理出,大卫 切瑞顿的类型是投资人。这两个例子呢,便是利用了 RDFS 自身蕴含的语义和逻辑,来进行推理。
基于规定的推理
基于规定的推理就是说,能够形象出一系列的规定,将这些规定利用于常识图谱中,进行补全纠错。这种思路也是很简略、直观的。基于规定的推理的长处是,推理后果精准,并且具备可解释性。因而规定推理在学术界和工业界都有宽泛的利用。
图中的例子,是人工定义了一些规定,包含“B 是 A 的妻子,则 A 是 B 的丈夫”、“B 是 A 的女儿,则 A 是 B 的父亲”等等。使用这些规定来进行推理,进而补全常识图谱的缺失关系。咱们能够利用这些规定,推理出“米歇尔的丈夫是奥巴马”、“玛利亚的父亲是奥巴马”等新的常识。
基于示意学习的推理
前两种办法:本体推理和规定推理,都是基于离散符号的常识示意来推理的。它们具备强逻辑束缚,准确度高、易于解释等长处。然而不易于扩大。基于示意学习的推理,通过映射函数,将离散符号映射到向量空间进行数值示意,同时捕获实体和关系之间的关联,再在映射后的向量空间中进行推理。
常识图谱是由实体和关系组成,通常采纳三元组的模式示意:head(头实体),relation(实体的关系),tail(尾实体),简写为 (h,r,t)。常识示意学习工作就是学习 h,r,t 的向量示意。如下图所示,不同的点示意了不同的常识。咱们能够找到一个适合的映射函数,让间隔较近的点,在语义上也是类似的。
基于示意学习的推理比拟形象和简单,这里举个简略的例子,推理“姚沁蕾的出生地是哪儿”。
假如咱们曾经找到了一个完满的映射函数,能够把常识图谱和一段蕴含相干信息的文本映射到同一向量空间。再对这些向量进行计算,比方把“姚沁蕾”、“在”、“当地医院”、“出世”几个向量简略相加后,达到了“休斯顿”这个向量,则能够推理出姚沁蕾的出生地是休斯顿。
[2021 华为云 AI 实战营]——六大实战营课程单元制,随进随学,供大家收费学习。
点击关注,第一工夫理解华为云陈腐技术~