常识图谱组队学习笔记 D1-用Windows Neo4j Destop 搭建繁难常识图谱

学习工夫： 7Days

学习进度：1/7

学习指标：Datawhale 常识图谱组队学习之 Task 1 常识图谱介绍

什么是常识图谱，Graph，schema

常识图谱：就是语义网络的知识库（Google 2012 -至今）

图（Graph）：是由节点（Vertex）和边（Edge）来形成，多关系图个别蕴含多种类型的节点和多种类型的边。

图的举例：

节点Vertex——示意实体：人名，地名，公司，药物
边Edge——示意关系：敌人，坐落于，子公司，衍生药物

Schema ：限定待退出常识图谱数据的格局；相当于某个畛域内的数据模型，蕴含了该畛域内有意义的概念类型以及这些类型的属性

Schema的举例：

电影Schema，中央商业Schema

常识图谱的价值

常识图谱是人工智能很重要的一个分支, 人工智能的指标为了让机器具备像人一样感性思考及做事的能力 -> 在符号主义的引领下，常识工程（核心内容即建设专家系统）获得了突破性的停顿 -> 在整个常识工程的分支下，常识示意是一个十分重要的工作 -> 而常识图谱又恰好是常识示意的重要一环

构建常识图谱

数据源：

对于垂直畛域的常识图谱，数据起源有2种：

sequenceDiagram
    数据源->>+数据: 业务自身数据（结构化）
    数据源->>+数据: 网络上公开、抓取的数据（非结构化）

信息抽取的难点

难点在于解决非结构化数据，须要自然语言解决

构建常识图谱须要的技术

实体命名辨认（Name Entity Recognition）——NER
- 提取出“Virgil’s BBQ”，并标记实体类型为“Restarant”
- 提取实体“NYC”，并标记实体类型为 “Location”
关系抽取（Relation Extraction）——RE
- 实体“hotel”和“Hilton property”之间的关系为“in”
- “hotel”和“Time Square”的关系为“near”
实体对立（Entity Resolution）——ER
- “NYC”和“New York”指向同一个实体，须要合并
指代消解（Coreference Resolution）
- “it”, “he”, “she”这些词指向“hotel”实体

常识图谱的存储

常识图谱次要有两种存储形式：

一种是基于RDF的存储；
另一种是基于图数据库的存储。

区别	图数据库	RDF
设计准则	高效的图查问及图搜寻	易公布，易共享
存储形式	存储三元组（Triple）	以图为表现形式
是否蕴含属性	No	Yes

Neo4j零碎目前仍是使用率最高的图数据库

Neo4j实际

neo4j 是一个图数据库，专门存储图构造，图的定义

Cypher 是 Neo4J 的申明式图形查询语言，相似于传统数据库的 SQL

Neo4j下载

官网

我在这里下载的是Windows版：Neo4j Desktop

创立图数据库

创立一个用于练习的图数据库 Exercise Graph Database，点击start开始运行

而后在浏览器中输出http://127.0.0.1:7474/browser/，进入Web 界面
- 此时能够进行各项配置、写入、查问等操作，还有可视化性能
- Web界面最上方是可交互的输入框
或者点击Neo4j Desktop的Graph Apps，而后再点击Neo4j Browser，也能进入Web界面（我用了这种办法）

简略理解Cypher 查询语言

这里要理解下Neo4j Cypher 查询语言

这个查询语言蕴含以下几个显著的局部：

START：在图中的开始点，通过元素的 ID 或所以查找取得

MATCH：图形的匹配模式，解放于开始点

WHERE：过滤条件

RETURN：返回所须要的

具体语法能够理解Neo4j 教程 – 5 详解 Cypher 语法

创立节点

创立一个人物节点：

CREATE (n:Person {name:'John'}) RETURN n

创立更多的人物节点：(此时曾经创立了6个工作节点)

  CREATE (n:Person {name:'Sally'}) RETURN n;
  CREATE (n:Person {name:'Steve'}) RETURN n;
  CREATE (n:Person {name:'Mike'}) RETURN n;
  CREATE (n:Person {name:'Liz'}) RETURN n;
  CREATE (n:Person {name:'Shawn'}) RETURN n;

显示以后的人物节点，能够看到有6个人物（这行代码超罕用）
```
MATCH (n) RETURN n
```

创立6个地区节点（此时有6个人物节点6个地区节点）

  CREATE (n:Location {city:'Miami', state:'FL'})
  CREATE (n:Location {city:'Boston', state:'MA'})
  CREATE (n:Location {city:'Lynn', state:'MA'})
  CREATE (n:Location {city:'Portland', state:'ME'})
  CREATE (n:Location {city:'San Francisco', state:'CA'})

创立关系

在敌人之间减少FRIENDS关系（LIz和MIke是个好基友）
Note：

MERGE的用法如下：
- 对不存在的节点创立，存在的节点返回。
  merge (robert:Critic) return robert,labels(robert);
- 单个属性节点：merge (charlie {name:”Charlie”,age:10}) return charlie;
- 带标签和属性的单个节点：merge (michel:Person {name:”michelDoug”}) return michel;
- 如果要创立节点就设置属性：merge on create
  merge (keanu:Person {name:”Keanu”}) on create set keanu.created=timestamp() return keanu;
[] 即为关系，FRIENDS 为关系的类型
–> 有方向，示意是从 a 到 b 的关系

  MATCH (a:Person {name:'Liz'}), 
        (b:Person {name:'Mike'}) 
  MERGE (a)-[:FRIENDS]->(b)

给shawn和Sally的FRIEND关系增加属性

  MATCH (a:Person {name:'Shawn'}), 
        (b:Person {name:'Sally'}) 
  MERGE (a)-[:FRIENDS {since:2001}]->(b)

给更多的好基友增加FRIEND 属性，给结婚的敌人增加MARIED属性

  MATCH (a:Person {name:'Shawn'}), (b:Person {name:'John'}) MERGE (a)-[:FRIENDS {since:2012}]->(b)；
  MATCH (a:Person {name:'Mike'}), (b:Person {name:'Shawn'}) MERGE (a)-[:FRIENDS {since:2006}]->(b)；
  MATCH (a:Person {name:'Sally'}), (b:Person {name:'Steve'}) MERGE (a)-[:FRIENDS {since:2006}]->(b)；
  MATCH (a:Person {name:'Liz'}), (b:Person {name:'John'}) MERGE (a)-[:MARRIED {since:1998}]->(b)；

创立出生地关系

创立人物与出生地之间的关系BORN_IN

  MATCH (a:Person {name:'John'}), (b:Location {city:'Boston'}) MERGE (a)-[:BORN_IN {year:1978}]->(b)；
  MATCH (a:Person {name:'Liz'}), (b:Location {city:'Boston'}) MERGE (a)-[:BORN_IN {year:1981}]->(b)；
  MATCH (a:Person {name:'Mike'}), (b:Location {city:'San Francisco'}) MERGE (a)-[:BORN_IN {year:1960}]->(b)；
  MATCH (a:Person {name:'Shawn'}), (b:Location {city:'Miami'}) MERGE (a)-[:BORN_IN {year:1960}]->(b)；
  MATCH (a:Person {name:'Steve'}), (b:Location {city:'Lynn'}) MERGE (a)-[:BORN_IN {year:1970}]->(b)；

TIPS:

同时创立人物节点和FRIEND关系
  CREATE (a:Person {name:'Todd'})-[r:FRIENDS]->(b:Person {name:'Carlos'}

图数据库查问

查问下所有在 Boston 出世的人物

  MATCH (a:Person)-[:BORN_IN]->(b:Location {city:'Boston'}) RETURN a,b

查问所有对外有关系的节点

  MATCH (a)--() RETURN a

查问所有有关系的节点

  MATCH (a)-[r]->() RETURN a.name, type(r)

查问所有对外有关系的节点，以及关系类型

  MATCH (a)-[r]->() RETURN a.name, type(r)

查问所有有结婚关系的节点

  MATCH (n)-[:MARRIED]-() RETURN n

查找某人的敌人的敌人

  MATCH (a:Person {name:'Mike'})-[r1:FRIENDS]-()-[r2:FRIENDS]-(friend_of_a_friend) RETURN friend_of_a_friend.name AS fofName

删除和批改

Note：

Set:

用于更新一个节点和关系的标签或属性。
create (n { name: ‘Andres’ }) ;

MATCH (n { name: ‘Andres’ }) SET n.surname = ‘Taylor’ RETURN n;

删除属性：MATCH (n { name: ‘Andres’}) SET n.name = NULL RETURN n

在节点和关系之间复制属性：MATCH (at { name: ‘Andres’}),(pn { name: ‘Peter’ }) SET at = pn RETURN at, pn;

从 map 增加属性：MATCH (peter { name: ‘Peter’}) SET peter += { hungry: TRUE , position: ‘Entrepreneur’ }

设置多个属性：MATCH (n { name: ‘Andres’}) SET n.position = ‘Developer’, n.surname = ‘Taylor’

在节点上加标签： MATCH (n { name: ‘Stefan’}) SET n :German RETURN n
MATCH (n { name: ‘Emil’ }) SET n :Swedish:Bossman RETURN n

DELETE：

删除节点和关系

删除单个节点：MATCH (n:Useless) DELETE n;

删除节点和连贯它的关系：MATCH (n { name: ‘Andres’})-[r]-() DELETE n, r

删除所有节点和关系：MATCH (n) OPTIONAL MATCH (n)-[r]-() DELETE n,r

REMOVE：

删除标签和属性

删除属性：MATCH (andres { name: ‘Andres’}) REMOVE andres.age RETURN andres;

删除节点的标签：MATCH (n { name: ‘Peter’}) REMOVE n:German RETURN n;

删除多重标签：MATCH (n { name: ‘Peter’}) REMOVE n:German:Swedish RETURN n

减少 / 批改节点的属性

  MATCH (a:Person {name:'Liz'}) SET a.age=34
  MATCH (a:Person {name:'Shawn'}) SET a.age=32
  MATCH (a:Person {name:'John'}) SET a.age=44
  MATCH (a:Person {name:'Mike'}) SET a.age=25

删除节点的属性

  MATCH (a:Person {name:'Mike'}) SET a.test='test'
  MATCH (a:Person {name:'Mike'}) REMOVE a.test
  MATCH (a:Location {city:'Portland'}) DELETE a
  MATCH (a:Person {name:'Todd'})-[rel]-(b:Person) DELETE a,b,rel

参考文档

Neo4j 教程 – 5 详解 Cypher 语法
图数据库之 Cypher 语言
Markdown 教程
Neo4J Cypher neo4j-driver py2neo 介绍与应用
Datawhale 常识图谱组队学习之 Task 1 常识图谱介绍

关于程序员:知识图谱组队学习笔记-D1用Windows-Neo4j-Destop-搭建简易知识图谱

常识图谱组队学习笔记 D1-用Windows Neo4j Destop 搭建繁难常识图谱

什么是常识图谱，Graph，schema

常识图谱的价值

构建常识图谱

数据源：

信息抽取的难点

构建常识图谱须要的技术

常识图谱的存储

Neo4j实际

Neo4j下载

创立图数据库

简略理解Cypher 查询语言

创立节点

创立关系

创立出生地关系

图数据库查问

删除和批改

参考文档

评论

发表回复取消回复

更多文章

DDN HPC 存储硬件架构设计深度分析

探秘IO500：从Lustre并行文件系统出发，开启HPC存储性能新征程

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

关于程序员:知识图谱组队学习笔记-D1用Windows-Neo4j-Destop-搭建简易知识图谱

常识图谱组队学习笔记 D1-用Windows Neo4j Destop 搭建繁难常识图谱

什么是常识图谱，Graph，schema

常识图谱的价值

构建常识图谱

数据源：

信息抽取的难点

构建常识图谱须要的技术

常识图谱的存储

Neo4j实际

Neo4j下载

创立图数据库

简略理解Cypher 查询语言

创立节点

创立关系

创立出生地关系

图数据库查问

删除和批改

参考文档

评论

发表回复 取消回复

更多文章

DDN HPC 存储硬件架构设计深度分析

探秘IO500：从Lustre并行文件系统出发，开启HPC存储性能新征程

苹果iOS打包的ipa应用无法安装？一篇文章带你了解可能的原因及排查方法

图解Golang：从零开始实现简易版过期LRU缓存

发表回复取消回复