Elasticsearch
- 反向索引又叫倒排索引,是根据文章内容中的关键字建立索引。
- 搜索引擎原理就是建立反向索引。
- 搜索引擎的三大过程:爬取内容,进行分词,建立反向索引。
- Elasticsearch 在 Lucene 库 的基础上进行封装,提供 restful 的 API,实现了可以存储海量数据的分布式搜索引擎。
- Elasticsearch 中的索引、类型和文档的概念比较重要,类似于 MySQL 中的数据库、表和行(记录)。
- Elasticsearch 也是 Master-slave 架构,也实现了数据的分片和备份。
- Elasticsearch 一个典型应用就是 ELK 日志分析系统。也就是日志分析系统。其中 E 就是 Elasticsearch,L 是 Logstash,是一个日志收集系统,K 是 Kibana,是一个数据可视化平台。
原文地址:终于有人把 Elasticsearch 原理讲透了!
ETL
Extraction-Transformation-Loading 的缩写,中文名称为数据抽取、转换和加载。
名词解释:
ODS——操作性数据
DW——数据仓库
DM——数据集市
neo4j
介绍
图形数据库(Graph Database)是 NoSQL 数据库家族中特殊的存在,用于存储丰富的关系数据,Neo4j 是目前最流行的图形数据库,支持完整的事务,在属性图中,图是由顶点(Vertex),边(Edge)和属性(Property)组成的,顶点和边都可以设置属性,顶点也称作节点,边也称作关系,每个节点和关系都可以由一个或多个属性。Neo4j 创建的图是用顶点和边构建一个有向图,其查询语言 cypher 已经成为事实上的标准。
模型规则
表示节点,关系和属性中的数据
节点和关系都包含属性
关系连接节点
属性是键值对
节点用圆圈表示,关系用方向键表示。
关系具有方向:单向和双向。
每个关系包含“开始节点”或“从节点”和“到节点”或“结束节点”
w3c 上面的教程和官网也可以参考