Elasticsearch入门教程

个别我介绍某个框架、MQ、中间件，个别都是讲是啥，能帮忙咱们干啥，而后用起来，高级个性。这次打算换一种格调，交叉一些小故事。写到这篇的时候，我想起我刚入行的第一个我的项目，有一个页面查问，主表两百七十万条数据，join了七张表，第二张从表一百多万数据，残余五张大略在四五十万条数据的高低，查问大略十几秒，这样的速度必定是难以满足要求的，请DBA优化，优化到七秒，用户勉强能够承受了，我过后问带我的大哥，如果数据量再往上涨，更慢怎么办，我过后的大哥说，能够思考ElasticSearch，ElasticSearch号称亿级数据，光速查问。缘起许多年前，一个刚结婚的名叫 Shay Banon 的就业开发者，跟着他的妻子去了伦敦，他的妻子在那里学习厨师。在寻找一个赚钱的工作的时候，为了给他的妻子做一个食谱搜索引擎，他开始应用 Lucene 的一个晚期版本。间接应用 Lucene 是很难的，因而 Shay 开始做一个形象层，Java 开发者应用它能够很简略的给他们的程序增加搜寻性能。他公布了他的第一个开源我的项目 Compass。起初 Shay 取得了一份工作，次要是高性能，分布式环境下的内存数据网格。这个对于高性能，实时，分布式搜索引擎的需要尤为突出，他决定重写 Compass，把它变为一个独立的服务并取名 Elasticsearch。第一个公开版本在2010年2月公布，从此以后，Elasticsearch 曾经成为了 Github 上最沉闷的我的项目之一，他领有超过300名 contributors(目前736名 contributors )。一家公司曾经开始围绕 Elasticsearch 提供商业服务，并开发新的个性，然而，Elasticsearch 将永远开源并对所有人可用。据说，Shay 的妻子还在等着她的食谱搜索引擎… 《Elasticsearch: 权威指南》基于2.x 版本那Lucene是啥，Lucene是一个全文搜索引擎库，属于Apache，全称为Apache Lucene，Luece能够说是当下最先进、高性能全功能的搜索引擎库, 然而Lucene仅仅只是一个库，应用起来比较复杂。Shay Banon构建了一个形象层，试图对开发者屏蔽简单细节，Java开发者应用它能够很简略的给他们的程序增加搜寻性能，这也就是Compass，最初演变为ElasticSearch。全文搜寻？传统的数据库不行吗？《ElasticSearch权威指南》给出的理由是: 可怜的是，大部分数据库在从你的数据中提取可用常识时出其不意的低效。当然，你能够通过工夫戳或准确值进行过滤，然而它们可能全文检索、解决同义词、通过相关性给文档评分么？它们能从同样的数据中生成剖析与聚合数据吗？最重要的是，它们能实时地做到上述操作，而不通过大型批处理的工作么？从下面的这句话咱们能够提取的无效信息是，大部分关系数据不可能进行全文检索、解决同义词、通过相关性给文档进行评分。什么是全文检索(搜寻)?Full Text Searching (or just text search) provides the capability to identify natural-language documents that satisfy a query, and optionally to sort them by relevance to the query. The most common type of search is to find all documents containing given query terms and return them in order of their similarity to the query. Notions of query and similarity are very flexible and depend on the specific application. The simplest search considers query as a set of words and similarity as the frequency of query words in the document. [1] ...

Elasticsearch入门教程

关于elasticsearch入门教程:elastic学习data的多层角色

关于elasticsearch入门教程:ElasticSearch-学习笔记一-基本概念与基本使用