关于java:面试官ElasticSearch是什么它有什么特性与使用场景

48次阅读

共计 2798 个字符,预计需要花费 7 分钟才能阅读完成。

哈喽!大家好,我是小奇,一位酷爱分享的程序员
小奇打算以轻松风趣的对话形式来分享一些技术,如果你感觉通过小奇的文章学到了货色,那就给小奇一个赞吧
文章继续更新

一、前言

书接上回,我本认为我跟面试我的小姐姐志同道合,这次工作必定是探囊取物了。

殊不知最初卡在了 hr 大姐那里了,说我体格太小不适合,我是来面试开发来了,不是面试驴拉磨来了,我狐疑 hr 跟刘婶是亲戚吧,以貌取人、以体格取人。。。

因为认为昨天探囊取物,明天也没有约面试,闲着也是闲着,我筹备找我在北京当工程师的发小去玩一天,他跟我说他是什么 长方体固体定向挪动工程师,我也不懂这是个什么,感觉比 Java 工程师要厉害,决定明天去访问他一下。

换乘了四趟地铁,又坐了十几站公交车,终于来到了我发小猴哥这里来了,他之前在电话里跟我说他当初混得特地好,从之前的赤贫如洗,混到当初的。。。,因为地铁上信号不太好前面混成啥样没听清就挂断了,我感觉怎么也混到了呼风唤雨的境地了吧。

到了目的地跟他打电话,他跟我说他在幸福小区顶楼,间接上来吧没有门,我寻思什么房子这么高级没有门呢,后果上来了远远的就看见他的背影了,我终于晓得前面说的当初混成什么样了,原来是从 之前的赤贫如洗,混成当初的腰缠万贯了 啊。。。

我:“猴哥,你不是说你在顶楼没有门吗?”

猴哥:“对啊,你看我当初不就在顶楼正干活呢嘛,这顶楼还没有盖好,所以当然没有门了嘛”。

我:“行吧,说不过你,那你不是工程师吗,什么 长方体固体定向挪动工程师”。

猴哥:“对啊,你看我手里的砖是长方体吧,我从这边给他挪动到这边,我这一套下来不就是 长方体固体定向挪动工程师嘛”。

我:“得,你来了大城市了当前套路也变深了啊”。

猴哥:“那必须的,对了小奇你来北京不是来面试 Java 了吗,面试的怎么样了?”

我:“别提了,人家嫌我体格不好,我要是有你这体格那我就杠杠的下班了”。

猴哥:“那你正好也别找开发工作了,你间接跟我干好了,干一个月你体格也就好了”。

我:“那你们这里加班吗?压力大不大?”

猴哥:“一点都不大,你能够看看咱们大门口的岗位要求,我感觉简简单单啦,跟你们程序员还是没法比的哦”。

我:“在哪呢?我去看看”。

我:“你们这特么都是跟谁学的,当初工地也这么卷的吗?“

猴哥:“没方法,咱们前一段时间空降了一个工头,之前是某大厂程序员,给咱们定了规矩,当初咱们每天回去还得写 ppt 呢”。

我:“这特么都是大厂给社会输送的人才,你得好好跟着你们工头干啊”。

猴哥:“必须的,等我我拾掇一下,咱们出去玩”。

我:“你这就拾掇好了啊,不换身衣服啊”。

猴哥:“不必换,一会领导打电话还得赶回来干活呢,你们不是也随时待命,陪女朋友逛商场也得背着电脑嘛”。

我:“当前学我点好的,别学我坏的”。

猴哥:“不是你也没有好的啊”。

我:“我。。。”。

二、面试

从发小那里玩完下午回来的路上忽然接到了一个电话,电话那头的小姐姐声音甘甜,说是在简历库中看到了我的简历,问我有没有工夫去现场面试,我想着反正当初也没有事件,不如就去面试,小姐姐说加我微信,一会发我公司地址。

加了小姐姐微信后,上来必定是先看一波朋友圈啊,小司机可能不太懂,然而老司机曾经开始剖析了,该说不说这个小姐姐的确副品啊,比刘婶强多了,为了补救被我刘婶视觉冲击到的读者,我就把小姐姐的照片分享给大家。

到了中央后小姐姐把我带进一个小黑屋,正在我窃喜可能会产生点什么的时候之间她拿了面试题过去了,说里面没有中央了,就在这个小屋子里做题吧,唉,白期待了。

做完题来了一位面试官,我一看是男的就霎时没了趣味,然而来都来了,怎么也得面试完啊。

面试官:“小奇是吧”。

我:“是我”。

面试官:“我看你简历上写的精通 ElasticSearch?是真的还是写错了”。

我:“我时而精通时而含糊,你就问吧”。

面试官:“行,那你就先简略的说一下 ElasticSearch 是什么吧”。

三、ElasticSearch 是什么

我:“ElasticSearch 是用 Java 开发的,并且是以后最风行的开源的企业级搜索引擎,它提供了一个分布式多用户能力的全文搜索引擎,它可能达到实时搜寻,稳固,牢靠,疾速,装置使用方便”。

四、ElasticSearch 索引原理

面试官:“嗯,你能说一下 ElasticSearch 应用的什么索引吗,有什么原理吗”。

我:ElasticSearch 中分词应用的是倒排索引。

我:ElasticSearch 先将文章的内容进行分词,将词和行数关联起来,而后将反复的词去重,将行数记录下来,这样咱们下面如果搜寻 hello 这个词的话就会给他展现第 1 和 2 行的数据,因为 hello 就在这两行外面,而不必再全文章扫描了。

面试官:“嗯,为什么有些数据库在数据质变大的时候性能降落的十分厉害,而 ElasticSearch 数据量越来越大的时候反而性能降落的不显著呢”。

我:因为咱们能够看到,无论文章有多少的内容,咱们最初都会去重,也就是说最初的索引表中的条数不会超过所有的单词。

也就是说如果世界上只有 100 个单词,那么最初索引表中只有 100 条数据,因为文章是由单词组成的,文章内容再多最初去重后也只有 100 条数据,只不过数据的所在行有所变动而已。

这样咱们就看进去了,文章内容越多,他的单词反复率越高,查问性能升高的也越来越慢。

五、ElasticSearch 分词器

面试官:“嗯,那咱们怎么晓得一句话中哪些是词语呢,怎么来分词呢”。

我:如果文章是英文的,那么十分好分词,因为英文单词两头有空格,咱们依据空格就能够分词,这样间接应用 ElasticSearch 自带的分词器就好。

如果文章是中文的,那么应用 ElasticSearch 自带的分词器就不是很好了,因为它会将中文的每一字都给离开,显然是不合理的,总不能把奇哥很帅离开吧。

所以咱们能够应用 IK 中文分词器,咱们应用这个插件就能够实现中文内容的分词了。

六、ElasticSearch 有哪些应用场景呢

面试官:“嗯,那你说一下 ElasticSearch 有哪些应用场景呢”。

我:个别的话像百度这种的专门做搜寻的,你搜寻关键词,他会帮你找到对应的内容,并且给他标红。

我:还有像淘宝、京东这种购物网站,搜寻关键词也会展现内容,并且关键词高亮解决。

面试官:“小伙子不错呀,什么时候能入职呢”

我:“额。。。我前面还约了面试呢,怎么也得一周左右了吧”

面试官:“别面别家的了,就来我这吧,条件轻易开”

我:“不不不,容我思考思考”。

面试官:“行,那等你思考好了通知我,明天就先这样,你还有什么问题要问我的吗”

我:“我有问题要问”。

面试官:“什么问题”

我:“就是带我的那个 hr 球姐有对象吗。。。”

七、总结

这里对于 ElasticSearch 还没有整顿结束,文章前面继续更新,倡议珍藏。

文章中波及到的命令大家肯定要像我一样每个都敲几遍,只有在敲的过程中能力发现自己对命令是否真正的把握了。

如果感觉我的文章还不错的话就点个赞吧

正文完
 0