明天给大家举荐一本大数据畛域中必读的一本书,名字叫《大数据日知录 - 架构与算法》
这本书正如它封面中介绍的一样,全面梳理大数据相干技术,从数据、算法、策略、利用和零碎架构等多个维度进行分析,既无所不包,又深入浅出。
这本书具体介绍了咱们所应用的大数据组件的底层原理及实现算法。
像 Flink 中十分重要的分布式一致性协定,应用的是两阶段提交协定,这本书中就具体介绍了两阶段提交协定的原理,如下为书中截图:
还有像比特币中用来进行交易验证的 Merkle 树,书中也有具体介绍,Merkle 树在亚马逊的 Dynamo 数据库中也有广泛应用
在 Hive 中罕用 orc 格局 + snappy 压缩是比拟罕用的存储加压缩格局,书中也有具体介绍压缩算法 Snappy
书中还有很多大数据组件底层算法及原理,就不一一举例了
给大家截取局部目录看下
这本书十分值得读一读,有趣味的同学倡议买一本实体书
因而处不易放链接,如果你想看电子版,能够搜寻公众号:五分钟学大数据 ,或间接扫描下方二维码,对话框发送 大数据日知录 即可获取此书电子版