分类: hadoop
-
Hadoop小文件解决方案-Hadoop小文件的前因后果
Hadoop不适用于大量小文件,而是需要更少的大文件。这可能是您之前听过的声明。但是,为什么Hadoop会出现…
-
以智能数据架构,挖掘增长金矿
对很多技术团队来说,在搭建智能数据架构的过程中,或多或少会遇到一些疑惑和挑战,经过多次实践后,有些团队已经破除…
-
应用AI芯片加速 Hadoop 3.0 纠删码的计算性能
做为大数据生态系统中最重要的底层存储文件系统HDFS,为了保证系统的可靠性,HDFS通过多副本的冗余来防止数据…
-
要不,我们简单聊聊Hadoop与它的生态圈
实际上,关于Hadoop及其生态系统的文章或者书籍已经汗牛充栋,在2016年大数据这个概念兴起的时候,有幸于能…
-
趣味集算:wordcount
WordCount 差不多是最常用的分布式系统练习程序了,Hadoop 就经常用这个当例子。我们来看用集算器怎…
-
Python进阶:切片的误区与高级用法
众所周知,我们可以通过索引值(或称下标)来查找序列类型(如字符串、列表、元组…)中的单个元素,那么,如果要…
-
logstash通过webhdfs放入hdfs增加时间戳和host字段
logstash通过webhdfs插件把数据放入hdfs的时候,发现每行数据的签名都增加了一个时间戳和host…
-
Data Lake Analytics + OSS数据文件格式处理大全
Data Lake Analytics是Serverless化的云上交互式查询分析服务。用户可以使用标准的SQ…
-
请读下面的这句绕口令:ResourceManager中的Resource Estimator框架介绍与算法剖析
本文首先介绍了Hadoop中的ResourceManager中的estimator service的框架与运行…
-
【云+社区极客说】新一代大数据技术:构建PB级云端数仓实践
在现代社会中,随着4G和光纤网络的普及、智能终端更清晰的摄像头和更灵敏的传感器、物联网设备入网等等而产生的数据…