hadoop kafka源码解析4RecordAccumulator的相关组件BufferPoolCopyOnWriteMap下 前面解析RecordAccumulator提到了batches是用来存放每个TopicPartition对应的批次队列的,因为会在多线程环境下使用所以声明为ConcurrentMap,但是batches是一个读多写少的场景,所以kafka设计了CopyOnWriteMap这…
hadoop Hadoop之完全分布式集群 集群环境: centOs6.8:hadoop102,hadoop103,hadoop104 jdk版本:jdk1.8.0_144 hadoop版本:Hadoop 2.7.2
hadoop kafka源码解析系列 客户端Producer源码解析 kafka源码解析1:Cluster集群信息kafka源码解析2:Metadata集群元信息kafka源码解析3:RecordAccumulator消息存储 服务端
hadoop kafka源码解析3RecordAccumulator消息存储 前面两节分析了部分源码,中间间隔了一个月没有继续分享,原因是在深入阅读中碰到了一些问题,因为我阅读源码是以KafkaProducer发送消息(send方法)作为入口开始逐行分析,涉及到新的类后就把整个类和相关的类全…
hadoop Hadoop-系列八-基于-ZooKeeper-搭建-Hadoop-高可用集群 Hadoop 高可用 (High Availability) 分为 HDFS 高可用和 YARN 高可用,两者的实现基本类似,但 HDFS NameNode 对数据存储及其一致性的要求比 YARN ResourceManger 高得多,所以它的实现也更加复杂,故下面先进行…
hadoop 大数据学习之路之Hadoop Hadoop是一个开源的分布式计算平台,用于存储大数据,并使用MapReduce来处理。Hadoop擅长于存储各种格式的庞大的数据,任意的格式甚至非结构化的处理。两个核心: