使用 start-dfs.sh
启动 HDFS 后,jps 查看到有 namenode 进程,但是过一会没了。
查看日志,是连不上 8485 端口,8485 配的是 journalnode,也就是说连不上 journalnode 而挂掉的。
参考 https://segmentfault.com/a/11…,ha 的集群需要先启动 journalnode,那么 node 再连接 journalnode,所以再搭建 hadoop ha 时,先手动启动的 journalnode 没有问题。可是 start-dfs.sh
是先启动 namenode,后启动 journalnode,然后让 namenode 进程启动后去等待重试连接 journalnode,所以如果有时候 journalnode 启动慢了,可能 namenode 就启动不了挂了,这就是为什么会出现 jps 中出现了 namenode 而一会儿又消失的原因。
找到原因了,就对症下药:(二选一)
1. 修改 core-site.xml 配置,让 namenode 多等一会儿,详见原文出处;
2. 手动启动挂掉的 namenode