开启高可用总览
# 开启高可用总览
组件装起来只是第一步,真正准备长期使用时,我会把存储、资源调度、安全入口这些控制面逐步切到高可用模式。这个分组用来放 Ambari Plus 中各组件 HA 的启用教程:先讲清楚启用前要确认什么,再按页面向导一步步做,最后给出能判断“真的可用”的验证方法。
注意
开启 HA 通常会触发服务重启、客户端配置刷新,甚至需要短暂维护窗口。不要在 Hive、HBase、Spark、Flink 等任务密集运行时直接操作,先确认业务低峰、备份和回退路径。
HDFS 开启 HA
把单 NameNode 切换为 Active / Standby,完成 JournalNode、ZKFC、Standby 初始化和读写验证。
YARN 开启 HA
为集群新增 Standby ResourceManager,通过 ZooKeeper 切换到 Active / Standby 调度入口。
config:
target: _self
data:
- name: HDFS 开启 HA
desc: 把单 NameNode 切换为 Active / Standby,完成 JournalNode、ZKFC、Standby 初始化和读写验证。
link: /ambari-plus/ha/hdfs/e7418f84-c290-43bc-a97c-49363171e815
bgColor: '#eef7ff'
textColor: '#17436b'
- name: YARN 开启 HA
desc: 为集群新增 Standby ResourceManager,通过 ZooKeeper 切换到 Active / Standby 调度入口。
link: /ambari-plus/ha/yarn/3f9142ec-f3df-4a9f-aca2-0ebef5f17d86
bgColor: '#effaf2'
textColor: '#205b32'
1
2
3
4
5
6
7
8
9
10
11
12
13
2
3
4
5
6
7
8
9
10
11
12
13
# 建议启用顺序
| 顺序 | 能力 | 为什么先做 |
|---|---|---|
| 1 | HDFS NameNode HA | HDFS 是 Hive、HBase、Spark、Hue 等组件的存储底座,先去掉 NameNode 单点。 |
| 2 | YARN ResourceManager HA | HDFS 稳定后,再处理资源调度入口的 Active / Standby。 |
| 3 | Ranger Admin HA | 权限中心承担策略和审计入口,生产环境建议单独规划统一访问域名。 |
第一篇先从 HDFS 开启 HA 开始,HDFS 稳定后继续做 YARN 开启 HA。