初始化集群

# 初始化集群

Ambari Server 启动以后，浏览器已经可以打开 Ambari Plus 登录页。这个时候不要急着装一堆大数据组件，我更建议先做一个最小闭环：创建集群、接入三台主机、安装基础协调服务，让 Web UI 能正式进入控制台。

本文示例环境沿用前面准备好的三台 FQDN：

这一篇先安装 ZOOKEEPER。它足够轻量，也能验证主机注册、仓库访问、组件安装、服务启动和 Service Check 是否完整跑通。HDFS、YARN、Hive、Ranger 这些服务，后面单独拆文章写会更清楚。

提示

截图里涉及 SSH 私钥的区域已经遮挡。真实操作时需要粘贴核心节点能免密登录目标主机的 PEM 私钥，文章里不展示私钥内容。

如果当前还没有可进入的集群，登录后会进入“准备初始化集群”页面。这里不是异常，而是新环境的正常入口。

页面上可以看到集群记录为 0、主状态为“未初始化”，点击 进入安装向导。

准备初始化集群

我在这里重点看三个点：

检查点	说明
当前版本	页面显示 `Ambari Plus 3.0.1`，说明 Web 资源加载正常
集群记录	新环境应为 `0`，已有集群则不会走这条初始化路径
初始化路径	状态检测完成后，下一步就是创建集群

进入向导后，第一步是选择 Stack 和填写组件仓库 Base URL。本文使用 BIGTOP-3.2.0，仓库地址沿用前面 Nginx 本地文件服务暴露出来的地址：

http://hadoop1.test.com/

填完以后点击 验证连通性。看到“仓库地址可达”“Base URL 校验通过”，再进入下一步。

Stack 仓库地址验证通过

这里我建议不要跳过验证。仓库地址看起来只是一个 URL，但后面所有组件安装都会从这里拿包。这个地方如果填错，后面报错通常会散落在 Agent 安装、组件安装、yum 缓存、RPM 依赖等多个环节里，排查成本会高很多。

第二步填写集群名称、目标主机、SSH 用户、SSH 端口和私钥。

本文示例填写：

笔记

常规内网环境 SSH 端口多为 22。本文示例环境的 SSH 服务监听在 52207，所以向导里填写 52207。这里填的是 Ambari Server 连接目标主机时使用的端口，不是浏览器访问 Web UI 的端口。

主机支持范围写法，hadoop[1-3].test.com 会解析成三台主机。确认页面显示“目标主机：3 台”，并且右下角按钮变成 启动 Bootstrap。

安装选项填写完成

我在实际部署时会先在核心节点命令行做一次免密验证，避免把问题拖到 Web UI：

for h in hadoop1.test.com hadoop2.test.com hadoop3.test.com; do
  ssh -p 52207 -o BatchMode=yes "$h" "hostname -f"
done

1
2
3

如果你的环境使用默认 22 端口，把 -p 52207 换成 -p 22，或者直接省略 -p。

点击 启动 Bootstrap 后，向导会进入确认主机页面。这个阶段会安装和注册 Agent，并把主机接入结果回传到页面。

等到三台主机都显示“已完成接入”，整体进度为 100%，并且失败主机为 0，再继续下一步。

确认主机完成

如果这里卡住，我一般先看三个方向：

现象	优先检查
主机一直进行中	目标主机 SSH 端口、私钥权限、`sudo`/root 权限
主机失败	点击单台主机的日志，看认证失败还是包安装失败
Agent 无法注册	`ambari-agent.ini` 的 Server 地址、主机名解析、时间同步