Zeppelin 安装0.10.1

# Zeppelin 安装

Zeppelin 是 Web Notebook 类工具，适合做交互式数据分析、SQL 探索、Spark 任务调试和简单的数据协作。前面已经安装了 HDFS、YARN、Spark 和 Livy，这时再装 Zeppelin，解释器环境会更完整，后面调 Spark、Livy、JDBC 都方便。

这套栈里的 Zeppelin 只有一个服务端角色：ZEPPELIN_SERVER。它不需要额外的元数据库，也没有 Slave / Client 组件。

本次角色分配如下：

主机	Zeppelin 角色
`hadoop1.test.com`	`ZEPPELIN_SERVER`
`hadoop2.test.com`	无 Zeppelin 组件
`hadoop3.test.com`	无 Zeppelin 组件

# 1. 选择 Zeppelin 服务

进入 服务与组件，点击 新增服务，在增强组件列表里勾选 Zeppelin。

选择 Zeppelin 服务

页面会显示 Zeppelin 依赖 HDFS、YARN、Spark。我这里已经把这些服务安装并启动，所以可以直接继续。

如果你的环境还没有 Spark，建议先回到 Spark 安装篇把 Spark History Server、Spark ThriftServer 和 Spark Client 装好，再回来安装 Zeppelin。

# 2. 分配 Zeppelin Server

Master 分配页里，Zeppelin 只有一个角色：ZEPPELIN_SERVER。

分配 Zeppelin Server

本次把它放在 hadoop1.test.com：

组件	主机	说明
`ZEPPELIN_SERVER`	`hadoop1.test.com`	提供 Notebook Web 页面和解释器管理能力。

Zeppelin 是 Web 入口型服务，小集群里放在主节点最直观。生产环境如果多人同时使用 Notebook，可以再规划独立节点、反向代理和资源隔离。

# 3. 确认角色分配范围

Zeppelin 在这套栈里没有 Slave 组件，也没有 Client 组件。Slave / Client 页无需额外选择，直接下一步即可。

确认时重点看最终安装清单：只新增 ZEPPELIN，并且 ZEPPELIN_SERVER 指向 hadoop1.test.com。

# 4. 检查 Zeppelin Web 配置

进入自定义配置页后，先确认顶部状态：待填写 0。再进入 zeppelin-site，重点看 Web 端口、SSL、解释器顺序和 Notebook 存储方式。

Zeppelin Web 端口配置

本次默认值如下：

配置项	本次示例值	说明
`zeppelin.server.addr`	`0.0.0.0`	监听所有网卡。
`zeppelin.server.port`	`9995`	Zeppelin HTTP 端口。
`zeppelin.server.ssl.port`	`9996`	Zeppelin HTTPS 端口。
`zeppelin.ssl`	`false`	本篇先使用 HTTP；生产环境建议放到网关或反向代理后面。
`zeppelin.interpreter.group.order`	`spark,angular,jdbc,livy,md,sh`	解释器显示顺序，能看到 `spark` 和 `livy`。

再看 zeppelin-env：

Zeppelin 运行目录配置

这里我会重点确认：

配置项	本次示例值	说明
`Spark Home`	`/usr/lib/spark`	Zeppelin 调用 Spark 解释器时使用。
`HBase Home`	`/usr/lib/hbase`	后续使用 HBase 相关解释器时会用到。
`Zeppelin Log Dir`	`/var/log/zeppelin`	服务日志目录。
`Zeppelin Notebook Dir`	`/user/zeppelin/notebook`	Notebook 存储目录。
`Zeppelin pid dir`	`/var/run/zeppelin`	PID 目录。

第一次安装不建议急着改解释器模板。先让服务启动和页面访问跑通，后面再根据团队习惯配置 Spark、Livy、JDBC、Hive 等解释器。

# 5. 确认安装清单

确认页会列出本次新增的 Zeppelin 服务。

Zeppelin 安装确认页

本次确认结果如下：

检查项	本次结果
新增服务	`ZEPPELIN`
Master 分配	`ZEPPELIN_SERVER -> hadoop1.test.com`
Slave 分配	无
Client 分配	无
配置校验	必填项已填写

确认无误后点击 开始安装。

# 6. 提交 Kerberos 授权并等待启动

开启 Kerberos 的集群中，新增 Zeppelin 会要求提交 KDC 管理员凭据。提交后，安装向导会为 Zeppelin 生成 principal / keytab，并继续安装和启动 ZEPPELIN_SERVER。

这个阶段主要看：

阶段	期望结果
安装软件包	`ZEPPELIN_SERVER` 安装完成。
Kerberos	Zeppelin keytab 生成并分发完成。
启动服务	`Zeppelin Server` 启动完成。

如果启动失败，优先看 /var/log/zeppelin 下的服务日志，以及 Spark、HDFS、YARN 客户端配置是否已经在 Zeppelin 所在主机上准备好。

# 7. 回到服务列表确认状态

回到 服务与组件 页面，Zeppelin 会出现在 接入工作台 分类下。

Zeppelin 服务运行中

页面里可以看到：

组件	状态
`Zeppelin Server`	运行中

服务端也可以确认 9995 端口已经监听：

ss -lntp | grep 9995

正常会看到 9995 处于监听状态，进程名为 java。

# 8. 打开 Zeppelin Web 页面

浏览器访问：

http://hadoop1.test.com:9995/

页面能打开并看到 Zeppelin 的欢迎页和登录入口，就说明 Web 服务已经可访问。

Zeppelin Web 页面

到这里，Zeppelin 的基础安装完成。下一篇可以继续安装 DolphinScheduler，把工作流调度能力接到这套已经跑通的 HDFS、YARN、Spark、Hive 环境上。

#Zeppelin #Spark #Livy #Kerberos #Ambari Plus

← Livy 安装 DolphinScheduler 安装→