Paimon 安装1.0.1

# Paimon 安装

Paimon 是湖仓表格式组件，常见用法是配合 Flink、Spark、Hive Metastore 和 HDFS，承接流批一体写入、增量更新和表管理。前面已经安装了 HDFS、Hive、Flink、Spark、Trino 等组件，这里补上 Paimon Client，后面在计算引擎里接 catalog 时就有基础环境了。

本篇继续使用三台 FQDN 主机：

主机	Paimon 角色
`hadoop1.test.com`	`PAIMON` Client
`hadoop2.test.com`	`PAIMON` Client
`hadoop3.test.com`	`PAIMON` Client

Paimon 在这套安装包里没有常驻 Master / Worker 服务，主要是下发客户端、配置 Hive Metastore 连接、Kerberos principal 和默认 warehouse 路径。所以安装完成后看到服务状态是“已安装”、实例分布是 0/1，这和 HDFS、YARN 这类常驻服务不一样。

提示

Paimon 本身不需要单独创建 MySQL / MariaDB 数据库。它在本文里使用 Hive Metastore 作为 catalog，warehouse 放到 HDFS 的 /warehouse/paimon。

# 1. 选择 Paimon 服务

进入 服务与组件，点击 新增服务，在服务列表中勾选 Paimon。

选择 Paimon 服务

这里能看到 Paimon 版本是 1.0.1，安装状态为“否”。如果 HDFS、Hive、Flink、Spark 这些基础组件已经安装完成，直接勾选 Paimon 进入下一步即可。

# 2. Master 分配页直接下一步

Paimon 没有 Master 组件，所以 Master 分配页会提示“所选服务无 Master 组件，直接下一步”。

Paimon 无 Master 组件

这一步不需要手工选择主机。页面左侧会列出当前集群里已经存在的 Master 角色，主要用于确认当前主机规划是否符合预期。

# 3. 分配 Paimon Client

Slave / Client 分配页也没有 Slave 组件，只有 PAIMON Client。

分配 Paimon Client

本次把 Paimon Client 分发到三台主机：

组件	分配主机	说明
`PAIMON`	`hadoop1.test.com`、`hadoop2.test.com`、`hadoop3.test.com`	下发 Paimon 相关客户端文件和配置，方便后续从任意节点配合 Flink / Spark / Hive 调试。

这里我建议三台都安装。Paimon 后面通常会被不同计算引擎调用，如果只装在一台机器上，排查 Flink、Spark 或命令行作业时容易出现“某台机器缺少客户端文件”的问题。

# 4. 检查 Paimon 配置

进入自定义配置页后，先看 paimon-site。页面会根据集群拓扑预填配置，但 Paimon 这里有几个值一定要人工确认。

检查 Paimon 配置

本篇环境里重点确认下面这些配置：

配置项	本次示例值	说明
`hive.metastore.uris`	`thrift://hadoop2.test.com:9083`	指向当前 Hive Metastore。不要保留模板变量。
`hive.metastore.principal`	`hive/[email protected]`	Kerberos 集群里必须和 Hive 的 Metastore principal 一致。
`paimon.catalog.type`	`hms`	使用 Hive Metastore 作为 Paimon catalog。
`paimon.catalog.warehouse`	`hdfs:///warehouse/paimon`	Paimon 默认 warehouse 目录。
`paimon.security.authentication`	`kerberos`	当前集群已开启 Kerberos。
`paimon.service.principal`	`paimon/[email protected]`	Paimon 服务 principal。
`paimon.web.authentication.kerberos.principal`	`HTTP/[email protected]`	Web / SPNEGO principal。

如果页面里看到 EXAMPLE.COM，要改成当前集群的 realm。本文环境使用 TEST.COM。如果 hive.metastore.uris 仍然显示，也要改成实际 Metastore 地址。

# 5. 确认安装清单

确认页会展示本次新增服务、组件分配和配置校验结果。

Paimon 安装确认页

本次确认结果如下：

检查项	本次结果
新增服务	`PAIMON`
Master 分配	无
Slave 分配	无
Client 分配	`PAIMON -> hadoop1.test.com, hadoop2.test.com, hadoop3.test.com`
配置校验	必填项已填写

确认无误后点击 开始安装。

# 6. 提交 Kerberos 凭据并等待安装

开启 Kerberos 的集群中，新增 Paimon 会要求提交 KDC 管理员凭据。这里填写 KDC 管理员 Principal 和密码，用于生成并分发 Paimon 相关 principal / keytab。

凭据提交后，安装页会进入主机任务视图。Paimon 是客户端组件，主要任务是安装软件包、分发 keytab、刷新 Kerberos Client 和下发配置。

Paimon 安装进度

三台主机执行完成后，页面会显示 PAIMON 安装成功。

Paimon 安装完成

如果安装阶段失败，优先打开失败主机的任务日志。Paimon 常见问题主要集中在 Kerberos 凭据、客户端包安装和配置值不正确。

# 7. 回到服务列表确认 Paimon

返回 服务与组件 页面，可以看到查询数据分类下新增了 PAIMON。

Paimon 服务列表

页面里会显示 3 个 Client 组件，这说明三台主机都已经下发 Paimon Client。Paimon 没有常驻进程，所以这里不会像 Trino Worker、HiveServer2 那样显示运行中的服务进程数。

# 8. 查看实例分布

进入 PAIMON 详情页，打开 实例分布。

Paimon 实例分布

页面里可以看到：

主机	组件	状态说明
`hadoop1.test.com`	`Paimon Client`	客户端已安装
`hadoop2.test.com`	`Paimon Client`	客户端已安装
`hadoop3.test.com`	`Paimon Client`	客户端已安装

这里三台主机都显示 0/1 是正常现象。Paimon Client 不是常驻服务，不会有运行中的进程；只要页面显示配置已同步，且组件出现在三台主机上，就说明客户端分发完成。

# 9. 安装后再看一次关键配置

Paimon 安装完成后，我会再回到 组件配置，确认最终生效的配置。

Paimon 安装后配置

这张图里重点看三件事：

检查项	期望值
Hive Metastore Principal	`hive/[email protected]`
Hive Metastore URIs	`thrift://hadoop2.test.com:9083`
Paimon Warehouse Path	`hdfs:///warehouse/paimon`

如果这里仍然是或 EXAMPLE.COM，建议先改成实际值再继续往后接 Flink / Spark catalog。

# 10. 确认 HDFS warehouse 目录

最后确认一下 warehouse 目录。当前集群开启了 Kerberos，所以先用 HDFS 的 keytab 认证，再检查目录：

kinit -kt /etc/security/keytabs/hdfs.headless.keytab [email protected]
hdfs dfs -ls -d /warehouse/paimon

1
2

期望能看到类似结果：

drwxrwxr-x   - paimon hadoop          0 2026-06-10 09:31 /warehouse/paimon

如果目录不存在，可以创建并授权：

hdfs dfs -mkdir -p /warehouse/paimon
hdfs dfs -chown -R paimon:hadoop /warehouse/paimon
hdfs dfs -chmod 775 /warehouse/paimon

1
2
3

到这里，Paimon Client 已经安装到三台主机，Hive Metastore、Kerberos principal 和 HDFS warehouse 也确认完成。后面再接 Flink / Spark 的 Paimon catalog 时，就不用回头补客户端和基础目录了。

下一篇继续安装 Hudi，把另一个常用湖表组件的客户端环境也补齐。

#Paimon #Hive #Flink #Spark #Kerberos #Ambari Plus

← Trino 安装 Hudi 安装→