集群管理
集群提供了一种将相关主机分组的方式,以简化管理和批量操作。本指南涵盖集群的创建、管理和常见使用模式。
导航到 主机管理 → 集群 → 创建集群:
- 名称 — 唯一的描述性名称(例如
prod-web-servers) - 描述 — 关于集群用途的可选说明
- 主机选择 — 手动添加主机或通过标签筛选
基于标签的动态分组
Section titled “基于标签的动态分组”您可以使用标签筛选来创建动态分组,而不是手动添加主机:
env:production AND role:web符合筛选条件的主机会自动被包含。当新主机被打上标签时,它们会自动加入集群。
定义集群后,您可以同时对所有主机执行操作:
- 批量脚本执行 — 在所有集群主机上运行任意脚本
- 滚动更新 — 以可配置的并发数和主机间延迟执行脚本
- 健康概览 — 查看整个集群的聚合健康指标
- 批量标签管理 — 对集群中所有主机应用或移除标签
常见集群模式
Section titled “常见集群模式”production → 所有标记为 env:production 的主机staging → 所有标记为 env:staging 的主机development → 所有标记为 env:development 的主机web-servers → role:webdb-servers → role:databaseworkers → role:workercache → role:cacheus-east → region:us-east-1eu-west → region:eu-west-1每个集群都有一个仪表板,显示以下信息:
| 指标 | 描述 |
|---|---|
| 主机总数 | 集群中的主机数量 |
| 在线 | 具有活跃 Agent 连接的主机 |
| 平均 CPU | 集群的平均 CPU 利用率 |
| 平均内存 | 平均内存使用率 |
| 近期任务 | 最近 10 次批量执行 |
- 在整个基础设施中使用一致的标签命名规范
- 生产集群优先使用基于标签的动态分组,而非静态主机列表
- 为集群设置专门的告警阈值
- 在描述字段中记录集群用途
- 定期审查集群成员,移除已退役的主机