跳转到内容

集群管理

集群提供了一种将相关主机分组的方式,以简化管理和批量操作。本指南涵盖集群的创建、管理和常见使用模式。

导航到 主机管理集群创建集群

  1. 名称 — 唯一的描述性名称(例如 prod-web-servers
  2. 描述 — 关于集群用途的可选说明
  3. 主机选择 — 手动添加主机或通过标签筛选

您可以使用标签筛选来创建动态分组,而不是手动添加主机:

env:production AND role:web

符合筛选条件的主机会自动被包含。当新主机被打上标签时,它们会自动加入集群。

定义集群后,您可以同时对所有主机执行操作:

  • 批量脚本执行 — 在所有集群主机上运行任意脚本
  • 滚动更新 — 以可配置的并发数和主机间延迟执行脚本
  • 健康概览 — 查看整个集群的聚合健康指标
  • 批量标签管理 — 对集群中所有主机应用或移除标签
production → 所有标记为 env:production 的主机
staging → 所有标记为 env:staging 的主机
development → 所有标记为 env:development 的主机
web-servers → role:web
db-servers → role:database
workers → role:worker
cache → role:cache
us-east → region:us-east-1
eu-west → region:eu-west-1

每个集群都有一个仪表板,显示以下信息:

指标描述
主机总数集群中的主机数量
在线具有活跃 Agent 连接的主机
平均 CPU集群的平均 CPU 利用率
平均内存平均内存使用率
近期任务最近 10 次批量执行
  • 在整个基础设施中使用一致的标签命名规范
  • 生产集群优先使用基于标签的动态分组,而非静态主机列表
  • 为集群设置专门的告警阈值
  • 在描述字段中记录集群用途
  • 定期审查集群成员,移除已退役的主机