将节点添加到高可用性配置

注意

向 HA 添加其他计算节点的功能位于公开预览中，并可能会更改。在预览期间，请与客户成功团队共享任何反馈。

对于寻求水平扩展的 GitHub Enterprise Server 用户而言，迁移到并运行群集是一个选项，但该过程资源消耗大且耗时。作为替代方法，我们建议将节点添加到 HA 配置。

本文中可互换使用术语“其他节点”和“无状态节点”。无状态节点只能添加到包含至少一个副本的 HA 部署。

其他节点

在 GitHub Enterprise Server 设备上运行的所有服务中，Unicorn 通常对 CPU 和内存的需求最高，其次是 Aqueduct、Git 和 MySQL。由于 Unicorn 和 Aqueduct 是无状态服务，因此它们非常适合水平缩放，可以在一组单独的节点上运行。其余服务可以继续使用每个数据中心的单个实例运行。

附加节点允许您水平扩展 Web 和任务工作负载。它们还可以将 Unicorn 和 Aqueduct 从主节点迁移走，为剩余的有状态服务释放大量的计算和内存资源。如果由于 Unicorn 实例的 CPU 使用率较高而遇到性能相关的服务中断，建议添加其他节点。在数据中心内可以添加的这些节点的数量没有重大限制。

条件

如果由于 HA 配置中的重载主节点而导致性能下降，应考虑将其他节点添加到 HA 环境。通过在主节点之外水平缩放 Web 角色和作业角色，这些额外的节点可以帮助减少主主机上的负载。

例如，如果你注意到 Unicorn 或 Aqueduct 队列中积压工作，或者遇到其他类型的资源争用，则应考虑此方法。即使没有可见的队列，主节点上的 CPU 耗尽也是另一个明确的信号。在这些情况下，可以添加其他节点并减少每个节点的工作器数，因此主节点处理的总体工作负荷更少。

添加节点

添加到 HA 部署中的每个节点都是运行 GitHub Enterprise Server 软件的虚拟机 (VM)。它应运行与主系统相同的软件。通常，无状态节点不需要与主节点的内存、CPU 或存储规范匹配。但是，无状态节点和主实例都需要子毫秒连接。副本连接要求保持不变。

若要将节点添加到 HA 配置中的主数据中心，请使用 ghe-add-node 命令。该 ghe-add-node 命令将当前设备设置为 HA 部署中的节点，旨在从主数据节点卸载 CPU 密集型任务，从而启用水平缩放。这些节点旨在处理 Web 和作业工作负荷，从而提高工作负荷分发和管理效率。此命令采用以下格式：

Shell

/usr/local/share/enterprise/ghe-add-node PRIMARY_IP [--hostname HOSTNAME]

/usr/local/share/enterprise/ghe-add-node PRIMARY_IP [--hostname HOSTNAME]

PRIMARY_IP：主节点的 IP 地址。
HOSTNAME （可选）：所添加主机的所需主机名。

例如，若要将主机名 ghes-node-1 的节点添加到 HA 主数据中心具有 IP 地址 192.168.1.1 的 HA 主实例，请运行以下命令：

Shell

/usr/local/share/enterprise/ghe-add-node 192.168.1.1 --hostname ghes-node-1

/usr/local/share/enterprise/ghe-add-node 192.168.1.1 --hostname ghes-node-1

然后，在主节点上，必须运行以下命令：

Shell

ghe-config-apply
ghe-cluster-balance rebalance --yes

ghe-config-apply
ghe-cluster-balance rebalance --yes

此命令 ghe-config-apply 是添加无状态节点的要求。

对于公共预览版，我们尚未专门测试停机时间，目前还不清楚是否需要维护时段。

删除其他节点

若要删除节点，请从要删除的节点运行 ghe-remove-node 。然后，您必须在主节点上运行：

Shell

ghe-config-apply

ghe-config-apply

此命令 ghe-config-apply 是删除无状态节点的要求。

对于公共预览版，我们尚未专门测试停机时间，目前还不清楚是否需要维护时段。

重新预配以前托管 GitHub Enterprise Server 的节点

可以将以前托管并运行 GitHub Enterprise Server 的节点用作无状态节点。为此，节点应更新到版本 3.18 或更高版本，并且部署中的所有节点都必须运行相同的版本。请检查在该节点上，/data/user/common/cluster.conf 是否已存在。如果这样做，则需要在无状态节点上运行 ghe-add-node 命令之前执行清理。

例如：

Shell

sudo rm -f /etc/github/cluster /data/user/common/cluster.conf
sudo timeout -k4 10 systemctl stop wireguard 2>/dev/null || sudo ip link delete tun0 || true

sudo rm -f /etc/github/cluster /data/user/common/cluster.conf
sudo timeout -k4 10 systemctl stop wireguard 2>/dev/null || sudo ip link delete tun0 || true