关于 Collectd 指标

Collectd 指标为 GitHub Enterprise Server 实例提供传统监控解决方案，与 OpenTelemetry 指标的公开预览一起受支持。

在本文中

默认情况下，Collectd指标会被收集，并在此版本中完全受支持。 OpenTelemetry 指标将成为监控的未来基础，并将在 GitHub Enterprise Server 3.18 及更高版本中提供。

注意

收集的指标应为关闭，然后在退休的 GitHub Enterprise Server的未来版本中停用。我们建议您的长期监控策略包括迁移到 OpenTelemetry 指标。请参阅“关于 OpenTelemetry 指标”。

关于 collectd 指标

Collectd 是一个守护程序，它定期收集系统性能统计信息，并采用多种方式存储它们。对于 GitHub Enterprise Server，collectd 从各种系统组件和服务收集指标，提供系统运行状况和性能的见解。

关键组件

收集的监视堆栈包含以下组件：

Collectd：收集系统性能统计信息的主要守护程序
Graphite：用作仪表板可视化效果的数据源

指标收集

Collectd 从各种来源收集指标，包括：

系统指标：CPU 使用率、内存利用率、磁盘 I/O、网络统计信息
应用程序指标：HAProxy 统计信息、Resque 队列指标、数据库性能
自定义指标：通过自定义插件和脚本实现特定于服务的指标

Architecture

单一设备

在单个设备部署中，collectd 在本地运行，并将指标存储在 RRD（循环数据库）文件中。管理控制台读取这些文件以显示监控仪表板。

群集环境

在群集环境中，collectd 进行分布式运行。

指标服务器：从所有群集节点收集和存储指标的指定节点
指标客户端：将指标转发到指标服务器的其他所有节点
冗余：度量指标在多个指标服务器之间进行冗余复制，以支持故障转移

配置收集的指标

Collectd 指标在 GitHub Enterprise Server 实例上默认启用。

使用 collectd 进行外部监控

你可以设置外部监控系统从你的 GitHub Enterprise Server 实例收集和分析 collectd 指标。这可实现与现有监视基础结构的集成，并提供其他可视化和警报功能。

有关设置外部监视的详细信息，请参阅使用collectd设置外部监控。

Collectd 指标参考

GitHub Enterprise Server 通过 collectd 收集各种指标，涵盖系统资源、应用程序性能和服务运行状况。了解这些指标对于有效监视和故障排除至关重要。

有关可用指标的综合列表，请参阅 GitHub Enterprise Server 的 collectd 指标。

迁移注意事项

随着 GitHub Enterprise Server 过渡到 OpenTelemetry 指标，请考虑以下事项：

共存：收集的指标和 OpenTelemetry 指标都可以在过渡期间同时运行
功能一致性：OpenTelemetry 指标提供等效和增强的监视功能
规划：开始评估监视工作流的 OpenTelemetry 指标
时间线：计划未来版本中 collectd 指标最终关闭然后退休

后续步骤

若要设置外部监视，请参阅使用collectd设置外部监控。
若要了解可用的指标，请参阅 GitHub Enterprise Server 的 collectd 指标。