Skip to main content

关于收集的指标

Collectd metrics provide a legacy monitoring solution for GitHub Enterprise Server instances that is supported alongside a public preview of OpenTelemetry metrics.

默认情况下,Collectd指标会被收集,并在此版本中完全受支持。 OpenTelemetry 指标将成为监控的未来基础,并将在 GitHub Enterprise Server 3.18 及更高版本中提供。

注意

收集的指标应为 弃用 ,然后在 已停用 的 GitHub Enterprise Server的未来版本中停用。 我们建议您的长期监控策略包括迁移到 OpenTelemetry 指标。 请参阅“关于 OpenTelemetry 指标”。

关于收集的指标

Collectd 是一个守护程序,它定期收集系统性能统计信息,并采用多种方式存储它们。 对于 GitHub Enterprise Server,collectd 会从各种系统组件和服务中收集指标,从而深入了解系统的运行状况和性能。

关键组件

收集的监视堆栈包含以下组件:

  •         **Collectd**:收集系统性能统计信息的主要守护程序
    
  •         **Graphite**:用作仪表板可视化效果的数据源
    

指标收集

收集的指标来自各种源,包括:

  •         **系统指标**:CPU 使用率、内存利用率、磁盘 I/O、网络统计信息
    
  •         **应用程序指标**:HAProxy 统计信息、Resque 队列指标、数据库性能
    
  •         **自定义指标**:通过自定义插件和脚本实现特定于服务的指标
    

Architecture

单一设备

在单个设备部署中,collectd 在本地运行,并将指标存储在 RRD(循环数据库)文件中。 管理控制台 读取这些文件以显示监视仪表板。

群集环境

在群集环境中,collectd 进行分布式运行。

  •         **指标服务器**:从所有群集节点收集和存储指标的指定节点
    
  •         **指标客户端**:将指标转发到指标服务器的其他所有节点
    
  •         **冗余**:度量指标在多个指标服务器之间进行冗余复制,以支持故障转移
    

配置收集的指标

默认情况下,收集的指标在 GitHub Enterprise Server 实例上启用。

使用 collectd 进行外部监控

你可以设置外部监视系统,从 GitHub Enterprise Server 实例收集和分析收集的指标。 这可实现与现有监视基础结构的集成,并提供其他可视化和警报功能。

有关设置外部监视的详细信息,请参阅 使用collectd设置外部监控

收集的指标参考

GitHub Enterprise Server 通过 collectd 收集各种指标,包括系统资源、应用程序性能和服务运行状况。 了解这些指标对于有效监视和故障排除至关重要。

有关可用指标的综合列表,请参阅 GitHub Enterprise Server 的 collectd 指标

迁移注意事项

在 GitHub Enterprise Server 向 OpenTelemetry 指标过渡期间,请考虑以下事项:

  •         **共存**:收集的指标和 OpenTelemetry 指标都可以在过渡期间同时运行
    
  •         **功能一致性**:OpenTelemetry 指标提供等效和增强的监视功能
    
  •         **规划**:开始评估监视工作流的 OpenTelemetry 指标
    
  •         **时间线**:规划最终 弃用 ,然后在将来版本中规划收集的指标的 已停用
    

后续步骤