Skip to main content

Enterprise Server 3.20 目前作为发布候选版本提供。

关于监控 仪表板

查看历史数据,了解 CPU 和存储使用情况、应用程序和身份验证响应时间以及一般系统运行状况等详细信息。

访问监控 仪表板

  1. 在 GitHub Enterprise Server 上的管理帐户中,在任一页面的右上角,单击“”。

  2. 如果你尚未在“站点管理员”页上,请在左上角单击“站点管理员”。1. 在“ 站点管理”边栏中,单击“管理控制台”****。

  3. 在顶部导航栏中,单击“监控”。

    管理控制台 标头的屏幕截图。 标有“监视”的选项卡以橙色边框突出显示。

  4. 在 HA 和集群环境中,可以使用下拉菜单并单击不同的主机名来在节点之间切换。

使用监控仪表板

仪表板直观显示可用于排查性能问题的指标,并更好地了解 GitHub Enterprise Server 设备的使用方式。 图形背后的数据由监视服务收集并定期采样。

在预构建的仪表板中,可以找到对不同类型的系统资源的图表进行分组的各个部分。 使用页面上的链接在仪表板之间导航。

管理控制台 标头的屏幕截图。 右上角提供的仪表板导航链接以橙色突出显示。

如果已启用 OpenTelemetry 的指标,则可以使用其他仪表板,请参阅: OpenTelemetry 高级指标仪表板

“运营健康”仪表板

这是“Monitor”页面上显示的默认仪表板。 它直观显示关键指标,这些指标可帮助你快速了解 GitHub Enterprise Server 设备的运行状况。

“System & Application Insights”仪表板

在这个更详细的仪表板上,你可以进一步深入了解在设备上运行的服务的各个方面。

创建新仪表板

从 GitHub Enterprise Server 3.18 开始,你可以直接在 管理控制台 内创建自定义 Grafana 仪表板和警报。 这些自定义仪表板和警报在升级期间保持不变,使维护监视配置更加轻松。

重要

可以打开和编辑预生成的仪表板进行检查,但无法保存更改。 创建仪表板的副本以应用并保留任何自定义项。

你可以同时使用 OpenTelemetry 和 collectd 指标进行外部监控。 在 公共预览版 期间,collectd 保持启用且无法禁用。

有关 OpenTelemetry 指标的详细信息,请参阅 关于 OpenTelemetry 指标

有关收集的指标的详细信息,请参阅 关于 Collectd 指标

关于监控仪表板上的指标

监控仪表板提供各种指标的综合视图,帮助你了解 GitHub Enterprise Server 实例的性能和运行状况。 这些指标分为不同的部分,以便更轻松地分析系统的特定方面。

系统健康状态

系统运行状况图表概述了服务和系统资源利用率。 CPU、内存和负载平均图表对于识别发生预配资源饱和的趋势或时间非常有用。 有关详细信息,请参阅“建议的警报阈值”。

应用程序运行状况

这些图包括支持 GitHub Enterprise Server 的服务的资源利用率的关键指标。 它们有助于在处理请求时可视化正在发生的问题。

  • Nomad 作业:各个服务的 CPU 和内存使用情况****。 GitHub Enterprise Server 在内部使用 Nomad 作为工作负载编排器。
  •         **响应代码:**GitHub Enterprise Server 服务返回的按状态代码分类的响应数量。
    
  • 响应时间:以毫秒为单位的第 90 百分位的 Web 请求速度。****
  •         **活动工作线程:** 每个 GitHub Enterprise Server 应用程序中忙碌的 Web 工作线程数量。
    
  • 排队请求:每个 GitHub Enterprise Server 应用程序中处于排队状态的 Web 请求数量。**** 当没有请求排队时,此面板显示“无数据”是正常的。
  • ElasticSearch 群集运行状况:基于 ElasticSearch 群集的主分片和副本分片的状态的该集群的运行状况****。 此群集支持 GitHub Enterprise Server 搜索。

进程

流程图表部分深入探讨了构成 GitHub Enterprise Server 设备的主要单个服务。 单独查看这些服务可以显示使用趋势如何随时间影响系统资源。

身份验证

身份验证图表分解了用户和应用程序向 GitHub Enterprise Server 设备进行身份验证的速率。 我们还跟踪用于身份验证的协议或服务类型(如 Git 或 API),这有助于识别广泛的用户活动趋势。 身份验证图可以帮助在深入了解身份验证和 API 请求日志时找到感兴趣的趋势或时间范围。

LDAP

只有在 GitHub Enterprise Server 设备上启用了 LDAP 身份验证时,LDAP 图表才会显示数据。 有关详细信息,请参阅“使用 LDAP”。 这些图表可帮助识别 LDAP 服务器的慢速响应以及基于 LDAP 密码的身份验证总量。

应用服务器

应用程序服务器部分提供了有关 GitHub Enterprise Server 服务的活动的见解,这些服务为用户和集成提供数据。

应用请求/响应

应用请求/响应”部分查看请求速率、这些请求的响应速度以及返回的状态。

操作

这些图表细分了 你的 GitHub Enterprise Server 实例 上有关 GitHub Actions 的不同指标,包括 GitHub Actions 服务 Web 请求的概述 以及 MSSQL 数据库事务日志大小。

后台作业

GitHub Enterprise Server 设备上排队等待后台处理的任务数。

Git 维护

监视 Git 维护故障可帮助拥有大型活动存储库的客户主动管理存储库运行状况。 偶尔会出现“spurious failures”和“retries”,但如果存储库一直显示标记为“failed”的 Git 维护,我们建议联系 GitHub 支持

网络

网络接口图表可用于分析用户活动以及传入和传出 GitHub Enterprise Server 设备的流量吞吐量。

存储

GitHub Enterprise Server 存储库性能非常依赖于基础存储系统。 低延迟,本地 SSD 磁盘提供最高性能。 有关 GitHub Enterprise 存储体系结构的详细信息,请参阅 系统概览

特定于设备的系统服务

系统服务图表包含与 GitHub Enterprise Server 上的主要数据库相关的数据。 这些是 MySQL 和 Elasticseach 持久性数据库以及包含临时数据的 Redis 和 Memcached。

  • Memcached:为 Web 和 API 操作提供内存中缓存层。 Memcached 有助于为用户和与系统交互的集成提供更快的响应时间。
  • MySQL:GitHub Enterprise Server 中的主数据库。 用户、问题和其他非 git 或搜索相关的元数据存储在 MySQL 中。
  • Nomad Jobs:GitHub Enterprise Server 在内部利用 Nomad 作为工作负载业务流程协调程序,其中可以看到各个服务的 CPU 和内存使用情况。
  • Redis:数据库主要包含后台作业队列以及会话状态信息。
  • Kafka-Lite:用于作业处理的 Kafka 中转站服务。
  • Elasticsearch:为 GitHub Enterprise Server 中的内置搜索功能提供支持。
  • 自定义挂钩:与预接收挂钩执行相关的图表。
  • Git 获取缓存:当多个相同的请求快速连续到达时,GitHub Enterprise Server 会尝试缓存资源密集型操作(如 Git pack-objects)。
  • MinIO:部分 GitHub Enterprise Server 服务使用的存储。
  • 包:为 GitHub Packages 提供支持的请求。
  • SecretScanning:为 Secret scanning 功能提供支持的服务。
  • 代码扫描:为 Code scanning 功能提供支持的服务。
  • 群集:与 GitHub Enterprise Server 高可用性或集群相关的图表。
  • Babeld:Git 代理。
  • 实时更新:为实时更新提供支持的服务。
  • Ghes-manage:为 GHES 管理 API 提供支持的服务。