Метрики OpenTelemetry — это будущая основа для мониторинга, доступная начиная с GitHub Enterprise Server 3.18 и выше. Этот новый стек мониторинга обеспечивает расширенные возможности наблюдения и управления по сравнению с устаревшей системой сбора данных.
Собранные метрики по-прежнему собираются по умолчанию и полностью поддерживаются в этом выпуске.
Предпосылки
- GitHub Enterprise Server 3.18 или более поздней версии
- Административный доступ к Консоль управления
- SSH-доступ к устройству GitHub Enterprise Server
Включение метрик OpenTelemetry
Метрики OpenTelemetry по умолчанию включены для новых установок GitHub Enterprise Server версии 3.19 и новее. Обновления до GitHub Enterprise Server 3.19 по-прежнему collectd будут иметь по умолчанию активные метрики, но вы можете выбрать переключение на метрики OpenTelemetry.
Вопросы, связанные с производительностью
При настройке метрик OpenTelemetry учитывайте следующие факторы производительности:
- Частота сбора: более частый сбор увеличивает нагрузку на систему
- Хранение данных: более длительные сроки хранения требуют большего объема хранилища
- Пользовательские экспортеры: Дополнительные экспортеры могут увеличить использование процессора и памяти
- Пропускная способность сети: доставка внешних метрик влияет на использование сети
Настройка сбора метрик
После включения метрик OpenTelemetry вы можете настроить различные аспекты процесса сбора метрик.
Настройка интервалов сбора данных
По умолчанию интервал сбора метрик составляет 30 секунд. Вы можете настроить это в зависимости от ваших потребностей в мониторинге.
Внимание
Установка более коротких интервалов повышает точность метрик, но также увеличивает требования к хранилищу и нагрузку на систему. Прежде чем настраивать этот параметр, учитывайте системные ресурсы и требования к мониторингу.
Использование Консоль управления для установки интервалов
-
В учетной записи администратора GitHub Enterprise Server, в правом верхнем углу любой страницы щелкните .
-
Если вы еще не на странице "Администратор сайта", в левом верхнем углу щелкните Администратор сайта.
-
На боковой панели " "Администратор сайта" щелкните Консоль управления.
-
В настройках мониторинга в разделе Интервал парсинга метрик введите нужный интервал в секундах (например,
60). -
На боковой панели "Параметры" нажмите кнопку "Сохранить параметры".
Примечание.
Сохранение параметров в Консоль управления перезапускает системные службы, что может привести к простоям, видимым пользователем.
-
Подождите завершения запуска конфигурации.
Использование командной строки для установки интервалов
SSH в устройство GitHub Enterprise Server и выполните следующие команды:
# Set scrape interval to 60 seconds
ghe-config observability.metrics.interval 60
ghe-config-apply
Настройка хранения данных
По умолчанию данные метрик хранятся в течение 30 дней. Вы можете изменить эту настройку с помощью Консоль управления или командной строки.
Использование Консоль управления для настройки хранения
-
В учетной записи администратора GitHub Enterprise Server, в правом верхнем углу любой страницы щелкните .
-
Если вы еще не на странице "Администратор сайта", в левом верхнем углу щелкните Администратор сайта.
-
На боковой панели " "Администратор сайта" щелкните Консоль управления.
-
В настройках мониторинга в разделе Удержание метрик введите желаемый срок хранения в днях (например,
15). -
На боковой панели "Параметры" нажмите кнопку "Сохранить параметры".
Примечание.
Сохранение параметров в Консоль управления перезапускает системные службы, что может привести к простоям, видимым пользователем.
-
Подождите завершения запуска конфигурации.
Использование командной строки для настройки хранения
SSH в устройство GitHub Enterprise Server и выполните следующие команды:
# Set retention to 15 days
ghe-config observability.metrics.retention 15
ghe-config-apply
Настройка уровня детализации для внутренней телеметрии
Сборщик OpenTelemetry создает собственные внутренние данные телеметрии для мониторинга работоспособности и производительности самого сборщика. Вы можете настроить детализацию этой внутренней телеметрии с помощью командной строки.
Доступны следующие уровни телеметрии:
none: Отключает внутреннюю телеметриюbasic: предоставляет важные данные телеметрии (по умолчанию)normal: Предоставляет стандартные данные телеметрииdetailed: предоставляет подробные данные телеметрии для отладки
SSH в устройство GitHub Enterprise Server и выполните следующие команды:
# Set internal telemetry level to normal
ghe-config observability.metrics.internal-otel-telemetry-level normal
ghe-config-apply
Примечание.
Более высокие уровни телеметрии предоставляют более подробную информацию о внутренних операциях сборщика, но также увеличивают использование ресурсов. Этот basic уровень рекомендуется использовать в производственных средах, если вам не требуется устранение неполадок со сборщиком.
Устранение проблем с конфигурацией
Если у вас возникли проблемы с конфигурацией OpenTelemetry, следующие сведения могут помочь вам выявить и устранить распространенные проблемы.
Распространенные проблемы с конфигурацией
- Сбои при запуске службы: проверка системных журналов на наличие сообщений об ошибках
- Ограничения ресурсов: мониторинг системных ресурсов при настройке интервалов сбора данных
Просмотр локальных журналов
SSH в узел, который требуется отладить, и выполните следующие команды:
Просмотр журналов сборщика OpenTelemetry:
sudo journalctl -u otelcol-contrib -f
Посмотреть логи VictoriaMetrics:
sudo journalctl -u victoriametrics -f
Дальнейшие шаги
- Чтобы включить расширенные панели мониторинга, см. Продвинутые дашборды метрик OpenTelemetry
- Изучая метрики OpenTelemetry, см. Использование Grafana для анализа метрик OpenTelemetry.
- Чтобы настроить внешний мониторинг, см. AUTOTITLE.