Устранение сбоев в мониторинге

Материал из Dynatrace

Прерывание мониторинга — это ситуация, когда большинство установленных агентов OneAgent теряют соединение с сервером Dynatrace, что обычно проявляется в отсутствии видимости с точки зрения доступности и мониторинга производительности.

Однако это не обязательно означает отключение ваших серверов. В случае прерывания мониторинга Dynatrace автоматически подавляет все проблемы, связанные с недоступностью хоста, и предупреждает вас о прерывании мониторинга. Все хосты находятся в состоянии доступности Unmonitored на время отключения мониторинга. Оповещения о прерывании мониторинга имеют специальный фильтр серьезности в ваших профилях оповещений. Уровень серьезности оповещения о недоступности мониторинга позволяет создать фильтр, а затем доставлять эти крайне важные оповещения группам по мониторингу операций.

Прерывания мониторинга могут иметь разные основные причины в зависимости от типа развертывания Dynatrace, которое вы используете. Среды Dynatrace SaaS администрируются командой Dynatrace DevOps, которая публикует все операционные проблемы на dynatrace.status.io. Для сред, работающих в управляемых развертываниях Dynatrace, наиболее вероятно, что прерывание мониторинга вызвано проблемой в вашем собственном центре обработки данных или конфигурации сети.

Ниже приведены подробные сведения о конкретных случаях использования.

Dynatrace SaaS

Мониторинг сбоев в одной среде Dynatrace

Эта ситуация обнаруживается всякий раз, когда отдельная среда Dynatrace SaaS теряет соединение со своими экземплярами OneAgent. Поскольку в том же кластере Dynatrace SaaS никакие другие среды не затронуты, настоятельно рекомендуется проверить следующие проблемы в конфигурации собственной сети:

  • Проверьте, не блокирует ли недавнее изменение в конфигурации вашей сети или брандмауэра исходящий мониторинговый трафик ваших экземпляров OneAgent.
  • Если вы направляете трафик OneAgent через ActiveGate, проверьте рабочее состояние ваших ActiveGate.
  • Наконец, если вы не обнаружите каких-либо проблем с сетью в вашем собственном центре обработки данных, проверьте dynatrace.status.io для общей проблемы в вашем регионе.

Мониторинг сбоев в кластере Dynatrace

Предупреждение отправляется во все затронутые среды мониторинга в кластере Dynatrace SaaS в случае общего прерывания связи с OneAgent. В предупреждающем сообщении говорится, что проблема затрагивает весь кластер Dynatrace и не ограничивается вашей собственной средой. Поскольку кластеры SaaS в разных регионах управляются командой Dynatrace DevOps, вы можете проверить статус вашего собственного региона SaaS на сайте dynatrace.status.io.