Устранение сбоев в мониторинге: различия между версиями

Материал из Dynatrace
 
Строка 1: Строка 1:
Прерывание мониторинга — это ситуация, когда большинство установленных агентов ЕдиногоАгента теряют соединение с сервером Ключ-Астром, что обычно проявляется в отсутствии видимости с точки зрения доступности и мониторинга производительности.
Прерывание мониторинга — это ситуация, когда большинство установленных агентов OneAgent теряют соединение с сервером Dynatrace, что обычно проявляется в отсутствии видимости с точки зрения доступности и мониторинга производительности.


Однако это не обязательно означает отключение ваших серверов. В случае прерывания мониторинга Ключ-Астром автоматически подавляет все проблемы, связанные с '''недоступностью хоста''', и предупреждает вас о прерывании мониторинга. Все хосты находятся в состоянии доступности '''Unmonitored''' на время отключения мониторинга. Оповещения о прерывании мониторинга имеют специальный фильтр серьезности в ваших профилях оповещений. Уровень серьезности <code>оповещения о недоступности мониторинга</code> позволяет создать фильтр, а затем доставлять эти крайне важные оповещения группам по мониторингу операций.
Однако это не обязательно означает отключение ваших серверов. В случае прерывания мониторинга Dynatrace автоматически подавляет все проблемы, связанные с '''недоступностью хоста''', и предупреждает вас о прерывании мониторинга. Все хосты находятся в состоянии доступности '''Unmonitored''' на время отключения мониторинга. Оповещения о прерывании мониторинга имеют специальный фильтр серьезности в ваших профилях оповещений. Уровень серьезности <code>оповещения о недоступности мониторинга</code> позволяет создать фильтр, а затем доставлять эти крайне важные оповещения группам по мониторингу операций.


Прерывания мониторинга могут иметь разные основные причины в зависимости от типа развертывания Ключ-Астром, которое вы используете. Среды Ключ-Астром SaaS администрируются командой Ключ-Астром DevOps, которая публикует все операционные проблемы на dynatrace.status.io. Для сред, работающих в управляемых развертываниях Ключ-Астром, наиболее вероятно, что прерывание мониторинга вызвано проблемой в вашем собственном центре обработки данных или конфигурации сети.
Прерывания мониторинга могут иметь разные основные причины в зависимости от типа развертывания Dynatrace, которое вы используете. Среды Dynatrace SaaS администрируются командой Dynatrace DevOps, которая публикует все операционные проблемы на dynatrace.status.io. Для сред, работающих в управляемых развертываниях Dynatrace, наиболее вероятно, что прерывание мониторинга вызвано проблемой в вашем собственном центре обработки данных или конфигурации сети.


Ниже приведены подробные сведения о конкретных случаях использования.
Ниже приведены подробные сведения о конкретных случаях использования.


== Ключ-Астром SaaS ==
== Dynatrace SaaS ==


=== Мониторинг сбоев в одной среде Ключ-Астром ===
=== Мониторинг сбоев в одной среде Dynatrace ===
Эта ситуация обнаруживается всякий раз, когда отдельная среда Ключ-Астром SaaS теряет соединение со своими экземплярами ЕдиногоАгента. Поскольку в том же кластере Ключ-Астром SaaS никакие другие среды не затронуты, настоятельно рекомендуется проверить следующие проблемы в конфигурации собственной сети:
Эта ситуация обнаруживается всякий раз, когда отдельная среда Dynatrace SaaS теряет соединение со своими экземплярами OneAgent. Поскольку в том же кластере Dynatrace SaaS никакие другие среды не затронуты, настоятельно рекомендуется проверить следующие проблемы в конфигурации собственной сети:


* Проверьте, не блокирует ли недавнее изменение в конфигурации вашей сети или брандмауэра исходящий мониторинговый трафик ваших экземпляров ЕдиногоАгента.
* Проверьте, не блокирует ли недавнее изменение в конфигурации вашей сети или брандмауэра исходящий мониторинговый трафик ваших экземпляров OneAgent.
* Если вы направляете трафик ЕдиногоАгента через АктивныйШлюз, проверьте рабочее состояние ваших АктивныхШлюзов.
* Если вы направляете трафик OneAgent через ActiveGate, проверьте рабочее состояние ваших ActiveGate.
* Наконец, если вы не обнаружите каких-либо проблем с сетью в вашем собственном центре обработки данных, проверьте dynatrace.status.io для общей проблемы в вашем регионе.
* Наконец, если вы не обнаружите каких-либо проблем с сетью в вашем собственном центре обработки данных, проверьте dynatrace.status.io для общей проблемы в вашем регионе.


=== Мониторинг сбоев в кластере Ключ-Астром ===
=== Мониторинг сбоев в кластере Dynatrace ===
Предупреждение отправляется во все затронутые среды мониторинга в кластере Ключ-Астром SaaS в случае общего прерывания связи с ЕдинымАгентом. В предупреждающем сообщении говорится, что проблема затрагивает весь кластер Ключ-Астром и не ограничивается вашей собственной средой. Поскольку кластеры SaaS в разных регионах управляются командой Ключ-Астром DevOps, вы можете проверить статус вашего собственного региона SaaS на сайте dynatrace.status.io.
Предупреждение отправляется во все затронутые среды мониторинга в кластере Dynatrace SaaS в случае общего прерывания связи с OneAgent. В предупреждающем сообщении говорится, что проблема затрагивает весь кластер Dynatrace и не ограничивается вашей собственной средой. Поскольку кластеры SaaS в разных регионах управляются командой Dynatrace DevOps, вы можете проверить статус вашего собственного региона SaaS на сайте dynatrace.status.io.

Текущая версия на 12:11, 22 января 2023

Прерывание мониторинга — это ситуация, когда большинство установленных агентов OneAgent теряют соединение с сервером Dynatrace, что обычно проявляется в отсутствии видимости с точки зрения доступности и мониторинга производительности.

Однако это не обязательно означает отключение ваших серверов. В случае прерывания мониторинга Dynatrace автоматически подавляет все проблемы, связанные с недоступностью хоста, и предупреждает вас о прерывании мониторинга. Все хосты находятся в состоянии доступности Unmonitored на время отключения мониторинга. Оповещения о прерывании мониторинга имеют специальный фильтр серьезности в ваших профилях оповещений. Уровень серьезности оповещения о недоступности мониторинга позволяет создать фильтр, а затем доставлять эти крайне важные оповещения группам по мониторингу операций.

Прерывания мониторинга могут иметь разные основные причины в зависимости от типа развертывания Dynatrace, которое вы используете. Среды Dynatrace SaaS администрируются командой Dynatrace DevOps, которая публикует все операционные проблемы на dynatrace.status.io. Для сред, работающих в управляемых развертываниях Dynatrace, наиболее вероятно, что прерывание мониторинга вызвано проблемой в вашем собственном центре обработки данных или конфигурации сети.

Ниже приведены подробные сведения о конкретных случаях использования.

Dynatrace SaaS

Мониторинг сбоев в одной среде Dynatrace

Эта ситуация обнаруживается всякий раз, когда отдельная среда Dynatrace SaaS теряет соединение со своими экземплярами OneAgent. Поскольку в том же кластере Dynatrace SaaS никакие другие среды не затронуты, настоятельно рекомендуется проверить следующие проблемы в конфигурации собственной сети:

  • Проверьте, не блокирует ли недавнее изменение в конфигурации вашей сети или брандмауэра исходящий мониторинговый трафик ваших экземпляров OneAgent.
  • Если вы направляете трафик OneAgent через ActiveGate, проверьте рабочее состояние ваших ActiveGate.
  • Наконец, если вы не обнаружите каких-либо проблем с сетью в вашем собственном центре обработки данных, проверьте dynatrace.status.io для общей проблемы в вашем регионе.

Мониторинг сбоев в кластере Dynatrace

Предупреждение отправляется во все затронутые среды мониторинга в кластере Dynatrace SaaS в случае общего прерывания связи с OneAgent. В предупреждающем сообщении говорится, что проблема затрагивает весь кластер Dynatrace и не ограничивается вашей собственной средой. Поскольку кластеры SaaS в разных регионах управляются командой Dynatrace DevOps, вы можете проверить статус вашего собственного региона SaaS на сайте dynatrace.status.io.