Перейти к содержанию

Monitor service

Статус: не в релизе

Monitor service описывает ближайший сервис наблюдаемости. В текущем релизе 3.0 есть диагностика и админские состояния, но отдельный monitor service не заявляется как готовая поставочная функция.

CAN-сервис VideoGrace

Monitor service — отдельный CAN-сервис для наблюдаемости. Его задача — регулярно собирать состояние клиентов, RTC-ноды и сервисов, строить агрегаты, отдавать online dashboard и формировать отчеты без нагрузки на основной сервер.

Что мониторит

  • состояние RTC/WSM-сессий;
  • RTP counters, errors, dropped/send failures;
  • состояние клиентов: активная конференция, transport mode, media devices, видимость страницы;
  • состояние сервисов: heartbeat age, active endpoints, job failures;
  • события переключения RTC -> WSM и WSM -> RTC;
  • push delivery status и ошибки отправки;
  • деградации: no media progress, рост fallback-rate, потеря RTC routes.

Почему это отдельный сервис

Основной сервер должен обслуживать пользователей и конференции. Мониторинг может быть тяжелее и чаще опрашивать клиентов/сервисы, хранить time-series, строить отчеты и отдавать dashboard. Поэтому его лучше держать отдельным сервисом: он расширяет наблюдаемость, но не увеличивает риск для боевого control plane.

Результат для эксплуатации

Администратор видит не просто “сервер online”, а реальную картину:

  • сколько клиентов в WebRTC и WSM;
  • какие RTC-ноды нагружены;
  • где растет packet loss или dropped RTP;
  • какие клиенты деградировали;
  • сколько переключений произошло за период;
  • какие сервисы не отвечают или дают ошибки.

Связанные разделы