Проактивный мониторинг серверов, сетевого оборудования и SSL-сертификатов. Двухуровневые триггеры, SNMP с AI-конструктором шаблонов, автоматическое создание инцидентов и уведомления в Telegram и Email.
Модуль ITOM платформы INFRAX обеспечивает централизованный мониторинг всей ИТ-инфраструктуры: серверов (CPU, RAM, диски, сеть), сетевого оборудования по SNMP (v1/v2c/v3), SSL-сертификатов и доступности узлов. Агенты устанавливаются автоматически на Linux (SSH) и Windows (WinRM), а двухуровневые триггеры (Warning/Critical) создают инциденты до того, как сбой затронет пользователей.
CPU (общая и по ядрам), RAM, диски, сетевые интерфейсы (in/out, скорость). Интерактивные графики временных рядов с масштабированием и выбором периодов. Автоматическое создание тикетов при превышении порогов.
Поддержка SNMPv1, v2c, v3 со всеми уровнями безопасности. Встроенный OID Browser, загрузка MIB-файлов, SNMP Walk и Bulk Walk. Автообнаружение SNMP-устройств с определением модели, серийного номера, версии ПО, fingerprinting ОС и обнаружением сетевых интерфейсов. Периодическое сканирование по расписанию для актуализации данных.
ИИ-помощник создаёт шаблоны мониторинга по SNMP-данным конкретного устройства. Конструктор поддерживает формулы с логическими, побитовыми и тернарными операторами. Импорт шаблонов Zabbix, dry-run с кэшированием результатов, compact-формат SNMP snapshot. Тестовый сбор метрик до применения, история версий с откатом. Массовое назначение на похожие узлы с учётом прав доступа.
Warning и Critical для каждой метрики — реагируйте на проблемы до наступления критической ситуации. Триггеры автоматически создают инциденты с соответствующим приоритетом. Журнал срабатываний с длительностью и статистикой.
Периодическая проверка доступности узлов с измерением RTT и потерь пакетов. Мониторинг SSL-сертификатов: срок действия, валидность, автоматические тикеты за N дней до истечения.
Автоматическая установка агентов на Windows (WinRM) и Linux (SSH). Ручная установка с генерацией готовых инструкций, если автоматическая недоступна. Просмотр логов агента прямо из интерфейса, групповое обновление до новой версии, диагностика подключения и проверка работоспособности. Автообнаружение SNMP-устройств с определением вендора и модели оборудования.
Учётные данные устанавливаются на уровне папки и автоматически наследуются всеми вложенными узлами. Переопределение на уровне отдельного узла при необходимости. Механизм Best Credential автоматически подбирает наиболее подходящие учётные данные и проверяет их работоспособность.
Планирование перезагрузки узлов с указанием даты и времени. Выбор типа перезагрузки: graceful (мягкая) или forced (принудительная). Просмотр расписания, отмена запланированных перезагрузок и полная история выполненных операций.
Массовый импорт узлов из CSV-файла для быстрой миграции и первоначального наполнения системы. Автоматическая привязка к проектам и папкам. Добавление через мастер сетевой настройки для ускорения развёртывания мониторинга на новой инфраструктуре.
Общий дашборд мониторинга показывает сводку по состоянию узлов, количество активных инцидентов и критические события. Графики временных рядов с интерактивными чартами, выбором периодов и масштабированием. Мониторинг по категориям: CPU, RAM, Disk, Network, SSL. Оптимизация отображения с прореживанием точек для больших объёмов данных.
Все срабатывания правил записываются в журнал с временем срабатывания и восстановления. Связь со сгенерированными тикетами. Анализ длительности инцидентов, частоты срабатываний и статистика по узлам. Системные услуги инцидентов: Ping, CPU, RAM, Disk, Agent, SSL, Script, Backup, SNMP Warning, SNMP Critical — каждый тип автоматически получает соответствующую услугу при создании тикета.
Диск сервера заполняется до 90% — ITOM создаёт тикет с приоритетом Warning. Администратор очищает место до того, как пользователи заметили проблему. При нормализации тикет закрывается автоматически.
Новый коммутатор в сети. AI-конструктор генерирует SNMP-шаблон по данным устройства, тестовый сбор подтверждает корректность. Шаблон применяется массово на все похожие узлы с учётом прав доступа.
ITOM проверяет сроки действия SSL-сертификатов и создаёт тикет за N дней до истечения. Администратор обновляет сертификат по плану, а не в авральном режиме после отказа HTTPS.
Бизнес-сервис связан с 6 серверами. При инциденте на одном из них статус сервиса автоматически меняется на Unhealthy. Руководство видит влияние на бизнес-процесс, а не абстрактный список серверов.
История метрик и журнал триггеров позволяют восстановить хронологию: когда началась деградация, как развивался инцидент, какие узлы были затронуты. Корреляция событий выявляет скрытые зависимости.
Автоматическая установка агентов на группу серверов: Linux через SSH, Windows через WinRM. Групповое обновление до новой версии. Мониторинг начинает работать сразу после установки без ручной настройки.