ITOM — узнайте о проблеме раньше пользователей

Проактивный мониторинг серверов, сетевого оборудования и SSL-сертификатов. Двухуровневые триггеры, SNMP с AI-конструктором шаблонов, автоматическое создание инцидентов и уведомления в Telegram и Email.

Модуль ITOM платформы INFRAX обеспечивает централизованный мониторинг всей ИТ-инфраструктуры: серверов (CPU, RAM, диски, сеть), сетевого оборудования по SNMP (v1/v2c/v3), SSL-сертификатов и доступности узлов. Агенты устанавливаются автоматически на Linux (SSH) и Windows (WinRM), а двухуровневые триггеры (Warning/Critical) создают инциденты до того, как сбой затронет пользователей.

Что умеет ITOM

Мониторинг серверов

CPU (общая и по ядрам), RAM, диски, сетевые интерфейсы (in/out, скорость). Интерактивные графики временных рядов с масштабированием и выбором периодов. Автоматическое создание тикетов при превышении порогов.

SNMP-мониторинг оборудования

Поддержка SNMPv1, v2c, v3 со всеми уровнями безопасности. Встроенный OID Browser, загрузка MIB-файлов, SNMP Walk и Bulk Walk. Автообнаружение SNMP-устройств с определением модели, серийного номера, версии ПО, fingerprinting ОС и обнаружением сетевых интерфейсов. Периодическое сканирование по расписанию для актуализации данных.

AI-генерация SNMP-шаблонов

ИИ-помощник создаёт шаблоны мониторинга по SNMP-данным конкретного устройства. Конструктор поддерживает формулы с логическими, побитовыми и тернарными операторами. Импорт шаблонов Zabbix, dry-run с кэшированием результатов, compact-формат SNMP snapshot. Тестовый сбор метрик до применения, история версий с откатом. Массовое назначение на похожие узлы с учётом прав доступа.

Двухуровневые триггеры

Warning и Critical для каждой метрики — реагируйте на проблемы до наступления критической ситуации. Триггеры автоматически создают инциденты с соответствующим приоритетом. Журнал срабатываний с длительностью и статистикой.

Ping и SSL-мониторинг

Периодическая проверка доступности узлов с измерением RTT и потерь пакетов. Мониторинг SSL-сертификатов: срок действия, валидность, автоматические тикеты за N дней до истечения.

Агенты и автообнаружение

Автоматическая установка агентов на Windows (WinRM) и Linux (SSH). Ручная установка с генерацией готовых инструкций, если автоматическая недоступна. Просмотр логов агента прямо из интерфейса, групповое обновление до новой версии, диагностика подключения и проверка работоспособности. Автообнаружение SNMP-устройств с определением вендора и модели оборудования.

Иерархическое наследование учётных данных

Учётные данные устанавливаются на уровне папки и автоматически наследуются всеми вложенными узлами. Переопределение на уровне отдельного узла при необходимости. Механизм Best Credential автоматически подбирает наиболее подходящие учётные данные и проверяет их работоспособность.

Запланированные перезагрузки

Планирование перезагрузки узлов с указанием даты и времени. Выбор типа перезагрузки: graceful (мягкая) или forced (принудительная). Просмотр расписания, отмена запланированных перезагрузок и полная история выполненных операций.

Импорт узлов из CSV

Массовый импорт узлов из CSV-файла для быстрой миграции и первоначального наполнения системы. Автоматическая привязка к проектам и папкам. Добавление через мастер сетевой настройки для ускорения развёртывания мониторинга на новой инфраструктуре.

Почему это важно

Проблема найдена до того, как пользователи заметили. Двухуровневые триггеры предупреждают на стадии Warning. Автоматический инцидент с уведомлением в Telegram и Email сокращает время реакции до минут.
SNMP-мониторинг без ручного подбора OID. AI-конструктор создаёт шаблон по данным устройства. Тестируйте до внедрения, храните историю версий, применяйте массово на группу похожих узлов.
Интеграция с CMDB и Helpdesk из коробки. Мониторинг-инциденты связываются с бизнес-сервисами в CMDB. Автоматическое создание и закрытие тикетов при нормализации. Единая картина: от серверной метрики до затронутого бизнес-процесса.
WebSocket-обновления в реальном времени. Данные мониторинга, статусы узлов и списки инцидентов обновляются мгновенно без перезагрузки страницы. Оперативная реакция на изменения без ручного обновления интерфейса.

Дашборды и визуализация

Общий дашборд мониторинга показывает сводку по состоянию узлов, количество активных инцидентов и критические события. Графики временных рядов с интерактивными чартами, выбором периодов и масштабированием. Мониторинг по категориям: CPU, RAM, Disk, Network, SSL. Оптимизация отображения с прореживанием точек для больших объёмов данных.

Журнал триггеров и анализ инцидентов

Все срабатывания правил записываются в журнал с временем срабатывания и восстановления. Связь со сгенерированными тикетами. Анализ длительности инцидентов, частоты срабатываний и статистика по узлам. Системные услуги инцидентов: Ping, CPU, RAM, Disk, Agent, SSL, Script, Backup, SNMP Warning, SNMP Critical — каждый тип автоматически получает соответствующую услугу при создании тикета.

Типовые сценарии

Проактивное предотвращение сбоя

Диск сервера заполняется до 90% — ITOM создаёт тикет с приоритетом Warning. Администратор очищает место до того, как пользователи заметили проблему. При нормализации тикет закрывается автоматически.

SNMP-мониторинг за 15 минут

Новый коммутатор в сети. AI-конструктор генерирует SNMP-шаблон по данным устройства, тестовый сбор подтверждает корректность. Шаблон применяется массово на все похожие узлы с учётом прав доступа.

Контроль SSL-сертификатов

ITOM проверяет сроки действия SSL-сертификатов и создаёт тикет за N дней до истечения. Администратор обновляет сертификат по плану, а не в авральном режиме после отказа HTTPS.

Мониторинг бизнес-сервисов

Бизнес-сервис связан с 6 серверами. При инциденте на одном из них статус сервиса автоматически меняется на Unhealthy. Руководство видит влияние на бизнес-процесс, а не абстрактный список серверов.

Расследование инцидента

История метрик и журнал триггеров позволяют восстановить хронологию: когда началась деградация, как развивался инцидент, какие узлы были затронуты. Корреляция событий выявляет скрытые зависимости.

Массовое развёртывание агентов

Автоматическая установка агентов на группу серверов: Linux через SSH, Windows через WinRM. Групповое обновление до новой версии. Мониторинг начинает работать сразу после установки без ручной настройки.