Мониторинг системы#

Системные метрики Angie ADC позволяют отслеживать состояние системы на разных уровнях:

  • на уровне ОС (процессор, память, сеть);

  • на уровне оборудования (только для аппаратного балансировщика Angie ADC: показания датчиков напряжения, температуры и пр.);

  • на уровне хранения (информация о накопителях и их диагностика).

Примечание

На каждом узле Angie ADC отображаются только метрики этого узла.

Чтобы просмотреть информацию о состоянии системы, выполните следующие действия:

  1. Откройте веб-интерфейс Angie ADC.

  2. В панели навигации перейдите МониторингСистема.

Откроется экран мониторинга, отображающий метрики системы и детализированные графики со статистикой за выбранный временной интервал.

В раскрывающемся списке За 30 минут в верхней части экрана вы можете изменить временной интервал для отображения статистики. Доступные временные интервалы: 30 минут, 3 часа, 6 часов, 12 часов, 24 часа, 48 часов, неделя, две недели.

Сводная иконографика#

В верхней части экрана отображается сводная информация о состоянии системы.

RAM (free)

Объем свободной оперативной памяти устройства (ГБ)

ROM (free)

Объем свободной постоянной памяти устройства (ГБ)

Fan (avg.)

Скорость вращения вентиляторов: среднее значение в оборотах в минуту (RPM) по всем вентиляторам устройства

Temp. (avg.)

Средняя температура по всем датчикам устройства (по Цельсию)

Voltage

Текущее напряжение блоков питания

Центральный процессор#

Uptime

Время непрерывной работы системы с момента последнего запуска.

CPU (core)

Количество ядер процессора.

Load Avg.

Усредненная загрузка системы за 1 минуту / 5 минут / 15 минут. Интерпретируется относительно числа ядер, например, на сервере с 4 ядрами значение 2.00 означает, что система загружена на 50%.

CPU (load) (график)

График использования процессора в процентах за выбранный временной интервал.

Load Avg. (график)

График усредненной загрузки системы за 1 минуту / 5 минут / 15 минут за выбранный временной интервал. Интерпретируется относительно числа ядер, например, на сервере с 4 ядрами значение 2.00 означает, что система загружена на 50%.

Обработка данных#

Received

Среднее количество данных, полученных в секунду (КБ/с)

Transmitted

Среднее количество данных, переданных в секунду (КБ/с)

Collisions (avg.)

Среднее количество коллизий в сети

Input Packet Errors (avg.)

Среднее количество ошибок входящих пакетов

Output Packet Errors (avg.)

Среднее количество ошибок исходящих пакетов

Received (график)

График среднего количества данных, полученных в секунду, за выбранный временной интервал с распределением по интерфейсам

Transmitted (график)

График среднего количества данных, переданных в секунду, за выбранный временной интервал с распределением по интерфейсам

Сетевые интерфейсы#

Таблица Interfaces отображает список подключенных интерфейсов.

Interface

Имя сетевого интерфейса

Adminstate

Состояние сетевого интерфейса, заданное администратором (up или down)

Operstate

Фактическое состояние сетевого интерфейса на данный момент (up или down)

Collisions, %

Процент коллизий за выбранный временной интервал

Input Packet Errors, %

Процентная доля принятых пакетов, в которых содержатся ошибки, за выбранный временной интервал

Output Packet Errors, %

Процентная доля переданных пакетов, в которых содержатся ошибки, за выбранный временной интервал

ОЗУ#

Total

Объем оперативной памяти, установленной на сервере (ГБ)

Available

Объем свободной оперативной памяти (ГБ)

Used

Объем используемой оперативной памяти (ГБ)

ECC correctable errors

Ошибки памяти, которые были обнаружены и автоматически исправлены (шт.)

ECC uncorrectable errors

Обнаруженные ошибки памяти, которые не удалось исправить (шт.)

RAM (used)

График использования оперативной памяти в процентах за выбранный временной интервал

Файловая система#

Круговая диаграмма Review file system отображает заполнение файловой системы в процентах (Used — использованное пространство, Free — свободное пространство).

Таблица File system содержит список смонтированных файловых систем и их параметры.

filesystem

Имя файловой системы

type

Тип файловой системы

size

Общий размер файловой системы

used

Объем использованного пространства

avail

Объем свободного пространства

use, %

Процент использования файловой системы

mountpoint

Точка монтирования файловой системы

Накопители (ROM)#

Таблица ROM (devices) отображает состояние накопителей.

smartctl_status

Состояние накопителя по данным SMART (Self-Monitoring, Analysis and Reporting Technology)

power_on

Общее время работы с момента включения

temp

Текущая температура

size

Объем накопителя

device

Имя устройства

interface

Тип интерфейса подключения

model_name

Модель устройства

serial_number

Серийный номер

S.M.A.R.T. атрибуты диска#

Таблица Reallocated_Sector_Ct отображает количество переназначенных (перемещенных в резервную область) секторов диска:

device

Имя устройства

raw

Необработанное значение атрибута SMART

thresh

Пороговое значение, при достижении которого состояние атрибута считается критическим

value

Нормализованное текущее значение атрибута

worst

Наихудшее нормализованное значение атрибута за выбранный временной интервал

Таблица Current_Pending_Sector отображает количество секторов, которые считаются нестабильными и ожидают переназначения:

device

Имя устройства

raw

Необработанное значение атрибута SMART

thresh

Пороговое значение, при достижении которого состояние атрибута считается критическим

value

Нормализованное текущее значение атрибута

worst

Наихудшее нормализованное значение атрибута за выбранный временной интервал

Датчики#

Таблица IPMI (temperature) отображает список датчиков с температурами. Данные получены через интерфейс IPMI (Intelligent Platform Management Interface):

Sensor

Идентификатор датчика температуры

Temp.

Текущее значение температуры

Таблица IPMI (fan) отображает информацию о вентиляторах. Данные получены через интерфейс IPMI (Intelligent Platform Management Interface):

Sensor

Идентификатор датчика вентилятора

RPM

Текущая скорость вращения вентилятора в оборотах в минуту (RPM)

Таблица IPMI (voltage) отображает параметры напряжения. Данные получены через интерфейс IPMI (Intelligent Platform Management Interface):

Sensor

Идентификатор датчика напряжения

Voltage

Текущее значение напряжения

Таблица IPMI (power state) отображает состояние питания устройств. Данные получены через интерфейс IPMI (Intelligent Platform Management Interface):

Sensor

Идентификатор датчика питания

State

Текущее состояние питания устройства (0 — выключено, 1 — включено).

Таблица IPMI (sensor state) отображает состояние всех остальных отслеживаемых датчиков, помимо перечисленных выше, в зависимости от типа оборудования. Данные получены через интерфейс IPMI (Intelligent Platform Management Interface):

Sensor

Идентификатор датчика

State

Текущее значение датчика (0 или 1).