Перейти к основному содержимому
Перейти к основному содержимому

system.asynchronous_metrics

Querying in ClickHouse Cloud

The data in this system table is held locally on each node in ClickHouse Cloud. Obtaining a complete view of all data, therefore, requires the clusterAllReplicas function. See here for further details.

Содержит метрики, которые периодически рассчитываются в фоновом режиме. Например, количество используемой оперативной памяти.

Колонки:

  • metric (String) — Имя метрики.
  • value (Float64) — Значение метрики.
  • description (String) — Описание метрики.

Пример

Описание метрик

AsynchronousHeavyMetricsCalculationTimeSpent

Время в секундах, затраченное на расчет асинхронных тяжелых (связанных с таблицами) метрик (это накладные расходы асинхронных метрик).

AsynchronousHeavyMetricsUpdateInterval

Интервал обновления тяжелых (связанных с таблицами) метрик.

AsynchronousMetricsCalculationTimeSpent

Время в секундах, затраченное на расчет асинхронных метрик (это накладные расходы асинхронных метрик).

AsynchronousMetricsUpdateInterval

Интервал обновления метрик.

BlockActiveTime_name

Время в секундах, в течение которого блочный устройство имело IO-запросы в очереди. Это метрика, действующая на уровне системы, она включает все процессы на хост-машине, а не только clickhouse-server. Исходник: /sys/block. Смотрите https://www.kernel.org/doc/Documentation/block/stat.txt

BlockDiscardBytes_name

Количество отброшенных байтов на блочном устройстве. Эти операции актуальны для SSD. Операции удаления не используются ClickHouse, но могут использоваться другими процессами в системе. Это метрика, действующая на уровне системы, она включает все процессы на хост-машине, а не только clickhouse-server. Исходник: /sys/block. Смотрите https://www.kernel.org/doc/Documentation/block/stat.txt

BlockDiscardMerges_name

Количество операций удаления, запрашиваемых от блочного устройства и объединяемых операционной системой. Эти операции актуальны для SSD. Операции удаления не используются ClickHouse, но могут использоваться другими процессами в системе. Это метрика, действующая на уровне системы, она включает все процессы на хост-машине, а не только clickhouse-server. Исходник: /sys/block. Смотрите https://www.kernel.org/doc/Documentation/block/stat.txt

BlockDiscardOps_name

Количество операций удаления, запрашиваемых от блочного устройства. Эти операции актуальны для SSD. Операции удаления не используются ClickHouse, но могут использоваться другими процессами в системе. Это метрика, действующая на уровне системы, она включает все процессы на хост-машине, а не только clickhouse-server. Исходник: /sys/block. Смотрите https://www.kernel.org/doc/Documentation/block/stat.txt

BlockDiscardTime_name

Время в секундах, затраченное на операции удаления, запрашиваемые от блочного устройства, суммированное по всем операциям. Эти операции актуальны для SSD. Операции удаления не используются ClickHouse, но могут использоваться другими процессами в системе. Это метрика, действующая на уровне системы, она включает все процессы на хост-машине, а не только clickhouse-server. Исходник: /sys/block. Смотрите https://www.kernel.org/doc/Documentation/block/stat.txt

BlockInFlightOps_name

Это значение учитывает количество IO-запросов, которые были выданы драйверу устройства, но еще не завершены. Не включает IO-запросы, которые находятся в очереди, но еще не были выданы драйверу устройства. Это метрика, действующая на уровне системы, она включает все процессы на хост-машине, а не только clickhouse-server. Исходник: /sys/block. Смотрите https://www.kernel.org/doc/Documentation/block/stat.txt

BlockQueueTime_name

Это значение учитывает общее количество миллисекунд, в течение которых IO-запросы ожидали на этом блочном устройстве. Если существует несколько IO-запросов, ожидающих, это значение будет увеличиваться как произведение количества миллисекунд на количество ожидающих запросов. Это метрика, действующая на уровне системы, она включает все процессы на хост-машине, а не только clickhouse-server. Исходник: /sys/block. Смотрите https://www.kernel.org/doc/Documentation/block/stat.txt

BlockReadBytes_name

Количество байтов, прочитанных с блочного устройства. Может быть меньше, чем количество байтов, прочитанных из файловой системы, из-за использования кэша страниц ОС, который экономит IO. Это метрика, действующая на уровне системы, она включает все процессы на хост-машине, а не только clickhouse-server. Исходник: /sys/block. Смотрите https://www.kernel.org/doc/Documentation/block/stat.txt

BlockReadMerges_name

Количество операций чтения, запрашиваемых от блочного устройства и объединяемых операционной системой. Это метрика, действующая на уровне системы, она включает все процессы на хост-машине, а не только clickhouse-server. Исходник: /sys/block. Смотрите https://www.kernel.org/doc/Documentation/block/stat.txt

BlockReadOps_name

Количество операций чтения, запрашиваемых от блочного устройства. Это метрика, действующая на уровне системы, она включает все процессы на хост-машине, а не только clickhouse-server. Исходник: /sys/block. Смотрите https://www.kernel.org/doc/Documentation/block/stat.txt

BlockReadTime_name

Время в секундах, затраченное на операции чтения, запрашиваемые от блочного устройства, суммированное по всем операциям. Это метрика, действующая на уровне системы, она включает все процессы на хост-машине, а не только clickhouse-server. Исходник: /sys/block. Смотрите https://www.kernel.org/doc/Documentation/block/stat.txt

BlockWriteBytes_name

Количество байтов, записанных на блочное устройство. Может быть меньше, чем количество байтов, записанных в файловую систему, из-за использования кэша страниц ОС, который экономит IO. Запись в блочное устройство может произойти позже, чем соответствующая запись в файловую систему из-за кэширования с записью. Это метрика, действующая на уровне системы, она включает все процессы на хост-машине, а не только clickhouse-server. Исходник: /sys/block. Смотрите https://www.kernel.org/doc/Documentation/block/stat.txt

BlockWriteMerges_name

Количество операций записи, запрашиваемых от блочного устройства и объединяемых операционной системой. Это метрика, действующая на уровне системы, она включает все процессы на хост-машине, а не только clickhouse-server. Исходник: /sys/block. Смотрите https://www.kernel.org/doc/Documentation/block/stat.txt

BlockWriteOps_name

Количество операций записи, запрашиваемых от блочного устройства. Это метрика, действующая на уровне системы, она включает все процессы на хост-машине, а не только clickhouse-server. Исходник: /sys/block. Смотрите https://www.kernel.org/doc/Documentation/block/stat.txt

BlockWriteTime_name

Время в секундах, затраченное на операции записи, запрашиваемые от блочного устройства, суммированное по всем операциям. Это метрика, действующая на уровне системы, она включает все процессы на хост-машине, а не только clickhouse-server. Исходник: /sys/block. Смотрите https://www.kernel.org/doc/Documentation/block/stat.txt

CPUFrequencyMHz_name

Текущая частота CPU в МГц. Большинство современных процессоров динамически регулирует частоту для экономии энергии и Turbo Boost.

CompiledExpressionCacheBytes

Общее количество байтов, используемых для кэша JIT-скомпилированного кода.

CompiledExpressionCacheCount

Общее количество записей в кэше JIT-скомпилированного кода.

DiskAvailable_name

Доступные байты на диске (виртуальная файловая система). Удаленные файловые системы могут показывать большое значение, например 16 EiB.

DiskTotal_name

Общий размер в байтах диска (виртуальная файловая система). Удаленные файловые системы могут показывать большое значение, например 16 EiB.

DiskUnreserved_name

Доступные байты на диске (виртуальная файловая система) без резервирования на слияние, выборки и перемещения. Удаленные файловые системы могут показывать большое значение, например 16 EiB.

DiskUsed_name

Использованные байты на диске (виртуальная файловая система). Удаленные файловые системы не всегда предоставляют эту информацию.

FilesystemCacheBytes

Общее количество байтов в виртуальной файловой системе cache. Этот кэш хранится на диске.

FilesystemCacheFiles

Общее количество сегментов файлов, кэшируемых в виртуальной файловой системе cache. Этот кэш хранится на диске.

FilesystemLogsPathAvailableBytes

Доступные байты на том томе, где смонтирован путь журналов ClickHouse. Если это значение приближается к нулю, вам следует настроить ротацию журналов в файле конфигурации.

FilesystemLogsPathAvailableINodes

Количество доступных inode на том томе, где смонтирован путь журналов ClickHouse.

FilesystemLogsPathTotalBytes

Размер тома, на котором смонтирован путь журналов ClickHouse, в байтах. Рекомендуется иметь не менее 10 ГБ для журналов.

FilesystemLogsPathTotalINodes

Общее количество inode на том томе, где смонтирован путь журналов ClickHouse.

FilesystemLogsPathUsedBytes

Использованные байты на том томе, где смонтирован путь журналов ClickHouse.

FilesystemLogsPathUsedINodes

Количество использованных inode на том томе, где смонтирован путь журналов ClickHouse.

FilesystemMainPathAvailableBytes

Доступные байты на том томе, где смонтирован основной путь ClickHouse.

FilesystemMainPathAvailableINodes

Количество доступных inode на том томе, где смонтирован основной путь ClickHouse. Если оно близко к нулю, это указывает на неправильную конфигурацию, и вы получите "нет места на устройстве", даже если диск не заполнен.

FilesystemMainPathTotalBytes

Размер тома, на котором смонтирован основной путь ClickHouse, в байтах.

FilesystemMainPathTotalINodes

Общее количество inode на том томе, где смонтирован основной путь ClickHouse. Если их меньше 25 миллионов, это указывает на неправильную конфигурацию.

FilesystemMainPathUsedBytes

Использованные байты на том томе, где смонтирован основной путь ClickHouse.

FilesystemMainPathUsedINodes

Количество использованных inode на том томе, где смонтирован основной путь ClickHouse. Это значение в основном соответствует количеству файлов.

HTTPThreads

Количество потоков в сервере HTTP интерфейса (без TLS).

InterserverThreads

Количество потоков в сервере протокола связи реплик (без TLS).

Jitter

Разница во времени, когда поток для расчета асинхронных метрик был запланирован для пробуждения и временем, когда он фактически был пробужден. Условный индикатор общей задержки системы и отзывчивости.

LoadAverageN

Общая нагрузка системы, усредненная с экспоненциальным сглаживанием за 1 минуту. Нагрузка представляет собой количество потоков по всем процессам (сущности планирования ядра ОС), которые в настоящее время выполняются на CPU или ожидают IO, или готовы к выполнению, но на данный момент не планируются. Это число включает все процессы, а не только clickhouse-server. Число может превышать количество ядер CPU, если система перегружена, и многие процессы готовы к выполнению, но ждут CPU или IO.

MMapCacheCells

Количество файлов, открытых с использованием mmap (отображенных в памяти). Это используется для запросов, в которых настройка local_filesystem_read_method установлена в mmap. Файлы, открытые с использованием mmap, хранятся в кэше, чтобы избежать дорогостоящих сбросов TLB.

MarkCacheBytes

Общий размер кэша меток в байтах.

MarkCacheFiles

Общее количество файлов меток, кэшированных в кэше меток.

MaxPartCountForPartition

Максимальное количество частей в партиции по всем партициям всех таблиц семейства MergeTree. Значения, превышающие 300, указывают на неправильную конфигурацию, перегрузку или массовую загрузку данных.

MemoryCode

Количество виртуальной памяти, отображенной для страниц машинного кода процесса сервера, в байтах.

MemoryDataAndStack

Количество виртуальной памяти, отображенной для использования стека и для выделенной памяти, в байтах. Не уточняется, включает ли она стек пер-потоков и большую часть выделенной памяти, которая выделяется с помощью системного вызова 'mmap'. Эта метрика существует только для полноты. Рекомендуется использовать метрику MemoryResident для мониторинга.

MemoryResidentMax

Максимальное количество физической памяти, используемой процессом сервера, в байтах.

MemoryResident

Количество физической памяти, используемой процессом сервера, в байтах.

MemoryShared

Количество памяти, используемой процессом сервера, которая также используется другими процессами, в байтах. ClickHouse не использует общую память, но часть памяти может быть помечена ОС как общая по своим причинам. Эта метрика не имеет большого смысла для наблюдения, и существует только для полноты.

MemoryVirtual

Размер пространства виртуальных адресов, выделенного процессом сервера, в байтах. Размер пространства виртуальных адресов обычно намного больше, чем потребление физической памяти, и не должен использоваться как оценка потребления памяти. Большие значения этой метрики абсолютно нормальны и имеют только технический смысл.

MySQLThreads

Количество потоков в сервере протокола совместимости MySQL.

NetworkReceiveBytes_name

Количество байтов, полученных через сетевой интерфейс. Это метрика, действующая на уровне системы, она включает все процессы на хост-машине, а не только clickhouse-server.

NetworkReceiveDrop_name

Количество байтов, потерянных в пакете при получении через сетевой интерфейс. Это метрика, действующая на уровне системы, она включает все процессы на хост-машине, а не только clickhouse-server.

NetworkReceiveErrors_name

Количество раз, когда произошла ошибка при получении через сетевой интерфейс. Это метрика, действующая на уровне системы, она включает все процессы на хост-машине, а не только clickhouse-server.

NetworkReceivePackets_name

Количество сетевых пакетов, полученных через сетевой интерфейс. Это метрика, действующая на уровне системы, она включает все процессы на хост-машине, а не только clickhouse-server.

NetworkSendBytes_name

Количество байтов, отправленных через сетевой интерфейс. Это метрика, действующая на уровне системы, она включает все процессы на хост-машине, а не только clickhouse-server.

NetworkSendDrop_name

Количество раз, когда пакет был потерян при отправке через сетевой интерфейс. Это метрика, действующая на уровне системы, она включает все процессы на хост-машине, а не только clickhouse-server.

NetworkSendErrors_name

Количество раз, когда произошла ошибка (например, повторная передача TCP) при отправке через сетевой интерфейс. Это метрика, действующая на уровне системы, она включает все процессы на хост-машине, а не только clickhouse-server.

NetworkSendPackets_name

Количество сетевых пакетов, отправленных через сетевой интерфейс. Это метрика, действующая на уровне системы, она включает все процессы на хост-машине, а не только clickhouse-server.

NumberOfDatabases

Общее количество баз данных на сервере.

NumberOfDetachedByUserParts

Общее количество частей, отделенных от таблиц MergeTree пользователями с помощью запроса ALTER TABLE DETACH (в отличие от неожиданных, поврежденных или игнорируемых частей). Сервер не беспокоится о отделенных частях, и они могут быть удалены.

NumberOfDetachedParts

Общее количество частей, отделенных от таблиц MergeTree. Часть может быть отделена пользователем с помощью запроса ALTER TABLE DETACH или самим сервером, если часть повреждена, неожиданна или ненужна. Сервер не беспокоится о отделенных частях, и они могут быть удалены.

NumberOfTables

Общее количество таблиц, суммированных по базам данных на сервере, исключая базы данных, которые не могут содержать таблицы MergeTree. Исключенные движки базы данных — это те, которые генерируют набор таблиц на лету, такие как Lazy, MySQL, PostgreSQL, SQlite.

OSContextSwitches

Количество переключений контекста, которые система пережила на хост-машине. Это метрика, действующая на уровне системы, она включает все процессы на хост-машине, а не только clickhouse-server.

OSGuestNiceTime

Соотношение времени, затраченного на запуск виртуального CPU для гостевых операционных систем под управлением ядра Linux, когда гость был установлен на более высокий приоритет (См. man procfs). Это метрика, действующая на уровне системы, она включает все процессы на хост-машине, а не только clickhouse-server. Эта метрика не имеет значения для ClickHouse, но все еще существует для полноты. Значение для одного ядра CPU будет в интервале [0..1]. Значение для всех ядер CPU рассчитывается как сумма по ним [0..число ядер].

OSGuestNiceTimeCPU_N

Соотношение времени, затраченного на запуск виртуального CPU для гостевых операционных систем под управлением ядра Linux, когда гость был установлен на более высокий приоритет (См. man procfs). Это метрика, действующая на уровне системы, она включает все процессы на хост-машине, а не только clickhouse-server. Эта метрика не имеет значения для ClickHouse, но все еще существует для полноты. Значение для одного ядра CPU будет в интервале [0..1]. Значение для всех ядер CPU рассчитывается как сумма по ним [0..число ядер].

OSGuestNiceTimeNormalized

Значение похоже на OSGuestNiceTime, но делится на количество ядер CPU, чтобы измеряться в интервале [0..1], независимо от числа ядер. Это позволяет вам усреднять значения этой метрики по нескольким серверам в кластере, даже если количество ядер не однородно, и все равно получать среднюю метрику использования ресурсов.

OSGuestTime

Соотношение времени, затраченного на запуск виртуального CPU для гостевых операционных систем под управлением ядра Linux (См. man procfs). Это метрика, действующая на уровне системы, она включает все процессы на хост-машине, а не только clickhouse-server. Эта метрика не имеет значения для ClickHouse, но все еще существует для полноты. Значение для одного ядра CPU будет в интервале [0..1]. Значение для всех ядер CPU рассчитывается как сумма по ним [0..число ядер].

OSGuestTimeCPU_N

Соотношение времени, затраченного на запуск виртуального CPU для гостевых операционных систем под управлением ядра Linux (См. man procfs). Это метрика, действующая на уровне системы, она включает все процессы на хост-машине, а не только clickhouse-server. Эта метрика не имеет значения для ClickHouse, но все еще существует для полноты. Значение для одного ядра CPU будет в интервале [0..1]. Значение для всех ядер CPU рассчитывается как сумма по ним [0..число ядер].

OSGuestTimeNormalized

Значение похоже на OSGuestTime, но делится на количество ядер CPU для измерения в интервале [0..1], независимо от числа ядер. Это позволяет вам усреднять значения этой метрики по нескольким серверам в кластере, даже если количество ядер не однородно, и все равно получать среднюю метрику использования ресурсов.

OSIOWaitTime

Соотношение времени, когда ядро CPU не выполняло код, но когда ядро ОС не запускало никакой другой процесс на этом CPU, так как процессы ожидали IO. Это метрика, действующая на уровне системы, она включает все процессы на хост-машине, а не только clickhouse-server. Значение для одного ядра CPU будет в интервале [0..1]. Значение для всех ядер CPU рассчитывается как сумма по ним [0..число ядер].

OSIOWaitTimeCPU_N

Соотношение времени, когда ядро CPU не выполняло код, но когда ядро ОС не запускало никакой другой процесс на этом CPU, так как процессы ожидали IO. Это метрика, действующая на уровне системы, она включает все процессы на хост-машине, а не только clickhouse-server. Значение для одного ядра CPU будет в интервале [0..1]. Значение для всех ядер CPU рассчитывается как сумма по ним [0..число ядер].

OSIOWaitTimeNormalized

Значение похоже на OSIOWaitTime, но делится на количество ядер CPU для измерения в интервале [0..1], независимо от числа ядер. Это позволяет вам усреднять значения этой метрики по нескольким серверам в кластере, даже если количество ядер не однородно, и все равно получать среднюю метрику использования ресурсов.

OSIdleTime

Соотношение времени, когда ядро CPU было бездействующим (даже не готовым запускать процесс ожидания IO) с точки зрения ядра ОС. Это метрика, действующая на уровне системы, она включает все процессы на хост-машине, а не только clickhouse-server. Это не включает время, когда CPU использовался недостаточно из-за причин, внутренних для CPU (загрузок памяти, задержек в конвейере, неправильных предсказаний ветвлений, работы другого ядра SMT). Значение для одного ядра CPU будет в интервале [0..1]. Значение для всех ядер CPU рассчитывается как сумма по ним [0..число ядер].

OSIdleTimeCPU_N

Соотношение времени, когда ядро CPU было бездействующим (даже не готовым запускать процесс ожидания IO) с точки зрения ядра ОС. Это метрика, действующая на уровне системы, она включает все процессы на хост-машине, а не только clickhouse-server. Это не включает время, когда CPU использовался недостаточно из-за причин, внутренних для CPU (загрузок памяти, задержек в конвейере, неправильных предсказаний ветвлений, работы другого ядра SMT). Значение для одного ядра CPU будет в интервале [0..1]. Значение для всех ядер CPU рассчитывается как сумма по ним [0..число ядер].

OSIdleTimeNormalized

Значение похоже на OSIdleTime, но делится на количество ядер CPU для измерения в интервале [0..1], независимо от числа ядер. Это позволяет вам усреднять значения этой метрики по нескольким серверам в кластере, даже если количество ядер не однородно, и все равно получать среднюю метрику использования ресурсов.

OSInterrupts

Количество прерываний на хост-машине. Это метрика, действующая на уровне системы, она включает все процессы на хост-машине, а не только clickhouse-server.

OSIrqTime

Соотношение времени, затраченного на выполнение аппаратных запросов прерывания на CPU. Это метрика, действующая на уровне системы, она включает все процессы на хост-машине, а не только clickhouse-server. Высокое значение этой метрики может указывать на неправильную конфигурацию оборудования или очень высокую сетевую нагрузку. Значение для одного ядра CPU будет в интервале [0..1]. Значение для всех ядер CPU рассчитывается как сумма по ним [0..число ядер].

OSIrqTimeCPU_N

Соотношение времени, затраченного на выполнение аппаратных запросов прерывания на CPU. Это метрика, действующая на уровне системы, она включает все процессы на хост-машине, а не только clickhouse-server. Высокое значение этой метрики может указывать на неправильную конфигурацию оборудования или очень высокую сетевую нагрузку. Значение для одного ядра CPU будет в интервале [0..1]. Значение для всех ядер CPU рассчитывается как сумма по ним [0..число ядер].

OSIrqTimeNormalized

Значение похоже на OSIrqTime, но делится на количество ядер CPU для измерения в интервале [0..1], независимо от числа ядер. Это позволяет вам усреднять значения этой метрики по нескольким серверам в кластере, даже если количество ядер не однородно, и все равно получать среднюю метрику использования ресурсов.

OSMemoryAvailable

Количество памяти, доступной для использования программами, в байтах. Это очень похоже на метрику OSMemoryFreePlusCached. Это метрика, действующая на уровне системы, она включает все процессы на хост-машине, а не только clickhouse-server.

OSMemoryBuffers

Количество памяти, используемой буферами ядра ОС, в байтах. Обычно это должно быть небольшим, и большие значения могут указывать на неправильную конфигурацию ОС. Это метрика, действующая на уровне системы, она включает все процессы на хост-машине, а не только clickhouse-server.

OSMemoryCached

Количество памяти, используемой кэшем страниц ОС, в байтах. Обычно почти вся доступная память используется кэшем страниц ОС - высокие значения этой метрики нормальны и ожидаемы. Это метрика, действующая на уровне системы, она включает все процессы на хост-машине, а не только clickhouse-server.

OSMemoryFreePlusCached

Количество свободной памяти плюс память кэша страниц ОС на хост-системе, в байтах. Эта память доступна для использования программами. Значение должно быть очень похоже на OSMemoryAvailable. Это метрика, действующая на уровне системы, она включает все процессы на хост-машине, а не только clickhouse-server.

OSMemoryFreeWithoutCached

Объем свободной памяти на хост-системе, в байтах. Это не включает память, используемую ОС для кэширования страниц, в байтах. Память кэша страниц также доступна для использования программами, поэтому значение этой метрики может быть запутанным. Вместо этого смотрите метрику OSMemoryAvailable. Для удобства мы также предоставляем метрику OSMemoryFreePlusCached, которая должна быть в некоторой степени аналогична OSMemoryAvailable. См. также https://www.linuxatemyram.com/. Это метрика, действующая на уровне всей системы, она включает все процессы на хост-машине, а не только clickhouse-server.

OSMemoryTotal

Общее количество памяти на хост-системе, в байтах.

OSNiceTime

Соотношение времени, в течение которого ядро CPU выполняло код пользовательского пространства с более высоким приоритетом. Это метрика, действующая на уровне всей системы, она включает все процессы на хост-машине, а не только clickhouse-server. Значение для одного ядра CPU будет в интервале [0..1]. Значение для всех ядер CPU вычисляется как сумма по ним [0..num cores].

OSNiceTimeCPU_N

Соотношение времени, в течение которого ядро CPU выполняло код пользовательского пространства с более высоким приоритетом. Это метрика, действующая на уровне всей системы, она включает все процессы на хост-машине, а не только clickhouse-server. Значение для одного ядра CPU будет в интервале [0..1]. Значение для всех ядер CPU вычисляется как сумма по ним [0..num cores].

OSNiceTimeNormalized

Значение похоже на OSNiceTime, но делится на количество ядер CPU, чтобы быть измеренным в интервале [0..1], независимо от количества ядер. Это позволяет усреднять значения этой метрики на нескольких серверах в кластере, даже если количество ядер неравномерно, и все же получать среднюю метрику использования ресурсов.

OSOpenFiles

Общее количество открытых файлов на хост-машине. Это метрика, действующая на уровне всей системы, она включает все процессы на хост-машине, а не только clickhouse-server.

OSProcessesBlocked

Количество потоков, заблокированных в ожидании завершения ввода-вывода (man procfs). Это метрика, действующая на уровне всей системы, она включает все процессы на хост-машине, а не только clickhouse-server.

OSProcessesCreated

Количество созданных процессов. Это метрика, действующая на уровне всей системы, она включает все процессы на хост-машине, а не только clickhouse-server.

OSProcessesRunning

Количество исполняемых (работающих или готовых к выполнению) потоков операционной системой. Это метрика, действующая на уровне всей системы, она включает все процессы на хост-машине, а не только clickhouse-server.

OSSoftIrqTime

Соотношение времени, затрачиваемого на выполнение программных прерываний на CPU. Это метрика, действующая на уровне всей системы, она включает все процессы на хост-машине, а не только clickhouse-server. Высокое значение этой метрики может указывать на неэффективное программное обеспечение, работающее в системе. Значение для одного ядра CPU будет в интервале [0..1]. Значение для всех ядер CPU вычисляется как сумма по ним [0..num cores].

OSSoftIrqTimeCPU_N

Соотношение времени, затрачиваемого на выполнение программных прерываний на CPU. Это метрика, действующая на уровне всей системы, она включает все процессы на хост-машине, а не только clickhouse-server. Высокое значение этой метрики может указывать на неэффективное программное обеспечение, работающее в системе. Значение для одного ядра CPU будет в интервале [0..1]. Значение для всех ядер CPU вычисляется как сумма по ним [0..num cores].

OSSoftIrqTimeNormalized

Значение похоже на OSSoftIrqTime, но делится на количество ядер CPU, чтобы быть измеренным в интервале [0..1], независимо от количества ядер. Это позволяет усреднять значения этой метрики на нескольких серверах в кластере, даже если количество ядер неравномерно, и все же получать среднюю метрику использования ресурсов.

OSStealTime

Соотношение времени, проведенного в других операционных системах CPU при работе в виртуализированной среде. Это метрика, действующая на уровне всей системы, она включает все процессы на хост-машине, а не только clickhouse-server. Не каждая виртуализированная среда предоставляет эту метрику, и большинство из них этого не делает. Значение для одного ядра CPU будет в интервале [0..1]. Значение для всех ядер CPU вычисляется как сумма по ним [0..num cores].

OSStealTimeCPU_N

Соотношение времени, проведенного в других операционных системах CPU при работе в виртуализированной среде. Это метрика, действующая на уровне всей системы, она включает все процессы на хост-машине, а не только clickhouse-server. Не каждая виртуализированная среда предоставляет эту метрику, и большинство из них этого не делает. Значение для одного ядра CPU будет в интервале [0..1]. Значение для всех ядер CPU вычисляется как сумма по ним [0..num cores].

OSStealTimeNormalized

Значение похоже на OSStealTime, но делится на количество ядер CPU, чтобы быть измеренным в интервале [0..1], независимо от количества ядер. Это позволяет усреднять значения этой метрики на нескольких серверах в кластере, даже если количество ядер неравномерно, и все же получать среднюю метрику использования ресурсов.

OSSystemTime

Соотношение времени, в течение которого ядро CPU выполняло код ядра ОС (системный код). Это метрика, действующая на уровне всей системы, она включает все процессы на хост-машине, а не только clickhouse-server. Значение для одного ядра CPU будет в интервале [0..1]. Значение для всех ядер CPU вычисляется как сумма по ним [0..num cores].

OSSystemTimeCPU_N

Соотношение времени, в течение которого ядро CPU выполняло код ядра ОС (системный код). Это метрика, действующая на уровне всей системы, она включает все процессы на хост-машине, а не только clickhouse-server. Значение для одного ядра CPU будет в интервале [0..1]. Значение для всех ядер CPU вычисляется как сумма по ним [0..num cores].

OSSystemTimeNormalized

Значение похоже на OSSystemTime, но делится на количество ядер CPU, чтобы быть измеренным в интервале [0..1], независимо от количества ядер. Это позволяет усреднять значения этой метрики на нескольких серверах в кластере, даже если количество ядер неравномерно, и все же получать среднюю метрику использования ресурсов.

OSThreadsRunnable

Общее количество «выполняемых» потоков, как это видит планировщик ядра ОС.

OSThreadsTotal

Общее количество потоков, как это видит планировщик ядра ОС.

OSUptime

Время работы хост-сервера (машина, на которой работает ClickHouse), в секундах.

OSUserTime

Соотношение времени, в течение которого ядро CPU выполняло код пользовательского пространства. Это метрика, действующая на уровне всей системы, она включает все процессы на хост-машине, а не только clickhouse-server. Это также включает время, когда CPU был недостаточно использован по причинам, внутренним для CPU (нагрузки памяти, задержки в конвейере, неверные предсказания ветвления, работа другого SMT-ядра). Значение для одного ядра CPU будет в интервале [0..1]. Значение для всех ядер CPU вычисляется как сумма по ним [0..num cores].

OSUserTimeCPU_N

Соотношение времени, в течение которого ядро CPU выполняло код пользовательского пространства. Это метрика, действующая на уровне всей системы, она включает все процессы на хост-машине, а не только clickhouse-server. Это также включает время, когда CPU был недостаточно использован по причинам, внутренним для CPU (нагрузки памяти, задержки в конвейере, неверные предсказания ветвления, работа другого SMT-ядра). Значение для одного ядра CPU будет в интервале [0..1]. Значение для всех ядер CPU вычисляется как сумма по ним [0..num cores].

OSUserTimeNormalized

Значение похоже на OSUserTime, но делится на количество ядер CPU, чтобы быть измеренным в интервале [0..1], независимо от количества ядер. Это позволяет усреднять значения этой метрики на нескольких серверах в кластере, даже если количество ядер неравномерно, и все же получать среднюю метрику использования ресурсов.

PostgreSQLThreads

Количество потоков в сервере протокола совместимости PostgreSQL.

QueryCacheBytes

Общий размер кэша запросов в байтах.

QueryCacheEntries

Общее количество записей в кэше запросов.

ReplicasMaxAbsoluteDelay

Максимальная разница в секундах между самой свежей реплицированной частью и самой свежей частью данных, которая еще должна быть реплицирована, среди реплицируемых таблиц. Очень высокое значение указывает на реплику без данных.

ReplicasMaxInsertsInQueue

Максимальное количество операций INSERT в очереди (еще не реплицированных) среди реплицируемых таблиц.

ReplicasMaxMergesInQueue

Максимальное количество операций слияния в очереди (еще не примененных) среди реплицируемых таблиц.

ReplicasMaxQueueSize

Максимальный размер очереди (в количестве операций, таких как get, merge) среди реплицируемых таблиц.

ReplicasMaxRelativeDelay

Максимальная разница между задержкой реплики и задержкой самой актуальной реплики той же таблицы среди реплицируемых таблиц.

ReplicasSumInsertsInQueue

Сумма операций INSERT в очереди (еще не реплицированных) среди реплицируемых таблиц.

ReplicasSumMergesInQueue

Сумма операций слияния в очереди (еще не примененных) среди реплицируемых таблиц.

ReplicasSumQueueSize

Суммарный размер очереди (в количестве операций, таких как get, merge) среди реплицируемых таблиц.

TCPThreads

Количество потоков в сервере протокола TCP (без TLS).

Temperature_N

Температура соответствующего устройства в ℃. Датчик может вернуть нереалистичное значение. Источник: /sys/class/thermal

Temperature_name

Температура, сообщаемая соответствующим аппаратным монитором и соответствующим датчиком в ℃. Датчик может вернуть нереалистичное значение. Источник: /sys/class/hwmon

TotalBytesOfMergeTreeTables

Общее количество байт (сжатых, включая данные и индексы), хранящихся во всех таблицах семейства MergeTree.

TotalPartsOfMergeTreeTables

Общее количество частей данных во всех таблицах семейства MergeTree. Числа, превышающие 10 000, негативно повлияют на время запуска сервера и могут указывать на неразумный выбор ключа партиционирования.

TotalPrimaryKeyBytesInMemory

Общее количество памяти (в байтах), используемое значениями первичного ключа (учитывает только активные части).

TotalPrimaryKeyBytesInMemoryAllocated

Общее количество памяти (в байтах), зарезервированное для значений первичного ключа (учитывает только активные части).

TotalRowsOfMergeTreeTables

Общее количество строк (записей), хранящихся во всех таблицах семейства MergeTree.

UncompressedCacheBytes

Общий размер несжатого кэша в байтах. Несжатый кэш обычно не улучшает производительность и должен в основном избегаться.

UncompressedCacheCells

Общее количество записей в несжатом кэше. Каждая запись представляет собой декомпрессированный блок данных. Несжатый кэш обычно не улучшает производительность и должен в основном избегаться.

Uptime

Время работы сервера в секундах. Включает время, затраченное на инициализацию сервера перед приемом соединений.

jemalloc.active

Внутренняя метрика низкоуровневого распределителя памяти (jemalloc). См. https://jemalloc.net/jemalloc.3.html

jemalloc.allocated

Внутренняя метрика низкоуровневого распределителя памяти (jemalloc). См. https://jemalloc.net/jemalloc.3.html

jemalloc.arenas.all.dirty_purged

Внутренняя метрика низкоуровневого распределителя памяти (jemalloc). См. https://jemalloc.net/jemalloc.3.html

jemalloc.arenas.all.muzzy_purged

Внутренняя метрика низкоуровневого распределителя памяти (jemalloc). См. https://jemalloc.net/jemalloc.3.html

jemalloc.arenas.all.pactive

Внутренняя метрика низкоуровневого распределителя памяти (jemalloc). См. https://jemalloc.net/jemalloc.3.html

jemalloc.arenas.all.pdirty

Внутренняя метрика низкоуровневого распределителя памяти (jemalloc). См. https://jemalloc.net/jemalloc.3.html

jemalloc.arenas.all.pmuzzy

Внутренняя метрика низкоуровневого распределителя памяти (jemalloc). См. https://jemalloc.net/jemalloc.3.html

jemalloc.background_thread.num_runs

Внутренняя метрика низкоуровневого распределителя памяти (jemalloc). См. https://jemalloc.net/jemalloc.3.html

jemalloc.background_thread.num_threads

Внутренняя метрика низкоуровневого распределителя памяти (jemalloc). См. https://jemalloc.net/jemalloc.3.html

jemalloc.background_thread.run_intervals

Внутренняя метрика низкоуровневого распределителя памяти (jemalloc). См. https://jemalloc.net/jemalloc.3.html

jemalloc.epoch

Внутренний инкрементальный номер обновления статистики jemalloc (распределитель памяти Джейсона Эванса), используемый во всех других метриках jemalloc.

jemalloc.mapped

Внутренняя метрика низкоуровневого распределителя памяти (jemalloc). См. https://jemalloc.net/jemalloc.3.html

jemalloc.metadata

Внутренняя метрика низкоуровневого распределителя памяти (jemalloc). См. https://jemalloc.net/jemalloc.3.html

jemalloc.metadata_thp

Внутренняя метрика низкоуровневого распределителя памяти (jemalloc). См. https://jemalloc.net/jemalloc.3.html

jemalloc.resident

Внутренняя метрика низкоуровневого распределителя памяти (jemalloc). См. https://jemalloc.net/jemalloc.3.html

jemalloc.retained

Внутренняя метрика низкоуровневого распределителя памяти (jemalloc). См. https://jemalloc.net/jemalloc.3.html

jemalloc.prof.active

Внутренняя метрика низкоуровневого распределителя памяти (jemalloc). См. https://jemalloc.net/jemalloc.3.html

См. также

  • Мониторинг — Основные концепции мониторинга ClickHouse.
  • system.metrics — Содержит мгновенно вычисляемые метрики.
  • system.events — Содержит множество событий, которые произошли.
  • system.metric_log — Содержит историю значений метрик из таблиц system.metrics и system.events.