system.asynchronous_metrics
The data in this system table is held locally on each node in ClickHouse Cloud. Obtaining a complete view of all data, therefore, requires the clusterAllReplicas
function. See here for further details.
Содержит метрики, которые периодически рассчитываются в фоновом режиме. Например, количество используемой оперативной памяти.
Колонки:
metric
(String) — Имя метрики.value
(Float64) — Значение метрики.description
(String) — Описание метрики.
Пример
Описание метрик
AsynchronousHeavyMetricsCalculationTimeSpent
Время в секундах, затраченное на расчет асинхронных тяжелых (связанных с таблицами) метрик (это накладные расходы асинхронных метрик).
AsynchronousHeavyMetricsUpdateInterval
Интервал обновления тяжелых (связанных с таблицами) метрик.
AsynchronousMetricsCalculationTimeSpent
Время в секундах, затраченное на расчет асинхронных метрик (это накладные расходы асинхронных метрик).
AsynchronousMetricsUpdateInterval
Интервал обновления метрик.
BlockActiveTime_name
Время в секундах, в течение которого блочный устройство имело IO-запросы в очереди. Это метрика, действующая на уровне системы, она включает все процессы на хост-машине, а не только clickhouse-server. Исходник: /sys/block
. Смотрите https://www.kernel.org/doc/Documentation/block/stat.txt
BlockDiscardBytes_name
Количество отброшенных байтов на блочном устройстве. Эти операции актуальны для SSD. Операции удаления не используются ClickHouse, но могут использоваться другими процессами в системе. Это метрика, действующая на уровне системы, она включает все процессы на хост-машине, а не только clickhouse-server. Исходник: /sys/block
. Смотрите https://www.kernel.org/doc/Documentation/block/stat.txt
BlockDiscardMerges_name
Количество операций удаления, запрашиваемых от блочного устройства и объединяемых операционной системой. Эти операции актуальны для SSD. Операции удаления не используются ClickHouse, но могут использоваться другими процессами в системе. Это метрика, действующая на уровне системы, она включает все процессы на хост-машине, а не только clickhouse-server. Исходник: /sys/block
. Смотрите https://www.kernel.org/doc/Documentation/block/stat.txt
BlockDiscardOps_name
Количество операций удаления, запрашиваемых от блочного устройства. Эти операции актуальны для SSD. Операции удаления не используются ClickHouse, но могут использоваться другими процессами в системе. Это метрика, действующая на уровне системы, она включает все процессы на хост-машине, а не только clickhouse-server. Исходник: /sys/block
. Смотрите https://www.kernel.org/doc/Documentation/block/stat.txt
BlockDiscardTime_name
Время в секундах, затраченное на операции удаления, запрашиваемые от блочного устройства, суммированное по всем операциям. Эти операции актуальны для SSD. Операции удаления не используются ClickHouse, но могут использоваться другими процессами в системе. Это метрика, действующая на уровне системы, она включает все процессы на хост-машине, а не только clickhouse-server. Исходник: /sys/block
. Смотрите https://www.kernel.org/doc/Documentation/block/stat.txt
BlockInFlightOps_name
Это значение учитывает количество IO-запросов, которые были выданы драйверу устройства, но еще не завершены. Не включает IO-запросы, которые находятся в очереди, но еще не были выданы драйверу устройства. Это метрика, действующая на уровне системы, она включает все процессы на хост-машине, а не только clickhouse-server. Исходник: /sys/block
. Смотрите https://www.kernel.org/doc/Documentation/block/stat.txt
BlockQueueTime_name
Это значение учитывает общее количество миллисекунд, в течение которых IO-запросы ожидали на этом блочном устройстве. Если существует несколько IO-запросов, ожидающих, это значение будет увеличиваться как произведение количества миллисекунд на количество ожидающих запросов. Это метрика, действующая на уровне системы, она включает все процессы на хост-машине, а не только clickhouse-server. Исходник: /sys/block
. Смотрите https://www.kernel.org/doc/Documentation/block/stat.txt
BlockReadBytes_name
Количество байтов, прочитанных с блочного устройства. Может быть меньше, чем количество байтов, прочитанных из файловой системы, из-за использования кэша страниц ОС, который экономит IO. Это метрика, действующая на уровне системы, она включает все процессы на хост-машине, а не только clickhouse-server. Исходник: /sys/block
. Смотрите https://www.kernel.org/doc/Documentation/block/stat.txt
BlockReadMerges_name
Количество операций чтения, запрашиваемых от блочного устройства и объединяемых операционной системой. Это метрика, действующая на уровне системы, она включает все процессы на хост-машине, а не только clickhouse-server. Исходник: /sys/block
. Смотрите https://www.kernel.org/doc/Documentation/block/stat.txt
BlockReadOps_name
Количество операций чтения, запрашиваемых от блочного устройства. Это метрика, действующая на уровне системы, она включает все процессы на хост-машине, а не только clickhouse-server. Исходник: /sys/block
. Смотрите https://www.kernel.org/doc/Documentation/block/stat.txt
BlockReadTime_name
Время в секундах, затраченное на операции чтения, запрашиваемые от блочного устройства, суммированное по всем операциям. Это метрика, действующая на уровне системы, она включает все процессы на хост-машине, а не только clickhouse-server. Исходник: /sys/block
. Смотрите https://www.kernel.org/doc/Documentation/block/stat.txt
BlockWriteBytes_name
Количество байтов, записанных на блочное устройство. Может быть меньше, чем количество байтов, записанных в файловую систему, из-за использования кэша страниц ОС, который экономит IO. Запись в блочное устройство может произойти позже, чем соответствующая запись в файловую систему из-за кэширования с записью. Это метрика, действующая на уровне системы, она включает все процессы на хост-машине, а не только clickhouse-server. Исходник: /sys/block
. Смотрите https://www.kernel.org/doc/Documentation/block/stat.txt
BlockWriteMerges_name
Количество операций записи, запрашиваемых от блочного устройства и объединяемых операционной системой. Это метрика, действующая на уровне системы, она включает все процессы на хост-машине, а не только clickhouse-server. Исходник: /sys/block
. Смотрите https://www.kernel.org/doc/Documentation/block/stat.txt
BlockWriteOps_name
Количество операций записи, запрашиваемых от блочного устройства. Это метрика, действующая на уровне системы, она включает все процессы на хост-машине, а не только clickhouse-server. Исходник: /sys/block
. Смотрите https://www.kernel.org/doc/Documentation/block/stat.txt
BlockWriteTime_name
Время в секундах, затраченное на операции записи, запрашиваемые от блочного устройства, суммированное по всем операциям. Это метрика, действующая на уровне системы, она включает все процессы на хост-машине, а не только clickhouse-server. Исходник: /sys/block
. Смотрите https://www.kernel.org/doc/Documentation/block/stat.txt
CPUFrequencyMHz_name
Текущая частота CPU в МГц. Большинство современных процессоров динамически регулирует частоту для экономии энергии и Turbo Boost.
CompiledExpressionCacheBytes
Общее количество байтов, используемых для кэша JIT-скомпилированного кода.
CompiledExpressionCacheCount
Общее количество записей в кэше JIT-скомпилированного кода.
DiskAvailable_name
Доступные байты на диске (виртуальная файловая система). Удаленные файловые системы могут показывать большое значение, например 16 EiB.
DiskTotal_name
Общий размер в байтах диска (виртуальная файловая система). Удаленные файловые системы могут показывать большое значение, например 16 EiB.
DiskUnreserved_name
Доступные байты на диске (виртуальная файловая система) без резервирования на слияние, выборки и перемещения. Удаленные файловые системы могут показывать большое значение, например 16 EiB.
DiskUsed_name
Использованные байты на диске (виртуальная файловая система). Удаленные файловые системы не всегда предоставляют эту информацию.
FilesystemCacheBytes
Общее количество байтов в виртуальной файловой системе cache
. Этот кэш хранится на диске.
FilesystemCacheFiles
Общее количество сегментов файлов, кэшируемых в виртуальной файловой системе cache
. Этот кэш хранится на диске.
FilesystemLogsPathAvailableBytes
Доступные байты на том томе, где смонтирован путь журналов ClickHouse. Если это значение приближается к нулю, вам следует настроить ротацию журналов в файле конфигурации.
FilesystemLogsPathAvailableINodes
Количество доступных inode на том томе, где смонтирован путь журналов ClickHouse.
FilesystemLogsPathTotalBytes
Размер тома, на котором смонтирован путь журналов ClickHouse, в байтах. Рекомендуется иметь не менее 10 ГБ для журналов.
FilesystemLogsPathTotalINodes
Общее количество inode на том томе, где смонтирован путь журналов ClickHouse.
FilesystemLogsPathUsedBytes
Использованные байты на том томе, где смонтирован путь журналов ClickHouse.
FilesystemLogsPathUsedINodes
Количество использованных inode на том томе, где смонтирован путь журналов ClickHouse.
FilesystemMainPathAvailableBytes
Доступные байты на том томе, где смонтирован основной путь ClickHouse.
FilesystemMainPathAvailableINodes
Количество доступных inode на том томе, где смонтирован основной путь ClickHouse. Если оно близко к нулю, это указывает на неправильную конфигурацию, и вы получите "нет места на устройстве", даже если диск не заполнен.
FilesystemMainPathTotalBytes
Размер тома, на котором смонтирован основной путь ClickHouse, в байтах.
FilesystemMainPathTotalINodes
Общее количество inode на том томе, где смонтирован основной путь ClickHouse. Если их меньше 25 миллионов, это указывает на неправильную конфигурацию.
FilesystemMainPathUsedBytes
Использованные байты на том томе, где смонтирован основной путь ClickHouse.
FilesystemMainPathUsedINodes
Количество использованных inode на том томе, где смонтирован основной путь ClickHouse. Это значение в основном соответствует количеству файлов.
HTTPThreads
Количество потоков в сервере HTTP интерфейса (без TLS).
InterserverThreads
Количество потоков в сервере протокола связи реплик (без TLS).
Jitter
Разница во времени, когда поток для расчета асинхронных метрик был запланирован для пробуждения и временем, когда он фактически был пробужден. Условный индикатор общей задержки системы и отзывчивости.
LoadAverageN
Общая нагрузка системы, усредненная с экспоненциальным сглаживанием за 1 минуту. Нагрузка представляет собой количество потоков по всем процессам (сущности планирования ядра ОС), которые в настоящее время выполняются на CPU или ожидают IO, или готовы к выполнению, но на данный момент не планируются. Это число включает все процессы, а не только clickhouse-server. Число может превышать количество ядер CPU, если система перегружена, и многие процессы готовы к выполнению, но ждут CPU или IO.
MMapCacheCells
Количество файлов, открытых с использованием mmap
(отображенных в памяти). Это используется для запросов, в которых настройка local_filesystem_read_method
установлена в mmap
. Файлы, открытые с использованием mmap
, хранятся в кэше, чтобы избежать дорогостоящих сбросов TLB.
MarkCacheBytes
Общий размер кэша меток в байтах.
MarkCacheFiles
Общее количество файлов меток, кэшированных в кэше меток.
MaxPartCountForPartition
Максимальное количество частей в партиции по всем партициям всех таблиц семейства MergeTree. Значения, превышающие 300, указывают на неправильную конфигурацию, перегрузку или массовую загрузку данных.
MemoryCode
Количество виртуальной памяти, отображенной для страниц машинного кода процесса сервера, в байтах.
MemoryDataAndStack
Количество виртуальной памяти, отображенной для использования стека и для выделенной памяти, в байтах. Не уточняется, включает ли она стек пер-потоков и большую часть выделенной памяти, которая выделяется с помощью системного вызова 'mmap'. Эта метрика существует только для полноты. Рекомендуется использовать метрику MemoryResident
для мониторинга.
MemoryResidentMax
Максимальное количество физической памяти, используемой процессом сервера, в байтах.
MemoryResident
Количество физической памяти, используемой процессом сервера, в байтах.
MemoryShared
Количество памяти, используемой процессом сервера, которая также используется другими процессами, в байтах. ClickHouse не использует общую память, но часть памяти может быть помечена ОС как общая по своим причинам. Эта метрика не имеет большого смысла для наблюдения, и существует только для полноты.
MemoryVirtual
Размер пространства виртуальных адресов, выделенного процессом сервера, в байтах. Размер пространства виртуальных адресов обычно намного больше, чем потребление физической памяти, и не должен использоваться как оценка потребления памяти. Большие значения этой метрики абсолютно нормальны и имеют только технический смысл.
MySQLThreads
Количество потоков в сервере протокола совместимости MySQL.
NetworkReceiveBytes_name
Количество байтов, полученных через сетевой интерфейс. Это метрика, действующая на уровне системы, она включает все процессы на хост-машине, а не только clickhouse-server.
NetworkReceiveDrop_name
Количество байтов, потерянных в пакете при получении через сетевой интерфейс. Это метрика, действующая на уровне системы, она включает все процессы на хост-машине, а не только clickhouse-server.
NetworkReceiveErrors_name
Количество раз, когда произошла ошибка при получении через сетевой интерфейс. Это метрика, действующая на уровне системы, она включает все процессы на хост-машине, а не только clickhouse-server.
NetworkReceivePackets_name
Количество сетевых пакетов, полученных через сетевой интерфейс. Это метрика, действующая на уровне системы, она включает все процессы на хост-машине, а не только clickhouse-server.
NetworkSendBytes_name
Количество байтов, отправленных через сетевой интерфейс. Это метрика, действующая на уровне системы, она включает все процессы на хост-машине, а не только clickhouse-server.
NetworkSendDrop_name
Количество раз, когда пакет был потерян при отправке через сетевой интерфейс. Это метрика, действующая на уровне системы, она включает все процессы на хост-машине, а не только clickhouse-server.
NetworkSendErrors_name
Количество раз, когда произошла ошибка (например, повторная передача TCP) при отправке через сетевой интерфейс. Это метрика, действующая на уровне системы, она включает все процессы на хост-машине, а не только clickhouse-server.
NetworkSendPackets_name
Количество сетевых пакетов, отправленных через сетевой интерфейс. Это метрика, действующая на уровне системы, она включает все процессы на хост-машине, а не только clickhouse-server.
NumberOfDatabases
Общее количество баз данных на сервере.
NumberOfDetachedByUserParts
Общее количество частей, отделенных от таблиц MergeTree пользователями с помощью запроса ALTER TABLE DETACH
(в отличие от неожиданных, поврежденных или игнорируемых частей). Сервер не беспокоится о отделенных частях, и они могут быть удалены.
NumberOfDetachedParts
Общее количество частей, отделенных от таблиц MergeTree. Часть может быть отделена пользователем с помощью запроса ALTER TABLE DETACH
или самим сервером, если часть повреждена, неожиданна или ненужна. Сервер не беспокоится о отделенных частях, и они могут быть удалены.
NumberOfTables
Общее количество таблиц, суммированных по базам данных на сервере, исключая базы данных, которые не могут содержать таблицы MergeTree. Исключенные движки базы данных — это те, которые генерируют набор таблиц на лету, такие как Lazy
, MySQL
, PostgreSQL
, SQlite
.
OSContextSwitches
Количество переключений контекста, которые система пережила на хост-машине. Это метрика, действующая на уровне системы, она включает все процессы на хост-машине, а не только clickhouse-server.
OSGuestNiceTime
Соотношение времени, затраченного на запуск виртуального CPU для гостевых операционных систем под управлением ядра Linux, когда гость был установлен на более высокий приоритет (См. man procfs
). Это метрика, действующая на уровне системы, она включает все процессы на хост-машине, а не только clickhouse-server. Эта метрика не имеет значения для ClickHouse, но все еще существует для полноты. Значение для одного ядра CPU будет в интервале [0..1]. Значение для всех ядер CPU рассчитывается как сумма по ним [0..число ядер].
OSGuestNiceTimeCPU_N
Соотношение времени, затраченного на запуск виртуального CPU для гостевых операционных систем под управлением ядра Linux, когда гость был установлен на более высокий приоритет (См. man procfs
). Это метрика, действующая на уровне системы, она включает все процессы на хост-машине, а не только clickhouse-server. Эта метрика не имеет значения для ClickHouse, но все еще существует для полноты. Значение для одного ядра CPU будет в интервале [0..1]. Значение для всех ядер CPU рассчитывается как сумма по ним [0..число ядер].
OSGuestNiceTimeNormalized
Значение похоже на OSGuestNiceTime
, но делится на количество ядер CPU, чтобы измеряться в интервале [0..1], независимо от числа ядер. Это позволяет вам усреднять значения этой метрики по нескольким серверам в кластере, даже если количество ядер не однородно, и все равно получать среднюю метрику использования ресурсов.
OSGuestTime
Соотношение времени, затраченного на запуск виртуального CPU для гостевых операционных систем под управлением ядра Linux (См. man procfs
). Это метрика, действующая на уровне системы, она включает все процессы на хост-машине, а не только clickhouse-server. Эта метрика не имеет значения для ClickHouse, но все еще существует для полноты. Значение для одного ядра CPU будет в интервале [0..1]. Значение для всех ядер CPU рассчитывается как сумма по ним [0..число ядер].
OSGuestTimeCPU_N
Соотношение времени, затраченного на запуск виртуального CPU для гостевых операционных систем под управлением ядра Linux (См. man procfs
). Это метрика, действующая на уровне системы, она включает все процессы на хост-машине, а не только clickhouse-server. Эта метрика не имеет значения для ClickHouse, но все еще существует для полноты. Значение для одного ядра CPU будет в интервале [0..1]. Значение для всех ядер CPU рассчитывается как сумма по ним [0..число ядер].
OSGuestTimeNormalized
Значение похоже на OSGuestTime
, но делится на количество ядер CPU для измерения в интервале [0..1], независимо от числа ядер. Это позволяет вам усреднять значения этой метрики по нескольким серверам в кластере, даже если количество ядер не однородно, и все равно получать среднюю метрику использования ресурсов.
OSIOWaitTime
Соотношение времени, когда ядро CPU не выполняло код, но когда ядро ОС не запускало никакой другой процесс на этом CPU, так как процессы ожидали IO. Это метрика, действующая на уровне системы, она включает все процессы на хост-машине, а не только clickhouse-server. Значение для одного ядра CPU будет в интервале [0..1]. Значение для всех ядер CPU рассчитывается как сумма по ним [0..число ядер].
OSIOWaitTimeCPU_N
Соотношение времени, когда ядро CPU не выполняло код, но когда ядро ОС не запускало никакой другой процесс на этом CPU, так как процессы ожидали IO. Это метрика, действующая на уровне системы, она включает все процессы на хост-машине, а не только clickhouse-server. Значение для одного ядра CPU будет в интервале [0..1]. Значение для всех ядер CPU рассчитывается как сумма по ним [0..число ядер].
OSIOWaitTimeNormalized
Значение похоже на OSIOWaitTime
, но делится на количество ядер CPU для измерения в интервале [0..1], независимо от числа ядер. Это позволяет вам усреднять значения этой метрики по нескольким серверам в кластере, даже если количество ядер не однородно, и все равно получать среднюю метрику использования ресурсов.
OSIdleTime
Соотношение времени, когда ядро CPU было бездействующим (даже не готовым запускать процесс ожидания IO) с точки зрения ядра ОС. Это метрика, действующая на уровне системы, она включает все процессы на хост-машине, а не только clickhouse-server. Это не включает время, когда CPU использовался недостаточно из-за причин, внутренних для CPU (загрузок памяти, задержек в конвейере, неправильных предсказаний ветвлений, работы другого ядра SMT). Значение для одного ядра CPU будет в интервале [0..1]. Значение для всех ядер CPU рассчитывается как сумма по ним [0..число ядер].
OSIdleTimeCPU_N
Соотношение времени, когда ядро CPU было бездействующим (даже не готовым запускать процесс ожидания IO) с точки зрения ядра ОС. Это метрика, действующая на уровне системы, она включает все процессы на хост-машине, а не только clickhouse-server. Это не включает время, когда CPU использовался недостаточно из-за причин, внутренних для CPU (загрузок памяти, задержек в конвейере, неправильных предсказаний ветвлений, работы другого ядра SMT). Значение для одного ядра CPU будет в интервале [0..1]. Значение для всех ядер CPU рассчитывается как сумма по ним [0..число ядер].
OSIdleTimeNormalized
Значение похоже на OSIdleTime
, но делится на количество ядер CPU для измерения в интервале [0..1], независимо от числа ядер. Это позволяет вам усреднять значения этой метрики по нескольким серверам в кластере, даже если количество ядер не однородно, и все равно получать среднюю метрику использования ресурсов.
OSInterrupts
Количество прерываний на хост-машине. Это метрика, действующая на уровне системы, она включает все процессы на хост-машине, а не только clickhouse-server.
OSIrqTime
Соотношение времени, затраченного на выполнение аппаратных запросов прерывания на CPU. Это метрика, действующая на уровне системы, она включает все процессы на хост-машине, а не только clickhouse-server. Высокое значение этой метрики может указывать на неправильную конфигурацию оборудования или очень высокую сетевую нагрузку. Значение для одного ядра CPU будет в интервале [0..1]. Значение для всех ядер CPU рассчитывается как сумма по ним [0..число ядер].
OSIrqTimeCPU_N
Соотношение времени, затраченного на выполнение аппаратных запросов прерывания на CPU. Это метрика, действующая на уровне системы, она включает все процессы на хост-машине, а не только clickhouse-server. Высокое значение этой метрики может указывать на неправильную конфигурацию оборудования или очень высокую сетевую нагрузку. Значение для одного ядра CPU будет в интервале [0..1]. Значение для всех ядер CPU рассчитывается как сумма по ним [0..число ядер].
OSIrqTimeNormalized
Значение похоже на OSIrqTime
, но делится на количество ядер CPU для измерения в интервале [0..1], независимо от числа ядер. Это позволяет вам усреднять значения этой метрики по нескольким серверам в кластере, даже если количество ядер не однородно, и все равно получать среднюю метрику использования ресурсов.
OSMemoryAvailable
Количество памяти, доступной для использования программами, в байтах. Это очень похоже на метрику OSMemoryFreePlusCached
. Это метрика, действующая на уровне системы, она включает все процессы на хост-машине, а не только clickhouse-server.
OSMemoryBuffers
Количество памяти, используемой буферами ядра ОС, в байтах. Обычно это должно быть небольшим, и большие значения могут указывать на неправильную конфигурацию ОС. Это метрика, действующая на уровне системы, она включает все процессы на хост-машине, а не только clickhouse-server.
OSMemoryCached
Количество памяти, используемой кэшем страниц ОС, в байтах. Обычно почти вся доступная память используется кэшем страниц ОС - высокие значения этой метрики нормальны и ожидаемы. Это метрика, действующая на уровне системы, она включает все процессы на хост-машине, а не только clickhouse-server.
OSMemoryFreePlusCached
Количество свободной памяти плюс память кэша страниц ОС на хост-системе, в байтах. Эта память доступна для использования программами. Значение должно быть очень похоже на OSMemoryAvailable
. Это метрика, действующая на уровне системы, она включает все процессы на хост-машине, а не только clickhouse-server.
OSMemoryFreeWithoutCached
Объем свободной памяти на хост-системе, в байтах. Это не включает память, используемую ОС для кэширования страниц, в байтах. Память кэша страниц также доступна для использования программами, поэтому значение этой метрики может быть запутанным. Вместо этого смотрите метрику OSMemoryAvailable
. Для удобства мы также предоставляем метрику OSMemoryFreePlusCached
, которая должна быть в некоторой степени аналогична OSMemoryAvailable. См. также https://www.linuxatemyram.com/. Это метрика, действующая на уровне всей системы, она включает все процессы на хост-машине, а не только clickhouse-server.
OSMemoryTotal
Общее количество памяти на хост-системе, в байтах.
OSNiceTime
Соотношение времени, в течение которого ядро CPU выполняло код пользовательского пространства с более высоким приоритетом. Это метрика, действующая на уровне всей системы, она включает все процессы на хост-машине, а не только clickhouse-server. Значение для одного ядра CPU будет в интервале [0..1]. Значение для всех ядер CPU вычисляется как сумма по ним [0..num cores].
OSNiceTimeCPU_N
Соотношение времени, в течение которого ядро CPU выполняло код пользовательского пространства с более высоким приоритетом. Это метрика, действующая на уровне всей системы, она включает все процессы на хост-машине, а не только clickhouse-server. Значение для одного ядра CPU будет в интервале [0..1]. Значение для всех ядер CPU вычисляется как сумма по ним [0..num cores].
OSNiceTimeNormalized
Значение похоже на OSNiceTime
, но делится на количество ядер CPU, чтобы быть измеренным в интервале [0..1], независимо от количества ядер. Это позволяет усреднять значения этой метрики на нескольких серверах в кластере, даже если количество ядер неравномерно, и все же получать среднюю метрику использования ресурсов.
OSOpenFiles
Общее количество открытых файлов на хост-машине. Это метрика, действующая на уровне всей системы, она включает все процессы на хост-машине, а не только clickhouse-server.
OSProcessesBlocked
Количество потоков, заблокированных в ожидании завершения ввода-вывода (man procfs
). Это метрика, действующая на уровне всей системы, она включает все процессы на хост-машине, а не только clickhouse-server.
OSProcessesCreated
Количество созданных процессов. Это метрика, действующая на уровне всей системы, она включает все процессы на хост-машине, а не только clickhouse-server.
OSProcessesRunning
Количество исполняемых (работающих или готовых к выполнению) потоков операционной системой. Это метрика, действующая на уровне всей системы, она включает все процессы на хост-машине, а не только clickhouse-server.
OSSoftIrqTime
Соотношение времени, затрачиваемого на выполнение программных прерываний на CPU. Это метрика, действующая на уровне всей системы, она включает все процессы на хост-машине, а не только clickhouse-server. Высокое значение этой метрики может указывать на неэффективное программное обеспечение, работающее в системе. Значение для одного ядра CPU будет в интервале [0..1]. Значение для всех ядер CPU вычисляется как сумма по ним [0..num cores].
OSSoftIrqTimeCPU_N
Соотношение времени, затрачиваемого на выполнение программных прерываний на CPU. Это метрика, действующая на уровне всей системы, она включает все процессы на хост-машине, а не только clickhouse-server. Высокое значение этой метрики может указывать на неэффективное программное обеспечение, работающее в системе. Значение для одного ядра CPU будет в интервале [0..1]. Значение для всех ядер CPU вычисляется как сумма по ним [0..num cores].
OSSoftIrqTimeNormalized
Значение похоже на OSSoftIrqTime
, но делится на количество ядер CPU, чтобы быть измеренным в интервале [0..1], независимо от количества ядер. Это позволяет усреднять значения этой метрики на нескольких серверах в кластере, даже если количество ядер неравномерно, и все же получать среднюю метрику использования ресурсов.
OSStealTime
Соотношение времени, проведенного в других операционных системах CPU при работе в виртуализированной среде. Это метрика, действующая на уровне всей системы, она включает все процессы на хост-машине, а не только clickhouse-server. Не каждая виртуализированная среда предоставляет эту метрику, и большинство из них этого не делает. Значение для одного ядра CPU будет в интервале [0..1]. Значение для всех ядер CPU вычисляется как сумма по ним [0..num cores].
OSStealTimeCPU_N
Соотношение времени, проведенного в других операционных системах CPU при работе в виртуализированной среде. Это метрика, действующая на уровне всей системы, она включает все процессы на хост-машине, а не только clickhouse-server. Не каждая виртуализированная среда предоставляет эту метрику, и большинство из них этого не делает. Значение для одного ядра CPU будет в интервале [0..1]. Значение для всех ядер CPU вычисляется как сумма по ним [0..num cores].
OSStealTimeNormalized
Значение похоже на OSStealTime
, но делится на количество ядер CPU, чтобы быть измеренным в интервале [0..1], независимо от количества ядер. Это позволяет усреднять значения этой метрики на нескольких серверах в кластере, даже если количество ядер неравномерно, и все же получать среднюю метрику использования ресурсов.
OSSystemTime
Соотношение времени, в течение которого ядро CPU выполняло код ядра ОС (системный код). Это метрика, действующая на уровне всей системы, она включает все процессы на хост-машине, а не только clickhouse-server. Значение для одного ядра CPU будет в интервале [0..1]. Значение для всех ядер CPU вычисляется как сумма по ним [0..num cores].
OSSystemTimeCPU_N
Соотношение времени, в течение которого ядро CPU выполняло код ядра ОС (системный код). Это метрика, действующая на уровне всей системы, она включает все процессы на хост-машине, а не только clickhouse-server. Значение для одного ядра CPU будет в интервале [0..1]. Значение для всех ядер CPU вычисляется как сумма по ним [0..num cores].
OSSystemTimeNormalized
Значение похоже на OSSystemTime
, но делится на количество ядер CPU, чтобы быть измеренным в интервале [0..1], независимо от количества ядер. Это позволяет усреднять значения этой метрики на нескольких серверах в кластере, даже если количество ядер неравномерно, и все же получать среднюю метрику использования ресурсов.
OSThreadsRunnable
Общее количество «выполняемых» потоков, как это видит планировщик ядра ОС.
OSThreadsTotal
Общее количество потоков, как это видит планировщик ядра ОС.
OSUptime
Время работы хост-сервера (машина, на которой работает ClickHouse), в секундах.
OSUserTime
Соотношение времени, в течение которого ядро CPU выполняло код пользовательского пространства. Это метрика, действующая на уровне всей системы, она включает все процессы на хост-машине, а не только clickhouse-server. Это также включает время, когда CPU был недостаточно использован по причинам, внутренним для CPU (нагрузки памяти, задержки в конвейере, неверные предсказания ветвления, работа другого SMT-ядра). Значение для одного ядра CPU будет в интервале [0..1]. Значение для всех ядер CPU вычисляется как сумма по ним [0..num cores].
OSUserTimeCPU_N
Соотношение времени, в течение которого ядро CPU выполняло код пользовательского пространства. Это метрика, действующая на уровне всей системы, она включает все процессы на хост-машине, а не только clickhouse-server. Это также включает время, когда CPU был недостаточно использован по причинам, внутренним для CPU (нагрузки памяти, задержки в конвейере, неверные предсказания ветвления, работа другого SMT-ядра). Значение для одного ядра CPU будет в интервале [0..1]. Значение для всех ядер CPU вычисляется как сумма по ним [0..num cores].
OSUserTimeNormalized
Значение похоже на OSUserTime
, но делится на количество ядер CPU, чтобы быть измеренным в интервале [0..1], независимо от количества ядер. Это позволяет усреднять значения этой метрики на нескольких серверах в кластере, даже если количество ядер неравномерно, и все же получать среднюю метрику использования ресурсов.
PostgreSQLThreads
Количество потоков в сервере протокола совместимости PostgreSQL.
QueryCacheBytes
Общий размер кэша запросов в байтах.
QueryCacheEntries
Общее количество записей в кэше запросов.
ReplicasMaxAbsoluteDelay
Максимальная разница в секундах между самой свежей реплицированной частью и самой свежей частью данных, которая еще должна быть реплицирована, среди реплицируемых таблиц. Очень высокое значение указывает на реплику без данных.
ReplicasMaxInsertsInQueue
Максимальное количество операций INSERT в очереди (еще не реплицированных) среди реплицируемых таблиц.
ReplicasMaxMergesInQueue
Максимальное количество операций слияния в очереди (еще не примененных) среди реплицируемых таблиц.
ReplicasMaxQueueSize
Максимальный размер очереди (в количестве операций, таких как get, merge) среди реплицируемых таблиц.
ReplicasMaxRelativeDelay
Максимальная разница между задержкой реплики и задержкой самой актуальной реплики той же таблицы среди реплицируемых таблиц.
ReplicasSumInsertsInQueue
Сумма операций INSERT в очереди (еще не реплицированных) среди реплицируемых таблиц.
ReplicasSumMergesInQueue
Сумма операций слияния в очереди (еще не примененных) среди реплицируемых таблиц.
ReplicasSumQueueSize
Суммарный размер очереди (в количестве операций, таких как get, merge) среди реплицируемых таблиц.
TCPThreads
Количество потоков в сервере протокола TCP (без TLS).
Temperature_N
Температура соответствующего устройства в ℃. Датчик может вернуть нереалистичное значение. Источник: /sys/class/thermal
Temperature_name
Температура, сообщаемая соответствующим аппаратным монитором и соответствующим датчиком в ℃. Датчик может вернуть нереалистичное значение. Источник: /sys/class/hwmon
TotalBytesOfMergeTreeTables
Общее количество байт (сжатых, включая данные и индексы), хранящихся во всех таблицах семейства MergeTree.
TotalPartsOfMergeTreeTables
Общее количество частей данных во всех таблицах семейства MergeTree. Числа, превышающие 10 000, негативно повлияют на время запуска сервера и могут указывать на неразумный выбор ключа партиционирования.
TotalPrimaryKeyBytesInMemory
Общее количество памяти (в байтах), используемое значениями первичного ключа (учитывает только активные части).
TotalPrimaryKeyBytesInMemoryAllocated
Общее количество памяти (в байтах), зарезервированное для значений первичного ключа (учитывает только активные части).
TotalRowsOfMergeTreeTables
Общее количество строк (записей), хранящихся во всех таблицах семейства MergeTree.
UncompressedCacheBytes
Общий размер несжатого кэша в байтах. Несжатый кэш обычно не улучшает производительность и должен в основном избегаться.
UncompressedCacheCells
Общее количество записей в несжатом кэше. Каждая запись представляет собой декомпрессированный блок данных. Несжатый кэш обычно не улучшает производительность и должен в основном избегаться.
Uptime
Время работы сервера в секундах. Включает время, затраченное на инициализацию сервера перед приемом соединений.
jemalloc.active
Внутренняя метрика низкоуровневого распределителя памяти (jemalloc). См. https://jemalloc.net/jemalloc.3.html
jemalloc.allocated
Внутренняя метрика низкоуровневого распределителя памяти (jemalloc). См. https://jemalloc.net/jemalloc.3.html
jemalloc.arenas.all.dirty_purged
Внутренняя метрика низкоуровневого распределителя памяти (jemalloc). См. https://jemalloc.net/jemalloc.3.html
jemalloc.arenas.all.muzzy_purged
Внутренняя метрика низкоуровневого распределителя памяти (jemalloc). См. https://jemalloc.net/jemalloc.3.html
jemalloc.arenas.all.pactive
Внутренняя метрика низкоуровневого распределителя памяти (jemalloc). См. https://jemalloc.net/jemalloc.3.html
jemalloc.arenas.all.pdirty
Внутренняя метрика низкоуровневого распределителя памяти (jemalloc). См. https://jemalloc.net/jemalloc.3.html
jemalloc.arenas.all.pmuzzy
Внутренняя метрика низкоуровневого распределителя памяти (jemalloc). См. https://jemalloc.net/jemalloc.3.html
jemalloc.background_thread.num_runs
Внутренняя метрика низкоуровневого распределителя памяти (jemalloc). См. https://jemalloc.net/jemalloc.3.html
jemalloc.background_thread.num_threads
Внутренняя метрика низкоуровневого распределителя памяти (jemalloc). См. https://jemalloc.net/jemalloc.3.html
jemalloc.background_thread.run_intervals
Внутренняя метрика низкоуровневого распределителя памяти (jemalloc). См. https://jemalloc.net/jemalloc.3.html
jemalloc.epoch
Внутренний инкрементальный номер обновления статистики jemalloc (распределитель памяти Джейсона Эванса), используемый во всех других метриках jemalloc
.
jemalloc.mapped
Внутренняя метрика низкоуровневого распределителя памяти (jemalloc). См. https://jemalloc.net/jemalloc.3.html
jemalloc.metadata
Внутренняя метрика низкоуровневого распределителя памяти (jemalloc). См. https://jemalloc.net/jemalloc.3.html
jemalloc.metadata_thp
Внутренняя метрика низкоуровневого распределителя памяти (jemalloc). См. https://jemalloc.net/jemalloc.3.html
jemalloc.resident
Внутренняя метрика низкоуровневого распределителя памяти (jemalloc). См. https://jemalloc.net/jemalloc.3.html
jemalloc.retained
Внутренняя метрика низкоуровневого распределителя памяти (jemalloc). См. https://jemalloc.net/jemalloc.3.html
jemalloc.prof.active
Внутренняя метрика низкоуровневого распределителя памяти (jemalloc). См. https://jemalloc.net/jemalloc.3.html
См. также
- Мониторинг — Основные концепции мониторинга ClickHouse.
- system.metrics — Содержит мгновенно вычисляемые метрики.
- system.events — Содержит множество событий, которые произошли.
- system.metric_log — Содержит историю значений метрик из таблиц
system.metrics
иsystem.events
.