ClickHouse/docs/ru/operations/monitoring.md
Anna a6fb067a75
DOCSUP-1915: Split system-table.md into separate files. (#13160)
* Corrected en files

* Split system-tables.md into separate files

* Fixed links.

* Fixed links.

* Fixed links.

* Fixed links.

* Add ref to original article

* Fixed links

* Add toc_folder_title and translate

* Add stack_trace.md, correct toc-title

* Fixed links

* Hypothesis testing

* Hypothesis testing

* Update run.sh, thanks @azat

Co-authored-by: Anna Devyatova <annadevyatova@yandex-team.ru>
Co-authored-by: Sergei Shtykov <bayonet@yandex-team.ru>
Co-authored-by: alexey-milovidov <milovidov@yandex-team.ru>
2020-08-06 11:50:29 +03:00

3.9 KiB
Raw Blame History

Мониторинг

Вы можете отслеживать:

  • Использование аппаратных ресурсов.
  • Метрики сервера ClickHouse.

Использование ресурсов

ClickHouse не отслеживает состояние аппаратных ресурсов самостоятельно.

Рекомендуем контролировать:

  • Загрузку и температуру процессоров.

    Можно использовать [dmesg](https://en.wikipedia.org/wiki/Dmesg), [turbostat](https://www.linux.org/docs/man8/turbostat.html) или другие инструменты.
    
  • Использование системы хранения, оперативной памяти и сети.

Метрики сервера ClickHouse

Сервер ClickHouse имеет встроенные инструменты мониторинга.

Для отслеживания событий на сервере используйте логи. Подробнее смотрите в разделе конфигурационного файла logger.

ClickHouse собирает:

  • Различные метрики того, как сервер использует вычислительные ресурсы.
  • Общую статистику обработки запросов.

Метрики находятся в таблицах system.metrics, system.events и system.asynchronous_metrics.

Можно настроить экспорт метрик из ClickHouse в Graphite. Смотрите секцию graphite конфигурационного файла ClickHouse. Перед настройкой экспорта метрик необходимо настроить Graphite, как указано в официальном руководстве.

Можно настроить экспорт метрик из ClickHouse в Prometheus. Смотрите prometheus конфигурационного файла ClickHouse. Перед настройкой экспорта метрик необходимо настроить Prometheus, как указано в официальном руководстве.

Также, можно отслеживать доступность сервера через HTTP API. Отправьте HTTP GET к ресурсу /ping. Если сервер доступен, он отвечает 200 OK.

Для мониторинга серверов в кластерной конфигурации необходимо установить параметр max_replica_delay_for_distributed_queries и использовать HTTP ресурс /replicas_status. Если реплика доступна и не отстаёт от других реплик, то запрос к /replicas_status возвращает 200 OK. Если реплика отстаёт, то запрос возвращает 503 HTTP_SERVICE_UNAVAILABLE, включая информацию о размере отставания.

Оригинальная статья