ClickHouse/docs/zh/operations/monitoring.md
Ivan Blinkov 2e1f6bc56d
[experimental] add "es" docs language as machine translated draft (#9787)
* replace exit with assert in test_single_page

* improve save_raw_single_page docs option

* More grammar fixes

* "Built from" link in new tab

* fix mistype

* Example of include in docs

* add anchor to meeting form

* Draft of translation helper

* WIP on translation helper

* Replace some fa docs content with machine translation

* add normalize-en-markdown.sh

* normalize some en markdown

* normalize some en markdown

* admonition support

* normalize

* normalize

* normalize

* support wide tables

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* lightly edited machine translation of introdpection.md

* lightly edited machhine translation of lazy.md

* WIP on translation utils

* Normalize ru docs

* Normalize other languages

* some fixes

* WIP on normalize/translate tools

* add requirements.txt

* [experimental] add es docs language as machine translated draft

* remove duplicate script

* Back to wider tab-stop (narrow renders not so well)
2020-03-21 07:11:51 +03:00

2.0 KiB
Raw Blame History

监控

可以监控到:

  • 硬件资源的利用率。
  • ClickHouse 服务的指标。

硬件资源利用率

ClickHouse 本身不会去监控硬件资源的状态。

强烈推荐监控以下监控项:

  • 处理器上的负载和温度。

    可以使用 [dmesg](https://en.wikipedia.org/wiki/Dmesg), [turbostat](https://www.linux.org/docs/man8/turbostat.html) 或者其他工具。
    
  • 磁盘存储RAM和网络的使用率。

ClickHouse 服务的指标。

ClickHouse服务本身具有用于自我状态监视指标。

要跟踪服务器事件,请观察服务器日志。 请参阅配置文件的[logger]server_settings/settings.md#server_settings-logger部分。

ClickHouse 收集的指标项:

  • 服务用于计算的资源占用的各种指标。
  • 关于查询处理的常见统计信息。

可以在 system.metrics system.events 以及system.asynchronous_metrics 等系统表查看所有的指标项。

可以配置ClickHouse 往 Graphite导入指标。 参考 Graphite section 配置文件。在配置指标导出之前需要参考Graphite官方教程搭建服务。

此外您可以通过HTTP API监视服务器可用性。 将HTTP GET请求发送到 /ping。 如果服务器可用,它将以 200 OK 响应。

要监视服务器集群的配置中,应设置max_replica_delay_for_distributed_queries参数并使用HTTP资源/replicas_status。 如果副本可用,并且不延迟在其他副本之后,则对/replicas_status的请求将返回200 OK。 如果副本滞后,请求将返回 503 HTTP_SERVICE_UNAVAILABLE,包括有关待办事项大小的信息。