ClickHouse/docs/fr/operations/monitoring.md
Ivan Blinkov d91c97d15d
[docs] replace underscores with hyphens (#10606)
* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
2020-04-30 21:19:18 +03:00

2.7 KiB
Raw Blame History

machine_translated machine_translated_rev toc_priority toc_title
true f865c9653f 45 Surveiller

Surveiller

Vous pouvez surveiller:

  • Lutilisation des ressources matérielles.
  • Statistiques du serveur ClickHouse.

LUtilisation Des Ressources

ClickHouse ne surveille pas létat des ressources matérielles par lui-même.

Il est fortement recommandé de configurer la surveillance de:

  • Charge et température sur les processeurs.

    Vous pouvez utiliser dmesg, turbostat ou dautres instruments.

  • Utilisation du système de stockage, de la RAM et du réseau.

Métriques Du Serveur Clickhouse

Clickhouse server a des instruments embarqués pour la surveillance de lauto-état.

Pour suivre les événements du serveur, utilisez les journaux du serveur. Voir la enregistreur section du fichier de configuration.

Clickhouse recueille:

  • Différentes mesures de la façon dont le serveur utilise les ressources de calcul.
  • Statistiques communes sur le traitement des requêtes.

Vous pouvez trouver des mesures dans le système.métrique, système.événement, et système.asynchronous_metrics table.

Vous pouvez configurer ClickHouse pour exporter des métriques vers Graphite. Voir la Graphite section dans le fichier de configuration du serveur ClickHouse. Avant de configurer lexportation des métriques, vous devez configurer Graphite en suivant leur guide.

De plus, vous pouvez surveiller la disponibilité du serveur via LAPI HTTP. Envoyer la HTTP GET demande à /ping. Si le serveur est disponible, il répond avec 200 OK.

Pour surveiller les serveurs dans une configuration de cluster, vous devez max_replica_delay_for_distributed_queries paramètre et utiliser la ressource HTTP /replicas_status. Une demande de /replicas_status retourner 200 OK si la réplique est disponible et nest pas retardé derrière les autres réplicas. Si une réplique est retardée, elle revient 503 HTTP_SERVICE_UNAVAILABLE avec des informations sur lécart.