ClickHouse/docs/es/operations/monitoring.md
2020-10-13 20:23:29 +03:00

3.0 KiB

machine_translated machine_translated_rev toc_priority toc_title
true 72537a2d52 45 Monitoreo

Monitoreo

Usted puede monitorear:

  • Utilización de recursos de hardware.
  • Métricas del servidor ClickHouse.

Utilización de recursos

ClickHouse no supervisa el estado de los recursos de hardware por sí mismo.

Se recomienda encarecidamente configurar la supervisión para:

  • Carga y temperatura en los procesadores.

    Usted puede utilizar dmesg, Turbostat u otros instrumentos.

  • Utilización del sistema de almacenamiento, RAM y red.

Métricas del servidor ClickHouse

El servidor ClickHouse tiene instrumentos integrados para el monitoreo de estado propio.

Para realizar un seguimiento de los eventos del servidor, use los registros del servidor. Ver el registrador sección del archivo de configuración.

ClickHouse recoge:

  • Diferentes métricas de cómo el servidor utiliza recursos computacionales.
  • Estadísticas comunes sobre el procesamiento de consultas.

Puede encontrar métricas en el sistema.métricas, sistema.evento, y sistema.asynchronous_metrics tabla.

Puede configurar ClickHouse para exportar métricas a Grafito. Ver el Sección de grafito en el archivo de configuración del servidor ClickHouse. Antes de configurar la exportación de métricas, debe configurar Graphite siguiendo sus guiar.

Puede configurar ClickHouse para exportar métricas a Prometeo. Ver el Sección Prometheus en el archivo de configuración del servidor ClickHouse. Antes de configurar la exportación de métricas, debe configurar Prometheus siguiendo su oficial guiar.

Además, puede supervisar la disponibilidad del servidor a través de la API HTTP. Enviar el HTTP GET solicitud de /ping. Si el servidor está disponible, responde con 200 OK.

Para supervisar servidores en una configuración de clúster, debe establecer max_replica_delay_for_distributed_queries parámetro y utilizar el recurso HTTP /replicas_status. Una solicitud para /replicas_status devoluciones 200 OK si la réplica está disponible y no se retrasa detrás de las otras réplicas. Si una réplica se retrasa, devuelve 503 HTTP_SERVICE_UNAVAILABLE con información sobre la brecha.