--- machine_translated: true --- # Método de codificación de datos: {#clickhouse-copier} Copia datos de las tablas de un clúster en tablas de otro (o del mismo) clúster. Puede ejecutar varios `clickhouse-copier` instancias en diferentes servidores para realizar el mismo trabajo. ZooKeeper se utiliza para sincronizar los procesos. Después de comenzar, `clickhouse-copier`: - Se conecta a ZooKeeper y recibe: - Copia de trabajos. - El estado de los trabajos de copia. - Realiza los trabajos. Cada proceso en ejecución elige el “closest” el fragmento del clúster de origen y copia los datos en el clúster de destino, reafirmando los datos si es necesario. `clickhouse-copier` realiza un seguimiento de los cambios en ZooKeeper y los aplica sobre la marcha. Para reducir el tráfico de red, recomendamos ejecutar `clickhouse-copier` en el mismo servidor donde se encuentran los datos de origen. ## Ejecución de clickhouse-copiadora {#running-clickhouse-copier} La utilidad debe ejecutarse manualmente: ``` bash $ clickhouse-copier copier --daemon --config zookeeper.xml --task-path /task/path --base-dir /path/to/dir ``` Parámetros: - `daemon` — Empezar `clickhouse-copier` en modo demonio. - `config` — El camino hacia el `zookeeper.xml` con los parámetros para la conexión a ZooKeeper. - `task-path` — La ruta al nodo ZooKeeper. Este nodo se utiliza para la sincronización `clickhouse-copier` procesos y tareas de almacenamiento. Las tareas se almacenan en `$task-path/description`. - `task-file` - Ruta opcional al archivo con la configuración de la tarea para la carga inicial a ZooKeeper. - `task-upload-force` — Fuerza de carga `task-file` incluso si el nodo ya existe. - `base-dir` — La ruta a los registros y archivos auxiliares. Cuando comienza, `clickhouse-copier` crear `clickhouse-copier_YYYYMMHHSS_` subdirectorios en `$base-dir`. Si se omite este parámetro, los directorios se crean en el directorio donde `clickhouse-copier` se puso en marcha. ## Formato de zookeeper.XML {#format-of-zookeeper-xml} ``` xml trace 100M 3 127.0.0.1 2181 ``` ## Configuración de tareas de copia {#configuration-of-copying-tasks} ``` xml false 127.0.0.1 9000 ... ... 2 1 0 3 1 source_cluster test hits destination_cluster test hits2 ENGINE=ReplicatedMergeTree('/clickhouse/tables/{cluster}/{shard}/hits2', '{replica}') PARTITION BY toMonday(date) ORDER BY (CounterID, EventDate) jumpConsistentHash(intHash64(UserID), 2) CounterID != 0 '2018-02-26' '2018-03-05' ... ... ... ``` `clickhouse-copier` seguimiento de los cambios en `/task/path/description` y los aplica sobre la marcha. Por ejemplo, si cambia el valor de `max_workers`, el número de procesos que ejecutan tareas también cambiará. [Artículo Original](https://clickhouse.tech/docs/es/operations/utils/clickhouse-copier/)