* replace exit with assert in test_single_page * improve save_raw_single_page docs option * More grammar fixes * "Built from" link in new tab * fix mistype * Example of include in docs * add anchor to meeting form * Draft of translation helper * WIP on translation helper * Replace some fa docs content with machine translation * add normalize-en-markdown.sh * normalize some en markdown * normalize some en markdown * admonition support * normalize * normalize * normalize * support wide tables * normalize * normalize * normalize * normalize * normalize * normalize * normalize * normalize * normalize * normalize * normalize * normalize * normalize * lightly edited machine translation of introdpection.md * lightly edited machhine translation of lazy.md * WIP on translation utils * Normalize ru docs * Normalize other languages * some fixes * WIP on normalize/translate tools * add requirements.txt * [experimental] add es docs language as machine translated draft * remove duplicate script * Back to wider tab-stop (narrow renders not so well) * Links to nowhere check at least for English * use f string * More complete es translation
20 KiB
Pruebas de ClickHouse
Pruebas funcionales
Las pruebas funcionales son las más simples y cómodas de usar. La mayoría de las características de ClickHouse se pueden probar con pruebas funcionales y son obligatorias para cada cambio en el código de ClickHouse que se puede probar de esa manera.
Cada prueba funcional envía una o varias consultas al servidor ClickHouse en ejecución y compara el resultado con la referencia.
Las pruebas se encuentran en dbms/tests/queries
Directorio. Hay dos subdirectorios: stateless
y stateful
. Las pruebas sin estado ejecutan consultas sin datos de prueba precargados: a menudo crean pequeños conjuntos de datos sintéticos sobre la marcha, dentro de la prueba misma. Las pruebas estatales requieren datos de prueba precargados de Yandex.Métrica y no está disponible para el público en general. Tendemos a usar sólo stateless
pruebas y evitar la adición de nuevos stateful
prueba.
Cada prueba puede ser de dos tipos: .sql
y .sh
. .sql
prueba es el script SQL simple que se canaliza a clickhouse-client --multiquery --testmode
. .sh
test es un script que se ejecuta por sí mismo.
Para ejecutar todas las pruebas, use dbms/tests/clickhouse-test
herramienta. Mira --help
para la lista de posibles opciones. Simplemente puede ejecutar todas las pruebas o ejecutar un subconjunto de pruebas filtradas por subcadena en el nombre de la prueba: ./clickhouse-test substring
.
La forma más sencilla de invocar pruebas funcionales es copiar clickhouse-client
Naciones /usr/bin/
, ejecutar clickhouse-server
y luego ejecutar ./clickhouse-test
de su propio directorio.
Atracciones cercanas al hotel .sql
o .sh
archivo en dbms/tests/queries/0_stateless
directorio, compruébelo manualmente y luego genere .reference
archivo de la siguiente manera: clickhouse-client -n --testmode < 00000_test.sql > 00000_test.reference
o ./00000_test.sh > ./00000_test.reference
.
Las pruebas deben usar (crear, soltar, etc.) solo tablas en test
base de datos que se supone que se crea de antemano; también las pruebas pueden usar tablas temporales.
Si desea utilizar consultas distribuidas en pruebas funcionales, puede aprovechar remote
función de la tabla con 127.0.0.{1..2}
direcciones para que el servidor se consulte; o puede usar clústeres de prueba predefinidos en el archivo de configuración del servidor como test_shard_localhost
.
Algunas pruebas están marcadas con zookeeper
, shard
o long
en sus nombres.
zookeeper
es para pruebas que están usando ZooKeeper. shard
es para pruebas que
Requiere servidor para escuchar 127.0.0.*
; distributed
o global
Tienen el mismo
significado. long
es para pruebas que duran un poco más de un segundo. Usted puede
Deshabilitar estos grupos de pruebas utilizando --no-zookeeper
, --no-shard
y
--no-long
opciones, respectivamente.
Errores conocidos
Si conocemos algunos errores que se pueden reproducir fácilmente mediante pruebas funcionales, colocamos pruebas funcionales preparadas en dbms/tests/queries/bugs
directorio. Estas pruebas se moverán a dbms/tests/queries/0_stateless
cuando se corrigen errores.
Pruebas de integración
Las pruebas de integración permiten probar ClickHouse en la configuración agrupada y la interacción de ClickHouse con otros servidores como MySQL, Postgres, MongoDB. Son útiles para emular divisiones de red, caídas de paquetes, etc. Estas pruebas se ejecutan bajo Docker y crean múltiples contenedores con varios software.
Ver dbms/tests/integration/README.md
sobre cómo ejecutar estas pruebas.
Tenga en cuenta que la integración de ClickHouse con controladores de terceros no se ha probado. Además, actualmente no tenemos pruebas de integración con nuestros controladores JDBC y ODBC.
Pruebas unitarias
Las pruebas unitarias son útiles cuando desea probar no ClickHouse como un todo, sino una sola biblioteca o clase aislada. Puede habilitar o deshabilitar la compilación de pruebas con ENABLE_TESTS
Opción CMake. Las pruebas unitarias (y otros programas de prueba) se encuentran en tests
subdirectorios en todo el código. Para ejecutar pruebas unitarias, escriba ninja test
. Algunas pruebas usan gtest
, pero algunos son solo programas que devuelven un código de salida distinto de cero en caso de fallo de prueba.
No es necesariamente tener pruebas unitarias si el código ya está cubierto por pruebas funcionales (y las pruebas funcionales suelen ser mucho más simples de usar).
Pruebas de rendimiento
Las pruebas de rendimiento permiten medir y comparar el rendimiento de alguna parte aislada de ClickHouse en consultas sintéticas. Las pruebas se encuentran en dbms/tests/performance
. Cada prueba está representada por .xml
archivo con la descripción del caso de prueba. Las pruebas se ejecutan con clickhouse performance-test
herramienta (que está incrustada en clickhouse
binario). Ver --help
para la invocación.
Cada prueba ejecuta una o múltiples consultas (posiblemente con combinaciones de parámetros) en un bucle con algunas condiciones para stop (como “maximum execution speed is not changing in three seconds”) y medir algunas métricas sobre el rendimiento de las consultas (como “maximum execution speed”). Algunas pruebas pueden contener condiciones previas en el conjunto de datos de pruebas precargado.
Si desea mejorar el rendimiento de ClickHouse en algún escenario, y si se pueden observar mejoras en consultas simples, se recomienda encarecidamente escribir una prueba de rendimiento. Siempre tiene sentido usar perf top
u otras herramientas de perf durante sus pruebas.
Herramientas de prueba y secuencias de comandos
Algunos programas en tests
directorio no son pruebas preparadas, pero son herramientas de prueba. Por ejemplo, párr Lexer
hay una herramienta dbms/src/Parsers/tests/lexer
que solo hacen la tokenización de stdin y escriben el resultado coloreado en stdout. Puede usar este tipo de herramientas como ejemplos de código y para exploración y pruebas manuales.
También puede colocar un par de archivos .sh
y .reference
junto con la herramienta para ejecutarlo en alguna entrada predefinida, entonces el resultado del script se puede comparar con .reference
file. Este tipo de pruebas no están automatizadas.
Pruebas misceláneas
Hay pruebas para diccionarios externos ubicados en dbms/tests/external_dictionaries
y para modelos aprendidos a máquina en dbms/tests/external_models
. Estas pruebas no se actualizan y deben transferirse a pruebas de integración.
Hay una prueba separada para inserciones de quórum. Esta prueba ejecuta el clúster ClickHouse en servidores separados y emula varios casos de fallas: división de red, caída de paquetes (entre nodos ClickHouse, entre ClickHouse y ZooKeeper, entre el servidor ClickHouse y el cliente, etc.), kill -9
, kill -STOP
y kill -CONT
, como Jepsen. A continuación, la prueba comprueba que todas las inserciones reconocidas se escribieron y todas las inserciones rechazadas no.
La prueba de quórum fue escrita por un equipo separado antes de que ClickHouse fuera de código abierto. Este equipo ya no trabaja con ClickHouse. La prueba fue escrita accidentalmente en Java. Por estas razones, la prueba de quórum debe reescribirse y trasladarse a pruebas de integración.
Pruebas manuales
Cuando desarrolla una nueva característica, es razonable probarla también manualmente. Puede hacerlo con los siguientes pasos:
Construir ClickHouse. Ejecute ClickHouse desde el terminal: cambie el directorio a dbms/src/programs/clickhouse-server
y ejecutarlo con ./clickhouse-server
. Se utilizará la configuración (config.xml
, users.xml
y archivos dentro de config.d
y users.d
directorios) desde el directorio actual de forma predeterminada. Para conectarse al servidor ClickHouse, ejecute dbms/src/programs/clickhouse-client/clickhouse-client
.
Tenga en cuenta que todas las herramientas de clickhouse (servidor, cliente, etc.) son solo enlaces simbólicos a un único binario llamado clickhouse
. Puede encontrar este binario en dbms/src/programs/clickhouse
. Todas las herramientas también se pueden invocar como clickhouse tool
es lugar de clickhouse-tool
.
Alternativamente, puede instalar el paquete ClickHouse: ya sea una versión estable del repositorio de Yandex o puede crear un paquete para usted con ./release
en la raíz de fuentes de ClickHouse. Luego inicie el servidor con sudo service clickhouse-server start
(o detener para detener el servidor). Busque registros en /etc/clickhouse-server/clickhouse-server.log
.
Cuando ClickHouse ya está instalado en su sistema, puede crear un nuevo clickhouse
binario y reemplazar el binario existente:
$ sudo service clickhouse-server stop
$ sudo cp ./clickhouse /usr/bin/
$ sudo service clickhouse-server start
También puede detener el servidor de clickhouse del sistema y ejecutar el suyo propio con la misma configuración pero con el registro en la terminal:
$ sudo service clickhouse-server stop
$ sudo -u clickhouse /usr/bin/clickhouse server --config-file /etc/clickhouse-server/config.xml
Ejemplo con gdb:
$ sudo -u clickhouse gdb --args /usr/bin/clickhouse server --config-file /etc/clickhouse-server/config.xml
Si el servidor de clickhouse del sistema ya se está ejecutando y no desea detenerlo, puede cambiar los números de config.xml
(o anularlos en un archivo en config.d
directorio), proporcione la ruta de datos adecuada y ejecútela.
clickhouse
binary casi no tiene dependencias y funciona en una amplia gama de distribuciones de Linux. Para probar rápidamente y sucio sus cambios en un servidor, simplemente puede scp
su fresco construido clickhouse
binario a su servidor y luego ejecútelo como en los ejemplos anteriores.
Entorno de prueba
Antes de publicar la versión como estable, la implementamos en el entorno de prueba. El entorno de prueba es un clúster que procesa 1/39 parte de El Yandex.Métrica datos. Compartimos nuestro entorno de pruebas con Yandex.Equipo de Metrica. ClickHouse se actualiza sin tiempo de inactividad sobre los datos existentes. Nos fijamos en un primer momento que los datos se procesan con éxito sin retraso de tiempo real, la replicación continúan trabajando y no hay problemas visibles para Yandex.Equipo de Metrica. La primera comprobación se puede hacer de la siguiente manera:
SELECT hostName() AS h, any(version()), any(uptime()), max(UTCEventTime), count() FROM remote('example01-01-{1..3}t', merge, hits) WHERE EventDate >= today() - 2 GROUP BY h ORDER BY h;
En algunos casos también implementamos en el entorno de prueba de nuestros equipos de amigos en Yandex: Market, Cloud, etc. También tenemos algunos servidores de hardware que se utilizan con fines de desarrollo.
Pruebas de carga
Después de implementar en el entorno de prueba, ejecutamos pruebas de carga con consultas del clúster de producción. Esto se hace manualmente.
Asegúrese de que ha habilitado query_log
en su clúster de producción.
Recopilar el registro de consultas para un día o más:
$ clickhouse-client --query="SELECT DISTINCT query FROM system.query_log WHERE event_date = today() AND query LIKE '%ym:%' AND query NOT LIKE '%system.query_log%' AND type = 2 AND is_initial_query" > queries.tsv
Este es un ejemplo complicado. type = 2
filtrará las consultas que se ejecutan correctamente. query LIKE '%ym:%'
es seleccionar consultas relevantes de Yandex.Métrica. is_initial_query
es seleccionar solo las consultas iniciadas por el cliente, no por ClickHouse (como partes del procesamiento de consultas distribuidas).
scp
este registro en su clúster de prueba y ejecútelo de la siguiente manera:
$ clickhouse benchmark --concurrency 16 < queries.tsv
(probablemente también desee especificar un --user
)
Luego déjalo por una noche o un fin de semana e ir a tomar un descanso.
Usted debe comprobar que clickhouse-server
no se bloquea, la huella de memoria está limitada y el rendimiento no se degrada con el tiempo.
Los tiempos de ejecución de consultas precisos no se registran y no se comparan debido a la alta variabilidad de las consultas y el entorno.
Pruebas de construcción
Las pruebas de compilación permiten verificar que la compilación no esté rota en varias configuraciones alternativas y en algunos sistemas extranjeros. Las pruebas se encuentran en ci
directorio. Ejecutan compilación desde la fuente dentro de Docker, Vagrant y, a veces, con qemu-user-static
dentro de Docker. Estas pruebas están en desarrollo y las ejecuciones de pruebas no están automatizadas.
Motivación:
Normalmente lanzamos y ejecutamos todas las pruebas en una sola variante de compilación ClickHouse. Pero hay variantes de construcción alternativas que no se prueban a fondo. Ejemplos:
- construir en FreeBSD;
- construir en Debian con bibliotecas de paquetes del sistema;
- Construir con enlaces compartidos de bibliotecas;
- construir en la plataforma AArch64;
- Construir en la plataforma PowerPc.
Por ejemplo, construir con paquetes del sistema es una mala práctica, porque no podemos garantizar qué versión exacta de paquetes tendrá un sistema. Pero esto es realmente necesario para los mantenedores de Debian. Por esta razón, al menos tenemos que admitir esta variante de construcción. Otro ejemplo: la vinculación compartida es una fuente común de problemas, pero es necesaria para algunos entusiastas.
Aunque no podemos ejecutar todas las pruebas en todas las variantes de compilaciones, queremos verificar al menos que varias variantes de compilación no estén rotas. Para este propósito utilizamos pruebas de construcción.
Pruebas de compatibilidad de protocolos
Cuando ampliamos el protocolo de red ClickHouse, probamos manualmente que el antiguo clickhouse-client funciona con el nuevo clickhouse-server y el nuevo clickhouse-client funciona con el antiguo clickhouse-server (simplemente ejecutando binarios de los paquetes correspondientes).
Ayuda del compilador
Código principal de ClickHouse (que se encuentra en dbms
Directorio) se construye con -Wall -Wextra -Werror
y con algunas advertencias habilitadas adicionales. Aunque estas opciones no están habilitadas para bibliotecas de terceros.
Clang tiene advertencias aún más útiles: puedes buscarlas con -Weverything
y elige algo para la compilación predeterminada.
Para las compilaciones de producción, se usa gcc (todavía genera un código ligeramente más eficiente que clang). Para el desarrollo, el clang suele ser más conveniente de usar. Puede construir en su propia máquina con el modo de depuración (para ahorrar batería de su computadora portátil), pero tenga en cuenta que el compilador puede generar más advertencias con -O3
debido a un mejor flujo de control y análisis entre procedimientos. Al construir con clang, libc++
se utiliza en lugar de libstdc++
y al construir con el modo de depuración, la versión de depuración de libc++
se utiliza que permite detectar más errores en tiempo de ejecución.
Desinfectantes
Dirección desinfectante. Ejecutamos pruebas funcionales y de integración bajo ASan por compromiso.
Valgrind (Memcheck).
Realizamos pruebas funcionales bajo Valgrind durante la noche. Se tarda varias horas. Actualmente hay un falso positivo conocido en re2
Biblioteca, ver este artículo.
Desinfectante de comportamiento indefinido. Ejecutamos pruebas funcionales y de integración bajo ASan por compromiso.
Desinfectante de hilo. Ejecutamos pruebas funcionales bajo TSan por compromiso. Todavía no ejecutamos pruebas de integración bajo TSan por compromiso.
Desinfectante de memoria. Actualmente todavía no usamos MSan.
Asignador de depuración.
Versión de depuración de jemalloc
se utiliza para la compilación de depuración.
Fuzzing
Usamos una prueba de fuzz simple para generar consultas SQL aleatorias y para verificar que el servidor no muera. Las pruebas de pelusa se realizan con el desinfectante Address. Lo puedes encontrar en 00746_sql_fuzzy.pl
. Esta prueba debe ejecutarse de forma continua (de la noche a la mañana y más).
A partir de diciembre de 2018, todavía no usamos pruebas de fuzz aisladas del código de la biblioteca.
Auditoría de seguridad
La gente del departamento de Yandex Cloud hace una visión general básica de las capacidades de ClickHouse desde el punto de vista de la seguridad.
Analizadores estáticos
Corremos PVS-Studio
por compromiso. Hemos evaluado clang-tidy
, Coverity
, cppcheck
, PVS-Studio
, tscancode
. Encontrará instrucciones de uso en dbms/tests/instructions/
directorio. También puedes leer el artículo en ruso.
Si usted estados unidos CLion
Como IDE, puede aprovechar algunos clang-tidy
comprueba fuera de la caja.
Endurecer
FORTIFY_SOURCE
se utiliza de forma predeterminada. Es casi inútil, pero todavía tiene sentido en casos raros y no lo desactivamos.
Estilo de código
Se describen las reglas de estilo de código aqui.
Para comprobar si hay algunas violaciones de estilo comunes, puede usar utils/check-style
script.
Para forzar el estilo adecuado de su código, puede usar clang-format
. File .clang-format
se encuentra en la raíz de las fuentes. Se corresponde principalmente con nuestro estilo de código real. Pero no se recomienda aplicar clang-format
a los archivos existentes porque empeora el formato. Usted puede utilizar clang-format-diff
herramienta que puede encontrar en el repositorio de origen clang.
Alternativamente, puede intentar uncrustify
herramienta para reformatear su código. La configuración está en uncrustify.cfg
en la raíz de las fuentes. Es menos probado que clang-format
.
CLion
tiene su propio formateador de código que debe ajustarse para nuestro estilo de código.
Pruebas Metrica B2B
Cada lanzamiento de ClickHouse se prueba con los motores Yandex Metrica y AppMetrica. Las pruebas y las versiones estables de ClickHouse se implementan en máquinas virtuales y se ejecutan con una copia pequeña del motor Metrica que procesa una muestra fija de datos de entrada. A continuación, los resultados de dos instancias del motor Metrica se comparan juntos.
Estas pruebas son automatizadas por un equipo separado. Debido a la gran cantidad de piezas móviles, las pruebas fallan la mayor parte del tiempo por razones completamente no relacionadas, que son muy difíciles de descubrir. Lo más probable es que estas pruebas tengan un valor negativo para nosotros. Sin embargo, se demostró que estas pruebas son útiles en aproximadamente una o dos veces de cada cientos.
Cobertura de prueba
A partir de julio de 2018 no realizamos un seguimiento de la cobertura de las pruebas.
Automatización de pruebas
Realizamos pruebas con el CI interno de Yandex y el sistema de automatización de trabajos llamado “Sandbox”.
Los trabajos de compilación y las pruebas se ejecutan en Sandbox por confirmación. Los paquetes resultantes y los resultados de las pruebas se publican en GitHub y se pueden descargar mediante enlaces directos. Los artefactos se almacenan eternamente. Cuando envías una solicitud de extracción en GitHub, la etiquetamos como “can be tested” y nuestro sistema CI construirá paquetes ClickHouse (liberación, depuración, con desinfectante de direcciones, etc.) para usted.
No usamos Travis CI debido al límite de tiempo y potencia computacional. No usamos Jenkins. Se usó antes y ahora estamos felices de no estar usando Jenkins.