ClickHouse/tests/integration/test_parallel_replicas_failover/test.py

import pytest

from helpers.cluster import ClickHouseCluster

cluster = ClickHouseCluster(__file__)

node1 = cluster.add_instance(
    "node1", main_configs=["configs/remote_servers.xml"], with_zookeeper=True
)
node2 = cluster.add_instance(
    "node2", main_configs=["configs/remote_servers.xml"], with_zookeeper=True
)
node3 = cluster.add_instance(
    "node3", main_configs=["configs/remote_servers.xml"], with_zookeeper=True
)


@pytest.fixture(scope="module")
def start_cluster():
    try:
        cluster.start()
        yield cluster
    finally:
        cluster.shutdown()


def create_tables(cluster, table_name, skip_last_replica):
    node1.query(f"DROP TABLE IF EXISTS {table_name} SYNC")
    node2.query(f"DROP TABLE IF EXISTS {table_name} SYNC")
    node3.query(f"DROP TABLE IF EXISTS {table_name} SYNC")

    node1.query(
        f"CREATE TABLE IF NOT EXISTS {table_name} (key Int64, value String) Engine=ReplicatedMergeTree('/test_parallel_replicas/shard1/{table_name}', 'r1') ORDER BY (key)"
    )
    node2.query(
        f"CREATE TABLE IF NOT EXISTS {table_name} (key Int64, value String) Engine=ReplicatedMergeTree('/test_parallel_replicas/shard1/{table_name}', 'r2') ORDER BY (key)"
    )
    if not skip_last_replica:
        node3.query(
            f"CREATE TABLE IF NOT EXISTS {table_name} (key Int64, value String) Engine=ReplicatedMergeTree('/test_parallel_replicas/shard1/{table_name}', 'r3') ORDER BY (key)"
        )

    # populate data
    node1.query(
        f"INSERT INTO {table_name} SELECT number % 4, number FROM numbers(1000)"
    )
    node1.query(
        f"INSERT INTO {table_name} SELECT number % 4, number FROM numbers(1000, 1000)"
    )
    node1.query(
        f"INSERT INTO {table_name} SELECT number % 4, number FROM numbers(2000, 1000)"
    )
    node1.query(
        f"INSERT INTO {table_name} SELECT number % 4, number FROM numbers(3000, 1000)"
    )
    node2.query(f"SYSTEM SYNC REPLICA {table_name}")
    if not skip_last_replica:
        node3.query(f"SYSTEM SYNC REPLICA {table_name}")


def test_skip_replicas_without_table(start_cluster):
    cluster_name = "test_1_shard_3_replicas"
    table_name = "tt"
    create_tables(cluster_name, table_name, skip_last_replica=True)

    expected_result = ""
    for i in range(4):
        expected_result += f"{i}\t1000\n"

    log_comment = "5230b069-9574-407d-9b80-891b5a175f41"
    assert (
        node1.query(
            f"SELECT key, count() FROM {table_name} GROUP BY key ORDER BY key",
            settings={
                "allow_experimental_parallel_reading_from_replicas": 2,
                "max_parallel_replicas": 3,
                "cluster_for_parallel_replicas": cluster_name,
                "log_comment": log_comment,
            },
        )
        == expected_result
    )

    node1.query("SYSTEM FLUSH LOGS")
    assert (
        node1.query(
            f"SELECT ProfileEvents['DistributedConnectionMissingTable'], ProfileEvents['ParallelReplicasUnavailableCount'] FROM system.query_log WHERE type = 'QueryFinish' AND query_id IN (SELECT query_id FROM system.query_log WHERE current_database = currentDatabase() AND log_comment = '{log_comment}' AND type = 'QueryFinish' AND initial_query_id = query_id)  SETTINGS allow_experimental_parallel_reading_from_replicas=0"
        )
        == "1\t1\n"
    )


def test_skip_unresponsive_replicas(start_cluster):
    cluster_name = "test_1_shard_3_replicas"
    table_name = "tt"
    create_tables(cluster_name, table_name, skip_last_replica=False)

    expected_result = ""
    for i in range(4):
        expected_result += f"{i}\t1000\n"

    node1.query("SYSTEM ENABLE FAILPOINT receive_timeout_on_table_status_response")

    assert (
        node1.query(
            f"SELECT key, count() FROM {table_name} GROUP BY key ORDER BY key",
            settings={
                "allow_experimental_parallel_reading_from_replicas": 2,
                "max_parallel_replicas": 3,
                "cluster_for_parallel_replicas": cluster_name,
            },
        )
        == expected_result
    )
Timeout injection 2024-03-26 12:30:16 +00:00			`import pytest`

			`from helpers.cluster import ClickHouseCluster`

			`cluster = ClickHouseCluster(__file__)`

Automatic style fix 2024-03-26 12:48:01 +00:00			`node1 = cluster.add_instance(`
			`"node1", main_configs=["configs/remote_servers.xml"], with_zookeeper=True`
			`)`
			`node2 = cluster.add_instance(`
			`"node2", main_configs=["configs/remote_servers.xml"], with_zookeeper=True`
			`)`
			`node3 = cluster.add_instance(`
			`"node3", main_configs=["configs/remote_servers.xml"], with_zookeeper=True`
			`)`
Timeout injection 2024-03-26 12:30:16 +00:00

			`@pytest.fixture(scope="module")`
			`def start_cluster():`
			`try:`
			`cluster.start()`
			`yield cluster`
			`finally:`
			`cluster.shutdown()`


Add test_skip_replicas_without_table 2024-04-24 21:13:07 +00:00			`def create_tables(cluster, table_name, skip_last_replica):`
Timeout injection 2024-03-26 12:30:16 +00:00			`node1.query(f"DROP TABLE IF EXISTS {table_name} SYNC")`
Add test_skip_replicas_without_table 2024-04-24 21:13:07 +00:00			`node2.query(f"DROP TABLE IF EXISTS {table_name} SYNC")`
Timeout injection 2024-03-26 12:30:16 +00:00			`node3.query(f"DROP TABLE IF EXISTS {table_name} SYNC")`

			`node1.query(`
			`f"CREATE TABLE IF NOT EXISTS {table_name} (key Int64, value String) Engine=ReplicatedMergeTree('/test_parallel_replicas/shard1/{table_name}', 'r1') ORDER BY (key)"`
			`)`
			`node2.query(`
			`f"CREATE TABLE IF NOT EXISTS {table_name} (key Int64, value String) Engine=ReplicatedMergeTree('/test_parallel_replicas/shard1/{table_name}', 'r2') ORDER BY (key)"`
			`)`
Add test_skip_replicas_without_table 2024-04-24 21:13:07 +00:00			`if not skip_last_replica:`
			`node3.query(`
			`f"CREATE TABLE IF NOT EXISTS {table_name} (key Int64, value String) Engine=ReplicatedMergeTree('/test_parallel_replicas/shard1/{table_name}', 'r3') ORDER BY (key)"`
			`)`
Timeout injection 2024-03-26 12:30:16 +00:00
			`# populate data`
			`node1.query(`
			`f"INSERT INTO {table_name} SELECT number % 4, number FROM numbers(1000)"`
			`)`
			`node1.query(`
			`f"INSERT INTO {table_name} SELECT number % 4, number FROM numbers(1000, 1000)"`
			`)`
			`node1.query(`
			`f"INSERT INTO {table_name} SELECT number % 4, number FROM numbers(2000, 1000)"`
			`)`
			`node1.query(`
			`f"INSERT INTO {table_name} SELECT number % 4, number FROM numbers(3000, 1000)"`
			`)`
			`node2.query(f"SYSTEM SYNC REPLICA {table_name}")`
Add test_skip_replicas_without_table 2024-04-24 21:13:07 +00:00			`if not skip_last_replica:`
			`node3.query(f"SYSTEM SYNC REPLICA {table_name}")`


			`def test_skip_replicas_without_table(start_cluster):`
			`cluster_name = "test_1_shard_3_replicas"`
			`table_name = "tt"`
			`create_tables(cluster_name, table_name, skip_last_replica=True)`

			`expected_result = ""`
			`for i in range(4):`
			`expected_result += f"{i}\t1000\n"`

			`log_comment = "5230b069-9574-407d-9b80-891b5a175f41"`
			`assert (`
			`node1.query(`
			`f"SELECT key, count() FROM {table_name} GROUP BY key ORDER BY key",`
			`settings={`
			`"allow_experimental_parallel_reading_from_replicas": 2,`
			`"max_parallel_replicas": 3,`
			`"cluster_for_parallel_replicas": cluster_name,`
			`"log_comment": log_comment,`
			`},`
			`)`
			`== expected_result`
			`)`

			`node1.query("SYSTEM FLUSH LOGS")`
Automatic style fix 2024-04-24 21:23:57 +00:00			`assert (`
			`node1.query(`
Fix: simplify test 2024-04-30 14:25:19 +00:00			`f"SELECT ProfileEvents['DistributedConnectionMissingTable'], ProfileEvents['ParallelReplicasUnavailableCount'] FROM system.query_log WHERE type = 'QueryFinish' AND query_id IN (SELECT query_id FROM system.query_log WHERE current_database = currentDatabase() AND log_comment = '{log_comment}' AND type = 'QueryFinish' AND initial_query_id = query_id) SETTINGS allow_experimental_parallel_reading_from_replicas=0"`
Automatic style fix 2024-04-24 21:23:57 +00:00			`)`
Fix: simplify test 2024-04-30 14:25:19 +00:00			`== "1\t1\n"`
Automatic style fix 2024-04-24 21:23:57 +00:00			`)`
Timeout injection 2024-03-26 12:30:16 +00:00

			`def test_skip_unresponsive_replicas(start_cluster):`
			`cluster_name = "test_1_shard_3_replicas"`
			`table_name = "tt"`
Add test_skip_replicas_without_table 2024-04-24 21:13:07 +00:00			`create_tables(cluster_name, table_name, skip_last_replica=False)`
Timeout injection 2024-03-26 12:30:16 +00:00
			`expected_result = ""`
			`for i in range(4):`
			`expected_result += f"{i}\t1000\n"`

			`node1.query("SYSTEM ENABLE FAILPOINT receive_timeout_on_table_status_response")`

			`assert (`
			`node1.query(`
			`f"SELECT key, count() FROM {table_name} GROUP BY key ORDER BY key",`
			`settings={`
			`"allow_experimental_parallel_reading_from_replicas": 2,`
			`"max_parallel_replicas": 3,`
			`"cluster_for_parallel_replicas": cluster_name,`
			`},`
			`)`
			`== expected_result`
			`)`