ClickHouse/contrib/qpl-cmake/benchmark_sample/client_scripts/client_stressing_test.py

from operator import eq
import os
import random
import time
import sys
from clickhouse_driver import Client
import numpy as np
import subprocess
import multiprocessing
from multiprocessing import Manager

warmup_runs = 10
calculated_runs = 10
seconds = 30
max_instances_number = 8
retest_number = 3
retest_tolerance = 10

def checkInt(str):
    try:
        int(str)
        return True
    except ValueError:
        return False


def setup_client(index):
    if index<4:
        port_idx = index
    else:
        port_idx = index + 4
    client = Client(host='localhost', database='default', user='default', password='',port='900%d'%port_idx)
    union_mode_query = "SET union_default_mode='DISTINCT'"
    client.execute(union_mode_query)
    return client

def warm_client(clientN, clientL, query, loop):
    for c_idx in range(clientN):
        for _ in range(loop):
            clientL[c_idx].execute(query)

def read_queries(queries_list):
    queries = list()
    queries_id = list()
    with open(queries_list, 'r') as f:
        for line in f:
            line = line.rstrip()
            line = line.split("$")
            queries_id.append(line[0])
            queries.append(line[1])
    return queries_id, queries

def run_task(client, cname, query, loop, query_latency):
    start_time = time.time()
    for i in range(loop):
        client.execute(query)
        query_latency.append(client.last_query.elapsed)

    end_time = time.time()
    p95 = np.percentile(query_latency, 95)
    print('CLIENT: {0} end. -> P95: %f, qps: %f'.format(cname)%(p95, loop / (end_time - start_time)))

def run_multi_clients(clientN, clientList, query, loop):
    client_pids={}
    start_time = time.time()
    manager = multiprocessing.Manager()
    query_latency_list0 = manager.list()
    query_latency_list1 = manager.list()
    query_latency_list2 = manager.list()
    query_latency_list3 = manager.list()
    query_latency_list4 = manager.list()
    query_latency_list5 = manager.list()
    query_latency_list6 = manager.list()
    query_latency_list7 = manager.list()

    for c_idx in range(clientN):
        client_name = "Role_%d"%c_idx
        if c_idx == 0:
            client_pids[c_idx] = multiprocessing.Process(target=run_task, args=(clientList[c_idx], client_name, query, loop, query_latency_list0))
        elif c_idx == 1:
            client_pids[c_idx] = multiprocessing.Process(target=run_task, args=(clientList[c_idx], client_name, query, loop, query_latency_list1))
        elif c_idx == 2:
            client_pids[c_idx] = multiprocessing.Process(target=run_task, args=(clientList[c_idx], client_name, query, loop, query_latency_list2))
        elif c_idx == 3:
            client_pids[c_idx] = multiprocessing.Process(target=run_task, args=(clientList[c_idx], client_name, query, loop, query_latency_list3))
        elif c_idx == 4:
            client_pids[c_idx] = multiprocessing.Process(target=run_task, args=(clientList[c_idx], client_name, query, loop, query_latency_list4))
        elif c_idx == 5:
            client_pids[c_idx] = multiprocessing.Process(target=run_task, args=(clientList[c_idx], client_name, query, loop, query_latency_list5))
        elif c_idx == 6:
            client_pids[c_idx] = multiprocessing.Process(target=run_task, args=(clientList[c_idx], client_name, query, loop, query_latency_list6))
        elif c_idx == 7:
            client_pids[c_idx] = multiprocessing.Process(target=run_task, args=(clientList[c_idx], client_name, query, loop, query_latency_list7))
        else:
            print('ERROR: CLIENT number dismatch!!')
            exit()
        print('CLIENT: %s start'%client_name)
        client_pids[c_idx].start()

    for c_idx in range(clientN):
        client_pids[c_idx].join()
    end_time = time.time()
    totalT = end_time-start_time

    query_latencyTotal = list()
    for item in query_latency_list0:
        query_latencyTotal.append(item)
    for item in query_latency_list1:
        query_latencyTotal.append(item)
    for item in query_latency_list2:
        query_latencyTotal.append(item)
    for item in query_latency_list3:
        query_latencyTotal.append(item)
    for item in query_latency_list4:
        query_latencyTotal.append(item)
    for item in query_latency_list5:
        query_latencyTotal.append(item)
    for item in query_latency_list6:
        query_latencyTotal.append(item)
    for item in query_latency_list7:
        query_latencyTotal.append(item)

    totalP95 = np.percentile(query_latencyTotal, 95) * 1000
    return totalT,totalP95

def run_task_caculated(client, cname, query, loop):
  query_latency = list()
  start_time = time.time()
  for i in range(loop):
    client.execute(query)
    query_latency.append(client.last_query.elapsed)
  end_time = time.time()
  p95 = np.percentile(query_latency, 95)

def run_multi_clients_caculated(clientN, clientList, query, loop):
    client_pids={}
    start_time = time.time()
    for c_idx in range(clientN):
        client_name = "Role_%d"%c_idx
        client_pids[c_idx] = multiprocessing.Process(target=run_task_caculated, args=(clientList[c_idx], client_name, query, loop))
        client_pids[c_idx].start()
    for c_idx in range(clientN):
        client_pids[c_idx].join()
    end_time = time.time()
    totalT = end_time-start_time
    return totalT

if __name__ == "__main__":
    client_number = 1
    queries = list()
    queries_id = list()

    if len(sys.argv) != 3:
        print('usage: python3 client_stressing_test.py [queries_file_path] [client_number]')
        sys.exit()
    else:
        queries_list = sys.argv[1]
        client_number = int(sys.argv[2])
        print('queries_file_path: %s, client_number: %d'%(queries_list,client_number))
        if not os.path.isfile(queries_list) or not os.access(queries_list, os.R_OK):
            print('please check the right path for queries file')
            sys.exit()
        if not checkInt(sys.argv[2]) or int(sys.argv[2]) > max_instances_number or int(sys.argv[2]) < 1:
            print('client_number should be in [1~%d]'%max_instances_number)
            sys.exit()

    client_list={}
    queries_id,queries = read_queries(queries_list)

    for c_idx in range(client_number):
        client_list[c_idx] = setup_client(c_idx)
    #clear cache
    os.system("sync; echo 3 > /proc/sys/vm/drop_caches")

    print("###Polit Run Begin")
    for i in queries:
        warm_client(client_number, client_list, i, 1)
    print("###Polit Run End -> Start stressing....")

    query_index = 0
    for q in queries:
        print("\n###START -> Index: %d, ID: %s, Query: %s" % (query_index,queries_id[query_index], q))
        warm_client(client_number, client_list, q, warmup_runs)
        print("###Warm Done!")
        for j in range(0,retest_number):
            totalT = run_multi_clients_caculated(client_number, client_list, q, calculated_runs)
            curr_loop = int (seconds * calculated_runs / totalT) + 1
            print("###Calculation Done! -> loopN: %d, expected seconds:%d" % (curr_loop, seconds))

            print('###Stress Running! -> %d iterations......' % curr_loop)

            totalT,totalP95 = run_multi_clients(client_number, client_list, q, curr_loop)

            if totalT > (seconds - retest_tolerance) and totalT < (seconds + retest_tolerance):
                break
            else:
                print('###totalT:%d is far way from expected seconds:%d. Run again ->j:%d!'%(totalT,seconds,j))

        print( "###Completed! -> ID: %s, clientN: %d, totalT: %.2f s, latencyAVG: %.2f ms, P95: %.2f ms, QPS_Final: %.2f" % (queries_id[query_index], client_number, totalT, totalT * 1000/(curr_loop*client_number), totalP95, ((curr_loop*client_number)/totalT) ) )
        query_index += 1

    print("###Finished!")