ClickHouse/dbms/include/DB/DataStreams/narrowBlockInputStreams.h
2012-06-25 02:52:51 +00:00

42 lines
1.3 KiB
C++
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

#pragma once
#include <DB/DataStreams/ConcatBlockInputStream.h>
namespace DB
{
/** Если количество источников inputs больше width,
* то клеит источники друг с другом (с помощью ConcatBlockInputStream),
* чтобы количество источников стало не больше width.
*
* Старается клеить источники друг с другом равномерно.
*/
BlockInputStreams narrowBlockInputStreams(BlockInputStreams & inputs, size_t width)
{
if (inputs.size() <= width)
return inputs;
std::vector<BlockInputStreams> partitions(width);
/** Для распределения, используем генератор случайных чисел,
* но не инициализируем его, чтобы результат был детерминированным.
*/
drand48_data rand_buf = {{0}};
long rand_res = 0;
for (size_t i = 0, size = inputs.size(); i < size; ++i)
{
lrand48_r(&rand_buf, &rand_res);
partitions[rand_res % width].push_back(inputs[i]); /// Теоретически, не слишком хорошо.
}
BlockInputStreams res(width);
for (size_t i = 0; i < width; ++i)
res[i] = new ConcatBlockInputStream(partitions[i]);
return res;
}
}