ClickHouse/dbms/src/Interpreters/Aggregator.cpp

#include <iomanip>

#include <statdaemons/Stopwatch.h>

#include <DB/DataTypes/DataTypeAggregateFunction.h>
#include <DB/Columns/ColumnAggregateFunction.h>
#include <DB/Columns/ColumnString.h>
#include <DB/Columns/ColumnFixedString.h>
#include <DB/Columns/ColumnsNumber.h>
#include <DB/AggregateFunctions/AggregateFunctionCount.h>

#include <DB/Interpreters/Aggregator.h>


namespace DB
{


AggregatedDataVariants::~AggregatedDataVariants()
{
	if (aggregator && !aggregator->all_aggregates_has_trivial_destructor)
		aggregator->destroyAggregateStates(*this);
}


void Aggregator::initialize(Block & block)
{
	Poco::ScopedLock<Poco::FastMutex> lock(mutex);

	if (initialized)
		return;

	initialized = true;

	aggregate_functions.resize(aggregates_size);
	for (size_t i = 0; i < aggregates_size; ++i)
		aggregate_functions[i] = &*aggregates[i].function;

	/// Инициализируем размеры состояний и смещения для агрегатных функций.
	offsets_of_aggregate_states.resize(aggregates_size);
	total_size_of_aggregate_states = 0;
	all_aggregates_has_trivial_destructor = true;

	for (size_t i = 0; i < aggregates_size; ++i)
	{
		offsets_of_aggregate_states[i] = total_size_of_aggregate_states;
		total_size_of_aggregate_states += aggregates[i].function->sizeOfData();

		if (!aggregates[i].function->hasTrivialDestructor())
			all_aggregates_has_trivial_destructor = false;
	}

	/** Всё остальное - только если передан непустой block.
	  * (всё остальное не нужно в методе merge блоков с готовыми состояниями агрегатных функций).
	  */
	if (!block)
		return;
	
	/// Преобразуем имена столбцов в номера, если номера не заданы
	if (keys.empty() && !key_names.empty())
		for (Names::const_iterator it = key_names.begin(); it != key_names.end(); ++it)
			keys.push_back(block.getPositionByName(*it));

	for (AggregateDescriptions::iterator it = aggregates.begin(); it != aggregates.end(); ++it)
		if (it->arguments.empty() && !it->argument_names.empty())
			for (Names::const_iterator jt = it->argument_names.begin(); jt != it->argument_names.end(); ++jt)
				it->arguments.push_back(block.getPositionByName(*jt));

	/// Создадим пример блока, описывающего результат
	if (!sample)
	{
		for (size_t i = 0; i < keys_size; ++i)
		{
			sample.insert(block.getByPosition(keys[i]).cloneEmpty());
			if (sample.getByPosition(i).column->isConst())
				sample.getByPosition(i).column = dynamic_cast<IColumnConst &>(*sample.getByPosition(i).column).convertToFullColumn();
		}

		for (size_t i = 0; i < aggregates_size; ++i)
		{
			ColumnWithNameAndType col;
			col.name = aggregates[i].column_name;

			size_t arguments_size = aggregates[i].arguments.size();
			DataTypes argument_types(arguments_size);
			for (size_t j = 0; j < arguments_size; ++j)
				argument_types[j] = block.getByPosition(aggregates[i].arguments[j]).type;
			
			col.type = new DataTypeAggregateFunction(aggregates[i].function, argument_types);
			col.column = new ColumnAggregateFunction(aggregates[i].function);

			sample.insert(col);
		}
	}	
}


AggregatedDataVariants::Type Aggregator::chooseAggregationMethod(const ConstColumnPlainPtrs & key_columns, Sizes & key_sizes)
{
	bool keys_fit_128_bits = true;
	size_t keys_bytes = 0;
	key_sizes.resize(keys_size);
	for (size_t j = 0; j < keys_size; ++j)
	{
		if (!key_columns[j]->isFixed())
		{
			keys_fit_128_bits = false;
			break;
		}
		key_sizes[j] = key_columns[j]->sizeOfField();
		keys_bytes += key_sizes[j];
	}
	if (keys_bytes > 16)
		keys_fit_128_bits = false;

	/// Если ключей нет
	if (keys_size == 0)
		return AggregatedDataVariants::WITHOUT_KEY;

	/// Если есть один числовой ключ, который помещается в 64 бита
	if (keys_size == 1 && key_columns[0]->isNumeric())
		return AggregatedDataVariants::KEY_64;

	/// Если ключи помещаются в 128 бит, будем использовать хэш-таблицу по упакованным в 128-бит ключам
	if (keys_fit_128_bits)
		return AggregatedDataVariants::KEYS_128;

	/// Если есть один строковый ключ, то используем хэш-таблицу с ним
	if (keys_size == 1
		&& (dynamic_cast<const ColumnString *>(key_columns[0]) || dynamic_cast<const ColumnFixedString *>(key_columns[0])
			|| dynamic_cast<const ColumnConstString *>(key_columns[0])))
		return AggregatedDataVariants::KEY_STRING;

	/// Иначе будем агрегировать по хэшу от ключей.
	return AggregatedDataVariants::HASHED;
}


/** Результат хранится в оперативке и должен полностью помещаться в оперативку.
  */
void Aggregator::execute(BlockInputStreamPtr stream, AggregatedDataVariants & result)
{
	StringRefs key(keys_size);
	ConstColumnPlainPtrs key_columns(keys_size);

	typedef std::vector<ConstColumnPlainPtrs> AggregateColumns;
	AggregateColumns aggregate_columns(aggregates_size);

	/** Используется, если есть ограничение на максимальное количество строк при агрегации,
	  *  и если group_by_overflow_mode == ANY.
	  * В этом случае, новые ключи не добавляются в набор, а производится агрегация только по
	  *  ключам, которые уже успели попасть в набор.
	  */
	bool no_more_keys = false;

	LOG_TRACE(log, "Aggregating");

	Stopwatch watch;

	size_t src_rows = 0;
	size_t src_bytes = 0;

	Sizes key_sizes;

	/// Читаем все данные
	while (Block block = stream->read())
	{
		initialize(block);

		/// result будет уничтожать состояния агрегатных функций в деструкторе
		result.aggregator = this;
		
		src_rows += block.rows();
		src_bytes += block.bytes();

		for (size_t i = 0; i < aggregates_size; ++i)
			aggregate_columns[i].resize(aggregates[i].arguments.size());
		
		/// Запоминаем столбцы, с которыми будем работать
		for (size_t i = 0; i < keys_size; ++i)
			key_columns[i] = block.getByPosition(keys[i]).column;

		for (size_t i = 0; i < aggregates_size; ++i)
		{
			for (size_t j = 0; j < aggregate_columns[i].size(); ++j)
			{
				aggregate_columns[i][j] = block.getByPosition(aggregates[i].arguments[j]).column;

				/** Агрегатные функции рассчитывают, что в них передаются полноценные столбцы.
				  * Поэтому, стобцы-константы не разрешены в качестве аргументов агрегатных функций.
				  */
				if (aggregate_columns[i][j]->isConst())
					throw Exception("Constants is not allowed as arguments of aggregate functions", ErrorCodes::ILLEGAL_COLUMN);
			}
		}

		size_t rows = block.rows();

		/// Каким способом выполнять агрегацию?
		if (result.empty())
		{
			result.type = chooseAggregationMethod(key_columns, key_sizes);
			result.keys_size = keys_size;
			result.key_sizes = key_sizes;
			LOG_TRACE(log, "Aggregation method: " << result.getMethodName());
		}

		if (result.type == AggregatedDataVariants::WITHOUT_KEY || with_totals)
		{
			AggregatedDataWithoutKey & res = result.without_key;
			if (!res)
			{
				res = result.aggregates_pool->alloc(total_size_of_aggregate_states);

				for (size_t i = 0; i < aggregates_size; ++i)
					aggregate_functions[i]->create(res + offsets_of_aggregate_states[i]);
			}

			/// Оптимизация в случае единственной агрегатной функции count.
			AggregateFunctionCount * agg_count = aggregates_size == 1
				? dynamic_cast<AggregateFunctionCount *>(aggregate_functions[0])
				: NULL;

			if (agg_count)
				agg_count->addDelta(res, rows);
			else
			{
				for (size_t i = 0; i < rows; ++i)
				{
					/// Добавляем значения
					for (size_t j = 0; j < aggregates_size; ++j)
						aggregate_functions[j]->add(res + offsets_of_aggregate_states[j], &aggregate_columns[j][0], i);
				}
			}
		}
		
		if (result.type == AggregatedDataVariants::KEY_64)
		{
			AggregatedDataWithUInt64Key & res = result.key64;
			const IColumn & column = *key_columns[0];

			/// Для всех строчек
			for (size_t i = 0; i < rows; ++i)
			{
				/// Строим ключ
				UInt64 key = get<UInt64>(column[i]);

				AggregatedDataWithUInt64Key::iterator it;
				bool inserted;

				if (!no_more_keys)
					res.emplace(key, it, inserted);
				else
				{
					inserted = false;
					it = res.find(key);
					if (res.end() == it)
						continue;
				}
				
				if (inserted)
				{
					it->second = result.aggregates_pool->alloc(total_size_of_aggregate_states);
					
					for (size_t j = 0; j < aggregates_size; ++j)
						aggregate_functions[j]->create(it->second + offsets_of_aggregate_states[j]);
				}

				/// Добавляем значения
				for (size_t j = 0; j < aggregates_size; ++j)
					aggregate_functions[j]->add(it->second + offsets_of_aggregate_states[j], &aggregate_columns[j][0], i);
			}
		}
		else if (result.type == AggregatedDataVariants::KEY_STRING)
		{
			AggregatedDataWithStringKey & res = result.key_string;
			const IColumn & column = *key_columns[0];

			if (const ColumnString * column_string = dynamic_cast<const ColumnString *>(&column))
			{
				const ColumnString::Offsets_t & offsets = column_string->getOffsets();
	            const ColumnString::Chars_t & data = column_string->getChars();

				/// Для всех строчек
				for (size_t i = 0; i < rows; ++i)
				{
					/// Строим ключ
					StringRef ref(&data[i == 0 ? 0 : offsets[i - 1]], (i == 0 ? offsets[i] : (offsets[i] - offsets[i - 1])) - 1);

					AggregatedDataWithStringKey::iterator it;
					bool inserted;

					if (!no_more_keys)
						res.emplace(ref, it, inserted);
					else
					{
						inserted = false;
						it = res.find(ref);
						if (res.end() == it)
							continue;
					}

					if (inserted)
					{
						it->first.data = result.string_pool.insert(ref.data, ref.size);
						it->second = result.aggregates_pool->alloc(total_size_of_aggregate_states);

						for (size_t j = 0; j < aggregates_size; ++j)
							aggregate_functions[j]->create(it->second + offsets_of_aggregate_states[j]);
					}

					/// Добавляем значения
					for (size_t j = 0; j < aggregates_size; ++j)
						aggregate_functions[j]->add(it->second + offsets_of_aggregate_states[j], &aggregate_columns[j][0], i);
				}
			}
			else if (const ColumnFixedString * column_string = dynamic_cast<const ColumnFixedString *>(&column))
			{
				size_t n = column_string->getN();
				const ColumnFixedString::Chars_t & data = column_string->getChars();

				/// Для всех строчек
				for (size_t i = 0; i < rows; ++i)
				{
					/// Строим ключ
					StringRef ref(&data[i * n], n);

					AggregatedDataWithStringKey::iterator it;
					bool inserted;

					if (!no_more_keys)
						res.emplace(ref, it, inserted);
					else
					{
						inserted = false;
						it = res.find(ref);
						if (res.end() == it)
							continue;
					}

					if (inserted)
					{
						it->first.data = result.string_pool.insert(ref.data, ref.size);
						it->second = result.aggregates_pool->alloc(total_size_of_aggregate_states);

						for (size_t j = 0; j < aggregates_size; ++j)
							aggregate_functions[j]->create(it->second + offsets_of_aggregate_states[j]);
					}

					/// Добавляем значения
					for (size_t j = 0; j < aggregates_size; ++j)
						aggregate_functions[j]->add(it->second + offsets_of_aggregate_states[j], &aggregate_columns[j][0], i);
				}
			}
			else
				throw Exception("Illegal type of column when aggregating by string key: " + column.getName(), ErrorCodes::ILLEGAL_COLUMN);
		}
		else if (result.type == AggregatedDataVariants::KEYS_128)
		{
			AggregatedDataWithKeys128 & res = result.keys128;

			/// Для всех строчек
			for (size_t i = 0; i < rows; ++i)
			{
				AggregatedDataWithKeys128::iterator it;
				bool inserted;
				UInt128 key128 = pack128(i, keys_size, key_columns, key_sizes);

				if (!no_more_keys)
					res.emplace(key128, it, inserted);
				else
				{
					inserted = false;
					it = res.find(key128);
					if (res.end() == it)
						continue;
				}

				if (inserted)
				{
					it->second = result.aggregates_pool->alloc(total_size_of_aggregate_states);

					for (size_t j = 0; j < aggregates_size; ++j)
						aggregate_functions[j]->create(it->second + offsets_of_aggregate_states[j]);
				}

				/// Добавляем значения
				for (size_t j = 0; j < aggregates_size; ++j)
					aggregate_functions[j]->add(it->second + offsets_of_aggregate_states[j], &aggregate_columns[j][0], i);
			}
		}
		else if (result.type == AggregatedDataVariants::HASHED)
		{
			AggregatedDataHashed & res = result.hashed;

			/// Для всех строчек
			for (size_t i = 0; i < rows; ++i)
			{
				AggregatedDataHashed::iterator it;
				bool inserted;
				UInt128 key128 = hash128(i, keys_size, key_columns, key);

				if (!no_more_keys)
					res.emplace(key128, it, inserted);
				else
				{
					inserted = false;
					it = res.find(key128);
					if (res.end() == it)
						continue;
				}

				if (inserted)
				{
					it->second.first = placeKeysInPool(i, keys_size, key, result.keys_pool);
					it->second.second = result.aggregates_pool->alloc(total_size_of_aggregate_states);

					for (size_t j = 0; j < aggregates_size; ++j)
						aggregate_functions[j]->create(it->second.second + offsets_of_aggregate_states[j]);
				}

				/// Добавляем значения
				for (size_t j = 0; j < aggregates_size; ++j)
					aggregate_functions[j]->add(it->second.second + offsets_of_aggregate_states[j], &aggregate_columns[j][0], i);
			}
		}
		else if (result.type != AggregatedDataVariants::WITHOUT_KEY)
			throw Exception("Unknown aggregated data variant.", ErrorCodes::UNKNOWN_AGGREGATED_DATA_VARIANT);

		/// Проверка ограничений.
		if (!no_more_keys && max_rows_to_group_by && result.size() > max_rows_to_group_by)
		{
			if (group_by_overflow_mode == Limits::THROW)
				throw Exception("Limit for rows to GROUP BY exceeded: has " + toString(result.size())
					+ " rows, maximum: " + toString(max_rows_to_group_by),
					ErrorCodes::TOO_MUCH_ROWS);
			else if (group_by_overflow_mode == Limits::BREAK)
				break;
			else if (group_by_overflow_mode == Limits::ANY)
				no_more_keys = true;
			else
				throw Exception("Logical error: unknown overflow mode", ErrorCodes::LOGICAL_ERROR);
		}
	}

	double elapsed_seconds = watch.elapsedSeconds();
	size_t rows = result.size();
	LOG_TRACE(log, std::fixed << std::setprecision(3)
		<< "Aggregated. " << src_rows << " to " << rows << " rows (from " << src_bytes / 1048576.0 << " MiB)"
		<< " in " << elapsed_seconds << " sec."
		<< " (" << src_rows / elapsed_seconds << " rows/sec., " << src_bytes / elapsed_seconds / 1048576.0 << " MiB/sec.)");
}


Block Aggregator::convertToBlock(AggregatedDataVariants & data_variants, bool separate_totals, Block & totals, bool final)
{
	Block res = sample.cloneEmpty();
	size_t rows = data_variants.size();

	if (with_totals && separate_totals && rows != 0)
		--rows;		/// Строчка с "тотальными" значениями идёт отдельно.

	LOG_TRACE(log, "Converting aggregated data to block");

	Stopwatch watch;

	/// В какой структуре данных агрегированы данные?
	if (data_variants.empty())
		return Block();

	typedef std::vector<ColumnAggregateFunction::Container_t *> AggregateColumns;
	
	ColumnPlainPtrs key_columns(keys_size);
	AggregateColumns aggregate_columns(aggregates_size);
	ColumnPlainPtrs final_aggregate_columns(aggregates_size);

	for (size_t i = 0; i < keys_size; ++i)
	{
		key_columns[i] = res.getByPosition(i).column;
		key_columns[i]->reserve(rows);
	}

	for (size_t i = 0; i < aggregates_size; ++i)
	{
		if (!final)
		{
			/// Столбец ColumnAggregateFunction захватывает разделяемое владение ареной с состояниями агрегатных функций.
			ColumnAggregateFunction & column_aggregate_func = static_cast<ColumnAggregateFunction &>(*res.getByPosition(i + keys_size).column);

			for (size_t j = 0; j < data_variants.aggregates_pools.size(); ++j)
				column_aggregate_func.addArena(data_variants.aggregates_pools[j]);

			aggregate_columns[i] = &column_aggregate_func.getData();
			aggregate_columns[i]->resize(rows);
		}
		else
		{
			ColumnWithNameAndType & column = res.getByPosition(i + keys_size);
			column.type = aggregate_functions[i]->getReturnType();
			column.column = column.type->createColumn();
			column.column->reserve(rows);

			final_aggregate_columns[i] = column.column;
		}
	}

	if (data_variants.type == AggregatedDataVariants::WITHOUT_KEY || with_totals)
	{
		AggregatedDataWithoutKey & data = data_variants.without_key;

		if (with_totals && separate_totals)
		{
			for (size_t i = 0; i < aggregates_size; ++i)
			{
				totals = res.cloneEmpty();

				/// Для тотальных данных вместо ключей пишутся значения по-умолчанию (нули, пустые строки).
				for (size_t i = 0; i < keys_size; ++i)
					totals.getByPosition(i).column->insertDefault();

				for (size_t i = 0; i < aggregates_size; ++i)
				{
					ColumnWithNameAndType & column = totals.getByPosition(i + keys_size);
					column.type = aggregate_functions[i]->getReturnType();
					column.column = column.type->createColumn();
					aggregate_functions[i]->insertResultInto(data + offsets_of_aggregate_states[i], *column.column);
				}
			}
		}
		else
		{
			if (!final)
				for (size_t i = 0; i < aggregates_size; ++i)
					(*aggregate_columns[i])[0] = data + offsets_of_aggregate_states[i];
			else
				for (size_t i = 0; i < aggregates_size; ++i)
					aggregate_functions[i]->insertResultInto(data + offsets_of_aggregate_states[i], *final_aggregate_columns[i]);

			if (with_totals)
				for (size_t i = 0; i < keys_size; ++i)
					key_columns[i]->insertDefault();
		}
	}
	
	if (data_variants.type == AggregatedDataVariants::KEY_64)
	{
		AggregatedDataWithUInt64Key & data = data_variants.key64;

		IColumn & first_column = *key_columns[0];

		size_t j = with_totals && !separate_totals ? 1 : 0;

		if (!final)
		{
			for (AggregatedDataWithUInt64Key::const_iterator it = data.begin(); it != data.end(); ++it, ++j)
			{
				first_column.insertData(reinterpret_cast<const char *>(&it->first), sizeof(it->first));

				for (size_t i = 0; i < aggregates_size; ++i)
					(*aggregate_columns[i])[j] = it->second + offsets_of_aggregate_states[i];
			}
		}
		else
		{
			for (AggregatedDataWithUInt64Key::const_iterator it = data.begin(); it != data.end(); ++it, ++j)
			{
				first_column.insertData(reinterpret_cast<const char *>(&it->first), sizeof(it->first));

				for (size_t i = 0; i < aggregates_size; ++i)
					aggregate_functions[i]->insertResultInto(it->second + offsets_of_aggregate_states[i], *final_aggregate_columns[i]);
			}
		}
	}
	else if (data_variants.type == AggregatedDataVariants::KEY_STRING)
	{
		AggregatedDataWithStringKey & data = data_variants.key_string;
		IColumn & first_column = *key_columns[0];

		size_t j = with_totals && !separate_totals ? 1 : 0;

		if (!final)
		{
			for (AggregatedDataWithStringKey::const_iterator it = data.begin(); it != data.end(); ++it, ++j)
			{
				first_column.insertData(it->first.data, it->first.size);

				for (size_t i = 0; i < aggregates_size; ++i)
					(*aggregate_columns[i])[j] = it->second + offsets_of_aggregate_states[i];
			}
		}
		else
		{
			for (AggregatedDataWithStringKey::const_iterator it = data.begin(); it != data.end(); ++it, ++j)
			{
				first_column.insertData(it->first.data, it->first.size);

				for (size_t i = 0; i < aggregates_size; ++i)
					aggregate_functions[i]->insertResultInto(it->second + offsets_of_aggregate_states[i], *final_aggregate_columns[i]);
			}
		}
	}
	else if (data_variants.type == AggregatedDataVariants::KEYS_128)
	{
		AggregatedDataWithKeys128 & data = data_variants.keys128;

		size_t j = with_totals && !separate_totals ? 1 : 0;

		if (!final)
		{
			for (AggregatedDataWithKeys128::const_iterator it = data.begin(); it != data.end(); ++it, ++j)
			{
				size_t offset = 0;
				for (size_t i = 0; i < keys_size; ++i)
				{
					size_t size = data_variants.key_sizes[i];
					key_columns[i]->insertData(reinterpret_cast<const char *>(&it->first) + offset, size);
					offset += size;
				}

				for (size_t i = 0; i < aggregates_size; ++i)
					(*aggregate_columns[i])[j] = it->second + offsets_of_aggregate_states[i];
			}
		}
		else
		{
			for (AggregatedDataWithKeys128::const_iterator it = data.begin(); it != data.end(); ++it, ++j)
			{
				size_t offset = 0;
				for (size_t i = 0; i < keys_size; ++i)
				{
					size_t size = data_variants.key_sizes[i];
					key_columns[i]->insertData(reinterpret_cast<const char *>(&it->first) + offset, size);
					offset += size;
				}

				for (size_t i = 0; i < aggregates_size; ++i)
					aggregate_functions[i]->insertResultInto(it->second + offsets_of_aggregate_states[i], *final_aggregate_columns[i]);
			}
		}
	}
	else if (data_variants.type == AggregatedDataVariants::HASHED)
	{
		AggregatedDataHashed & data = data_variants.hashed;

		size_t j = with_totals && !separate_totals ? 1 : 0;

		if (!final)
		{
			for (AggregatedDataHashed::const_iterator it = data.begin(); it != data.end(); ++it, ++j)
			{
				for (size_t i = 0; i < keys_size; ++i)
					key_columns[i]->insertDataWithTerminatingZero(it->second.first[i].data, it->second.first[i].size);

				for (size_t i = 0; i < aggregates_size; ++i)
					(*aggregate_columns[i])[j] = it->second.second + offsets_of_aggregate_states[i];
			}
		}
		else
		{
			for (AggregatedDataHashed::const_iterator it = data.begin(); it != data.end(); ++it, ++j)
			{
				for (size_t i = 0; i < keys_size; ++i)
					key_columns[i]->insertDataWithTerminatingZero(it->second.first[i].data, it->second.first[i].size);

				for (size_t i = 0; i < aggregates_size; ++i)
					aggregate_functions[i]->insertResultInto(it->second.second + offsets_of_aggregate_states[i], *final_aggregate_columns[i]);
			}
		}
	}
	else if (data_variants.type != AggregatedDataVariants::WITHOUT_KEY)
		throw Exception("Unknown aggregated data variant.", ErrorCodes::UNKNOWN_AGGREGATED_DATA_VARIANT);

	if (!final)
	{
		/// data_variants не будет уничтожать состояния агрегатных функций в деструкторе. Теперь состояниями владеют ColumnAggregateFunction.
		data_variants.aggregator = NULL;
	}

	/// Изменяем размер столбцов-констант в блоке.
	size_t columns = res.columns();
	for (size_t i = 0; i < columns; ++i)
		if (res.getByPosition(i).column->isConst())
			res.getByPosition(i).column = res.getByPosition(i).column->cut(0, rows);

	double elapsed_seconds = watch.elapsedSeconds();
	LOG_TRACE(log, std::fixed << std::setprecision(3)
		<< "Converted aggregated data to block. "
		<< rows << " rows, " << res.bytes() / 1048576.0 << " MiB"
		<< " in " << elapsed_seconds << " sec."
		<< " (" << rows / elapsed_seconds << " rows/sec., " << res.bytes() / elapsed_seconds / 1048576.0 << " MiB/sec.)");

	return res;
}


AggregatedDataVariantsPtr Aggregator::merge(ManyAggregatedDataVariants & data_variants)
{
	if (data_variants.empty())
 		throw Exception("Empty data passed to Aggregator::merge().", ErrorCodes::EMPTY_DATA_PASSED);

	LOG_TRACE(log, "Merging aggregated data");

	Stopwatch watch;

	AggregatedDataVariantsPtr res = data_variants[0];

	/// Все результаты агрегации соединяем с первым.
	size_t rows = res->size();
	for (size_t i = 1, size = data_variants.size(); i < size; ++i)
	{
		rows += data_variants[i]->size();
		AggregatedDataVariants & current = *data_variants[i];

		res->aggregates_pools.insert(res->aggregates_pools.end(), current.aggregates_pools.begin(), current.aggregates_pools.end());

		if (current.empty())
			continue;

		if (res->empty())
		{
			res = data_variants[i];
			continue;
		}

		if (res->type != current.type)
			throw Exception("Cannot merge different aggregated data variants.", ErrorCodes::CANNOT_MERGE_DIFFERENT_AGGREGATED_DATA_VARIANTS);

		/// В какой структуре данных агрегированы данные?
		if (res->type == AggregatedDataVariants::WITHOUT_KEY || with_totals)
		{
			AggregatedDataWithoutKey & res_data = res->without_key;
			AggregatedDataWithoutKey & current_data = current.without_key;

			for (size_t i = 0; i < aggregates_size; ++i)
			{
				aggregate_functions[i]->merge(res_data + offsets_of_aggregate_states[i], current_data + offsets_of_aggregate_states[i]);
				aggregate_functions[i]->destroy(current_data + offsets_of_aggregate_states[i]);
			}
		}
		
		if (res->type == AggregatedDataVariants::KEY_64)
		{
			AggregatedDataWithUInt64Key & res_data = res->key64;
			AggregatedDataWithUInt64Key & current_data = current.key64;

			for (AggregatedDataWithUInt64Key::const_iterator it = current_data.begin(); it != current_data.end(); ++it)
			{
				AggregatedDataWithUInt64Key::iterator res_it;
				bool inserted;
				res_data.emplace(it->first, res_it, inserted);

				if (!inserted)
				{
					for (size_t i = 0; i < aggregates_size; ++i)
					{
						aggregate_functions[i]->merge(res_it->second + offsets_of_aggregate_states[i], it->second + offsets_of_aggregate_states[i]);
						aggregate_functions[i]->destroy(it->second + offsets_of_aggregate_states[i]);
					}
				}
				else
					res_it->second = it->second;
			}
		}
		else if (res->type == AggregatedDataVariants::KEY_STRING)
		{
			AggregatedDataWithStringKey & res_data = res->key_string;
			AggregatedDataWithStringKey & current_data = current.key_string;
			
			for (AggregatedDataWithStringKey::const_iterator it = current_data.begin(); it != current_data.end(); ++it)
			{
				AggregatedDataWithStringKey::iterator res_it;
				bool inserted;
				res_data.emplace(it->first, res_it, inserted);

				if (!inserted)
				{
					for (size_t i = 0; i < aggregates_size; ++i)
					{
						aggregate_functions[i]->merge(res_it->second + offsets_of_aggregate_states[i], it->second + offsets_of_aggregate_states[i]);
						aggregate_functions[i]->destroy(it->second + offsets_of_aggregate_states[i]);
					}
				}
				else
					res_it->second = it->second;
			}
		}
		else if (res->type == AggregatedDataVariants::KEYS_128)
		{
			AggregatedDataWithKeys128 & res_data = res->keys128;
			AggregatedDataWithKeys128 & current_data = current.keys128;

			for (AggregatedDataWithKeys128::iterator it = current_data.begin(); it != current_data.end(); ++it)
			{
				AggregatedDataWithKeys128::iterator res_it;
				bool inserted;
				res_data.emplace(it->first, res_it, inserted);

				if (!inserted)
				{
					for (size_t i = 0; i < aggregates_size; ++i)
					{
						aggregate_functions[i]->merge(res_it->second + offsets_of_aggregate_states[i], it->second + offsets_of_aggregate_states[i]);
						aggregate_functions[i]->destroy(it->second + offsets_of_aggregate_states[i]);
					}
				}
				else
				{
					res_it->second = it->second;
				}
			}
		}
		else if (res->type == AggregatedDataVariants::HASHED)
		{
			AggregatedDataHashed & res_data = res->hashed;
			AggregatedDataHashed & current_data = current.hashed;

			for (AggregatedDataHashed::iterator it = current_data.begin(); it != current_data.end(); ++it)
			{
				AggregatedDataHashed::iterator res_it;
				bool inserted;
				res_data.emplace(it->first, res_it, inserted);

				if (!inserted)
				{
					for (size_t i = 0; i < aggregates_size; ++i)
					{
						aggregate_functions[i]->merge(res_it->second.second + offsets_of_aggregate_states[i], it->second.second + offsets_of_aggregate_states[i]);
						aggregate_functions[i]->destroy(it->second.second + offsets_of_aggregate_states[i]);
					}
				}
				else
				{
					res_it->second = it->second;
				}
			}
		}
		else if (res->type != AggregatedDataVariants::WITHOUT_KEY)
			throw Exception("Unknown aggregated data variant.", ErrorCodes::UNKNOWN_AGGREGATED_DATA_VARIANT);

		/// current не будет уничтожать состояния агрегатных функций в деструкторе
		current.aggregator = NULL;
	}

	double elapsed_seconds = watch.elapsedSeconds();
	size_t res_rows = res->size();
	
	LOG_TRACE(log, std::fixed << std::setprecision(3)
		<< "Merged aggregated data. "
		<< "From " << rows << " to " << res_rows << " rows (efficiency: " << static_cast<double>(rows) / res_rows << ")"
		<< " in " << elapsed_seconds << " sec."
		<< " (" << rows / elapsed_seconds << " rows/sec.)");

	return res;
}


void Aggregator::merge(BlockInputStreamPtr stream, AggregatedDataVariants & result)
{
	StringRefs key(keys_size);
	ConstColumnPlainPtrs key_columns(keys_size);

	typedef ColumnAggregateFunction::Container_t * AggregateColumn;
	typedef std::vector<AggregateColumn> AggregateColumns;
	AggregateColumns aggregate_columns(aggregates_size);

	Block empty_block;
	initialize(empty_block);

	/// result будет уничтожать состояния агрегатных функций в деструкторе
	result.aggregator = this;

	/// Читаем все данные
	while (Block block = stream->read())
	{
		LOG_TRACE(log, "Merging aggregated block");
		
		if (!sample)
			for (size_t i = 0; i < keys_size + aggregates_size; ++i)
				sample.insert(block.getByPosition(i).cloneEmpty());
		
		/// Запоминаем столбцы, с которыми будем работать
		for (size_t i = 0; i < keys_size; ++i)
			key_columns[i] = block.getByPosition(i).column;

		for (size_t i = 0; i < aggregates_size; ++i)
			aggregate_columns[i] = &dynamic_cast<ColumnAggregateFunction &>(*block.getByPosition(keys_size + i).column).getData();

		size_t rows = block.rows();

		/// Каким способом выполнять агрегацию?
		Sizes key_sizes;
		result.type = chooseAggregationMethod(key_columns, key_sizes);
		result.keys_size = keys_size;
		result.key_sizes = key_sizes;

		if (result.type == AggregatedDataVariants::WITHOUT_KEY || with_totals)
		{
			AggregatedDataWithoutKey & res = result.without_key;
			if (!res)
			{
				res = result.aggregates_pool->alloc(total_size_of_aggregate_states);
				
				for (size_t i = 0; i < aggregates_size; ++i)
					aggregate_functions[i]->create(res + offsets_of_aggregate_states[i]);
			}

			/// Добавляем значения
			for (size_t i = 0; i < aggregates_size; ++i)
				aggregate_functions[i]->merge(res + offsets_of_aggregate_states[i], (*aggregate_columns[i])[0]);
		}

		if (result.type == AggregatedDataVariants::KEY_64)
		{
			AggregatedDataWithUInt64Key & res = result.key64;
			const IColumn & column = *key_columns[0];

			/// Для всех строчек
			for (size_t i = with_totals ? 1 : 0; i < rows; ++i)
			{
				/// Строим ключ
				UInt64 key = get<UInt64>(column[i]);
				
				AggregatedDataWithUInt64Key::iterator it;
				bool inserted;
				res.emplace(key, it, inserted);

				if (inserted)
				{
					it->second = result.aggregates_pool->alloc(total_size_of_aggregate_states);

					for (size_t j = 0; j < aggregates_size; ++j)
						aggregate_functions[j]->create(it->second + offsets_of_aggregate_states[j]);
				}

				/// Добавляем значения
				for (size_t j = 0; j < aggregates_size; ++j)
					aggregate_functions[j]->merge(it->second + offsets_of_aggregate_states[j], (*aggregate_columns[j])[i]);
			}
		}
		else if (result.type == AggregatedDataVariants::KEY_STRING)
		{
			AggregatedDataWithStringKey & res = result.key_string;
			const IColumn & column = *key_columns[0];

			if (const ColumnString * column_string = dynamic_cast<const ColumnString *>(&column))
            {
                const ColumnString::Offsets_t & offsets = column_string->getOffsets();
                const ColumnString::Chars_t & data = column_string->getChars();

				/// Для всех строчек
				for (size_t i = with_totals ? 1 : 0; i < rows; ++i)
				{
					/// Строим ключ
					StringRef ref(&data[i == 0 ? 0 : offsets[i - 1]], (i == 0 ? offsets[i] : (offsets[i] - offsets[i - 1])) - 1);

					AggregatedDataWithStringKey::iterator it;
					bool inserted;
					res.emplace(ref, it, inserted);

					if (inserted)
					{
						it->first.data = result.string_pool.insert(ref.data, ref.size);
						it->second = result.aggregates_pool->alloc(total_size_of_aggregate_states);

						for (size_t j = 0; j < aggregates_size; ++j)
							aggregate_functions[j]->create(it->second + offsets_of_aggregate_states[j]);
					}

					/// Добавляем значения
					for (size_t j = 0; j < aggregates_size; ++j)
						aggregate_functions[j]->merge(it->second + offsets_of_aggregate_states[j], (*aggregate_columns[j])[i]);
				}
			}
			else if (const ColumnFixedString * column_string = dynamic_cast<const ColumnFixedString *>(&column))
            {
                size_t n = column_string->getN();
                const ColumnFixedString::Chars_t & data = column_string->getChars();

				/// Для всех строчек
				for (size_t i = with_totals ? 1 : 0; i < rows; ++i)
				{
					/// Строим ключ
					StringRef ref(&data[i * n], n);

					AggregatedDataWithStringKey::iterator it;
					bool inserted;
					res.emplace(ref, it, inserted);

					if (inserted)
					{
						it->first.data = result.string_pool.insert(ref.data, ref.size);
						it->second = result.aggregates_pool->alloc(total_size_of_aggregate_states);

						for (size_t j = 0; j < aggregates_size; ++j)
							aggregate_functions[j]->create(it->second + offsets_of_aggregate_states[j]);
					}

					/// Добавляем значения
					for (size_t j = 0; j < aggregates_size; ++j)
						aggregate_functions[j]->merge(it->second + offsets_of_aggregate_states[j], (*aggregate_columns[j])[i]);
				}
			}
			else
				throw Exception("Illegal type of column when aggregating by string key: " + column.getName(), ErrorCodes::ILLEGAL_COLUMN);
		}
		else if (result.type == AggregatedDataVariants::KEYS_128)
		{
			AggregatedDataWithKeys128 & res = result.keys128;

			/// Для всех строчек
			for (size_t i = with_totals ? 1 : 0; i < rows; ++i)
			{
				AggregatedDataWithKeys128::iterator it;
				bool inserted;
				res.emplace(pack128(i, keys_size, key_columns, key_sizes), it, inserted);

				if (inserted)
				{
					it->second = result.aggregates_pool->alloc(total_size_of_aggregate_states);

					for (size_t j = 0; j < aggregates_size; ++j)
						aggregate_functions[j]->create(it->second + offsets_of_aggregate_states[j]);
				}

				/// Добавляем значения
				for (size_t j = 0; j < aggregates_size; ++j)
					aggregate_functions[j]->merge(it->second + offsets_of_aggregate_states[j], (*aggregate_columns[j])[i]);
			}
		}
		else if (result.type == AggregatedDataVariants::HASHED)
		{
			AggregatedDataHashed & res = result.hashed;

			/// Для всех строчек
			for (size_t i = with_totals ? 1 : 0; i < rows; ++i)
			{
				AggregatedDataHashed::iterator it;
				bool inserted;
				res.emplace(hash128(i, keys_size, key_columns, key), it, inserted);

				if (inserted)
				{
					it->second.first = placeKeysInPool(i, keys_size, key, result.keys_pool);
					it->second.second = result.aggregates_pool->alloc(total_size_of_aggregate_states);

					for (size_t j = 0; j < aggregates_size; ++j)
						aggregate_functions[j]->create(it->second.second + offsets_of_aggregate_states[j]);
				}

				/// Добавляем значения
				for (size_t j = 0; j < aggregates_size; ++j)
					aggregate_functions[j]->merge(it->second.second + offsets_of_aggregate_states[j], (*aggregate_columns[j])[i]);
			}
		}
		else if (result.type != AggregatedDataVariants::WITHOUT_KEY)
			throw Exception("Unknown aggregated data variant.", ErrorCodes::UNKNOWN_AGGREGATED_DATA_VARIANT);

		LOG_TRACE(log, "Merged aggregated block");
	}
}


void Aggregator::destroyAggregateStates(AggregatedDataVariants & result)
{
	if (result.size() == 0)
		return;

	LOG_TRACE(log, "Destroying aggregate states");

	/// В какой структуре данных агрегированы данные?
	if (result.type == AggregatedDataVariants::WITHOUT_KEY || with_totals)
	{
		AggregatedDataWithoutKey & res_data = result.without_key;

		for (size_t i = 0; i < aggregates_size; ++i)
			aggregate_functions[i]->destroy(res_data + offsets_of_aggregate_states[i]);
	}
	if (result.type == AggregatedDataVariants::KEY_64)
	{
		AggregatedDataWithUInt64Key & res_data = result.key64;

		for (AggregatedDataWithUInt64Key::const_iterator it = res_data.begin(); it != res_data.end(); ++it)
			for (size_t i = 0; i < aggregates_size; ++i)
				aggregate_functions[i]->destroy(it->second + offsets_of_aggregate_states[i]);
	}
	else if (result.type == AggregatedDataVariants::KEY_STRING)
	{
		AggregatedDataWithStringKey & res_data = result.key_string;

		for (AggregatedDataWithStringKey::const_iterator it = res_data.begin(); it != res_data.end(); ++it)
			for (size_t i = 0; i < aggregates_size; ++i)
				aggregate_functions[i]->destroy(it->second + offsets_of_aggregate_states[i]);
	}
	else if (result.type == AggregatedDataVariants::HASHED)
	{
		AggregatedDataHashed & res_data = result.hashed;

		for (AggregatedDataHashed::iterator it = res_data.begin(); it != res_data.end(); ++it)
			for (size_t i = 0; i < aggregates_size; ++i)
				aggregate_functions[i]->destroy(it->second.second + offsets_of_aggregate_states[i]);
	}
}


String Aggregator::getID() const
{
	std::stringstream res;
	
	if (keys.empty())
	{
		res << "key_names";
		for (size_t i = 0; i < key_names.size(); ++i)
			res << ", " << key_names[i];
	}
	else
	{
		res << "keys";
		for (size_t i = 0; i < keys.size(); ++i)
			res << ", " << keys[i];
	}

	res << ", aggregates";
	for (size_t i = 0; i < aggregates.size(); ++i)
		res << ", " << aggregates[i].column_name;

	return res.str();
}

}
-												dbms: improved performance of queries with large aggregation result [#CONV-2944].



											
										
										
											2013-02-03 18:39:09 +00:00
+								#include <iomanip>
 								#include <statdaemons/Stopwatch.h>
-												dbms: development [#CONV-2944].



											
										
										
											2011-09-19 03:34:23 +00:00
+								#include <DB/DataTypes/DataTypeAggregateFunction.h>
 								#include <DB/Columns/ColumnAggregateFunction.h>
-												dbms: development [#CONV-2944].



											
										
										
											2011-09-26 07:25:22 +00:00
+								#include <DB/Columns/ColumnString.h>
 								#include <DB/Columns/ColumnFixedString.h>
 								#include <DB/Columns/ColumnsNumber.h>
-												dbms: development [#CONV-2944].



											
										
										
											2012-07-15 23:13:08 +00:00
+								#include <DB/AggregateFunctions/AggregateFunctionCount.h>
-												dbms: development [#CONV-2944].



											
										
										
											2011-09-19 03:34:23 +00:00
 								#include <DB/Interpreters/Aggregator.h>
-												dbms: development.



											
										
										
											2011-09-19 01:42:16 +00:00
 								namespace DB
 								{
-												dbms: development [#CONV-2944].



											
										
										
											2011-09-26 07:25:22 +00:00
-												dbms: fixed possible leak [#CONV-2944].



											
										
										
											2013-02-16 18:59:05 +00:00
+								AggregatedDataVariants::~AggregatedDataVariants()
 								{
-												dbms: additional performance improvement [#METR-2944].



											
										
										
											2013-11-03 23:54:12 +00:00
+									if (aggregator && !aggregator->all_aggregates_has_trivial_destructor)
-												dbms: fixed possible leak [#CONV-2944].



											
										
										
											2013-02-16 18:59:05 +00:00
+										aggregator->destroyAggregateStates(*this);
 								}
-												dbms: development [#CONV-2944].



											
										
										
											2012-03-05 07:58:34 +00:00
+								void Aggregator::initialize(Block & block)
 								{
 									Poco::ScopedLock<Poco::FastMutex> lock(mutex);
 									if (initialized)
 										return;
 									initialized = true;
-												dbms: probably fixed error in Aggregator [#CONV-2944].



											
										
										
											2013-02-13 19:24:19 +00:00
 									aggregate_functions.resize(aggregates_size);
 									for (size_t i = 0; i < aggregates_size; ++i)
 										aggregate_functions[i] = &*aggregates[i].function;
 									/// Инициализируем размеры состояний и смещения для агрегатных функций.
 									offsets_of_aggregate_states.resize(aggregates_size);
 									total_size_of_aggregate_states = 0;
-												dbms: additional performance improvement [#METR-2944].



											
										
										
											2013-11-03 23:54:12 +00:00
+									all_aggregates_has_trivial_destructor = true;
-												dbms: probably fixed error in Aggregator [#CONV-2944].



											
										
										
											2013-02-13 19:24:19 +00:00
 									for (size_t i = 0; i < aggregates_size; ++i)
 									{
 										offsets_of_aggregate_states[i] = total_size_of_aggregate_states;
 										total_size_of_aggregate_states += aggregates[i].function->sizeOfData();
-												dbms: additional performance improvement [#METR-2944].



											
										
										
											2013-11-03 23:54:12 +00:00
 										if (!aggregates[i].function->hasTrivialDestructor())
 											all_aggregates_has_trivial_destructor = false;
-												dbms: probably fixed error in Aggregator [#CONV-2944].



											
										
										
											2013-02-13 19:24:19 +00:00
+									}
 									/** Всё остальное - только если передан непустой block.
 									  * (всё остальное не нужно в методе merge блоков с готовыми состояниями агрегатных функций).
 									  */
 									if (!block)
 										return;
-												dbms: development [#CONV-2944].



											
										
										
											2012-03-05 07:58:34 +00:00
 									/// Преобразуем имена столбцов в номера, если номера не заданы
 									if (keys.empty() && !key_names.empty())
 										for (Names::const_iterator it = key_names.begin(); it != key_names.end(); ++it)
 											keys.push_back(block.getPositionByName(*it));
 									for (AggregateDescriptions::iterator it = aggregates.begin(); it != aggregates.end(); ++it)
 										if (it->arguments.empty() && !it->argument_names.empty())
 											for (Names::const_iterator jt = it->argument_names.begin(); jt != it->argument_names.end(); ++jt)
 												it->arguments.push_back(block.getPositionByName(*jt));
 									/// Создадим пример блока, описывающего результат
 									if (!sample)
 									{
-												dbms: continuing improvement (incomplete) [#CONV-2944].



											
										
										
											2013-02-08 20:34:30 +00:00
+										for (size_t i = 0; i < keys_size; ++i)
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-31 01:13:15 +00:00
+										{
-												dbms: development [#CONV-2944].



											
										
										
											2012-03-05 07:58:34 +00:00
+											sample.insert(block.getByPosition(keys[i]).cloneEmpty());
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-31 01:13:15 +00:00
+											if (sample.getByPosition(i).column->isConst())
 												sample.getByPosition(i).column = dynamic_cast<IColumnConst &>(*sample.getByPosition(i).column).convertToFullColumn();
 										}
-												dbms: development [#CONV-2944].



											
										
										
											2012-03-05 07:58:34 +00:00
-												dbms: continuing improvement (incomplete) [#CONV-2944].



											
										
										
											2013-02-08 20:34:30 +00:00
+										for (size_t i = 0; i < aggregates_size; ++i)
-												dbms: development [#CONV-2944].



											
										
										
											2012-03-05 07:58:34 +00:00
+										{
 											ColumnWithNameAndType col;
 											col.name = aggregates[i].column_name;
-												dbms: probably fixed error with aggregate function serialization (incomplete) [#CONV-2944].



											
										
										
											2012-10-24 18:14:36 +00:00
 											size_t arguments_size = aggregates[i].arguments.size();
 											DataTypes argument_types(arguments_size);
 											for (size_t j = 0; j < arguments_size; ++j)
 												argument_types[j] = block.getByPosition(aggregates[i].arguments[j]).type;
 											col.type = new DataTypeAggregateFunction(aggregates[i].function, argument_types);
-												dbms: continuing improvement (incomplete) [#CONV-2944].



											
										
										
											2013-02-08 20:34:30 +00:00
+											col.column = new ColumnAggregateFunction(aggregates[i].function);
-												dbms: development [#CONV-2944].



											
										
										
											2012-03-05 07:58:34 +00:00
 											sample.insert(col);
 										}
-												dbms: continuing improvement (incomplete) [#CONV-2944].



											
										
										
											2013-02-08 20:34:30 +00:00
+									}
-												dbms: development [#CONV-2944].



											
										
										
											2012-03-05 07:58:34 +00:00
+								}
-												dbms: improved performance of aggregation by many fields: lowered number of allocs; more direct memory layout; don't use temporary Fields; lowered memory consumption [#CONV-2944].



											
										
										
											2013-06-30 16:56:00 +00:00
+								AggregatedDataVariants::Type Aggregator::chooseAggregationMethod(const ConstColumnPlainPtrs & key_columns, Sizes & key_sizes)
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-30 01:38:02 +00:00
+								{
-												dbms: improved performance of aggregation by many fields: lowered number of allocs; more direct memory layout; don't use temporary Fields; lowered memory consumption [#CONV-2944].



											
										
										
											2013-06-30 16:56:00 +00:00
+									bool keys_fit_128_bits = true;
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-30 01:38:02 +00:00
+									size_t keys_bytes = 0;
 									key_sizes.resize(keys_size);
 									for (size_t j = 0; j < keys_size; ++j)
 									{
-												dbms: improved performance of aggregation by FixedString columns [#CONV-2944].



											
										
										
											2013-07-19 20:12:02 +00:00
+										if (!key_columns[j]->isFixed())
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-30 01:38:02 +00:00
+										{
 											keys_fit_128_bits = false;
 											break;
 										}
 										key_sizes[j] = key_columns[j]->sizeOfField();
 										keys_bytes += key_sizes[j];
 									}
 									if (keys_bytes > 16)
 										keys_fit_128_bits = false;
 									/// Если ключей нет
 									if (keys_size == 0)
 										return AggregatedDataVariants::WITHOUT_KEY;
-												dbms: improved performance of aggregation by FixedString columns [#CONV-2944].



											
										
										
											2013-07-19 20:12:02 +00:00
+									/// Если есть один числовой ключ, который помещается в 64 бита
-												dbms: Aggregator: improvement [#CONV-2944].



											
										
										
											2013-02-16 20:15:45 +00:00
+									if (keys_size == 1 && key_columns[0]->isNumeric())
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-30 01:38:02 +00:00
+										return AggregatedDataVariants::KEY_64;
-												dbms: improved performance of aggregation by FixedString columns [#CONV-2944].



											
										
										
											2013-07-19 20:12:02 +00:00
+									/// Если ключи помещаются в 128 бит, будем использовать хэш-таблицу по упакованным в 128-бит ключам
 									if (keys_fit_128_bits)
 										return AggregatedDataVariants::KEYS_128;
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-30 01:38:02 +00:00
+									/// Если есть один строковый ключ, то используем хэш-таблицу с ним
 									if (keys_size == 1
-												dbms: improved performance of aggregation [#CONV-2944].



											
										
										
											2013-01-08 19:41:22 +00:00
+										&& (dynamic_cast<const ColumnString *>(key_columns[0]) || dynamic_cast<const ColumnFixedString *>(key_columns[0])
 											|| dynamic_cast<const ColumnConstString *>(key_columns[0])))
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-30 01:38:02 +00:00
+										return AggregatedDataVariants::KEY_STRING;
-												dbms: improved performance of aggregation by many fields: lowered number of allocs; more direct memory layout; don't use temporary Fields; lowered memory consumption [#CONV-2944].



											
										
										
											2013-06-30 16:56:00 +00:00
+									/// Иначе будем агрегировать по хэшу от ключей.
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-30 01:38:02 +00:00
+									return AggregatedDataVariants::HASHED;
 								}
-												dbms: development [#CONV-2944].



											
										
										
											2011-09-28 05:24:38 +00:00
+								/** Результат хранится в оперативке и должен полностью помещаться в оперативку.
-												dbms: development.



											
										
										
											2011-09-19 01:42:16 +00:00
+								  */
-												dbms: development [#CONV-2944].



											
										
										
											2011-09-26 07:25:22 +00:00
+								void Aggregator::execute(BlockInputStreamPtr stream, AggregatedDataVariants & result)
-												dbms: development.



											
										
										
											2011-09-19 01:42:16 +00:00
+								{
-												dbms: improved performance of aggregation by many fields: lowered number of allocs; more direct memory layout; don't use temporary Fields; lowered memory consumption [#CONV-2944].



											
										
										
											2013-06-30 16:56:00 +00:00
+									StringRefs key(keys_size);
-												dbms: improved performance of aggregation [#CONV-2944].



											
										
										
											2013-01-08 19:41:22 +00:00
+									ConstColumnPlainPtrs key_columns(keys_size);
-												dbms: development.



											
										
										
											2011-09-19 01:42:16 +00:00
-												dbms: improved performance of aggregation [#CONV-2944].



											
										
										
											2013-01-08 19:41:22 +00:00
+									typedef std::vector<ConstColumnPlainPtrs> AggregateColumns;
-												dbms: development.



											
										
										
											2011-09-19 01:42:16 +00:00
+									AggregateColumns aggregate_columns(aggregates_size);
-												dbms: development of limits [#CONV-2944].



											
										
										
											2012-12-25 19:28:59 +00:00
+									/** Используется, если есть ограничение на максимальное количество строк при агрегации,
 									  *  и если group_by_overflow_mode == ANY.
 									  * В этом случае, новые ключи не добавляются в набор, а производится агрегация только по
 									  *  ключам, которые уже успели попасть в набор.
 									  */
 									bool no_more_keys = false;
-												dbms: Aggregator: more logging [#CONV-2944].



											
										
										
											2013-02-04 03:31:53 +00:00
+									LOG_TRACE(log, "Aggregating");
-												dbms: continuing improvement (incomplete) [#CONV-2944].



											
										
										
											2013-02-08 20:34:30 +00:00
-												dbms: Aggregator: more logging [#CONV-2944].



											
										
										
											2013-02-04 03:31:53 +00:00
+									Stopwatch watch;
 									size_t src_rows = 0;
 									size_t src_bytes = 0;
-												dbms: improvement [#CONV-2944].



											
										
										
											2013-02-09 01:02:52 +00:00
 									Sizes key_sizes;
 									/// Читаем все данные
-												dbms: development.



											
										
										
											2011-09-19 01:42:16 +00:00
+									while (Block block = stream->read())
 									{
-												dbms: development [#CONV-2944].



											
										
										
											2012-03-05 07:58:34 +00:00
+										initialize(block);
-												dbms: fixed possible leak [#CONV-2944].



											
										
										
											2013-02-16 18:59:05 +00:00
 										/// result будет уничтожать состояния агрегатных функций в деструкторе
 										result.aggregator = this;
-												dbms: Aggregator: more logging [#CONV-2944].



											
										
										
											2013-02-04 03:31:53 +00:00
+										src_rows += block.rows();
 										src_bytes += block.bytes();
-												dbms: development [#CONV-2944].



											
										
										
											2011-09-25 05:07:47 +00:00
 										for (size_t i = 0; i < aggregates_size; ++i)
 											aggregate_columns[i].resize(aggregates[i].arguments.size());
-												dbms: development [#CONV-2944].



											
										
										
											2011-09-24 20:32:41 +00:00
-												dbms: development.



											
										
										
											2011-09-19 01:42:16 +00:00
+										/// Запоминаем столбцы, с которыми будем работать
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-30 01:38:02 +00:00
+										for (size_t i = 0; i < keys_size; ++i)
-												dbms: development.



											
										
										
											2011-09-19 01:42:16 +00:00
+											key_columns[i] = block.getByPosition(keys[i]).column;
 										for (size_t i = 0; i < aggregates_size; ++i)
-												dbms: improved performance [#CONV-2944].



											
										
										
											2013-06-25 14:16:16 +00:00
+										{
-												dbms: development.



											
										
										
											2011-09-19 01:42:16 +00:00
+											for (size_t j = 0; j < aggregate_columns[i].size(); ++j)
-												dbms: improved performance [#CONV-2944].



											
										
										
											2013-06-25 14:16:16 +00:00
+											{
-												dbms: development.



											
										
										
											2011-09-19 01:42:16 +00:00
+												aggregate_columns[i][j] = block.getByPosition(aggregates[i].arguments[j]).column;
-												dbms: improved performance [#CONV-2944].



											
										
										
											2013-06-25 14:16:16 +00:00
+												/** Агрегатные функции рассчитывают, что в них передаются полноценные столбцы.
 												  * Поэтому, стобцы-константы не разрешены в качестве аргументов агрегатных функций.
 												  */
 												if (aggregate_columns[i][j]->isConst())
 													throw Exception("Constants is not allowed as arguments of aggregate functions", ErrorCodes::ILLEGAL_COLUMN);
 											}
 										}
-												dbms: development.



											
										
										
											2011-09-19 01:42:16 +00:00
+										size_t rows = block.rows();
-												dbms: development [#CONV-2944].



											
										
										
											2011-09-26 07:25:22 +00:00
+										/// Каким способом выполнять агрегацию?
-												dbms: improvement [#CONV-2944].



											
										
										
											2013-02-09 01:02:52 +00:00
+										if (result.empty())
 										{
-												dbms: improved performance of aggregation by many fields: lowered number of allocs; more direct memory layout; don't use temporary Fields; lowered memory consumption [#CONV-2944].



											
										
										
											2013-06-30 16:56:00 +00:00
+											result.type = chooseAggregationMethod(key_columns, key_sizes);
-												dbms: improvement [#CONV-2944].



											
										
										
											2013-02-09 02:20:26 +00:00
+											result.keys_size = keys_size;
-												dbms: improved performance of aggregation by many fields: lowered number of allocs; more direct memory layout; don't use temporary Fields; lowered memory consumption [#CONV-2944].



											
										
										
											2013-06-30 16:56:00 +00:00
+											result.key_sizes = key_sizes;
 											LOG_TRACE(log, "Aggregation method: " << result.getMethodName());
-												dbms: improvement [#CONV-2944].



											
										
										
											2013-02-09 01:02:52 +00:00
+										}
-												dbms: development [#CONV-2944].



											
										
										
											2011-09-26 12:50:50 +00:00
-												dbms: added WITH TOTALS modifier for GROUP BY [#CONV-2944].



											
										
										
											2013-05-04 15:46:50 +00:00
+										if (result.type == AggregatedDataVariants::WITHOUT_KEY || with_totals)
-												dbms: development.



											
										
										
											2011-09-19 01:42:16 +00:00
+										{
-												dbms: development [#CONV-2944].



											
										
										
											2011-09-26 07:25:22 +00:00
+											AggregatedDataWithoutKey & res = result.without_key;
-												dbms: continuing improvement (incomplete) [#CONV-2944].



											
										
										
											2013-02-08 20:34:30 +00:00
+											if (!res)
-												dbms: development [#CONV-2944].



											
										
										
											2011-09-26 11:58:35 +00:00
+											{
-												dbms: continuing improvement (incomplete) [#CONV-2944].



											
										
										
											2013-02-08 20:34:30 +00:00
+												res = result.aggregates_pool->alloc(total_size_of_aggregate_states);
-												dbms: development [#CONV-2944].



											
										
										
											2011-09-26 11:58:35 +00:00
+												for (size_t i = 0; i < aggregates_size; ++i)
-												dbms: tiny improvement [#CONV-2944].



											
										
										
											2013-07-28 01:42:36 +00:00
+													aggregate_functions[i]->create(res + offsets_of_aggregate_states[i]);
-												dbms: development [#CONV-2944].



											
										
										
											2011-09-26 11:58:35 +00:00
+											}
-												dbms: development [#CONV-2944].



											
										
										
											2012-07-15 23:13:08 +00:00
 											/// Оптимизация в случае единственной агрегатной функции count.
-												dbms: fixed error when no aggregate functions and GROUP BY WITH TOTALS [#METR-9030].



											
										
										
											2013-10-23 23:12:40 +00:00
+											AggregateFunctionCount * agg_count = aggregates_size == 1
 												? dynamic_cast<AggregateFunctionCount *>(aggregate_functions[0])
 												: NULL;
 											if (agg_count)
-												dbms: continuing improvement (incomplete) [#CONV-2944].



											
										
										
											2013-02-08 20:34:30 +00:00
+												agg_count->addDelta(res, rows);
-												dbms: development [#CONV-2944].



											
										
										
											2012-07-15 23:13:08 +00:00
+											else
-												dbms: development [#CONV-2944].



											
										
										
											2011-09-26 07:25:22 +00:00
+											{
-												dbms: development [#CONV-2944].



											
										
										
											2012-07-15 23:13:08 +00:00
+												for (size_t i = 0; i < rows; ++i)
-												dbms: development [#CONV-2944].



											
										
										
											2011-09-26 07:25:22 +00:00
+												{
-												dbms: development [#CONV-2944].



											
										
										
											2012-07-15 23:13:08 +00:00
+													/// Добавляем значения
 													for (size_t j = 0; j < aggregates_size; ++j)
-												dbms: improved performance of aggregation a little [#CONV-2944].



											
										
										
											2013-06-25 08:06:40 +00:00
+														aggregate_functions[j]->add(res + offsets_of_aggregate_states[j], &aggregate_columns[j][0], i);
-												dbms: development [#CONV-2944].



											
										
										
											2011-09-26 07:25:22 +00:00
+												}
 											}
 										}
-												dbms: fixed error after adding 'WITH TOTALS' modifier [#CONV-7489].



											
										
										
											2013-05-06 11:45:28 +00:00
-												dbms: added WITH TOTALS modifier for GROUP BY [#CONV-2944].



											
										
										
											2013-05-04 15:46:50 +00:00
+										if (result.type == AggregatedDataVariants::KEY_64)
-												dbms: development [#CONV-2944].



											
										
										
											2011-09-26 07:25:22 +00:00
+										{
 											AggregatedDataWithUInt64Key & res = result.key64;
-												dbms: improved performance of aggregation [#CONV-2944].



											
										
										
											2013-01-08 19:41:22 +00:00
+											const IColumn & column = *key_columns[0];
-												dbms: development.



											
										
										
											2011-09-19 01:42:16 +00:00
-												dbms: development [#CONV-2944].



											
										
										
											2011-09-26 07:25:22 +00:00
+											/// Для всех строчек
 											for (size_t i = 0; i < rows; ++i)
-												dbms: development.



											
										
										
											2011-09-19 01:42:16 +00:00
+											{
-												dbms: development [#CONV-2944].



											
										
										
											2011-09-26 07:25:22 +00:00
+												/// Строим ключ
-												dbms: continuing improvement (incomplete) [#CONV-2944].



											
										
										
											2013-02-08 20:34:30 +00:00
+												UInt64 key = get<UInt64>(column[i]);
-												dbms: development [#CONV-2944].



											
										
										
											2011-09-26 07:25:22 +00:00
-												dbms: development [#CONV-2944].



											
										
										
											2011-12-19 02:00:40 +00:00
+												AggregatedDataWithUInt64Key::iterator it;
 												bool inserted;
-												dbms: development of limits [#CONV-2944].



											
										
										
											2012-12-25 19:28:59 +00:00
 												if (!no_more_keys)
 													res.emplace(key, it, inserted);
 												else
 												{
 													inserted = false;
 													it = res.find(key);
 													if (res.end() == it)
 														continue;
 												}
-												dbms: development [#CONV-2944].



											
										
										
											2011-12-19 02:00:40 +00:00
 												if (inserted)
-												dbms: development [#CONV-2944].



											
										
										
											2011-09-26 07:25:22 +00:00
+												{
-												dbms: continuing improvement (incomplete) [#CONV-2944].



											
										
										
											2013-02-08 20:34:30 +00:00
+													it->second = result.aggregates_pool->alloc(total_size_of_aggregate_states);
-												dbms: development [#CONV-2944].



											
										
										
											2011-12-19 02:00:40 +00:00
-												dbms: development [#CONV-2944].



											
										
										
											2011-09-26 07:25:22 +00:00
+													for (size_t j = 0; j < aggregates_size; ++j)
-												dbms: continuing improvement (incomplete) [#CONV-2944].



											
										
										
											2013-02-08 20:34:30 +00:00
+														aggregate_functions[j]->create(it->second + offsets_of_aggregate_states[j]);
-												dbms: development [#CONV-2944].



											
										
										
											2011-09-26 07:25:22 +00:00
+												}
 												/// Добавляем значения
-												dbms: development.



											
										
										
											2011-09-19 01:42:16 +00:00
+												for (size_t j = 0; j < aggregates_size; ++j)
-												dbms: improved performance of aggregation a little [#CONV-2944].



											
										
										
											2013-06-25 08:06:40 +00:00
+													aggregate_functions[j]->add(it->second + offsets_of_aggregate_states[j], &aggregate_columns[j][0], i);
-												dbms: development.



											
										
										
											2011-09-19 01:42:16 +00:00
+											}
-												dbms: development [#CONV-2944].



											
										
										
											2011-09-26 07:25:22 +00:00
+										}
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-30 01:38:02 +00:00
+										else if (result.type == AggregatedDataVariants::KEY_STRING)
-												dbms: development [#CONV-2944].



											
										
										
											2011-09-26 15:22:25 +00:00
+										{
 											AggregatedDataWithStringKey & res = result.key_string;
-												dbms: improved performance of aggregation [#CONV-2944].



											
										
										
											2013-01-08 19:41:22 +00:00
+											const IColumn & column = *key_columns[0];
-												dbms: development [#CONV-2944].



											
										
										
											2011-09-26 15:22:25 +00:00
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-31 05:41:56 +00:00
+											if (const ColumnString * column_string = dynamic_cast<const ColumnString *>(&column))
-												dbms: development [#CONV-2944].



											
										
										
											2011-09-26 15:22:25 +00:00
+											{
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-31 05:41:56 +00:00
+												const ColumnString::Offsets_t & offsets = column_string->getOffsets();
-												Separated ColumnString from ColumnArray and ColumnFixedString from ColumnFixedArray; removed ColumnFixedArray [#CONV-2944].



											
										
										
											2013-05-05 15:25:25 +00:00
+									            const ColumnString::Chars_t & data = column_string->getChars();
-												dbms: development [#CONV-2944].



											
										
										
											2011-09-26 15:22:25 +00:00
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-31 05:41:56 +00:00
+												/// Для всех строчек
 												for (size_t i = 0; i < rows; ++i)
-												dbms: development [#CONV-2944].



											
										
										
											2011-09-26 15:22:25 +00:00
+												{
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-31 05:41:56 +00:00
+													/// Строим ключ
-												dbms, sqxxl: fixed error [#CONV-7289].



											
										
										
											2013-04-13 00:56:07 +00:00
+													StringRef ref(&data[i == 0 ? 0 : offsets[i - 1]], (i == 0 ? offsets[i] : (offsets[i] - offsets[i - 1])) - 1);
-												dbms: development [#CONV-2944].



											
										
										
											2011-09-26 15:22:25 +00:00
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-31 05:41:56 +00:00
+													AggregatedDataWithStringKey::iterator it;
 													bool inserted;
-												dbms: development of limits [#CONV-2944].



											
										
										
											2012-12-25 19:28:59 +00:00
 													if (!no_more_keys)
 														res.emplace(ref, it, inserted);
 													else
 													{
 														inserted = false;
 														it = res.find(ref);
 														if (res.end() == it)
 															continue;
 													}
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-31 05:41:56 +00:00
 													if (inserted)
 													{
 														it->first.data = result.string_pool.insert(ref.data, ref.size);
-												dbms: continuing improvement (incomplete) [#CONV-2944].



											
										
										
											2013-02-08 20:34:30 +00:00
+														it->second = result.aggregates_pool->alloc(total_size_of_aggregate_states);
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-31 05:41:56 +00:00
 														for (size_t j = 0; j < aggregates_size; ++j)
-												dbms: continuing improvement (incomplete) [#CONV-2944].



											
										
										
											2013-02-08 20:34:30 +00:00
+															aggregate_functions[j]->create(it->second + offsets_of_aggregate_states[j]);
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-31 05:41:56 +00:00
+													}
 													/// Добавляем значения
-												dbms: development [#CONV-2944].



											
										
										
											2011-09-26 15:22:25 +00:00
+													for (size_t j = 0; j < aggregates_size; ++j)
-												dbms: improved performance of aggregation a little [#CONV-2944].



											
										
										
											2013-06-25 08:06:40 +00:00
+														aggregate_functions[j]->add(it->second + offsets_of_aggregate_states[j], &aggregate_columns[j][0], i);
-												dbms: development [#CONV-2944].



											
										
										
											2011-09-26 15:22:25 +00:00
+												}
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-31 05:41:56 +00:00
+											}
 											else if (const ColumnFixedString * column_string = dynamic_cast<const ColumnFixedString *>(&column))
 											{
 												size_t n = column_string->getN();
-												Separated ColumnString from ColumnArray and ColumnFixedString from ColumnFixedArray; removed ColumnFixedArray [#CONV-2944].



											
										
										
											2013-05-05 15:25:25 +00:00
+												const ColumnFixedString::Chars_t & data = column_string->getChars();
-												dbms: development [#CONV-2944].



											
										
										
											2011-09-26 15:22:25 +00:00
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-31 05:41:56 +00:00
+												/// Для всех строчек
 												for (size_t i = 0; i < rows; ++i)
-												dbms: development [#CONV-2944].



											
										
										
											2011-09-26 15:22:25 +00:00
+												{
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-31 05:41:56 +00:00
+													/// Строим ключ
 													StringRef ref(&data[i * n], n);
-												dbms: development [#CONV-2944].



											
										
										
											2011-09-26 15:22:25 +00:00
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-31 05:41:56 +00:00
+													AggregatedDataWithStringKey::iterator it;
 													bool inserted;
-												dbms: development of limits [#CONV-2944].



											
										
										
											2012-12-25 19:28:59 +00:00
 													if (!no_more_keys)
 														res.emplace(ref, it, inserted);
 													else
 													{
 														inserted = false;
 														it = res.find(ref);
 														if (res.end() == it)
 															continue;
 													}
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-31 05:41:56 +00:00
 													if (inserted)
 													{
 														it->first.data = result.string_pool.insert(ref.data, ref.size);
-												dbms: continuing improvement (incomplete) [#CONV-2944].



											
										
										
											2013-02-08 20:34:30 +00:00
+														it->second = result.aggregates_pool->alloc(total_size_of_aggregate_states);
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-31 05:41:56 +00:00
 														for (size_t j = 0; j < aggregates_size; ++j)
-												dbms: continuing improvement (incomplete) [#CONV-2944].



											
										
										
											2013-02-08 20:34:30 +00:00
+															aggregate_functions[j]->create(it->second + offsets_of_aggregate_states[j]);
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-31 05:41:56 +00:00
+													}
 													/// Добавляем значения
 													for (size_t j = 0; j < aggregates_size; ++j)
-												dbms: improved performance of aggregation a little [#CONV-2944].



											
										
										
											2013-06-25 08:06:40 +00:00
+														aggregate_functions[j]->add(it->second + offsets_of_aggregate_states[j], &aggregate_columns[j][0], i);
-												dbms: development [#CONV-2944].



											
										
										
											2011-09-26 15:22:25 +00:00
+												}
 											}
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-31 05:41:56 +00:00
+											else
 												throw Exception("Illegal type of column when aggregating by string key: " + column.getName(), ErrorCodes::ILLEGAL_COLUMN);
-												dbms: development [#CONV-2944].



											
										
										
											2011-09-26 15:22:25 +00:00
+										}
-												dbms: improved performance of aggregation by many fields: lowered number of allocs; more direct memory layout; don't use temporary Fields; lowered memory consumption [#CONV-2944].



											
										
										
											2013-06-30 16:56:00 +00:00
+										else if (result.type == AggregatedDataVariants::KEYS_128)
-												dbms: development [#CONV-2944].



											
										
										
											2011-09-26 07:25:22 +00:00
+										{
-												dbms: improved performance of aggregation by many fields: lowered number of allocs; more direct memory layout; don't use temporary Fields; lowered memory consumption [#CONV-2944].



											
										
										
											2013-06-30 16:56:00 +00:00
+											AggregatedDataWithKeys128 & res = result.keys128;
-												dbms: development.



											
										
										
											2011-09-19 01:42:16 +00:00
-												dbms: development [#CONV-2944].



											
										
										
											2011-09-26 07:25:22 +00:00
+											/// Для всех строчек
 											for (size_t i = 0; i < rows; ++i)
-												dbms: development.



											
										
										
											2011-09-19 01:42:16 +00:00
+											{
-												dbms: improved performance of aggregation by many fields: lowered number of allocs; more direct memory layout; don't use temporary Fields; lowered memory consumption [#CONV-2944].



											
										
										
											2013-06-30 16:56:00 +00:00
+												AggregatedDataWithKeys128::iterator it;
-												dbms: development [#CONV-2944].



											
										
										
											2011-12-19 02:00:40 +00:00
+												bool inserted;
-												dbms: improved performance of aggregation by many fields: lowered number of allocs; more direct memory layout; don't use temporary Fields; lowered memory consumption [#CONV-2944].



											
										
										
											2013-06-30 16:56:00 +00:00
+												UInt128 key128 = pack128(i, keys_size, key_columns, key_sizes);
-												dbms: development of limits [#CONV-2944].



											
										
										
											2012-12-25 19:28:59 +00:00
 												if (!no_more_keys)
 													res.emplace(key128, it, inserted);
 												else
 												{
 													inserted = false;
 													it = res.find(key128);
 													if (res.end() == it)
 														continue;
 												}
-												dbms: development [#CONV-2944].



											
										
										
											2011-12-19 02:00:40 +00:00
 												if (inserted)
-												dbms: development [#CONV-2944].



											
										
										
											2011-09-26 07:25:22 +00:00
+												{
-												dbms: improved performance of aggregation by many fields: lowered number of allocs; more direct memory layout; don't use temporary Fields; lowered memory consumption [#CONV-2944].



											
										
										
											2013-06-30 16:56:00 +00:00
+													it->second = result.aggregates_pool->alloc(total_size_of_aggregate_states);
-												dbms: development [#CONV-2944].



											
										
										
											2011-09-26 07:25:22 +00:00
+													for (size_t j = 0; j < aggregates_size; ++j)
-												dbms: improved performance of aggregation by many fields: lowered number of allocs; more direct memory layout; don't use temporary Fields; lowered memory consumption [#CONV-2944].



											
										
										
											2013-06-30 16:56:00 +00:00
+														aggregate_functions[j]->create(it->second + offsets_of_aggregate_states[j]);
-												dbms: development [#CONV-2944].



											
										
										
											2011-09-26 07:25:22 +00:00
+												}
 												/// Добавляем значения
 												for (size_t j = 0; j < aggregates_size; ++j)
-												dbms: improved performance of aggregation by many fields: lowered number of allocs; more direct memory layout; don't use temporary Fields; lowered memory consumption [#CONV-2944].



											
										
										
											2013-06-30 16:56:00 +00:00
+													aggregate_functions[j]->add(it->second + offsets_of_aggregate_states[j], &aggregate_columns[j][0], i);
-												dbms: development.



											
										
										
											2011-09-19 01:42:16 +00:00
+											}
 										}
-												dbms: improved performance of aggregation by many fields: lowered number of allocs; more direct memory layout; don't use temporary Fields; lowered memory consumption [#CONV-2944].



											
										
										
											2013-06-30 16:56:00 +00:00
+										else if (result.type == AggregatedDataVariants::HASHED)
-												dbms: development [#CONV-2944].



											
										
										
											2011-09-26 07:25:22 +00:00
+										{
-												dbms: improved performance of aggregation by many fields: lowered number of allocs; more direct memory layout; don't use temporary Fields; lowered memory consumption [#CONV-2944].



											
										
										
											2013-06-30 16:56:00 +00:00
+											AggregatedDataHashed & res = result.hashed;
-												dbms: development [#CONV-2944].



											
										
										
											2011-09-26 07:25:22 +00:00
+											/// Для всех строчек
 											for (size_t i = 0; i < rows; ++i)
 											{
-												dbms: improved performance of aggregation by many fields: lowered number of allocs; more direct memory layout; don't use temporary Fields; lowered memory consumption [#CONV-2944].



											
										
										
											2013-06-30 16:56:00 +00:00
+												AggregatedDataHashed::iterator it;
 												bool inserted;
 												UInt128 key128 = hash128(i, keys_size, key_columns, key);
-												dbms: development [#CONV-2944].



											
										
										
											2011-09-26 07:25:22 +00:00
-												dbms: improved performance of aggregation by many fields: lowered number of allocs; more direct memory layout; don't use temporary Fields; lowered memory consumption [#CONV-2944].



											
										
										
											2013-06-30 16:56:00 +00:00
+												if (!no_more_keys)
 													res.emplace(key128, it, inserted);
 												else
-												dbms: development [#CONV-2944].



											
										
										
											2011-09-26 07:25:22 +00:00
+												{
-												dbms: improved performance of aggregation by many fields: lowered number of allocs; more direct memory layout; don't use temporary Fields; lowered memory consumption [#CONV-2944].



											
										
										
											2013-06-30 16:56:00 +00:00
+													inserted = false;
 													it = res.find(key128);
 													if (res.end() == it)
-												dbms: development of limits [#CONV-2944].



											
										
										
											2012-12-25 19:28:59 +00:00
+														continue;
-												dbms: improved performance of aggregation by many fields: lowered number of allocs; more direct memory layout; don't use temporary Fields; lowered memory consumption [#CONV-2944].



											
										
										
											2013-06-30 16:56:00 +00:00
+												}
 												if (inserted)
 												{
 													it->second.first = placeKeysInPool(i, keys_size, key, result.keys_pool);
 													it->second.second = result.aggregates_pool->alloc(total_size_of_aggregate_states);
-												dbms: development [#CONV-2944].



											
										
										
											2011-09-26 07:25:22 +00:00
 													for (size_t j = 0; j < aggregates_size; ++j)
-												dbms: improved performance of aggregation by many fields: lowered number of allocs; more direct memory layout; don't use temporary Fields; lowered memory consumption [#CONV-2944].



											
										
										
											2013-06-30 16:56:00 +00:00
+														aggregate_functions[j]->create(it->second.second + offsets_of_aggregate_states[j]);
-												dbms: development [#CONV-2944].



											
										
										
											2011-09-26 07:25:22 +00:00
+												}
-												dbms: development.



											
										
										
											2011-09-19 01:42:16 +00:00
-												dbms: development [#CONV-2944].



											
										
										
											2011-09-26 07:25:22 +00:00
+												/// Добавляем значения
 												for (size_t j = 0; j < aggregates_size; ++j)
-												dbms: improved performance of aggregation by many fields: lowered number of allocs; more direct memory layout; don't use temporary Fields; lowered memory consumption [#CONV-2944].



											
										
										
											2013-06-30 16:56:00 +00:00
+													aggregate_functions[j]->add(it->second.second + offsets_of_aggregate_states[j], &aggregate_columns[j][0], i);
-												dbms: development [#CONV-2944].



											
										
										
											2011-09-26 07:25:22 +00:00
+											}
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-30 01:38:02 +00:00
+										}
-												dbms: fixed error after adding 'WITH TOTALS' modifier [#CONV-7489].



											
										
										
											2013-05-06 11:45:28 +00:00
+										else if (result.type != AggregatedDataVariants::WITHOUT_KEY)
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-30 01:38:02 +00:00
+											throw Exception("Unknown aggregated data variant.", ErrorCodes::UNKNOWN_AGGREGATED_DATA_VARIANT);
-												dbms: development of limits [#CONV-2944].



											
										
										
											2012-12-25 19:28:59 +00:00
 										/// Проверка ограничений.
 										if (!no_more_keys && max_rows_to_group_by && result.size() > max_rows_to_group_by)
 										{
 											if (group_by_overflow_mode == Limits::THROW)
-												dbms: improvement [#CONV-2944].



											
										
										
											2013-06-21 20:34:19 +00:00
+												throw Exception("Limit for rows to GROUP BY exceeded: has " + toString(result.size())
 													+ " rows, maximum: " + toString(max_rows_to_group_by),
-												dbms: development of limits [#CONV-2944].



											
										
										
											2012-12-25 19:28:59 +00:00
+													ErrorCodes::TOO_MUCH_ROWS);
 											else if (group_by_overflow_mode == Limits::BREAK)
 												break;
 											else if (group_by_overflow_mode == Limits::ANY)
 												no_more_keys = true;
 											else
-												typo in error messages [#CONV-2807]


											
										
										
											2013-05-17 08:02:34 +00:00
+												throw Exception("Logical error: unknown overflow mode", ErrorCodes::LOGICAL_ERROR);
-												dbms: development of limits [#CONV-2944].



											
										
										
											2012-12-25 19:28:59 +00:00
+										}
-												dbms: development [#CONV-2944].



											
										
										
											2011-09-26 07:25:22 +00:00
+									}
-												dbms: Aggregator: more logging [#CONV-2944].



											
										
										
											2013-02-04 03:31:53 +00:00
 									double elapsed_seconds = watch.elapsedSeconds();
 									size_t rows = result.size();
 									LOG_TRACE(log, std::fixed << std::setprecision(3)
 										<< "Aggregated. " << src_rows << " to " << rows << " rows (from " << src_bytes / 1048576.0 << " MiB)"
 										<< " in " << elapsed_seconds << " sec."
 										<< " (" << src_rows / elapsed_seconds << " rows/sec., " << src_bytes / elapsed_seconds / 1048576.0 << " MiB/sec.)");
-												dbms: development.



											
										
										
											2011-09-19 01:42:16 +00:00
+								}
-												dbms: merged convertToBlock and finalize aggregation steps whenever possible [#METR-2944].



											
										
										
											2013-11-03 23:35:18 +00:00
+								Block Aggregator::convertToBlock(AggregatedDataVariants & data_variants, bool separate_totals, Block & totals, bool final)
-												dbms: development [#CONV-2944].



											
										
										
											2012-02-27 06:28:20 +00:00
+								{
-												dbms: Aggregator: fixed error [#CONV-2944].



											
										
										
											2013-09-16 05:33:49 +00:00
+									Block res = sample.cloneEmpty();
-												dbms: improved performance for queries with large aggregation result [#CONV-2944].



											
										
										
											2013-02-03 18:08:52 +00:00
+									size_t rows = data_variants.size();
-												dbms: development [#CONV-2944].



											
										
										
											2012-02-27 06:28:20 +00:00
-												dbms: added totals as separate data in JSON formats [#CONV-8366].



											
										
										
											2013-09-01 04:55:41 +00:00
+									if (with_totals && separate_totals && rows != 0)
 										--rows;		/// Строчка с "тотальными" значениями идёт отдельно.
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-31 00:33:42 +00:00
+									LOG_TRACE(log, "Converting aggregated data to block");
-												dbms: improved performance of queries with large aggregation result [#CONV-2944].



											
										
										
											2013-02-03 18:39:09 +00:00
+									Stopwatch watch;
-												dbms: development [#CONV-2944].



											
										
										
											2012-02-27 06:28:20 +00:00
+									/// В какой структуре данных агрегированы данные?
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-10 07:47:13 +00:00
+									if (data_variants.empty())
-												dbms: Aggregator: fixed error [#CONV-2944].



											
										
										
											2013-09-16 05:33:49 +00:00
+										return Block();
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-10 07:47:13 +00:00
-												dbms: improvement to prev. revision [#CONV-2944].



											
										
										
											2013-02-03 18:45:33 +00:00
+									typedef std::vector<ColumnAggregateFunction::Container_t *> AggregateColumns;
-												dbms: improved performance for queries with large aggregation result [#CONV-2944].



											
										
										
											2013-02-03 18:08:52 +00:00
 									ColumnPlainPtrs key_columns(keys_size);
 									AggregateColumns aggregate_columns(aggregates_size);
-												dbms: merged convertToBlock and finalize aggregation steps whenever possible [#METR-2944].



											
										
										
											2013-11-03 23:35:18 +00:00
+									ColumnPlainPtrs final_aggregate_columns(aggregates_size);
-												dbms: improved performance for queries with large aggregation result [#CONV-2944].



											
										
										
											2013-02-03 18:08:52 +00:00
 									for (size_t i = 0; i < keys_size; ++i)
-												dbms: improved performance of queries with large aggregation result [#CONV-2944].



											
										
										
											2013-02-03 18:39:09 +00:00
+									{
-												dbms: improved performance for queries with large aggregation result [#CONV-2944].



											
										
										
											2013-02-03 18:08:52 +00:00
+										key_columns[i] = res.getByPosition(i).column;
-												dbms: improved performance of queries with large aggregation result [#CONV-2944].



											
										
										
											2013-02-03 18:39:09 +00:00
+										key_columns[i]->reserve(rows);
 									}
-												dbms: improved performance for queries with large aggregation result [#CONV-2944].



											
										
										
											2013-02-03 18:08:52 +00:00
 									for (size_t i = 0; i < aggregates_size; ++i)
-												dbms: improved performance of queries with large aggregation result [#CONV-2944].



											
										
										
											2013-02-03 18:39:09 +00:00
+									{
-												dbms: merged convertToBlock and finalize aggregation steps whenever possible [#METR-2944].



											
										
										
											2013-11-03 23:35:18 +00:00
+										if (!final)
 										{
 											/// Столбец ColumnAggregateFunction захватывает разделяемое владение ареной с состояниями агрегатных функций.
 											ColumnAggregateFunction & column_aggregate_func = static_cast<ColumnAggregateFunction &>(*res.getByPosition(i + keys_size).column);
 											for (size_t j = 0; j < data_variants.aggregates_pools.size(); ++j)
 												column_aggregate_func.addArena(data_variants.aggregates_pools[j]);
-												dbms: continue improvement [#CONV-2944].



											
										
										
											2013-02-09 00:12:04 +00:00
-												dbms: merged convertToBlock and finalize aggregation steps whenever possible [#METR-2944].



											
										
										
											2013-11-03 23:35:18 +00:00
+											aggregate_columns[i] = &column_aggregate_func.getData();
 											aggregate_columns[i]->resize(rows);
 										}
 										else
 										{
 											ColumnWithNameAndType & column = res.getByPosition(i + keys_size);
 											column.type = aggregate_functions[i]->getReturnType();
 											column.column = column.type->createColumn();
 											column.column->reserve(rows);
-												dbms: continuing improvement (incomplete) [#CONV-2944].



											
										
										
											2013-02-08 20:34:30 +00:00
-												dbms: merged convertToBlock and finalize aggregation steps whenever possible [#METR-2944].



											
										
										
											2013-11-03 23:35:18 +00:00
+											final_aggregate_columns[i] = column.column;
 										}
-												dbms: improved performance of queries with large aggregation result [#CONV-2944].



											
										
										
											2013-02-03 18:39:09 +00:00
+									}
-												dbms: improved performance for queries with large aggregation result [#CONV-2944].



											
										
										
											2013-02-03 18:08:52 +00:00
-												dbms: added WITH TOTALS modifier for GROUP BY [#CONV-2944].



											
										
										
											2013-05-04 15:46:50 +00:00
+									if (data_variants.type == AggregatedDataVariants::WITHOUT_KEY || with_totals)
-												dbms: development [#CONV-2944].



											
										
										
											2012-02-27 06:28:20 +00:00
+									{
 										AggregatedDataWithoutKey & data = data_variants.without_key;
-												dbms: Aggregator: fixed error [#CONV-8366].



											
										
										
											2013-09-02 20:28:18 +00:00
+										if (with_totals && separate_totals)
-												dbms: added totals as separate data in JSON formats [#CONV-8366].



											
										
										
											2013-09-01 04:55:41 +00:00
+										{
 											for (size_t i = 0; i < aggregates_size; ++i)
 											{
 												totals = res.cloneEmpty();
-												dbms: added WITH TOTALS modifier for GROUP BY [#CONV-2944].



											
										
										
											2013-05-04 15:46:50 +00:00
-												dbms: added totals as separate data in JSON formats [#CONV-8366].



											
										
										
											2013-09-01 04:55:41 +00:00
+												/// Для тотальных данных вместо ключей пишутся значения по-умолчанию (нули, пустые строки).
 												for (size_t i = 0; i < keys_size; ++i)
 													totals.getByPosition(i).column->insertDefault();
 												for (size_t i = 0; i < aggregates_size; ++i)
 												{
 													ColumnWithNameAndType & column = totals.getByPosition(i + keys_size);
 													column.type = aggregate_functions[i]->getReturnType();
 													column.column = column.type->createColumn();
 													aggregate_functions[i]->insertResultInto(data + offsets_of_aggregate_states[i], *column.column);
 												}
 											}
 										}
 										else
 										{
-												dbms: merged convertToBlock and finalize aggregation steps whenever possible [#METR-2944].



											
										
										
											2013-11-03 23:35:18 +00:00
+											if (!final)
 												for (size_t i = 0; i < aggregates_size; ++i)
 													(*aggregate_columns[i])[0] = data + offsets_of_aggregate_states[i];
 											else
 												for (size_t i = 0; i < aggregates_size; ++i)
 													aggregate_functions[i]->insertResultInto(data + offsets_of_aggregate_states[i], *final_aggregate_columns[i]);
-												dbms: added totals as separate data in JSON formats [#CONV-8366].



											
										
										
											2013-09-01 04:55:41 +00:00
 											if (with_totals)
 												for (size_t i = 0; i < keys_size; ++i)
 													key_columns[i]->insertDefault();
 										}
-												dbms: development [#CONV-2944].



											
										
										
											2012-02-27 06:28:20 +00:00
+									}
-												dbms: fixed error after adding 'WITH TOTALS' modifier [#CONV-7489].



											
										
										
											2013-05-06 11:45:28 +00:00
-												dbms: added WITH TOTALS modifier for GROUP BY [#CONV-2944].



											
										
										
											2013-05-04 15:46:50 +00:00
+									if (data_variants.type == AggregatedDataVariants::KEY_64)
-												dbms: development [#CONV-2944].



											
										
										
											2012-02-27 06:28:20 +00:00
+									{
 										AggregatedDataWithUInt64Key & data = data_variants.key64;
-												dbms: improved performance for queries with large aggregation result [#CONV-2944].



											
										
										
											2013-02-03 18:08:52 +00:00
+										IColumn & first_column = *key_columns[0];
-												dbms: development [#CONV-2944].



											
										
										
											2012-02-27 06:28:20 +00:00
-												dbms: added totals as separate data in JSON formats [#CONV-8366].



											
										
										
											2013-09-01 04:55:41 +00:00
+										size_t j = with_totals && !separate_totals ? 1 : 0;
-												dbms: merged convertToBlock and finalize aggregation steps whenever possible [#METR-2944].



											
										
										
											2013-11-03 23:35:18 +00:00
 										if (!final)
-												dbms: development [#CONV-2944].



											
										
										
											2012-02-27 06:28:20 +00:00
+										{
-												dbms: merged convertToBlock and finalize aggregation steps whenever possible [#METR-2944].



											
										
										
											2013-11-03 23:35:18 +00:00
+											for (AggregatedDataWithUInt64Key::const_iterator it = data.begin(); it != data.end(); ++it, ++j)
 											{
 												first_column.insertData(reinterpret_cast<const char *>(&it->first), sizeof(it->first));
-												dbms: development [#CONV-2944].



											
										
										
											2012-02-27 06:28:20 +00:00
-												dbms: merged convertToBlock and finalize aggregation steps whenever possible [#METR-2944].



											
										
										
											2013-11-03 23:35:18 +00:00
+												for (size_t i = 0; i < aggregates_size; ++i)
 													(*aggregate_columns[i])[j] = it->second + offsets_of_aggregate_states[i];
 											}
 										}
 										else
 										{
 											for (AggregatedDataWithUInt64Key::const_iterator it = data.begin(); it != data.end(); ++it, ++j)
 											{
 												first_column.insertData(reinterpret_cast<const char *>(&it->first), sizeof(it->first));
 												for (size_t i = 0; i < aggregates_size; ++i)
 													aggregate_functions[i]->insertResultInto(it->second + offsets_of_aggregate_states[i], *final_aggregate_columns[i]);
 											}
-												dbms: development [#CONV-2944].



											
										
										
											2012-02-27 06:28:20 +00:00
+										}
 									}
 									else if (data_variants.type == AggregatedDataVariants::KEY_STRING)
 									{
 										AggregatedDataWithStringKey & data = data_variants.key_string;
-												dbms: improved performance for queries with large aggregation result [#CONV-2944].



											
										
										
											2013-02-03 18:08:52 +00:00
+										IColumn & first_column = *key_columns[0];
-												dbms: development [#CONV-2944].



											
										
										
											2012-02-27 06:28:20 +00:00
-												dbms: added totals as separate data in JSON formats [#CONV-8366].



											
										
										
											2013-09-01 04:55:41 +00:00
+										size_t j = with_totals && !separate_totals ? 1 : 0;
-												dbms: merged convertToBlock and finalize aggregation steps whenever possible [#METR-2944].



											
										
										
											2013-11-03 23:35:18 +00:00
 										if (!final)
-												dbms: development [#CONV-2944].



											
										
										
											2012-02-27 06:28:20 +00:00
+										{
-												dbms: merged convertToBlock and finalize aggregation steps whenever possible [#METR-2944].



											
										
										
											2013-11-03 23:35:18 +00:00
+											for (AggregatedDataWithStringKey::const_iterator it = data.begin(); it != data.end(); ++it, ++j)
 											{
 												first_column.insertData(it->first.data, it->first.size);
-												dbms: development [#CONV-2944].



											
										
										
											2012-02-27 06:28:20 +00:00
-												dbms: merged convertToBlock and finalize aggregation steps whenever possible [#METR-2944].



											
										
										
											2013-11-03 23:35:18 +00:00
+												for (size_t i = 0; i < aggregates_size; ++i)
 													(*aggregate_columns[i])[j] = it->second + offsets_of_aggregate_states[i];
 											}
 										}
 										else
 										{
 											for (AggregatedDataWithStringKey::const_iterator it = data.begin(); it != data.end(); ++it, ++j)
 											{
 												first_column.insertData(it->first.data, it->first.size);
 												for (size_t i = 0; i < aggregates_size; ++i)
 													aggregate_functions[i]->insertResultInto(it->second + offsets_of_aggregate_states[i], *final_aggregate_columns[i]);
 											}
-												dbms: development [#CONV-2944].



											
										
										
											2012-02-27 06:28:20 +00:00
+										}
 									}
-												dbms: improved performance of aggregation by many fields: lowered number of allocs; more direct memory layout; don't use temporary Fields; lowered memory consumption [#CONV-2944].



											
										
										
											2013-06-30 16:56:00 +00:00
+									else if (data_variants.type == AggregatedDataVariants::KEYS_128)
-												dbms: development [#CONV-2944].



											
										
										
											2012-02-27 06:28:20 +00:00
+									{
-												dbms: improved performance of aggregation by many fields: lowered number of allocs; more direct memory layout; don't use temporary Fields; lowered memory consumption [#CONV-2944].



											
										
										
											2013-06-30 16:56:00 +00:00
+										AggregatedDataWithKeys128 & data = data_variants.keys128;
-												dbms: improved performance for queries with large aggregation result [#CONV-2944].



											
										
										
											2013-02-03 18:08:52 +00:00
-												dbms: added totals as separate data in JSON formats [#CONV-8366].



											
										
										
											2013-09-01 04:55:41 +00:00
+										size_t j = with_totals && !separate_totals ? 1 : 0;
-												dbms: merged convertToBlock and finalize aggregation steps whenever possible [#METR-2944].



											
										
										
											2013-11-03 23:35:18 +00:00
 										if (!final)
-												dbms: development [#CONV-2944].



											
										
										
											2012-02-27 06:28:20 +00:00
+										{
-												dbms: merged convertToBlock and finalize aggregation steps whenever possible [#METR-2944].



											
										
										
											2013-11-03 23:35:18 +00:00
+											for (AggregatedDataWithKeys128::const_iterator it = data.begin(); it != data.end(); ++it, ++j)
-												dbms: improved performance of aggregation by many fields: lowered number of allocs; more direct memory layout; don't use temporary Fields; lowered memory consumption [#CONV-2944].



											
										
										
											2013-06-30 16:56:00 +00:00
+											{
-												dbms: merged convertToBlock and finalize aggregation steps whenever possible [#METR-2944].



											
										
										
											2013-11-03 23:35:18 +00:00
+												size_t offset = 0;
 												for (size_t i = 0; i < keys_size; ++i)
 												{
 													size_t size = data_variants.key_sizes[i];
 													key_columns[i]->insertData(reinterpret_cast<const char *>(&it->first) + offset, size);
 													offset += size;
 												}
 												for (size_t i = 0; i < aggregates_size; ++i)
 													(*aggregate_columns[i])[j] = it->second + offsets_of_aggregate_states[i];
-												dbms: improved performance of aggregation by many fields: lowered number of allocs; more direct memory layout; don't use temporary Fields; lowered memory consumption [#CONV-2944].



											
										
										
											2013-06-30 16:56:00 +00:00
+											}
-												dbms: merged convertToBlock and finalize aggregation steps whenever possible [#METR-2944].



											
										
										
											2013-11-03 23:35:18 +00:00
+										}
 										else
 										{
 											for (AggregatedDataWithKeys128::const_iterator it = data.begin(); it != data.end(); ++it, ++j)
 											{
 												size_t offset = 0;
 												for (size_t i = 0; i < keys_size; ++i)
 												{
 													size_t size = data_variants.key_sizes[i];
 													key_columns[i]->insertData(reinterpret_cast<const char *>(&it->first) + offset, size);
 													offset += size;
 												}
-												dbms: development [#CONV-2944].



											
										
										
											2012-02-27 06:28:20 +00:00
-												dbms: merged convertToBlock and finalize aggregation steps whenever possible [#METR-2944].



											
										
										
											2013-11-03 23:35:18 +00:00
+												for (size_t i = 0; i < aggregates_size; ++i)
 													aggregate_functions[i]->insertResultInto(it->second + offsets_of_aggregate_states[i], *final_aggregate_columns[i]);
 											}
-												dbms: development [#CONV-2944].



											
										
										
											2012-02-27 06:28:20 +00:00
+										}
 									}
-												dbms: improved performance of aggregation by many fields: lowered number of allocs; more direct memory layout; don't use temporary Fields; lowered memory consumption [#CONV-2944].



											
										
										
											2013-06-30 16:56:00 +00:00
+									else if (data_variants.type == AggregatedDataVariants::HASHED)
-												dbms: development [#CONV-2944].



											
										
										
											2012-02-27 06:28:20 +00:00
+									{
-												dbms: improved performance of aggregation by many fields: lowered number of allocs; more direct memory layout; don't use temporary Fields; lowered memory consumption [#CONV-2944].



											
										
										
											2013-06-30 16:56:00 +00:00
+										AggregatedDataHashed & data = data_variants.hashed;
-												dbms: added totals as separate data in JSON formats [#CONV-8366].



											
										
										
											2013-09-01 04:55:41 +00:00
+										size_t j = with_totals && !separate_totals ? 1 : 0;
-												dbms: merged convertToBlock and finalize aggregation steps whenever possible [#METR-2944].



											
										
										
											2013-11-03 23:35:18 +00:00
 										if (!final)
-												dbms: development [#CONV-2944].



											
										
										
											2012-02-27 06:28:20 +00:00
+										{
-												dbms: merged convertToBlock and finalize aggregation steps whenever possible [#METR-2944].



											
										
										
											2013-11-03 23:35:18 +00:00
+											for (AggregatedDataHashed::const_iterator it = data.begin(); it != data.end(); ++it, ++j)
 											{
 												for (size_t i = 0; i < keys_size; ++i)
 													key_columns[i]->insertDataWithTerminatingZero(it->second.first[i].data, it->second.first[i].size);
-												dbms: development [#CONV-2944].



											
										
										
											2012-02-27 06:28:20 +00:00
-												dbms: merged convertToBlock and finalize aggregation steps whenever possible [#METR-2944].



											
										
										
											2013-11-03 23:35:18 +00:00
+												for (size_t i = 0; i < aggregates_size; ++i)
 													(*aggregate_columns[i])[j] = it->second.second + offsets_of_aggregate_states[i];
 											}
 										}
 										else
 										{
 											for (AggregatedDataHashed::const_iterator it = data.begin(); it != data.end(); ++it, ++j)
 											{
 												for (size_t i = 0; i < keys_size; ++i)
 													key_columns[i]->insertDataWithTerminatingZero(it->second.first[i].data, it->second.first[i].size);
 												for (size_t i = 0; i < aggregates_size; ++i)
 													aggregate_functions[i]->insertResultInto(it->second.second + offsets_of_aggregate_states[i], *final_aggregate_columns[i]);
 											}
-												dbms: development [#CONV-2944].



											
										
										
											2012-02-27 06:28:20 +00:00
+										}
 									}
-												dbms: fixed error after adding 'WITH TOTALS' modifier [#CONV-7489].



											
										
										
											2013-05-06 11:45:28 +00:00
+									else if (data_variants.type != AggregatedDataVariants::WITHOUT_KEY)
-												dbms: development [#CONV-2944].



											
										
										
											2012-02-27 06:28:20 +00:00
+										throw Exception("Unknown aggregated data variant.", ErrorCodes::UNKNOWN_AGGREGATED_DATA_VARIANT);
-												dbms: merged convertToBlock and finalize aggregation steps whenever possible [#METR-2944].



											
										
										
											2013-11-03 23:35:18 +00:00
+									if (!final)
 									{
 										/// data_variants не будет уничтожать состояния агрегатных функций в деструкторе. Теперь состояниями владеют ColumnAggregateFunction.
 										data_variants.aggregator = NULL;
 									}
-												dbms: fixed possible leak [#CONV-2944].



											
										
										
											2013-02-16 18:59:05 +00:00
-												dbms: development [#CONV-2944].



											
										
										
											2012-02-27 06:28:20 +00:00
+									/// Изменяем размер столбцов-констант в блоке.
 									size_t columns = res.columns();
 									for (size_t i = 0; i < columns; ++i)
 										if (res.getByPosition(i).column->isConst())
-												dbms: fixed error [#CONV-7486].



											
										
										
											2013-05-03 05:23:14 +00:00
+											res.getByPosition(i).column = res.getByPosition(i).column->cut(0, rows);
-												dbms: development [#CONV-2944].



											
										
										
											2012-02-27 06:28:20 +00:00
-												dbms: improved performance of queries with large aggregation result [#CONV-2944].



											
										
										
											2013-02-03 18:39:09 +00:00
+									double elapsed_seconds = watch.elapsedSeconds();
-												dbms: Aggregator: more logging [#CONV-2944].



											
										
										
											2013-02-04 03:31:53 +00:00
+									LOG_TRACE(log, std::fixed << std::setprecision(3)
 										<< "Converted aggregated data to block. "
-												dbms: improved performance of queries with large aggregation result [#CONV-2944].



											
										
										
											2013-02-03 18:39:09 +00:00
+										<< rows << " rows, " << res.bytes() / 1048576.0 << " MiB"
-												dbms: Aggregator: more logging [#CONV-2944].



											
										
										
											2013-02-04 03:31:53 +00:00
+										<< " in " << elapsed_seconds << " sec."
-												dbms: improved performance of queries with large aggregation result [#CONV-2944].



											
										
										
											2013-02-03 18:39:09 +00:00
+										<< " (" << rows / elapsed_seconds << " rows/sec., " << res.bytes() / elapsed_seconds / 1048576.0 << " MiB/sec.)");
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-31 00:33:42 +00:00
-												dbms: development [#CONV-2944].



											
										
										
											2012-02-27 06:28:20 +00:00
+									return res;
 								}
 								AggregatedDataVariantsPtr Aggregator::merge(ManyAggregatedDataVariants & data_variants)
 								{
 									if (data_variants.empty())
-												dbms: development [#CONV-2944].



											
										
										
											2012-02-27 07:54:16 +00:00
+								 		throw Exception("Empty data passed to Aggregator::merge().", ErrorCodes::EMPTY_DATA_PASSED);
-												dbms: development [#CONV-2944].



											
										
										
											2012-02-27 06:28:20 +00:00
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-31 00:33:42 +00:00
+									LOG_TRACE(log, "Merging aggregated data");
-												dbms: Aggregator: more logging [#CONV-2944].



											
										
										
											2013-02-04 03:31:53 +00:00
+									Stopwatch watch;
-												dbms: development [#CONV-2944].



											
										
										
											2012-08-21 18:34:55 +00:00
+									AggregatedDataVariantsPtr res = data_variants[0];
-												dbms: development [#CONV-2944].



											
										
										
											2012-02-27 06:28:20 +00:00
 									/// Все результаты агрегации соединяем с первым.
-												dbms: Aggregator: more logging [#CONV-2944].



											
										
										
											2013-02-04 03:31:53 +00:00
+									size_t rows = res->size();
-												dbms: development [#CONV-2944].



											
										
										
											2012-02-27 06:28:20 +00:00
+									for (size_t i = 1, size = data_variants.size(); i < size; ++i)
 									{
-												dbms: Aggregator: more logging [#CONV-2944].



											
										
										
											2013-02-04 03:31:53 +00:00
+										rows += data_variants[i]->size();
-												dbms: development [#CONV-2944].



											
										
										
											2012-02-27 06:28:20 +00:00
+										AggregatedDataVariants & current = *data_variants[i];
-												dbms: continue improvement [#CONV-2944].



											
										
										
											2013-02-09 00:12:04 +00:00
+										res->aggregates_pools.insert(res->aggregates_pools.end(), current.aggregates_pools.begin(), current.aggregates_pools.end());
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-10 07:47:13 +00:00
+										if (current.empty())
 											continue;
-												dbms: development [#CONV-2944].



											
										
										
											2012-08-21 18:34:55 +00:00
+										if (res->empty())
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-10 07:47:13 +00:00
+										{
-												dbms: development [#CONV-2944].



											
										
										
											2012-08-21 18:34:55 +00:00
+											res = data_variants[i];
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-10 07:47:13 +00:00
+											continue;
 										}
-												dbms: development [#CONV-2944].



											
										
										
											2012-08-21 18:34:55 +00:00
+										if (res->type != current.type)
-												dbms: development [#CONV-2944].



											
										
										
											2012-02-27 06:28:20 +00:00
+											throw Exception("Cannot merge different aggregated data variants.", ErrorCodes::CANNOT_MERGE_DIFFERENT_AGGREGATED_DATA_VARIANTS);
 										/// В какой структуре данных агрегированы данные?
-												dbms: added WITH TOTALS modifier for GROUP BY [#CONV-2944].



											
										
										
											2013-05-04 15:46:50 +00:00
+										if (res->type == AggregatedDataVariants::WITHOUT_KEY || with_totals)
-												dbms: development [#CONV-2944].



											
										
										
											2012-02-27 06:28:20 +00:00
+										{
-												dbms: development [#CONV-2944].



											
										
										
											2012-08-21 18:34:55 +00:00
+											AggregatedDataWithoutKey & res_data = res->without_key;
-												dbms: development [#CONV-2944].



											
										
										
											2012-02-27 06:28:20 +00:00
+											AggregatedDataWithoutKey & current_data = current.without_key;
-												dbms: continue of improvement [#CONV-2944].



											
										
										
											2013-02-08 23:41:05 +00:00
+											for (size_t i = 0; i < aggregates_size; ++i)
-												dbms: development [#CONV-2944].



											
										
										
											2012-02-27 06:28:20 +00:00
+											{
-												dbms: continue of improvement [#CONV-2944].



											
										
										
											2013-02-08 23:41:05 +00:00
+												aggregate_functions[i]->merge(res_data + offsets_of_aggregate_states[i], current_data + offsets_of_aggregate_states[i]);
 												aggregate_functions[i]->destroy(current_data + offsets_of_aggregate_states[i]);
-												dbms: development [#CONV-2944].



											
										
										
											2012-02-27 06:28:20 +00:00
+											}
 										}
-												dbms: fixed error after adding 'WITH TOTALS' modifier [#CONV-7489].



											
										
										
											2013-05-06 11:45:28 +00:00
-												dbms: added WITH TOTALS modifier for GROUP BY [#CONV-2944].



											
										
										
											2013-05-04 15:46:50 +00:00
+										if (res->type == AggregatedDataVariants::KEY_64)
-												dbms: development [#CONV-2944].



											
										
										
											2012-02-27 06:28:20 +00:00
+										{
-												dbms: development [#CONV-2944].



											
										
										
											2012-08-21 18:34:55 +00:00
+											AggregatedDataWithUInt64Key & res_data = res->key64;
-												dbms: development [#CONV-2944].



											
										
										
											2012-02-27 06:28:20 +00:00
+											AggregatedDataWithUInt64Key & current_data = current.key64;
-												dbms: development [#CONV-2944].



											
										
										
											2012-02-27 16:23:28 +00:00
+											for (AggregatedDataWithUInt64Key::const_iterator it = current_data.begin(); it != current_data.end(); ++it)
-												dbms: development [#CONV-2944].



											
										
										
											2012-02-27 06:28:20 +00:00
+											{
 												AggregatedDataWithUInt64Key::iterator res_it;
 												bool inserted;
 												res_data.emplace(it->first, res_it, inserted);
 												if (!inserted)
 												{
-												dbms: continue of improvement [#CONV-2944].



											
										
										
											2013-02-08 23:41:05 +00:00
+													for (size_t i = 0; i < aggregates_size; ++i)
-												dbms: development [#CONV-2944].



											
										
										
											2012-02-27 06:28:20 +00:00
+													{
-												dbms: continue of improvement [#CONV-2944].



											
										
										
											2013-02-08 23:41:05 +00:00
+														aggregate_functions[i]->merge(res_it->second + offsets_of_aggregate_states[i], it->second + offsets_of_aggregate_states[i]);
 														aggregate_functions[i]->destroy(it->second + offsets_of_aggregate_states[i]);
-												dbms: development [#CONV-2944].



											
										
										
											2012-02-27 06:28:20 +00:00
+													}
 												}
 												else
-												dbms: continue of improvement [#CONV-2944].



											
										
										
											2013-02-08 23:41:05 +00:00
+													res_it->second = it->second;
-												dbms: development [#CONV-2944].



											
										
										
											2012-02-27 06:28:20 +00:00
+											}
 										}
-												dbms: development [#CONV-2944].



											
										
										
											2012-08-21 18:34:55 +00:00
+										else if (res->type == AggregatedDataVariants::KEY_STRING)
-												dbms: development [#CONV-2944].



											
										
										
											2012-02-27 06:28:20 +00:00
+										{
-												dbms: development [#CONV-2944].



											
										
										
											2012-08-21 18:34:55 +00:00
+											AggregatedDataWithStringKey & res_data = res->key_string;
-												dbms: development [#CONV-2944].



											
										
										
											2012-02-27 06:28:20 +00:00
+											AggregatedDataWithStringKey & current_data = current.key_string;
-												dbms: development [#CONV-2944].



											
										
										
											2012-02-27 16:23:28 +00:00
+											for (AggregatedDataWithStringKey::const_iterator it = current_data.begin(); it != current_data.end(); ++it)
-												dbms: development [#CONV-2944].



											
										
										
											2012-02-27 06:28:20 +00:00
+											{
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-31 05:41:56 +00:00
+												AggregatedDataWithStringKey::iterator res_it;
 												bool inserted;
 												res_data.emplace(it->first, res_it, inserted);
 												if (!inserted)
-												dbms: development [#CONV-2944].



											
										
										
											2012-02-27 06:28:20 +00:00
+												{
-												dbms: continue of improvement [#CONV-2944].



											
										
										
											2013-02-08 23:41:05 +00:00
+													for (size_t i = 0; i < aggregates_size; ++i)
-												dbms: development [#CONV-2944].



											
										
										
											2012-02-27 06:28:20 +00:00
+													{
-												dbms: continue of improvement [#CONV-2944].



											
										
										
											2013-02-08 23:41:05 +00:00
+														aggregate_functions[i]->merge(res_it->second + offsets_of_aggregate_states[i], it->second + offsets_of_aggregate_states[i]);
 														aggregate_functions[i]->destroy(it->second + offsets_of_aggregate_states[i]);
-												dbms: development [#CONV-2944].



											
										
										
											2012-02-27 06:28:20 +00:00
+													}
 												}
 												else
-												dbms: continue of improvement [#CONV-2944].



											
										
										
											2013-02-08 23:41:05 +00:00
+													res_it->second = it->second;
-												dbms: development [#CONV-2944].



											
										
										
											2012-02-27 06:28:20 +00:00
+											}
 										}
-												dbms: improved performance of aggregation by many fields: lowered number of allocs; more direct memory layout; don't use temporary Fields; lowered memory consumption [#CONV-2944].



											
										
										
											2013-06-30 16:56:00 +00:00
+										else if (res->type == AggregatedDataVariants::KEYS_128)
-												dbms: development [#CONV-2944].



											
										
										
											2012-02-27 06:28:20 +00:00
+										{
-												dbms: improved performance of aggregation by many fields: lowered number of allocs; more direct memory layout; don't use temporary Fields; lowered memory consumption [#CONV-2944].



											
										
										
											2013-06-30 16:56:00 +00:00
+											AggregatedDataWithKeys128 & res_data = res->keys128;
 											AggregatedDataWithKeys128 & current_data = current.keys128;
-												dbms: development [#CONV-2944].



											
										
										
											2012-02-27 06:28:20 +00:00
-												dbms: improved performance of aggregation by many fields: lowered number of allocs; more direct memory layout; don't use temporary Fields; lowered memory consumption [#CONV-2944].



											
										
										
											2013-06-30 16:56:00 +00:00
+											for (AggregatedDataWithKeys128::iterator it = current_data.begin(); it != current_data.end(); ++it)
-												dbms: development [#CONV-2944].



											
										
										
											2012-02-27 06:28:20 +00:00
+											{
-												dbms: improved performance of aggregation by many fields: lowered number of allocs; more direct memory layout; don't use temporary Fields; lowered memory consumption [#CONV-2944].



											
										
										
											2013-06-30 16:56:00 +00:00
+												AggregatedDataWithKeys128::iterator res_it;
-												dbms: development [#CONV-2944].



											
										
										
											2012-02-27 06:28:20 +00:00
+												bool inserted;
 												res_data.emplace(it->first, res_it, inserted);
 												if (!inserted)
 												{
-												dbms: continue of improvement [#CONV-2944].



											
										
										
											2013-02-08 23:41:05 +00:00
+													for (size_t i = 0; i < aggregates_size; ++i)
-												dbms: development [#CONV-2944].



											
										
										
											2012-02-27 06:28:20 +00:00
+													{
-												dbms: improved performance of aggregation by many fields: lowered number of allocs; more direct memory layout; don't use temporary Fields; lowered memory consumption [#CONV-2944].



											
										
										
											2013-06-30 16:56:00 +00:00
+														aggregate_functions[i]->merge(res_it->second + offsets_of_aggregate_states[i], it->second + offsets_of_aggregate_states[i]);
 														aggregate_functions[i]->destroy(it->second + offsets_of_aggregate_states[i]);
-												dbms: development [#CONV-2944].



											
										
										
											2012-02-27 06:28:20 +00:00
+													}
 												}
 												else
-												dbms: improvement [#CONV-2944].



											
										
										
											2013-02-09 02:20:26 +00:00
+												{
 													res_it->second = it->second;
 												}
-												dbms: development [#CONV-2944].



											
										
										
											2012-02-27 06:28:20 +00:00
+											}
 										}
-												dbms: improved performance of aggregation by many fields: lowered number of allocs; more direct memory layout; don't use temporary Fields; lowered memory consumption [#CONV-2944].



											
										
										
											2013-06-30 16:56:00 +00:00
+										else if (res->type == AggregatedDataVariants::HASHED)
-												dbms: development [#CONV-2944].



											
										
										
											2012-02-27 06:28:20 +00:00
+										{
-												dbms: improved performance of aggregation by many fields: lowered number of allocs; more direct memory layout; don't use temporary Fields; lowered memory consumption [#CONV-2944].



											
										
										
											2013-06-30 16:56:00 +00:00
+											AggregatedDataHashed & res_data = res->hashed;
 											AggregatedDataHashed & current_data = current.hashed;
-												dbms: development [#CONV-2944].



											
										
										
											2012-02-27 06:28:20 +00:00
-												dbms: improved performance of aggregation by many fields: lowered number of allocs; more direct memory layout; don't use temporary Fields; lowered memory consumption [#CONV-2944].



											
										
										
											2013-06-30 16:56:00 +00:00
+											for (AggregatedDataHashed::iterator it = current_data.begin(); it != current_data.end(); ++it)
-												dbms: development [#CONV-2944].



											
										
										
											2012-02-27 06:28:20 +00:00
+											{
-												dbms: improved performance of aggregation by many fields: lowered number of allocs; more direct memory layout; don't use temporary Fields; lowered memory consumption [#CONV-2944].



											
										
										
											2013-06-30 16:56:00 +00:00
+												AggregatedDataHashed::iterator res_it;
 												bool inserted;
 												res_data.emplace(it->first, res_it, inserted);
 												if (!inserted)
-												dbms: development [#CONV-2944].



											
										
										
											2012-02-27 06:28:20 +00:00
+												{
-												dbms: continue of improvement [#CONV-2944].



											
										
										
											2013-02-08 23:41:05 +00:00
+													for (size_t i = 0; i < aggregates_size; ++i)
-												dbms: development [#CONV-2944].



											
										
										
											2012-02-27 06:28:20 +00:00
+													{
-												dbms: improved performance of aggregation by many fields: lowered number of allocs; more direct memory layout; don't use temporary Fields; lowered memory consumption [#CONV-2944].



											
										
										
											2013-06-30 16:56:00 +00:00
+														aggregate_functions[i]->merge(res_it->second.second + offsets_of_aggregate_states[i], it->second.second + offsets_of_aggregate_states[i]);
 														aggregate_functions[i]->destroy(it->second.second + offsets_of_aggregate_states[i]);
-												dbms: development [#CONV-2944].



											
										
										
											2012-02-27 06:28:20 +00:00
+													}
 												}
 												else
-												dbms: improved performance of aggregation by many fields: lowered number of allocs; more direct memory layout; don't use temporary Fields; lowered memory consumption [#CONV-2944].



											
										
										
											2013-06-30 16:56:00 +00:00
+												{
 													res_it->second = it->second;
 												}
-												dbms: development [#CONV-2944].



											
										
										
											2012-02-27 06:28:20 +00:00
+											}
 										}
-												dbms: fixed error after adding 'WITH TOTALS' modifier [#CONV-7489].



											
										
										
											2013-05-06 11:45:28 +00:00
+										else if (res->type != AggregatedDataVariants::WITHOUT_KEY)
-												dbms: development [#CONV-2944].



											
										
										
											2012-02-27 06:28:20 +00:00
+											throw Exception("Unknown aggregated data variant.", ErrorCodes::UNKNOWN_AGGREGATED_DATA_VARIANT);
-												dbms: fixed possible leak [#CONV-2944].



											
										
										
											2013-02-16 18:59:05 +00:00
 										/// current не будет уничтожать состояния агрегатных функций в деструкторе
 										current.aggregator = NULL;
-												dbms: development [#CONV-2944].



											
										
										
											2012-02-27 06:28:20 +00:00
+									}
-												dbms: Aggregator: more logging [#CONV-2944].



											
										
										
											2013-02-04 03:31:53 +00:00
+									double elapsed_seconds = watch.elapsedSeconds();
 									size_t res_rows = res->size();
 									LOG_TRACE(log, std::fixed << std::setprecision(3)
 										<< "Merged aggregated data. "
 										<< "From " << rows << " to " << res_rows << " rows (efficiency: " << static_cast<double>(rows) / res_rows << ")"
 										<< " in " << elapsed_seconds << " sec."
 										<< " (" << rows / elapsed_seconds << " rows/sec.)");
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-31 00:33:42 +00:00
-												dbms: development [#CONV-2944].



											
										
										
											2012-08-21 18:34:55 +00:00
+									return res;
-												dbms: development [#CONV-2944].



											
										
										
											2012-02-27 06:28:20 +00:00
+								}
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-30 01:38:02 +00:00
+								void Aggregator::merge(BlockInputStreamPtr stream, AggregatedDataVariants & result)
 								{
-												dbms: improved performance of aggregation by many fields: lowered number of allocs; more direct memory layout; don't use temporary Fields; lowered memory consumption [#CONV-2944].



											
										
										
											2013-06-30 16:56:00 +00:00
+									StringRefs key(keys_size);
-												dbms: improved performance of aggregation [#CONV-2944].



											
										
										
											2013-01-08 19:41:22 +00:00
+									ConstColumnPlainPtrs key_columns(keys_size);
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-30 01:38:02 +00:00
 									typedef ColumnAggregateFunction::Container_t * AggregateColumn;
 									typedef std::vector<AggregateColumn> AggregateColumns;
 									AggregateColumns aggregate_columns(aggregates_size);
-												dbms: probably fixed error in Aggregator [#CONV-2944].



											
										
										
											2013-02-13 19:24:19 +00:00
+									Block empty_block;
 									initialize(empty_block);
-												dbms: fixed possible leak [#CONV-2944].



											
										
										
											2013-02-16 18:59:05 +00:00
+									/// result будет уничтожать состояния агрегатных функций в деструкторе
 									result.aggregator = this;
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-30 01:38:02 +00:00
+									/// Читаем все данные
 									while (Block block = stream->read())
 									{
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-31 00:33:42 +00:00
+										LOG_TRACE(log, "Merging aggregated block");
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-30 03:30:29 +00:00
+										if (!sample)
 											for (size_t i = 0; i < keys_size + aggregates_size; ++i)
 												sample.insert(block.getByPosition(i).cloneEmpty());
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-30 01:38:02 +00:00
+										/// Запоминаем столбцы, с которыми будем работать
 										for (size_t i = 0; i < keys_size; ++i)
 											key_columns[i] = block.getByPosition(i).column;
 										for (size_t i = 0; i < aggregates_size; ++i)
 											aggregate_columns[i] = &dynamic_cast<ColumnAggregateFunction &>(*block.getByPosition(keys_size + i).column).getData();
 										size_t rows = block.rows();
 										/// Каким способом выполнять агрегацию?
 										Sizes key_sizes;
-												dbms: improved performance of aggregation by many fields: lowered number of allocs; more direct memory layout; don't use temporary Fields; lowered memory consumption [#CONV-2944].



											
										
										
											2013-06-30 16:56:00 +00:00
+										result.type = chooseAggregationMethod(key_columns, key_sizes);
-												dbms: improvement [#CONV-2944].



											
										
										
											2013-02-09 02:20:26 +00:00
+										result.keys_size = keys_size;
-												dbms: improved performance of aggregation by many fields: lowered number of allocs; more direct memory layout; don't use temporary Fields; lowered memory consumption [#CONV-2944].



											
										
										
											2013-06-30 16:56:00 +00:00
+										result.key_sizes = key_sizes;
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-30 01:38:02 +00:00
-												dbms: added WITH TOTALS modifier for GROUP BY [#CONV-2944].



											
										
										
											2013-05-04 15:46:50 +00:00
+										if (result.type == AggregatedDataVariants::WITHOUT_KEY || with_totals)
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-30 01:38:02 +00:00
+										{
 											AggregatedDataWithoutKey & res = result.without_key;
-												dbms: continue of improvement [#CONV-2944].



											
										
										
											2013-02-08 23:41:05 +00:00
+											if (!res)
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-30 01:38:02 +00:00
+											{
-												dbms: continue of improvement [#CONV-2944].



											
										
										
											2013-02-08 23:41:05 +00:00
+												res = result.aggregates_pool->alloc(total_size_of_aggregate_states);
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-30 01:38:02 +00:00
+												for (size_t i = 0; i < aggregates_size; ++i)
-												dbms: continue of improvement [#CONV-2944].



											
										
										
											2013-02-08 23:41:05 +00:00
+													aggregate_functions[i]->create(res + offsets_of_aggregate_states[i]);
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-30 01:38:02 +00:00
+											}
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-30 03:30:29 +00:00
 											/// Добавляем значения
 											for (size_t i = 0; i < aggregates_size; ++i)
-												dbms: continue of improvement [#CONV-2944].



											
										
										
											2013-02-08 23:41:05 +00:00
+												aggregate_functions[i]->merge(res + offsets_of_aggregate_states[i], (*aggregate_columns[i])[0]);
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-30 01:38:02 +00:00
+										}
-												dbms: fixed error after adding 'WITH TOTALS' modifier [#CONV-7489].



											
										
										
											2013-05-06 11:45:28 +00:00
-												dbms: added WITH TOTALS modifier for GROUP BY [#CONV-2944].



											
										
										
											2013-05-04 15:46:50 +00:00
+										if (result.type == AggregatedDataVariants::KEY_64)
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-30 01:38:02 +00:00
+										{
 											AggregatedDataWithUInt64Key & res = result.key64;
-												dbms: improved performance of aggregation [#CONV-2944].



											
										
										
											2013-01-08 19:41:22 +00:00
+											const IColumn & column = *key_columns[0];
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-30 01:38:02 +00:00
 											/// Для всех строчек
-												dbms: added WITH TOTALS modifier for GROUP BY [#CONV-2944].



											
										
										
											2013-05-04 15:46:50 +00:00
+											for (size_t i = with_totals ? 1 : 0; i < rows; ++i)
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-30 01:38:02 +00:00
+											{
 												/// Строим ключ
-												dbms: continuing improvement (incomplete) [#CONV-2944].



											
										
										
											2013-02-08 20:34:30 +00:00
+												UInt64 key = get<UInt64>(column[i]);
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-30 01:38:02 +00:00
+												AggregatedDataWithUInt64Key::iterator it;
 												bool inserted;
 												res.emplace(key, it, inserted);
 												if (inserted)
 												{
-												dbms: continue of improvement [#CONV-2944].



											
										
										
											2013-02-08 23:41:05 +00:00
+													it->second = result.aggregates_pool->alloc(total_size_of_aggregate_states);
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-30 01:38:02 +00:00
 													for (size_t j = 0; j < aggregates_size; ++j)
-												dbms: continue of improvement [#CONV-2944].



											
										
										
											2013-02-08 23:41:05 +00:00
+														aggregate_functions[j]->create(it->second + offsets_of_aggregate_states[j]);
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-30 01:38:02 +00:00
+												}
 												/// Добавляем значения
 												for (size_t j = 0; j < aggregates_size; ++j)
-												dbms: fixed error with Aggregator [#CONV-2944].



											
										
										
											2013-02-13 20:13:28 +00:00
+													aggregate_functions[j]->merge(it->second + offsets_of_aggregate_states[j], (*aggregate_columns[j])[i]);
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-30 01:38:02 +00:00
+											}
 										}
 										else if (result.type == AggregatedDataVariants::KEY_STRING)
 										{
 											AggregatedDataWithStringKey & res = result.key_string;
-												dbms: improved performance of aggregation [#CONV-2944].



											
										
										
											2013-01-08 19:41:22 +00:00
+											const IColumn & column = *key_columns[0];
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-30 01:38:02 +00:00
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-31 05:41:56 +00:00
+											if (const ColumnString * column_string = dynamic_cast<const ColumnString *>(&column))
 								            {
 								                const ColumnString::Offsets_t & offsets = column_string->getOffsets();
-												Separated ColumnString from ColumnArray and ColumnFixedString from ColumnFixedArray; removed ColumnFixedArray [#CONV-2944].



											
										
										
											2013-05-05 15:25:25 +00:00
+								                const ColumnString::Chars_t & data = column_string->getChars();
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-30 01:38:02 +00:00
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-31 05:41:56 +00:00
+												/// Для всех строчек
-												dbms: added WITH TOTALS modifier for GROUP BY [#CONV-2944].



											
										
										
											2013-05-04 15:46:50 +00:00
+												for (size_t i = with_totals ? 1 : 0; i < rows; ++i)
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-30 01:38:02 +00:00
+												{
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-31 05:41:56 +00:00
+													/// Строим ключ
-												dbms, sqxxl: fixed error [#CONV-7289].



											
										
										
											2013-04-13 00:56:07 +00:00
+													StringRef ref(&data[i == 0 ? 0 : offsets[i - 1]], (i == 0 ? offsets[i] : (offsets[i] - offsets[i - 1])) - 1);
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-30 01:38:02 +00:00
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-31 05:41:56 +00:00
+													AggregatedDataWithStringKey::iterator it;
 													bool inserted;
 													res.emplace(ref, it, inserted);
 													if (inserted)
 													{
 														it->first.data = result.string_pool.insert(ref.data, ref.size);
-												dbms: continue of improvement [#CONV-2944].



											
										
										
											2013-02-08 23:41:05 +00:00
+														it->second = result.aggregates_pool->alloc(total_size_of_aggregate_states);
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-31 05:41:56 +00:00
 														for (size_t j = 0; j < aggregates_size; ++j)
-												dbms: continue of improvement [#CONV-2944].



											
										
										
											2013-02-08 23:41:05 +00:00
+															aggregate_functions[j]->create(it->second + offsets_of_aggregate_states[j]);
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-31 05:41:56 +00:00
+													}
 													/// Добавляем значения
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-30 01:38:02 +00:00
+													for (size_t j = 0; j < aggregates_size; ++j)
-												dbms: fixed error with Aggregator [#CONV-2944].



											
										
										
											2013-02-13 20:13:28 +00:00
+														aggregate_functions[j]->merge(it->second + offsets_of_aggregate_states[j], (*aggregate_columns[j])[i]);
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-30 01:38:02 +00:00
+												}
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-31 05:41:56 +00:00
+											}
 											else if (const ColumnFixedString * column_string = dynamic_cast<const ColumnFixedString *>(&column))
 								            {
 								                size_t n = column_string->getN();
-												Separated ColumnString from ColumnArray and ColumnFixedString from ColumnFixedArray; removed ColumnFixedArray [#CONV-2944].



											
										
										
											2013-05-05 15:25:25 +00:00
+								                const ColumnFixedString::Chars_t & data = column_string->getChars();
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-30 01:38:02 +00:00
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-31 05:41:56 +00:00
+												/// Для всех строчек
-												dbms: added WITH TOTALS modifier for GROUP BY [#CONV-2944].



											
										
										
											2013-05-04 15:46:50 +00:00
+												for (size_t i = with_totals ? 1 : 0; i < rows; ++i)
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-31 05:41:56 +00:00
+												{
 													/// Строим ключ
 													StringRef ref(&data[i * n], n);
 													AggregatedDataWithStringKey::iterator it;
 													bool inserted;
 													res.emplace(ref, it, inserted);
 													if (inserted)
 													{
 														it->first.data = result.string_pool.insert(ref.data, ref.size);
-												dbms: continue of improvement [#CONV-2944].



											
										
										
											2013-02-08 23:41:05 +00:00
+														it->second = result.aggregates_pool->alloc(total_size_of_aggregate_states);
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-31 05:41:56 +00:00
 														for (size_t j = 0; j < aggregates_size; ++j)
-												dbms: continue of improvement [#CONV-2944].



											
										
										
											2013-02-08 23:41:05 +00:00
+															aggregate_functions[j]->create(it->second + offsets_of_aggregate_states[j]);
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-31 05:41:56 +00:00
+													}
 													/// Добавляем значения
 													for (size_t j = 0; j < aggregates_size; ++j)
-												dbms: fixed error with Aggregator [#CONV-2944].



											
										
										
											2013-02-13 20:13:28 +00:00
+														aggregate_functions[j]->merge(it->second + offsets_of_aggregate_states[j], (*aggregate_columns[j])[i]);
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-31 05:41:56 +00:00
+												}
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-30 01:38:02 +00:00
+											}
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-31 05:41:56 +00:00
+											else
 												throw Exception("Illegal type of column when aggregating by string key: " + column.getName(), ErrorCodes::ILLEGAL_COLUMN);
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-30 01:38:02 +00:00
+										}
-												dbms: improved performance of aggregation by many fields: lowered number of allocs; more direct memory layout; don't use temporary Fields; lowered memory consumption [#CONV-2944].



											
										
										
											2013-06-30 16:56:00 +00:00
+										else if (result.type == AggregatedDataVariants::KEYS_128)
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-30 01:38:02 +00:00
+										{
-												dbms: improved performance of aggregation by many fields: lowered number of allocs; more direct memory layout; don't use temporary Fields; lowered memory consumption [#CONV-2944].



											
										
										
											2013-06-30 16:56:00 +00:00
+											AggregatedDataWithKeys128 & res = result.keys128;
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-30 01:38:02 +00:00
 											/// Для всех строчек
-												dbms: added WITH TOTALS modifier for GROUP BY [#CONV-2944].



											
										
										
											2013-05-04 15:46:50 +00:00
+											for (size_t i = with_totals ? 1 : 0; i < rows; ++i)
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-30 01:38:02 +00:00
+											{
-												dbms: improved performance of aggregation by many fields: lowered number of allocs; more direct memory layout; don't use temporary Fields; lowered memory consumption [#CONV-2944].



											
										
										
											2013-06-30 16:56:00 +00:00
+												AggregatedDataWithKeys128::iterator it;
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-30 01:38:02 +00:00
+												bool inserted;
-												dbms: improved performance of aggregation by many fields: lowered number of allocs; more direct memory layout; don't use temporary Fields; lowered memory consumption [#CONV-2944].



											
										
										
											2013-06-30 16:56:00 +00:00
+												res.emplace(pack128(i, keys_size, key_columns, key_sizes), it, inserted);
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-30 01:38:02 +00:00
 												if (inserted)
 												{
-												dbms: improved performance of aggregation by many fields: lowered number of allocs; more direct memory layout; don't use temporary Fields; lowered memory consumption [#CONV-2944].



											
										
										
											2013-06-30 16:56:00 +00:00
+													it->second = result.aggregates_pool->alloc(total_size_of_aggregate_states);
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-30 01:38:02 +00:00
 													for (size_t j = 0; j < aggregates_size; ++j)
-												dbms: improved performance of aggregation by many fields: lowered number of allocs; more direct memory layout; don't use temporary Fields; lowered memory consumption [#CONV-2944].



											
										
										
											2013-06-30 16:56:00 +00:00
+														aggregate_functions[j]->create(it->second + offsets_of_aggregate_states[j]);
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-30 01:38:02 +00:00
+												}
 												/// Добавляем значения
 												for (size_t j = 0; j < aggregates_size; ++j)
-												dbms: improved performance of aggregation by many fields: lowered number of allocs; more direct memory layout; don't use temporary Fields; lowered memory consumption [#CONV-2944].



											
										
										
											2013-06-30 16:56:00 +00:00
+													aggregate_functions[j]->merge(it->second + offsets_of_aggregate_states[j], (*aggregate_columns[j])[i]);
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-30 01:38:02 +00:00
+											}
 										}
-												dbms: improved performance of aggregation by many fields: lowered number of allocs; more direct memory layout; don't use temporary Fields; lowered memory consumption [#CONV-2944].



											
										
										
											2013-06-30 16:56:00 +00:00
+										else if (result.type == AggregatedDataVariants::HASHED)
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-30 01:38:02 +00:00
+										{
-												dbms: improved performance of aggregation by many fields: lowered number of allocs; more direct memory layout; don't use temporary Fields; lowered memory consumption [#CONV-2944].



											
										
										
											2013-06-30 16:56:00 +00:00
+											AggregatedDataHashed & res = result.hashed;
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-30 01:38:02 +00:00
 											/// Для всех строчек
-												dbms: added WITH TOTALS modifier for GROUP BY [#CONV-2944].



											
										
										
											2013-05-04 15:46:50 +00:00
+											for (size_t i = with_totals ? 1 : 0; i < rows; ++i)
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-30 01:38:02 +00:00
+											{
-												dbms: improved performance of aggregation by many fields: lowered number of allocs; more direct memory layout; don't use temporary Fields; lowered memory consumption [#CONV-2944].



											
										
										
											2013-06-30 16:56:00 +00:00
+												AggregatedDataHashed::iterator it;
 												bool inserted;
 												res.emplace(hash128(i, keys_size, key_columns, key), it, inserted);
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-30 01:38:02 +00:00
-												dbms: improved performance of aggregation by many fields: lowered number of allocs; more direct memory layout; don't use temporary Fields; lowered memory consumption [#CONV-2944].



											
										
										
											2013-06-30 16:56:00 +00:00
+												if (inserted)
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-30 01:38:02 +00:00
+												{
-												dbms: improved performance of aggregation by many fields: lowered number of allocs; more direct memory layout; don't use temporary Fields; lowered memory consumption [#CONV-2944].



											
										
										
											2013-06-30 16:56:00 +00:00
+													it->second.first = placeKeysInPool(i, keys_size, key, result.keys_pool);
 													it->second.second = result.aggregates_pool->alloc(total_size_of_aggregate_states);
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-30 01:38:02 +00:00
 													for (size_t j = 0; j < aggregates_size; ++j)
-												dbms: improved performance of aggregation by many fields: lowered number of allocs; more direct memory layout; don't use temporary Fields; lowered memory consumption [#CONV-2944].



											
										
										
											2013-06-30 16:56:00 +00:00
+														aggregate_functions[j]->create(it->second.second + offsets_of_aggregate_states[j]);
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-30 01:38:02 +00:00
+												}
 												/// Добавляем значения
 												for (size_t j = 0; j < aggregates_size; ++j)
-												dbms: improved performance of aggregation by many fields: lowered number of allocs; more direct memory layout; don't use temporary Fields; lowered memory consumption [#CONV-2944].



											
										
										
											2013-06-30 16:56:00 +00:00
+													aggregate_functions[j]->merge(it->second.second + offsets_of_aggregate_states[j], (*aggregate_columns[j])[i]);
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-30 01:38:02 +00:00
+											}
 										}
-												dbms: fixed error after adding 'WITH TOTALS' modifier [#CONV-7489].



											
										
										
											2013-05-06 11:45:28 +00:00
+										else if (result.type != AggregatedDataVariants::WITHOUT_KEY)
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-30 01:38:02 +00:00
+											throw Exception("Unknown aggregated data variant.", ErrorCodes::UNKNOWN_AGGREGATED_DATA_VARIANT);
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-31 00:33:42 +00:00
 										LOG_TRACE(log, "Merged aggregated block");
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-30 01:38:02 +00:00
+									}
 								}
-												dbms: fixed possible leak [#CONV-2944].



											
										
										
											2013-02-16 18:59:05 +00:00
+								void Aggregator::destroyAggregateStates(AggregatedDataVariants & result)
 								{
 									if (result.size() == 0)
 										return;
-												dbms: merged convertToBlock and finalize aggregation steps whenever possible [#METR-2944].



											
										
										
											2013-11-03 23:35:18 +00:00
+									LOG_TRACE(log, "Destroying aggregate states");
-												dbms: fixed possible leak [#CONV-2944].



											
										
										
											2013-02-16 18:59:05 +00:00
 									/// В какой структуре данных агрегированы данные?
-												dbms: added WITH TOTALS modifier for GROUP BY [#CONV-2944].



											
										
										
											2013-05-04 15:46:50 +00:00
+									if (result.type == AggregatedDataVariants::WITHOUT_KEY || with_totals)
-												dbms: fixed possible leak [#CONV-2944].



											
										
										
											2013-02-16 18:59:05 +00:00
+									{
 										AggregatedDataWithoutKey & res_data = result.without_key;
 										for (size_t i = 0; i < aggregates_size; ++i)
 											aggregate_functions[i]->destroy(res_data + offsets_of_aggregate_states[i]);
 									}
-												dbms: added WITH TOTALS modifier for GROUP BY [#CONV-2944].



											
										
										
											2013-05-04 15:46:50 +00:00
+									if (result.type == AggregatedDataVariants::KEY_64)
-												dbms: fixed possible leak [#CONV-2944].



											
										
										
											2013-02-16 18:59:05 +00:00
+									{
 										AggregatedDataWithUInt64Key & res_data = result.key64;
 										for (AggregatedDataWithUInt64Key::const_iterator it = res_data.begin(); it != res_data.end(); ++it)
 											for (size_t i = 0; i < aggregates_size; ++i)
 												aggregate_functions[i]->destroy(it->second + offsets_of_aggregate_states[i]);
 									}
 									else if (result.type == AggregatedDataVariants::KEY_STRING)
 									{
 										AggregatedDataWithStringKey & res_data = result.key_string;
 										for (AggregatedDataWithStringKey::const_iterator it = res_data.begin(); it != res_data.end(); ++it)
 											for (size_t i = 0; i < aggregates_size; ++i)
 												aggregate_functions[i]->destroy(it->second + offsets_of_aggregate_states[i]);
 									}
 									else if (result.type == AggregatedDataVariants::HASHED)
 									{
 										AggregatedDataHashed & res_data = result.hashed;
 										for (AggregatedDataHashed::iterator it = res_data.begin(); it != res_data.end(); ++it)
 											for (size_t i = 0; i < aggregates_size; ++i)
 												aggregate_functions[i]->destroy(it->second.second + offsets_of_aggregate_states[i]);
 									}
 								}
-												dbms: development of multi-queries [#CONV-2944].



											
										
										
											2013-05-03 10:20:53 +00:00
 								String Aggregator::getID() const
 								{
 									std::stringstream res;
 									if (keys.empty())
 									{
 										res << "key_names";
 										for (size_t i = 0; i < key_names.size(); ++i)
 											res << ", " << key_names[i];
 									}
 									else
 									{
 										res << "keys";
 										for (size_t i = 0; i < keys.size(); ++i)
 											res << ", " << keys[i];
 									}
 									res << ", aggregates";
 									for (size_t i = 0; i < aggregates.size(); ++i)
 										res << ", " << aggregates[i].column_name;
 									return res.str();
 								}
-												dbms: development.



											
										
										
											2011-09-19 01:42:16 +00:00
+								}