ClickHouse/dbms/include/DB/AggregateFunctions/AggregateFunctionQuantileTiming.h

#pragma once

#include <limits>

#include <DB/Common/MemoryTracker.h>
#include <DB/Common/HashTable/Hash.h>

#include <DB/IO/WriteHelpers.h>
#include <DB/IO/ReadHelpers.h>

#include <DB/DataTypes/DataTypesNumberFixed.h>
#include <DB/DataTypes/DataTypeArray.h>

#include <DB/AggregateFunctions/IUnaryAggregateFunction.h>
#include <DB/AggregateFunctions/IBinaryAggregateFunction.h>
#include <DB/AggregateFunctions/QuantilesCommon.h>

#include <DB/Columns/ColumnArray.h>

#include <ext/range.hpp>


namespace DB
{

/** Вычисляет квантиль для времени в миллисекундах, меньшего 30 сек.
  * Если значение больше 30 сек, то значение приравнивается к 30 сек.
  *
  * Если всего значений не больше 32, то вычисление точное.
  *
  * Иначе:
  *  Если время меньше 1024 мс., то вычисление точное.
  *  Иначе вычисление идёт с округлением до числа, кратного 16 мс.
  */

#define TINY_MAX_ELEMS 31
#define BIG_THRESHOLD 30000

namespace detail
{
	/** Вспомогательная структура для оптимизации в случае маленького количества значений.
	  * Размер - 64 байта. Должна быть POD-типом (используется в union).
	  */
	struct QuantileTimingTiny
	{
		mutable UInt16 elems[TINY_MAX_ELEMS];	/// mutable потому что сортировка массива не считается изменением состояния.
		UInt16 count;	/// Важно, чтобы count был не в первых 8 байтах структуры. Вы должны сами инициализировать его нулём.

		/// Можно использовать только пока count < TINY_MAX_ELEMS.
		void insert(UInt64 x)
		{
			if (unlikely(x > BIG_THRESHOLD))
				x = BIG_THRESHOLD;

			elems[count] = x;
			++count;
		}

		/// Можно использовать только пока count + rhs.count <= TINY_MAX_ELEMS.
		void merge(const QuantileTimingTiny & rhs)
		{
			for (size_t i = 0; i < rhs.count; ++i)
			{
				elems[count] = rhs.elems[i];
				++count;
			}
		}

		void serialize(WriteBuffer & buf) const
		{
			writeBinary(count, buf);
			buf.write(reinterpret_cast<const char *>(elems), count * sizeof(elems[0]));
		}

		void deserialize(ReadBuffer & buf)
		{
			readBinary(count, buf);
			buf.readStrict(reinterpret_cast<char *>(elems), count * sizeof(elems[0]));
		}

		/** Эту функцию обязательно нужно позвать перед get-функциями. */
		void prepare() const
		{
			std::sort(elems, elems + count);
		}

		UInt16 get(double level) const
		{
			return level != 1
				? elems[static_cast<size_t>(count * level)]
				: elems[count - 1];
		}

		template <typename ResultType>
		void getMany(const double * levels, size_t size, ResultType * result) const
		{
			const double * levels_end = levels + size;

			while (levels != levels_end)
			{
				*result = get(*levels);
				++levels;
				++result;
			}
		}

		/// То же самое, но в случае пустого состояния возвращается NaN.
		float getFloat(double level) const
		{
			return count
				? get(level)
				: std::numeric_limits<float>::quiet_NaN();
		}

		void getManyFloat(const double * levels, size_t size, float * result) const
		{
			if (count)
				getMany(levels, size, result);
			else
				for (size_t i = 0; i < size; ++i)
					result[i] = std::numeric_limits<float>::quiet_NaN();
		}
	};


	#define SMALL_THRESHOLD 1024
	#define BIG_SIZE ((BIG_THRESHOLD - SMALL_THRESHOLD) / BIG_PRECISION)
	#define BIG_PRECISION 16

	#define SIZE_OF_LARGE_WITHOUT_COUNT ((SMALL_THRESHOLD + BIG_SIZE) * sizeof(UInt64))


	/** Для большого количества значений. Размер около 20 КБ.
	  * TODO: Есть off-by-one ошибки - может возвращаться значение на 1 больше нужного.
	  */
	class QuantileTimingLarge
	{
	private:
		/// Общее число значений.
		UInt64 count;

		/// Число значений для каждого значения меньше small_threshold.
		UInt64 count_small[SMALL_THRESHOLD];

		/// Число значений для каждого значения от small_threshold до big_threshold, округлённого до big_precision.
		UInt64 count_big[BIG_SIZE];

		/// Получить значение квантиля по индексу в массиве count_big.
		static inline UInt16 indexInBigToValue(size_t i)
		{
			return (i * BIG_PRECISION) + SMALL_THRESHOLD
				+ (intHash32<0>(i) % BIG_PRECISION - (BIG_PRECISION / 2));	/// Небольшая рандомизация, чтобы не было заметно, что все значения чётные.
		}

	public:
		QuantileTimingLarge()
		{
			memset(this, 0, sizeof(*this));
		}

		QuantileTimingLarge(ReadBuffer & buf)
		{
			deserialize(buf, true);
		}

		void insert(UInt64 x)
		{
			insertWeighted(x, 1);
		}

		void insertWeighted(UInt64 x, size_t weight)
		{
			count += weight;

			if (x < SMALL_THRESHOLD)
				count_small[x] += weight;
			else if (x < BIG_THRESHOLD)
				count_big[(x - SMALL_THRESHOLD) / BIG_PRECISION] += weight;
		}

		void merge(const QuantileTimingLarge & rhs)
		{
			count += rhs.count;

			for (size_t i = 0; i < SMALL_THRESHOLD; ++i)
				count_small[i] += rhs.count_small[i];

			for (size_t i = 0; i < BIG_SIZE; ++i)
				count_big[i] += rhs.count_big[i];
		}

		void serialize(WriteBuffer & buf) const
		{
			writeBinary(count, buf);

			if (count * 2 > SMALL_THRESHOLD + BIG_SIZE)
			{
				/// Простая сериализация для сильно заполненного случая.
				buf.write(reinterpret_cast<const char *>(this) + sizeof(count), SIZE_OF_LARGE_WITHOUT_COUNT);
			}
			else
			{
				/// Более компактная сериализация для разреженного случая.

				for (size_t i = 0; i < SMALL_THRESHOLD; ++i)
				{
					if (count_small[i])
					{
						writeBinary(UInt16(i), buf);
						writeBinary(count_small[i], buf);
					}
				}

				for (size_t i = 0; i < BIG_SIZE; ++i)
				{
					if (count_big[i])
					{
						writeBinary(UInt16(i + SMALL_THRESHOLD), buf);
						writeBinary(count_big[i], buf);
					}
				}

				/// Символизирует конец данных.
				writeBinary(UInt16(BIG_THRESHOLD), buf);
			}
		}

		void deserialize(ReadBuffer & buf, bool need_memset = false)
		{
			readBinary(count, buf);

			if (count * 2 > SMALL_THRESHOLD + BIG_SIZE)
			{
				buf.readStrict(reinterpret_cast<char *>(this) + sizeof(count), SIZE_OF_LARGE_WITHOUT_COUNT);
			}
			else
			{
				/// Используется, если в конструкторе ещё не был сделан memset.
				if (need_memset)
					memset(reinterpret_cast<char *>(this) + sizeof(count), 0, SIZE_OF_LARGE_WITHOUT_COUNT);

				while (true)
				{
					UInt16 index = 0;
					readBinary(index, buf);
					if (index == BIG_THRESHOLD)
						break;

					UInt64 count = 0;
					readBinary(count, buf);

					if (index < SMALL_THRESHOLD)
						count_small[index] = count;
					else
						count_big[index - SMALL_THRESHOLD] = count;
				}
			}
		}

		void deserializeMerge(ReadBuffer & buf)
		{
			merge(QuantileTimingLarge(buf));
		}


		/// Получить значение квантиля уровня level. Уровень должен быть от 0 до 1.
		UInt16 get(double level) const
		{
			UInt64 pos = count * level;

			UInt64 accumulated = 0;

			size_t i = 0;
			while (i < SMALL_THRESHOLD && accumulated < pos)
			{
				accumulated += count_small[i];
				++i;
			}

			if (i < SMALL_THRESHOLD)
				return i;

			i = 0;
			while (i < BIG_SIZE && accumulated < pos)
			{
				accumulated += count_big[i];
				++i;
			}

			if (i < BIG_SIZE)
				return indexInBigToValue(i);

			return BIG_THRESHOLD;
		}

		/// Получить значения size квантилей уровней levels. Записать size результатов начиная с адреса result.
		/// indices - массив индексов levels такой, что соответствующие элементы будут идти в порядке по возрастанию.
		template <typename ResultType>
		void getMany(const double * levels, const size_t * indices, size_t size, ResultType * result) const
		{
			const auto indices_end = indices + size;
			auto index = indices;

			UInt64 pos = count * levels[*index];

			UInt64 accumulated = 0;

			size_t i = 0;
			while (i < SMALL_THRESHOLD)
			{
				while (i < SMALL_THRESHOLD && accumulated < pos)
				{
					accumulated += count_small[i];
					++i;
				}

				if (i < SMALL_THRESHOLD)
				{
					result[*index] = i;

					++index;

					if (index == indices_end)
						return;

					pos = count * levels[*index];
				}
			}

			i = 0;
			while (i < BIG_SIZE)
			{
				while (i < BIG_SIZE && accumulated < pos)
				{
					accumulated += count_big[i];
					++i;
				}

				if (i < BIG_SIZE)
				{
					result[*index] = indexInBigToValue(i);

					++index;

					if (index == indices_end)
						return;

					pos = count * levels[*index];
				}
			}

			while (index < indices_end)
			{
				result[*index] = BIG_THRESHOLD;

				++index;
			}
		}

		/// То же самое, но в случае пустого состояния возвращается NaN.
		float getFloat(double level) const
		{
			return count
				? get(level)
				: std::numeric_limits<float>::quiet_NaN();
		}

		void getManyFloat(const double * levels, const size_t * levels_permutation, size_t size, float * result) const
		{
			if (count)
				getMany(levels, levels_permutation, size, result);
			else
				for (size_t i = 0; i < size; ++i)
					result[i] = std::numeric_limits<float>::quiet_NaN();
		}
	};
}


/** sizeof - 64 байта.
  * Если их не хватает - выделяет дополнительно около 20 КБ памяти.
  */
class QuantileTiming : private boost::noncopyable
{
private:
	union
	{
		detail::QuantileTimingTiny tiny;
		detail::QuantileTimingLarge * large;
	};

	bool isLarge() const { return tiny.count == TINY_MAX_ELEMS + 1; }

	void toLarge()
	{
		if (current_memory_tracker)
			current_memory_tracker->alloc(sizeof(detail::QuantileTimingLarge));

		/// На время копирования данных из tiny, устанавливать значение large ещё нельзя (иначе оно перезатрёт часть данных).
		detail::QuantileTimingLarge * tmp_large = new detail::QuantileTimingLarge;

		for (size_t i = 0; i < tiny.count; ++i)
			tmp_large->insert(tiny.elems[i]);

		large = tmp_large;
		tiny.count = TINY_MAX_ELEMS + 1;
	}

public:
	QuantileTiming()
	{
		tiny.count = 0;
	}

	~QuantileTiming()
	{
		if (isLarge())
		{
			delete large;

			if (current_memory_tracker)
				current_memory_tracker->free(sizeof(detail::QuantileTimingLarge));
		}
	}

	void insert(UInt64 x)
	{
		if (tiny.count < TINY_MAX_ELEMS)
		{
			tiny.insert(x);
		}
		else
		{
			if (unlikely(tiny.count == TINY_MAX_ELEMS))
				toLarge();

			large->insert(x);
		}
	}

	void insertWeighted(UInt64 x, size_t weight)
	{
		/// NOTE: Первое условие - для того, чтобы избежать переполнения.
		if (weight < TINY_MAX_ELEMS && tiny.count + weight <= TINY_MAX_ELEMS)
		{
			for (size_t i = 0; i < weight; ++i)
				tiny.insert(x);
		}
		else
		{
			if (unlikely(tiny.count <= TINY_MAX_ELEMS))
				toLarge();

			large->insertWeighted(x, weight);
		}
	}

	void merge(const QuantileTiming & rhs)
	{
		if (tiny.count + rhs.tiny.count <= TINY_MAX_ELEMS)
		{
			tiny.merge(rhs.tiny);
		}
		else
		{
			if (!isLarge())
				toLarge();

			if (rhs.isLarge())
			{
				large->merge(*rhs.large);
			}
			else
			{
				for (size_t i = 0; i < rhs.tiny.count; ++i)
					large->insert(rhs.tiny.elems[i]);
			}
		}
	}

	void serialize(WriteBuffer & buf) const
	{
		bool is_large = isLarge();
		DB::writeBinary(is_large, buf);

		if (is_large)
			large->serialize(buf);
		else
			tiny.serialize(buf);
	}

	void deserialize(ReadBuffer & buf)
	{
		bool is_rhs_large;
		DB::readBinary(is_rhs_large, buf);

		if (is_rhs_large)
		{
			if (!isLarge())
			{
				tiny.count = TINY_MAX_ELEMS + 1;

				if (current_memory_tracker)
					current_memory_tracker->alloc(sizeof(detail::QuantileTimingLarge));

				large = new detail::QuantileTimingLarge;
			}

			large->deserialize(buf);
		}
		else
			tiny.deserialize(buf);
	}

	void deserializeMerge(ReadBuffer & buf)
	{
		bool is_rhs_large;
		DB::readBinary(is_rhs_large, buf);

		if (is_rhs_large)
		{
			if (!isLarge())
			{
				tiny.count = TINY_MAX_ELEMS + 1;

				if (current_memory_tracker)
					current_memory_tracker->alloc(sizeof(detail::QuantileTimingLarge));

				large = new detail::QuantileTimingLarge;
			}

			large->merge(detail::QuantileTimingLarge(buf));
		}
		else
		{
			QuantileTiming rhs;
			rhs.tiny.deserialize(buf);

			merge(rhs);
		}
	}


	/// Получить значение квантиля уровня level. Уровень должен быть от 0 до 1.
	UInt16 get(double level) const
	{
		if (isLarge())
		{
			return large->get(level);
		}
		else
		{
			tiny.prepare();
			return tiny.get(level);
		}
	}

	/// Получить значения size квантилей уровней levels. Записать size результатов начиная с адреса result.
	template <typename ResultType>
	void getMany(const double * levels, const size_t * levels_permutation, size_t size, ResultType * result) const
	{
		if (isLarge())
		{
			return large->getMany(levels, levels_permutation, size, result);
		}
		else
		{
			tiny.prepare();
			return tiny.getMany(levels, size, result);
		}
	}

	/// То же самое, но в случае пустого состояния возвращается NaN.
	float getFloat(double level) const
	{
		return tiny.count
			? get(level)
			: std::numeric_limits<float>::quiet_NaN();
	}

	void getManyFloat(const double * levels, const size_t * levels_permutation, size_t size, float * result) const
	{
		if (tiny.count)
			getMany(levels, levels_permutation, size, result);
		else
			for (size_t i = 0; i < size; ++i)
				result[i] = std::numeric_limits<float>::quiet_NaN();
	}
};

#undef SMALL_THRESHOLD
#undef BIG_THRESHOLD
#undef BIG_SIZE
#undef BIG_PRECISION
#undef TINY_MAX_ELEMS


template <typename ArgumentFieldType>
class AggregateFunctionQuantileTiming final : public IUnaryAggregateFunction<QuantileTiming, AggregateFunctionQuantileTiming<ArgumentFieldType> >
{
private:
	double level;

public:
	AggregateFunctionQuantileTiming(double level_ = 0.5) : level(level_) {}

	String getName() const override { return "quantileTiming"; }

	DataTypePtr getReturnType() const override
	{
		return new DataTypeFloat32;
	}

	void setArgument(const DataTypePtr & argument)
	{
	}

	void setParameters(const Array & params) override
	{
		if (params.size() != 1)
			throw Exception("Aggregate function " + getName() + " requires exactly one parameter.", ErrorCodes::NUMBER_OF_ARGUMENTS_DOESNT_MATCH);

		level = apply_visitor(FieldVisitorConvertToNumber<Float64>(), params[0]);
	}


	void addImpl(AggregateDataPtr place, const IColumn & column, size_t row_num) const
	{
		this->data(place).insert(static_cast<const ColumnVector<ArgumentFieldType> &>(column).getData()[row_num]);
	}

	void merge(AggregateDataPtr place, ConstAggregateDataPtr rhs) const override
	{
		this->data(place).merge(this->data(rhs));
	}

	void serialize(ConstAggregateDataPtr place, WriteBuffer & buf) const override
	{
		this->data(place).serialize(buf);
	}

	void deserializeMerge(AggregateDataPtr place, ReadBuffer & buf) const override
	{
		this->data(place).deserializeMerge(buf);
	}

	void insertResultInto(ConstAggregateDataPtr place, IColumn & to) const override
	{
		static_cast<ColumnFloat32 &>(to).getData().push_back(this->data(place).getFloat(level));
	}
};


/** То же самое, но с двумя аргументами. Второй аргумент - "вес" (целое число) - сколько раз учитывать значение.
  */
template <typename ArgumentFieldType, typename WeightFieldType>
class AggregateFunctionQuantileTimingWeighted final
	: public IBinaryAggregateFunction<QuantileTiming, AggregateFunctionQuantileTimingWeighted<ArgumentFieldType, WeightFieldType>>
{
private:
	double level;

public:
	AggregateFunctionQuantileTimingWeighted(double level_ = 0.5) : level(level_) {}

	String getName() const override { return "quantileTimingWeighted"; }

	DataTypePtr getReturnType() const override
	{
		return new DataTypeFloat32;
	}

	void setArgumentsImpl(const DataTypes & arguments)
	{
	}

	void setParameters(const Array & params) override
	{
		if (params.size() != 1)
			throw Exception("Aggregate function " + getName() + " requires exactly one parameter.", ErrorCodes::NUMBER_OF_ARGUMENTS_DOESNT_MATCH);

		level = apply_visitor(FieldVisitorConvertToNumber<Float64>(), params[0]);
	}

	void addImpl(AggregateDataPtr place, const IColumn & column_value, const IColumn & column_weight, size_t row_num) const
	{
		this->data(place).insertWeighted(
			static_cast<const ColumnVector<ArgumentFieldType> &>(column_value).getData()[row_num],
			static_cast<const ColumnVector<WeightFieldType> &>(column_weight).getData()[row_num]);
	}

	void merge(AggregateDataPtr place, ConstAggregateDataPtr rhs) const override
	{
		this->data(place).merge(this->data(rhs));
	}

	void serialize(ConstAggregateDataPtr place, WriteBuffer & buf) const override
	{
		this->data(place).serialize(buf);
	}

	void deserializeMerge(AggregateDataPtr place, ReadBuffer & buf) const override
	{
		this->data(place).deserializeMerge(buf);
	}

	void insertResultInto(ConstAggregateDataPtr place, IColumn & to) const override
	{
		static_cast<ColumnFloat32 &>(to).getData().push_back(this->data(place).getFloat(level));
	}
};


/** То же самое, но позволяет вычислить сразу несколько квантилей.
  * Для этого, принимает в качестве параметров несколько уровней. Пример: quantilesTiming(0.5, 0.8, 0.9, 0.95)(ConnectTiming).
  * Возвращает массив результатов.
  */
template <typename ArgumentFieldType>
class AggregateFunctionQuantilesTiming final : public IUnaryAggregateFunction<QuantileTiming, AggregateFunctionQuantilesTiming<ArgumentFieldType> >
{
private:
	QuantileLevels<double> levels;

public:
	String getName() const override { return "quantilesTiming"; }

	DataTypePtr getReturnType() const override
	{
		return new DataTypeArray(new DataTypeFloat32);
	}

	void setArgument(const DataTypePtr & argument)
	{
	}

	void setParameters(const Array & params) override
	{
		levels.set(params);
	}


	void addImpl(AggregateDataPtr place, const IColumn & column, size_t row_num) const
	{
		this->data(place).insert(static_cast<const ColumnVector<ArgumentFieldType> &>(column).getData()[row_num]);
	}

	void merge(AggregateDataPtr place, ConstAggregateDataPtr rhs) const override
	{
		this->data(place).merge(this->data(rhs));
	}

	void serialize(ConstAggregateDataPtr place, WriteBuffer & buf) const override
	{
		this->data(place).serialize(buf);
	}

	void deserializeMerge(AggregateDataPtr place, ReadBuffer & buf) const override
	{
		this->data(place).deserializeMerge(buf);
	}

	void insertResultInto(ConstAggregateDataPtr place, IColumn & to) const override
	{
		ColumnArray & arr_to = static_cast<ColumnArray &>(to);
		ColumnArray::Offsets_t & offsets_to = arr_to.getOffsets();

		size_t size = levels.size();
		offsets_to.push_back((offsets_to.size() == 0 ? 0 : offsets_to.back()) + size);

		typename ColumnFloat32::Container_t & data_to = static_cast<ColumnFloat32 &>(arr_to.getData()).getData();
		size_t old_size = data_to.size();
		data_to.resize(data_to.size() + size);

		this->data(place).getManyFloat(&levels.levels[0], &levels.permutation[0], size, &data_to[old_size]);
	}
};


template <typename ArgumentFieldType, typename WeightFieldType>
class AggregateFunctionQuantilesTimingWeighted final
	: public IBinaryAggregateFunction<QuantileTiming, AggregateFunctionQuantilesTimingWeighted<ArgumentFieldType, WeightFieldType>>
{
private:
	QuantileLevels<double> levels;

public:
	String getName() const override { return "quantilesTimingWeighted"; }

	DataTypePtr getReturnType() const override
	{
		return new DataTypeArray(new DataTypeFloat32);
	}

	void setArgumentsImpl(const DataTypes & arguments)
	{
	}

	void setParameters(const Array & params) override
	{
		levels.set(params);
	}

	void addImpl(AggregateDataPtr place, const IColumn & column_value, const IColumn & column_weight, size_t row_num) const
	{
		this->data(place).insertWeighted(
			static_cast<const ColumnVector<ArgumentFieldType> &>(column_value).getData()[row_num],
			static_cast<const ColumnVector<WeightFieldType> &>(column_weight).getData()[row_num]);
	}

	void merge(AggregateDataPtr place, ConstAggregateDataPtr rhs) const override
	{
		this->data(place).merge(this->data(rhs));
	}

	void serialize(ConstAggregateDataPtr place, WriteBuffer & buf) const override
	{
		this->data(place).serialize(buf);
	}

	void deserializeMerge(AggregateDataPtr place, ReadBuffer & buf) const override
	{
		this->data(place).deserializeMerge(buf);
	}

	void insertResultInto(ConstAggregateDataPtr place, IColumn & to) const override
	{
		ColumnArray & arr_to = static_cast<ColumnArray &>(to);
		ColumnArray::Offsets_t & offsets_to = arr_to.getOffsets();

		size_t size = levels.size();
		offsets_to.push_back((offsets_to.size() == 0 ? 0 : offsets_to.back()) + size);

		typename ColumnFloat32::Container_t & data_to = static_cast<ColumnFloat32 &>(arr_to.getData()).getData();
		size_t old_size = data_to.size();
		data_to.resize(data_to.size() + size);

		this->data(place).getManyFloat(&levels.levels[0], &levels.permutation[0], size, &data_to[old_size]);
	}
};


}
-												dbms: added aggregate functions quantileTiming, quantilesTiming [#CONV-8223].



											
										
										
											2013-07-27 19:57:45 +00:00
+								#pragma once
-												dbms: quantiles returning NaN for empty state [#CONV-8799].



											
										
										
											2013-09-24 19:56:33 +00:00
+								#include <limits>
-												dbms: tracking amount of memory usage per query [#METR-11015].

											
										
										
											2014-05-03 22:57:43 +00:00
+								#include <DB/Common/MemoryTracker.h>
-												dbms: addition to prev. revision [#METR-18778].

											
										
										
											2015-11-15 09:14:22 +00:00
+								#include <DB/Common/HashTable/Hash.h>
-												dbms: tracking amount of memory usage per query [#METR-11015].

											
										
										
											2014-05-03 22:57:43 +00:00
-												dbms: added aggregate functions quantileTiming, quantilesTiming [#CONV-8223].



											
										
										
											2013-07-27 19:57:45 +00:00
+								#include <DB/IO/WriteHelpers.h>
 								#include <DB/IO/ReadHelpers.h>
 								#include <DB/DataTypes/DataTypesNumberFixed.h>
 								#include <DB/DataTypes/DataTypeArray.h>
 								#include <DB/AggregateFunctions/IUnaryAggregateFunction.h>
-												dbms: improved performance of quantile and quantileDeterministic aggregate functions [#METR-18778].

											
										
										
											2015-11-15 05:52:41 +00:00
+								#include <DB/AggregateFunctions/IBinaryAggregateFunction.h>
-												dbms: quantiles: allowed parameters in non-increasing order [#METR-18778].

											
										
										
											2015-11-23 21:33:43 +00:00
+								#include <DB/AggregateFunctions/QuantilesCommon.h>
-												dbms: added aggregate functions quantileTiming, quantilesTiming [#CONV-8223].



											
										
										
											2013-07-27 19:57:45 +00:00
 								#include <DB/Columns/ColumnArray.h>
-												Moved files [#METR-17973].

											
										
										
											2015-10-05 00:33:43 +00:00
+								#include <ext/range.hpp>
-												dbms: aggregate function quantileTiming: added (deterministic) randomization [#CONV-2944].



											
										
										
											2013-10-20 03:57:28 +00:00
-												dbms: added aggregate functions quantileTiming, quantilesTiming [#CONV-8223].



											
										
										
											2013-07-27 19:57:45 +00:00
 								namespace DB
 								{
 								/** Вычисляет квантиль для времени в миллисекундах, меньшего 30 сек.
-												dbms: AggregateFunctionQuantileTiming: small object optimization [#CONV-8850].



											
										
										
											2013-09-30 04:51:57 +00:00
+								  * Если значение больше 30 сек, то значение приравнивается к 30 сек.
 								  *
 								  * Если всего значений не больше 32, то вычисление точное.
 								  *
 								  * Иначе:
 								  *  Если время меньше 1024 мс., то вычисление точное.
 								  *  Иначе вычисление идёт с округлением до числа, кратного 16 мс.
-												dbms: added aggregate functions quantileTiming, quantilesTiming [#CONV-8223].



											
										
										
											2013-07-27 19:57:45 +00:00
+								  */
-												dbms: AggregateFunctionQuantileTiming: small object optimization [#CONV-8850].



											
										
										
											2013-09-30 04:51:57 +00:00
+								#define TINY_MAX_ELEMS 31
-												dbms: added aggregate functions quantileTiming, quantilesTiming [#CONV-8223].



											
										
										
											2013-07-27 19:57:45 +00:00
+								#define BIG_THRESHOLD 30000
-												dbms: AggregateFunctionQuantileTiming: small object optimization [#CONV-8850].



											
										
										
											2013-09-30 04:51:57 +00:00
+								namespace detail
-												dbms: added aggregate functions quantileTiming, quantilesTiming [#CONV-8223].



											
										
										
											2013-07-27 19:57:45 +00:00
+								{
-												dbms: AggregateFunctionQuantileTiming: small object optimization [#CONV-8850].



											
										
										
											2013-09-30 04:51:57 +00:00
+									/** Вспомогательная структура для оптимизации в случае маленького количества значений.
 									  * Размер - 64 байта. Должна быть POD-типом (используется в union).
 									  */
 									struct QuantileTimingTiny
 									{
 										mutable UInt16 elems[TINY_MAX_ELEMS];	/// mutable потому что сортировка массива не считается изменением состояния.
 										UInt16 count;	/// Важно, чтобы count был не в первых 8 байтах структуры. Вы должны сами инициализировать его нулём.
-												dbms: added aggregate functions quantileTiming, quantilesTiming [#CONV-8223].



											
										
										
											2013-07-27 19:57:45 +00:00
-												dbms: AggregateFunctionQuantileTiming: small object optimization [#CONV-8850].



											
										
										
											2013-09-30 04:51:57 +00:00
+										/// Можно использовать только пока count < TINY_MAX_ELEMS.
 										void insert(UInt64 x)
 										{
 											if (unlikely(x > BIG_THRESHOLD))
 												x = BIG_THRESHOLD;
-												dbms: added aggregate functions quantileTiming, quantilesTiming [#CONV-8223].



											
										
										
											2013-07-27 19:57:45 +00:00
-												dbms: AggregateFunctionQuantileTiming: small object optimization [#CONV-8850].



											
										
										
											2013-09-30 04:51:57 +00:00
+											elems[count] = x;
 											++count;
 										}
-												dbms: added aggregate functions quantileTiming, quantilesTiming [#CONV-8223].



											
										
										
											2013-07-27 19:57:45 +00:00
-												dbms: AggregateFunctionQuantileTiming: small object optimization [#CONV-8850].



											
										
										
											2013-09-30 04:51:57 +00:00
+										/// Можно использовать только пока count + rhs.count <= TINY_MAX_ELEMS.
 										void merge(const QuantileTimingTiny & rhs)
 										{
 											for (size_t i = 0; i < rhs.count; ++i)
 											{
 												elems[count] = rhs.elems[i];
 												++count;
 											}
 										}
-												dbms: added aggregate functions quantileTiming, quantilesTiming [#CONV-8223].



											
										
										
											2013-07-27 19:57:45 +00:00
-												dbms: AggregateFunctionQuantileTiming: small object optimization [#CONV-8850].



											
										
										
											2013-09-30 04:51:57 +00:00
+										void serialize(WriteBuffer & buf) const
 										{
 											writeBinary(count, buf);
 											buf.write(reinterpret_cast<const char *>(elems), count * sizeof(elems[0]));
 										}
-												dbms: added aggregate functions quantileTiming, quantilesTiming [#CONV-8223].



											
										
										
											2013-07-27 19:57:45 +00:00
-												dbms: AggregateFunctionQuantileTiming: small object optimization [#CONV-8850].



											
										
										
											2013-09-30 04:51:57 +00:00
+										void deserialize(ReadBuffer & buf)
 										{
 											readBinary(count, buf);
 											buf.readStrict(reinterpret_cast<char *>(elems), count * sizeof(elems[0]));
 										}
-												dbms: added aggregate functions quantileTiming, quantilesTiming [#CONV-8223].



											
										
										
											2013-07-27 19:57:45 +00:00
-												dbms: AggregateFunctionQuantileTiming: small object optimization [#CONV-8850].



											
										
										
											2013-09-30 04:51:57 +00:00
+										/** Эту функцию обязательно нужно позвать перед get-функциями. */
 										void prepare() const
 										{
 											std::sort(elems, elems + count);
 										}
-												dbms: added aggregate functions quantileTiming, quantilesTiming [#CONV-8223].



											
										
										
											2013-07-27 19:57:45 +00:00
-												dbms: AggregateFunctionQuantileTiming: small object optimization [#CONV-8850].



											
										
										
											2013-09-30 04:51:57 +00:00
+										UInt16 get(double level) const
 										{
 											return level != 1
 												? elems[static_cast<size_t>(count * level)]
 												: elems[count - 1];
 										}
-												dbms: added aggregate functions quantileTiming, quantilesTiming [#CONV-8223].



											
										
										
											2013-07-27 19:57:45 +00:00
-												dbms: AggregateFunctionQuantileTiming: small object optimization [#CONV-8850].



											
										
										
											2013-09-30 04:51:57 +00:00
+										template <typename ResultType>
 										void getMany(const double * levels, size_t size, ResultType * result) const
 										{
 											const double * levels_end = levels + size;
-												dbms: added aggregate functions quantileTiming, quantilesTiming [#CONV-8223].



											
										
										
											2013-07-27 19:57:45 +00:00
-												dbms: AggregateFunctionQuantileTiming: small object optimization [#CONV-8850].



											
										
										
											2013-09-30 04:51:57 +00:00
+											while (levels != levels_end)
 											{
 												*result = get(*levels);
 												++levels;
 												++result;
 											}
 										}
-												dbms: added aggregate functions quantileTiming, quantilesTiming [#CONV-8223].



											
										
										
											2013-07-27 19:57:45 +00:00
-												dbms: AggregateFunctionQuantileTiming: small object optimization [#CONV-8850].



											
										
										
											2013-09-30 04:51:57 +00:00
+										/// То же самое, но в случае пустого состояния возвращается NaN.
 										float getFloat(double level) const
 										{
 											return count
 												? get(level)
 												: std::numeric_limits<float>::quiet_NaN();
 										}
-												dbms: added aggregate functions quantileTiming, quantilesTiming [#CONV-8223].



											
										
										
											2013-07-27 19:57:45 +00:00
-												dbms: AggregateFunctionQuantileTiming: small object optimization [#CONV-8850].



											
										
										
											2013-09-30 04:51:57 +00:00
+										void getManyFloat(const double * levels, size_t size, float * result) const
 										{
 											if (count)
 												getMany(levels, size, result);
 											else
 												for (size_t i = 0; i < size; ++i)
 													result[i] = std::numeric_limits<float>::quiet_NaN();
 										}
 									};
-												dbms: added aggregate functions quantileTiming, quantilesTiming [#CONV-8223].



											
										
										
											2013-07-27 19:57:45 +00:00
-												dbms: AggregateFunctionQuantileTiming: small object optimization [#CONV-8850].



											
										
										
											2013-09-30 04:51:57 +00:00
+									#define SMALL_THRESHOLD 1024
 									#define BIG_SIZE ((BIG_THRESHOLD - SMALL_THRESHOLD) / BIG_PRECISION)
 									#define BIG_PRECISION 16
-												dbms: added aggregate functions quantileTiming, quantilesTiming [#CONV-8223].



											
										
										
											2013-07-27 19:57:45 +00:00
-												Lowered size of uncompressed serialized state of aggregate function quantileTiming about 20 times in average; improved performance of distributed queries [#METR-20359].

											
										
										
											2016-03-11 03:43:16 +00:00
+									#define SIZE_OF_LARGE_WITHOUT_COUNT ((SMALL_THRESHOLD + BIG_SIZE) * sizeof(UInt64))
-												dbms: AggregateFunctionQuantileTiming: small object optimization [#CONV-8850].



											
										
										
											2013-09-30 04:51:57 +00:00
 									/** Для большого количества значений. Размер около 20 КБ.
 									  * TODO: Есть off-by-one ошибки - может возвращаться значение на 1 больше нужного.
 									  */
 									class QuantileTimingLarge
-												dbms: added aggregate functions quantileTiming, quantilesTiming [#CONV-8223].



											
										
										
											2013-07-27 19:57:45 +00:00
+									{
-												dbms: AggregateFunctionQuantileTiming: small object optimization [#CONV-8850].



											
										
										
											2013-09-30 04:51:57 +00:00
+									private:
 										/// Общее число значений.
 										UInt64 count;
-												dbms: added aggregate functions quantileTiming, quantilesTiming [#CONV-8223].



											
										
										
											2013-07-27 19:57:45 +00:00
-												dbms: AggregateFunctionQuantileTiming: small object optimization [#CONV-8850].



											
										
										
											2013-09-30 04:51:57 +00:00
+										/// Число значений для каждого значения меньше small_threshold.
 										UInt64 count_small[SMALL_THRESHOLD];
-												dbms: added aggregate functions quantileTiming, quantilesTiming [#CONV-8223].



											
										
										
											2013-07-27 19:57:45 +00:00
-												dbms: AggregateFunctionQuantileTiming: small object optimization [#CONV-8850].



											
										
										
											2013-09-30 04:51:57 +00:00
+										/// Число значений для каждого значения от small_threshold до big_threshold, округлённого до big_precision.
 										UInt64 count_big[BIG_SIZE];
-												dbms: aggregate function quantileTiming: added (deterministic) randomization [#CONV-2944].



											
										
										
											2013-10-20 03:57:28 +00:00
+										/// Получить значение квантиля по индексу в массиве count_big.
 										static inline UInt16 indexInBigToValue(size_t i)
 										{
 											return (i * BIG_PRECISION) + SMALL_THRESHOLD
 												+ (intHash32<0>(i) % BIG_PRECISION - (BIG_PRECISION / 2));	/// Небольшая рандомизация, чтобы не было заметно, что все значения чётные.
 										}
-												dbms: AggregateFunctionQuantileTiming: small object optimization [#CONV-8850].



											
										
										
											2013-09-30 04:51:57 +00:00
+									public:
 										QuantileTimingLarge()
-												dbms: added aggregate functions quantileTiming, quantilesTiming [#CONV-8223].



											
										
										
											2013-07-27 19:57:45 +00:00
+										{
-												dbms: AggregateFunctionQuantileTiming: small object optimization [#CONV-8850].



											
										
										
											2013-09-30 04:51:57 +00:00
+											memset(this, 0, sizeof(*this));
-												dbms: added aggregate functions quantileTiming, quantilesTiming [#CONV-8223].



											
										
										
											2013-07-27 19:57:45 +00:00
+										}
-												dbms: AggregateFunctionQuantileTiming: small object optimization [#CONV-8850].



											
										
										
											2013-09-30 04:51:57 +00:00
+										QuantileTimingLarge(ReadBuffer & buf)
 										{
-												Lowered size of uncompressed serialized state of aggregate function quantileTiming about 20 times in average; improved performance of distributed queries [#METR-20359].

											
										
										
											2016-03-11 03:43:16 +00:00
+											deserialize(buf, true);
-												dbms: AggregateFunctionQuantileTiming: small object optimization [#CONV-8850].



											
										
										
											2013-09-30 04:51:57 +00:00
+										}
-												dbms: added aggregate functions quantileTiming, quantilesTiming [#CONV-8223].



											
										
										
											2013-07-27 19:57:45 +00:00
-												dbms: AggregateFunctionQuantileTiming: small object optimization [#CONV-8850].



											
										
										
											2013-09-30 04:51:57 +00:00
+										void insert(UInt64 x)
-												dbms: added aggregate functions quantileTiming, quantilesTiming [#CONV-8223].



											
										
										
											2013-07-27 19:57:45 +00:00
+										{
-												dbms: added aggregate functions quantileTimingWeighted, quantilesTimingWeighted, medianTimingWeighted [#METR-15181].

											
										
										
											2015-02-27 17:38:21 +00:00
+											insertWeighted(x, 1);
 										}
 										void insertWeighted(UInt64 x, size_t weight)
 										{
 											count += weight;
-												dbms: AggregateFunctionQuantileTiming: small object optimization [#CONV-8850].



											
										
										
											2013-09-30 04:51:57 +00:00
 											if (x < SMALL_THRESHOLD)
-												dbms: added aggregate functions quantileTimingWeighted, quantilesTimingWeighted, medianTimingWeighted [#METR-15181].

											
										
										
											2015-02-27 17:38:21 +00:00
+												count_small[x] += weight;
-												dbms: AggregateFunctionQuantileTiming: small object optimization [#CONV-8850].



											
										
										
											2013-09-30 04:51:57 +00:00
+											else if (x < BIG_THRESHOLD)
-												dbms: added aggregate functions quantileTimingWeighted, quantilesTimingWeighted, medianTimingWeighted [#METR-15181].

											
										
										
											2015-02-27 17:38:21 +00:00
+												count_big[(x - SMALL_THRESHOLD) / BIG_PRECISION] += weight;
-												dbms: added aggregate functions quantileTiming, quantilesTiming [#CONV-8223].



											
										
										
											2013-07-27 19:57:45 +00:00
+										}
-												dbms: AggregateFunctionQuantileTiming: small object optimization [#CONV-8850].



											
										
										
											2013-09-30 04:51:57 +00:00
+										void merge(const QuantileTimingLarge & rhs)
 										{
 											count += rhs.count;
-												dbms: added aggregate functions quantileTiming, quantilesTiming [#CONV-8223].



											
										
										
											2013-07-27 19:57:45 +00:00
-												dbms: AggregateFunctionQuantileTiming: small object optimization [#CONV-8850].



											
										
										
											2013-09-30 04:51:57 +00:00
+											for (size_t i = 0; i < SMALL_THRESHOLD; ++i)
 												count_small[i] += rhs.count_small[i];
-												dbms: added aggregate functions quantileTiming, quantilesTiming [#CONV-8223].



											
										
										
											2013-07-27 19:57:45 +00:00
-												dbms: AggregateFunctionQuantileTiming: small object optimization [#CONV-8850].



											
										
										
											2013-09-30 04:51:57 +00:00
+											for (size_t i = 0; i < BIG_SIZE; ++i)
 												count_big[i] += rhs.count_big[i];
 										}
 										void serialize(WriteBuffer & buf) const
 										{
-												Lowered size of uncompressed serialized state of aggregate function quantileTiming about 20 times in average; improved performance of distributed queries [#METR-20359].

											
										
										
											2016-03-11 03:43:16 +00:00
+											writeBinary(count, buf);
 											if (count * 2 > SMALL_THRESHOLD + BIG_SIZE)
 											{
 												/// Простая сериализация для сильно заполненного случая.
 												buf.write(reinterpret_cast<const char *>(this) + sizeof(count), SIZE_OF_LARGE_WITHOUT_COUNT);
 											}
 											else
 											{
 												/// Более компактная сериализация для разреженного случая.
 												for (size_t i = 0; i < SMALL_THRESHOLD; ++i)
 												{
 													if (count_small[i])
 													{
 														writeBinary(UInt16(i), buf);
 														writeBinary(count_small[i], buf);
 													}
 												}
 												for (size_t i = 0; i < BIG_SIZE; ++i)
 												{
 													if (count_big[i])
 													{
 														writeBinary(UInt16(i + SMALL_THRESHOLD), buf);
 														writeBinary(count_big[i], buf);
 													}
 												}
 												/// Символизирует конец данных.
 												writeBinary(UInt16(BIG_THRESHOLD), buf);
 											}
-												dbms: AggregateFunctionQuantileTiming: small object optimization [#CONV-8850].



											
										
										
											2013-09-30 04:51:57 +00:00
+										}
-												Lowered size of uncompressed serialized state of aggregate function quantileTiming about 20 times in average; improved performance of distributed queries [#METR-20359].

											
										
										
											2016-03-11 03:43:16 +00:00
+										void deserialize(ReadBuffer & buf, bool need_memset = false)
-												dbms: AggregateFunctionQuantileTiming: small object optimization [#CONV-8850].



											
										
										
											2013-09-30 04:51:57 +00:00
+										{
-												Lowered size of uncompressed serialized state of aggregate function quantileTiming about 20 times in average; improved performance of distributed queries [#METR-20359].

											
										
										
											2016-03-11 03:43:16 +00:00
+											readBinary(count, buf);
 											if (count * 2 > SMALL_THRESHOLD + BIG_SIZE)
 											{
 												buf.readStrict(reinterpret_cast<char *>(this) + sizeof(count), SIZE_OF_LARGE_WITHOUT_COUNT);
 											}
 											else
 											{
 												/// Используется, если в конструкторе ещё не был сделан memset.
 												if (need_memset)
 													memset(reinterpret_cast<char *>(this) + sizeof(count), 0, SIZE_OF_LARGE_WITHOUT_COUNT);
 												while (true)
 												{
 													UInt16 index = 0;
 													readBinary(index, buf);
 													if (index == BIG_THRESHOLD)
 														break;
 													UInt64 count = 0;
 													readBinary(count, buf);
 													if (index < SMALL_THRESHOLD)
 														count_small[index] = count;
 													else
 														count_big[index - SMALL_THRESHOLD] = count;
 												}
 											}
-												dbms: AggregateFunctionQuantileTiming: small object optimization [#CONV-8850].



											
										
										
											2013-09-30 04:51:57 +00:00
+										}
 										void deserializeMerge(ReadBuffer & buf)
 										{
 											merge(QuantileTimingLarge(buf));
 										}
-												dbms: added aggregate functions quantileTiming, quantilesTiming [#CONV-8223].



											
										
										
											2013-07-27 19:57:45 +00:00
-												dbms: AggregateFunctionQuantileTiming: small object optimization [#CONV-8850].



											
										
										
											2013-09-30 04:51:57 +00:00
+										/// Получить значение квантиля уровня level. Уровень должен быть от 0 до 1.
 										UInt16 get(double level) const
-												dbms: added aggregate functions quantileTiming, quantilesTiming [#CONV-8223].



											
										
										
											2013-07-27 19:57:45 +00:00
+										{
-												dbms: AggregateFunctionQuantileTiming: small object optimization [#CONV-8850].



											
										
										
											2013-09-30 04:51:57 +00:00
+											UInt64 pos = count * level;
 											UInt64 accumulated = 0;
 											size_t i = 0;
-												dbms: added aggregate functions quantileTiming, quantilesTiming [#CONV-8223].



											
										
										
											2013-07-27 19:57:45 +00:00
+											while (i < SMALL_THRESHOLD && accumulated < pos)
 											{
 												accumulated += count_small[i];
 												++i;
 											}
 											if (i < SMALL_THRESHOLD)
-												dbms: AggregateFunctionQuantileTiming: small object optimization [#CONV-8850].



											
										
										
											2013-09-30 04:51:57 +00:00
+												return i;
 											i = 0;
 											while (i < BIG_SIZE && accumulated < pos)
-												dbms: added aggregate functions quantileTiming, quantilesTiming [#CONV-8223].



											
										
										
											2013-07-27 19:57:45 +00:00
+											{
-												dbms: AggregateFunctionQuantileTiming: small object optimization [#CONV-8850].



											
										
										
											2013-09-30 04:51:57 +00:00
+												accumulated += count_big[i];
 												++i;
 											}
-												dbms: added aggregate functions quantileTiming, quantilesTiming [#CONV-8223].



											
										
										
											2013-07-27 19:57:45 +00:00
-												dbms: AggregateFunctionQuantileTiming: small object optimization [#CONV-8850].



											
										
										
											2013-09-30 04:51:57 +00:00
+											if (i < BIG_SIZE)
-												dbms: aggregate function quantileTiming: added (deterministic) randomization [#CONV-2944].



											
										
										
											2013-10-20 03:57:28 +00:00
+												return indexInBigToValue(i);
-												dbms: added aggregate functions quantileTiming, quantilesTiming [#CONV-8223].



											
										
										
											2013-07-27 19:57:45 +00:00
-												dbms: AggregateFunctionQuantileTiming: small object optimization [#CONV-8850].



											
										
										
											2013-09-30 04:51:57 +00:00
+											return BIG_THRESHOLD;
-												dbms: added aggregate functions quantileTiming, quantilesTiming [#CONV-8223].



											
										
										
											2013-07-27 19:57:45 +00:00
+										}
-												dbms: AggregateFunctionQuantileTiming: small object optimization [#CONV-8850].



											
										
										
											2013-09-30 04:51:57 +00:00
+										/// Получить значения size квантилей уровней levels. Записать size результатов начиная с адреса result.
-												dbms: quantiles: allowed parameters in non-increasing order [#METR-18778].

											
										
										
											2015-11-23 21:33:43 +00:00
+										/// indices - массив индексов levels такой, что соответствующие элементы будут идти в порядке по возрастанию.
-												dbms: AggregateFunctionQuantileTiming: small object optimization [#CONV-8850].



											
										
										
											2013-09-30 04:51:57 +00:00
+										template <typename ResultType>
-												dbms: quantiles: allowed parameters in non-increasing order [#METR-18778].

											
										
										
											2015-11-23 21:33:43 +00:00
+										void getMany(const double * levels, const size_t * indices, size_t size, ResultType * result) const
-												dbms: added aggregate functions quantileTiming, quantilesTiming [#CONV-8223].



											
										
										
											2013-07-27 19:57:45 +00:00
+										{
-												dbms: fix quantilesTiming for levels specified in non-increasing order [#METR-14503]

											
										
										
											2015-08-20 16:47:02 +00:00
+											const auto indices_end = indices + size;
 											auto index = indices;
 											UInt64 pos = count * levels[*index];
-												dbms: AggregateFunctionQuantileTiming: small object optimization [#CONV-8850].



											
										
										
											2013-09-30 04:51:57 +00:00
 											UInt64 accumulated = 0;
 											size_t i = 0;
 											while (i < SMALL_THRESHOLD)
-												dbms: added aggregate functions quantileTiming, quantilesTiming [#CONV-8223].



											
										
										
											2013-07-27 19:57:45 +00:00
+											{
-												dbms: AggregateFunctionQuantileTiming: small object optimization [#CONV-8850].



											
										
										
											2013-09-30 04:51:57 +00:00
+												while (i < SMALL_THRESHOLD && accumulated < pos)
 												{
 													accumulated += count_small[i];
 													++i;
 												}
 												if (i < SMALL_THRESHOLD)
 												{
-												dbms: fix quantilesTiming for levels specified in non-increasing order [#METR-14503]

											
										
										
											2015-08-20 16:47:02 +00:00
+													result[*index] = i;
-												dbms: AggregateFunctionQuantileTiming: small object optimization [#CONV-8850].



											
										
										
											2013-09-30 04:51:57 +00:00
-												dbms: fix quantilesTiming for levels specified in non-increasing order [#METR-14503]

											
										
										
											2015-08-20 16:47:02 +00:00
+													++index;
-												dbms: AggregateFunctionQuantileTiming: small object optimization [#CONV-8850].



											
										
										
											2013-09-30 04:51:57 +00:00
-												dbms: fix quantilesTiming for levels specified in non-increasing order [#METR-14503]

											
										
										
											2015-08-20 16:47:02 +00:00
+													if (index == indices_end)
-												dbms: AggregateFunctionQuantileTiming: small object optimization [#CONV-8850].



											
										
										
											2013-09-30 04:51:57 +00:00
+														return;
-												dbms: fix quantilesTiming for levels specified in non-increasing order [#METR-14503]

											
										
										
											2015-08-20 16:47:02 +00:00
+													pos = count * levels[*index];
-												dbms: AggregateFunctionQuantileTiming: small object optimization [#CONV-8850].



											
										
										
											2013-09-30 04:51:57 +00:00
+												}
-												dbms: added aggregate functions quantileTiming, quantilesTiming [#CONV-8223].



											
										
										
											2013-07-27 19:57:45 +00:00
+											}
-												dbms: AggregateFunctionQuantileTiming: small object optimization [#CONV-8850].



											
										
										
											2013-09-30 04:51:57 +00:00
+											i = 0;
 											while (i < BIG_SIZE)
 											{
 												while (i < BIG_SIZE && accumulated < pos)
 												{
 													accumulated += count_big[i];
 													++i;
 												}
 												if (i < BIG_SIZE)
 												{
-												dbms: fix quantilesTiming for levels specified in non-increasing order [#METR-14503]

											
										
										
											2015-08-20 16:47:02 +00:00
+													result[*index] = indexInBigToValue(i);
-												dbms: AggregateFunctionQuantileTiming: small object optimization [#CONV-8850].



											
										
										
											2013-09-30 04:51:57 +00:00
-												dbms: fix quantilesTiming for levels specified in non-increasing order [#METR-14503]

											
										
										
											2015-08-20 16:47:02 +00:00
+													++index;
-												dbms: AggregateFunctionQuantileTiming: small object optimization [#CONV-8850].



											
										
										
											2013-09-30 04:51:57 +00:00
-												dbms: fix quantilesTiming for levels specified in non-increasing order [#METR-14503]

											
										
										
											2015-08-20 16:47:02 +00:00
+													if (index == indices_end)
-												dbms: AggregateFunctionQuantileTiming: small object optimization [#CONV-8850].



											
										
										
											2013-09-30 04:51:57 +00:00
+														return;
-												dbms: fix quantilesTiming for levels specified in non-increasing order [#METR-14503]

											
										
										
											2015-08-20 16:47:02 +00:00
+													pos = count * levels[*index];
-												dbms: AggregateFunctionQuantileTiming: small object optimization [#CONV-8850].



											
										
										
											2013-09-30 04:51:57 +00:00
+												}
 											}
-												dbms: fix quantilesTiming for levels specified in non-increasing order [#METR-14503]

											
										
										
											2015-08-20 16:47:02 +00:00
+											while (index < indices_end)
-												dbms: added aggregate functions quantileTiming, quantilesTiming [#CONV-8223].



											
										
										
											2013-07-27 19:57:45 +00:00
+											{
-												dbms: fix quantilesTiming for levels specified in non-increasing order [#METR-14503]

											
										
										
											2015-08-20 16:47:02 +00:00
+												result[*index] = BIG_THRESHOLD;
-												dbms: added aggregate functions quantileTiming, quantilesTiming [#CONV-8223].



											
										
										
											2013-07-27 19:57:45 +00:00
-												dbms: fix quantilesTiming for levels specified in non-increasing order [#METR-14503]

											
										
										
											2015-08-20 16:47:02 +00:00
+												++index;
-												dbms: AggregateFunctionQuantileTiming: small object optimization [#CONV-8850].



											
										
										
											2013-09-30 04:51:57 +00:00
+											}
 										}
 										/// То же самое, но в случае пустого состояния возвращается NaN.
 										float getFloat(double level) const
 										{
 											return count
 												? get(level)
 												: std::numeric_limits<float>::quiet_NaN();
 										}
-												dbms: quantiles: allowed parameters in non-increasing order [#METR-18778].

											
										
										
											2015-11-23 21:33:43 +00:00
+										void getManyFloat(const double * levels, const size_t * levels_permutation, size_t size, float * result) const
-												dbms: AggregateFunctionQuantileTiming: small object optimization [#CONV-8850].



											
										
										
											2013-09-30 04:51:57 +00:00
+										{
 											if (count)
-												dbms: quantiles: allowed parameters in non-increasing order [#METR-18778].

											
										
										
											2015-11-23 21:33:43 +00:00
+												getMany(levels, levels_permutation, size, result);
-												dbms: AggregateFunctionQuantileTiming: small object optimization [#CONV-8850].



											
										
										
											2013-09-30 04:51:57 +00:00
+											else
 												for (size_t i = 0; i < size; ++i)
 													result[i] = std::numeric_limits<float>::quiet_NaN();
 										}
 									};
 								}
 								/** sizeof - 64 байта.
 								  * Если их не хватает - выделяет дополнительно около 20 КБ памяти.
 								  */
 								class QuantileTiming : private boost::noncopyable
 								{
 								private:
 									union
 									{
 										detail::QuantileTimingTiny tiny;
 										detail::QuantileTimingLarge * large;
 									};
 									bool isLarge() const { return tiny.count == TINY_MAX_ELEMS + 1; }
 									void toLarge()
 									{
-												dbms: tracking amount of memory usage per query [#METR-11015].

											
										
										
											2014-05-03 22:57:43 +00:00
+										if (current_memory_tracker)
 											current_memory_tracker->alloc(sizeof(detail::QuantileTimingLarge));
-												dbms: fixed error with aggregate function quantileTiming [#METR-10597].

											
										
										
											2014-03-26 00:34:00 +00:00
+										/// На время копирования данных из tiny, устанавливать значение large ещё нельзя (иначе оно перезатрёт часть данных).
 										detail::QuantileTimingLarge * tmp_large = new detail::QuantileTimingLarge;
-												dbms: AggregateFunctionQuantileTiming: small object optimization [#CONV-8850].



											
										
										
											2013-09-30 04:51:57 +00:00
 										for (size_t i = 0; i < tiny.count; ++i)
-												dbms: fixed error with aggregate function quantileTiming [#METR-10597].

											
										
										
											2014-03-26 00:34:00 +00:00
+											tmp_large->insert(tiny.elems[i]);
-												dbms: AggregateFunctionQuantileTiming: small object optimization [#CONV-8850].



											
										
										
											2013-09-30 04:51:57 +00:00
-												dbms: fixed error with aggregate function quantileTiming [#METR-10597].

											
										
										
											2014-03-26 00:34:00 +00:00
+										large = tmp_large;
-												dbms: AggregateFunctionQuantileTiming: small object optimization [#CONV-8850].



											
										
										
											2013-09-30 04:51:57 +00:00
+										tiny.count = TINY_MAX_ELEMS + 1;
 									}
 								public:
 									QuantileTiming()
 									{
 										tiny.count = 0;
 									}
 									~QuantileTiming()
 									{
 										if (isLarge())
-												dbms: tracking amount of memory usage per query [#METR-11015].

											
										
										
											2014-05-03 22:57:43 +00:00
+										{
-												dbms: AggregateFunctionQuantileTiming: small object optimization [#CONV-8850].



											
										
										
											2013-09-30 04:51:57 +00:00
+											delete large;
-												dbms: tracking amount of memory usage per query [#METR-11015].

											
										
										
											2014-05-03 22:57:43 +00:00
 											if (current_memory_tracker)
 												current_memory_tracker->free(sizeof(detail::QuantileTimingLarge));
 										}
-												dbms: AggregateFunctionQuantileTiming: small object optimization [#CONV-8850].



											
										
										
											2013-09-30 04:51:57 +00:00
+									}
 									void insert(UInt64 x)
 									{
 										if (tiny.count < TINY_MAX_ELEMS)
 										{
 											tiny.insert(x);
 										}
 										else
 										{
 											if (unlikely(tiny.count == TINY_MAX_ELEMS))
 												toLarge();
 											large->insert(x);
 										}
 									}
-												dbms: added aggregate functions quantileTimingWeighted, quantilesTimingWeighted, medianTimingWeighted [#METR-15181].

											
										
										
											2015-02-27 17:38:21 +00:00
+									void insertWeighted(UInt64 x, size_t weight)
 									{
 										/// NOTE: Первое условие - для того, чтобы избежать переполнения.
 										if (weight < TINY_MAX_ELEMS && tiny.count + weight <= TINY_MAX_ELEMS)
 										{
 											for (size_t i = 0; i < weight; ++i)
 												tiny.insert(x);
 										}
 										else
 										{
 											if (unlikely(tiny.count <= TINY_MAX_ELEMS))
 												toLarge();
 											large->insertWeighted(x, weight);
 										}
 									}
-												dbms: AggregateFunctionQuantileTiming: small object optimization [#CONV-8850].



											
										
										
											2013-09-30 04:51:57 +00:00
+									void merge(const QuantileTiming & rhs)
 									{
 										if (tiny.count + rhs.tiny.count <= TINY_MAX_ELEMS)
 										{
 											tiny.merge(rhs.tiny);
 										}
 										else
 										{
 											if (!isLarge())
 												toLarge();
 											if (rhs.isLarge())
 											{
 												large->merge(*rhs.large);
 											}
 											else
 											{
 												for (size_t i = 0; i < rhs.tiny.count; ++i)
 													large->insert(rhs.tiny.elems[i]);
 											}
 										}
 									}
 									void serialize(WriteBuffer & buf) const
 									{
 										bool is_large = isLarge();
 										DB::writeBinary(is_large, buf);
 										if (is_large)
 											large->serialize(buf);
 										else
 											tiny.serialize(buf);
 									}
-												dbms: added aggregate functions quantileTiming, quantilesTiming [#CONV-8223].



											
										
										
											2013-07-27 19:57:45 +00:00
-												dbms: AggregateFunctionQuantileTiming: small object optimization [#CONV-8850].



											
										
										
											2013-09-30 04:51:57 +00:00
+									void deserialize(ReadBuffer & buf)
 									{
 										bool is_rhs_large;
 										DB::readBinary(is_rhs_large, buf);
-												dbms: added aggregate functions quantileTiming, quantilesTiming [#CONV-8223].



											
										
										
											2013-07-27 19:57:45 +00:00
-												dbms: AggregateFunctionQuantileTiming: small object optimization [#CONV-8850].



											
										
										
											2013-09-30 04:51:57 +00:00
+										if (is_rhs_large)
 										{
 											if (!isLarge())
 											{
 												tiny.count = TINY_MAX_ELEMS + 1;
-												dbms: tracking amount of memory usage per query [#METR-11015].

											
										
										
											2014-05-03 22:57:43 +00:00
 												if (current_memory_tracker)
 													current_memory_tracker->alloc(sizeof(detail::QuantileTimingLarge));
-												dbms: AggregateFunctionQuantileTiming: small object optimization [#CONV-8850].



											
										
										
											2013-09-30 04:51:57 +00:00
+												large = new detail::QuantileTimingLarge;
-												dbms: added aggregate functions quantileTiming, quantilesTiming [#CONV-8223].



											
										
										
											2013-07-27 19:57:45 +00:00
+											}
-												dbms: AggregateFunctionQuantileTiming: small object optimization [#CONV-8850].



											
										
										
											2013-09-30 04:51:57 +00:00
 											large->deserialize(buf);
-												dbms: added aggregate functions quantileTiming, quantilesTiming [#CONV-8223].



											
										
										
											2013-07-27 19:57:45 +00:00
+										}
-												dbms: AggregateFunctionQuantileTiming: small object optimization [#CONV-8850].



											
										
										
											2013-09-30 04:51:57 +00:00
+										else
 											tiny.deserialize(buf);
 									}
 									void deserializeMerge(ReadBuffer & buf)
 									{
 										bool is_rhs_large;
 										DB::readBinary(is_rhs_large, buf);
-												dbms: added aggregate functions quantileTiming, quantilesTiming [#CONV-8223].



											
										
										
											2013-07-27 19:57:45 +00:00
-												dbms: AggregateFunctionQuantileTiming: small object optimization [#CONV-8850].



											
										
										
											2013-09-30 04:51:57 +00:00
+										if (is_rhs_large)
-												dbms: added aggregate functions quantileTiming, quantilesTiming [#CONV-8223].



											
										
										
											2013-07-27 19:57:45 +00:00
+										{
-												dbms: AggregateFunctionQuantileTiming: small object optimization [#CONV-8850].



											
										
										
											2013-09-30 04:51:57 +00:00
+											if (!isLarge())
 											{
 												tiny.count = TINY_MAX_ELEMS + 1;
-												dbms: tracking amount of memory usage per query [#METR-11015].

											
										
										
											2014-05-03 22:57:43 +00:00
 												if (current_memory_tracker)
 													current_memory_tracker->alloc(sizeof(detail::QuantileTimingLarge));
-												dbms: AggregateFunctionQuantileTiming: small object optimization [#CONV-8850].



											
										
										
											2013-09-30 04:51:57 +00:00
+												large = new detail::QuantileTimingLarge;
 											}
-												dbms: fix quantilesTiming for levels specified in non-increasing order [#METR-14503]

											
										
										
											2015-08-20 16:47:02 +00:00
-												dbms: AggregateFunctionQuantileTiming: small object optimization [#CONV-8850].



											
										
										
											2013-09-30 04:51:57 +00:00
+											large->merge(detail::QuantileTimingLarge(buf));
 										}
 										else
 										{
 											QuantileTiming rhs;
 											rhs.tiny.deserialize(buf);
 											merge(rhs);
 										}
 									}
 									/// Получить значение квантиля уровня level. Уровень должен быть от 0 до 1.
 									UInt16 get(double level) const
 									{
 										if (isLarge())
 										{
 											return large->get(level);
 										}
 										else
 										{
 											tiny.prepare();
 											return tiny.get(level);
 										}
 									}
 									/// Получить значения size квантилей уровней levels. Записать size результатов начиная с адреса result.
 									template <typename ResultType>
-												dbms: quantiles: allowed parameters in non-increasing order [#METR-18778].

											
										
										
											2015-11-23 21:33:43 +00:00
+									void getMany(const double * levels, const size_t * levels_permutation, size_t size, ResultType * result) const
-												dbms: AggregateFunctionQuantileTiming: small object optimization [#CONV-8850].



											
										
										
											2013-09-30 04:51:57 +00:00
+									{
 										if (isLarge())
 										{
-												dbms: quantiles: allowed parameters in non-increasing order [#METR-18778].

											
										
										
											2015-11-23 21:33:43 +00:00
+											return large->getMany(levels, levels_permutation, size, result);
-												dbms: AggregateFunctionQuantileTiming: small object optimization [#CONV-8850].



											
										
										
											2013-09-30 04:51:57 +00:00
+										}
 										else
 										{
 											tiny.prepare();
 											return tiny.getMany(levels, size, result);
-												dbms: added aggregate functions quantileTiming, quantilesTiming [#CONV-8223].



											
										
										
											2013-07-27 19:57:45 +00:00
+										}
 									}
-												dbms: quantiles returning NaN for empty state [#CONV-8799].



											
										
										
											2013-09-24 19:56:33 +00:00
 									/// То же самое, но в случае пустого состояния возвращается NaN.
 									float getFloat(double level) const
 									{
-												dbms: AggregateFunctionQuantileTiming: small object optimization [#CONV-8850].



											
										
										
											2013-09-30 04:51:57 +00:00
+										return tiny.count
-												dbms: quantiles returning NaN for empty state [#CONV-8799].



											
										
										
											2013-09-24 19:56:33 +00:00
+											? get(level)
 											: std::numeric_limits<float>::quiet_NaN();
 									}
-												dbms: quantiles: allowed parameters in non-increasing order [#METR-18778].

											
										
										
											2015-11-23 21:33:43 +00:00
+									void getManyFloat(const double * levels, const size_t * levels_permutation, size_t size, float * result) const
-												dbms: quantiles returning NaN for empty state [#CONV-8799].



											
										
										
											2013-09-24 19:56:33 +00:00
+									{
-												dbms: AggregateFunctionQuantileTiming: small object optimization [#CONV-8850].



											
										
										
											2013-09-30 04:51:57 +00:00
+										if (tiny.count)
-												dbms: quantiles: allowed parameters in non-increasing order [#METR-18778].

											
										
										
											2015-11-23 21:33:43 +00:00
+											getMany(levels, levels_permutation, size, result);
-												dbms: quantiles returning NaN for empty state [#CONV-8799].



											
										
										
											2013-09-24 19:56:33 +00:00
+										else
 											for (size_t i = 0; i < size; ++i)
 												result[i] = std::numeric_limits<float>::quiet_NaN();
 									}
-												dbms: added aggregate functions quantileTiming, quantilesTiming [#CONV-8223].



											
										
										
											2013-07-27 19:57:45 +00:00
+								};
 								#undef SMALL_THRESHOLD
 								#undef BIG_THRESHOLD
 								#undef BIG_SIZE
 								#undef BIG_PRECISION
-												dbms: AggregateFunctionQuantileTiming: small object optimization [#CONV-8850].



											
										
										
											2013-09-30 04:51:57 +00:00
+								#undef TINY_MAX_ELEMS
-												dbms: added aggregate functions quantileTiming, quantilesTiming [#CONV-8223].



											
										
										
											2013-07-27 19:57:45 +00:00
 								template <typename ArgumentFieldType>
-												dbms: improved performance of function regionToName [#METR-11434].

											
										
										
											2014-06-04 01:00:09 +00:00
+								class AggregateFunctionQuantileTiming final : public IUnaryAggregateFunction<QuantileTiming, AggregateFunctionQuantileTiming<ArgumentFieldType> >
-												dbms: added aggregate functions quantileTiming, quantilesTiming [#CONV-8223].



											
										
										
											2013-07-27 19:57:45 +00:00
+								{
 								private:
 									double level;
 								public:
 									AggregateFunctionQuantileTiming(double level_ = 0.5) : level(level_) {}
-												dbms: better [#METR-2944].

											
										
										
											2015-11-11 02:04:23 +00:00
+									String getName() const override { return "quantileTiming"; }
-												dbms: added aggregate functions quantileTiming, quantilesTiming [#CONV-8223].



											
										
										
											2013-07-27 19:57:45 +00:00
-												dbms: better [#METR-2944].

											
										
										
											2015-11-11 02:04:23 +00:00
+									DataTypePtr getReturnType() const override
-												dbms: added aggregate functions quantileTiming, quantilesTiming [#CONV-8223].



											
										
										
											2013-07-27 19:57:45 +00:00
+									{
-												dbms: quantiles returning NaN for empty state [#CONV-8799].



											
										
										
											2013-09-24 19:56:33 +00:00
+										return new DataTypeFloat32;
-												dbms: added aggregate functions quantileTiming, quantilesTiming [#CONV-8223].



											
										
										
											2013-07-27 19:57:45 +00:00
+									}
-												dbms: added aggregate function quantileExactWeighted and companions [#METR-18778].

											
										
										
											2015-11-15 08:31:08 +00:00
+									void setArgument(const DataTypePtr & argument)
-												dbms: added aggregate functions quantileTiming, quantilesTiming [#CONV-8223].



											
										
										
											2013-07-27 19:57:45 +00:00
+									{
 									}
-												dbms: better [#METR-2944].

											
										
										
											2015-11-11 02:04:23 +00:00
+									void setParameters(const Array & params) override
-												dbms: added aggregate functions quantileTiming, quantilesTiming [#CONV-8223].



											
										
										
											2013-07-27 19:57:45 +00:00
+									{
 										if (params.size() != 1)
 											throw Exception("Aggregate function " + getName() + " requires exactly one parameter.", ErrorCodes::NUMBER_OF_ARGUMENTS_DOESNT_MATCH);
 										level = apply_visitor(FieldVisitorConvertToNumber<Float64>(), params[0]);
 									}
-												dbms: renamed functions [#METR-18778].

											
										
										
											2015-11-15 06:23:44 +00:00
+									void addImpl(AggregateDataPtr place, const IColumn & column, size_t row_num) const
-												dbms: added aggregate functions quantileTiming, quantilesTiming [#CONV-8223].



											
										
										
											2013-07-27 19:57:45 +00:00
+									{
 										this->data(place).insert(static_cast<const ColumnVector<ArgumentFieldType> &>(column).getData()[row_num]);
 									}
-												dbms: better [#METR-2944].

											
										
										
											2015-11-11 02:04:23 +00:00
+									void merge(AggregateDataPtr place, ConstAggregateDataPtr rhs) const override
-												dbms: added aggregate functions quantileTiming, quantilesTiming [#CONV-8223].



											
										
										
											2013-07-27 19:57:45 +00:00
+									{
 										this->data(place).merge(this->data(rhs));
 									}
-												dbms: better [#METR-2944].

											
										
										
											2015-11-11 02:04:23 +00:00
+									void serialize(ConstAggregateDataPtr place, WriteBuffer & buf) const override
-												dbms: added aggregate functions quantileTiming, quantilesTiming [#CONV-8223].



											
										
										
											2013-07-27 19:57:45 +00:00
+									{
 										this->data(place).serialize(buf);
 									}
-												dbms: better [#METR-2944].

											
										
										
											2015-11-11 02:04:23 +00:00
+									void deserializeMerge(AggregateDataPtr place, ReadBuffer & buf) const override
-												dbms: added aggregate functions quantileTiming, quantilesTiming [#CONV-8223].



											
										
										
											2013-07-27 19:57:45 +00:00
+									{
 										this->data(place).deserializeMerge(buf);
 									}
-												dbms: better [#METR-2944].

											
										
										
											2015-11-11 02:04:23 +00:00
+									void insertResultInto(ConstAggregateDataPtr place, IColumn & to) const override
-												dbms: added aggregate functions quantileTiming, quantilesTiming [#CONV-8223].



											
										
										
											2013-07-27 19:57:45 +00:00
+									{
-												dbms: quantiles returning NaN for empty state [#CONV-8799].



											
										
										
											2013-09-24 19:56:33 +00:00
+										static_cast<ColumnFloat32 &>(to).getData().push_back(this->data(place).getFloat(level));
-												dbms: added aggregate functions quantileTiming, quantilesTiming [#CONV-8223].



											
										
										
											2013-07-27 19:57:45 +00:00
+									}
 								};
-												dbms: added aggregate functions quantileTimingWeighted, quantilesTimingWeighted, medianTimingWeighted [#METR-15181].

											
										
										
											2015-02-27 17:38:21 +00:00
+								/** То же самое, но с двумя аргументами. Второй аргумент - "вес" (целое число) - сколько раз учитывать значение.
 								  */
 								template <typename ArgumentFieldType, typename WeightFieldType>
-												dbms: better [#METR-2944].

											
										
										
											2015-11-21 18:56:54 +00:00
+								class AggregateFunctionQuantileTimingWeighted final
 									: public IBinaryAggregateFunction<QuantileTiming, AggregateFunctionQuantileTimingWeighted<ArgumentFieldType, WeightFieldType>>
-												dbms: added aggregate functions quantileTimingWeighted, quantilesTimingWeighted, medianTimingWeighted [#METR-15181].

											
										
										
											2015-02-27 17:38:21 +00:00
+								{
 								private:
 									double level;
 								public:
 									AggregateFunctionQuantileTimingWeighted(double level_ = 0.5) : level(level_) {}
-												dbms: better [#METR-2944].

											
										
										
											2015-11-11 02:04:23 +00:00
+									String getName() const override { return "quantileTimingWeighted"; }
-												dbms: added aggregate functions quantileTimingWeighted, quantilesTimingWeighted, medianTimingWeighted [#METR-15181].

											
										
										
											2015-02-27 17:38:21 +00:00
-												dbms: better [#METR-2944].

											
										
										
											2015-11-11 02:04:23 +00:00
+									DataTypePtr getReturnType() const override
-												dbms: added aggregate functions quantileTimingWeighted, quantilesTimingWeighted, medianTimingWeighted [#METR-15181].

											
										
										
											2015-02-27 17:38:21 +00:00
+									{
 										return new DataTypeFloat32;
 									}
-												dbms: better [#METR-2944].

											
										
										
											2015-11-21 18:56:54 +00:00
+									void setArgumentsImpl(const DataTypes & arguments)
-												dbms: added aggregate functions quantileTimingWeighted, quantilesTimingWeighted, medianTimingWeighted [#METR-15181].

											
										
										
											2015-02-27 17:38:21 +00:00
+									{
 									}
-												dbms: better [#METR-2944].

											
										
										
											2015-11-11 02:04:23 +00:00
+									void setParameters(const Array & params) override
-												dbms: added aggregate functions quantileTimingWeighted, quantilesTimingWeighted, medianTimingWeighted [#METR-15181].

											
										
										
											2015-02-27 17:38:21 +00:00
+									{
 										if (params.size() != 1)
 											throw Exception("Aggregate function " + getName() + " requires exactly one parameter.", ErrorCodes::NUMBER_OF_ARGUMENTS_DOESNT_MATCH);
 										level = apply_visitor(FieldVisitorConvertToNumber<Float64>(), params[0]);
 									}
-												dbms: better [#METR-2944].

											
										
										
											2015-11-21 18:56:54 +00:00
+									void addImpl(AggregateDataPtr place, const IColumn & column_value, const IColumn & column_weight, size_t row_num) const
-												dbms: added aggregate functions quantileTimingWeighted, quantilesTimingWeighted, medianTimingWeighted [#METR-15181].

											
										
										
											2015-02-27 17:38:21 +00:00
+									{
 										this->data(place).insertWeighted(
-												dbms: better [#METR-2944].

											
										
										
											2015-11-21 18:56:54 +00:00
+											static_cast<const ColumnVector<ArgumentFieldType> &>(column_value).getData()[row_num],
 											static_cast<const ColumnVector<WeightFieldType> &>(column_weight).getData()[row_num]);
-												dbms: added aggregate functions quantileTimingWeighted, quantilesTimingWeighted, medianTimingWeighted [#METR-15181].

											
										
										
											2015-02-27 17:38:21 +00:00
+									}
-												dbms: better [#METR-2944].

											
										
										
											2015-11-11 02:04:23 +00:00
+									void merge(AggregateDataPtr place, ConstAggregateDataPtr rhs) const override
-												dbms: added aggregate functions quantileTimingWeighted, quantilesTimingWeighted, medianTimingWeighted [#METR-15181].

											
										
										
											2015-02-27 17:38:21 +00:00
+									{
 										this->data(place).merge(this->data(rhs));
 									}
-												dbms: better [#METR-2944].

											
										
										
											2015-11-11 02:04:23 +00:00
+									void serialize(ConstAggregateDataPtr place, WriteBuffer & buf) const override
-												dbms: added aggregate functions quantileTimingWeighted, quantilesTimingWeighted, medianTimingWeighted [#METR-15181].

											
										
										
											2015-02-27 17:38:21 +00:00
+									{
 										this->data(place).serialize(buf);
 									}
-												dbms: better [#METR-2944].

											
										
										
											2015-11-11 02:04:23 +00:00
+									void deserializeMerge(AggregateDataPtr place, ReadBuffer & buf) const override
-												dbms: added aggregate functions quantileTimingWeighted, quantilesTimingWeighted, medianTimingWeighted [#METR-15181].

											
										
										
											2015-02-27 17:38:21 +00:00
+									{
 										this->data(place).deserializeMerge(buf);
 									}
-												dbms: better [#METR-2944].

											
										
										
											2015-11-11 02:04:23 +00:00
+									void insertResultInto(ConstAggregateDataPtr place, IColumn & to) const override
-												dbms: added aggregate functions quantileTimingWeighted, quantilesTimingWeighted, medianTimingWeighted [#METR-15181].

											
										
										
											2015-02-27 17:38:21 +00:00
+									{
 										static_cast<ColumnFloat32 &>(to).getData().push_back(this->data(place).getFloat(level));
 									}
 								};
-												dbms: added aggregate functions quantileTiming, quantilesTiming [#CONV-8223].



											
										
										
											2013-07-27 19:57:45 +00:00
+								/** То же самое, но позволяет вычислить сразу несколько квантилей.
 								  * Для этого, принимает в качестве параметров несколько уровней. Пример: quantilesTiming(0.5, 0.8, 0.9, 0.95)(ConnectTiming).
 								  * Возвращает массив результатов.
 								  */
 								template <typename ArgumentFieldType>
-												dbms: improved performance of function regionToName [#METR-11434].

											
										
										
											2014-06-04 01:00:09 +00:00
+								class AggregateFunctionQuantilesTiming final : public IUnaryAggregateFunction<QuantileTiming, AggregateFunctionQuantilesTiming<ArgumentFieldType> >
-												dbms: added aggregate functions quantileTiming, quantilesTiming [#CONV-8223].



											
										
										
											2013-07-27 19:57:45 +00:00
+								{
 								private:
-												dbms: quantiles: allowed parameters in non-increasing order [#METR-18778].

											
										
										
											2015-11-23 21:33:43 +00:00
+									QuantileLevels<double> levels;
-												dbms: added aggregate functions quantileTiming, quantilesTiming [#CONV-8223].



											
										
										
											2013-07-27 19:57:45 +00:00
 								public:
-												dbms: better [#METR-2944].

											
										
										
											2015-11-11 02:04:23 +00:00
+									String getName() const override { return "quantilesTiming"; }
-												dbms: added aggregate functions quantileTiming, quantilesTiming [#CONV-8223].



											
										
										
											2013-07-27 19:57:45 +00:00
-												dbms: better [#METR-2944].

											
										
										
											2015-11-11 02:04:23 +00:00
+									DataTypePtr getReturnType() const override
-												dbms: added aggregate functions quantileTiming, quantilesTiming [#CONV-8223].



											
										
										
											2013-07-27 19:57:45 +00:00
+									{
-												dbms: quantiles returning NaN for empty state [#CONV-8799].



											
										
										
											2013-09-24 19:56:33 +00:00
+										return new DataTypeArray(new DataTypeFloat32);
-												dbms: added aggregate functions quantileTiming, quantilesTiming [#CONV-8223].



											
										
										
											2013-07-27 19:57:45 +00:00
+									}
-												dbms: added aggregate function quantileExactWeighted and companions [#METR-18778].

											
										
										
											2015-11-15 08:31:08 +00:00
+									void setArgument(const DataTypePtr & argument)
-												dbms: added aggregate functions quantileTiming, quantilesTiming [#CONV-8223].



											
										
										
											2013-07-27 19:57:45 +00:00
+									{
 									}
-												dbms: better [#METR-2944].

											
										
										
											2015-11-11 02:04:23 +00:00
+									void setParameters(const Array & params) override
-												dbms: added aggregate functions quantileTiming, quantilesTiming [#CONV-8223].



											
										
										
											2013-07-27 19:57:45 +00:00
+									{
-												dbms: quantiles: allowed parameters in non-increasing order [#METR-18778].

											
										
										
											2015-11-23 21:33:43 +00:00
+										levels.set(params);
-												dbms: added aggregate functions quantileTiming, quantilesTiming [#CONV-8223].



											
										
										
											2013-07-27 19:57:45 +00:00
+									}
-												dbms: renamed functions [#METR-18778].

											
										
										
											2015-11-15 06:23:44 +00:00
+									void addImpl(AggregateDataPtr place, const IColumn & column, size_t row_num) const
-												dbms: added aggregate functions quantileTiming, quantilesTiming [#CONV-8223].



											
										
										
											2013-07-27 19:57:45 +00:00
+									{
 										this->data(place).insert(static_cast<const ColumnVector<ArgumentFieldType> &>(column).getData()[row_num]);
 									}
-												dbms: better [#METR-2944].

											
										
										
											2015-11-11 02:04:23 +00:00
+									void merge(AggregateDataPtr place, ConstAggregateDataPtr rhs) const override
-												dbms: added aggregate functions quantileTiming, quantilesTiming [#CONV-8223].



											
										
										
											2013-07-27 19:57:45 +00:00
+									{
 										this->data(place).merge(this->data(rhs));
 									}
-												dbms: better [#METR-2944].

											
										
										
											2015-11-11 02:04:23 +00:00
+									void serialize(ConstAggregateDataPtr place, WriteBuffer & buf) const override
-												dbms: added aggregate functions quantileTiming, quantilesTiming [#CONV-8223].



											
										
										
											2013-07-27 19:57:45 +00:00
+									{
 										this->data(place).serialize(buf);
 									}
-												dbms: better [#METR-2944].

											
										
										
											2015-11-11 02:04:23 +00:00
+									void deserializeMerge(AggregateDataPtr place, ReadBuffer & buf) const override
-												dbms: added aggregate functions quantileTiming, quantilesTiming [#CONV-8223].



											
										
										
											2013-07-27 19:57:45 +00:00
+									{
 										this->data(place).deserializeMerge(buf);
 									}
-												dbms: better [#METR-2944].

											
										
										
											2015-11-11 02:04:23 +00:00
+									void insertResultInto(ConstAggregateDataPtr place, IColumn & to) const override
-												dbms: added aggregate functions quantileTiming, quantilesTiming [#CONV-8223].



											
										
										
											2013-07-27 19:57:45 +00:00
+									{
 										ColumnArray & arr_to = static_cast<ColumnArray &>(to);
 										ColumnArray::Offsets_t & offsets_to = arr_to.getOffsets();
 										size_t size = levels.size();
 										offsets_to.push_back((offsets_to.size() == 0 ? 0 : offsets_to.back()) + size);
-												dbms: fix quantilesTiming for levels specified in non-increasing order [#METR-14503]

											
										
										
											2015-08-20 16:47:02 +00:00
-												dbms: quantiles returning NaN for empty state [#CONV-8799].



											
										
										
											2013-09-24 19:56:33 +00:00
+										typename ColumnFloat32::Container_t & data_to = static_cast<ColumnFloat32 &>(arr_to.getData()).getData();
-												dbms: added aggregate functions quantileTiming, quantilesTiming [#CONV-8223].



											
										
										
											2013-07-27 19:57:45 +00:00
+										size_t old_size = data_to.size();
 										data_to.resize(data_to.size() + size);
-												dbms: fix quantilesTiming for levels specified in non-increasing order [#METR-14503]

											
										
										
											2015-08-20 16:47:02 +00:00
-												dbms: quantiles: allowed parameters in non-increasing order [#METR-18778].

											
										
										
											2015-11-23 21:33:43 +00:00
+										this->data(place).getManyFloat(&levels.levels[0], &levels.permutation[0], size, &data_to[old_size]);
-												dbms: added aggregate functions quantileTiming, quantilesTiming [#CONV-8223].



											
										
										
											2013-07-27 19:57:45 +00:00
+									}
 								};
-												dbms: added aggregate functions quantileTimingWeighted, quantilesTimingWeighted, medianTimingWeighted [#METR-15181].

											
										
										
											2015-02-27 17:38:21 +00:00
 								template <typename ArgumentFieldType, typename WeightFieldType>
-												dbms: improved performance of quantile and quantileDeterministic aggregate functions [#METR-18778].

											
										
										
											2015-11-15 05:52:41 +00:00
+								class AggregateFunctionQuantilesTimingWeighted final
 									: public IBinaryAggregateFunction<QuantileTiming, AggregateFunctionQuantilesTimingWeighted<ArgumentFieldType, WeightFieldType>>
-												dbms: added aggregate functions quantileTimingWeighted, quantilesTimingWeighted, medianTimingWeighted [#METR-15181].

											
										
										
											2015-02-27 17:38:21 +00:00
+								{
 								private:
-												dbms: quantiles: allowed parameters in non-increasing order [#METR-18778].

											
										
										
											2015-11-23 21:33:43 +00:00
+									QuantileLevels<double> levels;
-												dbms: added aggregate functions quantileTimingWeighted, quantilesTimingWeighted, medianTimingWeighted [#METR-15181].

											
										
										
											2015-02-27 17:38:21 +00:00
 								public:
-												dbms: better [#METR-2944].

											
										
										
											2015-11-11 02:04:23 +00:00
+									String getName() const override { return "quantilesTimingWeighted"; }
-												dbms: added aggregate functions quantileTimingWeighted, quantilesTimingWeighted, medianTimingWeighted [#METR-15181].

											
										
										
											2015-02-27 17:38:21 +00:00
-												dbms: better [#METR-2944].

											
										
										
											2015-11-11 02:04:23 +00:00
+									DataTypePtr getReturnType() const override
-												dbms: added aggregate functions quantileTimingWeighted, quantilesTimingWeighted, medianTimingWeighted [#METR-15181].

											
										
										
											2015-02-27 17:38:21 +00:00
+									{
 										return new DataTypeArray(new DataTypeFloat32);
 									}
-												dbms: improved performance of quantile and quantileDeterministic aggregate functions [#METR-18778].

											
										
										
											2015-11-15 05:52:41 +00:00
+									void setArgumentsImpl(const DataTypes & arguments)
-												dbms: added aggregate functions quantileTimingWeighted, quantilesTimingWeighted, medianTimingWeighted [#METR-15181].

											
										
										
											2015-02-27 17:38:21 +00:00
+									{
 									}
-												dbms: better [#METR-2944].

											
										
										
											2015-11-11 02:04:23 +00:00
+									void setParameters(const Array & params) override
-												dbms: added aggregate functions quantileTimingWeighted, quantilesTimingWeighted, medianTimingWeighted [#METR-15181].

											
										
										
											2015-02-27 17:38:21 +00:00
+									{
-												dbms: quantiles: allowed parameters in non-increasing order [#METR-18778].

											
										
										
											2015-11-23 21:33:43 +00:00
+										levels.set(params);
-												dbms: added aggregate functions quantileTimingWeighted, quantilesTimingWeighted, medianTimingWeighted [#METR-15181].

											
										
										
											2015-02-27 17:38:21 +00:00
+									}
-												dbms: renamed functions [#METR-18778].

											
										
										
											2015-11-15 06:23:44 +00:00
+									void addImpl(AggregateDataPtr place, const IColumn & column_value, const IColumn & column_weight, size_t row_num) const
-												dbms: added aggregate functions quantileTimingWeighted, quantilesTimingWeighted, medianTimingWeighted [#METR-15181].

											
										
										
											2015-02-27 17:38:21 +00:00
+									{
 										this->data(place).insertWeighted(
-												dbms: improved performance of quantile and quantileDeterministic aggregate functions [#METR-18778].

											
										
										
											2015-11-15 05:52:41 +00:00
+											static_cast<const ColumnVector<ArgumentFieldType> &>(column_value).getData()[row_num],
 											static_cast<const ColumnVector<WeightFieldType> &>(column_weight).getData()[row_num]);
-												dbms: added aggregate functions quantileTimingWeighted, quantilesTimingWeighted, medianTimingWeighted [#METR-15181].

											
										
										
											2015-02-27 17:38:21 +00:00
+									}
-												dbms: better [#METR-2944].

											
										
										
											2015-11-11 02:04:23 +00:00
+									void merge(AggregateDataPtr place, ConstAggregateDataPtr rhs) const override
-												dbms: added aggregate functions quantileTimingWeighted, quantilesTimingWeighted, medianTimingWeighted [#METR-15181].

											
										
										
											2015-02-27 17:38:21 +00:00
+									{
 										this->data(place).merge(this->data(rhs));
 									}
-												dbms: better [#METR-2944].

											
										
										
											2015-11-11 02:04:23 +00:00
+									void serialize(ConstAggregateDataPtr place, WriteBuffer & buf) const override
-												dbms: added aggregate functions quantileTimingWeighted, quantilesTimingWeighted, medianTimingWeighted [#METR-15181].

											
										
										
											2015-02-27 17:38:21 +00:00
+									{
 										this->data(place).serialize(buf);
 									}
-												dbms: better [#METR-2944].

											
										
										
											2015-11-11 02:04:23 +00:00
+									void deserializeMerge(AggregateDataPtr place, ReadBuffer & buf) const override
-												dbms: added aggregate functions quantileTimingWeighted, quantilesTimingWeighted, medianTimingWeighted [#METR-15181].

											
										
										
											2015-02-27 17:38:21 +00:00
+									{
 										this->data(place).deserializeMerge(buf);
 									}
-												dbms: better [#METR-2944].

											
										
										
											2015-11-11 02:04:23 +00:00
+									void insertResultInto(ConstAggregateDataPtr place, IColumn & to) const override
-												dbms: added aggregate functions quantileTimingWeighted, quantilesTimingWeighted, medianTimingWeighted [#METR-15181].

											
										
										
											2015-02-27 17:38:21 +00:00
+									{
 										ColumnArray & arr_to = static_cast<ColumnArray &>(to);
 										ColumnArray::Offsets_t & offsets_to = arr_to.getOffsets();
 										size_t size = levels.size();
 										offsets_to.push_back((offsets_to.size() == 0 ? 0 : offsets_to.back()) + size);
 										typename ColumnFloat32::Container_t & data_to = static_cast<ColumnFloat32 &>(arr_to.getData()).getData();
 										size_t old_size = data_to.size();
 										data_to.resize(data_to.size() + size);
-												dbms: quantiles: allowed parameters in non-increasing order [#METR-18778].

											
										
										
											2015-11-23 21:33:43 +00:00
+										this->data(place).getManyFloat(&levels.levels[0], &levels.permutation[0], size, &data_to[old_size]);
-												dbms: added aggregate functions quantileTimingWeighted, quantilesTimingWeighted, medianTimingWeighted [#METR-15181].

											
										
										
											2015-02-27 17:38:21 +00:00
+									}
 								};
-												dbms: added aggregate functions quantileTiming, quantilesTiming [#CONV-8223].



											
										
										
											2013-07-27 19:57:45 +00:00
+								}