ClickHouse/dbms/src/Storages/MergeTree/MergeTreeDataSelectExecutor.cpp

#include <boost/rational.hpp>	/// Для вычислений, связанных с коэффициентами сэмплирования.

#include <DB/Core/FieldVisitors.h>
#include <DB/Storages/MergeTree/MergeTreeDataSelectExecutor.h>
#include <DB/Storages/MergeTree/MergeTreeBlockInputStream.h>
#include <DB/Storages/MergeTree/MergeTreeReadPool.h>
#include <DB/Storages/MergeTree/MergeTreeThreadBlockInputStream.h>
#include <DB/Parsers/ASTIdentifier.h>
#include <DB/Parsers/ASTSampleRatio.h>
#include <DB/DataStreams/ExpressionBlockInputStream.h>
#include <DB/DataStreams/FilterBlockInputStream.h>
#include <DB/DataStreams/CollapsingFinalBlockInputStream.h>
#include <DB/DataStreams/AddingConstColumnBlockInputStream.h>
#include <DB/DataStreams/CreatingSetsBlockInputStream.h>
#include <DB/DataStreams/NullBlockInputStream.h>
#include <DB/DataStreams/SummingSortedBlockInputStream.h>
#include <DB/DataStreams/AggregatingSortedBlockInputStream.h>
#include <DB/DataTypes/DataTypesNumberFixed.h>
#include <DB/DataTypes/DataTypeDate.h>
#include <DB/Common/VirtualColumnUtils.h>


namespace DB
{

namespace ErrorCodes
{
	extern const int INDEX_NOT_USED;
	extern const int SAMPLING_NOT_SUPPORTED;
}


MergeTreeDataSelectExecutor::MergeTreeDataSelectExecutor(MergeTreeData & data_)
	: data(data_), log(&Logger::get(data.getLogName() + " (SelectExecutor)"))
{
}


/// Построить блок состоящий только из возможных значений виртуальных столбцов
static Block getBlockWithPartColumn(const MergeTreeData::DataPartsVector & parts)
{
	Block res;
	ColumnWithTypeAndName _part(new ColumnString, new DataTypeString, "_part");

	for (const auto & part : parts)
		_part.column->insert(part->name);

	res.insert(_part);
	return res;
}


size_t MergeTreeDataSelectExecutor::getApproximateTotalRowsToRead(
	const MergeTreeData::DataPartsVector & parts, const PKCondition & key_condition, const Settings & settings) const
{
	size_t full_marks_count = 0;

	/// Узнаем, сколько строк мы бы прочли без семплирования.
	LOG_DEBUG(log, "Preliminary index scan with condition: " << key_condition.toString());

	for (size_t i = 0; i < parts.size(); ++i)
	{
		const MergeTreeData::DataPartPtr & part = parts[i];
		MarkRanges ranges = markRangesFromPKRange(part->index, key_condition, settings);

		/** Для того, чтобы получить оценку снизу количества строк, подходящих под условие на PK,
		  *  учитываем только гарантированно полные засечки.
		  * То есть, не учитываем первую и последнюю засечку, которые могут быть неполными.
		  */
		for (size_t j = 0; j < ranges.size(); ++j)
			if (ranges[j].end - ranges[j].begin > 2)
				full_marks_count += ranges[j].end - ranges[j].begin - 2;
	}

	return full_marks_count * data.index_granularity;
}


using RelativeSize = boost::rational<ASTSampleRatio::BigNum>;

static std::ostream & operator<<(std::ostream & ostr, const RelativeSize & x)
{
	ostr << ASTSampleRatio::toString(x.numerator()) << "/" << ASTSampleRatio::toString(x.denominator());
	return ostr;
}


/// Переводит размер сэмпла в приблизительном количестве строк (вида SAMPLE 1000000) в относительную величину (вида SAMPLE 0.1).
static RelativeSize convertAbsoluteSampleSizeToRelative(const ASTPtr & node, size_t approx_total_rows)
{
	if (approx_total_rows == 0)
		return 1;

	const ASTSampleRatio & node_sample = typeid_cast<const ASTSampleRatio &>(*node);

	auto absolute_sample_size = node_sample.ratio.numerator / node_sample.ratio.denominator;
	return std::min(RelativeSize(1), RelativeSize(absolute_sample_size) / approx_total_rows);
}


BlockInputStreams MergeTreeDataSelectExecutor::read(
	const Names & column_names_to_return,
	ASTPtr query,
	const Context & context,
	const Settings & settings,
	QueryProcessingStage::Enum & processed_stage,
	const size_t max_block_size,
	const unsigned threads,
	size_t * inout_part_index,
	Int64 max_block_number_to_read) const
{
	size_t part_index_var = 0;
	if (!inout_part_index)
		inout_part_index = &part_index_var;

	MergeTreeData::DataPartsVector parts = data.getDataPartsVector();

	/// Если в запросе есть ограничения на виртуальный столбец _part или _part_index, выберем только подходящие под него куски.
	/// В запросе может быть запрошен виртуальный столбец _sample_factor - 1 / использованный коэффициент сэмплирования.
	Names virt_column_names;
	Names real_column_names;

	bool part_column_queried = false;

	bool sample_factor_column_queried = false;
	Float64 used_sample_factor = 1;

	for (const String & name : column_names_to_return)
	{
		if (name == "_part")
		{
			part_column_queried = true;
			virt_column_names.push_back(name);
		}
		else if (name == "_part_index")
		{
			virt_column_names.push_back(name);
		}
		else if (name == "_sample_factor")
		{
			sample_factor_column_queried = true;
			virt_column_names.push_back(name);
		}
		else
		{
			real_column_names.push_back(name);
		}
	}

	NamesAndTypesList available_real_columns = data.getColumnsList();

	NamesAndTypesList available_real_and_virtual_columns = available_real_columns;
	for (const auto & name : virt_column_names)
		available_real_and_virtual_columns.emplace_back(data.getColumn(name));

	/// Если в запросе только виртуальные столбцы, надо запросить хотя бы один любой другой.
	if (real_column_names.empty())
		real_column_names.push_back(ExpressionActions::getSmallestColumn(available_real_columns));

	/// Если запрошен виртуальный столбец _part, пробуем использовать его в качестве индекса.
	Block virtual_columns_block = getBlockWithPartColumn(parts);
	if (part_column_queried)
		VirtualColumnUtils::filterBlockWithQuery(query, virtual_columns_block, context);

	std::multiset<String> part_values = VirtualColumnUtils::extractSingleValueFromBlock<String>(virtual_columns_block, "_part");

	data.check(real_column_names);
	processed_stage = QueryProcessingStage::FetchColumns;

	PKCondition key_condition(query, context, available_real_and_virtual_columns, data.getSortDescription());
	PKCondition date_condition(query, context, available_real_and_virtual_columns, SortDescription(1, SortColumnDescription(data.date_column_name, 1)));

	if (settings.force_primary_key && key_condition.alwaysUnknownOrTrue())
		throw Exception("Primary key is not used and setting 'force_primary_key' is set.", ErrorCodes::INDEX_NOT_USED);

	if (settings.force_index_by_date && date_condition.alwaysUnknownOrTrue())
		throw Exception("Index by date is not used and setting 'force_index_by_date' is set.", ErrorCodes::INDEX_NOT_USED);

	/// Выберем куски, в которых могут быть данные, удовлетворяющие date_condition, и которые подходят под условие на _part,
	///  а также max_block_number_to_read.
	{
		const DataTypes data_types_date { new DataTypeDate };

		auto prev_parts = parts;
		parts.clear();

		for (const auto & part : prev_parts)
		{
			if (part_values.find(part->name) == part_values.end())
				continue;

			Field left = static_cast<UInt64>(part->left_date);
			Field right = static_cast<UInt64>(part->right_date);

			if (!date_condition.mayBeTrueInRange(&left, &right, data_types_date))
				continue;

			if (max_block_number_to_read && part->right > max_block_number_to_read)
				continue;

			parts.push_back(part);
		}
	}

	/// Семплирование.
	Names column_names_to_read = real_column_names;
	typedef Poco::SharedPtr<ASTFunction> ASTFunctionPtr;
	ASTFunctionPtr filter_function;
	ExpressionActionsPtr filter_expression;

	RelativeSize relative_sample_size = 0;
	RelativeSize relative_sample_offset = 0;

	ASTSelectQuery & select = *typeid_cast<ASTSelectQuery*>(&*query);

	if (select.sample_size)
	{
		relative_sample_size.assign(
			typeid_cast<const ASTSampleRatio &>(*select.sample_size).ratio.numerator,
			typeid_cast<const ASTSampleRatio &>(*select.sample_size).ratio.denominator);

		if (relative_sample_size < 0)
			throw Exception("Negative sample size", ErrorCodes::ARGUMENT_OUT_OF_BOUND);

		relative_sample_offset = 0;
		if (select.sample_offset)
			relative_sample_offset.assign(
				typeid_cast<const ASTSampleRatio &>(*select.sample_offset).ratio.numerator,
				typeid_cast<const ASTSampleRatio &>(*select.sample_offset).ratio.denominator);

		if (relative_sample_offset < 0)
			throw Exception("Negative sample offset", ErrorCodes::ARGUMENT_OUT_OF_BOUND);

		/// Переводим абсолютную величину сэмплирования (вида SAMPLE 1000000 - сколько строк прочитать) в относительную (какую долю данных читать).
		size_t approx_total_rows = 0;
		if (relative_sample_size > 1 || relative_sample_offset > 1)
			approx_total_rows = getApproximateTotalRowsToRead(parts, key_condition, settings);

		if (relative_sample_size > 1)
		{
			relative_sample_size = convertAbsoluteSampleSizeToRelative(select.sample_size, approx_total_rows);
			LOG_DEBUG(log, "Selected relative sample size: " << relative_sample_size);
		}

		/// SAMPLE 1 - то же, что и отсутствие SAMPLE.
		if (relative_sample_size == 1)
			relative_sample_size = 0;

		if (relative_sample_offset > 0 && 0 == relative_sample_size)
			throw Exception("Sampling offset is incorrect because no sampling", ErrorCodes::ARGUMENT_OUT_OF_BOUND);

		if (relative_sample_offset > 1)
		{
			relative_sample_offset = convertAbsoluteSampleSizeToRelative(select.sample_offset, approx_total_rows);
			LOG_DEBUG(log, "Selected relative sample offset: " << relative_sample_offset);
		}
	}

	/** Какой диапазон значений ключа сэмплирования нужно читать?
	  * Сначала во всём диапазоне ("юнивёрсум") выбераем интервал
	  *  относительного размера relative_sample_size, смещённый от начала на relative_sample_offset.
	  *
	  * Пример: SAMPLE 0.4 OFFSET 0.3:
	  *
	  * [------********------]
	  *        ^ - offset
	  *        <------> - size
	  *
	  * Если интервал переходит через конец юнивёрсума, то срезаем его правую часть.
	  *
	  * Пример: SAMPLE 0.4 OFFSET 0.8:
	  *
	  * [----------------****]
	  *                  ^ - offset
	  *                  <------> - size
	  *
	  * Далее, если выставлены настройки parallel_replicas_count, parallel_replica_offset,
	  *  то необходимо разбить полученный интервал ещё на кусочки в количестве parallel_replicas_count,
	  *  и выбрать из них кусочек с номером parallel_replica_offset (от нуля).
	  *
	  * Пример: SAMPLE 0.4 OFFSET 0.3, parallel_replicas_count = 2, parallel_replica_offset = 1:
	  *
	  * [----------****------]
	  *        ^ - offset
	  *        <------> - size
	  *        <--><--> - кусочки для разных parallel_replica_offset, выбираем второй.
	  *
	  * Очень важно, чтобы интервалы для разных parallel_replica_offset покрывали весь диапазон без пропусков и перекрытий.
	  * Также важно, чтобы весь юнивёрсум можно было покрыть, используя SAMPLE 0.1 OFFSET 0, ... OFFSET 0.9 и похожие десятичные дроби.
	  */

	bool use_sampling = relative_sample_size > 0 || settings.parallel_replicas_count > 1;
	bool no_data = false;	/// После сэмплирования ничего не остаётся.

	if (use_sampling)
	{
		if (!data.sampling_expression)
			throw Exception("Illegal SAMPLE: table doesn't support sampling", ErrorCodes::SAMPLING_NOT_SUPPORTED);

		if (sample_factor_column_queried && relative_sample_size != 0)
			used_sample_factor = 1.0 / boost::rational_cast<Float64>(relative_sample_size);

		RelativeSize size_of_universum = 0;
		DataTypePtr type = data.getPrimaryExpression()->getSampleBlock().getByName(data.sampling_expression->getColumnName()).type;

		if (typeid_cast<const DataTypeUInt64 *>(type.get()))
			size_of_universum = RelativeSize(std::numeric_limits<UInt64>::max()) + 1;
		else if (typeid_cast<const DataTypeUInt32 *>(type.get()))
			size_of_universum = RelativeSize(std::numeric_limits<UInt32>::max()) + 1;
		else if (typeid_cast<const DataTypeUInt16 *>(type.get()))
			size_of_universum = RelativeSize(std::numeric_limits<UInt16>::max()) + 1;
		else if (typeid_cast<const DataTypeUInt8 *>(type.get()))
			size_of_universum = RelativeSize(std::numeric_limits<UInt8>::max()) + 1;
		else
			throw Exception("Invalid sampling column type in storage parameters: " + type->getName() + ". Must be unsigned integer type.",
				ErrorCodes::ILLEGAL_TYPE_OF_COLUMN_FOR_FILTER);

		if (settings.parallel_replicas_count > 1)
		{
			if (relative_sample_size == 0)
				relative_sample_size = 1;

			relative_sample_size /= settings.parallel_replicas_count;
			relative_sample_offset += relative_sample_size * settings.parallel_replica_offset;
		}

		if (relative_sample_offset >= 1)
			no_data = true;

		/// Вычисляем полуинтервал [lower, upper) значений столбца.
		bool has_lower_limit = false;
		bool has_upper_limit = false;

		RelativeSize lower_limit_rational = relative_sample_offset * size_of_universum;
		RelativeSize upper_limit_rational = (relative_sample_offset + relative_sample_size) * size_of_universum;

		UInt64 lower = boost::rational_cast<ASTSampleRatio::BigNum>(lower_limit_rational);
		UInt64 upper = boost::rational_cast<ASTSampleRatio::BigNum>(upper_limit_rational);

		if (lower > 0)
			has_lower_limit = true;

		if (upper_limit_rational < size_of_universum)
			has_upper_limit = true;

		/*std::cerr << std::fixed << std::setprecision(100)
			<< "relative_sample_size: " << relative_sample_size << "\n"
			<< "relative_sample_offset: " << relative_sample_offset << "\n"
			<< "lower_limit_float: " << lower_limit_rational << "\n"
			<< "upper_limit_float: " << upper_limit_rational << "\n"
			<< "lower: " << lower << "\n"
			<< "upper: " << upper << "\n";*/

		if ((has_upper_limit && upper == 0)
			|| (has_lower_limit && has_upper_limit && lower == upper))
			no_data = true;

		if (no_data || (!has_lower_limit && !has_upper_limit))
		{
			use_sampling = false;
		}
		else
		{
			/// Добавим условия, чтобы отсечь еще что-нибудь при повторном просмотре индекса и при обработке запроса.

			ASTFunctionPtr lower_function;
			ASTFunctionPtr upper_function;

			if (has_lower_limit)
			{
				if (!key_condition.addCondition(data.sampling_expression->getColumnName(), Range::createLeftBounded(lower, true)))
					throw Exception("Sampling column not in primary key", ErrorCodes::ILLEGAL_COLUMN);

				ASTPtr args = new ASTExpressionList;
				args->children.push_back(data.sampling_expression);
				args->children.push_back(new ASTLiteral(StringRange(), lower));

				lower_function = new ASTFunction;
				lower_function->name = "greaterOrEquals";
				lower_function->arguments = args;
				lower_function->children.push_back(lower_function->arguments);

				filter_function = lower_function;
			}

			if (has_upper_limit)
			{
				if (!key_condition.addCondition(data.sampling_expression->getColumnName(), Range::createRightBounded(upper, false)))
					throw Exception("Sampling column not in primary key", ErrorCodes::ILLEGAL_COLUMN);

				ASTPtr args = new ASTExpressionList;
				args->children.push_back(data.sampling_expression);
				args->children.push_back(new ASTLiteral(StringRange(), upper));

				upper_function = new ASTFunction;
				upper_function->name = "less";
				upper_function->arguments = args;
				upper_function->children.push_back(upper_function->arguments);

				filter_function = upper_function;
			}

			if (has_lower_limit && has_upper_limit)
			{
				ASTPtr args = new ASTExpressionList;
				args->children.push_back(lower_function);
				args->children.push_back(upper_function);

				filter_function = new ASTFunction;
				filter_function->name = "and";
				filter_function->arguments = args;
				filter_function->children.push_back(filter_function->arguments);
			}

			filter_expression = ExpressionAnalyzer(filter_function, context, nullptr, available_real_columns).getActions(false);

			/// Добавим столбцы, нужные для sampling_expression.
			std::vector<String> add_columns = filter_expression->getRequiredColumns();
			column_names_to_read.insert(column_names_to_read.end(), add_columns.begin(), add_columns.end());
			std::sort(column_names_to_read.begin(), column_names_to_read.end());
			column_names_to_read.erase(std::unique(column_names_to_read.begin(), column_names_to_read.end()), column_names_to_read.end());
		}
	}

	if (no_data)
	{
		LOG_DEBUG(log, "Sampling yields no data.");
		return {};
	}

	LOG_DEBUG(log, "Key condition: " << key_condition.toString());
	LOG_DEBUG(log, "Date condition: " << date_condition.toString());

	/// PREWHERE
	ExpressionActionsPtr prewhere_actions;
	String prewhere_column;
	if (select.prewhere_expression)
	{
		ExpressionAnalyzer analyzer(select.prewhere_expression, context, nullptr, available_real_columns);
		prewhere_actions = analyzer.getActions(false);
		prewhere_column = select.prewhere_expression->getColumnName();
		SubqueriesForSets prewhere_subqueries = analyzer.getSubqueriesForSets();

		/** Вычислим подзапросы прямо сейчас.
		  * NOTE Недостаток - эти вычисления не вписываются в конвейер выполнения запроса.
		  * Они делаются до начала выполнения конвейера; их нельзя прервать; во время вычислений не отправляются пакеты прогресса.
		  */
		if (!prewhere_subqueries.empty())
			CreatingSetsBlockInputStream(new NullBlockInputStream, prewhere_subqueries, settings.limits).read();
	}

	RangesInDataParts parts_with_ranges;

	/// Найдем, какой диапазон читать из каждого куска.
	size_t sum_marks = 0;
	size_t sum_ranges = 0;
	for (auto & part : parts)
	{
		RangesInDataPart ranges(part, (*inout_part_index)++);

		if (data.mode != MergeTreeData::Unsorted)
			ranges.ranges = markRangesFromPKRange(part->index, key_condition, settings);
		else
			ranges.ranges = MarkRanges{MarkRange{0, part->size}};

		if (!ranges.ranges.empty())
		{
			parts_with_ranges.push_back(ranges);

			sum_ranges += ranges.ranges.size();
			for (const auto & range : ranges.ranges)
				sum_marks += range.end - range.begin;
		}
	}

	LOG_DEBUG(log, "Selected " << parts.size() << " parts by date, " << parts_with_ranges.size() << " parts by key, "
		<< sum_marks << " marks to read from " << sum_ranges << " ranges");

	if (parts_with_ranges.empty())
		return {};

	BlockInputStreams res;

	if (select.final)
	{
		/// Добавим столбцы, нужные для вычисления первичного ключа и знака.
		std::vector<String> add_columns = data.getPrimaryExpression()->getRequiredColumns();
		column_names_to_read.insert(column_names_to_read.end(), add_columns.begin(), add_columns.end());

		if (!data.sign_column.empty())
			column_names_to_read.push_back(data.sign_column);

		std::sort(column_names_to_read.begin(), column_names_to_read.end());
		column_names_to_read.erase(std::unique(column_names_to_read.begin(), column_names_to_read.end()), column_names_to_read.end());

		res = spreadMarkRangesAmongThreadsFinal(
			parts_with_ranges,
			threads,
			column_names_to_read,
			max_block_size,
			settings.use_uncompressed_cache,
			prewhere_actions,
			prewhere_column,
			virt_column_names,
			settings,
			context);
	}
	else
	{
		res = spreadMarkRangesAmongThreads(
			parts_with_ranges,
			threads,
			column_names_to_read,
			max_block_size,
			settings.use_uncompressed_cache,
			prewhere_actions,
			prewhere_column,
			virt_column_names,
			settings);
	}

	if (use_sampling)
		for (auto & stream : res)
			stream = new FilterBlockInputStream(stream, filter_expression, filter_function->getColumnName());

	/// Кстати, если делается распределённый запрос или запрос к Merge-таблице, то в столбце _sample_factor могут быть разные значения.
	if (sample_factor_column_queried)
		for (auto & stream : res)
			stream = new AddingConstColumnBlockInputStream<Float64>(
				stream, new DataTypeFloat64, used_sample_factor, "_sample_factor");

	return res;
}


BlockInputStreams MergeTreeDataSelectExecutor::spreadMarkRangesAmongThreads(
	RangesInDataParts parts,
	size_t threads,
	const Names & column_names,
	size_t max_block_size,
	bool use_uncompressed_cache,
	ExpressionActionsPtr prewhere_actions,
	const String & prewhere_column,
	const Names & virt_columns,
	const Settings & settings) const
{
	const std::size_t min_marks_for_concurrent_read =
		(settings.merge_tree_min_rows_for_concurrent_read + data.index_granularity - 1) / data.index_granularity;
	const std::size_t max_marks_to_use_cache =
		(settings.merge_tree_max_rows_to_use_cache + data.index_granularity - 1) / data.index_granularity;

	/// Посчитаем засечки для каждого куска.
	std::vector<size_t> sum_marks_in_parts(parts.size());
	size_t sum_marks = 0;
	for (size_t i = 0; i < parts.size(); ++i)
	{
		/// Пусть отрезки будут перечислены справа налево, чтобы можно было выбрасывать самый левый отрезок с помощью pop_back().
		std::reverse(parts[i].ranges.begin(), parts[i].ranges.end());

		for (const auto & range : parts[i].ranges)
			sum_marks_in_parts[i] += range.end - range.begin;

		sum_marks += sum_marks_in_parts[i];
	}

	if (sum_marks > max_marks_to_use_cache)
		use_uncompressed_cache = false;

	BlockInputStreams res;

	if (sum_marks > 0 && settings.merge_tree_uniform_read_distribution == 1)
	{
		/// Уменьшим количество потоков, если данных мало.
		if (sum_marks < threads * min_marks_for_concurrent_read && parts.size() < threads)
			threads = std::max((sum_marks + min_marks_for_concurrent_read - 1) / min_marks_for_concurrent_read, parts.size());

		MergeTreeReadPoolPtr pool = std::make_shared<MergeTreeReadPool>(
			threads, sum_marks, min_marks_for_concurrent_read, parts, data, prewhere_actions, prewhere_column, true,
			column_names, MergeTreeReadPool::BackoffSettings(settings));

		/// Оценим общее количество строк - для прогресс-бара.
		const std::size_t total_rows = data.index_granularity * sum_marks;
		LOG_TRACE(log, "Reading approx. " << total_rows << " rows");

		for (std::size_t i = 0; i < threads; ++i)
		{
			res.emplace_back(new MergeTreeThreadBlockInputStream{
				i, pool, min_marks_for_concurrent_read, max_block_size, data, use_uncompressed_cache,
				prewhere_actions,
				prewhere_column, settings, virt_columns
			});

			if (i == 0)
			{
				/// Выставим приблизительное количество строк только для первого источника
				static_cast<IProfilingBlockInputStream &>(*res.front()).setTotalRowsApprox(total_rows);
			}
		}
	}
	else if (sum_marks > 0)
	{
		const size_t min_marks_per_thread = (sum_marks - 1) / threads + 1;

		for (size_t i = 0; i < threads && !parts.empty(); ++i)
		{
			size_t need_marks = min_marks_per_thread;

			/// Цикл по кускам.
			while (need_marks > 0 && !parts.empty())
			{
				RangesInDataPart & part = parts.back();
				size_t & marks_in_part = sum_marks_in_parts.back();

				/// Не будем брать из куска слишком мало строк.
				if (marks_in_part >= min_marks_for_concurrent_read &&
					need_marks < min_marks_for_concurrent_read)
					need_marks = min_marks_for_concurrent_read;

				/// Не будем оставлять в куске слишком мало строк.
				if (marks_in_part > need_marks &&
					marks_in_part - need_marks < min_marks_for_concurrent_read)
					need_marks = marks_in_part;

				MarkRanges ranges_to_get_from_part;

				/// Возьмем весь кусок, если он достаточно мал.
				if (marks_in_part <= need_marks)
				{
					/// Восстановим порядок отрезков.
					std::reverse(part.ranges.begin(), part.ranges.end());

					ranges_to_get_from_part = part.ranges;

					need_marks -= marks_in_part;
					parts.pop_back();
					sum_marks_in_parts.pop_back();
				}
				else
				{
					/// Цикл по отрезкам куска.
					while (need_marks > 0)
					{
						if (part.ranges.empty())
							throw Exception("Unexpected end of ranges while spreading marks among threads", ErrorCodes::LOGICAL_ERROR);

						MarkRange & range = part.ranges.back();

						const size_t marks_in_range = range.end - range.begin;
						const size_t marks_to_get_from_range = std::min(marks_in_range, need_marks);

						ranges_to_get_from_part.emplace_back(range.begin, range.begin + marks_to_get_from_range);
						range.begin += marks_to_get_from_range;
						marks_in_part -= marks_to_get_from_range;
						need_marks -= marks_to_get_from_range;
						if (range.begin == range.end)
							part.ranges.pop_back();
					}
				}

				BlockInputStreamPtr source_stream = new MergeTreeBlockInputStream(
					data.getFullPath() + part.data_part->name + '/', max_block_size, column_names, data,
					part.data_part, ranges_to_get_from_part, use_uncompressed_cache,
					prewhere_actions, prewhere_column, true, settings.min_bytes_to_use_direct_io, settings.max_read_buffer_size, true);

				res.push_back(source_stream);

				for (const String & virt_column : virt_columns)
				{
					if (virt_column == "_part")
						res.back() = new AddingConstColumnBlockInputStream<String>(
							res.back(), new DataTypeString, part.data_part->name, "_part");
					else if (virt_column == "_part_index")
						res.back() = new AddingConstColumnBlockInputStream<UInt64>(
							res.back(), new DataTypeUInt64, part.part_index_in_query, "_part_index");
				}
			}
		}

		if (!parts.empty())
			throw Exception("Couldn't spread marks among threads", ErrorCodes::LOGICAL_ERROR);
	}

	return res;
}

BlockInputStreams MergeTreeDataSelectExecutor::spreadMarkRangesAmongThreadsFinal(
	RangesInDataParts parts,
	size_t threads,
	const Names & column_names,
	size_t max_block_size,
	bool use_uncompressed_cache,
	ExpressionActionsPtr prewhere_actions,
	const String & prewhere_column,
	const Names & virt_columns,
	const Settings & settings,
	const Context & context) const
{
	const size_t max_marks_to_use_cache =
		(settings.merge_tree_max_rows_to_use_cache + data.index_granularity - 1) / data.index_granularity;
	const size_t min_marks_for_read_task =
		(settings.merge_tree_min_rows_for_concurrent_read + data.index_granularity - 1) / data.index_granularity;

	size_t sum_marks = 0;
	for (size_t i = 0; i < parts.size(); ++i)
		for (size_t j = 0; j < parts[i].ranges.size(); ++j)
			sum_marks += parts[i].ranges[j].end - parts[i].ranges[j].begin;

	if (sum_marks > max_marks_to_use_cache)
		use_uncompressed_cache = false;

	BlockInputStreams to_merge;

	if (settings.merge_tree_uniform_read_distribution == 1)
	{
		/// Пусть отрезки будут перечислены справа налево, чтобы можно было выбрасывать самый левый отрезок с помощью pop_back().
		for (auto & part : parts)
			std::reverse(std::begin(part.ranges), std::end(part.ranges));

		MergeTreeReadPoolPtr pool = std::make_shared<MergeTreeReadPool>(
			parts.size(), sum_marks, min_marks_for_read_task, parts, data, prewhere_actions, prewhere_column, true,
			column_names, MergeTreeReadPool::BackoffSettings{}, true);

		/// Оценим общее количество строк - для прогресс-бара.
		const std::size_t total_rows = data.index_granularity * sum_marks;
		LOG_TRACE(log, "Reading approx. " << total_rows << " rows");

		for (const auto i : ext::range(0, parts.size()))
		{
			BlockInputStreamPtr source_stream{
				new MergeTreeThreadBlockInputStream{
					i, pool, min_marks_for_read_task, max_block_size, data, use_uncompressed_cache, prewhere_actions,
					prewhere_column, settings, virt_columns
				}
			};

			if (i == 0)
				/// Выставим приблизительное количество строк только для первого источника
				static_cast<IProfilingBlockInputStream &>(*source_stream).setTotalRowsApprox(total_rows);

			to_merge.push_back(new ExpressionBlockInputStream(source_stream, data.getPrimaryExpression()));
		}
	}
	else
	{
		for (size_t part_index = 0; part_index < parts.size(); ++part_index)
		{
			RangesInDataPart & part = parts[part_index];

			BlockInputStreamPtr source_stream = new MergeTreeBlockInputStream(
				data.getFullPath() + part.data_part->name + '/', max_block_size, column_names, data,
				part.data_part, part.ranges, use_uncompressed_cache,
				prewhere_actions, prewhere_column, true, settings.min_bytes_to_use_direct_io, settings.max_read_buffer_size, true);

			for (const String & virt_column : virt_columns)
			{
				if (virt_column == "_part")
					source_stream = new AddingConstColumnBlockInputStream<String>(
						source_stream, new DataTypeString, part.data_part->name, "_part");
				else if (virt_column == "_part_index")
					source_stream = new AddingConstColumnBlockInputStream<UInt64>(
						source_stream, new DataTypeUInt64, part.part_index_in_query, "_part_index");
			}

			to_merge.push_back(new ExpressionBlockInputStream(source_stream, data.getPrimaryExpression()));
		}
	}

	BlockInputStreams res;
	if (to_merge.size() == 1)
	{
		if (!data.sign_column.empty())
		{
			ExpressionActionsPtr sign_filter_expression;
			String sign_filter_column;

			createPositiveSignCondition(sign_filter_expression, sign_filter_column, context);

			res.push_back(new FilterBlockInputStream(to_merge[0], sign_filter_expression, sign_filter_column));
		}
		else
			res = to_merge;
	}
	else if (to_merge.size() > 1)
	{
		BlockInputStreamPtr merged;

		switch (data.mode)
		{
			case MergeTreeData::Ordinary:
				merged = new MergingSortedBlockInputStream(to_merge, data.getSortDescription(), max_block_size);
				break;

			case MergeTreeData::Collapsing:
				merged = new CollapsingFinalBlockInputStream(to_merge, data.getSortDescription(), data.sign_column);
				break;

			case MergeTreeData::Summing:
				merged = new SummingSortedBlockInputStream(to_merge, data.getSortDescription(), data.columns_to_sum, max_block_size);
				break;

			case MergeTreeData::Aggregating:
				merged = new AggregatingSortedBlockInputStream(to_merge, data.getSortDescription(), max_block_size);
				break;

			case MergeTreeData::Unsorted:
				throw Exception("UnsortedMergeTree doesn't support FINAL", ErrorCodes::LOGICAL_ERROR);
		}

		res.push_back(merged);
	}

	return res;
}

void MergeTreeDataSelectExecutor::createPositiveSignCondition(
	ExpressionActionsPtr & out_expression, String & out_column, const Context & context) const
{
	ASTFunction * function = new ASTFunction;
	ASTPtr function_ptr = function;

	ASTExpressionList * arguments = new ASTExpressionList;
	ASTPtr arguments_ptr = arguments;

	ASTIdentifier * sign = new ASTIdentifier;
	ASTPtr sign_ptr = sign;

	ASTLiteral * one = new ASTLiteral;
	ASTPtr one_ptr = one;

	function->name = "equals";
	function->arguments = arguments_ptr;
	function->children.push_back(arguments_ptr);

	arguments->children.push_back(sign_ptr);
	arguments->children.push_back(one_ptr);

	sign->name = data.sign_column;
	sign->kind = ASTIdentifier::Column;

	one->value = Field(static_cast<Int64>(1));

	out_expression = ExpressionAnalyzer(function_ptr, context, {}, data.getColumnsList()).getActions(false);
	out_column = function->getColumnName();
}

/// Получает набор диапазонов засечек, вне которых не могут находиться ключи из заданного диапазона.
MarkRanges MergeTreeDataSelectExecutor::markRangesFromPKRange(
	const MergeTreeData::DataPart::Index & index, const PKCondition & key_condition, const Settings & settings) const
{
	size_t min_marks_for_seek = (settings.merge_tree_min_rows_for_seek + data.index_granularity - 1) / data.index_granularity;

	MarkRanges res;

	size_t key_size = data.getSortDescription().size();
	size_t marks_count = index.at(0).get()->size();

	/// Если индекс не используется.
	if (key_condition.alwaysUnknownOrTrue())
	{
		res.push_back(MarkRange(0, marks_count));
	}
	else
	{
		/** В стеке всегда будут находиться непересекающиеся подозрительные отрезки, самый левый наверху (back).
			* На каждом шаге берем левый отрезок и проверяем, подходит ли он.
			* Если подходит, разбиваем его на более мелкие и кладем их в стек. Если нет - выбрасываем его.
			* Если отрезок уже длиной в одну засечку, добавляем его в ответ и выбрасываем.
			*/
		std::vector<MarkRange> ranges_stack;
		ranges_stack.push_back(MarkRange(0, marks_count));

		/// NOTE Лишнее копирование объектов типа Field для передачи в PKCondition.
		Row index_left(key_size);
		Row index_right(key_size);

		while (!ranges_stack.empty())
		{
			MarkRange range = ranges_stack.back();
			ranges_stack.pop_back();

			bool may_be_true;
			if (range.end == marks_count)
			{
				for (size_t i = 0; i < key_size; ++i)
				{
					index_left[i] = (*index[i].get())[range.begin];
				}

				may_be_true = key_condition.mayBeTrueAfter(&index_left[0], data.primary_key_data_types);
			}
			else
			{
				for (size_t i = 0; i < key_size; ++i)
				{
					index_left[i] = (*index[i].get())[range.begin];
					index_right[i] = (*index[i].get())[range.end];
				}

				may_be_true = key_condition.mayBeTrueInRange(&index_left[0], &index_right[0], data.primary_key_data_types);
			}

			if (!may_be_true)
				continue;

			if (range.end == range.begin + 1)
			{
				/// Увидели полезный промежуток между соседними засечками. Либо добавим его к последнему диапазону, либо начнем новый диапазон.
				if (res.empty() || range.begin - res.back().end > min_marks_for_seek)
					res.push_back(range);
				else
					res.back().end = range.end;
			}
			else
			{
				/// Разбиваем отрезок и кладем результат в стек справа налево.
				size_t step = (range.end - range.begin - 1) / settings.merge_tree_coarse_index_granularity + 1;
				size_t end;

				for (end = range.end; end > range.begin + step; end -= step)
					ranges_stack.push_back(MarkRange(end - step, end));

				ranges_stack.push_back(MarkRange(range.begin, end));
			}
		}
	}

	return res;
}

}
-												dbms: SAMPLE ... OFFSET development: using rational numbers [#METR-18847].

											
										
										
											2015-11-19 21:34:53 +00:00
+								#include <boost/rational.hpp>	/// Для вычислений, связанных с коэффициентами сэмплирования.
-												dbms: added support for different numeric types in function has [#METR-18382].

											
										
										
											2015-10-12 07:05:54 +00:00
+								#include <DB/Core/FieldVisitors.h>
-												Merge

											
										
										
											2014-03-13 12:48:07 +00:00
+								#include <DB/Storages/MergeTree/MergeTreeDataSelectExecutor.h>
-												Merge

											
										
										
											2015-04-12 04:39:20 +00:00
+								#include <DB/Storages/MergeTree/MergeTreeBlockInputStream.h>
-												Merge

											
										
										
											2015-06-24 11:03:53 +00:00
+								#include <DB/Storages/MergeTree/MergeTreeReadPool.h>
 								#include <DB/Storages/MergeTree/MergeTreeThreadBlockInputStream.h>
-												Merge

											
										
										
											2014-03-13 12:48:07 +00:00
+								#include <DB/Parsers/ASTIdentifier.h>
-												dbms: SAMPLE ... OFFSET development: using rational numbers [#METR-18847].

											
										
										
											2015-11-19 21:34:53 +00:00
+								#include <DB/Parsers/ASTSampleRatio.h>
-												Merge

											
										
										
											2014-03-13 12:48:07 +00:00
+								#include <DB/DataStreams/ExpressionBlockInputStream.h>
 								#include <DB/DataStreams/FilterBlockInputStream.h>
 								#include <DB/DataStreams/CollapsingFinalBlockInputStream.h>
-												dbms: more scalable aggregator: development [#METR-2944].

											
										
										
											2014-12-30 18:04:53 +00:00
+								#include <DB/DataStreams/AddingConstColumnBlockInputStream.h>
-												dbms: added support for subqueries in PREWHERE [#METR-15106].

											
										
										
											2015-02-15 04:16:11 +00:00
+								#include <DB/DataStreams/CreatingSetsBlockInputStream.h>
 								#include <DB/DataStreams/NullBlockInputStream.h>
-												Merge

											
										
										
											2015-07-08 04:38:46 +00:00
+								#include <DB/DataStreams/SummingSortedBlockInputStream.h>
 								#include <DB/DataStreams/AggregatingSortedBlockInputStream.h>
-												Merge

											
										
										
											2014-03-13 12:48:07 +00:00
+								#include <DB/DataTypes/DataTypesNumberFixed.h>
-												dbms: allowed to use index if column is wrapped by piecewise-monotonic functions: initial implementation [#METR-19052].

											
										
										
											2015-11-29 08:06:29 +00:00
+								#include <DB/DataTypes/DataTypeDate.h>
-												Merge

											
										
										
											2014-07-28 10:36:11 +00:00
+								#include <DB/Common/VirtualColumnUtils.h>
-												WHERE condition recognition. [#METR-11900]

											
										
										
											2014-09-17 09:59:21 +00:00
-												dbms: Server: queries with several replicas: development [#METR-14410]

											
										
										
											2015-02-03 14:37:35 +00:00
-												Merge

											
										
										
											2014-03-13 12:48:07 +00:00
+								namespace DB
 								{
-												dbms: cutting dependency [#METR-2944]..

											
										
										
											2016-01-11 21:46:36 +00:00
+								namespace ErrorCodes
 								{
 									extern const int INDEX_NOT_USED;
-												Merge

											
										
										
											2016-03-03 20:29:52 +00:00
+									extern const int SAMPLING_NOT_SUPPORTED;
-												dbms: cutting dependency [#METR-2944]..

											
										
										
											2016-01-11 21:46:36 +00:00
+								}
-												dbms: added settings to fine tune reads from merge tree [#METR-2944].

											
										
										
											2015-02-15 02:31:48 +00:00
+								MergeTreeDataSelectExecutor::MergeTreeDataSelectExecutor(MergeTreeData & data_)
 									: data(data_), log(&Logger::get(data.getLogName() + " (SelectExecutor)"))
-												Merge

											
										
										
											2014-03-13 12:48:07 +00:00
+								{
 								}
-												dbms: added support for SAMPLE ... OFFSET [#METR-18847].

											
										
										
											2015-11-18 21:37:28 +00:00
-												Merge

											
										
										
											2014-07-28 10:36:11 +00:00
+								/// Построить блок состоящий только из возможных значений виртуальных столбцов
-												Fixed error [#METR-20296].

											
										
										
											2016-03-05 03:17:11 +00:00
+								static Block getBlockWithPartColumn(const MergeTreeData::DataPartsVector & parts)
-												Merge

											
										
										
											2014-07-28 10:36:11 +00:00
+								{
 									Block res;
-												dbms: renamed ColumnWithNameAndType to ColumnWithTypeAndName for clarification [#METR-2944].

											
										
										
											2015-07-17 01:27:35 +00:00
+									ColumnWithTypeAndName _part(new ColumnString, new DataTypeString, "_part");
-												Merge

											
										
										
											2014-07-28 10:36:11 +00:00
 									for (const auto & part : parts)
 										_part.column->insert(part->name);
 									res.insert(_part);
 									return res;
 								}
-												dbms: added support for SAMPLE ... OFFSET [#METR-18847].

											
										
										
											2015-11-18 21:37:28 +00:00
 								size_t MergeTreeDataSelectExecutor::getApproximateTotalRowsToRead(
 									const MergeTreeData::DataPartsVector & parts, const PKCondition & key_condition, const Settings & settings) const
 								{
 									size_t full_marks_count = 0;
 									/// Узнаем, сколько строк мы бы прочли без семплирования.
 									LOG_DEBUG(log, "Preliminary index scan with condition: " << key_condition.toString());
 									for (size_t i = 0; i < parts.size(); ++i)
 									{
 										const MergeTreeData::DataPartPtr & part = parts[i];
-												dbms: development; provided monotonicity properties for date-time functions [#METR-19052].

											
										
										
											2015-11-29 11:58:44 +00:00
+										MarkRanges ranges = markRangesFromPKRange(part->index, key_condition, settings);
-												dbms: added support for SAMPLE ... OFFSET [#METR-18847].

											
										
										
											2015-11-18 21:37:28 +00:00
 										/** Для того, чтобы получить оценку снизу количества строк, подходящих под условие на PK,
 										  *  учитываем только гарантированно полные засечки.
 										  * То есть, не учитываем первую и последнюю засечку, которые могут быть неполными.
 										  */
 										for (size_t j = 0; j < ranges.size(); ++j)
 											if (ranges[j].end - ranges[j].begin > 2)
 												full_marks_count += ranges[j].end - ranges[j].begin - 2;
 									}
 									return full_marks_count * data.index_granularity;
 								}
-												dbms: SAMPLE ... OFFSET development: using rational numbers [#METR-18847].

											
										
										
											2015-11-19 21:34:53 +00:00
+								using RelativeSize = boost::rational<ASTSampleRatio::BigNum>;
 								static std::ostream & operator<<(std::ostream & ostr, const RelativeSize & x)
 								{
 									ostr << ASTSampleRatio::toString(x.numerator()) << "/" << ASTSampleRatio::toString(x.denominator());
 									return ostr;
 								}
-												dbms: added support for SAMPLE ... OFFSET [#METR-18847].

											
										
										
											2015-11-18 21:37:28 +00:00
 								/// Переводит размер сэмпла в приблизительном количестве строк (вида SAMPLE 1000000) в относительную величину (вида SAMPLE 0.1).
 								static RelativeSize convertAbsoluteSampleSizeToRelative(const ASTPtr & node, size_t approx_total_rows)
 								{
 									if (approx_total_rows == 0)
 										return 1;
-												dbms: SAMPLE ... OFFSET development: using rational numbers [#METR-18847].

											
										
										
											2015-11-19 21:34:53 +00:00
+									const ASTSampleRatio & node_sample = typeid_cast<const ASTSampleRatio &>(*node);
 									auto absolute_sample_size = node_sample.ratio.numerator / node_sample.ratio.denominator;
 									return std::min(RelativeSize(1), RelativeSize(absolute_sample_size) / approx_total_rows);
-												dbms: added support for SAMPLE ... OFFSET [#METR-18847].

											
										
										
											2015-11-18 21:37:28 +00:00
+								}
-												Merge

											
										
										
											2014-03-13 12:48:07 +00:00
+								BlockInputStreams MergeTreeDataSelectExecutor::read(
 									const Names & column_names_to_return,
 									ASTPtr query,
-												dbms: pass proper context into Storage::read(). [#METR-14179]

This reverts commit 34b3f738a67432b44f6f69238dd1529535984d1a.

											
										
										
											2014-12-17 11:53:17 +00:00
+									const Context & context,
-												Merge

											
										
										
											2014-03-13 12:48:07 +00:00
+									const Settings & settings,
 									QueryProcessingStage::Enum & processed_stage,
-												dbms: pass proper context into Storage::read(). [#METR-14179]

This reverts commit 34b3f738a67432b44f6f69238dd1529535984d1a.

											
										
										
											2014-12-17 11:53:17 +00:00
+									const size_t max_block_size,
 									const unsigned threads,
-												Added virtual column '_sample_factor' [#METR-20296].

											
										
										
											2016-03-04 04:54:10 +00:00
+									size_t * inout_part_index,
-												dbms: added support for SAMPLE ... OFFSET [#METR-18847].

											
										
										
											2015-11-18 21:37:28 +00:00
+									Int64 max_block_number_to_read) const
-												Merge

											
										
										
											2014-03-13 12:48:07 +00:00
+								{
-												Merge

											
										
										
											2014-07-30 12:10:34 +00:00
+									size_t part_index_var = 0;
-												Added virtual column '_sample_factor' [#METR-20296].

											
										
										
											2016-03-04 04:54:10 +00:00
+									if (!inout_part_index)
 										inout_part_index = &part_index_var;
-												Merge

											
										
										
											2014-07-30 12:10:34 +00:00
-												Merge

											
										
										
											2014-09-19 11:44:29 +00:00
+									MergeTreeData::DataPartsVector parts = data.getDataPartsVector();
-												Merge

											
										
										
											2014-07-28 10:36:11 +00:00
-												Added virtual column '_sample_factor' [#METR-20296].

											
										
										
											2016-03-04 04:54:10 +00:00
+									/// Если в запросе есть ограничения на виртуальный столбец _part или _part_index, выберем только подходящие под него куски.
 									/// В запросе может быть запрошен виртуальный столбец _sample_factor - 1 / использованный коэффициент сэмплирования.
 									Names virt_column_names;
 									Names real_column_names;
-												Fixed error [#METR-20296].

											
										
										
											2016-03-05 03:17:11 +00:00
+									bool part_column_queried = false;
-												Added virtual column '_sample_factor' [#METR-20296].

											
										
										
											2016-03-04 04:54:10 +00:00
+									bool sample_factor_column_queried = false;
 									Float64 used_sample_factor = 1;
-												Merge

											
										
										
											2014-07-30 12:10:34 +00:00
+									for (const String & name : column_names_to_return)
-												Added virtual column '_sample_factor' [#METR-20296].

											
										
										
											2016-03-04 04:54:10 +00:00
+									{
-												Fixed error [#METR-20296].

											
										
										
											2016-03-05 03:17:11 +00:00
+										if (name == "_part")
 										{
 											part_column_queried = true;
 											virt_column_names.push_back(name);
 										}
 										else if (name == "_part_index")
-												Added virtual column '_sample_factor' [#METR-20296].

											
										
										
											2016-03-04 04:54:10 +00:00
+										{
 											virt_column_names.push_back(name);
 										}
 										else if (name == "_sample_factor")
 										{
 											sample_factor_column_queried = true;
-												Merge

											
										
										
											2014-07-30 12:10:34 +00:00
+											virt_column_names.push_back(name);
-												Added virtual column '_sample_factor' [#METR-20296].

											
										
										
											2016-03-04 04:54:10 +00:00
+										}
 										else
 										{
 											real_column_names.push_back(name);
 										}
 									}
-												Merge

											
										
										
											2014-07-28 10:36:11 +00:00
-												Fixed error [#METR-20296].

											
										
										
											2016-03-05 03:17:11 +00:00
+									NamesAndTypesList available_real_columns = data.getColumnsList();
 									NamesAndTypesList available_real_and_virtual_columns = available_real_columns;
 									for (const auto & name : virt_column_names)
 										available_real_and_virtual_columns.emplace_back(data.getColumn(name));
-												Merge

											
										
										
											2014-07-30 12:22:12 +00:00
+									/// Если в запросе только виртуальные столбцы, надо запросить хотя бы один любой другой.
-												fix `optimize_move_to_prewhere`, alter query before any other manipulations. #[METR-13020]

											
										
										
											2014-10-03 09:17:06 +00:00
+									if (real_column_names.empty())
-												Fixed error [#METR-20296].

											
										
										
											2016-03-05 03:17:11 +00:00
+										real_column_names.push_back(ExpressionActions::getSmallestColumn(available_real_columns));
-												Merge

											
										
										
											2014-07-28 10:36:11 +00:00
-												Fixed error [#METR-20296].

											
										
										
											2016-03-05 03:17:11 +00:00
+									/// Если запрошен виртуальный столбец _part, пробуем использовать его в качестве индекса.
 									Block virtual_columns_block = getBlockWithPartColumn(parts);
 									if (part_column_queried)
-												dbms: pass proper context into Storage::read(). [#METR-14179]

This reverts commit 34b3f738a67432b44f6f69238dd1529535984d1a.

											
										
										
											2014-12-17 11:53:17 +00:00
+										VirtualColumnUtils::filterBlockWithQuery(query, virtual_columns_block, context);
-												Merge

											
										
										
											2014-07-28 10:36:11 +00:00
-												Fixed error [#METR-20296].

											
										
										
											2016-03-05 03:17:11 +00:00
+									std::multiset<String> part_values = VirtualColumnUtils::extractSingleValueFromBlock<String>(virtual_columns_block, "_part");
-												Merge

											
										
										
											2014-07-28 10:36:11 +00:00
 									data.check(real_column_names);
-												Merge

											
										
										
											2014-03-13 12:48:07 +00:00
+									processed_stage = QueryProcessingStage::FetchColumns;
-												Fixed error [#METR-20296].

											
										
										
											2016-03-05 03:17:11 +00:00
+									PKCondition key_condition(query, context, available_real_and_virtual_columns, data.getSortDescription());
 									PKCondition date_condition(query, context, available_real_and_virtual_columns, SortDescription(1, SortColumnDescription(data.date_column_name, 1)));
-												Merge

											
										
										
											2014-03-13 12:48:07 +00:00
-												dbms: using numeric constants while evaluating PKCondition [#METR-19758].

											
										
										
											2016-01-22 21:28:58 +00:00
+									if (settings.force_primary_key && key_condition.alwaysUnknownOrTrue())
-												dbms: allowed to use index if column is wrapped by piecewise-monotonic functions: initial implementation [#METR-19052].

											
										
										
											2015-11-29 08:06:29 +00:00
+										throw Exception("Primary key is not used and setting 'force_primary_key' is set.", ErrorCodes::INDEX_NOT_USED);
-												dbms: using numeric constants while evaluating PKCondition [#METR-19758].

											
										
										
											2016-01-22 21:28:58 +00:00
+									if (settings.force_index_by_date && date_condition.alwaysUnknownOrTrue())
-												dbms: added setting 'force_index_by_date' [#METR-15484].

											
										
										
											2015-03-14 01:20:10 +00:00
+										throw Exception("Index by date is not used and setting 'force_index_by_date' is set.", ErrorCodes::INDEX_NOT_USED);
-												dbms: added setting 'select_sequential_consistency' [#METR-16779].

											
										
										
											2015-09-20 11:54:58 +00:00
+									/// Выберем куски, в которых могут быть данные, удовлетворяющие date_condition, и которые подходят под условие на _part,
 									///  а также max_block_number_to_read.
-												Merge

											
										
										
											2014-03-13 12:48:07 +00:00
+									{
-												dbms: allowed to use index if column is wrapped by piecewise-monotonic functions: initial implementation [#METR-19052].

											
										
										
											2015-11-29 08:06:29 +00:00
+										const DataTypes data_types_date { new DataTypeDate };
-												Merge

											
										
										
											2014-07-28 10:36:11 +00:00
+										auto prev_parts = parts;
 										parts.clear();
-												Merge

											
										
										
											2014-03-13 12:48:07 +00:00
-												Merge

											
										
										
											2014-07-28 10:36:11 +00:00
+										for (const auto & part : prev_parts)
-												Merge

											
										
										
											2014-03-13 12:48:07 +00:00
+										{
-												Fixed error [#METR-20296].

											
										
										
											2016-03-05 03:17:11 +00:00
+											if (part_values.find(part->name) == part_values.end())
-												Merge

											
										
										
											2014-07-28 10:36:11 +00:00
+												continue;
 											Field left = static_cast<UInt64>(part->left_date);
 											Field right = static_cast<UInt64>(part->right_date);
-												dbms: allowed to use index if column is wrapped by piecewise-monotonic functions: initial implementation [#METR-19052].

											
										
										
											2015-11-29 08:06:29 +00:00
+											if (!date_condition.mayBeTrueInRange(&left, &right, data_types_date))
-												Merge

											
										
										
											2014-07-28 10:36:11 +00:00
+												continue;
-												Merge

											
										
										
											2014-03-13 12:48:07 +00:00
-												dbms: addition to prev. revision [#METR-16779].

											
										
										
											2015-09-20 12:25:10 +00:00
+											if (max_block_number_to_read && part->right > max_block_number_to_read)
-												dbms: added setting 'select_sequential_consistency' [#METR-16779].

											
										
										
											2015-09-20 11:54:58 +00:00
+												continue;
-												Merge

											
										
										
											2014-07-28 10:36:11 +00:00
+											parts.push_back(part);
-												Merge

											
										
										
											2014-03-13 12:48:07 +00:00
+										}
 									}
 									/// Семплирование.
-												Merge

											
										
										
											2014-07-28 10:36:11 +00:00
+									Names column_names_to_read = real_column_names;
-												Merge

											
										
										
											2014-03-13 12:48:07 +00:00
+									typedef Poco::SharedPtr<ASTFunction> ASTFunctionPtr;
 									ASTFunctionPtr filter_function;
 									ExpressionActionsPtr filter_expression;
-												dbms: added support for SAMPLE ... OFFSET [#METR-18847].

											
										
										
											2015-11-18 21:37:28 +00:00
 									RelativeSize relative_sample_size = 0;
 									RelativeSize relative_sample_offset = 0;
-												Merge

											
										
										
											2014-03-13 12:48:07 +00:00
-												Merge

											
										
										
											2015-05-20 11:58:21 +00:00
+									ASTSelectQuery & select = *typeid_cast<ASTSelectQuery*>(&*query);
-												Merge

											
										
										
											2014-03-13 12:48:07 +00:00
+									if (select.sample_size)
 									{
-												dbms: SAMPLE ... OFFSET development: using rational numbers [#METR-18847].

											
										
										
											2015-11-19 21:34:53 +00:00
+										relative_sample_size.assign(
 											typeid_cast<const ASTSampleRatio &>(*select.sample_size).ratio.numerator,
 											typeid_cast<const ASTSampleRatio &>(*select.sample_size).ratio.denominator);
-												Merge

											
										
										
											2014-03-13 12:48:07 +00:00
-												dbms: treat SAMPLE 1 as no-op [#METR-2944].

											
										
										
											2014-10-23 19:16:43 +00:00
+										if (relative_sample_size < 0)
-												Merge

											
										
										
											2014-03-13 12:48:07 +00:00
+											throw Exception("Negative sample size", ErrorCodes::ARGUMENT_OUT_OF_BOUND);
-												dbms: added support for SAMPLE ... OFFSET [#METR-18847].

											
										
										
											2015-11-18 21:37:28 +00:00
+										relative_sample_offset = 0;
 										if (select.sample_offset)
-												dbms: SAMPLE ... OFFSET development: using rational numbers [#METR-18847].

											
										
										
											2015-11-19 21:34:53 +00:00
+											relative_sample_offset.assign(
 												typeid_cast<const ASTSampleRatio &>(*select.sample_offset).ratio.numerator,
 												typeid_cast<const ASTSampleRatio &>(*select.sample_offset).ratio.denominator);
-												Merge

											
										
										
											2014-03-13 12:48:07 +00:00
-												dbms: added support for SAMPLE ... OFFSET [#METR-18847].

											
										
										
											2015-11-18 21:37:28 +00:00
+										if (relative_sample_offset < 0)
 											throw Exception("Negative sample offset", ErrorCodes::ARGUMENT_OUT_OF_BOUND);
-												Merge

											
										
										
											2014-03-13 12:48:07 +00:00
-												dbms: added support for SAMPLE ... OFFSET [#METR-18847].

											
										
										
											2015-11-18 21:37:28 +00:00
+										/// Переводим абсолютную величину сэмплирования (вида SAMPLE 1000000 - сколько строк прочитать) в относительную (какую долю данных читать).
 										size_t approx_total_rows = 0;
 										if (relative_sample_size > 1 || relative_sample_offset > 1)
 											approx_total_rows = getApproximateTotalRowsToRead(parts, key_condition, settings);
-												Merge

											
										
										
											2014-03-13 12:48:07 +00:00
-												dbms: added support for SAMPLE ... OFFSET [#METR-18847].

											
										
										
											2015-11-18 21:37:28 +00:00
+										if (relative_sample_size > 1)
 										{
 											relative_sample_size = convertAbsoluteSampleSizeToRelative(select.sample_size, approx_total_rows);
-												dbms: treat SAMPLE 1 as no-op [#METR-2944].

											
										
										
											2014-10-23 19:16:43 +00:00
+											LOG_DEBUG(log, "Selected relative sample size: " << relative_sample_size);
-												Merge

											
										
										
											2014-03-13 12:48:07 +00:00
+										}
-												dbms: treat SAMPLE 1 as no-op [#METR-2944].

											
										
										
											2014-10-23 19:16:43 +00:00
+										/// SAMPLE 1 - то же, что и отсутствие SAMPLE.
 										if (relative_sample_size == 1)
 											relative_sample_size = 0;
-												dbms: added support for SAMPLE ... OFFSET [#METR-18847].

											
										
										
											2015-11-18 21:37:28 +00:00
+										if (relative_sample_offset > 0 && 0 == relative_sample_size)
 											throw Exception("Sampling offset is incorrect because no sampling", ErrorCodes::ARGUMENT_OUT_OF_BOUND);
-												dbms: Server: queries with several replicas: development [#METR-14410]

											
										
										
											2015-02-03 12:33:51 +00:00
-												dbms: added support for SAMPLE ... OFFSET [#METR-18847].

											
										
										
											2015-11-18 21:37:28 +00:00
+										if (relative_sample_offset > 1)
 										{
 											relative_sample_offset = convertAbsoluteSampleSizeToRelative(select.sample_offset, approx_total_rows);
 											LOG_DEBUG(log, "Selected relative sample offset: " << relative_sample_offset);
 										}
 									}
 									/** Какой диапазон значений ключа сэмплирования нужно читать?
 									  * Сначала во всём диапазоне ("юнивёрсум") выбераем интервал
 									  *  относительного размера relative_sample_size, смещённый от начала на relative_sample_offset.
 									  *
 									  * Пример: SAMPLE 0.4 OFFSET 0.3:
 									  *
 									  * [------********------]
 									  *        ^ - offset
 									  *        <------> - size
 									  *
 									  * Если интервал переходит через конец юнивёрсума, то срезаем его правую часть.
 									  *
 									  * Пример: SAMPLE 0.4 OFFSET 0.8:
 									  *
 									  * [----------------****]
 									  *                  ^ - offset
 									  *                  <------> - size
 									  *
 									  * Далее, если выставлены настройки parallel_replicas_count, parallel_replica_offset,
 									  *  то необходимо разбить полученный интервал ещё на кусочки в количестве parallel_replicas_count,
 									  *  и выбрать из них кусочек с номером parallel_replica_offset (от нуля).
 									  *
 									  * Пример: SAMPLE 0.4 OFFSET 0.3, parallel_replicas_count = 2, parallel_replica_offset = 1:
 									  *
 									  * [----------****------]
 									  *        ^ - offset
 									  *        <------> - size
 									  *        <--><--> - кусочки для разных parallel_replica_offset, выбираем второй.
-												dbms: SAMPLE OFFSET: development [#METR-18847].

											
										
										
											2015-11-19 03:24:59 +00:00
+									  *
 									  * Очень важно, чтобы интервалы для разных parallel_replica_offset покрывали весь диапазон без пропусков и перекрытий.
 									  * Также важно, чтобы весь юнивёрсум можно было покрыть, используя SAMPLE 0.1 OFFSET 0, ... OFFSET 0.9 и похожие десятичные дроби.
-												dbms: added support for SAMPLE ... OFFSET [#METR-18847].

											
										
										
											2015-11-18 21:37:28 +00:00
+									  */
 									bool use_sampling = relative_sample_size > 0 || settings.parallel_replicas_count > 1;
 									bool no_data = false;	/// После сэмплирования ничего не остаётся.
 									if (use_sampling)
-												dbms: treat SAMPLE 1 as no-op [#METR-2944].

											
										
										
											2014-10-23 19:16:43 +00:00
+									{
-												Merge

											
										
										
											2016-03-03 20:29:52 +00:00
+										if (!data.sampling_expression)
 											throw Exception("Illegal SAMPLE: table doesn't support sampling", ErrorCodes::SAMPLING_NOT_SUPPORTED);
-												Added virtual column '_sample_factor' [#METR-20296].

											
										
										
											2016-03-04 04:54:10 +00:00
+										if (sample_factor_column_queried && relative_sample_size != 0)
 											used_sample_factor = 1.0 / boost::rational_cast<Float64>(relative_sample_size);
-												dbms: SAMPLE OFFSET: development [#METR-18847].

											
										
										
											2015-11-19 03:24:59 +00:00
+										RelativeSize size_of_universum = 0;
-												Merge

											
										
										
											2014-03-14 17:03:52 +00:00
+										DataTypePtr type = data.getPrimaryExpression()->getSampleBlock().getByName(data.sampling_expression->getColumnName()).type;
-												Merge

											
										
										
											2014-03-13 12:48:07 +00:00
-												dbms: SAMPLE OFFSET: development [#METR-18847].

											
										
										
											2015-11-19 03:24:59 +00:00
+										if (typeid_cast<const DataTypeUInt64 *>(type.get()))
 											size_of_universum = RelativeSize(std::numeric_limits<UInt64>::max()) + 1;
 										else if (typeid_cast<const DataTypeUInt32 *>(type.get()))
 											size_of_universum = RelativeSize(std::numeric_limits<UInt32>::max()) + 1;
 										else if (typeid_cast<const DataTypeUInt16 *>(type.get()))
 											size_of_universum = RelativeSize(std::numeric_limits<UInt16>::max()) + 1;
 										else if (typeid_cast<const DataTypeUInt8 *>(type.get()))
 											size_of_universum = RelativeSize(std::numeric_limits<UInt8>::max()) + 1;
-												Merge

											
										
										
											2014-03-13 12:48:07 +00:00
+										else
-												Better diagnostics [#METR-19808].

											
										
										
											2016-03-05 02:30:20 +00:00
+											throw Exception("Invalid sampling column type in storage parameters: " + type->getName() + ". Must be unsigned integer type.",
 												ErrorCodes::ILLEGAL_TYPE_OF_COLUMN_FOR_FILTER);
-												Merge

											
										
										
											2014-03-13 12:48:07 +00:00
-												dbms: Server: queries with several replicas: fixes [#METR-14410]

											
										
										
											2015-02-04 10:40:00 +00:00
+										if (settings.parallel_replicas_count > 1)
-												dbms: Server: queries with several replicas: development [#METR-14410]

											
										
										
											2015-02-03 12:33:51 +00:00
+										{
-												dbms: addition to prev. revision [#METR-18847].

											
										
										
											2015-11-20 02:29:16 +00:00
+											if (relative_sample_size == 0)
 												relative_sample_size = 1;
-												dbms: added support for SAMPLE ... OFFSET [#METR-18847].

											
										
										
											2015-11-18 21:37:28 +00:00
+											relative_sample_size /= settings.parallel_replicas_count;
 											relative_sample_offset += relative_sample_size * settings.parallel_replica_offset;
-												dbms: Server: queries with several replicas: development [#METR-14410]

											
										
										
											2015-02-03 12:33:51 +00:00
+										}
-												dbms: added support for SAMPLE ... OFFSET [#METR-18847].

											
										
										
											2015-11-18 21:37:28 +00:00
-												dbms: SAMPLE OFFSET: development [#METR-18847].

											
										
										
											2015-11-19 03:24:59 +00:00
+										if (relative_sample_offset >= 1)
 											no_data = true;
-												dbms: added support for SAMPLE ... OFFSET [#METR-18847].

											
										
										
											2015-11-18 21:37:28 +00:00
 										/// Вычисляем полуинтервал [lower, upper) значений столбца.
 										bool has_lower_limit = false;
 										bool has_upper_limit = false;
-												dbms: SAMPLE ... OFFSET development: using rational numbers [#METR-18847].

											
										
										
											2015-11-19 21:34:53 +00:00
+										RelativeSize lower_limit_rational = relative_sample_offset * size_of_universum;
 										RelativeSize upper_limit_rational = (relative_sample_offset + relative_sample_size) * size_of_universum;
-												dbms: SAMPLE OFFSET: development [#METR-18847].

											
										
										
											2015-11-19 03:24:59 +00:00
-												dbms: addition to prev. revision [#METR-18847].

											
										
										
											2015-11-20 03:08:12 +00:00
+										UInt64 lower = boost::rational_cast<ASTSampleRatio::BigNum>(lower_limit_rational);
 										UInt64 upper = boost::rational_cast<ASTSampleRatio::BigNum>(upper_limit_rational);
-												dbms: added support for SAMPLE ... OFFSET [#METR-18847].

											
										
										
											2015-11-18 21:37:28 +00:00
 										if (lower > 0)
 											has_lower_limit = true;
-												dbms: addition to prev. revision [#METR-18847].

											
										
										
											2015-11-20 02:42:26 +00:00
+										if (upper_limit_rational < size_of_universum)
-												dbms: added support for SAMPLE ... OFFSET [#METR-18847].

											
										
										
											2015-11-18 21:37:28 +00:00
+											has_upper_limit = true;
-												dbms: SAMPLE OFFSET: development [#METR-18847].

											
										
										
											2015-11-19 03:24:59 +00:00
-												dbms: addition to prev. revision [#METR-18847].

											
										
										
											2015-11-20 03:08:12 +00:00
+										/*std::cerr << std::fixed << std::setprecision(100)
-												dbms: SAMPLE OFFSET: development [#METR-18847].

											
										
										
											2015-11-19 03:24:59 +00:00
+											<< "relative_sample_size: " << relative_sample_size << "\n"
 											<< "relative_sample_offset: " << relative_sample_offset << "\n"
-												dbms: addition to prev. revision [#METR-18847].

											
										
										
											2015-11-20 02:29:16 +00:00
+											<< "lower_limit_float: " << lower_limit_rational << "\n"
 											<< "upper_limit_float: " << upper_limit_rational << "\n"
-												dbms: SAMPLE OFFSET: development [#METR-18847].

											
										
										
											2015-11-19 03:24:59 +00:00
+											<< "lower: " << lower << "\n"
 											<< "upper: " << upper << "\n";*/
 										if ((has_upper_limit && upper == 0)
 											|| (has_lower_limit && has_upper_limit && lower == upper))
 											no_data = true;
-												dbms: Server: queries with several replicas: development [#METR-14410]

											
										
										
											2015-02-03 12:33:51 +00:00
-												dbms: added support for SAMPLE ... OFFSET [#METR-18847].

											
										
										
											2015-11-18 21:37:28 +00:00
+										if (no_data || (!has_lower_limit && !has_upper_limit))
 										{
 											use_sampling = false;
 										}
 										else
 										{
 											/// Добавим условия, чтобы отсечь еще что-нибудь при повторном просмотре индекса и при обработке запроса.
-												Merge

											
										
										
											2014-03-13 12:48:07 +00:00
-												dbms: added support for SAMPLE ... OFFSET [#METR-18847].

											
										
										
											2015-11-18 21:37:28 +00:00
+											ASTFunctionPtr lower_function;
 											ASTFunctionPtr upper_function;
-												dbms: Server: queries with several replicas: development [#METR-14410]

											
										
										
											2015-02-03 12:33:51 +00:00
-												dbms: added support for SAMPLE ... OFFSET [#METR-18847].

											
										
										
											2015-11-18 21:37:28 +00:00
+											if (has_lower_limit)
 											{
 												if (!key_condition.addCondition(data.sampling_expression->getColumnName(), Range::createLeftBounded(lower, true)))
 													throw Exception("Sampling column not in primary key", ErrorCodes::ILLEGAL_COLUMN);
-												dbms: Server: queries with several replicas: development [#METR-14410]

											
										
										
											2015-02-03 12:33:51 +00:00
-												dbms: added support for SAMPLE ... OFFSET [#METR-18847].

											
										
										
											2015-11-18 21:37:28 +00:00
+												ASTPtr args = new ASTExpressionList;
 												args->children.push_back(data.sampling_expression);
 												args->children.push_back(new ASTLiteral(StringRange(), lower));
-												Merge

											
										
										
											2014-03-13 12:48:07 +00:00
-												dbms: added support for SAMPLE ... OFFSET [#METR-18847].

											
										
										
											2015-11-18 21:37:28 +00:00
+												lower_function = new ASTFunction;
 												lower_function->name = "greaterOrEquals";
 												lower_function->arguments = args;
 												lower_function->children.push_back(lower_function->arguments);
-												dbms: Server: queries with several replicas: fixes [#METR-14410]

											
										
										
											2015-02-04 10:27:06 +00:00
-												dbms: added support for SAMPLE ... OFFSET [#METR-18847].

											
										
										
											2015-11-18 21:37:28 +00:00
+												filter_function = lower_function;
 											}
-												Merge

											
										
										
											2014-03-13 12:48:07 +00:00
-												dbms: added support for SAMPLE ... OFFSET [#METR-18847].

											
										
										
											2015-11-18 21:37:28 +00:00
+											if (has_upper_limit)
 											{
 												if (!key_condition.addCondition(data.sampling_expression->getColumnName(), Range::createRightBounded(upper, false)))
 													throw Exception("Sampling column not in primary key", ErrorCodes::ILLEGAL_COLUMN);
-												dbms: Server: queries with several replicas: fixes [#METR-14410]

											
										
										
											2015-02-04 10:27:06 +00:00
-												dbms: added support for SAMPLE ... OFFSET [#METR-18847].

											
										
										
											2015-11-18 21:37:28 +00:00
+												ASTPtr args = new ASTExpressionList;
 												args->children.push_back(data.sampling_expression);
 												args->children.push_back(new ASTLiteral(StringRange(), upper));
-												dbms: Server: queries with several replicas: fixes [#METR-14410]

											
										
										
											2015-02-04 10:27:06 +00:00
-												dbms: added support for SAMPLE ... OFFSET [#METR-18847].

											
										
										
											2015-11-18 21:37:28 +00:00
+												upper_function = new ASTFunction;
 												upper_function->name = "less";
 												upper_function->arguments = args;
 												upper_function->children.push_back(upper_function->arguments);
-												Merge

											
										
										
											2014-03-13 12:48:07 +00:00
-												dbms: added support for SAMPLE ... OFFSET [#METR-18847].

											
										
										
											2015-11-18 21:37:28 +00:00
+												filter_function = upper_function;
 											}
-												Merge

											
										
										
											2014-03-13 12:48:07 +00:00
-												dbms: added support for SAMPLE ... OFFSET [#METR-18847].

											
										
										
											2015-11-18 21:37:28 +00:00
+											if (has_lower_limit && has_upper_limit)
 											{
 												ASTPtr args = new ASTExpressionList;
 												args->children.push_back(lower_function);
 												args->children.push_back(upper_function);
 												filter_function = new ASTFunction;
 												filter_function->name = "and";
 												filter_function->arguments = args;
 												filter_function->children.push_back(filter_function->arguments);
 											}
-												Fixed error [#METR-20296].

											
										
										
											2016-03-05 03:17:11 +00:00
+											filter_expression = ExpressionAnalyzer(filter_function, context, nullptr, available_real_columns).getActions(false);
-												dbms: added support for SAMPLE ... OFFSET [#METR-18847].

											
										
										
											2015-11-18 21:37:28 +00:00
 											/// Добавим столбцы, нужные для sampling_expression.
 											std::vector<String> add_columns = filter_expression->getRequiredColumns();
 											column_names_to_read.insert(column_names_to_read.end(), add_columns.begin(), add_columns.end());
 											std::sort(column_names_to_read.begin(), column_names_to_read.end());
 											column_names_to_read.erase(std::unique(column_names_to_read.begin(), column_names_to_read.end()), column_names_to_read.end());
 										}
 									}
 									if (no_data)
 									{
 										LOG_DEBUG(log, "Sampling yields no data.");
 										return {};
-												Merge

											
										
										
											2014-03-13 12:48:07 +00:00
+									}
 									LOG_DEBUG(log, "Key condition: " << key_condition.toString());
 									LOG_DEBUG(log, "Date condition: " << date_condition.toString());
 									/// PREWHERE
 									ExpressionActionsPtr prewhere_actions;
 									String prewhere_column;
 									if (select.prewhere_expression)
 									{
-												Fixed error [#METR-20296].

											
										
										
											2016-03-05 03:17:11 +00:00
+										ExpressionAnalyzer analyzer(select.prewhere_expression, context, nullptr, available_real_columns);
-												Merge

											
										
										
											2014-03-13 12:48:07 +00:00
+										prewhere_actions = analyzer.getActions(false);
 										prewhere_column = select.prewhere_expression->getColumnName();
-												dbms: added support for subqueries in PREWHERE [#METR-15106].

											
										
										
											2015-02-15 04:16:11 +00:00
+										SubqueriesForSets prewhere_subqueries = analyzer.getSubqueriesForSets();
 										/** Вычислим подзапросы прямо сейчас.
 										  * NOTE Недостаток - эти вычисления не вписываются в конвейер выполнения запроса.
 										  * Они делаются до начала выполнения конвейера; их нельзя прервать; во время вычислений не отправляются пакеты прогресса.
 										  */
 										if (!prewhere_subqueries.empty())
 											CreatingSetsBlockInputStream(new NullBlockInputStream, prewhere_subqueries, settings.limits).read();
-												Merge

											
										
										
											2014-03-13 12:48:07 +00:00
+									}
 									RangesInDataParts parts_with_ranges;
 									/// Найдем, какой диапазон читать из каждого куска.
-												dbms: Server: queries with several replicas: development [#METR-14410]

											
										
										
											2015-02-03 12:33:51 +00:00
+									size_t sum_marks = 0;
 									size_t sum_ranges = 0;
-												dbms: tiny modifications [#METR-2944].

											
										
										
											2014-10-18 21:46:05 +00:00
+									for (auto & part : parts)
-												Merge

											
										
										
											2014-03-13 12:48:07 +00:00
+									{
-												Added virtual column '_sample_factor' [#METR-20296].

											
										
										
											2016-03-04 04:54:10 +00:00
+										RangesInDataPart ranges(part, (*inout_part_index)++);
-												Merge

											
										
										
											2015-03-14 02:37:53 +00:00
 										if (data.mode != MergeTreeData::Unsorted)
-												dbms: development; provided monotonicity properties for date-time functions [#METR-19052].

											
										
										
											2015-11-29 11:58:44 +00:00
+											ranges.ranges = markRangesFromPKRange(part->index, key_condition, settings);
-												Merge

											
										
										
											2015-03-14 02:37:53 +00:00
+										else
 											ranges.ranges = MarkRanges{MarkRange{0, part->size}};
-												Merge

											
										
										
											2014-03-13 12:48:07 +00:00
 										if (!ranges.ranges.empty())
-												dbms: Server: queries with several replicas: development [#METR-14410]

											
										
										
											2015-01-21 11:17:18 +00:00
+										{
-												dbms: Server: queries with several replicas: development [#METR-14410]

											
										
										
											2015-02-03 12:33:51 +00:00
+											parts_with_ranges.push_back(ranges);
-												dbms: Server: queries with several replicas: development [#METR-14410]

											
										
										
											2015-01-22 14:22:59 +00:00
-												dbms: Server: queries with several replicas: development [#METR-14410]

											
										
										
											2015-02-03 12:33:51 +00:00
+											sum_ranges += ranges.ranges.size();
 											for (const auto & range : ranges.ranges)
 												sum_marks += range.end - range.begin;
-												dbms: Server: queries with several replicas: development [#METR-14410]

											
										
										
											2015-01-21 12:24:29 +00:00
+										}
-												dbms: Server: queries with several replicas: development [#METR-14410]

											
										
										
											2015-01-22 14:22:59 +00:00
+									}
-												dbms: Server: queries with several replicas: development [#METR-14410]

											
										
										
											2015-01-21 14:35:49 +00:00
+									LOG_DEBUG(log, "Selected " << parts.size() << " parts by date, " << parts_with_ranges.size() << " parts by key, "
-												dbms: different compression methods on merge: preparation [#METR-15386].

											
										
										
											2015-03-14 02:36:39 +00:00
+										<< sum_marks << " marks to read from " << sum_ranges << " ranges");
-												Merge

											
										
										
											2014-03-13 12:48:07 +00:00
-												dbms: fixed error [#METR-16457].

											
										
										
											2015-09-16 04:18:16 +00:00
+									if (parts_with_ranges.empty())
 										return {};
-												Merge

											
										
										
											2014-03-13 12:48:07 +00:00
+									BlockInputStreams res;
 									if (select.final)
 									{
 										/// Добавим столбцы, нужные для вычисления первичного ключа и знака.
-												Merge

											
										
										
											2014-03-14 17:03:52 +00:00
+										std::vector<String> add_columns = data.getPrimaryExpression()->getRequiredColumns();
-												Merge

											
										
										
											2014-03-13 12:48:07 +00:00
+										column_names_to_read.insert(column_names_to_read.end(), add_columns.begin(), add_columns.end());
-												Merge

											
										
										
											2015-07-08 04:38:46 +00:00
 										if (!data.sign_column.empty())
 											column_names_to_read.push_back(data.sign_column);
-												Merge

											
										
										
											2014-03-13 12:48:07 +00:00
+										std::sort(column_names_to_read.begin(), column_names_to_read.end());
 										column_names_to_read.erase(std::unique(column_names_to_read.begin(), column_names_to_read.end()), column_names_to_read.end());
 										res = spreadMarkRangesAmongThreadsFinal(
-												dbms: Server: queries with several replicas: development [#METR-14410]

											
										
										
											2015-01-21 14:35:49 +00:00
+											parts_with_ranges,
-												Merge

											
										
										
											2014-03-13 12:48:07 +00:00
+											threads,
 											column_names_to_read,
 											max_block_size,
 											settings.use_uncompressed_cache,
 											prewhere_actions,
-												Merge

											
										
										
											2014-07-28 10:36:11 +00:00
+											prewhere_column,
-												dbms: added settings to fine tune reads from merge tree [#METR-2944].

											
										
										
											2015-02-15 02:31:48 +00:00
+											virt_column_names,
-												dbms: passing proper Context to subqueries analyzer in PREWHERE [#METR-17231].

											
										
										
											2015-07-15 04:50:48 +00:00
+											settings,
 											context);
-												Merge

											
										
										
											2014-03-13 12:48:07 +00:00
+									}
 									else
 									{
 										res = spreadMarkRangesAmongThreads(
-												dbms: Server: queries with several replicas: development [#METR-14410]

											
										
										
											2015-01-21 14:35:49 +00:00
+											parts_with_ranges,
-												Merge

											
										
										
											2014-03-13 12:48:07 +00:00
+											threads,
 											column_names_to_read,
 											max_block_size,
 											settings.use_uncompressed_cache,
 											prewhere_actions,
-												Merge

											
										
										
											2014-07-28 10:36:11 +00:00
+											prewhere_column,
-												dbms: added settings to fine tune reads from merge tree [#METR-2944].

											
										
										
											2015-02-15 02:31:48 +00:00
+											virt_column_names,
 											settings);
-												Merge

											
										
										
											2014-03-13 12:48:07 +00:00
+									}
-												dbms: added support for SAMPLE ... OFFSET [#METR-18847].

											
										
										
											2015-11-18 21:37:28 +00:00
+									if (use_sampling)
-												dbms: tiny modifications [#METR-2944].

											
										
										
											2014-10-18 21:46:05 +00:00
+										for (auto & stream : res)
-												dbms: return early on WHERE 0 [#METR-19758].

											
										
										
											2016-01-22 20:43:16 +00:00
+											stream = new FilterBlockInputStream(stream, filter_expression, filter_function->getColumnName());
-												Merge

											
										
										
											2014-03-13 12:48:07 +00:00
-												Added virtual column '_sample_factor' [#METR-20296].

											
										
										
											2016-03-04 04:54:10 +00:00
+									/// Кстати, если делается распределённый запрос или запрос к Merge-таблице, то в столбце _sample_factor могут быть разные значения.
 									if (sample_factor_column_queried)
 										for (auto & stream : res)
 											stream = new AddingConstColumnBlockInputStream<Float64>(
 												stream, new DataTypeFloat64, used_sample_factor, "_sample_factor");
-												Merge

											
										
										
											2014-03-13 12:48:07 +00:00
+									return res;
 								}
-												dbms: added support for subqueries in PREWHERE [#METR-15106].

											
										
										
											2015-02-15 04:16:11 +00:00
-												Merge

											
										
										
											2014-03-13 12:48:07 +00:00
+								BlockInputStreams MergeTreeDataSelectExecutor::spreadMarkRangesAmongThreads(
 									RangesInDataParts parts,
 									size_t threads,
 									const Names & column_names,
 									size_t max_block_size,
 									bool use_uncompressed_cache,
 									ExpressionActionsPtr prewhere_actions,
-												Merge

											
										
										
											2014-07-28 10:36:11 +00:00
+									const String & prewhere_column,
-												dbms: added settings to fine tune reads from merge tree [#METR-2944].

											
										
										
											2015-02-15 02:31:48 +00:00
+									const Names & virt_columns,
-												dbms: added support for SAMPLE ... OFFSET [#METR-18847].

											
										
										
											2015-11-18 21:37:28 +00:00
+									const Settings & settings) const
-												Merge

											
										
										
											2014-03-13 12:48:07 +00:00
+								{
-												Merge

											
										
										
											2015-06-24 11:03:53 +00:00
+									const std::size_t min_marks_for_concurrent_read =
-												Merge

											
										
										
											2015-06-11 13:04:45 +00:00
+										(settings.merge_tree_min_rows_for_concurrent_read + data.index_granularity - 1) / data.index_granularity;
-												Merge

											
										
										
											2015-06-24 11:03:53 +00:00
+									const std::size_t max_marks_to_use_cache =
-												Merge

											
										
										
											2015-06-11 13:04:45 +00:00
+										(settings.merge_tree_max_rows_to_use_cache + data.index_granularity - 1) / data.index_granularity;
-												dbms: added settings to fine tune reads from merge tree [#METR-2944].

											
										
										
											2015-02-15 02:31:48 +00:00
-												Merge

											
										
										
											2014-03-13 12:48:07 +00:00
+									/// Посчитаем засечки для каждого куска.
 									std::vector<size_t> sum_marks_in_parts(parts.size());
 									size_t sum_marks = 0;
 									for (size_t i = 0; i < parts.size(); ++i)
 									{
 										/// Пусть отрезки будут перечислены справа налево, чтобы можно было выбрасывать самый левый отрезок с помощью pop_back().
 										std::reverse(parts[i].ranges.begin(), parts[i].ranges.end());
-												Merge

											
										
										
											2015-06-11 13:04:45 +00:00
+										for (const auto & range : parts[i].ranges)
-												Merge

											
										
										
											2014-03-13 12:48:07 +00:00
+											sum_marks_in_parts[i] += range.end - range.begin;
-												Merge

											
										
										
											2015-06-11 13:04:45 +00:00
-												Merge

											
										
										
											2014-03-13 12:48:07 +00:00
+										sum_marks += sum_marks_in_parts[i];
 									}
 									if (sum_marks > max_marks_to_use_cache)
 										use_uncompressed_cache = false;
 									BlockInputStreams res;
-												Merge

											
										
										
											2015-09-01 16:09:12 +00:00
+									if (sum_marks > 0 && settings.merge_tree_uniform_read_distribution == 1)
 									{
-												dbms: fixed little error [#METR-16457].

											
										
										
											2015-10-08 20:01:09 +00:00
+										/// Уменьшим количество потоков, если данных мало.
 										if (sum_marks < threads * min_marks_for_concurrent_read && parts.size() < threads)
 											threads = std::max((sum_marks + min_marks_for_concurrent_read - 1) / min_marks_for_concurrent_read, parts.size());
-												Merge

											
										
										
											2015-09-01 16:09:12 +00:00
+										MergeTreeReadPoolPtr pool = std::make_shared<MergeTreeReadPool>(
 											threads, sum_marks, min_marks_for_concurrent_read, parts, data, prewhere_actions, prewhere_column, true,
-												dbms: added backoff on slow reads [#METR-17579].

											
										
										
											2015-12-13 04:52:13 +00:00
+											column_names, MergeTreeReadPool::BackoffSettings(settings));
-												Merge

											
										
										
											2015-09-01 16:09:12 +00:00
-												dbms: fix for non-final select just in case [#METR-16457]

											
										
										
											2015-09-16 12:15:25 +00:00
+										/// Оценим общее количество строк - для прогресс-бара.
 										const std::size_t total_rows = data.index_granularity * sum_marks;
 										LOG_TRACE(log, "Reading approx. " << total_rows << " rows");
-												Merge

											
										
										
											2015-09-01 16:09:12 +00:00
+										for (std::size_t i = 0; i < threads; ++i)
-												dbms: fix for non-final select just in case [#METR-16457]

											
										
										
											2015-09-16 12:15:25 +00:00
+										{
-												Merge

											
										
										
											2015-09-01 16:09:12 +00:00
+											res.emplace_back(new MergeTreeThreadBlockInputStream{
-												Merge

											
										
										
											2015-09-25 13:39:06 +00:00
+												i, pool, min_marks_for_concurrent_read, max_block_size, data, use_uncompressed_cache,
 												prewhere_actions,
 												prewhere_column, settings, virt_columns
-												Merge

											
										
										
											2015-09-01 16:09:12 +00:00
+											});
-												dbms: fix for non-final select just in case [#METR-16457]

											
										
										
											2015-09-16 12:15:25 +00:00
+											if (i == 0)
-												Better diagnostics [#METR-19808].

											
										
										
											2016-03-05 02:30:20 +00:00
+											{
-												dbms: fix for non-final select just in case [#METR-16457]

											
										
										
											2015-09-16 12:15:25 +00:00
+												/// Выставим приблизительное количество строк только для первого источника
 												static_cast<IProfilingBlockInputStream &>(*res.front()).setTotalRowsApprox(total_rows);
-												Better diagnostics [#METR-19808].

											
										
										
											2016-03-05 02:30:20 +00:00
+											}
-												dbms: fix for non-final select just in case [#METR-16457]

											
										
										
											2015-09-16 12:15:25 +00:00
+										}
-												Merge

											
										
										
											2015-09-01 16:09:12 +00:00
+									}
 									else if (sum_marks > 0)
-												dbms: temporarily add merge_tree_uniform_read_distribution setting. [#METR-16457]

											
										
										
											2015-06-24 12:21:43 +00:00
+									{
 										const size_t min_marks_per_thread = (sum_marks - 1) / threads + 1;
 										for (size_t i = 0; i < threads && !parts.empty(); ++i)
 										{
 											size_t need_marks = min_marks_per_thread;
 											/// Цикл по кускам.
 											while (need_marks > 0 && !parts.empty())
 											{
 												RangesInDataPart & part = parts.back();
 												size_t & marks_in_part = sum_marks_in_parts.back();
 												/// Не будем брать из куска слишком мало строк.
 												if (marks_in_part >= min_marks_for_concurrent_read &&
 													need_marks < min_marks_for_concurrent_read)
 													need_marks = min_marks_for_concurrent_read;
 												/// Не будем оставлять в куске слишком мало строк.
 												if (marks_in_part > need_marks &&
 													marks_in_part - need_marks < min_marks_for_concurrent_read)
 													need_marks = marks_in_part;
 												MarkRanges ranges_to_get_from_part;
 												/// Возьмем весь кусок, если он достаточно мал.
 												if (marks_in_part <= need_marks)
 												{
 													/// Восстановим порядок отрезков.
 													std::reverse(part.ranges.begin(), part.ranges.end());
 													ranges_to_get_from_part = part.ranges;
 													need_marks -= marks_in_part;
 													parts.pop_back();
 													sum_marks_in_parts.pop_back();
 												}
 												else
 												{
 													/// Цикл по отрезкам куска.
 													while (need_marks > 0)
 													{
 														if (part.ranges.empty())
 															throw Exception("Unexpected end of ranges while spreading marks among threads", ErrorCodes::LOGICAL_ERROR);
 														MarkRange & range = part.ranges.back();
 														const size_t marks_in_range = range.end - range.begin;
 														const size_t marks_to_get_from_range = std::min(marks_in_range, need_marks);
 														ranges_to_get_from_part.emplace_back(range.begin, range.begin + marks_to_get_from_range);
 														range.begin += marks_to_get_from_range;
 														marks_in_part -= marks_to_get_from_range;
 														need_marks -= marks_to_get_from_range;
 														if (range.begin == range.end)
 															part.ranges.pop_back();
 													}
 												}
 												BlockInputStreamPtr source_stream = new MergeTreeBlockInputStream(
 													data.getFullPath() + part.data_part->name + '/', max_block_size, column_names, data,
 													part.data_part, ranges_to_get_from_part, use_uncompressed_cache,
-												dbms: don't thrash mark_cache on merges (and ALTER MODIFY TYPE) [#METR-19575].

											
										
										
											2015-12-26 00:59:09 +00:00
+													prewhere_actions, prewhere_column, true, settings.min_bytes_to_use_direct_io, settings.max_read_buffer_size, true);
-												dbms: temporarily add merge_tree_uniform_read_distribution setting. [#METR-16457]

											
										
										
											2015-06-24 12:21:43 +00:00
 												res.push_back(source_stream);
 												for (const String & virt_column : virt_columns)
 												{
 													if (virt_column == "_part")
 														res.back() = new AddingConstColumnBlockInputStream<String>(
 															res.back(), new DataTypeString, part.data_part->name, "_part");
 													else if (virt_column == "_part_index")
 														res.back() = new AddingConstColumnBlockInputStream<UInt64>(
 															res.back(), new DataTypeUInt64, part.part_index_in_query, "_part_index");
 												}
 											}
 										}
 										if (!parts.empty())
 											throw Exception("Couldn't spread marks among threads", ErrorCodes::LOGICAL_ERROR);
 									}
-												Merge

											
										
										
											2014-03-13 12:48:07 +00:00
 									return res;
 								}
 								BlockInputStreams MergeTreeDataSelectExecutor::spreadMarkRangesAmongThreadsFinal(
 									RangesInDataParts parts,
 									size_t threads,
 									const Names & column_names,
 									size_t max_block_size,
 									bool use_uncompressed_cache,
 									ExpressionActionsPtr prewhere_actions,
-												Merge

											
										
										
											2014-07-28 10:36:11 +00:00
+									const String & prewhere_column,
-												dbms: added settings to fine tune reads from merge tree [#METR-2944].

											
										
										
											2015-02-15 02:31:48 +00:00
+									const Names & virt_columns,
-												dbms: passing proper Context to subqueries analyzer in PREWHERE [#METR-17231].

											
										
										
											2015-07-15 04:50:48 +00:00
+									const Settings & settings,
-												dbms: added support for SAMPLE ... OFFSET [#METR-18847].

											
										
										
											2015-11-18 21:37:28 +00:00
+									const Context & context) const
-												Merge

											
										
										
											2014-03-13 12:48:07 +00:00
+								{
-												dbms: support final with new code [#METR-16457]

											
										
										
											2015-09-01 12:24:38 +00:00
+									const size_t max_marks_to_use_cache =
 										(settings.merge_tree_max_rows_to_use_cache + data.index_granularity - 1) / data.index_granularity;
 									const size_t min_marks_for_read_task =
 										(settings.merge_tree_min_rows_for_concurrent_read + data.index_granularity - 1) / data.index_granularity;
-												dbms: added settings to fine tune reads from merge tree [#METR-2944].

											
										
										
											2015-02-15 02:31:48 +00:00
-												Merge

											
										
										
											2014-03-13 12:48:07 +00:00
+									size_t sum_marks = 0;
 									for (size_t i = 0; i < parts.size(); ++i)
 										for (size_t j = 0; j < parts[i].ranges.size(); ++j)
 											sum_marks += parts[i].ranges[j].end - parts[i].ranges[j].begin;
 									if (sum_marks > max_marks_to_use_cache)
 										use_uncompressed_cache = false;
-												Merge

											
										
										
											2015-07-08 04:38:46 +00:00
+									BlockInputStreams to_merge;
-												Merge

											
										
										
											2014-03-13 12:48:07 +00:00
-												Merge

											
										
										
											2015-09-01 16:09:12 +00:00
+									if (settings.merge_tree_uniform_read_distribution == 1)
-												Merge

											
										
										
											2014-03-13 12:48:07 +00:00
+									{
-												dbms: fix reverse order of ranges for FINAL with merge_tree_uniform_read_distribution = 1 [#METR-16457]

											
										
										
											2015-09-25 11:35:58 +00:00
+										/// Пусть отрезки будут перечислены справа налево, чтобы можно было выбрасывать самый левый отрезок с помощью pop_back().
 										for (auto & part : parts)
 											std::reverse(std::begin(part.ranges), std::end(part.ranges));
-												Merge

											
										
										
											2015-09-01 16:09:12 +00:00
+										MergeTreeReadPoolPtr pool = std::make_shared<MergeTreeReadPool>(
 											parts.size(), sum_marks, min_marks_for_read_task, parts, data, prewhere_actions, prewhere_column, true,
-												dbms: added backoff on slow reads [#METR-17579].

											
										
										
											2015-12-13 04:52:13 +00:00
+											column_names, MergeTreeReadPool::BackoffSettings{}, true);
-												Merge

											
										
										
											2015-09-01 16:09:12 +00:00
-												dbms: fix segfault when SELECT FINAL selects zero parts[#METR-16457]

											
										
										
											2015-09-16 11:46:23 +00:00
+										/// Оценим общее количество строк - для прогресс-бара.
 										const std::size_t total_rows = data.index_granularity * sum_marks;
 										LOG_TRACE(log, "Reading approx. " << total_rows << " rows");
-												Merge

											
										
										
											2015-09-01 16:09:12 +00:00
+										for (const auto i : ext::range(0, parts.size()))
 										{
 											BlockInputStreamPtr source_stream{
 												new MergeTreeThreadBlockInputStream{
 													i, pool, min_marks_for_read_task, max_block_size, data, use_uncompressed_cache, prewhere_actions,
-												dbms: use actual settings [#METR-16457]

											
										
										
											2015-09-02 11:15:16 +00:00
+													prewhere_column, settings, virt_columns
-												Merge

											
										
										
											2015-09-01 16:09:12 +00:00
+												}
 											};
-												dbms: fix segfault when SELECT FINAL selects zero parts[#METR-16457]

											
										
										
											2015-09-16 11:46:23 +00:00
+											if (i == 0)
 												/// Выставим приблизительное количество строк только для первого источника
 												static_cast<IProfilingBlockInputStream &>(*source_stream).setTotalRowsApprox(total_rows);
-												Merge

											
										
										
											2015-09-01 16:09:12 +00:00
+											to_merge.push_back(new ExpressionBlockInputStream(source_stream, data.getPrimaryExpression()));
 										}
-												Merge

											
										
										
											2014-03-13 12:48:07 +00:00
+									}
-												Merge

											
										
										
											2015-09-01 16:09:12 +00:00
+									else
 									{
 										for (size_t part_index = 0; part_index < parts.size(); ++part_index)
 										{
 											RangesInDataPart & part = parts[part_index];
-												Merge

											
										
										
											2014-03-13 12:48:07 +00:00
-												Merge

											
										
										
											2015-09-01 16:09:12 +00:00
+											BlockInputStreamPtr source_stream = new MergeTreeBlockInputStream(
 												data.getFullPath() + part.data_part->name + '/', max_block_size, column_names, data,
 												part.data_part, part.ranges, use_uncompressed_cache,
-												dbms: don't thrash mark_cache on merges (and ALTER MODIFY TYPE) [#METR-19575].

											
										
										
											2015-12-26 00:59:09 +00:00
+												prewhere_actions, prewhere_column, true, settings.min_bytes_to_use_direct_io, settings.max_read_buffer_size, true);
-												dbms: support final with new code [#METR-16457]

											
										
										
											2015-09-01 12:24:38 +00:00
-												Merge

											
										
										
											2015-09-01 16:09:12 +00:00
+											for (const String & virt_column : virt_columns)
 											{
 												if (virt_column == "_part")
 													source_stream = new AddingConstColumnBlockInputStream<String>(
 														source_stream, new DataTypeString, part.data_part->name, "_part");
 												else if (virt_column == "_part_index")
 													source_stream = new AddingConstColumnBlockInputStream<UInt64>(
 														source_stream, new DataTypeUInt64, part.part_index_in_query, "_part_index");
 											}
-												dbms: support final with new code [#METR-16457]

											
										
										
											2015-09-01 12:24:38 +00:00
-												Merge

											
										
										
											2015-09-01 16:09:12 +00:00
+											to_merge.push_back(new ExpressionBlockInputStream(source_stream, data.getPrimaryExpression()));
 										}
 									}
-												dbms: support final with new code [#METR-16457]

											
										
										
											2015-09-01 12:24:38 +00:00
-												Merge

											
										
										
											2014-03-13 12:48:07 +00:00
+									BlockInputStreams res;
-												Merge

											
										
										
											2015-07-08 04:38:46 +00:00
+									if (to_merge.size() == 1)
 									{
 										if (!data.sign_column.empty())
 										{
 											ExpressionActionsPtr sign_filter_expression;
 											String sign_filter_column;
-												dbms: passing proper Context to subqueries analyzer in PREWHERE [#METR-17231].

											
										
										
											2015-07-15 04:50:48 +00:00
+											createPositiveSignCondition(sign_filter_expression, sign_filter_column, context);
-												Merge

											
										
										
											2015-07-08 04:38:46 +00:00
-												dbms: return early on WHERE 0 [#METR-19758].

											
										
										
											2016-01-22 20:43:16 +00:00
+											res.push_back(new FilterBlockInputStream(to_merge[0], sign_filter_expression, sign_filter_column));
-												Merge

											
										
										
											2015-07-08 04:38:46 +00:00
+										}
 										else
 											res = to_merge;
 									}
 									else if (to_merge.size() > 1)
 									{
 										BlockInputStreamPtr merged;
 										switch (data.mode)
 										{
 											case MergeTreeData::Ordinary:
-												Merge

											
										
										
											2015-09-16 04:18:52 +00:00
+												merged = new MergingSortedBlockInputStream(to_merge, data.getSortDescription(), max_block_size);
 												break;
-												Merge

											
										
										
											2015-07-08 04:38:46 +00:00
 											case MergeTreeData::Collapsing:
 												merged = new CollapsingFinalBlockInputStream(to_merge, data.getSortDescription(), data.sign_column);
 												break;
 											case MergeTreeData::Summing:
 												merged = new SummingSortedBlockInputStream(to_merge, data.getSortDescription(), data.columns_to_sum, max_block_size);
 												break;
 											case MergeTreeData::Aggregating:
 												merged = new AggregatingSortedBlockInputStream(to_merge, data.getSortDescription(), max_block_size);
 												break;
 											case MergeTreeData::Unsorted:
 												throw Exception("UnsortedMergeTree doesn't support FINAL", ErrorCodes::LOGICAL_ERROR);
 										}
 										res.push_back(merged);
 									}
-												Merge

											
										
										
											2014-03-13 12:48:07 +00:00
 									return res;
 								}
-												Fixed error [#METR-20296].

											
										
										
											2016-03-05 03:17:11 +00:00
+								void MergeTreeDataSelectExecutor::createPositiveSignCondition(
 									ExpressionActionsPtr & out_expression, String & out_column, const Context & context) const
-												Merge

											
										
										
											2014-03-13 12:48:07 +00:00
+								{
 									ASTFunction * function = new ASTFunction;
 									ASTPtr function_ptr = function;
 									ASTExpressionList * arguments = new ASTExpressionList;
 									ASTPtr arguments_ptr = arguments;
 									ASTIdentifier * sign = new ASTIdentifier;
 									ASTPtr sign_ptr = sign;
 									ASTLiteral * one = new ASTLiteral;
 									ASTPtr one_ptr = one;
 									function->name = "equals";
 									function->arguments = arguments_ptr;
 									function->children.push_back(arguments_ptr);
 									arguments->children.push_back(sign_ptr);
 									arguments->children.push_back(one_ptr);
 									sign->name = data.sign_column;
 									sign->kind = ASTIdentifier::Column;
 									one->value = Field(static_cast<Int64>(1));
-												dbms: passing proper Context to subqueries analyzer in PREWHERE [#METR-17231].

											
										
										
											2015-07-15 04:50:48 +00:00
+									out_expression = ExpressionAnalyzer(function_ptr, context, {}, data.getColumnsList()).getActions(false);
-												Merge

											
										
										
											2014-03-13 12:48:07 +00:00
+									out_column = function->getColumnName();
 								}
 								/// Получает набор диапазонов засечек, вне которых не могут находиться ключи из заданного диапазона.
-												dbms: development; provided monotonicity properties for date-time functions [#METR-19052].

											
										
										
											2015-11-29 11:58:44 +00:00
+								MarkRanges MergeTreeDataSelectExecutor::markRangesFromPKRange(
-												dbms: added support for SAMPLE ... OFFSET [#METR-18847].

											
										
										
											2015-11-18 21:37:28 +00:00
+									const MergeTreeData::DataPart::Index & index, const PKCondition & key_condition, const Settings & settings) const
-												Merge

											
										
										
											2014-03-13 12:48:07 +00:00
+								{
-												dbms: added settings to fine tune reads from merge tree [#METR-2944].

											
										
										
											2015-02-15 02:31:48 +00:00
+									size_t min_marks_for_seek = (settings.merge_tree_min_rows_for_seek + data.index_granularity - 1) / data.index_granularity;
-												Merge

											
										
										
											2014-03-13 12:48:07 +00:00
+									MarkRanges res;
-												Merge

											
										
										
											2014-03-14 17:03:52 +00:00
+									size_t key_size = data.getSortDescription().size();
-												Lowered size of index in memory (experimental) [#METR-2944].

											
										
										
											2016-02-14 05:43:03 +00:00
+									size_t marks_count = index.at(0).get()->size();
-												Merge

											
										
										
											2014-03-13 12:48:07 +00:00
 									/// Если индекс не используется.
-												dbms: using numeric constants while evaluating PKCondition [#METR-19758].

											
										
										
											2016-01-22 21:28:58 +00:00
+									if (key_condition.alwaysUnknownOrTrue())
-												Merge

											
										
										
											2014-03-13 12:48:07 +00:00
+									{
 										res.push_back(MarkRange(0, marks_count));
 									}
 									else
 									{
 										/** В стеке всегда будут находиться непересекающиеся подозрительные отрезки, самый левый наверху (back).
 											* На каждом шаге берем левый отрезок и проверяем, подходит ли он.
 											* Если подходит, разбиваем его на более мелкие и кладем их в стек. Если нет - выбрасываем его.
 											* Если отрезок уже длиной в одну засечку, добавляем его в ответ и выбрасываем.
 											*/
 										std::vector<MarkRange> ranges_stack;
 										ranges_stack.push_back(MarkRange(0, marks_count));
-												Lowered size of index in memory (experimental) [#METR-2944].

											
										
										
											2016-02-14 05:43:03 +00:00
 										/// NOTE Лишнее копирование объектов типа Field для передачи в PKCondition.
 										Row index_left(key_size);
 										Row index_right(key_size);
-												Merge

											
										
										
											2014-03-13 12:48:07 +00:00
+										while (!ranges_stack.empty())
 										{
 											MarkRange range = ranges_stack.back();
 											ranges_stack.pop_back();
 											bool may_be_true;
 											if (range.end == marks_count)
-												Lowered size of index in memory (experimental) [#METR-2944].

											
										
										
											2016-02-14 05:43:03 +00:00
+											{
 												for (size_t i = 0; i < key_size; ++i)
 												{
 													index_left[i] = (*index[i].get())[range.begin];
 												}
 												may_be_true = key_condition.mayBeTrueAfter(&index_left[0], data.primary_key_data_types);
 											}
-												Merge

											
										
										
											2014-03-13 12:48:07 +00:00
+											else
-												Lowered size of index in memory (experimental) [#METR-2944].

											
										
										
											2016-02-14 05:43:03 +00:00
+											{
 												for (size_t i = 0; i < key_size; ++i)
 												{
 													index_left[i] = (*index[i].get())[range.begin];
 													index_right[i] = (*index[i].get())[range.end];
 												}
 												may_be_true = key_condition.mayBeTrueInRange(&index_left[0], &index_right[0], data.primary_key_data_types);
 											}
-												Merge

											
										
										
											2014-03-13 12:48:07 +00:00
 											if (!may_be_true)
 												continue;
 											if (range.end == range.begin + 1)
 											{
 												/// Увидели полезный промежуток между соседними засечками. Либо добавим его к последнему диапазону, либо начнем новый диапазон.
 												if (res.empty() || range.begin - res.back().end > min_marks_for_seek)
 													res.push_back(range);
 												else
 													res.back().end = range.end;
 											}
 											else
 											{
 												/// Разбиваем отрезок и кладем результат в стек справа налево.
-												dbms: added settings to fine tune reads from merge tree [#METR-2944].

											
										
										
											2015-02-15 02:31:48 +00:00
+												size_t step = (range.end - range.begin - 1) / settings.merge_tree_coarse_index_granularity + 1;
-												Merge

											
										
										
											2014-03-13 12:48:07 +00:00
+												size_t end;
 												for (end = range.end; end > range.begin + step; end -= step)
 													ranges_stack.push_back(MarkRange(end - step, end));
 												ranges_stack.push_back(MarkRange(range.begin, end));
 											}
 										}
 									}
 									return res;
 								}
 								}