ClickHouse/dbms/src/Interpreters/InterpreterSelectQuery.cpp

#include <DB/DataStreams/ExpressionBlockInputStream.h>
#include <DB/DataStreams/FilterBlockInputStream.h>
#include <DB/DataStreams/LimitBlockInputStream.h>
#include <DB/DataStreams/PartialSortingBlockInputStream.h>
#include <DB/DataStreams/MergeSortingBlockInputStream.h>
#include <DB/DataStreams/AggregatingBlockInputStream.h>
#include <DB/DataStreams/FinalizingAggregatedBlockInputStream.h>
#include <DB/DataStreams/MergingAggregatedBlockInputStream.h>
#include <DB/DataStreams/AsynchronousBlockInputStream.h>
#include <DB/DataStreams/UnionBlockInputStream.h>
#include <DB/DataStreams/ParallelAggregatingBlockInputStream.h>
#include <DB/DataStreams/SplittingAggregatingBlockInputStream.h>
#include <DB/DataStreams/DistinctBlockInputStream.h>
#include <DB/DataStreams/NullBlockInputStream.h>
#include <DB/DataStreams/narrowBlockInputStreams.h>
#include <DB/DataStreams/copyData.h>

#include <DB/Parsers/ASTSelectQuery.h>
#include <DB/Parsers/ASTIdentifier.h>
#include <DB/Parsers/ASTFunction.h>
#include <DB/Parsers/ASTLiteral.h>
#include <DB/Parsers/ASTOrderByElement.h>

#include <DB/Interpreters/InterpreterSelectQuery.h>


namespace DB
{


InterpreterSelectQuery::InterpreterSelectQuery(ASTPtr query_ptr_, const Context & context_, QueryProcessingStage::Enum to_stage_,
	size_t subquery_depth_)
	: query_ptr(query_ptr_), query(dynamic_cast<ASTSelectQuery &>(*query_ptr)),
	context(context_), settings(context.getSettings()), to_stage(to_stage_), subquery_depth(subquery_depth_),
	log(&Logger::get("InterpreterSelectQuery"))
{
	if (settings.limits.max_subquery_depth && subquery_depth > settings.limits.max_subquery_depth)
		throw Exception("Too deep subqueries. Maximum: " + toString(settings.limits.max_subquery_depth),
			ErrorCodes::TOO_DEEP_SUBQUERIES);
	
	context.setColumns(!query.table || !dynamic_cast<ASTSelectQuery *>(&*query.table)
		? getTable()->getColumnsList()
		: InterpreterSelectQuery(query.table, context).getSampleBlock().getColumnsList());
	
	if (context.getColumns().empty())
		throw Exception("There is no available columns", ErrorCodes::THERE_IS_NO_COLUMN);
	
	query_analyzer = new ExpressionAnalyzer(query_ptr, context, subquery_depth);
}


void InterpreterSelectQuery::getDatabaseAndTableNames(String & database_name, String & table_name)
{
	/** Если таблица не указана - используем таблицу system.one.
	  * Если база данных не указана - используем текущую базу данных.
	  */
	if (!query.table)
	{
		database_name = "system";
		table_name = "one";
	}
	else if (!query.database)
		database_name = context.getCurrentDatabase();

	if (query.database)
		database_name = dynamic_cast<ASTIdentifier &>(*query.database).name;
	if (query.table)
		table_name = dynamic_cast<ASTIdentifier &>(*query.table).name;
}


StoragePtr InterpreterSelectQuery::getTable()
{
	String database_name;
	String table_name;

	getDatabaseAndTableNames(database_name, table_name);
	return context.getTable(database_name, table_name);
}


ASTPtr InterpreterSelectQuery::getCreateQuery()
{
	String database_name;
	String table_name;

	getDatabaseAndTableNames(database_name, table_name);
	return context.getCreateQuery(database_name, table_name);
}


DataTypes InterpreterSelectQuery::getReturnTypes()
{
	DataTypes res;
	NamesAndTypesList columns = query_analyzer->getSelectSampleBlock().getColumnsList();
	for (NamesAndTypesList::iterator it = columns.begin(); it != columns.end(); ++it)
	{
		res.push_back(it->second);
	}
	return res;
}


Block InterpreterSelectQuery::getSampleBlock()
{
	Block block = query_analyzer->getSelectSampleBlock();
	/// создадим ненулевые колонки, чтобы SampleBlock можно было
	/// писать (читать) с помощью BlockOut(In)putStream'ов
	for (size_t i = 0; i < block.columns(); ++i)
	{
		ColumnWithNameAndType & col = block.getByPosition(i);
		col.column = col.type->createColumn();
	}
	return block;
}


/// Превращает источник в асинхронный, если это указано.
static inline BlockInputStreamPtr maybeAsynchronous(BlockInputStreamPtr in, bool is_async)
{
	return is_async
		? new AsynchronousBlockInputStream(in)
		: in;
}


BlockInputStreamPtr InterpreterSelectQuery::execute()
{
	/** Потоки данных. При параллельном выполнении запроса, имеем несколько потоков данных.
	  * Если нет GROUP BY, то выполним все операции до ORDER BY и LIMIT параллельно, затем
	  *  если есть ORDER BY, то склеим потоки с помощью UnionBlockInputStream, а затем MergеSortingBlockInputStream,
	  *  если нет, то склеим с помощью UnionBlockInputStream,
	  *  затем применим LIMIT.
	  * Если есть GROUP BY, то выполним все операции до GROUP BY, включительно, параллельно;
	  *  параллельный GROUP BY склеит потоки в один,
	  *  затем выполним остальные операции с одним получившимся потоком.
	  */
	BlockInputStreams streams;

	/** Вынем данные из Storage. from_stage - до какой стадии запрос был выполнен в Storage. */
	QueryProcessingStage::Enum from_stage = executeFetchColumns(streams);

	/** Если данных нет. */
	if (streams.empty())
		return new NullBlockInputStream;

	LOG_TRACE(log, QueryProcessingStage::toString(from_stage) << " -> " << QueryProcessingStage::toString(to_stage));

	if (to_stage > QueryProcessingStage::FetchColumns)
	{
		bool has_where      = false;
		bool need_aggregate = false;
		bool has_having     = false;
		bool has_order_by   = false;
		
		ExpressionActionsPtr before_where;
		ExpressionActionsPtr before_aggregation;
		ExpressionActionsPtr before_having;
		ExpressionActionsPtr before_order_and_select;
		ExpressionActionsPtr final_projection;
		
		/// Сначала составим цепочку действий и запомним нужные шаги из нее.
		
		ExpressionActionsChain chain;
		
		need_aggregate = query_analyzer->hasAggregation();
			
		if (from_stage < QueryProcessingStage::WithMergeableState
			&& to_stage >= QueryProcessingStage::WithMergeableState)
		{
			query_analyzer->appendArrayJoin(chain);
			
			if (query_analyzer->appendWhere(chain))
			{
				has_where = true;
				before_where = chain.getLastActions();
				
				/// Если кроме WHERE ничего выполнять не нужно, пометим все исходные столбцы как нужные, чтобы finalize их не выбросил.
				if (!need_aggregate && to_stage == QueryProcessingStage::WithMergeableState)
				{
					Names columns = query_analyzer->getRequiredColumns();
					chain.getLastStep().required_output.insert(chain.getLastStep().required_output.end(),
															columns.begin(), columns.end());
					
					chain.finalize();
				}
				else
				{
					chain.addStep();
				}
			}
			
			if (need_aggregate)
			{
				query_analyzer->appendGroupBy(chain);
				query_analyzer->appendAggregateFunctionsArguments(chain);
				before_aggregation = chain.getLastActions();
				
				chain.finalize();
				
				chain.clear();
			}
		}
		
		if (from_stage <= QueryProcessingStage::WithMergeableState
			&& to_stage > QueryProcessingStage::WithMergeableState)
		{
			if (need_aggregate && query_analyzer->appendHaving(chain))
			{
				has_having = true;
				before_having = chain.getLastActions();
				chain.addStep();
			}
			
			query_analyzer->appendSelect(chain);
			has_order_by = query_analyzer->appendOrderBy(chain);
			before_order_and_select = chain.getLastActions();
			chain.addStep();
			
			query_analyzer->appendProjectResult(chain);
			final_projection = chain.getLastActions();
			chain.finalize();
			
			/// Если предыдущая стадия запроса выполнялась отдельно, нам могли дать лишних столбцов (например, используемых только в секции WHERE).
			/// Уберем их. Они могут существенно мешать, например, при arrayJoin.
			if (from_stage == QueryProcessingStage::WithMergeableState)
				before_order_and_select->prependProjectInput();
			
			/// Перед выполнением HAVING уберем из блока лишние столбцы (в основном, ключи агрегации).
			if (has_having)
				before_having->prependProjectInput();
		}
		
		/// Теперь составим потоки блоков, выполняющие нужные действия.
		
		if (from_stage < QueryProcessingStage::WithMergeableState
			&& to_stage >= QueryProcessingStage::WithMergeableState)
		{
			if (has_where)
				executeWhere(streams, before_where);
			
			if (need_aggregate)
				executeAggregation(streams, before_aggregation);

			/** Оптимизация - при распределённой обработке запроса, на удалённом сервере,
			  *  если не указаны DISTINCT, GROUP, HAVING, ORDER, но указан LIMIT,
			  *  то выполним предварительный LIMIT на удалёном сервере.
			  */
			if (to_stage == QueryProcessingStage::WithMergeableState
				&& !query.distinct && !need_aggregate && !has_having && !has_order_by
				&& query.limit_length)
			{
				executePreLimit(streams);
			}
		}

		if (from_stage <= QueryProcessingStage::WithMergeableState
			&& to_stage > QueryProcessingStage::WithMergeableState)
		{
			if (need_aggregate)
			{
				/// Если нужно объединить агрегированные результаты с нескольких серверов
				if (from_stage == QueryProcessingStage::WithMergeableState)
					executeMergeAggregated(streams);
				
				executeFinalizeAggregates(streams);
			}
			
			if (has_having)
				executeHaving(streams, before_having);
			
			executeOuterExpression(streams, before_order_and_select);
			
			if (has_order_by)
				executeOrder(streams);
			
			executeProjection(streams, final_projection);
			
			/// Сначала выполняем DISTINCT во всех источниках.
			executeDistinct(streams, true);

			/// На этой стадии можно считать минимумы и максимумы, если надо.
			if (settings.extremes)
				for (BlockInputStreams::iterator it = streams.begin(); it != streams.end(); ++it)
					if (IProfilingBlockInputStream * stream = dynamic_cast<IProfilingBlockInputStream *>(&**it))
						stream->enableExtremes();

			/** Оптимизация - если источников несколько и есть LIMIT, то сначала применим предварительный LIMIT,
			  * ограничивающий число записей в каждом до offset + limit.
			  */
			if (query.limit_length && streams.size() > 1)
				executePreLimit(streams);
			
			bool need_second_distinct_pass = streams.size() > 1;
			
			executeUnion(streams);
			
			/// Если было более одного источника - то нужно выполнить DISTINCT ещё раз после их слияния.
			if (need_second_distinct_pass)
				executeDistinct(streams, false);
			
			/** NOTE: В некоторых случаях, DISTINCT можно было бы применять раньше
			  *  - до сортировки и, возможно, на удалённых серверах.
			  */

			executeLimit(streams);
		}
	}

	executeUnion(streams);

	/// Ограничения на результат, квота на результат, а также колбек для прогресса.
	if (IProfilingBlockInputStream * stream = dynamic_cast<IProfilingBlockInputStream *>(&*streams[0]))
	{
		IProfilingBlockInputStream::LocalLimits limits;
		limits.max_rows_to_read = settings.limits.max_result_rows;
		limits.max_bytes_to_read = settings.limits.max_result_bytes;
		limits.read_overflow_mode = settings.limits.result_overflow_mode;

		stream->setLimits(limits);
		stream->setQuota(context.getQuota(), IProfilingBlockInputStream::QUOTA_RESULT);

		stream->setProgressCallback(context.getProgressCallback());
	}

	return streams[0];
}


static void getLimitLengthAndOffset(ASTSelectQuery & query, size_t & length, size_t & offset)
{
	length = 0;
	offset = 0;
	if (query.limit_length)
	{
		length = safeGet<UInt64>(dynamic_cast<ASTLiteral &>(*query.limit_length).value);
		if (query.limit_offset)
			offset = safeGet<UInt64>(dynamic_cast<ASTLiteral &>(*query.limit_offset).value);
	}
}


QueryProcessingStage::Enum InterpreterSelectQuery::executeFetchColumns(BlockInputStreams & streams)
{
	/// Таблица, откуда читать данные, если не подзапрос.
	StoragePtr table;
	/// Интерпретатор подзапроса, если подзапрос
	SharedPtr<InterpreterSelectQuery> interpreter_subquery;

	if (!query.table || !dynamic_cast<ASTSelectQuery *>(&*query.table))
		table = getTable();
	else
		interpreter_subquery = new InterpreterSelectQuery(query.table, context, QueryProcessingStage::Complete, subquery_depth + 1);

	if (query.sample_size && (!table || !table->supportsSampling()))
		throw Exception("Illegal SAMPLE: table doesn't support sampling", ErrorCodes::SAMPLING_NOT_SUPPORTED);
	
	if (query.final && (!table || !table->supportsFinal()))
		throw Exception("Illegal FINAL", ErrorCodes::ILLEGAL_FINAL);
	
	/** При распределённой обработке запроса, в потоках почти не делается вычислений,
	  *  а делается ожидание и получение данных с удалённых серверов.
	  * Если у нас 20 удалённых серверов, а max_threads = 8, то было бы не очень хорошо
	  *  соединяться и опрашивать только по 8 серверов одновременно.
	  * Чтобы одновременно опрашивалось больше удалённых серверов,
	  *  вместо max_threads используется max_distributed_connections.
	  *
	  * Сохраним изначальное значение max_threads в settings_for_storage
	  *  - эти настройки будут переданы на удалённые серверы при распределённой обработке запроса,
	  *  и там должно быть оригинальное значение max_threads, а не увеличенное.
	  */
	Settings settings_for_storage = settings;
	if (table && table->isRemote())
		settings.max_threads = settings.max_distributed_connections;
	
	/// Список столбцов, которых нужно прочитать, чтобы выполнить запрос.
	Names required_columns = query_analyzer->getRequiredColumns();

	/// Ограничение на количество столбцов для чтения.
	if (settings.limits.max_columns_to_read && required_columns.size() > settings.limits.max_columns_to_read)
		throw Exception("Limit for number of columns to read exceeded. "
			"Requested: " + toString(required_columns.size())
			+ ", maximum: " + toString(settings.limits.max_columns_to_read),
			ErrorCodes::TOO_MUCH_COLUMNS);

	size_t limit_length = 0;
	size_t limit_offset = 0;
	getLimitLengthAndOffset(query, limit_length, limit_offset);

	/** Оптимизация - если не указаны DISTINCT, WHERE, GROUP, HAVING, ORDER, но указан LIMIT, и limit + offset < max_block_size,
	  *  то в качестве размера блока будем использовать limit + offset (чтобы не читать из таблицы больше, чем запрошено),
	  *  а также установим количество потоков в 1 и отменим асинхронное выполнение конвейера запроса.
	  */
	if (!query.distinct && !query.where_expression && !query.group_expression_list && !query.having_expression && !query.order_expression_list
		&& query.limit_length && !query_analyzer->hasAggregation() && limit_length + limit_offset < settings.max_block_size)
	{
		settings.max_block_size = limit_length + limit_offset;
		settings.max_threads = 1;
		settings.asynchronous = false;
	}

	QueryProcessingStage::Enum from_stage = QueryProcessingStage::FetchColumns;
	
	/// Инициализируем изначальные потоки данных, на которые накладываются преобразования запроса. Таблица или подзапрос?
	if (!query.table || !dynamic_cast<ASTSelectQuery *>(&*query.table))
 		streams = table->read(required_columns, query_ptr, settings_for_storage, from_stage, settings.max_block_size, settings.max_threads);
	else
		streams.push_back(maybeAsynchronous(interpreter_subquery->execute(), settings.asynchronous));

	/** Если истчоников слишком много, то склеим их в max_threads источников.
	  * (Иначе действия в каждом маленьком источнике, а затем объединение состояний, слишком неэффективно.)
	  */
	if (streams.size() > settings.max_threads)
		streams = narrowBlockInputStreams(streams, settings.max_threads);

	/** Установка ограничений и квоты на чтение данных.
	  * Они устанавливаются на самые "глубокие" чтения.
	  * То есть, не должны устанавливаться для чтений из удалённых серверов и подзапросов.
	  */
	if (table && !table->isRemote())
	{
		IProfilingBlockInputStream::LocalLimits limits;
		limits.max_rows_to_read = settings.limits.max_rows_to_read;
		limits.max_bytes_to_read = settings.limits.max_bytes_to_read;
		limits.read_overflow_mode = settings.limits.read_overflow_mode;
		limits.max_execution_time = settings.limits.max_execution_time;
		limits.timeout_overflow_mode = settings.limits.timeout_overflow_mode;
		limits.min_execution_speed = settings.limits.min_execution_speed;
		limits.timeout_before_checking_execution_speed = settings.limits.timeout_before_checking_execution_speed;

		QuotaForIntervals & quota = context.getQuota();
		
		for (BlockInputStreams::iterator it = streams.begin(); it != streams.end(); ++it)
		{
			if (IProfilingBlockInputStream * stream = dynamic_cast<IProfilingBlockInputStream *>(&**it))
			{
				stream->setLimits(limits);
				stream->setQuota(quota, IProfilingBlockInputStream::QUOTA_READ);
			}
		}
	}

	return from_stage;
}


void InterpreterSelectQuery::executeWhere(BlockInputStreams & streams, ExpressionActionsPtr expression)
{
	bool is_async = settings.asynchronous && streams.size() <= settings.max_threads;
	for (BlockInputStreams::iterator it = streams.begin(); it != streams.end(); ++it)
	{
		BlockInputStreamPtr & stream = *it;
		stream = maybeAsynchronous(new ExpressionBlockInputStream(stream, expression), is_async);
		stream = maybeAsynchronous(new FilterBlockInputStream(stream, query.where_expression->getColumnName()), is_async);
	}
}


void InterpreterSelectQuery::executeAggregation(BlockInputStreams & streams, ExpressionActionsPtr expression)
{
	bool is_async = settings.asynchronous && streams.size() <= settings.max_threads;
	for (BlockInputStreams::iterator it = streams.begin(); it != streams.end(); ++it)
	{
		BlockInputStreamPtr & stream = *it;
		stream = maybeAsynchronous(new ExpressionBlockInputStream(stream, expression), is_async);
	}

	BlockInputStreamPtr & stream = streams[0];

	Names key_names;
	AggregateDescriptions aggregates;
	query_analyzer->getAggregateInfo(key_names, aggregates);

	bool separate_totals = to_stage > QueryProcessingStage::WithMergeableState;
	
	/// Если источников несколько, то выполняем параллельную агрегацию
	if (streams.size() > 1)
	{
		stream = maybeAsynchronous(new ParallelAggregatingBlockInputStream(streams, key_names, aggregates, query.group_by_with_totals, separate_totals,
			settings.max_threads, settings.limits.max_rows_to_group_by, settings.limits.group_by_overflow_mode), settings.asynchronous);
		streams.resize(1);

	/*	stream = maybeAsynchronous(
			new SplittingAggregatingBlockInputStream(
				new UnionBlockInputStream(streams, settings.max_threads), key_names, aggregates, settings.max_threads),
			settings.asynchronous);
		
		streams.resize(1);*/
	}
	else
		stream = maybeAsynchronous(new AggregatingBlockInputStream(stream, key_names, aggregates, query.group_by_with_totals, separate_totals,
			settings.limits.max_rows_to_group_by, settings.limits.group_by_overflow_mode), settings.asynchronous);
}


void InterpreterSelectQuery::executeFinalizeAggregates(BlockInputStreams & streams)
{
	Names key_names;
	AggregateDescriptions aggregates;
	query_analyzer->getAggregateInfo(key_names, aggregates);
	
	/// Финализируем агрегатные функции - заменяем их состояния вычислений на готовые значения
	BlockInputStreamPtr & stream = streams[0];
	stream = maybeAsynchronous(new FinalizingAggregatedBlockInputStream(stream, aggregates), settings.asynchronous);
}


void InterpreterSelectQuery::executeMergeAggregated(BlockInputStreams & streams)
{
	/// Если объединять нечего
	if (streams.size() == 1)
		return;

	/// Склеим несколько источников в один
	streams[0] = new UnionBlockInputStream(streams, settings.max_threads);
	streams.resize(1);

	bool separate_totals = to_stage > QueryProcessingStage::WithMergeableState;

	/// Теперь объединим агрегированные блоки
	Names key_names;
	AggregateDescriptions aggregates;
	query_analyzer->getAggregateInfo(key_names, aggregates);
	streams[0] = maybeAsynchronous(new MergingAggregatedBlockInputStream(streams[0], key_names, aggregates, query.group_by_with_totals, separate_totals), settings.asynchronous);
}


void InterpreterSelectQuery::executeHaving(BlockInputStreams & streams, ExpressionActionsPtr expression)
{
	bool is_async = settings.asynchronous && streams.size() <= settings.max_threads;
	for (BlockInputStreams::iterator it = streams.begin(); it != streams.end(); ++it)
	{
		BlockInputStreamPtr & stream = *it;
		stream = maybeAsynchronous(new ExpressionBlockInputStream(stream, expression), is_async);
		stream = maybeAsynchronous(new FilterBlockInputStream(stream, query.having_expression->getColumnName()), is_async);
	}
}


void InterpreterSelectQuery::executeOuterExpression(BlockInputStreams & streams, ExpressionActionsPtr expression)
{
	bool is_async = settings.asynchronous && streams.size() <= settings.max_threads;
	for (BlockInputStreams::iterator it = streams.begin(); it != streams.end(); ++it)
	{
		BlockInputStreamPtr & stream = *it;
		stream = maybeAsynchronous(new ExpressionBlockInputStream(stream, expression), is_async);
	}
}


void InterpreterSelectQuery::executeOrder(BlockInputStreams & streams)
{
	SortDescription order_descr;
	order_descr.reserve(query.order_expression_list->children.size());
	for (ASTs::iterator it = query.order_expression_list->children.begin();
		it != query.order_expression_list->children.end();
		++it)
	{
		String name = (*it)->children.front()->getColumnName();
		order_descr.push_back(SortColumnDescription(name, dynamic_cast<ASTOrderByElement &>(**it).direction));
	}

	/// Если есть LIMIT - можно делать частичную сортировку.
	size_t limit_length = 0;
	size_t limit_offset = 0;
	getLimitLengthAndOffset(query, limit_length, limit_offset);
	size_t limit = limit_length + limit_offset;

	bool is_async = settings.asynchronous && streams.size() <= settings.max_threads;
	for (BlockInputStreams::iterator it = streams.begin(); it != streams.end(); ++it)
	{
		BlockInputStreamPtr & stream = *it;
		IProfilingBlockInputStream * sorting_stream = new PartialSortingBlockInputStream(stream, order_descr, limit);

		/// Ограничения на сортировку
		IProfilingBlockInputStream::LocalLimits limits;
		limits.max_rows_to_read = settings.limits.max_rows_to_sort;
		limits.max_bytes_to_read = settings.limits.max_bytes_to_sort;
		limits.read_overflow_mode = settings.limits.sort_overflow_mode;
		sorting_stream->setLimits(limits);
			
		stream = maybeAsynchronous(sorting_stream, is_async);
	}

	BlockInputStreamPtr & stream = streams[0];

	/// Если потоков несколько, то объединяем их в один
	if (streams.size() > 1)
	{
		stream = new UnionBlockInputStream(streams, settings.max_threads);
		streams.resize(1);
	}

	/// Сливаем сортированные блоки TODO: таймаут на слияние.
	stream = maybeAsynchronous(new MergeSortingBlockInputStream(stream, order_descr, limit), is_async);
}


void InterpreterSelectQuery::executeProjection(BlockInputStreams & streams, ExpressionActionsPtr expression)
{
	bool is_async = settings.asynchronous && streams.size() <= settings.max_threads;
	for (BlockInputStreams::iterator it = streams.begin(); it != streams.end(); ++it)
	{
		BlockInputStreamPtr & stream = *it;
		stream = maybeAsynchronous(new ExpressionBlockInputStream(stream, expression), is_async);
	}
}


void InterpreterSelectQuery::executeDistinct(BlockInputStreams & streams, bool before_order)
{
	if (query.distinct)
	{
		size_t limit_length = 0;
		size_t limit_offset = 0;
		getLimitLengthAndOffset(query, limit_length, limit_offset);

		size_t limit_for_distinct = 0;

		/// Если после этой стадии DISTINCT не будет выполняться ORDER BY, то можно достать не более limit_length + limit_offset различных строк.
		if (!query.order_expression_list || !before_order)
			limit_for_distinct = limit_length + limit_offset;

		bool is_async = settings.asynchronous && streams.size() <= settings.max_threads;
		for (BlockInputStreams::iterator it = streams.begin(); it != streams.end(); ++it)
		{
			BlockInputStreamPtr & stream = *it;
			stream = maybeAsynchronous(new DistinctBlockInputStream(stream, settings.limits, limit_for_distinct), is_async);
		}
	}
}


void InterpreterSelectQuery::executeUnion(BlockInputStreams & streams)
{
	/// Если до сих пор есть несколько потоков, то объединяем их в один
	if (streams.size() > 1)
	{
		streams[0] = new UnionBlockInputStream(streams, settings.max_threads);
		streams.resize(1);
	}
}


/// Предварительный LIMIT - применяется в каждом источнике, если источников несколько, до их объединения.
void InterpreterSelectQuery::executePreLimit(BlockInputStreams & streams)
{
	size_t limit_length = 0;
	size_t limit_offset = 0;
	getLimitLengthAndOffset(query, limit_length, limit_offset);

	/// Если есть LIMIT
	if (query.limit_length)
	{
		for (BlockInputStreams::iterator it = streams.begin(); it != streams.end(); ++it)
		{
			BlockInputStreamPtr & stream = *it;
			stream = new LimitBlockInputStream(stream, limit_length + limit_offset, 0);
		}
	}
}


void InterpreterSelectQuery::executeLimit(BlockInputStreams & streams)
{
	size_t limit_length = 0;
	size_t limit_offset = 0;
	getLimitLengthAndOffset(query, limit_length, limit_offset);

	/// Если есть LIMIT
	if (query.limit_length)
	{
		BlockInputStreamPtr & stream = streams[0];
		stream = new LimitBlockInputStream(stream, limit_length, limit_offset);
	}
}


BlockInputStreamPtr InterpreterSelectQuery::executeAndFormat(WriteBuffer & buf)
{
	Block sample = getSampleBlock();
	String format_name = query.format ? dynamic_cast<ASTIdentifier &>(*query.format).name : context.getDefaultFormat();

	BlockInputStreamPtr in = execute();
	BlockOutputStreamPtr out = context.getFormatFactory().getOutput(format_name, buf, sample);

	copyData(*in, *out);

	return in;
}


}
-												dbms: development [#CONV-2944].



											
										
										
											2011-08-28 05:13:24 +00:00
+								#include <DB/DataStreams/ExpressionBlockInputStream.h>
 								#include <DB/DataStreams/FilterBlockInputStream.h>
 								#include <DB/DataStreams/LimitBlockInputStream.h>
-												dbms: development [#CONV-2944].



											
										
										
											2011-09-04 05:14:52 +00:00
+								#include <DB/DataStreams/PartialSortingBlockInputStream.h>
 								#include <DB/DataStreams/MergeSortingBlockInputStream.h>
-												dbms: development [#CONV-2944].



											
										
										
											2011-09-25 03:37:09 +00:00
+								#include <DB/DataStreams/AggregatingBlockInputStream.h>
 								#include <DB/DataStreams/FinalizingAggregatedBlockInputStream.h>
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-30 01:38:02 +00:00
+								#include <DB/DataStreams/MergingAggregatedBlockInputStream.h>
-												dbms: development [#CONV-2944].



											
										
										
											2011-11-28 05:51:33 +00:00
+								#include <DB/DataStreams/AsynchronousBlockInputStream.h>
-												dbms: development [#CONV-2944].



											
										
										
											2012-01-10 22:11:51 +00:00
+								#include <DB/DataStreams/UnionBlockInputStream.h>
-												dbms: development [#CONV-2944].



											
										
										
											2012-02-27 06:28:20 +00:00
+								#include <DB/DataStreams/ParallelAggregatingBlockInputStream.h>
-												dbms: added new aggregation method [#CONV-2944].



											
										
										
											2013-09-15 10:53:10 +00:00
+								#include <DB/DataStreams/SplittingAggregatingBlockInputStream.h>
-												dbms: added DISTINCT [#CONV-7756].



											
										
										
											2013-06-01 07:43:57 +00:00
+								#include <DB/DataStreams/DistinctBlockInputStream.h>
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-30 04:45:49 +00:00
+								#include <DB/DataStreams/NullBlockInputStream.h>
-												dbms: development [#CONV-2944].



											
										
										
											2012-06-25 02:52:51 +00:00
+								#include <DB/DataStreams/narrowBlockInputStreams.h>
-												dbms: development [#CONV-2944].



											
										
										
											2011-10-30 05:19:41 +00:00
+								#include <DB/DataStreams/copyData.h>
-												dbms: development [#CONV-2944].



											
										
										
											2011-08-28 05:13:24 +00:00
 								#include <DB/Parsers/ASTSelectQuery.h>
 								#include <DB/Parsers/ASTIdentifier.h>
-												dbms: development [#CONV-2944].



											
										
										
											2011-09-04 05:14:52 +00:00
+								#include <DB/Parsers/ASTFunction.h>
-												dbms: development [#CONV-2944].



											
										
										
											2011-08-28 08:02:11 +00:00
+								#include <DB/Parsers/ASTLiteral.h>
-												dbms: development [#CONV-2944].



											
										
										
											2011-09-04 05:14:52 +00:00
+								#include <DB/Parsers/ASTOrderByElement.h>
-												dbms: development [#CONV-2944].



											
										
										
											2011-08-28 05:13:24 +00:00
 								#include <DB/Interpreters/InterpreterSelectQuery.h>
 								namespace DB
 								{
-												dbms: development of limits [#CONV-2944].



											
										
										
											2012-12-25 20:36:35 +00:00
+								InterpreterSelectQuery::InterpreterSelectQuery(ASTPtr query_ptr_, const Context & context_, QueryProcessingStage::Enum to_stage_,
 									size_t subquery_depth_)
-												dbms: development [#CONV-2944].



											
										
										
											2012-08-02 17:33:31 +00:00
+									: query_ptr(query_ptr_), query(dynamic_cast<ASTSelectQuery &>(*query_ptr)),
-												dbms: development of limits [#CONV-2944].



											
										
										
											2012-12-25 20:36:35 +00:00
+									context(context_), settings(context.getSettings()), to_stage(to_stage_), subquery_depth(subquery_depth_),
-												dbms: development [#CONV-2944].



											
										
										
											2012-06-25 03:56:45 +00:00
+									log(&Logger::get("InterpreterSelectQuery"))
-												dbms: development [#CONV-2944].



											
										
										
											2011-08-28 05:13:24 +00:00
+								{
-												dbms: development of limits [#CONV-2944].



											
										
										
											2012-12-25 20:36:35 +00:00
+									if (settings.limits.max_subquery_depth && subquery_depth > settings.limits.max_subquery_depth)
-												dbms: improvement [#CONV-2944].



											
										
										
											2013-06-21 20:34:19 +00:00
+										throw Exception("Too deep subqueries. Maximum: " + toString(settings.limits.max_subquery_depth),
-												dbms: development of limits [#CONV-2944].



											
										
										
											2012-12-25 20:36:35 +00:00
+											ErrorCodes::TOO_DEEP_SUBQUERIES);
-												clickhouse: switched to ExpressionAnalyzer [#CONV-7444].


											
										
										
											2013-06-03 10:18:41 +00:00
 									context.setColumns(!query.table || !dynamic_cast<ASTSelectQuery *>(&*query.table)
 										? getTable()->getColumnsList()
 										: InterpreterSelectQuery(query.table, context).getSampleBlock().getColumnsList());
 									if (context.getColumns().empty())
 										throw Exception("There is no available columns", ErrorCodes::THERE_IS_NO_COLUMN);
 									query_analyzer = new ExpressionAnalyzer(query_ptr, context, subquery_depth);
-												dbms: development [#CONV-2944].



											
										
										
											2011-08-28 05:13:24 +00:00
+								}
-												dbms: development [#CONV-2944].



											
										
										
											2012-08-20 19:21:04 +00:00
+								void InterpreterSelectQuery::getDatabaseAndTableNames(String & database_name, String & table_name)
-												dbms: development [#CONV-2944].



											
										
										
											2011-08-28 05:13:24 +00:00
+								{
 									/** Если таблица не указана - используем таблицу system.one.
 									  * Если база данных не указана - используем текущую базу данных.
 									  */
 									if (!query.table)
 									{
 										database_name = "system";
 										table_name = "one";
 									}
 									else if (!query.database)
-												dbms: development [#CONV-2944].



											
										
										
											2012-08-02 17:33:31 +00:00
+										database_name = context.getCurrentDatabase();
-												dbms: development [#CONV-2944].



											
										
										
											2011-08-28 05:13:24 +00:00
 									if (query.database)
 										database_name = dynamic_cast<ASTIdentifier &>(*query.database).name;
 									if (query.table)
 										table_name = dynamic_cast<ASTIdentifier &>(*query.table).name;
-												dbms: development [#CONV-2944].



											
										
										
											2012-08-20 19:21:04 +00:00
+								}
-												dbms: development [#CONV-2944].



											
										
										
											2011-08-28 05:13:24 +00:00
-												dbms: development [#CONV-2944].



											
										
										
											2012-08-20 19:21:04 +00:00
+								StoragePtr InterpreterSelectQuery::getTable()
 								{
 									String database_name;
 									String table_name;
 									getDatabaseAndTableNames(database_name, table_name);
-												dbms: development [#CONV-2944].



											
										
										
											2012-08-02 17:33:31 +00:00
+									return context.getTable(database_name, table_name);
-												dbms: development [#CONV-2944].



											
										
										
											2011-08-28 05:13:24 +00:00
+								}
-												dbms: development [#CONV-2944].



											
										
										
											2012-08-20 19:21:04 +00:00
+								ASTPtr InterpreterSelectQuery::getCreateQuery()
 								{
 									String database_name;
 									String table_name;
 									getDatabaseAndTableNames(database_name, table_name);
 									return context.getCreateQuery(database_name, table_name);
 								}
-												dbms: development [#CONV-2944].



											
										
										
											2011-08-28 05:13:24 +00:00
+								DataTypes InterpreterSelectQuery::getReturnTypes()
 								{
-												clickhouse: switched to ExpressionAnalyzer [#CONV-7444].


											
										
										
											2013-06-03 10:18:41 +00:00
+									DataTypes res;
 									NamesAndTypesList columns = query_analyzer->getSelectSampleBlock().getColumnsList();
 									for (NamesAndTypesList::iterator it = columns.begin(); it != columns.end(); ++it)
 									{
 										res.push_back(it->second);
 									}
 									return res;
-												dbms: development [#CONV-2944].



											
										
										
											2011-08-28 05:13:24 +00:00
+								}
-												dbms: development [#CONV-2944].



											
										
										
											2011-10-30 05:19:41 +00:00
+								Block InterpreterSelectQuery::getSampleBlock()
 								{
-												implemented using revision version [#CONV-7906]


											
										
										
											2013-06-18 14:12:10 +00:00
+									Block block = query_analyzer->getSelectSampleBlock();
 									/// создадим ненулевые колонки, чтобы SampleBlock можно было
 									/// писать (читать) с помощью BlockOut(In)putStream'ов
 									for (size_t i = 0; i < block.columns(); ++i)
 									{
 										ColumnWithNameAndType & col = block.getByPosition(i);
-												added comments, fixed non-emptiness of SelectSampleBlock [#CONV-7906]


											
										
										
											2013-06-19 13:09:28 +00:00
+										col.column = col.type->createColumn();
-												implemented using revision version [#CONV-7906]


											
										
										
											2013-06-18 14:12:10 +00:00
+									}
 									return block;
-												dbms: development [#CONV-2944].



											
										
										
											2011-10-30 05:19:41 +00:00
+								}
-												dbms: development [#CONV-2944].



											
										
										
											2012-03-05 00:09:41 +00:00
+								/// Превращает источник в асинхронный, если это указано.
 								static inline BlockInputStreamPtr maybeAsynchronous(BlockInputStreamPtr in, bool is_async)
 								{
 									return is_async
 										? new AsynchronousBlockInputStream(in)
 										: in;
 								}
-												dbms: development [#CONV-2944].



											
										
										
											2011-08-28 05:13:24 +00:00
+								BlockInputStreamPtr InterpreterSelectQuery::execute()
 								{
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-09 13:12:38 +00:00
+									/** Потоки данных. При параллельном выполнении запроса, имеем несколько потоков данных.
 									  * Если нет GROUP BY, то выполним все операции до ORDER BY и LIMIT параллельно, затем
 									  *  если есть ORDER BY, то склеим потоки с помощью UnionBlockInputStream, а затем MergеSortingBlockInputStream,
 									  *  если нет, то склеим с помощью UnionBlockInputStream,
 									  *  затем применим LIMIT.
 									  * Если есть GROUP BY, то выполним все операции до GROUP BY, включительно, параллельно;
 									  *  параллельный GROUP BY склеит потоки в один,
 									  *  затем выполним остальные операции с одним получившимся потоком.
 									  */
 									BlockInputStreams streams;
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-22 18:32:45 +00:00
+									/** Вынем данные из Storage. from_stage - до какой стадии запрос был выполнен в Storage. */
-												clickhouse: switched to ExpressionAnalyzer [#CONV-7444].


											
										
										
											2013-06-03 10:18:41 +00:00
+									QueryProcessingStage::Enum from_stage = executeFetchColumns(streams);
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-09 13:12:38 +00:00
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-30 04:45:49 +00:00
+									/** Если данных нет. */
 									if (streams.empty())
 										return new NullBlockInputStream;
-												dbms: development [#CONV-2944].



											
										
										
											2012-06-25 03:56:45 +00:00
+									LOG_TRACE(log, QueryProcessingStage::toString(from_stage) << " -> " << QueryProcessingStage::toString(to_stage));
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-30 01:38:02 +00:00
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-22 18:32:45 +00:00
+									if (to_stage > QueryProcessingStage::FetchColumns)
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-09 13:12:38 +00:00
+									{
-												clickhouse: switched to ExpressionAnalyzer [#CONV-7444].


											
										
										
											2013-06-03 10:18:41 +00:00
+										bool has_where      = false;
 										bool need_aggregate = false;
 										bool has_having     = false;
 										bool has_order_by   = false;
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-22 18:32:45 +00:00
-												clickhouse: switched to ExpressionAnalyzer [#CONV-7444].


											
										
										
											2013-06-03 10:18:41 +00:00
+										ExpressionActionsPtr before_where;
 										ExpressionActionsPtr before_aggregation;
 										ExpressionActionsPtr before_having;
 										ExpressionActionsPtr before_order_and_select;
 										ExpressionActionsPtr final_projection;
 										/// Сначала составим цепочку действий и запомним нужные шаги из нее.
 										ExpressionActionsChain chain;
 										need_aggregate = query_analyzer->hasAggregation();
 										if (from_stage < QueryProcessingStage::WithMergeableState
 											&& to_stage >= QueryProcessingStage::WithMergeableState)
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-22 18:32:45 +00:00
+										{
-												reorganized adding of MULTIPLE_ARRAY_JOIN action (appendArrayJoin) [#CONV-7967]


											
										
										
											2013-07-26 16:33:05 +00:00
+											query_analyzer->appendArrayJoin(chain);
-												clickhouse: switched to ExpressionAnalyzer [#CONV-7444].


											
										
										
											2013-06-03 10:18:41 +00:00
+											if (query_analyzer->appendWhere(chain))
 											{
 												has_where = true;
-												clickhouse: removed Expression, fixed tests [#CONV-7444].


											
										
										
											2013-06-05 12:46:41 +00:00
+												before_where = chain.getLastActions();
-												clickhouse: switched to ExpressionAnalyzer [#CONV-7444].


											
										
										
											2013-06-03 10:18:41 +00:00
 												/// Если кроме WHERE ничего выполнять не нужно, пометим все исходные столбцы как нужные, чтобы finalize их не выбросил.
 												if (!need_aggregate && to_stage == QueryProcessingStage::WithMergeableState)
 												{
 													Names columns = query_analyzer->getRequiredColumns();
-												clickhouse: removed Expression, fixed tests [#CONV-7444].


											
										
										
											2013-06-05 12:46:41 +00:00
+													chain.getLastStep().required_output.insert(chain.getLastStep().required_output.end(),
-												clickhouse: switched to ExpressionAnalyzer [#CONV-7444].


											
										
										
											2013-06-03 10:18:41 +00:00
+																							columns.begin(), columns.end());
 													chain.finalize();
 												}
 												else
 												{
 													chain.addStep();
 												}
 											}
-												clickhouse: fixed subqueries with Distributed tables [#CONV-6822].


											
										
										
											2013-03-27 12:04:48 +00:00
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-22 18:32:45 +00:00
+											if (need_aggregate)
-												clickhouse: switched to ExpressionAnalyzer [#CONV-7444].


											
										
										
											2013-06-03 10:18:41 +00:00
+											{
 												query_analyzer->appendGroupBy(chain);
 												query_analyzer->appendAggregateFunctionsArguments(chain);
-												clickhouse: removed Expression, fixed tests [#CONV-7444].


											
										
										
											2013-06-05 12:46:41 +00:00
+												before_aggregation = chain.getLastActions();
-												clickhouse: switched to ExpressionAnalyzer [#CONV-7444].


											
										
										
											2013-06-03 10:18:41 +00:00
 												chain.finalize();
 												chain.clear();
 											}
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-22 18:32:45 +00:00
+										}
-												clickhouse: switched to ExpressionAnalyzer [#CONV-7444].


											
										
										
											2013-06-03 10:18:41 +00:00
 										if (from_stage <= QueryProcessingStage::WithMergeableState
 											&& to_stage > QueryProcessingStage::WithMergeableState)
-												clickhouse: fixed subqueries with Distributed tables [#CONV-6822].


											
										
										
											2013-03-27 12:04:48 +00:00
+										{
-												clickhouse: switched to ExpressionAnalyzer [#CONV-7444].


											
										
										
											2013-06-03 10:18:41 +00:00
+											if (need_aggregate && query_analyzer->appendHaving(chain))
 											{
 												has_having = true;
-												clickhouse: removed Expression, fixed tests [#CONV-7444].


											
										
										
											2013-06-05 12:46:41 +00:00
+												before_having = chain.getLastActions();
-												clickhouse: switched to ExpressionAnalyzer [#CONV-7444].


											
										
										
											2013-06-03 10:18:41 +00:00
+												chain.addStep();
 											}
 											query_analyzer->appendSelect(chain);
 											has_order_by = query_analyzer->appendOrderBy(chain);
-												clickhouse: removed Expression, fixed tests [#CONV-7444].


											
										
										
											2013-06-05 12:46:41 +00:00
+											before_order_and_select = chain.getLastActions();
-												clickhouse: switched to ExpressionAnalyzer [#CONV-7444].


											
										
										
											2013-06-03 10:18:41 +00:00
+											chain.addStep();
 											query_analyzer->appendProjectResult(chain);
-												clickhouse: removed Expression, fixed tests [#CONV-7444].


											
										
										
											2013-06-05 12:46:41 +00:00
+											final_projection = chain.getLastActions();
-												clickhouse: switched to ExpressionAnalyzer [#CONV-7444].


											
										
										
											2013-06-03 10:18:41 +00:00
+											chain.finalize();
-												clickhouse: fixed arrayJoin with distributed tables [#CONV-7444].


											
										
										
											2013-06-17 14:57:03 +00:00
+											/// Если предыдущая стадия запроса выполнялась отдельно, нам могли дать лишних столбцов (например, используемых только в секции WHERE).
 											/// Уберем их. Они могут существенно мешать, например, при arrayJoin.
 											if (from_stage == QueryProcessingStage::WithMergeableState)
 												before_order_and_select->prependProjectInput();
-												clickhouse: switched to ExpressionAnalyzer [#CONV-7444].


											
										
										
											2013-06-03 10:18:41 +00:00
+											/// Перед выполнением HAVING уберем из блока лишние столбцы (в основном, ключи агрегации).
 											if (has_having)
 												before_having->prependProjectInput();
-												clickhouse: fixed subqueries with Distributed tables [#CONV-6822].


											
										
										
											2013-03-27 12:04:48 +00:00
+										}
-												clickhouse: switched to ExpressionAnalyzer [#CONV-7444].


											
										
										
											2013-06-03 10:18:41 +00:00
 										/// Теперь составим потоки блоков, выполняющие нужные действия.
 										if (from_stage < QueryProcessingStage::WithMergeableState
 											&& to_stage >= QueryProcessingStage::WithMergeableState)
 										{
 											if (has_where)
 												executeWhere(streams, before_where);
 											if (need_aggregate)
 												executeAggregation(streams, before_aggregation);
-												dbms: improvement: using pre-LIMIT on remote servers when query is streaming [#CONV-2944].



											
										
										
											2013-06-29 20:32:33 +00:00
 											/** Оптимизация - при распределённой обработке запроса, на удалённом сервере,
 											  *  если не указаны DISTINCT, GROUP, HAVING, ORDER, но указан LIMIT,
 											  *  то выполним предварительный LIMIT на удалёном сервере.
 											  */
 											if (to_stage == QueryProcessingStage::WithMergeableState
 												&& !query.distinct && !need_aggregate && !has_having && !has_order_by
 												&& query.limit_length)
 											{
 												executePreLimit(streams);
 											}
-												clickhouse: switched to ExpressionAnalyzer [#CONV-7444].


											
										
										
											2013-06-03 10:18:41 +00:00
+										}
-												dbms: improvement: using pre-LIMIT on remote servers when query is streaming [#CONV-2944].



											
										
										
											2013-06-29 20:32:33 +00:00
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-22 18:32:45 +00:00
+										if (from_stage <= QueryProcessingStage::WithMergeableState
 											&& to_stage > QueryProcessingStage::WithMergeableState)
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-09 13:12:38 +00:00
+										{
 											if (need_aggregate)
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-30 01:38:02 +00:00
+											{
 												/// Если нужно объединить агрегированные результаты с нескольких серверов
 												if (from_stage == QueryProcessingStage::WithMergeableState)
-												clickhouse: switched to ExpressionAnalyzer [#CONV-7444].


											
										
										
											2013-06-03 10:18:41 +00:00
+													executeMergeAggregated(streams);
 												executeFinalizeAggregates(streams);
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-30 01:38:02 +00:00
+											}
-												clickhouse: switched to ExpressionAnalyzer [#CONV-7444].


											
										
										
											2013-06-03 10:18:41 +00:00
 											if (has_having)
 												executeHaving(streams, before_having);
 											executeOuterExpression(streams, before_order_and_select);
 											if (has_order_by)
 												executeOrder(streams);
 											executeProjection(streams, final_projection);
-												dbms: added DISTINCT [#CONV-7756].



											
										
										
											2013-06-01 07:43:57 +00:00
+											/// Сначала выполняем DISTINCT во всех источниках.
 											executeDistinct(streams, true);
-												dbms: added calculation of min/max [#CONV-8691].



											
										
										
											2013-09-07 02:03:13 +00:00
+											/// На этой стадии можно считать минимумы и максимумы, если надо.
 											if (settings.extremes)
 												for (BlockInputStreams::iterator it = streams.begin(); it != streams.end(); ++it)
 													if (IProfilingBlockInputStream * stream = dynamic_cast<IProfilingBlockInputStream *>(&**it))
 														stream->enableExtremes();
-												dbms: development [#CONV-2944].



											
										
										
											2012-06-24 23:17:06 +00:00
+											/** Оптимизация - если источников несколько и есть LIMIT, то сначала применим предварительный LIMIT,
-												dbms: improvement: using pre-LIMIT on remote servers when query is streaming [#CONV-2944].



											
										
										
											2013-06-29 20:32:33 +00:00
+											  * ограничивающий число записей в каждом до offset + limit.
 											  */
-												dbms: development [#CONV-2944].



											
										
										
											2012-06-24 23:17:06 +00:00
+											if (query.limit_length && streams.size() > 1)
-												clickhouse: switched to ExpressionAnalyzer [#CONV-7444].


											
										
										
											2013-06-03 10:18:41 +00:00
+												executePreLimit(streams);
-												dbms: added DISTINCT [#CONV-7756].



											
										
										
											2013-06-01 07:43:57 +00:00
+											bool need_second_distinct_pass = streams.size() > 1;
-												clickhouse: switched to ExpressionAnalyzer [#CONV-7444].


											
										
										
											2013-06-03 10:18:41 +00:00
 											executeUnion(streams);
-												dbms: added DISTINCT [#CONV-7756].



											
										
										
											2013-06-01 07:43:57 +00:00
+											/// Если было более одного источника - то нужно выполнить DISTINCT ещё раз после их слияния.
 											if (need_second_distinct_pass)
 												executeDistinct(streams, false);
-												clickhouse: switched to ExpressionAnalyzer [#CONV-7444].


											
										
										
											2013-06-03 10:18:41 +00:00
-												dbms: added DISTINCT [#CONV-7756].



											
										
										
											2013-06-01 07:43:57 +00:00
+											/** NOTE: В некоторых случаях, DISTINCT можно было бы применять раньше
-												dbms: improvement: using pre-LIMIT on remote servers when query is streaming [#CONV-2944].



											
										
										
											2013-06-29 20:32:33 +00:00
+											  *  - до сортировки и, возможно, на удалённых серверах.
 											  */
-												clickhouse: switched to ExpressionAnalyzer [#CONV-7444].


											
										
										
											2013-06-03 10:18:41 +00:00
+											executeLimit(streams);
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-09 13:12:38 +00:00
+										}
 									}
-												clickhouse: switched to ExpressionAnalyzer [#CONV-7444].


											
										
										
											2013-06-03 10:18:41 +00:00
+									executeUnion(streams);
-												dbms: development of limits [#CONV-2944].



											
										
										
											2012-12-25 20:36:35 +00:00
-												dbms: Quota: development [#CONV-8459].



											
										
										
											2013-08-28 20:47:22 +00:00
+									/// Ограничения на результат, квота на результат, а также колбек для прогресса.
-												dbms: development of limits [#CONV-2944].



											
										
										
											2012-12-25 20:36:35 +00:00
+									if (IProfilingBlockInputStream * stream = dynamic_cast<IProfilingBlockInputStream *>(&*streams[0]))
 									{
 										IProfilingBlockInputStream::LocalLimits limits;
 										limits.max_rows_to_read = settings.limits.max_result_rows;
 										limits.max_bytes_to_read = settings.limits.max_result_bytes;
 										limits.read_overflow_mode = settings.limits.result_overflow_mode;
 										stream->setLimits(limits);
-												dbms: Quota: development [#CONV-8459].



											
										
										
											2013-08-28 20:47:22 +00:00
+										stream->setQuota(context.getQuota(), IProfilingBlockInputStream::QUOTA_RESULT);
-												dbms: sending progress while processing subqueries [#CONV-2944].



											
										
										
											2013-02-16 14:55:14 +00:00
 										stream->setProgressCallback(context.getProgressCallback());
-												dbms: development of limits [#CONV-2944].



											
										
										
											2012-12-25 20:36:35 +00:00
+									}
-												dbms: sending progress while processing subqueries [#CONV-2944].



											
										
										
											2013-02-16 14:55:14 +00:00
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-09 13:12:38 +00:00
+									return streams[0];
 								}
-												dbms: development [#CONV-2944].



											
										
										
											2011-08-28 05:13:24 +00:00
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-09 13:12:38 +00:00
+								static void getLimitLengthAndOffset(ASTSelectQuery & query, size_t & length, size_t & offset)
 								{
 									length = 0;
 									offset = 0;
 									if (query.limit_length)
 									{
-												Using own Field class instead of boost::variant (experimental) [#CONV-2944].



											
										
										
											2013-01-05 20:03:19 +00:00
+										length = safeGet<UInt64>(dynamic_cast<ASTLiteral &>(*query.limit_length).value);
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-09 13:12:38 +00:00
+										if (query.limit_offset)
-												Using own Field class instead of boost::variant (experimental) [#CONV-2944].



											
										
										
											2013-01-05 20:03:19 +00:00
+											offset = safeGet<UInt64>(dynamic_cast<ASTLiteral &>(*query.limit_offset).value);
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-09 13:12:38 +00:00
+									}
 								}
-												clickhouse: switched to ExpressionAnalyzer [#CONV-7444].


											
										
										
											2013-06-03 10:18:41 +00:00
+								QueryProcessingStage::Enum InterpreterSelectQuery::executeFetchColumns(BlockInputStreams & streams)
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-09 13:12:38 +00:00
+								{
-												dbms: development [#CONV-2944].



											
										
										
											2011-11-06 02:29:13 +00:00
+									/// Таблица, откуда читать данные, если не подзапрос.
 									StoragePtr table;
 									/// Интерпретатор подзапроса, если подзапрос
 									SharedPtr<InterpreterSelectQuery> interpreter_subquery;
-												dbms: development [#CONV-2944].



											
										
										
											2011-08-28 05:13:24 +00:00
-												dbms: development [#CONV-2944].



											
										
										
											2011-11-06 22:00:39 +00:00
+									if (!query.table || !dynamic_cast<ASTSelectQuery *>(&*query.table))
-												dbms: development [#CONV-2944].



											
										
										
											2011-11-06 02:29:13 +00:00
+										table = getTable();
 									else
-												dbms: development of limits [#CONV-2944].



											
										
										
											2012-12-25 20:36:35 +00:00
+										interpreter_subquery = new InterpreterSelectQuery(query.table, context, QueryProcessingStage::Complete, subquery_depth + 1);
-												dbms: improved distributed query processing [#CONV-2944].



											
										
										
											2012-10-30 20:15:07 +00:00
-												clickhouse: added support for SAMPLE clause of SELECT query (works only in merge tree storage) [#6201].


											
										
										
											2012-12-12 14:25:55 +00:00
+									if (query.sample_size && (!table || !table->supportsSampling()))
 										throw Exception("Illegal SAMPLE: table doesn't support sampling", ErrorCodes::SAMPLING_NOT_SUPPORTED);
-												Merge

											
										
										
											2013-04-23 11:08:41 +00:00
+									if (query.final && (!table || !table->supportsFinal()))
 										throw Exception("Illegal FINAL", ErrorCodes::ILLEGAL_FINAL);
-												dbms: improved distributed query processing [#CONV-2944].



											
										
										
											2012-10-30 20:15:07 +00:00
+									/** При распределённой обработке запроса, в потоках почти не делается вычислений,
 									  *  а делается ожидание и получение данных с удалённых серверов.
 									  * Если у нас 20 удалённых серверов, а max_threads = 8, то было бы не очень хорошо
 									  *  соединяться и опрашивать только по 8 серверов одновременно.
 									  * Чтобы одновременно опрашивалось больше удалённых серверов,
 									  *  вместо max_threads используется max_distributed_connections.
-												dbms: fixed error with passing settings to remote servers [#CONV-2944].



											
										
										
											2013-02-02 22:24:21 +00:00
+									  *
 									  * Сохраним изначальное значение max_threads в settings_for_storage
 									  *  - эти настройки будут переданы на удалённые серверы при распределённой обработке запроса,
 									  *  и там должно быть оригинальное значение max_threads, а не увеличенное.
-												dbms: improved distributed query processing [#CONV-2944].



											
										
										
											2012-10-30 20:15:07 +00:00
+									  */
-												dbms: fixed error with passing settings to remote servers [#CONV-2944].



											
										
										
											2013-02-02 22:24:21 +00:00
+									Settings settings_for_storage = settings;
-												dbms: fixed subqueries [#CONV-2944].



											
										
										
											2012-11-07 19:56:21 +00:00
+									if (table && table->isRemote())
-												dbms: improved distributed query processing [#CONV-2944].



											
										
										
											2012-10-30 20:15:07 +00:00
+										settings.max_threads = settings.max_distributed_connections;
-												dbms: development [#CONV-2944].



											
										
										
											2011-11-06 02:29:13 +00:00
 									/// Список столбцов, которых нужно прочитать, чтобы выполнить запрос.
-												clickhouse: switched to ExpressionAnalyzer [#CONV-7444].


											
										
										
											2013-06-03 10:18:41 +00:00
+									Names required_columns = query_analyzer->getRequiredColumns();
-												dbms: development [#CONV-2944].



											
										
										
											2011-08-28 08:02:11 +00:00
-												dbms: development of limits [#CONV-2944].



											
										
										
											2012-12-25 20:36:35 +00:00
+									/// Ограничение на количество столбцов для чтения.
 									if (settings.limits.max_columns_to_read && required_columns.size() > settings.limits.max_columns_to_read)
 										throw Exception("Limit for number of columns to read exceeded. "
-												dbms: improvement [#CONV-2944].



											
										
										
											2013-06-21 20:34:19 +00:00
+											"Requested: " + toString(required_columns.size())
 											+ ", maximum: " + toString(settings.limits.max_columns_to_read),
-												dbms: development of limits [#CONV-2944].



											
										
										
											2012-12-25 20:36:35 +00:00
+											ErrorCodes::TOO_MUCH_COLUMNS);
-												dbms: development [#CONV-2944].



											
										
										
											2011-09-04 05:14:52 +00:00
+									size_t limit_length = 0;
 									size_t limit_offset = 0;
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-09 13:12:38 +00:00
+									getLimitLengthAndOffset(query, limit_length, limit_offset);
-												dbms: development [#CONV-2944].



											
										
										
											2011-09-04 05:14:52 +00:00
-												dbms: added DISTINCT [#CONV-7756].



											
										
										
											2013-06-01 07:43:57 +00:00
+									/** Оптимизация - если не указаны DISTINCT, WHERE, GROUP, HAVING, ORDER, но указан LIMIT, и limit + offset < max_block_size,
-												dbms: development [#CONV-2944].



											
										
										
											2012-06-25 07:26:58 +00:00
+									  *  то в качестве размера блока будем использовать limit + offset (чтобы не читать из таблицы больше, чем запрошено),
 									  *  а также установим количество потоков в 1 и отменим асинхронное выполнение конвейера запроса.
-												dbms: development [#CONV-2944].



											
										
										
											2011-09-04 05:14:52 +00:00
+									  */
-												dbms: added DISTINCT [#CONV-7756].



											
										
										
											2013-06-01 07:43:57 +00:00
+									if (!query.distinct && !query.where_expression && !query.group_expression_list && !query.having_expression && !query.order_expression_list
-												clickhouse: switched to ExpressionAnalyzer [#CONV-7444].


											
										
										
											2013-06-03 10:18:41 +00:00
+										&& query.limit_length && !query_analyzer->hasAggregation() && limit_length + limit_offset < settings.max_block_size)
-												dbms: development [#CONV-2944].



											
										
										
											2011-09-04 05:14:52 +00:00
+									{
-												dbms: development [#CONV-2944].



											
										
										
											2012-08-02 17:33:31 +00:00
+										settings.max_block_size = limit_length + limit_offset;
 										settings.max_threads = 1;
 										settings.asynchronous = false;
-												dbms: development [#CONV-2944].



											
										
										
											2011-09-04 05:14:52 +00:00
+									}
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-22 18:32:45 +00:00
 									QueryProcessingStage::Enum from_stage = QueryProcessingStage::FetchColumns;
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-09 13:12:38 +00:00
-												dbms: development [#CONV-2944].



											
										
										
											2012-02-27 06:28:20 +00:00
+									/// Инициализируем изначальные потоки данных, на которые накладываются преобразования запроса. Таблица или подзапрос?
-												dbms: development [#CONV-2944].



											
										
										
											2011-11-06 22:00:39 +00:00
+									if (!query.table || !dynamic_cast<ASTSelectQuery *>(&*query.table))
-												dbms: fixed error with passing settings to remote servers [#CONV-2944].



											
										
										
											2013-02-02 22:24:21 +00:00
+								 		streams = table->read(required_columns, query_ptr, settings_for_storage, from_stage, settings.max_block_size, settings.max_threads);
-												dbms: development [#CONV-2944].



											
										
										
											2011-11-06 02:29:13 +00:00
+									else
-												dbms: development [#CONV-2944].



											
										
										
											2012-08-02 17:33:31 +00:00
+										streams.push_back(maybeAsynchronous(interpreter_subquery->execute(), settings.asynchronous));
-												dbms: development [#CONV-2944].



											
										
										
											2012-02-27 07:54:16 +00:00
-												dbms: development [#CONV-2944].



											
										
										
											2012-06-25 03:01:37 +00:00
+									/** Если истчоников слишком много, то склеим их в max_threads источников.
 									  * (Иначе действия в каждом маленьком источнике, а затем объединение состояний, слишком неэффективно.)
 									  */
-												dbms: development [#CONV-2944].



											
										
										
											2012-08-02 17:33:31 +00:00
+									if (streams.size() > settings.max_threads)
 										streams = narrowBlockInputStreams(streams, settings.max_threads);
-												dbms: development [#CONV-2944].



											
										
										
											2012-06-25 03:01:37 +00:00
-												dbms: Quota: development [#CONV-8459].



											
										
										
											2013-08-28 20:47:22 +00:00
+									/** Установка ограничений и квоты на чтение данных.
-												dbms: development of limits [#CONV-2944].



											
										
										
											2012-12-25 19:28:59 +00:00
+									  * Они устанавливаются на самые "глубокие" чтения.
 									  * То есть, не должны устанавливаться для чтений из удалённых серверов и подзапросов.
 									  */
 									if (table && !table->isRemote())
 									{
 										IProfilingBlockInputStream::LocalLimits limits;
 										limits.max_rows_to_read = settings.limits.max_rows_to_read;
 										limits.max_bytes_to_read = settings.limits.max_bytes_to_read;
 										limits.read_overflow_mode = settings.limits.read_overflow_mode;
 										limits.max_execution_time = settings.limits.max_execution_time;
 										limits.timeout_overflow_mode = settings.limits.timeout_overflow_mode;
 										limits.min_execution_speed = settings.limits.min_execution_speed;
 										limits.timeout_before_checking_execution_speed = settings.limits.timeout_before_checking_execution_speed;
-												dbms: Quota: development [#CONV-8459].



											
										
										
											2013-08-28 20:47:22 +00:00
 										QuotaForIntervals & quota = context.getQuota();
-												dbms: development of limits [#CONV-2944].



											
										
										
											2012-12-25 19:28:59 +00:00
 										for (BlockInputStreams::iterator it = streams.begin(); it != streams.end(); ++it)
-												dbms: Quota: development [#CONV-8459].



											
										
										
											2013-08-28 20:47:22 +00:00
+										{
-												dbms: development of limits [#CONV-2944].



											
										
										
											2012-12-25 19:28:59 +00:00
+											if (IProfilingBlockInputStream * stream = dynamic_cast<IProfilingBlockInputStream *>(&**it))
-												dbms: Quota: development [#CONV-8459].



											
										
										
											2013-08-28 20:47:22 +00:00
+											{
-												dbms: development of limits [#CONV-2944].



											
										
										
											2012-12-25 19:28:59 +00:00
+												stream->setLimits(limits);
-												dbms: Quota: development [#CONV-8459].



											
										
										
											2013-08-28 20:47:22 +00:00
+												stream->setQuota(quota, IProfilingBlockInputStream::QUOTA_READ);
 											}
 										}
-												dbms: development of limits [#CONV-2944].



											
										
										
											2012-12-25 19:28:59 +00:00
+									}
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-22 18:32:45 +00:00
+									return from_stage;
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-09 13:12:38 +00:00
+								}
-												dbms: development [#CONV-2944].



											
										
										
											2011-08-28 05:13:24 +00:00
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-09 13:12:38 +00:00
-												clickhouse: switched to ExpressionAnalyzer [#CONV-7444].


											
										
										
											2013-06-03 10:18:41 +00:00
+								void InterpreterSelectQuery::executeWhere(BlockInputStreams & streams, ExpressionActionsPtr expression)
-												dbms: development [#CONV-2944].



											
										
										
											2012-08-27 05:13:14 +00:00
+								{
-												clickhouse: switched to ExpressionAnalyzer [#CONV-7444].


											
										
										
											2013-06-03 10:18:41 +00:00
+									bool is_async = settings.asynchronous && streams.size() <= settings.max_threads;
 									for (BlockInputStreams::iterator it = streams.begin(); it != streams.end(); ++it)
-												dbms: development [#CONV-2944].



											
										
										
											2012-08-27 05:13:14 +00:00
+									{
-												clickhouse: switched to ExpressionAnalyzer [#CONV-7444].


											
										
										
											2013-06-03 10:18:41 +00:00
+										BlockInputStreamPtr & stream = *it;
 										stream = maybeAsynchronous(new ExpressionBlockInputStream(stream, expression), is_async);
 										stream = maybeAsynchronous(new FilterBlockInputStream(stream, query.where_expression->getColumnName()), is_async);
-												dbms: development [#CONV-2944].



											
										
										
											2012-08-27 05:13:14 +00:00
+									}
 								}
-												clickhouse: switched to ExpressionAnalyzer [#CONV-7444].


											
										
										
											2013-06-03 10:18:41 +00:00
+								void InterpreterSelectQuery::executeAggregation(BlockInputStreams & streams, ExpressionActionsPtr expression)
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-09 13:12:38 +00:00
+								{
-												dbms: development [#CONV-2944].



											
										
										
											2012-08-02 17:33:31 +00:00
+									bool is_async = settings.asynchronous && streams.size() <= settings.max_threads;
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-09 13:12:38 +00:00
+									for (BlockInputStreams::iterator it = streams.begin(); it != streams.end(); ++it)
 									{
 										BlockInputStreamPtr & stream = *it;
-												clickhouse: switched to ExpressionAnalyzer [#CONV-7444].


											
										
										
											2013-06-03 10:18:41 +00:00
+										stream = maybeAsynchronous(new ExpressionBlockInputStream(stream, expression), is_async);
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-09 13:12:38 +00:00
+									}
-												dbms: development [#CONV-2944].



											
										
										
											2012-02-27 06:28:20 +00:00
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-09 13:12:38 +00:00
+									BlockInputStreamPtr & stream = streams[0];
-												dbms: development [#CONV-2944].



											
										
										
											2012-02-27 06:28:20 +00:00
-												Expression replacement: development [#CONV-7444].


											
										
										
											2013-05-27 14:02:55 +00:00
+									Names key_names;
 									AggregateDescriptions aggregates;
-												clickhouse: switched to ExpressionAnalyzer [#CONV-7444].


											
										
										
											2013-06-03 10:18:41 +00:00
+									query_analyzer->getAggregateInfo(key_names, aggregates);
-												dbms: added totals as separate data in JSON formats [#CONV-8366].



											
										
										
											2013-09-01 04:55:41 +00:00
 									bool separate_totals = to_stage > QueryProcessingStage::WithMergeableState;
-												Expression replacement: development [#CONV-7444].


											
										
										
											2013-05-27 14:02:55 +00:00
-												dbms: development [#CONV-5097].



											
										
										
											2012-06-22 15:39:13 +00:00
+									/// Если источников несколько, то выполняем параллельную агрегацию
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-09 13:12:38 +00:00
+									if (streams.size() > 1)
 									{
-												dbms: added totals as separate data in JSON formats [#CONV-8366].



											
										
										
											2013-09-01 04:55:41 +00:00
+										stream = maybeAsynchronous(new ParallelAggregatingBlockInputStream(streams, key_names, aggregates, query.group_by_with_totals, separate_totals,
-												dbms: added WITH TOTALS modifier for GROUP BY [#CONV-2944].



											
										
										
											2013-05-04 15:46:50 +00:00
+											settings.max_threads, settings.limits.max_rows_to_group_by, settings.limits.group_by_overflow_mode), settings.asynchronous);
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-09 13:12:38 +00:00
+										streams.resize(1);
-												dbms: added new aggregation method [#CONV-2944].



											
										
										
											2013-09-15 10:53:10 +00:00
 									/*	stream = maybeAsynchronous(
 											new SplittingAggregatingBlockInputStream(
 												new UnionBlockInputStream(streams, settings.max_threads), key_names, aggregates, settings.max_threads),
 											settings.asynchronous);
 										streams.resize(1);*/
-												dbms: development [#CONV-2944].



											
										
										
											2011-11-06 22:00:39 +00:00
+									}
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-09 13:12:38 +00:00
+									else
-												dbms: added totals as separate data in JSON formats [#CONV-8366].



											
										
										
											2013-09-01 04:55:41 +00:00
+										stream = maybeAsynchronous(new AggregatingBlockInputStream(stream, key_names, aggregates, query.group_by_with_totals, separate_totals,
-												dbms: development of limits [#CONV-2944].



											
										
										
											2012-12-25 19:28:59 +00:00
+											settings.limits.max_rows_to_group_by, settings.limits.group_by_overflow_mode), settings.asynchronous);
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-09 13:12:38 +00:00
+								}
-												dbms: development [#CONV-2944].



											
										
										
											2011-11-06 22:00:39 +00:00
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-09 13:12:38 +00:00
-												clickhouse: switched to ExpressionAnalyzer [#CONV-7444].


											
										
										
											2013-06-03 10:18:41 +00:00
+								void InterpreterSelectQuery::executeFinalizeAggregates(BlockInputStreams & streams)
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-09 13:12:38 +00:00
+								{
-												dbms: fixed parametric aggregate functions in distributed query processing [#CONV-8223].



											
										
										
											2013-07-28 03:14:03 +00:00
+									Names key_names;
 									AggregateDescriptions aggregates;
 									query_analyzer->getAggregateInfo(key_names, aggregates);
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-09 13:12:38 +00:00
+									/// Финализируем агрегатные функции - заменяем их состояния вычислений на готовые значения
 									BlockInputStreamPtr & stream = streams[0];
-												dbms: fixed parametric aggregate functions in distributed query processing [#CONV-8223].



											
										
										
											2013-07-28 03:14:03 +00:00
+									stream = maybeAsynchronous(new FinalizingAggregatedBlockInputStream(stream, aggregates), settings.asynchronous);
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-30 01:38:02 +00:00
+								}
-												clickhouse: switched to ExpressionAnalyzer [#CONV-7444].


											
										
										
											2013-06-03 10:18:41 +00:00
+								void InterpreterSelectQuery::executeMergeAggregated(BlockInputStreams & streams)
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-30 01:38:02 +00:00
+								{
 									/// Если объединять нечего
 									if (streams.size() == 1)
 										return;
 									/// Склеим несколько источников в один
-												dbms: development [#CONV-2944].



											
										
										
											2012-08-02 17:33:31 +00:00
+									streams[0] = new UnionBlockInputStream(streams, settings.max_threads);
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-30 01:38:02 +00:00
+									streams.resize(1);
-												dbms: added totals as separate data in JSON formats [#CONV-8366].



											
										
										
											2013-09-01 04:55:41 +00:00
+									bool separate_totals = to_stage > QueryProcessingStage::WithMergeableState;
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-30 01:38:02 +00:00
+									/// Теперь объединим агрегированные блоки
-												Expression replacement: development [#CONV-7444].


											
										
										
											2013-05-27 14:02:55 +00:00
+									Names key_names;
 									AggregateDescriptions aggregates;
-												clickhouse: switched to ExpressionAnalyzer [#CONV-7444].


											
										
										
											2013-06-03 10:18:41 +00:00
+									query_analyzer->getAggregateInfo(key_names, aggregates);
-												dbms: added totals as separate data in JSON formats [#CONV-8366].



											
										
										
											2013-09-01 04:55:41 +00:00
+									streams[0] = maybeAsynchronous(new MergingAggregatedBlockInputStream(streams[0], key_names, aggregates, query.group_by_with_totals, separate_totals), settings.asynchronous);
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-09 13:12:38 +00:00
+								}
-												clickhouse: switched to ExpressionAnalyzer [#CONV-7444].


											
										
										
											2013-06-03 10:18:41 +00:00
+								void InterpreterSelectQuery::executeHaving(BlockInputStreams & streams, ExpressionActionsPtr expression)
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-09 13:12:38 +00:00
+								{
-												clickhouse: switched to ExpressionAnalyzer [#CONV-7444].


											
										
										
											2013-06-03 10:18:41 +00:00
+									bool is_async = settings.asynchronous && streams.size() <= settings.max_threads;
 									for (BlockInputStreams::iterator it = streams.begin(); it != streams.end(); ++it)
-												dbms: development [#CONV-2944].



											
										
										
											2011-11-06 22:00:39 +00:00
+									{
-												clickhouse: switched to ExpressionAnalyzer [#CONV-7444].


											
										
										
											2013-06-03 10:18:41 +00:00
+										BlockInputStreamPtr & stream = *it;
 										stream = maybeAsynchronous(new ExpressionBlockInputStream(stream, expression), is_async);
 										stream = maybeAsynchronous(new FilterBlockInputStream(stream, query.having_expression->getColumnName()), is_async);
-												dbms: development [#CONV-2944].



											
										
										
											2011-09-25 03:37:09 +00:00
+									}
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-09 13:12:38 +00:00
+								}
-												dbms: development [#CONV-2944].



											
										
										
											2011-09-25 03:37:09 +00:00
-												clickhouse: switched to ExpressionAnalyzer [#CONV-7444].


											
										
										
											2013-06-03 10:18:41 +00:00
+								void InterpreterSelectQuery::executeOuterExpression(BlockInputStreams & streams, ExpressionActionsPtr expression)
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-09 13:12:38 +00:00
+								{
-												dbms: development [#CONV-2944].



											
										
										
											2012-08-02 17:33:31 +00:00
+									bool is_async = settings.asynchronous && streams.size() <= settings.max_threads;
-												dbms: development [#CONV-2944].



											
										
										
											2012-02-27 06:28:20 +00:00
+									for (BlockInputStreams::iterator it = streams.begin(); it != streams.end(); ++it)
 									{
 										BlockInputStreamPtr & stream = *it;
-												clickhouse: switched to ExpressionAnalyzer [#CONV-7444].


											
										
										
											2013-06-03 10:18:41 +00:00
+										stream = maybeAsynchronous(new ExpressionBlockInputStream(stream, expression), is_async);
-												dbms: development [#CONV-2944].



											
										
										
											2012-02-27 06:28:20 +00:00
+									}
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-09 13:12:38 +00:00
+								}
-												clickhouse: switched to ExpressionAnalyzer [#CONV-7444].


											
										
										
											2013-06-03 10:18:41 +00:00
+								void InterpreterSelectQuery::executeOrder(BlockInputStreams & streams)
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-09 13:12:38 +00:00
+								{
-												clickhouse: switched to ExpressionAnalyzer [#CONV-7444].


											
										
										
											2013-06-03 10:18:41 +00:00
+									SortDescription order_descr;
 									order_descr.reserve(query.order_expression_list->children.size());
 									for (ASTs::iterator it = query.order_expression_list->children.begin();
 										it != query.order_expression_list->children.end();
 										++it)
-												dbms: development [#CONV-2944].



											
										
										
											2011-09-04 05:14:52 +00:00
+									{
-												clickhouse: switched to ExpressionAnalyzer [#CONV-7444].


											
										
										
											2013-06-03 10:18:41 +00:00
+										String name = (*it)->children.front()->getColumnName();
 										order_descr.push_back(SortColumnDescription(name, dynamic_cast<ASTOrderByElement &>(**it).direction));
 									}
-												dbms: development [#CONV-2944].



											
										
										
											2011-09-04 05:14:52 +00:00
-												dbms: optimized ORDER BY with LIMIT; rows_before_limit_at_least is temporarily broken [#CONV-2944].



											
										
										
											2013-09-16 05:44:47 +00:00
+									/// Если есть LIMIT - можно делать частичную сортировку.
 									size_t limit_length = 0;
 									size_t limit_offset = 0;
 									getLimitLengthAndOffset(query, limit_length, limit_offset);
 									size_t limit = limit_length + limit_offset;
-												clickhouse: switched to ExpressionAnalyzer [#CONV-7444].


											
										
										
											2013-06-03 10:18:41 +00:00
+									bool is_async = settings.asynchronous && streams.size() <= settings.max_threads;
 									for (BlockInputStreams::iterator it = streams.begin(); it != streams.end(); ++it)
 									{
 										BlockInputStreamPtr & stream = *it;
-												dbms: optimized ORDER BY with LIMIT; rows_before_limit_at_least is temporarily broken [#CONV-2944].



											
										
										
											2013-09-16 05:44:47 +00:00
+										IProfilingBlockInputStream * sorting_stream = new PartialSortingBlockInputStream(stream, order_descr, limit);
-												clickhouse: switched to ExpressionAnalyzer [#CONV-7444].


											
										
										
											2013-06-03 10:18:41 +00:00
 										/// Ограничения на сортировку
 										IProfilingBlockInputStream::LocalLimits limits;
 										limits.max_rows_to_read = settings.limits.max_rows_to_sort;
 										limits.max_bytes_to_read = settings.limits.max_bytes_to_sort;
 										limits.read_overflow_mode = settings.limits.sort_overflow_mode;
 										sorting_stream->setLimits(limits);
-												dbms: development of limits [#CONV-2944].



											
										
										
											2012-12-25 20:36:35 +00:00
-												clickhouse: switched to ExpressionAnalyzer [#CONV-7444].


											
										
										
											2013-06-03 10:18:41 +00:00
+										stream = maybeAsynchronous(sorting_stream, is_async);
 									}
-												dbms: development [#CONV-2944].



											
										
										
											2012-02-27 06:28:20 +00:00
-												clickhouse: switched to ExpressionAnalyzer [#CONV-7444].


											
										
										
											2013-06-03 10:18:41 +00:00
+									BlockInputStreamPtr & stream = streams[0];
-												dbms: development [#CONV-2944].



											
										
										
											2012-02-27 06:28:20 +00:00
-												clickhouse: switched to ExpressionAnalyzer [#CONV-7444].


											
										
										
											2013-06-03 10:18:41 +00:00
+									/// Если потоков несколько, то объединяем их в один
 									if (streams.size() > 1)
 									{
 										stream = new UnionBlockInputStream(streams, settings.max_threads);
 										streams.resize(1);
 									}
 									/// Сливаем сортированные блоки TODO: таймаут на слияние.
-												dbms: optimized ORDER BY with LIMIT; rows_before_limit_at_least is temporarily broken [#CONV-2944].



											
										
										
											2013-09-16 05:44:47 +00:00
+									stream = maybeAsynchronous(new MergeSortingBlockInputStream(stream, order_descr, limit), is_async);
-												clickhouse: switched to ExpressionAnalyzer [#CONV-7444].


											
										
										
											2013-06-03 10:18:41 +00:00
+								}
-												dbms: development [#CONV-2944].



											
										
										
											2012-02-27 06:28:20 +00:00
-												dbms: development [#CONV-2944].



											
										
										
											2012-07-25 20:29:22 +00:00
-												clickhouse: switched to ExpressionAnalyzer [#CONV-7444].


											
										
										
											2013-06-03 10:18:41 +00:00
+								void InterpreterSelectQuery::executeProjection(BlockInputStreams & streams, ExpressionActionsPtr expression)
 								{
 									bool is_async = settings.asynchronous && streams.size() <= settings.max_threads;
 									for (BlockInputStreams::iterator it = streams.begin(); it != streams.end(); ++it)
 									{
 										BlockInputStreamPtr & stream = *it;
 										stream = maybeAsynchronous(new ExpressionBlockInputStream(stream, expression), is_async);
-												dbms: development [#CONV-2944].



											
										
										
											2011-09-04 05:14:52 +00:00
+									}
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-09 13:12:38 +00:00
+								}
-												dbms: development [#CONV-2944].



											
										
										
											2012-02-27 06:28:20 +00:00
-												dbms: added DISTINCT [#CONV-7756].



											
										
										
											2013-06-01 07:43:57 +00:00
+								void InterpreterSelectQuery::executeDistinct(BlockInputStreams & streams, bool before_order)
 								{
 									if (query.distinct)
 									{
 										size_t limit_length = 0;
 										size_t limit_offset = 0;
 										getLimitLengthAndOffset(query, limit_length, limit_offset);
 										size_t limit_for_distinct = 0;
 										/// Если после этой стадии DISTINCT не будет выполняться ORDER BY, то можно достать не более limit_length + limit_offset различных строк.
 										if (!query.order_expression_list || !before_order)
 											limit_for_distinct = limit_length + limit_offset;
 										bool is_async = settings.asynchronous && streams.size() <= settings.max_threads;
 										for (BlockInputStreams::iterator it = streams.begin(); it != streams.end(); ++it)
 										{
 											BlockInputStreamPtr & stream = *it;
-												limits for IN and DISTINCT [not tested] [#CONV-7934]


											
										
										
											2013-06-20 12:12:27 +00:00
+											stream = maybeAsynchronous(new DistinctBlockInputStream(stream, settings.limits, limit_for_distinct), is_async);
-												dbms: added DISTINCT [#CONV-7756].



											
										
										
											2013-06-01 07:43:57 +00:00
+										}
 									}
 								}
-												clickhouse: switched to ExpressionAnalyzer [#CONV-7444].


											
										
										
											2013-06-03 10:18:41 +00:00
+								void InterpreterSelectQuery::executeUnion(BlockInputStreams & streams)
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-09 13:12:38 +00:00
+								{
-												dbms: development [#CONV-2944].



											
										
										
											2012-02-27 06:28:20 +00:00
+									/// Если до сих пор есть несколько потоков, то объединяем их в один
 									if (streams.size() > 1)
 									{
-												dbms: development [#CONV-2944].



											
										
										
											2012-08-02 17:33:31 +00:00
+										streams[0] = new UnionBlockInputStream(streams, settings.max_threads);
-												dbms: development [#CONV-2944].



											
										
										
											2012-02-27 06:28:20 +00:00
+										streams.resize(1);
 									}
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-09 13:12:38 +00:00
+								}
-												dbms: development [#CONV-2944].



											
										
										
											2012-06-24 23:17:06 +00:00
+								/// Предварительный LIMIT - применяется в каждом источнике, если источников несколько, до их объединения.
-												clickhouse: switched to ExpressionAnalyzer [#CONV-7444].


											
										
										
											2013-06-03 10:18:41 +00:00
+								void InterpreterSelectQuery::executePreLimit(BlockInputStreams & streams)
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-09 13:12:38 +00:00
+								{
 									size_t limit_length = 0;
 									size_t limit_offset = 0;
 									getLimitLengthAndOffset(query, limit_length, limit_offset);
-												dbms: development [#CONV-2944].



											
										
										
											2012-02-27 06:28:20 +00:00
-												dbms: development [#CONV-2944].



											
										
										
											2012-06-24 23:17:06 +00:00
+									/// Если есть LIMIT
 									if (query.limit_length)
 									{
 										for (BlockInputStreams::iterator it = streams.begin(); it != streams.end(); ++it)
 										{
 											BlockInputStreamPtr & stream = *it;
 											stream = new LimitBlockInputStream(stream, limit_length + limit_offset, 0);
 										}
 									}
 								}
-												clickhouse: switched to ExpressionAnalyzer [#CONV-7444].


											
										
										
											2013-06-03 10:18:41 +00:00
+								void InterpreterSelectQuery::executeLimit(BlockInputStreams & streams)
-												dbms: development [#CONV-2944].



											
										
										
											2012-06-24 23:17:06 +00:00
+								{
 									size_t limit_length = 0;
 									size_t limit_offset = 0;
 									getLimitLengthAndOffset(query, limit_length, limit_offset);
-												dbms: development [#CONV-2944].



											
										
										
											2012-05-09 13:12:38 +00:00
-												dbms: development [#CONV-2944].



											
										
										
											2011-08-28 08:02:11 +00:00
+									/// Если есть LIMIT
 									if (query.limit_length)
 									{
-												dbms: development [#CONV-2944].



											
										
										
											2012-06-24 23:17:06 +00:00
+										BlockInputStreamPtr & stream = streams[0];
-												dbms: development [#CONV-2944].



											
										
										
											2011-08-28 08:02:11 +00:00
+										stream = new LimitBlockInputStream(stream, limit_length, limit_offset);
 									}
-												dbms: development [#CONV-2944].



											
										
										
											2011-08-28 05:13:24 +00:00
+								}
-												dbms: development [#CONV-2944].



											
										
										
											2011-10-30 05:19:41 +00:00
+								BlockInputStreamPtr InterpreterSelectQuery::executeAndFormat(WriteBuffer & buf)
 								{
 									Block sample = getSampleBlock();
-												dbms: Server: HTTP interface: allowed to specify default_format in URL parameter [#CONV-2944].



											
										
										
											2013-06-29 18:03:57 +00:00
+									String format_name = query.format ? dynamic_cast<ASTIdentifier &>(*query.format).name : context.getDefaultFormat();
-												dbms: development [#CONV-2944].



											
										
										
											2011-10-30 05:19:41 +00:00
 									BlockInputStreamPtr in = execute();
-												works with client now [#CONV-7549]


											
										
										
											2013-05-22 14:57:43 +00:00
+									BlockOutputStreamPtr out = context.getFormatFactory().getOutput(format_name, buf, sample);
-												dbms: fixed error [#CONV-7549].



											
										
										
											2013-05-31 17:34:30 +00:00
-												dbms: development [#CONV-2944].



											
										
										
											2011-10-30 05:19:41 +00:00
+									copyData(*in, *out);
 									return in;
 								}
-												dbms: development [#CONV-2944].



											
										
										
											2011-08-28 05:13:24 +00:00
+								}