2011-08-28 05:13:24 +00:00
|
|
|
|
#pragma once
|
|
|
|
|
|
2012-05-09 13:12:38 +00:00
|
|
|
|
#include <DB/Core/QueryProcessingStage.h>
|
2011-08-28 05:13:24 +00:00
|
|
|
|
#include <DB/Interpreters/Context.h>
|
2015-06-18 02:11:05 +00:00
|
|
|
|
#include <DB/Interpreters/IInterpreter.h>
|
2015-05-06 23:35:37 +00:00
|
|
|
|
#include <DB/Interpreters/ExpressionActions.h>
|
2011-08-28 05:13:24 +00:00
|
|
|
|
#include <DB/DataStreams/IBlockInputStream.h>
|
|
|
|
|
|
|
|
|
|
namespace DB
|
|
|
|
|
{
|
|
|
|
|
|
2015-05-06 23:35:37 +00:00
|
|
|
|
class ExpressionAnalyzer;
|
|
|
|
|
class ASTSelectQuery;
|
2016-03-07 04:35:06 +00:00
|
|
|
|
struct SubqueryForSet;
|
2015-05-06 23:35:37 +00:00
|
|
|
|
|
|
|
|
|
|
2012-05-09 13:12:38 +00:00
|
|
|
|
/** Интерпретирует запрос SELECT. Возвращает поток блоков с результатами выполнения запроса до стадии to_stage.
|
2011-08-28 05:13:24 +00:00
|
|
|
|
*/
|
2015-06-18 02:11:05 +00:00
|
|
|
|
class InterpreterSelectQuery : public IInterpreter
|
2011-08-28 05:13:24 +00:00
|
|
|
|
{
|
|
|
|
|
public:
|
2014-12-19 12:48:09 +00:00
|
|
|
|
/** to_stage
|
|
|
|
|
* - стадия, до которой нужно выполнить запрос. По-умолчанию - до конца.
|
|
|
|
|
* Можно выполнить до промежуточного состояния агрегации, которые объединяются с разных серверов при распределённой обработке запроса.
|
|
|
|
|
*
|
|
|
|
|
* subquery_depth
|
|
|
|
|
* - для контроля ограничений на глубину вложенности подзапросов. Для подзапросов передаётся значение, увеличенное на единицу.
|
|
|
|
|
*
|
|
|
|
|
* input
|
|
|
|
|
* - если задан - читать не из таблицы, указанной в запросе, а из готового источника.
|
|
|
|
|
*
|
|
|
|
|
* required_column_names
|
|
|
|
|
* - удалить из запроса все столбцы кроме указанных - используется для удаления ненужных столбцов из подзапросов.
|
|
|
|
|
*
|
|
|
|
|
* table_column_names
|
2015-07-15 01:26:35 +00:00
|
|
|
|
* - список доступных столбцов таблицы.
|
2014-12-19 12:48:09 +00:00
|
|
|
|
* Используется, например, совместно с указанием input.
|
|
|
|
|
*/
|
|
|
|
|
|
|
|
|
|
InterpreterSelectQuery(
|
|
|
|
|
ASTPtr query_ptr_,
|
|
|
|
|
const Context & context_,
|
|
|
|
|
QueryProcessingStage::Enum to_stage_ = QueryProcessingStage::Complete,
|
|
|
|
|
size_t subquery_depth_ = 0,
|
2015-07-13 15:02:29 +00:00
|
|
|
|
BlockInputStreamPtr input = nullptr);
|
2014-12-19 12:48:09 +00:00
|
|
|
|
|
|
|
|
|
InterpreterSelectQuery(
|
|
|
|
|
ASTPtr query_ptr_,
|
|
|
|
|
const Context & context_,
|
|
|
|
|
const Names & required_column_names,
|
|
|
|
|
QueryProcessingStage::Enum to_stage_ = QueryProcessingStage::Complete,
|
|
|
|
|
size_t subquery_depth_ = 0,
|
|
|
|
|
BlockInputStreamPtr input = nullptr);
|
|
|
|
|
|
|
|
|
|
InterpreterSelectQuery(
|
|
|
|
|
ASTPtr query_ptr_,
|
|
|
|
|
const Context & context_,
|
|
|
|
|
const Names & required_column_names,
|
2015-07-15 01:26:35 +00:00
|
|
|
|
const NamesAndTypesList & table_column_names_,
|
2014-12-19 12:48:09 +00:00
|
|
|
|
QueryProcessingStage::Enum to_stage_ = QueryProcessingStage::Complete,
|
|
|
|
|
size_t subquery_depth_ = 0,
|
|
|
|
|
BlockInputStreamPtr input = nullptr);
|
|
|
|
|
|
2015-05-06 23:35:37 +00:00
|
|
|
|
~InterpreterSelectQuery();
|
|
|
|
|
|
2015-01-03 06:49:32 +00:00
|
|
|
|
/** Выполнить запрос, возможно являющиийся цепочкой UNION ALL.
|
2014-12-19 12:48:09 +00:00
|
|
|
|
* Получить поток блоков для чтения
|
|
|
|
|
*/
|
2015-06-18 02:11:05 +00:00
|
|
|
|
BlockIO execute() override;
|
2014-12-19 12:48:09 +00:00
|
|
|
|
|
2015-04-21 15:12:08 +00:00
|
|
|
|
/** Выполнить запрос без объединения потоков, если это возможно.
|
2015-04-17 13:56:29 +00:00
|
|
|
|
*/
|
2015-04-23 13:16:42 +00:00
|
|
|
|
const BlockInputStreams & executeWithoutUnion();
|
2015-01-03 06:49:32 +00:00
|
|
|
|
|
2014-12-19 12:48:09 +00:00
|
|
|
|
DataTypes getReturnTypes();
|
|
|
|
|
Block getSampleBlock();
|
2011-08-28 05:13:24 +00:00
|
|
|
|
|
2015-07-13 15:02:29 +00:00
|
|
|
|
static Block getSampleBlock(
|
|
|
|
|
ASTPtr query_ptr_,
|
2015-07-15 02:58:28 +00:00
|
|
|
|
const Context & context_);
|
2015-07-13 15:02:29 +00:00
|
|
|
|
|
2011-08-28 05:13:24 +00:00
|
|
|
|
private:
|
2015-07-13 15:02:29 +00:00
|
|
|
|
/**
|
2015-07-15 01:26:35 +00:00
|
|
|
|
* - Оптимизация, если объект создаётся только, чтобы вызвать getSampleBlock(): учитываем только первый SELECT цепочки UNION ALL, потому что
|
2015-07-13 15:02:29 +00:00
|
|
|
|
* первый SELECT достаточен для определения нужных столбцов.
|
|
|
|
|
*/
|
2015-07-15 02:52:19 +00:00
|
|
|
|
struct OnlyAnalyzeTag {};
|
2015-07-13 15:02:29 +00:00
|
|
|
|
InterpreterSelectQuery(
|
2015-07-15 02:52:19 +00:00
|
|
|
|
OnlyAnalyzeTag,
|
2015-07-13 15:02:29 +00:00
|
|
|
|
ASTPtr query_ptr_,
|
2015-07-15 02:52:19 +00:00
|
|
|
|
const Context & context_);
|
2015-07-13 15:02:29 +00:00
|
|
|
|
|
2015-07-15 01:26:35 +00:00
|
|
|
|
void init(BlockInputStreamPtr input, const Names & required_column_names = Names{});
|
|
|
|
|
void basicInit(BlockInputStreamPtr input);
|
2014-12-25 10:22:24 +00:00
|
|
|
|
void initQueryAnalyzer();
|
2015-01-03 06:49:32 +00:00
|
|
|
|
|
2014-12-19 12:48:09 +00:00
|
|
|
|
/// Выполнить один запрос SELECT из цепочки UNION ALL.
|
2014-12-26 21:37:38 +00:00
|
|
|
|
void executeSingleQuery();
|
2014-12-19 12:48:09 +00:00
|
|
|
|
|
|
|
|
|
/** Оставить в каждом запросе цепочки UNION ALL только нужные столбцы секции SELECT.
|
|
|
|
|
* Однако, если используется хоть один DISTINCT в цепочке, то все столбцы считаются нужными,
|
2016-10-24 03:08:56 +00:00
|
|
|
|
* так как иначе DISTINCT работал бы по-другому.
|
|
|
|
|
*
|
|
|
|
|
* Always leave arrayJoin, because it changes number of rows.
|
|
|
|
|
*
|
|
|
|
|
* TODO If query doesn't have GROUP BY, but have aggregate functions,
|
|
|
|
|
* then leave at least one aggregate function,
|
|
|
|
|
* In order that fact of aggregation has not been lost.
|
2014-12-19 12:48:09 +00:00
|
|
|
|
*/
|
|
|
|
|
void rewriteExpressionList(const Names & required_column_names);
|
2014-12-25 14:17:08 +00:00
|
|
|
|
|
|
|
|
|
/// Содержит ли запрос хотя бы один астериск?
|
|
|
|
|
bool hasAsterisk() const;
|
|
|
|
|
|
|
|
|
|
// Переименовать столбцы каждого запроса цепочки UNION ALL в такие же имена, как в первом запросе.
|
|
|
|
|
void renameColumns();
|
2015-01-03 06:49:32 +00:00
|
|
|
|
|
2015-07-22 01:46:35 +00:00
|
|
|
|
/** Из какой таблицы читать. При JOIN, возвращается "левая" таблица.
|
2014-12-19 12:48:09 +00:00
|
|
|
|
*/
|
|
|
|
|
void getDatabaseAndTableNames(String & database_name, String & table_name);
|
|
|
|
|
|
|
|
|
|
/** Выбрать из списка столбцов какой-нибудь, лучше - минимального размера.
|
|
|
|
|
*/
|
|
|
|
|
String getAnyColumn();
|
|
|
|
|
|
|
|
|
|
/// Разные стадии выполнения запроса.
|
|
|
|
|
|
|
|
|
|
/// Вынимает данные из таблицы. Возвращает стадию, до которой запрос был обработан в Storage.
|
2015-07-22 00:59:22 +00:00
|
|
|
|
QueryProcessingStage::Enum executeFetchColumns();
|
|
|
|
|
|
|
|
|
|
void executeWhere(ExpressionActionsPtr expression);
|
|
|
|
|
void executeAggregation(ExpressionActionsPtr expression, bool overflow_row, bool final);
|
|
|
|
|
void executeMergeAggregated(bool overflow_row, bool final);
|
|
|
|
|
void executeTotalsAndHaving(bool has_having, ExpressionActionsPtr expression, bool overflow_row);
|
|
|
|
|
void executeHaving(ExpressionActionsPtr expression);
|
|
|
|
|
void executeExpression(ExpressionActionsPtr expression);
|
|
|
|
|
void executeOrder();
|
|
|
|
|
void executeMergeSorted();
|
|
|
|
|
void executePreLimit();
|
|
|
|
|
void executeUnion();
|
|
|
|
|
void executeLimit();
|
|
|
|
|
void executeProjection(ExpressionActionsPtr expression);
|
|
|
|
|
void executeDistinct(bool before_order, Names columns);
|
|
|
|
|
void executeSubqueriesInSetsAndJoins(std::unordered_map<String, SubqueryForSet> & subqueries_for_sets);
|
|
|
|
|
|
|
|
|
|
template <typename Transform>
|
|
|
|
|
void transformStreams(Transform && transform)
|
|
|
|
|
{
|
|
|
|
|
for (auto & stream : streams)
|
|
|
|
|
transform(stream);
|
2015-07-22 01:46:35 +00:00
|
|
|
|
|
|
|
|
|
if (stream_with_non_joined_data)
|
|
|
|
|
transform(stream_with_non_joined_data);
|
|
|
|
|
}
|
|
|
|
|
|
|
|
|
|
bool hasNoData() const
|
|
|
|
|
{
|
|
|
|
|
return streams.empty() && !stream_with_non_joined_data;
|
2015-07-22 00:59:22 +00:00
|
|
|
|
}
|
2014-12-19 12:48:09 +00:00
|
|
|
|
|
2015-07-22 02:59:47 +00:00
|
|
|
|
bool hasMoreThanOneStream() const
|
|
|
|
|
{
|
|
|
|
|
return streams.size() + (stream_with_non_joined_data ? 1 : 0) > 1;
|
|
|
|
|
}
|
|
|
|
|
|
|
|
|
|
|
2015-05-06 23:35:37 +00:00
|
|
|
|
void ignoreWithTotals();
|
2015-04-23 11:07:15 +00:00
|
|
|
|
|
2015-06-06 20:00:08 +00:00
|
|
|
|
/** Если в запросе SELECT есть секция SETTINGS, то применить настройки из неё.
|
2015-06-05 21:28:04 +00:00
|
|
|
|
* Затем достать настройки из context и поместить их в settings.
|
|
|
|
|
*
|
|
|
|
|
* Секция SETTINGS - настройки для конкретного запроса.
|
|
|
|
|
* Обычно настройки могут быть переданы другими способами, не внутри запроса.
|
|
|
|
|
* Но использование такой секции оправдано, если нужно задать настройки для одного подзапроса.
|
|
|
|
|
*/
|
|
|
|
|
void initSettings();
|
|
|
|
|
|
2014-12-19 12:48:09 +00:00
|
|
|
|
ASTPtr query_ptr;
|
|
|
|
|
ASTSelectQuery & query;
|
|
|
|
|
Context context;
|
|
|
|
|
Settings settings;
|
2015-01-03 06:49:32 +00:00
|
|
|
|
size_t original_max_threads; /// В settings настройка max_threads может быть изменена. В original_max_threads сохраняется изначальное значение.
|
2014-12-19 12:48:09 +00:00
|
|
|
|
QueryProcessingStage::Enum to_stage;
|
|
|
|
|
size_t subquery_depth;
|
2015-01-14 02:44:25 +00:00
|
|
|
|
std::unique_ptr<ExpressionAnalyzer> query_analyzer;
|
2015-07-15 01:26:35 +00:00
|
|
|
|
NamesAndTypesList table_column_names;
|
2015-01-03 06:49:32 +00:00
|
|
|
|
|
2015-07-22 01:46:35 +00:00
|
|
|
|
/** Потоки данных.
|
|
|
|
|
* Исходные потоки данных получаются в функции executeFetchColumns.
|
|
|
|
|
* Затем они преобразуются (оборачиваются в другие потоки) с помощью функций execute*,
|
|
|
|
|
* чтобы получить целый конвейер выполнения запроса.
|
|
|
|
|
*/
|
|
|
|
|
BlockInputStreams streams;
|
|
|
|
|
|
|
|
|
|
/** При выполнении FULL или RIGHT JOIN, здесь будет поток данных, из которого можно прочитать "неприсоединённые" строки.
|
|
|
|
|
* Он имеет особое значение, так как чтение из него должно осуществляться после чтения из основных потоков.
|
|
|
|
|
* Он подклеивается к основным потокам в UnionBlockInputStream или ParallelAggregatingBlockInputStream.
|
|
|
|
|
*/
|
|
|
|
|
BlockInputStreamPtr stream_with_non_joined_data;
|
|
|
|
|
|
2015-02-13 11:40:58 +00:00
|
|
|
|
/// Являемся ли мы первым запросом SELECT цепочки UNION ALL?
|
|
|
|
|
bool is_first_select_inside_union_all;
|
2014-12-19 12:48:09 +00:00
|
|
|
|
|
2015-07-15 02:52:19 +00:00
|
|
|
|
/// Объект создан только для анализа запроса.
|
|
|
|
|
bool only_analyze = false;
|
|
|
|
|
|
2015-07-15 01:26:35 +00:00
|
|
|
|
/// Следующий запрос SELECT в цепочке UNION ALL, если есть.
|
2014-12-19 12:48:09 +00:00
|
|
|
|
std::unique_ptr<InterpreterSelectQuery> next_select_in_union_all;
|
2015-01-03 06:49:32 +00:00
|
|
|
|
|
2014-12-19 12:48:09 +00:00
|
|
|
|
/// Таблица, откуда читать данные, если не подзапрос.
|
|
|
|
|
StoragePtr storage;
|
|
|
|
|
IStorage::TableStructureReadLockPtr table_lock;
|
|
|
|
|
|
2015-04-21 15:12:08 +00:00
|
|
|
|
/// Выполнить объединение потоков внутри запроса SELECT?
|
|
|
|
|
bool union_within_single_query = false;
|
2015-04-17 13:56:29 +00:00
|
|
|
|
|
2014-12-19 12:48:09 +00:00
|
|
|
|
Logger * log;
|
2011-08-28 05:13:24 +00:00
|
|
|
|
};
|
|
|
|
|
|
|
|
|
|
}
|