ClickHouse/dbms/include/DB/Storages/MergeTree/PKCondition.h

338 lines
12 KiB
C++
Raw Normal View History

2012-12-05 12:44:55 +00:00
#pragma once
#include <sstream>
#include <DB/Core/FieldVisitors.h>
2012-12-05 12:44:55 +00:00
#include <DB/Interpreters/Context.h>
#include <DB/Core/SortDescription.h>
#include <DB/Parsers/ASTExpressionList.h>
#include <DB/Parsers/ASTSelectQuery.h>
#include <DB/Parsers/ASTFunction.h>
#include <DB/Parsers/ASTLiteral.h>
2014-03-26 18:19:25 +00:00
#include <DB/Storages/MergeTree/BoolMask.h>
#include <DB/Functions/IFunction.h>
2012-12-05 12:44:55 +00:00
namespace DB
{
2012-12-05 12:44:55 +00:00
/** Диапазон с открытыми или закрытыми концами; возможно, неограниченный.
*/
2012-12-05 12:44:55 +00:00
struct Range
{
private:
static bool equals(const Field & lhs, const Field & rhs);
static bool less(const Field & lhs, const Field & rhs);
public:
2012-12-05 12:44:55 +00:00
Field left; /// левая граница, если есть
Field right; /// правая граница, если есть
2015-05-26 00:35:13 +00:00
bool left_bounded = false; /// ограничен ли слева
bool right_bounded = false; /// ограничен ли справа
bool left_included = false; /// включает левую границу, если есть
bool right_included = false; /// включает правую границу, если есть
2012-12-05 12:44:55 +00:00
/// Всё множество.
2015-05-26 00:35:13 +00:00
Range() {}
2012-12-05 12:44:55 +00:00
/// Одна точка.
Range(const Field & point)
: left(point), right(point), left_bounded(true), right_bounded(true), left_included(true), right_included(true) {}
2012-12-05 12:44:55 +00:00
/// Ограниченный с двух сторон диапазон.
Range(const Field & left_, bool left_included_, const Field & right_, bool right_included_)
: left(left_), right(right_),
left_bounded(true), right_bounded(true),
left_included(left_included_), right_included(right_included_)
{
shrinkToIncludedIfPossible();
}
static Range createRightBounded(const Field & right_point, bool right_included)
2012-12-05 12:44:55 +00:00
{
Range r;
r.right = right_point;
r.right_bounded = true;
r.right_included = right_included;
r.shrinkToIncludedIfPossible();
2012-12-05 12:44:55 +00:00
return r;
}
static Range createLeftBounded(const Field & left_point, bool left_included)
2012-12-05 12:44:55 +00:00
{
Range r;
r.left = left_point;
2012-12-05 12:44:55 +00:00
r.left_bounded = true;
r.left_included = left_included;
r.shrinkToIncludedIfPossible();
2012-12-05 12:44:55 +00:00
return r;
}
/** Оптимизировать диапазон. Если у него есть открытая граница и тип Field "неплотный"
* - то преобразовать её в закрытую, сузив на единицу.
* То есть, например, превратить (0,2) в [1].
*/
void shrinkToIncludedIfPossible()
2012-12-05 12:44:55 +00:00
{
if (left_bounded && !left_included)
{
if (left.getType() == Field::Types::UInt64 && left.get<UInt64>() != std::numeric_limits<UInt64>::max())
{
++left.get<UInt64 &>();
left_included = true;
}
if (left.getType() == Field::Types::Int64 && left.get<Int64>() != std::numeric_limits<Int64>::max())
{
++left.get<Int64 &>();
left_included = true;
}
}
if (right_bounded && !right_included)
{
if (right.getType() == Field::Types::UInt64 && right.get<UInt64>() != std::numeric_limits<UInt64>::min())
{
--right.get<UInt64 &>();
right_included = true;
}
if (right.getType() == Field::Types::Int64 && right.get<Int64>() != std::numeric_limits<Int64>::min())
{
--right.get<Int64 &>();
right_included = true;
}
}
2012-12-05 12:44:55 +00:00
}
bool empty() const
2012-12-05 12:44:55 +00:00
{
return left_bounded && right_bounded
&& (less(right, left)
|| ((!left_included || !right_included) && !less(left, right)));
2012-12-05 12:44:55 +00:00
}
2012-12-05 12:44:55 +00:00
/// x входит в range
bool contains(const Field & x) const
2012-12-05 12:44:55 +00:00
{
return !leftThan(x) && !rightThan(x);
}
2012-12-05 12:44:55 +00:00
/// x находится левее
bool rightThan(const Field & x) const
2012-12-05 12:44:55 +00:00
{
return (left_bounded
? !(less(left, x) || (left_included && equals(x, left)))
: false);
2012-12-05 12:44:55 +00:00
}
2012-12-05 12:44:55 +00:00
/// x находится правее
bool leftThan(const Field & x) const
2012-12-05 12:44:55 +00:00
{
return (right_bounded
? !(less(x, right) || (right_included && equals(x, right)))
: false);
2012-12-05 12:44:55 +00:00
}
bool intersectsRange(const Range & r) const
2012-12-05 12:44:55 +00:00
{
/// r левее меня.
if (r.right_bounded
&& left_bounded
&& (less(r.right, left)
|| ((!left_included || !r.right_included)
&& equals(r.right, left))))
2012-12-05 12:44:55 +00:00
return false;
2012-12-05 12:44:55 +00:00
/// r правее меня.
if (r.left_bounded
&& right_bounded
&& (less(right, r.left) /// ...} {...
|| ((!right_included || !r.left_included) /// ...)[... или ...](...
&& equals(r.left, right))))
2012-12-05 12:44:55 +00:00
return false;
2012-12-05 12:44:55 +00:00
return true;
}
bool containsRange(const Range & r) const
2012-12-05 12:44:55 +00:00
{
/// r начинается левее меня.
if (left_bounded
&& (!r.left_bounded
|| less(r.left, left)
|| (r.left_included
&& !left_included
&& equals(r.left, left))))
2012-12-05 12:44:55 +00:00
return false;
2012-12-05 12:44:55 +00:00
/// r заканчивается правее меня.
if (right_bounded
&& (!r.right_bounded
|| less(right, r.right)
|| (r.right_included
&& !right_included
&& equals(r.right, right))))
2012-12-05 12:44:55 +00:00
return false;
2012-12-05 12:44:55 +00:00
return true;
}
void swapLeftAndRight()
{
std::swap(left, right);
std::swap(left_bounded, right_bounded);
std::swap(left_included, right_included);
}
String toString() const
2012-12-05 12:44:55 +00:00
{
std::stringstream str;
2012-12-05 12:44:55 +00:00
if (!left_bounded)
str << "(-inf, ";
else
str << (left_included ? '[' : '(') << apply_visitor(FieldVisitorToString(), left) << ", ";
2012-12-05 12:44:55 +00:00
if (!right_bounded)
str << "+inf)";
else
str << apply_visitor(FieldVisitorToString(), right) << (right_included ? ']' : ')');
2012-12-05 12:44:55 +00:00
return str.str();
}
};
class ASTSet;
/** Условие на индекс.
*
* Состоит из условий на принадлежность ключа всевозможным диапазонам или множествам,
* а также логических связок AND/OR/NOT над этими условиями.
*
* Составляет reverse polish notation от этих условий
* и умеет вычислять (интерпретировать) её выполнимость над диапазонами ключа.
*/
2012-12-10 10:23:10 +00:00
class PKCondition
2012-12-05 12:44:55 +00:00
{
struct RPNElement;
2012-12-05 12:44:55 +00:00
public:
/// Словарь, содержащий действия к соответствующим функциям по превращению их в RPNElement
using AtomMap = std::unordered_map<std::string, bool(*)(RPNElement & out, const Field & value, ASTPtr & node)>;
static const AtomMap atom_map;
2013-05-06 12:15:34 +00:00
/// Не учитывает секцию SAMPLE. all_columns - набор всех столбцов таблицы.
PKCondition(ASTPtr & query, const Context & context, const NamesAndTypesList & all_columns, const SortDescription & sort_descr);
2012-12-06 09:45:09 +00:00
/// Выполнимо ли условие в диапазоне ключей.
2012-12-05 12:44:55 +00:00
/// left_pk и right_pk должны содержать все поля из sort_descr в соответствующем порядке.
/// data_types - типы столбцов первичного ключа.
bool mayBeTrueInRange(size_t used_key_size, const Field * left_pk, const Field * right_pk, const DataTypes & data_types) const;
2012-12-06 09:45:09 +00:00
/// Выполнимо ли условие в полубесконечном (не ограниченном справа) диапазоне ключей.
/// left_pk должен содержать все поля из sort_descr в соответствующем порядке.
bool mayBeTrueAfter(size_t used_key_size, const Field * left_pk, const DataTypes & data_types) const;
/// Проверяет, что индекс не может быть использован.
bool alwaysUnknownOrTrue() const;
/// Получить максимальный номер используемого в условии элемента первичного ключа.
size_t getMaxKeyColumn() const;
/// Наложить дополнительное условие: значение в столбце column должно быть в диапазоне range.
/// Возвращает, есть ли такой столбец в первичном ключе.
bool addCondition(const String & column, const Range & range);
2015-03-27 03:37:46 +00:00
String toString() const;
/** Вычисление выражений, зависящих только от констант.
* Чтобы индекс мог использоваться, если написано, например WHERE Date = toDate(now()).
*/
static Block getBlockWithConstants(
const ASTPtr & query, const Context & context, const NamesAndTypesList & all_columns);
2012-12-05 12:44:55 +00:00
private:
2012-12-10 10:23:10 +00:00
/// Выражение хранится в виде обратной польской строки (Reverse Polish Notation).
2012-12-05 12:44:55 +00:00
struct RPNElement
{
enum Function
{
/// Атомы логического выражения.
FUNCTION_IN_RANGE,
FUNCTION_NOT_IN_RANGE,
2014-03-20 12:25:26 +00:00
FUNCTION_IN_SET,
2014-03-26 10:56:21 +00:00
FUNCTION_NOT_IN_SET,
2012-12-05 12:44:55 +00:00
FUNCTION_UNKNOWN, /// Может принимать любое значение.
/// Операторы логического выражения.
FUNCTION_NOT,
FUNCTION_AND,
FUNCTION_OR,
/// Константы
ALWAYS_FALSE,
ALWAYS_TRUE,
2012-12-05 12:44:55 +00:00
};
2012-12-05 12:44:55 +00:00
RPNElement() {}
RPNElement(Function function_) : function(function_) {}
RPNElement(Function function_, size_t key_column_) : function(function_), key_column(key_column_) {}
RPNElement(Function function_, size_t key_column_, const Range & range_)
2014-04-22 22:52:00 +00:00
: function(function_), range(range_), key_column(key_column_) {}
2015-03-27 03:37:46 +00:00
String toString() const;
Function function = FUNCTION_UNKNOWN;
2012-12-05 12:44:55 +00:00
/// Для FUNCTION_IN_RANGE и FUNCTION_NOT_IN_RANGE.
Range range;
size_t key_column;
/// Для FUNCTION_IN_SET, FUNCTION_NOT_IN_SET
ASTPtr in_function;
/** Цепочка возможно-монотонных функций.
* Если столбец первичного ключа завёрнут в функции, которые могут быть монотонными в некоторых диапазонах значений
* (например: -toFloat64(toDayOfWeek(date))), то здесь будут расположены функции: toDayOfWeek, toFloat64, negate.
*/
using MonotonicFunctionsChain = std::vector<FunctionPtr>;
mutable MonotonicFunctionsChain monotonic_functions_chain; /// Выполнение функции не нарушает константность.
2012-12-05 12:44:55 +00:00
};
using RPN = std::vector<RPNElement>;
using ColumnIndices = std::map<String, size_t>;
bool mayBeTrueInRange(
size_t used_key_size,
const Field * left_pk,
const Field * right_pk,
const DataTypes & data_types,
bool right_bounded) const;
bool mayBeTrueInRangeImpl(const std::vector<Range> & key_ranges, const DataTypes & data_types) const;
void traverseAST(ASTPtr & node, const Context & context, Block & block_with_constants);
bool atomFromAST(ASTPtr & node, const Context & context, Block & block_with_constants, RPNElement & out);
bool operatorFromAST(const ASTFunction * func, RPNElement & out);
/** Является ли node столбцом первичного ключа
* или выражением, в котором столбец первичного ключа завёрнут в цепочку функций,
* которые могут быть монотонными на некоторых диапазонах.
* Если да - вернуть номер этого столбца в первичном ключе, а также заполнить цепочку возможно-монотонных функций.
*/
bool isPrimaryKeyPossiblyWrappedByMonotonicFunctions(
const ASTPtr & node,
const Context & context,
size_t & out_primary_key_column_num,
RPNElement::MonotonicFunctionsChain & out_functions_chain);
bool isPrimaryKeyPossiblyWrappedByMonotonicFunctionsImpl(
const ASTPtr & node,
size_t & out_primary_key_column_num,
std::vector<const ASTFunction *> & out_functions_chain);
2012-12-05 12:44:55 +00:00
RPN rpn;
2012-12-05 12:44:55 +00:00
SortDescription sort_descr;
ColumnIndices pk_columns;
};
}