mirror of
https://github.com/ClickHouse/ClickHouse.git
synced 2024-11-17 21:24:28 +00:00
129 lines
4.8 KiB
C++
129 lines
4.8 KiB
C++
#pragma once
|
||
|
||
#include <Poco/RWLock.h>
|
||
#include <DB/Columns/ColumnArray.h>
|
||
#include <DB/Columns/ColumnConst.h>
|
||
#include <DB/DataStreams/IBlockInputStream.h>
|
||
#include <DB/Interpreters/Limits.h>
|
||
#include <DB/Interpreters/SetVariants.h>
|
||
#include <DB/Parsers/IAST.h>
|
||
#include <DB/Storages/MergeTree/BoolMask.h>
|
||
|
||
#include <common/logger_useful.h>
|
||
|
||
|
||
namespace DB
|
||
{
|
||
|
||
struct Range;
|
||
|
||
|
||
/** Структура данных для реализации выражения IN.
|
||
*/
|
||
class Set
|
||
{
|
||
public:
|
||
Set(const Limits & limits) :
|
||
log(&Logger::get("Set")),
|
||
max_rows(limits.max_rows_in_set),
|
||
max_bytes(limits.max_bytes_in_set),
|
||
overflow_mode(limits.set_overflow_mode)
|
||
{
|
||
}
|
||
|
||
bool empty() const { return data.empty(); }
|
||
|
||
/** Создать множество по выражению (для перечисления в самом запросе).
|
||
* types - типы того, что стоит слева от IN.
|
||
* node - это список значений: 1, 2, 3 или список tuple-ов: (1, 2), (3, 4), (5, 6).
|
||
* create_ordered_set - создавать ли вектор упорядоченных элементов. Нужен для работы индекса
|
||
*/
|
||
void createFromAST(const DataTypes & types, ASTPtr node, const Context & context, bool create_ordered_set);
|
||
|
||
// Возвращает false, если превышено какое-нибудь ограничение, и больше не нужно вставлять.
|
||
bool insertFromBlock(const Block & block, bool create_ordered_set = false);
|
||
|
||
/** Для столбцов блока проверить принадлежность их значений множеству.
|
||
* Записать результат в столбец в позиции result.
|
||
*/
|
||
ColumnPtr execute(const Block & block, bool negative) const;
|
||
|
||
std::string describe() const;
|
||
|
||
/// проверяет есть ли в Set элементы для заданного диапазона индекса
|
||
BoolMask mayBeTrueInRange(const Range & range) const;
|
||
|
||
size_t getTotalRowCount() const { return data.getTotalRowCount(); }
|
||
size_t getTotalByteCount() const { return data.getTotalByteCount(); }
|
||
|
||
private:
|
||
Sizes key_sizes;
|
||
|
||
SetVariants data;
|
||
|
||
/** Типы данных, из которых было создано множество.
|
||
* При проверке на принадлежность множеству, типы проверяемых столбцов должны с ними совпадать.
|
||
*/
|
||
DataTypes data_types;
|
||
|
||
Logger * log;
|
||
|
||
/// Ограничения на максимальный размер множества
|
||
size_t max_rows;
|
||
size_t max_bytes;
|
||
OverflowMode overflow_mode;
|
||
|
||
/// Если в левой части IN стоит массив. Проверяем, что хоть один элемент массива лежит в множестве.
|
||
void executeArray(const ColumnArray * key_column, ColumnUInt8::Container_t & vec_res, bool negative) const;
|
||
|
||
/// Если в левой части набор столбцов тех же типов, что элементы множества.
|
||
void executeOrdinary(const ConstColumnPlainPtrs & key_columns, ColumnUInt8::Container_t & vec_res, bool negative) const;
|
||
|
||
/// Проверить не превышены ли допустимые размеры множества ключей
|
||
bool checkSetSizeLimits() const;
|
||
|
||
/// Вектор упорядоченных элементов Set.
|
||
/// Нужен для работы индекса по первичному ключу в операторе IN.
|
||
using OrderedSetElements = std::vector<Field>;
|
||
using OrderedSetElementsPtr = std::unique_ptr<OrderedSetElements>;
|
||
OrderedSetElementsPtr ordered_set_elements;
|
||
|
||
/** Защищает работу с множеством в функциях insertFromBlock и execute.
|
||
* Эти функции могут вызываться одновременно из разных потоков только при использовании StorageSet,
|
||
* и StorageSet вызывает только эти две функции.
|
||
* Поэтому остальные функции по работе с множеством, не защинены.
|
||
*/
|
||
mutable Poco::RWLock rwlock;
|
||
|
||
|
||
template <typename Method>
|
||
void insertFromBlockImpl(
|
||
Method & method,
|
||
const ConstColumnPlainPtrs & key_columns,
|
||
size_t rows,
|
||
SetVariants & variants);
|
||
|
||
template <typename Method>
|
||
void executeImpl(
|
||
Method & method,
|
||
const ConstColumnPlainPtrs & key_columns,
|
||
ColumnUInt8::Container_t & vec_res,
|
||
bool negative,
|
||
size_t rows) const;
|
||
|
||
template <typename Method>
|
||
void executeArrayImpl(
|
||
Method & method,
|
||
const ConstColumnPlainPtrs & key_columns,
|
||
const ColumnArray::Offsets_t & offsets,
|
||
ColumnUInt8::Container_t & vec_res,
|
||
bool negative,
|
||
size_t rows) const;
|
||
};
|
||
|
||
using SetPtr = std::shared_ptr<Set>;
|
||
using ConstSetPtr = std::shared_ptr<const Set>;
|
||
using Sets = std::vector<SetPtr>;
|
||
|
||
}
|