ClickHouse/dbms/include/DB/Interpreters/Set.h
2012-08-23 22:27:10 +00:00

79 lines
2.7 KiB
C++
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

#pragma once
#include <set>
#include <DB/Parsers/IAST.h>
#include <DB/Interpreters/HashSet.h>
#include <DB/Interpreters/Aggregator.h>
namespace DB
{
/** Структура данных для реализации выражения IN.
*/
struct Set
{
Set() : type(EMPTY), log(&Logger::get("Set")) {}
bool empty() { return type == EMPTY; }
/** Создать множество по потоку блоков (для подзапроса). */
void create(BlockInputStreamPtr stream);
/** Создать множество по выражению (для перечисления в самом запросе). */
void create(ASTPtr node);
/** Для указанных столбцов блока проверить принадлежность их значений множеству.
* Записать результат в столбец в позиции result.
*/
void execute(Block & block, const ColumnNumbers & arguments, size_t result, bool negative) const;
private:
/** Разные структуры данных, которые могут использоваться для проверки принадлежности
* одного или нескольких столбцов значений множеству.
*/
typedef std::set<Row> SetGeneric;
typedef HashSet<UInt64> SetUInt64;
typedef HashSet<StringRef, StringRefHash, StringRefZeroTraits> SetString;
typedef HashSet<UInt128, UInt128Hash, UInt128ZeroTraits> SetHashed;
/// Наиболее общий вариант. Самый медленный. На данный момент, не используется.
SetGeneric generic;
/// Специализация для случая, когда есть один числовой ключ (не с плавающей запятой).
SetUInt64 key64;
/// Специализация для случая, когда есть один строковый ключ.
SetString key_string;
StringPool string_pool;
/** Сравнивает 128 битные хэши.
* Если все ключи фиксированной длины, влезающие целиком в 128 бит, то укладывает их без изменений в 128 бит.
* Иначе - вычисляет md5 от набора из всех ключей.
* (При этом, строки, содержащие нули посередине, могут склеиться.)
*/
SetHashed hashed;
enum Type
{
EMPTY = 0,
GENERIC = 1,
KEY_64 = 2,
KEY_STRING = 3,
HASHED = 4,
};
Type type;
Logger * log;
typedef std::vector<size_t> Sizes;
static Type chooseMethod(Columns & key_columns, bool & keys_fit_128_bits, Sizes & key_sizes);
};
typedef SharedPtr<Set> SetPtr;
}