ClickHouse/dbms/include/DB/Common/HashTable/HashMap.h

182 lines
6.7 KiB
C
Raw Normal View History

2014-03-17 02:01:03 +00:00
#pragma once
#include <DB/Common/HashTable/Hash.h>
#include <DB/Common/HashTable/HashTable.h>
#include <DB/Common/HashTable/HashTableAllocator.h>
2014-05-19 04:54:54 +00:00
struct NoInitTag {};
/// Пара, которая не инициализирует элементы, если не нужно.
template <typename First, typename Second>
struct PairNoInit
{
First first;
Second second;
PairNoInit() {}
template <typename First_>
PairNoInit(First_ && first_, NoInitTag)
: first(std::forward<First_>(first_)) {}
template <typename First_, typename Second_>
PairNoInit(First_ && first_, Second_ && second_)
: first(std::forward<First_>(first_)), second(std::forward<Second_>(second_)) {}
};
template <typename Key, typename TMapped, typename Hash, typename TState = HashTableNoState>
2014-03-17 02:01:03 +00:00
struct HashMapCell
{
typedef TMapped Mapped;
typedef TState State;
2014-05-19 04:54:54 +00:00
typedef PairNoInit<Key, Mapped> value_type;
2014-03-17 02:01:03 +00:00
value_type value;
HashMapCell() {}
2014-05-19 04:54:54 +00:00
HashMapCell(const Key & key_, const State & state) : value(key_, NoInitTag()) {}
HashMapCell(const value_type & value_, const State & state) : value(value_) {}
2014-03-17 02:01:03 +00:00
value_type & getValue() { return value; }
const value_type & getValue() const { return value; }
static Key & getKey(value_type & value) { return value.first; }
static const Key & getKey(const value_type & value) { return value.first; }
bool keyEquals(const Key & key_) const { return value.first == key_; }
bool keyEquals(const Key & key_, size_t hash_) const { return value.first == key_; }
2014-03-17 02:01:03 +00:00
void setHash(size_t hash_value) {}
size_t getHash(const Hash & hash) const { return hash(value.first); }
bool isZero(const State & state) const { return isZero(value.first, state); }
static bool isZero(const Key & key, const State & state) { return ZeroTraits::check(key); }
/// Установить значение ключа в ноль.
void setZero() { ZeroTraits::set(value.first); }
2014-03-17 02:01:03 +00:00
/// Нужно ли хранить нулевой ключ отдельно (то есть, могут ли в хэш-таблицу вставить нулевой ключ).
static constexpr bool need_zero_value_storage = true;
/// Является ли ячейка удалённой.
bool isDeleted() const { return false; }
2014-03-17 02:01:03 +00:00
void setMapped(const value_type & value_) { value.second = value_.second; }
/// Сериализация, в бинарном и текстовом виде.
void write(DB::WriteBuffer & wb) const
{
DB::writeBinary(value.first, wb);
DB::writeBinary(value.second, wb);
}
void writeText(DB::WriteBuffer & wb) const
{
2014-03-17 02:06:26 +00:00
DB::writeDoubleQuoted(value.first, wb);
DB::writeChar(',', wb);
DB::writeDoubleQuoted(value.second, wb);
2014-03-17 02:01:03 +00:00
}
/// Десериализация, в бинарном и текстовом виде.
void read(DB::ReadBuffer & rb)
{
DB::readBinary(value.first, rb);
DB::readBinary(value.second, rb);
}
void readText(DB::ReadBuffer & rb)
{
2014-03-17 02:06:26 +00:00
DB::readDoubleQuoted(value.first, rb);
DB::assertString(",", rb);
DB::readDoubleQuoted(value.second, rb);
2014-03-17 02:01:03 +00:00
}
};
template <typename Key, typename TMapped, typename Hash, typename TState = HashTableNoState>
struct HashMapCellWithSavedHash : public HashMapCell<Key, TMapped, Hash, TState>
{
typedef HashMapCell<Key, TMapped, Hash, TState> Base;
size_t saved_hash;
HashMapCellWithSavedHash() : Base() {}
HashMapCellWithSavedHash(const Key & key_, const typename Base::State & state) : Base(key_, state) {}
HashMapCellWithSavedHash(const typename Base::value_type & value_, const typename Base::State & state) : Base(value_, state) {}
bool keyEquals(const Key & key_) const { return this->value.first == key_; }
bool keyEquals(const Key & key_, size_t hash_) const { return saved_hash == hash_ && this->value.first == key_; }
void setHash(size_t hash_value) { saved_hash = hash_value; }
size_t getHash(const Hash & hash) const { return saved_hash; }
};
2014-03-17 02:01:03 +00:00
template
<
typename Key,
typename Cell,
2014-03-17 02:01:03 +00:00
typename Hash = DefaultHash<Key>,
2014-05-03 16:03:49 +00:00
typename Grower = HashTableGrower<>,
2014-03-17 02:01:03 +00:00
typename Allocator = HashTableAllocator
>
class HashMapTable : public HashTable<Key, Cell, Hash, Grower, Allocator>
2014-03-17 02:01:03 +00:00
{
public:
typedef Key key_type;
typedef typename Cell::Mapped mapped_type;
typedef typename Cell::value_type value_type;
2014-03-17 02:01:03 +00:00
2014-12-25 00:19:29 +00:00
using HashTable<Key, Cell, Hash, Grower, Allocator>::HashTable;
mapped_type & ALWAYS_INLINE operator[](Key x)
2014-03-17 02:01:03 +00:00
{
typename HashMapTable::iterator it;
2014-03-17 02:01:03 +00:00
bool inserted;
this->emplace(x, it, inserted);
/** Может показаться, что инициализация не обязательна для POD-типов (или __has_trivial_constructor),
* так как кусок памяти для хэш-таблицы изначально инициализирован нулями.
* Но, на самом деле, пустая ячейка может быть не инициализирована нулями в следующих случаях:
* - ZeroValueStorage (в нём зануляется только ключ);
* - после ресайза и переноса части ячеек в новую половину хэш-таблицы, у старых ячеек, тоже зануляется только ключ.
*
* По производительности, разницы почти всегда нет, за счёт того, что it->second как правило присваивается сразу
* после вызова operator[], и так как operator[] инлайнится, компилятор убирает лишнюю инициализацию.
*
* Иногда из-за инициализации, производительность даже растёт. Это происходит в коде вида ++map[key].
* Когда мы делаем инициализацию, то для новых ячеек, достаточно сразу сделать store 1.
* А если бы мы не делали инициализацию, то не смотря на то, что в ячейке был ноль,
* компилятор не может об этом догадаться, и генерирует код load, increment, store.
*/
if (inserted)
new(&it->second) mapped_type();
2014-03-17 02:01:03 +00:00
return it->second;
}
};
template
<
typename Key,
typename Mapped,
typename Hash = DefaultHash<Key>,
2014-05-03 16:03:49 +00:00
typename Grower = HashTableGrower<>,
typename Allocator = HashTableAllocator
>
using HashMap = HashMapTable<Key, HashMapCell<Key, Mapped, Hash>, Hash, Grower, Allocator>;
template
<
typename Key,
typename Mapped,
typename Hash = DefaultHash<Key>,
typename Grower = HashTableGrower<>,
typename Allocator = HashTableAllocator
>
using HashMapWithSavedHash = HashMapTable<Key, HashMapCellWithSavedHash<Key, Mapped, Hash>, Hash, Grower, Allocator>;