ClickHouse/docs/ru/operations/table_engines/join.md

5.2 KiB
Raw Blame History

Join

Подготовленная структура данных для использования в операциях JOIN.

Создание таблицы

CREATE TABLE [IF NOT EXISTS] [db.]table_name [ON CLUSTER cluster]
(
    name1 [type1] [DEFAULT|MATERIALIZED|ALIAS expr1] [TTL expr1],
    name2 [type2] [DEFAULT|MATERIALIZED|ALIAS expr2] [TTL expr2],
) ENGINE = Join(join_strictness, join_type, k1[, k2, ...])

Смотрите подробное описание запроса CREATE TABLE.

Параметры движка

  • join_strictness строгость JOIN.
  • join_type тип JOIN.
  • k1[, k2, ...] ключевые столбцы секции USING с которыми выполняется операция JOIN.

Вводите параметры join_strictness и join_type без кавычек, например, Join(ANY, LEFT, col1). Они должны быть такими же как и в той операции JOIN, в которой таблица будет использоваться. Если параметры не совпадают, ClickHouse не генерирует исключение и может возвращать неверные данные.

Использование таблицы

Пример

Создание левой таблицы:

CREATE TABLE id_val(`id` UInt32, `val` UInt32) ENGINE = TinyLog
INSERT INTO id_val VALUES (1,11)(2,12)(3,13)

Создание правой таблицы с движком Join:

CREATE TABLE id_val_join(`id` UInt32, `val` UInt8) ENGINE = Join(ANY, LEFT, id)
INSERT INTO id_val_join VALUES (1,21)(1,22)(3,23)

Объединение таблиц:

SELECT * FROM id_val ANY LEFT JOIN id_val_join USING (id) SETTINGS join_use_nulls = 1
┌─id─┬─val─┬─id_val_join.val─┐
│  1 │  11 │              21 │
│  2 │  12 │            ᴺᵁᴸᴸ │
│  3 │  13 │              23 │
└────┴─────┴─────────────────┘

В качестве альтернативы, можно извлечь данные из таблицы Join, указав значение ключа объединения:

SELECT joinGet('id_val_join', 'val', toUInt32(1))
┌─joinGet('id_val_join', 'val', toUInt32(1))─┐
│                                         21 │
└────────────────────────────────────────────┘

Выборка и вставка данных

Для добавления данных в таблицы с движком Join используйте запрос INSERT. Если таблица создавалась со строгостью ANY, то данные с повторяющимися ключами игнорируются. Если задавалась строгость ALL, то добавляются все строки.

Из таблиц нельзя выбрать данные с помощью запроса SELECT. Вместо этого, используйте один из следующих методов:

  • Используйте таблицу как правую в секции JOIN.
  • Используйте функцию joinGet, которая позволяет извлекать данные из таблицы таким же образом как из словаря.

Ограничения и настройки

При создании таблицы, применяются следующие параметры :

Таблицы с движком Join нельзя использовать в операциях GLOBAL JOIN.

Хранение данных

Данные таблиц Join всегда находятся в RAM. При вставке строк в таблицу ClickHouse записывает блоки данных в каталог на диске, чтобы их можно было восстановить при перезапуске сервера.

При аварийном перезапуске сервера блок данных на диске может быть потерян или повреждён. В последнем случае, может потребоваться вручную удалить файл с повреждёнными данными.

Оригинальная статья