* added description of disable_set_and_join_persistency setting. * Changed setting name to persistent, added references about persistent to join table engine and set table engine * Resolved conflict. * Added reviewers suggestions * Added translation for Russian. * Fixed typos * Update docs/en/operations/settings/settings.md Fixed minor stuff. Co-authored-by: BayoNet <da-daos@yandex.ru> * Update settings.md Updated translation. * Fixed description and translation * Fixed letter cases Co-authored-by: George <gyuton@yandex-team.ru> Co-authored-by: BayoNet <da-daos@yandex.ru>
6.4 KiB
toc_priority | toc_title |
---|---|
40 | Join |
Join
Подготовленная структура данных для использования в операциях JOIN.
Создание таблицы
CREATE TABLE [IF NOT EXISTS] [db.]table_name [ON CLUSTER cluster]
(
name1 [type1] [DEFAULT|MATERIALIZED|ALIAS expr1] [TTL expr1],
name2 [type2] [DEFAULT|MATERIALIZED|ALIAS expr2] [TTL expr2],
) ENGINE = Join(join_strictness, join_type, k1[, k2, ...])
Смотрите подробное описание запроса CREATE TABLE.
Параметры движка
join_strictness
– строгость JOIN.join_type
– тип JOIN.k1[, k2, ...]
– ключевые столбцы секцииUSING
с которыми выполняется операцияJOIN
.
Вводите параметры join_strictness
и join_type
без кавычек, например, Join(ANY, LEFT, col1)
. Они должны быть такими же как и в той операции JOIN
, в которой таблица будет использоваться. Если параметры не совпадают, ClickHouse не генерирует исключение и может возвращать неверные данные.
Использование таблицы
Пример
Создание левой таблицы:
CREATE TABLE id_val(`id` UInt32, `val` UInt32) ENGINE = TinyLog
INSERT INTO id_val VALUES (1,11)(2,12)(3,13)
Создание правой таблицы с движком Join
:
CREATE TABLE id_val_join(`id` UInt32, `val` UInt8) ENGINE = Join(ANY, LEFT, id)
INSERT INTO id_val_join VALUES (1,21)(1,22)(3,23)
Объединение таблиц:
SELECT * FROM id_val ANY LEFT JOIN id_val_join USING (id) SETTINGS join_use_nulls = 1
┌─id─┬─val─┬─id_val_join.val─┐
│ 1 │ 11 │ 21 │
│ 2 │ 12 │ ᴺᵁᴸᴸ │
│ 3 │ 13 │ 23 │
└────┴─────┴─────────────────┘
В качестве альтернативы, можно извлечь данные из таблицы Join
, указав значение ключа объединения:
SELECT joinGet('id_val_join', 'val', toUInt32(1))
┌─joinGet('id_val_join', 'val', toUInt32(1))─┐
│ 21 │
└────────────────────────────────────────────┘
Выборка и вставка данных
Для добавления данных в таблицы с движком Join
используйте запрос INSERT
. Если таблица создавалась со строгостью ANY
, то данные с повторяющимися ключами игнорируются. Если задавалась строгость ALL
, то добавляются все строки.
Из таблиц нельзя выбрать данные с помощью запроса SELECT
. Вместо этого, используйте один из следующих методов:
- Используйте таблицу как правую в секции
JOIN
. - Используйте функцию joinGet, которая позволяет извлекать данные из таблицы таким же образом как из словаря.
Ограничения и настройки
При создании таблицы, применяются следующие параметры :
- join_use_nulls
- max_rows_in_join
- max_bytes_in_join
- join_overflow_mode
- join_any_take_last_row
- persistent
Таблицы с движком Join
нельзя использовать в операциях GLOBAL JOIN
.
Движок Join
позволяет использовать параметр join_use_nulls в запросе CREATE TABLE
, который также можно использовать в запросе SELECT. Если у вас разные настройки join_use_nulls
, вы можете получить сообщение об ошибке при объединении таблиц. Это зависит от типа соединения. Когда вы используете функцию joinGet, вам необходимо использовать один и тот же параметр join_use_nulls
в запросах CRATE TABLE
и SELECT
.
Хранение данных
Данные таблиц Join
всегда находятся в RAM. При вставке строк в таблицу ClickHouse записывает блоки данных в каталог на диске, чтобы их можно было восстановить при перезапуске сервера.
При аварийном перезапуске сервера блок данных на диске может быть потерян или повреждён. В последнем случае, может потребоваться вручную удалить файл с повреждёнными данными.