* DOCSUP-2806: Add meta intro. * DOCSUP-2806: Update meta intro. * DOCSUP-2806: Fix meta. * DOCSUP-2806: Add quotes for meta headers. * DOCSUP-2806: Remove quotes from meta headers. * DOCSUP-2806: Add meta headers. * DOCSUP-2806: Fix quotes in meta headers. * DOCSUP-2806: Update meta headers. * DOCSUP-2806: Fix link to nowhere in EN. * DOCSUP-2806: Fix link (settings to tune) * DOCSUP-2806: Fix links. * DOCSUP-2806:Fix links EN * DOCSUP-2806: Fix build errors. * DOCSUP-2806: Fix meta intro. * DOCSUP-2806: Fix toc_priority in examples datasets TOC. * DOCSUP-2806: Fix items order in toc. * DOCSUP-2806: Fix order in toc. * DOCSUP-2806: Fix toc order. * DOCSUP-2806: Fix order in toc. * DOCSUP-2806: Fix toc index in create * DOCSUP-2806: Fix toc order in create. Co-authored-by: romanzhukov <romanzhukov@yandex-team.ru> Co-authored-by: alexey-milovidov <milovidov@yandex-team.ru>
6.4 KiB
toc_priority | toc_title |
---|---|
40 | Join |
Join
Подготовленная структура данных для использования в операциях JOIN.
Создание таблицы
CREATE TABLE [IF NOT EXISTS] [db.]table_name [ON CLUSTER cluster]
(
name1 [type1] [DEFAULT|MATERIALIZED|ALIAS expr1] [TTL expr1],
name2 [type2] [DEFAULT|MATERIALIZED|ALIAS expr2] [TTL expr2],
) ENGINE = Join(join_strictness, join_type, k1[, k2, ...])
Смотрите подробное описание запроса CREATE TABLE.
Параметры движка
join_strictness
– строгость JOIN.join_type
– тип JOIN.k1[, k2, ...]
– ключевые столбцы секцииUSING
с которыми выполняется операцияJOIN
.
Вводите параметры join_strictness
и join_type
без кавычек, например, Join(ANY, LEFT, col1)
. Они должны быть такими же как и в той операции JOIN
, в которой таблица будет использоваться. Если параметры не совпадают, ClickHouse не генерирует исключение и может возвращать неверные данные.
Использование таблицы
Пример
Создание левой таблицы:
CREATE TABLE id_val(`id` UInt32, `val` UInt32) ENGINE = TinyLog
INSERT INTO id_val VALUES (1,11)(2,12)(3,13)
Создание правой таблицы с движком Join
:
CREATE TABLE id_val_join(`id` UInt32, `val` UInt8) ENGINE = Join(ANY, LEFT, id)
INSERT INTO id_val_join VALUES (1,21)(1,22)(3,23)
Объединение таблиц:
SELECT * FROM id_val ANY LEFT JOIN id_val_join USING (id) SETTINGS join_use_nulls = 1
┌─id─┬─val─┬─id_val_join.val─┐
│ 1 │ 11 │ 21 │
│ 2 │ 12 │ ᴺᵁᴸᴸ │
│ 3 │ 13 │ 23 │
└────┴─────┴─────────────────┘
В качестве альтернативы, можно извлечь данные из таблицы Join
, указав значение ключа объединения:
SELECT joinGet('id_val_join', 'val', toUInt32(1))
┌─joinGet('id_val_join', 'val', toUInt32(1))─┐
│ 21 │
└────────────────────────────────────────────┘
Выборка и вставка данных
Для добавления данных в таблицы с движком Join
используйте запрос INSERT
. Если таблица создавалась со строгостью ANY
, то данные с повторяющимися ключами игнорируются. Если задавалась строгость ALL
, то добавляются все строки.
Из таблиц нельзя выбрать данные с помощью запроса SELECT
. Вместо этого, используйте один из следующих методов:
- Используйте таблицу как правую в секции
JOIN
. - Используйте функцию joinGet, которая позволяет извлекать данные из таблицы таким же образом как из словаря.
Ограничения и настройки
При создании таблицы, применяются следующие параметры :
Таблицы с движком Join
нельзя использовать в операциях GLOBAL JOIN
.
Движок Join
позволяет использовать параметр join_use_nulls в запросе CREATE TABLE
, который также можно использовать в запросе SELECT. Если у вас разные настройки join_use_nulls
, вы можете получить сообщение об ошибке при объединении таблиц. Это зависит от типа соединения. Когда вы используете функцию joinGet, вам необходимо использовать один и тот же параметр join_use_nulls
в запросах CRATE TABLE
и SELECT
.
Хранение данных
Данные таблиц Join
всегда находятся в RAM. При вставке строк в таблицу ClickHouse записывает блоки данных в каталог на диске, чтобы их можно было восстановить при перезапуске сервера.
При аварийном перезапуске сервера блок данных на диске может быть потерян или повреждён. В последнем случае, может потребоваться вручную удалить файл с повреждёнными данными.