ClickHouse/docs/ru/engines/table-engines/mergetree-family/mergetree.md

---
toc_priority: 30
toc_title: MergeTree
---

# MergeTree {#table_engines-mergetree}

Движок `MergeTree`, а также другие движки этого семейства (`*MergeTree`) — это наиболее функциональные движки таблиц ClickHouse.

Основная идея, заложенная в основу движков семейства `MergeTree` следующая. Когда у вас есть огромное количество данных, которые должны быть вставлены в таблицу, вы должны быстро записать их по частям, а затем объединить части по некоторым правилам в фоновом режиме. Этот метод намного эффективнее, чем постоянная перезапись данных в хранилище при вставке.

Основные возможности:

-   **Хранит данные, отсортированные по первичному ключу.** Это позволяет создавать разреженный индекс небольшого объёма, который позволяет быстрее находить данные.

-   **Позволяет оперировать партициями, если задан [ключ партиционирования](custom-partitioning-key.md).** ClickHouse поддерживает отдельные операции с партициями, которые работают эффективнее, чем общие операции с этим же результатом над этими же данными. Также, ClickHouse автоматически отсекает данные по партициям там, где ключ партиционирования указан в запросе. Это также увеличивает эффективность выполнения запросов.

-   **Поддерживает репликацию данных.** Для этого используется семейство таблиц `ReplicatedMergeTree`. Подробнее читайте в разделе [Репликация данных](replication.md).

-   **Поддерживает сэмплирование данных.** При необходимости можно задать способ сэмплирования данных в таблице.

!!! info "Info"
    Движок [Merge](../special/merge.md#merge) не относится к семейству `*MergeTree`.

## Создание таблицы {#table_engine-mergetree-creating-a-table}

``` sql
CREATE TABLE [IF NOT EXISTS] [db.]table_name [ON CLUSTER cluster]
(
    name1 [type1] [DEFAULT|MATERIALIZED|ALIAS expr1] [TTL expr1],
    name2 [type2] [DEFAULT|MATERIALIZED|ALIAS expr2] [TTL expr2],
    ...
    INDEX index_name1 expr1 TYPE type1(...) GRANULARITY value1,
    INDEX index_name2 expr2 TYPE type2(...) GRANULARITY value2
) ENGINE = MergeTree()
ORDER BY expr
[PARTITION BY expr]
[PRIMARY KEY expr]
[SAMPLE BY expr]
[TTL expr
    [DELETE|TO DISK 'xxx'|TO VOLUME 'xxx' [, ...] ]
    [WHERE conditions]
    [GROUP BY key_expr [SET v1 = aggr_func(v1) [, v2 = aggr_func(v2) ...]] ] ]
[SETTINGS name=value, ...]
```

Описание параметров смотрите в [описании запроса CREATE](../../../engines/table-engines/mergetree-family/mergetree.md).

### Секции запроса {#mergetree-query-clauses}

-   `ENGINE` — имя и параметры движка. `ENGINE = MergeTree()`. `MergeTree` не имеет параметров.

-   `ORDER BY` — ключ сортировки.

    Кортеж столбцов или произвольных выражений. Пример: `ORDER BY (CounterID, EventDate)`.

    ClickHouse использует ключ сортировки в качестве первичного ключа, если первичный ключ не задан в секции `PRIMARY KEY`.

    Чтобы отключить сортировку, используйте синтаксис `ORDER BY tuple()`. Смотрите [выбор первичного ключа](#primary-keys-and-indexes-in-queries).

-   `PARTITION BY` — [ключ партиционирования](custom-partitioning-key.md). Необязательный параметр.

    Для партиционирования по месяцам используйте выражение `toYYYYMM(date_column)`, где `date_column` — столбец с датой типа [Date](../../../engines/table-engines/mergetree-family/mergetree.md). В этом случае имена партиций имеют формат `"YYYYMM"`.

-   `PRIMARY KEY` — первичный ключ, если он [отличается от ключа сортировки](#choosing-a-primary-key-that-differs-from-the-sorting-key). Необязательный параметр.

    По умолчанию первичный ключ совпадает с ключом сортировки (который задаётся секцией `ORDER BY`.) Поэтому в большинстве случаев секцию `PRIMARY KEY` отдельно указывать не нужно.

-   `SAMPLE BY` — выражение для сэмплирования. Необязательный параметр.

    Если используется выражение для сэмплирования, то первичный ключ должен содержать его. Результат выражения для сэмплирования должен быть беззнаковым целым числом. Пример: `SAMPLE BY intHash32(UserID) ORDER BY (CounterID, EventDate, intHash32(UserID))`.

-   `TTL` — список правил, определяющих длительности хранения строк, а также задающих правила перемещения частей на определённые тома или диски. Необязательный параметр.

    Выражение должно возвращать столбец `Date` или `DateTime`. Пример: `TTL date + INTERVAL 1 DAY`.

    Тип правила `DELETE|TO DISK 'xxx'|TO VOLUME 'xxx'|GROUP BY` указывает действие, которое будет выполнено с частью: удаление строк (прореживание), перемещение (при выполнении условия для всех строк части) на определённый диск (`TO DISK 'xxx'`) или том (`TO VOLUME 'xxx'`), или агрегирование данных в устаревших строках. Поведение по умолчанию соответствует удалению строк (`DELETE`). В списке правил может быть указано только одно выражение с поведением `DELETE`.

    Дополнительные сведения смотрите в разделе [TTL для столбцов и таблиц](#table_engine-mergetree-ttl)

-   `SETTINGS` — дополнительные параметры, регулирующие поведение `MergeTree` (необязательные):

    -   `index_granularity` — максимальное количество строк данных между засечками индекса. По умолчанию — 8192. Смотрите [Хранение данных](#mergetree-data-storage).
    -   `index_granularity_bytes` — максимальный размер гранул данных в байтах. По умолчанию — 10Mb. Чтобы ограничить размер гранул только количеством строк, установите значение 0 (не рекомендовано). Смотрите [Хранение данных](#mergetree-data-storage).
    -   `min_index_granularity_bytes` — минимально допустимый размер гранул данных в байтах. Значение по умолчанию — 1024b. Для обеспечения защиты от случайного создания таблиц с очень низким значением `index_granularity_bytes`. Смотрите [Хранение данных](#mergetree-data-storage).
    -   `enable_mixed_granularity_parts` — включает или выключает переход к ограничению размера гранул с помощью настройки `index_granularity_bytes`. Настройка `index_granularity_bytes` улучшает производительность ClickHouse при выборке данных из таблиц с большими (десятки и сотни мегабайтов) строками. Если у вас есть таблицы с большими строками, можно включить эту настройку, чтобы повысить эффективность запросов `SELECT`.
    -   `use_minimalistic_part_header_in_zookeeper` — Способ хранения заголовков кусков данных в ZooKeeper. Если  `use_minimalistic_part_header_in_zookeeper = 1`, то ZooKeeper хранит меньше данных. Подробнее читайте в [описании настройки](../../../operations/server-configuration-parameters/settings.md#server-settings-use_minimalistic_part_header_in_zookeeper) в разделе "Конфигурационные параметры сервера".
    -   `min_merge_bytes_to_use_direct_io` — минимальный объём данных при слиянии, необходимый для прямого (небуферизованного) чтения/записи (direct I/O) на диск. При слиянии частей данных ClickHouse вычисляет общий объём хранения всех данных, подлежащих слиянию. Если общий объём хранения всех данных для чтения превышает `min_bytes_to_use_direct_io` байт, тогда ClickHouse  использует флаг `O_DIRECT` при чтении данных с диска. Если `min_merge_bytes_to_use_direct_io = 0`, тогда прямой ввод-вывод отключен. Значение по умолчанию: `10 * 1024 * 1024 * 1024` байтов.
    -   <a name="mergetree_setting-merge_with_ttl_timeout"></a>`merge_with_ttl_timeout` — минимальное время в секундах перед повторным слиянием с TTL. По умолчанию — 86400 (1 день).
    -   `write_final_mark` — включает или отключает запись последней засечки индекса в конце куска данных, указывающей за последний байт. По умолчанию — 1. Не отключайте её.
    -   `merge_max_block_size` — максимальное количество строк в блоке для операций слияния. Значение по умолчанию: 8192.
    -   `storage_policy` — политика хранения данных. Смотрите [Хранение данных таблицы на нескольких блочных устройствах](#table_engine-mergetree-multiple-volumes).
    -   `min_bytes_for_wide_part`, `min_rows_for_wide_part` — минимальное количество байт/строк в куске данных для хранения в формате `Wide`. Можно задать одну или обе настройки или не задавать ни одной. Подробнее см. в разделе [Хранение данных](#mergetree-data-storage).
	-   `max_parts_in_total` — максимальное количество кусков во всех партициях.
	-   `max_compress_block_size` — максимальный размер блоков несжатых данных перед сжатием для записи в таблицу. Вы также можете задать этот параметр в глобальных настройках (смотрите [max_compress_block_size](../../../operations/settings/settings.md#max-compress-block-size)). Настройка, которая задается при создании таблицы, имеет более высокий приоритет, чем глобальная.
	-   `min_compress_block_size` — минимальный размер блоков несжатых данных, необходимых для сжатия при записи следующей засечки. Вы также можете задать этот параметр в глобальных настройках (смотрите [min_compress_block_size](../../../operations/settings/settings.md#min-compress-block-size)). Настройка, которая задается при создании таблицы, имеет более высокий приоритет, чем глобальная.
    -   `max_partitions_to_read` — Ограничивает максимальное число партиций для чтения в одном запросе. Также возможно указать настройку [max_partitions_to_read](../../../operations/settings/merge-tree-settings.md#max-partitions-to-read) в глобальных настройках.

**Пример задания секций**

``` sql
ENGINE MergeTree() PARTITION BY toYYYYMM(EventDate) ORDER BY (CounterID, EventDate, intHash32(UserID)) SAMPLE BY intHash32(UserID) SETTINGS index_granularity=8192
```

В примере мы устанавливаем партиционирование по месяцам.

Также мы задаем выражение для сэмплирования в виде хэша по идентификатору посетителя. Это позволяет псевдослучайным образом перемешать данные в таблице для каждого `CounterID` и `EventDate`. Если при выборке данных задать секцию [SAMPLE](../../../engines/table-engines/mergetree-family/mergetree.md#select-sample-clause), то ClickHouse вернёт равномерно-псевдослучайную выборку данных для подмножества посетителей.

`index_granularity` можно было не указывать, поскольку 8192 — это значение по умолчанию.

<details markdown="1">

<summary>Устаревший способ создания таблицы</summary>

!!! attention "Attention"
    Не используйте этот способ в новых проектах и по возможности переведите старые проекты на способ, описанный выше.

``` sql
CREATE TABLE [IF NOT EXISTS] [db.]table_name [ON CLUSTER cluster]
(
    name1 [type1] [DEFAULT|MATERIALIZED|ALIAS expr1],
    name2 [type2] [DEFAULT|MATERIALIZED|ALIAS expr2],
    ...
) ENGINE [=] MergeTree(date-column [, sampling_expression], (primary, key), index_granularity)
```

**Параметры MergeTree()**

-   `date-column` — имя столбца с типом [Date](../../../engines/table-engines/mergetree-family/mergetree.md). На основе этого столбца ClickHouse автоматически создаёт партиции по месяцам. Имена партиций имеют формат `"YYYYMM"`.
-   `sampling_expression` — выражение для сэмплирования.
-   `(primary, key)` — первичный ключ. Тип — [Tuple()](../../../engines/table-engines/mergetree-family/mergetree.md)
-   `index_granularity` — гранулярность индекса. Число строк данных между «засечками» индекса. Для большинства задач подходит значение 8192.

**Пример**

``` sql
MergeTree(EventDate, intHash32(UserID), (CounterID, EventDate, intHash32(UserID)), 8192)
```

Движок `MergeTree` сконфигурирован таким же образом, как и в примере выше для основного способа конфигурирования движка.

</details>

## Хранение данных {#mergetree-data-storage}

Таблица состоит из *кусков* данных (data parts), отсортированных по первичному ключу.

При вставке в таблицу создаются отдельные куски данных, каждый из которых лексикографически отсортирован по первичному ключу. Например, если первичный ключ — `(CounterID, Date)`, то данные в куске будут лежать в порядке `CounterID`, а для каждого `CounterID` в порядке `Date`.

Данные, относящиеся к разным партициям, разбиваются на разные куски. В фоновом режиме ClickHouse выполняет слияния (merge) кусков данных для более эффективного хранения. Куски, относящиеся к разным партициям не объединяются. Механизм слияния не гарантирует, что все строки с одинаковым первичным ключом окажутся в одном куске.

Куски данных могут храниться в формате `Wide` или `Compact`. В формате `Wide` каждый столбец хранится в отдельном файле, а в формате `Compact` все столбцы хранятся в одном файле. Формат `Compact` может быть полезен для повышения производительности при частом добавлении небольших объемов данных.

Формат хранения определяется настройками движка `min_bytes_for_wide_part` и `min_rows_for_wide_part`. Если число байт или строк в куске данных меньше значения, указанного в соответствующей настройке, тогда этот кусок данных хранится в формате `Compact`. В противном случае кусок данных хранится в формате `Wide`. Если ни одна из настроек не задана, куски данных хранятся в формате `Wide`.

Каждый кусок данных логически делится на гранулы. Гранула — это минимальный неделимый набор данных, который ClickHouse считывает при выборке данных. ClickHouse не разбивает строки и значения и гранула всегда содержит целое число строк. Первая строка гранулы помечается значением первичного ключа для этой строки (засечка). Для каждого куска данных ClickHouse создаёт файл с засечками (индексный файл). Для каждого столбца, независимо от того, входит он в первичный ключ или нет, ClickHouse также сохраняет эти же засечки. Засечки используются для поиска данных напрямую в файлах столбцов.

Размер гранул оганичен настройками движка `index_granularity` и `index_granularity_bytes`. Количество строк в грануле лежит в диапазоне `[1, index_granularity]`, в зависимости от размера строк. Размер гранулы может превышать `index_granularity_bytes` в том случае, когда размер единственной строки в грануле превышает значение настройки. В этом случае, размер гранулы равен размеру строки.

## Первичные ключи и индексы в запросах {#primary-keys-and-indexes-in-queries}

Рассмотрим первичный ключ — `(CounterID, Date)`. В этом случае сортировку и индекс можно проиллюстрировать следующим образом:

``` text
Whole data:     [-------------------------------------------------------------------------]
CounterID:      [aaaaaaaaaaaaaaaaaabbbbcdeeeeeeeeeeeeefgggggggghhhhhhhhhiiiiiiiiikllllllll]
Date:           [1111111222222233331233211111222222333211111112122222223111112223311122333]
Marks:           |      |      |      |      |      |      |      |      |      |      |
                a,1    a,2    a,3    b,3    e,2    e,3    g,1    h,2    i,1    i,3    l,3
Marks numbers:   0      1      2      3      4      5      6      7      8      9      10
```

Если в запросе к данным указать:

-   `CounterID IN ('a', 'h')`, то сервер читает данные в диапазонах засечек `[0, 3)` и `[6, 8)`.
-   `CounterID IN ('a', 'h') AND Date = 3`, то сервер читает данные в диапазонах засечек `[1, 3)` и `[7, 8)`.
-   `Date = 3`, то сервер читает данные в диапазоне засечек `[1, 10]`.

Примеры выше показывают, что использование индекса всегда эффективнее, чем full scan.

Разреженный индекс допускает чтение лишних строк. При чтении одного диапазона первичного ключа, может быть прочитано до `index_granularity * 2` лишних строк в каждом блоке данных.

Разреженный индекс почти всегда помещаеся в оперативную память и позволяет работать с очень большим количеством строк в таблицах.

ClickHouse не требует уникального первичного ключа. Можно вставить много строк с одинаковым первичным ключом.

Ключ в `PRIMARY KEY` и `ORDER BY` может иметь тип `Nullable`. За поддержку этой возможности отвечает настройка [allow_nullable_key](../../../operations/settings/settings.md#allow-nullable-key).

При сортировке с использованием выражения `ORDER BY` для значений `NULL` всегда работает принцип [NULLS_LAST](../../../sql-reference/statements/select/order-by.md#sorting-of-special-values).

### Выбор первичного ключа {#selecting-the-primary-key}

Количество столбцов в первичном ключе не ограничено явным образом. В зависимости от структуры данных в первичный ключ можно включать больше или меньше столбцов. Это может:

-   Увеличить эффективность индекса.

    Пусть первичный ключ — `(a, b)`, тогда добавление ещё одного столбца `c` повысит эффективность, если выполнены условия:

    - Есть запросы с условием на столбец `c`.
    - Часто встречаются достаточно длинные (в несколько раз больше `index_granularity`) диапазоны данных с одинаковыми значениями `(a, b)`. Иначе говоря, когда добавление ещё одного столбца позволит пропускать достаточно длинные диапазоны данных.

-   Улучшить сжатие данных.

    ClickHouse сортирует данные по первичному ключу, поэтому чем выше однородность, тем лучше сжатие.

-   Обеспечить дополнительную логику при слиянии кусков данных в движках [CollapsingMergeTree](collapsingmergetree.md#table_engine-collapsingmergetree) и [SummingMergeTree](summingmergetree.md).

    В этом случае имеет смысл указать отдельный *ключ сортировки*, отличающийся от первичного ключа.

Длинный первичный ключ будет негативно влиять на производительность вставки и потребление памяти, однако на производительность ClickHouse при запросах `SELECT` лишние столбцы в первичном ключе не влияют.

Вы можете создать таблицу без первичного ключа, используя синтаксис `ORDER BY tuple()`. В этом случае ClickHouse хранит данные в порядке вставки. Если вы хотите сохранить порядок данных при вставке данных с помощью запросов `INSERT ... SELECT`, установите [max_insert_threads = 1](../../../operations/settings/settings.md#settings-max-insert-threads).

Чтобы выбрать данные в первоначальном порядке, используйте
[однопоточные](../../../operations/settings/settings.md#settings-max_threads) запросы `SELECT.


### Первичный ключ, отличный от ключа сортировки {#choosing-a-primary-key-that-differs-from-the-sorting-key}

Существует возможность задать первичный ключ (выражение, значения которого будут записаны в индексный файл для
каждой засечки), отличный от ключа сортировки (выражение, по которому будут упорядочены строки в кусках
данных). Кортеж выражения первичного ключа при этом должен быть префиксом кортежа выражения ключа
сортировки.

Данная возможность особенно полезна при использовании движков [SummingMergeTree](summingmergetree.md)
и [AggregatingMergeTree](aggregatingmergetree.md). В типичном сценарии использования этих движков таблица
содержит столбцы двух типов: *измерения* (dimensions) и *меры* (measures). Типичные запросы агрегируют
значения столбцов-мер с произвольной группировкой и фильтрацией по измерениям. Так как `SummingMergeTree`
и `AggregatingMergeTree` производят фоновую агрегацию строк с одинаковым значением ключа сортировки, приходится
добавлять в него все столбцы-измерения. В результате выражение ключа содержит большой список столбцов,
который приходится постоянно расширять при добавлении новых измерений.

В этом сценарии имеет смысл оставить в первичном ключе всего несколько столбцов, которые обеспечат эффективную фильтрацию по индексу, а остальные столбцы-измерения добавить в выражение ключа сортировки.

[ALTER ключа сортировки](../../../engines/table-engines/mergetree-family/mergetree.md) — лёгкая операция, так как при одновременном добавлении нового столбца в таблицу и ключ сортировки не нужно изменять данные кусков (они остаются упорядоченными и по новому выражению ключа).

### Использование индексов и партиций в запросах {#use-of-indexes-and-partitions-in-queries}

Для запросов `SELECT` ClickHouse анализирует возможность использования индекса. Индекс может использоваться, если в секции `WHERE/PREWHERE`, в качестве одного из элементов конъюнкции, или целиком, есть выражение, представляющее операции сравнения на равенства, неравенства, а также `IN` или `LIKE` с фиксированным префиксом, над столбцами или выражениями, входящими в первичный ключ или ключ партиционирования, либо над некоторыми частично монотонными функциями от этих столбцов, а также логические связки над такими выражениями.

Таким образом, обеспечивается возможность быстро выполнять запросы по одному или многим диапазонам первичного ключа. Например, в указанном примере будут быстро работать запросы для конкретного счётчика; для конкретного счётчика и диапазона дат; для конкретного счётчика и даты, для нескольких счётчиков и диапазона дат и т. п.

Рассмотрим движок сконфигурированный следующим образом:

``` sql
ENGINE MergeTree() PARTITION BY toYYYYMM(EventDate) ORDER BY (CounterID, EventDate) SETTINGS index_granularity=8192
```

В этом случае в запросах:

``` sql
SELECT count() FROM table WHERE EventDate = toDate(now()) AND CounterID = 34
SELECT count() FROM table WHERE EventDate = toDate(now()) AND (CounterID = 34 OR CounterID = 42)
SELECT count() FROM table WHERE ((EventDate >= toDate('2014-01-01') AND EventDate <= toDate('2014-01-31')) OR EventDate = toDate('2014-05-01')) AND CounterID IN (101500, 731962, 160656) AND (CounterID = 101500 OR EventDate != toDate('2014-05-01'))
```

ClickHouse будет использовать индекс по первичному ключу для отсечения не подходящих данных, а также ключ партиционирования по месяцам для отсечения партиций, которые находятся в не подходящих диапазонах дат.

Запросы выше показывают, что индекс используется даже для сложных выражений. Чтение из таблицы организовано так, что использование индекса не может быть медленнее, чем full scan.

В примере ниже индекс не может использоваться.

``` sql
SELECT count() FROM table WHERE CounterID = 34 OR URL LIKE '%upyachka%'
```

Чтобы проверить, сможет ли ClickHouse использовать индекс при выполнении запроса, используйте настройки [force_index_by_date](../../../operations/settings/settings.md#settings-force_index_by_date) и [force_primary_key](../../../operations/settings/settings.md#settings-force_primary_key).

Ключ партиционирования по месяцам обеспечивает чтение только тех блоков данных, которые содержат даты из нужного диапазона. При этом блок данных может содержать данные за многие даты (до целого месяца). В пределах одного блока данные упорядочены по первичному ключу, который может не содержать дату в качестве первого столбца. В связи с этим, при использовании запроса с указанием условия только на дату, но не на префикс первичного ключа, будет читаться данных больше, чем за одну дату.

### Использование индекса для частично-монотонных первичных ключей {#use-of-index-for-partially-monotonic-primary-keys}

Рассмотрим, например, дни месяца. Они образуют последовательность [монотонную](https://ru.wikipedia.org/wiki/Монотонная_последовательность) в течение одного месяца, но не монотонную на более длительных периодах. Это частично-монотонная последовательность. Если пользователь создаёт таблицу с частично-монотонным первичным ключом, ClickHouse как обычно создаёт разреженный индекс. Когда пользователь выбирает данные из такого рода таблиц, ClickHouse анализирует условия запроса. Если пользователь хочет получить данные между двумя метками индекса, и обе эти метки находятся внутри одного месяца, ClickHouse может использовать индекс в данном конкретном случае, поскольку он может рассчитать расстояние между параметрами запроса и индексными метками.

ClickHouse не может использовать индекс, если значения первичного ключа в диапазоне параметров запроса не представляют собой монотонную последовательность. В этом случае ClickHouse использует метод полного сканирования.

ClickHouse использует эту логику не только для последовательностей дней месяца, но и для любого частично-монотонного первичного ключа.

### Индексы пропуска данных {#table_engine-mergetree-data_skipping-indexes}

Объявление индексов при определении столбцов в запросе `CREATE`.

``` sql
INDEX index_name expr TYPE type(...) GRANULARITY granularity_value
```

Для таблиц семейства `*MergeTree` можно задать дополнительные индексы в секции столбцов.

Индексы агрегируют для заданного выражения некоторые данные, а потом при `SELECT` запросе используют для пропуска блоков данных (пропускаемый блок состоит из гранул данных в количестве равном гранулярности данного индекса), на которых секция `WHERE` не может быть выполнена, тем самым уменьшая объём данных читаемых с диска.

**Пример**

``` sql
CREATE TABLE table_name
(
    u64 UInt64,
    i32 Int32,
    s String,
    ...
    INDEX a (u64 * i32, s) TYPE minmax GRANULARITY 3,
    INDEX b (u64 * length(s)) TYPE set(1000) GRANULARITY 4
) ENGINE = MergeTree()
...
```

Эти индексы смогут использоваться для оптимизации следующих запросов

``` sql
SELECT count() FROM table WHERE s < 'z'
SELECT count() FROM table WHERE u64 * i32 == 10 AND u64 * length(s) >= 1234
```

#### Доступные индексы {#available-types-of-indices}

-   `minmax` — Хранит минимум и максимум выражения (если выражение - `tuple`, то для каждого элемента `tuple`), используя их для пропуска блоков аналогично первичному ключу.

-   `set(max_rows)` — Хранит уникальные значения выражения на блоке в количестве не более `max_rows` (если `max_rows = 0`, то ограничений нет), используя их для пропуска блоков, оценивая выполнимость `WHERE` выражения на хранимых данных.

-   `bloom_filter([false_positive])` — [фильтр Блума](https://en.wikipedia.org/wiki/Bloom_filter) для указанных стоблцов.

    Необязательный параметр `false_positive` — это вероятность получения ложноположительного срабатывания. Возможные значения: (0, 1). Значение по умолчанию: 0.025.

    Поддержанные типы данных: `Int*`, `UInt*`, `Float*`, `Enum`, `Date`, `DateTime`, `String`, `FixedString`.

    Фильтром могут пользоваться функции: [equals](../../../engines/table-engines/mergetree-family/mergetree.md), [notEquals](../../../engines/table-engines/mergetree-family/mergetree.md), [in](../../../engines/table-engines/mergetree-family/mergetree.md), [notIn](../../../engines/table-engines/mergetree-family/mergetree.md).

**Примеры**

``` sql
INDEX b (u64 * length(str), i32 + f64 * 100, date, str) TYPE minmax GRANULARITY 4
INDEX b (u64 * length(str), i32 + f64 * 100, date, str) TYPE set(100) GRANULARITY 4
```

#### Поддержка для функций {#functions-support}

Условия в секции `WHERE` содержат вызовы функций, оперирующих со столбцами. Если столбец - часть индекса, ClickHouse пытается использовать индекс при выполнении функции. Для разных видов индексов, ClickHouse поддерживает различные наборы функций, которые могут использоваться индексами.

Индекс `set` используется со всеми функциями. Наборы функций для остальных индексов представлены в таблице ниже.

| Функция (оператор) / Индекс                                                                                | primary key | minmax | ngrambf_v1 | tokenbf_v1 | bloom_filter |
|------------------------------------------------------------------------------------------------------------|-------------|--------|-------------|-------------|---------------|
| [equals (=, ==)](../../../sql-reference/functions/comparison-functions.md#function-equals)                 | ✔           | ✔      | ✔           | ✔           | ✔             |
| [notEquals(!=, \<\>)](../../../sql-reference/functions/comparison-functions.md#function-notequals)         | ✔           | ✔      | ✔           | ✔           | ✔             |
| [like](../../../sql-reference/functions/string-search-functions.md#function-like)                          | ✔           | ✔      | ✔           | ✔           | ✗             |
| [notLike](../../../sql-reference/functions/string-search-functions.md#function-notlike)                    | ✔           | ✔      | ✔           | ✔           | ✗             |
| [startsWith](../../../sql-reference/functions/string-functions.md#startswith)                              | ✔           | ✔      | ✔           | ✔           | ✗             |
| [endsWith](../../../sql-reference/functions/string-functions.md#endswith)                                  | ✗           | ✗      | ✔           | ✔           | ✗             |
| [multiSearchAny](../../../sql-reference/functions/string-search-functions.md#function-multisearchany)      | ✗           | ✗      | ✔           | ✗           | ✗             |
| [in](../../../sql-reference/functions/in-functions.md#in-functions)                                        | ✔           | ✔      | ✔           | ✔           | ✔             |
| [notIn](../../../sql-reference/functions/in-functions.md#in-functions)                                     | ✔           | ✔      | ✔           | ✔           | ✔             |
| [less (\<)](../../../sql-reference/functions/comparison-functions.md#function-less)                        | ✔           | ✔      | ✗           | ✗           | ✗             |
| [greater (\>)](../../../sql-reference/functions/comparison-functions.md#function-greater)                  | ✔           | ✔      | ✗           | ✗           | ✗             |
| [lessOrEquals (\<=)](../../../sql-reference/functions/comparison-functions.md#function-lessorequals)       | ✔           | ✔      | ✗           | ✗           | ✗             |
| [greaterOrEquals (\>=)](../../../sql-reference/functions/comparison-functions.md#function-greaterorequals) | ✔           | ✔      | ✗           | ✗           | ✗             |
| [empty](../../../sql-reference/functions/array-functions.md#function-empty)                                | ✔           | ✔      | ✗           | ✗           | ✗             |
| [notEmpty](../../../sql-reference/functions/array-functions.md#function-notempty)                          | ✔           | ✔      | ✗           | ✗           | ✗             |
| hasToken                                                                                                   | ✗           | ✗      | ✗           | ✔           | ✗             |

Функции с постоянным агрументом, который меньше, чем размер ngram не могут использовать индекс `ngrambf_v1` для оптимизации запроса.

Фильтры Блума могут иметь ложнопозитивные срабатывания, следовательно индексы `ngrambf_v1`, `tokenbf_v1` и `bloom_filter` невозможно использовать для оптимизации запросов, в которых результат функции предполается false, например:

-   Можно оптимизировать:
    -   `s LIKE '%test%'`
    -   `NOT s NOT LIKE '%test%'`
    -   `s = 1`
    -   `NOT s != 1`
    -   `startsWith(s, 'test')`
-   Нельзя оптимизировать:
    -   `NOT s LIKE '%test%'`
    -   `s NOT LIKE '%test%'`
    -   `NOT s = 1`
    -   `s != 1`
    -   `NOT startsWith(s, 'test')`

### Проекции {#projections}
Проекции похожи на материализованные представления, но определяются на уровне партов. Это обеспечивает гарантии согласованности наряду с автоматическим использованием в запросах.

#### Запрос {#projection-query}
Запрос проекции — это то, что определяет проекцию. Он имеет следующую грамматику:

`SELECT <COLUMN LIST EXPR> [GROUP BY] [ORDER BY]`

Он неявно выбирает данные из родительской таблицы.

#### Хранение {#projection-storage}
Проекции хранятся в каталоге парта. Это похоже на хранение индексов, но используется подкаталог, в котором хранится анонимный парт таблицы MergeTree. Таблица создается запросом определения проекции. Если есть конструкция GROUP BY, то базовый механизм хранения становится AggregatedMergeTree, а все агрегатные функции преобразуются в AggregateFunction. Если есть конструкция ORDER BY, таблица MergeTree будет использовать его в качестве выражения первичного ключа. Во время процесса слияния парт проекции будет слит с помощью процедуры слияния ее хранилища. Контрольная сумма парта родительской таблицы будет включать парт проекции. Другие процедуры аналогичны индексам пропуска данных.

#### Анализ запросов {#projection-query-analysis}
1. Проверить, можно ли использовать проекцию в данном запросе, то есть, что с ней выходит тот же результат, что и с запросом к базовой таблице.
2. Выбрать наиболее подходящее совпадение, содержащее наименьшее количество гранул для чтения.
3. План запроса, который использует проекции, будет отличаться от того, который использует исходные парты. При отсутствии проекции в некоторых партах можно расширить план, чтобы «проецировать» на лету.

## Конкурентный доступ к данным {#concurrent-data-access}

Для конкурентного доступа к таблице используется мультиверсионность. То есть, при одновременном чтении и обновлении таблицы, данные будут читаться из набора кусочков, актуального на момент запроса. Длинных блокировок нет. Вставки никак не мешают чтениям.

Чтения из таблицы автоматически распараллеливаются.

## TTL для столбцов и таблиц {#table_engine-mergetree-ttl}

Определяет время жизни значений, а также правила перемещения данных на другой диск или том.

Секция `TTL` может быть установлена как для всей таблицы, так и для каждого отдельного столбца. Правила `TTL` для таблицы позволяют указать целевые диски или тома для фонового перемещения на них частей данных.

Выражения должны возвращать тип [Date](../../../engines/table-engines/mergetree-family/mergetree.md) или [DateTime](../../../engines/table-engines/mergetree-family/mergetree.md).

Для задания времени жизни столбца, например:

``` sql
TTL time_column
TTL time_column + interval
```

Чтобы задать `interval`, используйте операторы [интервала времени](../../../engines/table-engines/mergetree-family/mergetree.md#operators-datetime).

``` sql
TTL date_time + INTERVAL 1 MONTH
TTL date_time + INTERVAL 15 HOUR
```

### TTL столбца {#mergetree-column-ttl}

Когда срок действия значений в столбце истечет, ClickHouse заменит их значениями по умолчанию для типа данных столбца. Если срок действия всех значений столбцов в части данных истек, ClickHouse удаляет столбец из куска данных в файловой системе.

Секцию `TTL` нельзя использовать для ключевых столбцов.

Примеры:

Создание таблицы с TTL

``` sql
CREATE TABLE example_table
(
    d DateTime,
    a Int TTL d + INTERVAL 1 MONTH,
    b Int TTL d + INTERVAL 1 MONTH,
    c String
)
ENGINE = MergeTree
PARTITION BY toYYYYMM(d)
ORDER BY d;
```

Добавление TTL на колонку существующей таблицы

``` sql
ALTER TABLE example_table
    MODIFY COLUMN
    c String TTL d + INTERVAL 1 DAY;
```

Изменение TTL у колонки

``` sql
ALTER TABLE example_table
    MODIFY COLUMN
    c String TTL d + INTERVAL 1 MONTH;
```

### TTL таблицы {#mergetree-table-ttl}

Для таблицы можно задать одно выражение для устаревания данных, а также несколько выражений, по срабатывании которых данные переместятся на [некоторый диск или том](#table_engine-mergetree-multiple-volumes). Когда некоторые данные в таблице устаревают, ClickHouse удаляет все соответствующие строки.

``` sql
TTL expr
    [DELETE|TO DISK 'xxx'|TO VOLUME 'xxx'][, DELETE|TO DISK 'aaa'|TO VOLUME 'bbb'] ...
    [WHERE conditions]
    [GROUP BY key_expr [SET v1 = aggr_func(v1) [, v2 = aggr_func(v2) ...]] ]
```

За каждым TTL выражением может следовать тип действия, которое выполняется после достижения времени, соответствующего результату TTL выражения:

-   `DELETE` - удалить данные (действие по умолчанию);
-   `TO DISK 'aaa'` - переместить данные на диск `aaa`;
-   `TO VOLUME 'bbb'` - переместить данные на том `bbb`;
-   `GROUP BY` -  агрегировать данные.

В секции `WHERE` можно задать условие удаления или агрегирования устаревших строк (для перемещения условие `WHERE` не применимо).

Колонки, по которым агрегируются данные в `GROUP BY`, должны являться префиксом первичного ключа таблицы.

Если колонка не является частью выражения `GROUP BY` и не задается напрямую в секции `SET`, в результирующих строках она будет содержать случайное значение, взятое из одной из сгруппированных строк (как будто к ней применяется агрегирующая функция `any`).

**Примеры**

Создание таблицы с TTL:

``` sql
CREATE TABLE example_table
(
    d DateTime,
    a Int
)
ENGINE = MergeTree
PARTITION BY toYYYYMM(d)
ORDER BY d
TTL d + INTERVAL 1 MONTH [DELETE],
    d + INTERVAL 1 WEEK TO VOLUME 'aaa',
    d + INTERVAL 2 WEEK TO DISK 'bbb';
```

Изменение TTL:

``` sql
ALTER TABLE example_table
    MODIFY TTL d + INTERVAL 1 DAY;
```

Создание таблицы, в которой строки устаревают через месяц. Устаревшие строки удаляются, если дата выпадает на понедельник:

``` sql
CREATE TABLE table_with_where
(
    d DateTime,
    a Int
)
ENGINE = MergeTree
PARTITION BY toYYYYMM(d)
ORDER BY d
TTL d + INTERVAL 1 MONTH DELETE WHERE toDayOfWeek(d) = 1;
```

Создание таблицы, где устаревшие строки агрегируются. В результирующих строках колонка `x` содержит максимальное значение по сгруппированным строкам, `y` — минимальное значение, а `d` — случайное значение из одной из сгуппированных строк.

``` sql
CREATE TABLE table_for_aggregation
(
    d DateTime,
    k1 Int,
    k2 Int,
    x Int,
    y Int
)
ENGINE = MergeTree
ORDER BY (k1, k2)
TTL d + INTERVAL 1 MONTH GROUP BY k1, k2 SET x = max(x), y = min(y);
```

**Удаление данных**

Данные с истекшим TTL удаляются, когда ClickHouse мёржит куски данных.

Когда ClickHouse видит, что некоторые данные устарели, он выполняет внеплановые мёржи. Для управление частотой подобных мёржей, можно задать настройку `merge_with_ttl_timeout`. Если её значение слишком низкое, придется выполнять много внеплановых мёржей, которые могут начать потреблять значительную долю ресурсов сервера.

Если вы выполните запрос `SELECT` между слияниями вы можете получить устаревшие данные. Чтобы избежать этого используйте запрос [OPTIMIZE](../../../engines/table-engines/mergetree-family/mergetree.md#misc_operations-optimize) перед `SELECT`.

## Хранение данных таблицы на нескольких блочных устройствах {#table_engine-mergetree-multiple-volumes}

### Введение {#introduction}

Движки таблиц семейства `MergeTree` могут хранить данные на нескольких блочных устройствах. Это может оказаться полезным, например, при неявном разделении данных одной таблицы на «горячие» и «холодные». Наиболее свежая часть занимает малый объём и запрашивается регулярно, а большой хвост исторических данных запрашивается редко. При наличии в системе нескольких дисков, «горячая» часть данных может быть размещена на быстрых дисках (например, на NVMe SSD или в памяти), а холодная на более медленных (например, HDD).

Минимальной перемещаемой единицей для `MergeTree` является кусок данных (data part). Данные одного куска могут находится только на одном диске. Куски могут перемещаться между дисками в фоне, согласно пользовательским настройкам, а также с помощью запросов [ALTER](../../../engines/table-engines/mergetree-family/mergetree.md#alter_move-partition).

### Термины {#terms}

-   Диск — примонтированное в файловой системе блочное устройство.
-   Диск по умолчанию — диск, на котором находится путь, указанный в конфигурационной настройке сервера [path](../../../operations/server-configuration-parameters/settings.md#server_configuration_parameters-path).
-   Том (Volume) — упорядоченный набор равноценных дисков (схоже с [JBOD](https://ru.wikipedia.org/wiki/JBOD))
-   Политика хранения (StoragePolicy) — множество томов с правилами перемещения данных между ними.

У всех описанных сущностей при создании указываются имена, можно найти в системных таблицах [system.storage_policies](../../../engines/table-engines/mergetree-family/mergetree.md#system_tables-storage_policies) и [system.disks](../../../engines/table-engines/mergetree-family/mergetree.md#system_tables-disks). Имя политики хранения можно указать в настройке `storage_policy` движков таблиц семейства `MergeTree`.

### Конфигурация {#table_engine-mergetree-multiple-volumes_configure}

Диски, тома и политики хранения задаются внутри тега `<storage_configuration>` в основном файле `config.xml` или в отдельном файле в директории `config.d`.

Структура конфигурации:

``` xml
<storage_configuration>
    <disks>
        <disk_name_1> <!-- disk name -->
            <path>/mnt/fast_ssd/clickhouse/</path>
        </disk_name_1>
        <disk_name_2>
            <path>/mnt/hdd1/clickhouse/</path>
            <keep_free_space_bytes>10485760</keep_free_space_bytes>
        </disk_name_2>
        <disk_name_3>
            <path>/mnt/hdd2/clickhouse/</path>
            <keep_free_space_bytes>10485760</keep_free_space_bytes>
        </disk_name_3>

        ...
    </disks>

    ...
</storage_configuration>
```

Теги:

-   `<disk_name_N>` — имя диска. Имена должны быть разными для всех дисков.
-   `path` — путь по которому будут храниться данные сервера (каталоги `data` и `shadow`), должен быть терминирован `/`.
-   `keep_free_space_bytes` — размер зарезервированного свободного места на диске.

Порядок задания дисков не имеет значения.

Общий вид конфигурации политик хранения:

``` xml
<storage_configuration>
    ...
    <policies>
        <policy_name_1>
            <volumes>
                <volume_name_1>
                    <disk>disk_name_from_disks_configuration</disk>
                    <max_data_part_size_bytes>1073741824</max_data_part_size_bytes>
                </volume_name_1>
                <volume_name_2>
                    <!-- configuration -->
                </volume_name_2>
                <!-- more volumes -->
            </volumes>
            <move_factor>0.2</move_factor>
        </policy_name_1>
        <policy_name_2>
            <!-- configuration -->
        </policy_name_2>

        <!-- more policies -->
    </policies>
    ...
</storage_configuration>
```

Тэги:

-   `policy_name_N` — название политики. Названия политик должны быть уникальны.
-   `volume_name_N` — название тома. Названия томов должны быть уникальны.
-   `disk` — диск, находящийся внутри тома.
-   `max_data_part_size_bytes` — максимальный размер куска данных, который может находится на любом из дисков этого тома.
-   `move_factor` — доля доступного свободного места на томе, если места становится меньше, то данные начнут перемещение на следующий том, если он есть (по умолчанию 0.1).
-   `prefer_not_to_merge` — Отключает слияние кусков данных, хранящихся на данном томе. Если данная настройка включена, то слияние данных, хранящихся на данном томе, не допускается. Это позволяет контролировать работу ClickHouse с медленными дисками.

Примеры конфигураций:

``` xml
<storage_configuration>
    ...
    <policies>
        <hdd_in_order> <!-- policy name -->
            <volumes>
                <single> <!-- volume name -->
                    <disk>disk1</disk>
                    <disk>disk2</disk>
                </single>
            </volumes>
        </hdd_in_order>

        <moving_from_ssd_to_hdd>
            <volumes>
                <hot>
                    <disk>fast_ssd</disk>
                    <max_data_part_size_bytes>1073741824</max_data_part_size_bytes>
                </hot>
                <cold>
                    <disk>disk1</disk>
                </cold>
            </volumes>
            <move_factor>0.2</move_factor>
        </moving_from_ssd_to_hdd>

		<small_jbod_with_external_no_merges>
            <volumes>
                <main>
                    <disk>jbod1</disk>
                </main>
                <external>
                    <disk>external</disk>
                    <prefer_not_to_merge>true</prefer_not_to_merge>
                </external>
            </volumes>
        </small_jbod_with_external_no_merges>

    </policies>
    ...
</storage_configuration>
```

В приведенном примере, политика `hdd_in_order` реализует прицип [round-robin](https://ru.wikipedia.org/wiki/Round-robin_(%D0%B0%D0%BB%D0%B3%D0%BE%D1%80%D0%B8%D1%82%D0%BC)). Так как в политике есть всего один том (`single`), то все записи производятся на его диски по круговому циклу. Такая политика может быть полезна при наличии в системе нескольких похожих дисков, но при этом не сконфигурирован RAID. Учтите, что каждый отдельный диск ненадёжен и чтобы не потерять важные данные это необходимо скомпенсировать за счет хранения данных в трёх копиях.

Если система содержит диски различных типов, то может пригодиться политика `moving_from_ssd_to_hdd`. В томе `hot` находится один SSD-диск (`fast_ssd`), а также задается ограничение на максимальный размер куска, который может храниться на этом томе (1GB). Все куски такой таблицы больше 1GB будут записываться сразу на том `cold`, в котором содержится один HDD-диск `disk1`. Также, при заполнении диска `fast_ssd` более чем на 80% данные будут переносится на диск `disk1` фоновым процессом.

Порядок томов в политиках хранения важен, при достижении условий на переполнение тома данные переносятся на следующий. Порядок дисков в томах так же важен, данные пишутся по очереди на каждый из них.

После задания конфигурации политик хранения их можно использовать, как настройку при создании таблиц:

``` sql
CREATE TABLE table_with_non_default_policy (
    EventDate Date,
    OrderID UInt64,
    BannerID UInt64,
    SearchPhrase String
) ENGINE = MergeTree
ORDER BY (OrderID, BannerID)
PARTITION BY toYYYYMM(EventDate)
SETTINGS storage_policy = 'moving_from_ssd_to_hdd'
```

По умолчанию используется политика хранения `default` в которой есть один том и один диск, указанный в `<path>`.
Изменить политику хранения после создания таблицы можно при помощи запроса [ALTER TABLE ... MODIFY SETTING]. При этом необходимо учесть, что новая политика должна содержать все тома и диски предыдущей политики с теми же именами.


Количество потоков для фоновых перемещений кусков между дисками можно изменить с помощью настройки [background_move_pool_size](../../../operations/settings/settings.md#background_move_pool_size)

### Особенности работы {#details}

В таблицах `MergeTree` данные попадают на диск несколькими способами:

-   В результате вставки (запрос `INSERT`).
-   В фоновых операциях слияний и [мутаций](../../../sql-reference/statements/alter/index.md#mutations).
-   При скачивании данных с другой реплики.
-   В результате заморозки партиций [ALTER TABLE … FREEZE PARTITION](../../../engines/table-engines/mergetree-family/mergetree.md#alter_freeze-partition).

Во всех случаях, кроме мутаций и заморозки партиций, при записи куска выбирается том и диск в соответствии с указанной конфигурацией хранилища:

1.  Выбирается первый по порядку том, на котором есть свободное место для записи куска (`unreserved_space > current_part_size`) и который позволяет записывать куски требуемого размера `max_data_part_size_bytes > current_part_size`.
2.  Внутри тома выбирается следующий диск после того, на который была предыдущая запись и на котором свободного места больше чем размер куска (`unreserved_space - keep_free_space_bytes > current_part_size`)

Мутации и запросы заморозки партиций в реализации используют [жесткие ссылки](https://ru.wikipedia.org/wiki/%D0%96%D1%91%D1%81%D1%82%D0%BA%D0%B0%D1%8F_%D1%81%D1%81%D1%8B%D0%BB%D0%BA%D0%B0). Жесткие ссылки между различными дисками не поддерживаются, поэтому в случае таких операций куски размещаются на тех же дисках, что и исходные.

В фоне куски перемещаются между томами на основе информации о занятом месте (настройка `move_factor`) по порядку, в котором указаны тома в конфигурации. Данные никогда не перемещаются с последнего тома и на первый том. Следить за фоновыми перемещениями можно с помощью системных таблиц [system.part_log](../../../engines/table-engines/mergetree-family/mergetree.md#system_tables-part-log) (поле `type = MOVE_PART`) и [system.parts](../../../engines/table-engines/mergetree-family/mergetree.md#system_tables-parts) (поля `path` и `disk`). Также подробная информация о перемещениях доступна в логах сервера.
С помощью запроса [ALTER TABLE … MOVE PART\|PARTITION … TO VOLUME\|DISK …](../../../engines/table-engines/mergetree-family/mergetree.md#alter_move-partition) пользователь может принудительно перенести кусок или партицию с одного раздела на другой. При этом учитываются все ограничения, указанные для фоновых операций. Запрос самостоятельно инициирует процесс перемещения не дожидаясь фоновых операций. В случае недостатка места или неудовлетворения ограничениям пользователь получит сообщение об ошибке.

Перемещения данных не взаимодействуют с репликацией данных, поэтому на разных репликах одной и той же таблицы могут быть указаны разные политики хранения.

После выполнения фоновых слияний или мутаций старые куски не удаляются сразу, а через некоторое время (табличная настройка `old_parts_lifetime`). Также они не перемещаются на другие тома или диски, поэтому до момента удаления они продолжают учитываться при подсчёте занятого дискового пространства.

## Использование сервиса S3 для хранения данных {#table_engine-mergetree-s3}

Таблицы семейства `MergeTree` могут хранить данные в сервисе [S3](https://aws.amazon.com/s3/) при использовании диска типа `s3`.

Конфигурация:

``` xml
<storage_configuration>
    ...
    <disks>
        <s3>
            <type>s3</type>
            <endpoint>https://storage.yandexcloud.net/my-bucket/root-path/</endpoint>
            <access_key_id>your_access_key_id</access_key_id>
            <secret_access_key>your_secret_access_key</secret_access_key>
            <region></region>
            <proxy>
                <uri>http://proxy1</uri>
                <uri>http://proxy2</uri>
            </proxy>
            <connect_timeout_ms>10000</connect_timeout_ms>
            <request_timeout_ms>5000</request_timeout_ms>
            <retry_attempts>10</retry_attempts>
            <single_read_retries>4</single_read_retries>
            <min_bytes_for_seek>1000</min_bytes_for_seek>
            <metadata_path>/var/lib/clickhouse/disks/s3/</metadata_path>
            <cache_enabled>true</cache_enabled>
            <cache_path>/var/lib/clickhouse/disks/s3/cache/</cache_path>
            <skip_access_check>false</skip_access_check>
        </s3>
    </disks>
    ...
</storage_configuration>
```

Обязательные параметры:

-   `endpoint` — URL точки приема запроса на стороне S3 в [форматах](https://docs.aws.amazon.com/AmazonS3/latest/userguide/VirtualHosting.html) `path` или `virtual hosted`. URL точки должен содержать бакет и путь к корневой директории на сервере, где хранятся данные.
-   `access_key_id` — id ключа доступа к S3.
-   `secret_access_key` — секретный ключ доступа к S3.

Необязательные параметры:

-   `region` — название региона S3.
-   `use_environment_credentials` — признак, нужно ли считывать учетные данные AWS из сетевого окружения, а также из переменных окружения `AWS_ACCESS_KEY_ID`, `AWS_SECRET_ACCESS_KEY` и `AWS_SESSION_TOKEN`, если они есть. Значение по умолчанию: `false`.
-   `use_insecure_imds_request` — признак, нужно ли использовать менее безопасное соединение при выполнении запроса к IMDS при получении учётных данных из метаданных Amazon EC2. Значение по умолчанию: `false`.
-   `proxy` — конфигурация прокси-сервера для конечной точки S3. Каждый элемент `uri` внутри блока `proxy` должен содержать URL прокси-сервера.
-   `connect_timeout_ms` — таймаут подключения к сокету в миллисекундах. Значение по умолчанию: 10 секунд.
-   `request_timeout_ms` — таймаут выполнения запроса в миллисекундах. Значение по умолчанию: 5 секунд.
-   `retry_attempts` — число попыток выполнения запроса в случае возникновения ошибки. Значение по умолчанию: `10`.
-   `single_read_retries` — число попыток выполнения запроса в случае возникновения ошибки в процессе чтения. Значение по умолчанию: `4`.
-   `min_bytes_for_seek` — минимальное количество байтов, которые используются для операций поиска вместо последовательного чтения. Значение по умолчанию: 1 МБайт.
-   `metadata_path` — путь к локальному файловому хранилищу для хранения файлов с метаданными для S3. Значение по умолчанию: `/var/lib/clickhouse/disks/<disk_name>/`.
-   `cache_enabled` — признак, разрешено ли хранение кэша засечек и файлов индекса в локальной файловой системе. Значение по умолчанию: `true`.
-   `cache_path` — путь в локальной файловой системе, где будут храниться кэш засечек и файлы индекса. Значение по умолчанию: `/var/lib/clickhouse/disks/<disk_name>/cache/`.
-   `skip_access_check` — признак, выполнять ли проверку доступов при запуске диска. Если установлено значение `true`, то проверка не выполняется. Значение по умолчанию: `false`.

Диск S3 может быть сконфигурирован как `main` или `cold`:

``` xml
<storage_configuration>
    ...
    <disks>
        <s3>
            <type>s3</type>
            <endpoint>https://storage.yandexcloud.net/my-bucket/root-path/</endpoint>
            <access_key_id>your_access_key_id</access_key_id>
            <secret_access_key>your_secret_access_key</secret_access_key>
        </s3>
    </disks>
    <policies>
        <s3_main>
            <volumes>
                <main>
                    <disk>s3</disk>
                </main>
            </volumes>
        </s3_main>
        <s3_cold>
            <volumes>
                <main>
                    <disk>default</disk>
                </main>
                <external>
                    <disk>s3</disk>
                </external>
            </volumes>
            <move_factor>0.2</move_factor>
        </s3_cold>
    </policies>
    ...
</storage_configuration>
```

Если диск сконфигурирован как `cold`, данные будут переноситься в S3 при срабатывании правил TTL или когда свободное место на локальном диске станет меньше порогового значения, которое определяется как `move_factor * disk_size`.
-												DOCSUP-2037: Edit and translate PR to RU (#14439)

* DOCSUP-2037: Updated by PR#12010.

* DOCSUP-2037: Updated by PR#11865

* DOCSUP-2037: Update by PR#11032.

* DOCSUP-2037: Update by PR#11433.

* Update docs/ru/engines/table-engines/mergetree-family/mergetree.md

Co-authored-by: BayoNet <da-daos@yandex.ru>

* Update docs/ru/engines/table-engines/mergetree-family/mergetree.md

Co-authored-by: BayoNet <da-daos@yandex.ru>

* Update docs/ru/operations/system-tables/index.md

Co-authored-by: BayoNet <da-daos@yandex.ru>

* Update docs/ru/operations/system-tables/index.md

Co-authored-by: BayoNet <da-daos@yandex.ru>

Co-authored-by: romanzhukov <romanzhukov@yandex-team.ru>
Co-authored-by: BayoNet <da-daos@yandex.ru>
											
										
										
											2020-09-08 15:20:02 +00:00
+								---
 								toc_priority: 30
 								toc_title: MergeTree
 								---
-												Restore some old manual anchors in docs (#9803)

* Simplify 404 page

* add es array_functions.md

* restore some old manual anchors

* update sitemaps

* trigger checks

* restore more old manual anchors

* refactor test.md + temporary disable failure again

* fix mistype
											
										
										
											2020-03-22 09:14:59 +00:00
+								# MergeTree {#table_engines-mergetree}
-												Added documentation in RST format. (ReadTheDocs ready)

											
										
										
											2017-03-12 17:58:51 +00:00
-												Fix typos

											
										
										
											2019-08-23 10:55:34 +00:00
+								Движок `MergeTree`, а также другие движки этого семейства (`*MergeTree`) — это наиболее функциональные движки таблиц ClickHouse.
-												Added documentation in RST format. (ReadTheDocs ready)

											
										
										
											2017-03-12 17:58:51 +00:00
-												DOCAPI-5203: Direct I/O settings for MergeTree descriptions. EN review and RU translation. (#4848)


											
										
										
											2019-04-08 16:25:37 +00:00
+								Основная идея, заложенная в основу движков семейства `MergeTree` следующая. Когда у вас есть огромное количество данных, которые должны быть вставлены в таблицу, вы должны быстро записать их по частям, а затем объединить части по некоторым правилам в фоновом режиме. Этот метод намного эффективнее, чем постоянная перезапись данных в хранилище при вставке.
-												Added documentation in RST format. (ReadTheDocs ready)

											
										
										
											2017-03-12 17:58:51 +00:00
-												Updated description of MergeTree.

											
										
										
											2018-08-21 07:54:37 +00:00
+								Основные возможности:
-												CLICKHOUSE-4862: some markdown fixes @ ru mergetree.md (#10835)


											
										
										
											2020-05-12 09:49:36 +00:00
+								-   **Хранит данные, отсортированные по первичному ключу.** Это позволяет создавать разреженный индекс небольшого объёма, который позволяет быстрее находить данные.
-												Updated description of MergeTree.

											
										
										
											2018-08-21 07:54:37 +00:00
-												CLICKHOUSE-4862: some markdown fixes @ ru mergetree.md (#10835)


											
										
										
											2020-05-12 09:49:36 +00:00
+								-   **Позволяет оперировать партициями, если задан [ключ партиционирования](custom-partitioning-key.md).** ClickHouse поддерживает отдельные операции с партициями, которые работают эффективнее, чем общие операции с этим же результатом над этими же данными. Также, ClickHouse автоматически отсекает данные по партициям там, где ключ партиционирования указан в запросе. Это также увеличивает эффективность выполнения запросов.
-												Updated description of MergeTree.

											
										
										
											2018-08-21 07:54:37 +00:00
-												CLICKHOUSE-4862: some markdown fixes @ ru mergetree.md (#10835)


											
										
										
											2020-05-12 09:49:36 +00:00
+								-   **Поддерживает репликацию данных.** Для этого используется семейство таблиц `ReplicatedMergeTree`. Подробнее читайте в разделе [Репликация данных](replication.md).
-												Updated description of MergeTree.

											
										
										
											2018-08-21 07:54:37 +00:00
-												CLICKHOUSE-4862: some markdown fixes @ ru mergetree.md (#10835)


											
										
										
											2020-05-12 09:49:36 +00:00
+								-   **Поддерживает сэмплирование данных.** При необходимости можно задать способ сэмплирования данных в таблице.
-												Updated description of MergeTree.

											
										
										
											2018-08-21 07:54:37 +00:00
-												WIP on docs translation/normalization tools (#9783)


											
										
										
											2020-03-20 18:20:59 +00:00
+								!!! info "Info"
-												DOCS-624: Fixing links to nowhere (#10675)

* enbaskakova-DOCSUP-652 (#101)

* "docs(orNull&orDefault): Functions 'orNull&orDefault' have been edited"

* "docs(orNull&orDefault): Functions 'orNull&orDefault' have been edited"

* "docs(orNull&orDefault): Functions 'orNull&orDefault' have been edited"

* Update docs/en/sql_reference/aggregate_functions/combinators.md

Co-Authored-By: BayoNet <da-daos@yandex.ru>

* Update docs/en/sql_reference/aggregate_functions/combinators.md

Co-Authored-By: BayoNet <da-daos@yandex.ru>

* Update docs/en/sql_reference/aggregate_functions/combinators.md

Co-Authored-By: BayoNet <da-daos@yandex.ru>

* Update docs/en/sql_reference/aggregate_functions/combinators.md

Co-Authored-By: BayoNet <da-daos@yandex.ru>

* Update docs/en/sql_reference/aggregate_functions/combinators.md

Co-Authored-By: BayoNet <da-daos@yandex.ru>

* "docs(orNull&orDefault): Functions 'orNull&orDefault' have been edited"

* "docs(orNull&orDefault): Functions 'orNull&orDefault' have been edited"

* "docs(orNull&orDefault): Functions 'orNull&orDefault' have been edited"

Co-authored-by: elenbaskakova <elenbaskakova@yandex-team.ru>
Co-authored-by: BayoNet <da-daos@yandex.ru>

* Revert "enbaskakova-DOCSUP-652 (#101)" (#107)

This reverts commit 639fee7610f28e421d14e535b7def3f466e7efca.

* CLICKHOUSEDOCS-624: Fixed links. Was 60, became 13.

* CLICKHOUSEDOCS-624: Finished fix links in Enlish version.

* CLICKHOUSEDOCS-624: Fixed RU links

Co-authored-by: elenaspb2019 <47083263+elenaspb2019@users.noreply.github.com>
Co-authored-by: elenbaskakova <elenbaskakova@yandex-team.ru>
Co-authored-by: Sergei Shtykov <bayonet@yandex-team.ru>
											
										
										
											2020-05-06 06:13:29 +00:00
+								    Движок [Merge](../special/merge.md#merge) не относится к семейству `*MergeTree`.
-												Updates for Aggregating-,Collapsing-, Replacing- and SummingMergeTree. (#3346)

* Update of english version of descriprion of the table function `file`.

* New syntax for ReplacingMergeTree.
Some improvements in text.

* Significantly change article about SummingMergeTree.
Article is restructured, text is changed in many places of the document. New syntax for table creation is described.

* Descriptions of AggregateFunction and AggregatingMergeTree are updated. Russian version.

* New syntax for new syntax of CREATE TABLE

* Added english docs on Aggregating, Replacing and SummingMergeTree.

* CollapsingMergeTree docs. English version.

* 1. Update of CollapsingMergeTree. 2. Minor changes in markup

* Update aggregatefunction.md

* Update aggregatefunction.md

* Update aggregatefunction.md

* Update aggregatingmergetree.md

* GraphiteMergeTree docs update.
New syntax for creation of Replicated* tables.
Minor changes in *MergeTree tables creation syntax.

* Markup fix

* Markup and language fixes

* Clarification in the CollapsingMergeTree article

											
										
										
											2018-10-19 11:25:22 +00:00
-												Restore some old manual anchors in docs (#9803)

* Simplify 404 page

* add es array_functions.md

* restore some old manual anchors

* update sitemaps

* trigger checks

* restore more old manual anchors

* refactor test.md + temporary disable failure again

* fix mistype
											
										
										
											2020-03-22 09:14:59 +00:00
+								## Создание таблицы {#table_engine-mergetree-creating-a-table}
-												Updates for Aggregating-,Collapsing-, Replacing- and SummingMergeTree. (#3346)

* Update of english version of descriprion of the table function `file`.

* New syntax for ReplacingMergeTree.
Some improvements in text.

* Significantly change article about SummingMergeTree.
Article is restructured, text is changed in many places of the document. New syntax for table creation is described.

* Descriptions of AggregateFunction and AggregatingMergeTree are updated. Russian version.

* New syntax for new syntax of CREATE TABLE

* Added english docs on Aggregating, Replacing and SummingMergeTree.

* CollapsingMergeTree docs. English version.

* 1. Update of CollapsingMergeTree. 2. Minor changes in markup

* Update aggregatefunction.md

* Update aggregatefunction.md

* Update aggregatefunction.md

* Update aggregatingmergetree.md

* GraphiteMergeTree docs update.
New syntax for creation of Replicated* tables.
Minor changes in *MergeTree tables creation syntax.

* Markup fix

* Markup and language fixes

* Clarification in the CollapsingMergeTree article

											
										
										
											2018-10-19 11:25:22 +00:00
-												WIP on docs translation/normalization tools (#9783)


											
										
										
											2020-03-20 18:20:59 +00:00
+								``` sql
-												Updates for Aggregating-,Collapsing-, Replacing- and SummingMergeTree. (#3346)

* Update of english version of descriprion of the table function `file`.

* New syntax for ReplacingMergeTree.
Some improvements in text.

* Significantly change article about SummingMergeTree.
Article is restructured, text is changed in many places of the document. New syntax for table creation is described.

* Descriptions of AggregateFunction and AggregatingMergeTree are updated. Russian version.

* New syntax for new syntax of CREATE TABLE

* Added english docs on Aggregating, Replacing and SummingMergeTree.

* CollapsingMergeTree docs. English version.

* 1. Update of CollapsingMergeTree. 2. Minor changes in markup

* Update aggregatefunction.md

* Update aggregatefunction.md

* Update aggregatefunction.md

* Update aggregatingmergetree.md

* GraphiteMergeTree docs update.
New syntax for creation of Replicated* tables.
Minor changes in *MergeTree tables creation syntax.

* Markup fix

* Markup and language fixes

* Clarification in the CollapsingMergeTree article

											
										
										
											2018-10-19 11:25:22 +00:00
+								CREATE TABLE [IF NOT EXISTS] [db.]table_name [ON CLUSTER cluster]
 								(
-												TTL for columns and tables (#4212)

Add TTL for columns and tables.

											
										
										
											2019-04-15 09:30:45 +00:00
+								    name1 [type1] [DEFAULT|MATERIALIZED|ALIAS expr1] [TTL expr1],
 								    name2 [type2] [DEFAULT|MATERIALIZED|ALIAS expr2] [TTL expr2],
-												Updates for Aggregating-,Collapsing-, Replacing- and SummingMergeTree. (#3346)

* Update of english version of descriprion of the table function `file`.

* New syntax for ReplacingMergeTree.
Some improvements in text.

* Significantly change article about SummingMergeTree.
Article is restructured, text is changed in many places of the document. New syntax for table creation is described.

* Descriptions of AggregateFunction and AggregatingMergeTree are updated. Russian version.

* New syntax for new syntax of CREATE TABLE

* Added english docs on Aggregating, Replacing and SummingMergeTree.

* CollapsingMergeTree docs. English version.

* 1. Update of CollapsingMergeTree. 2. Minor changes in markup

* Update aggregatefunction.md

* Update aggregatefunction.md

* Update aggregatefunction.md

* Update aggregatingmergetree.md

* GraphiteMergeTree docs update.
New syntax for creation of Replicated* tables.
Minor changes in *MergeTree tables creation syntax.

* Markup fix

* Markup and language fixes

* Clarification in the CollapsingMergeTree article

											
										
										
											2018-10-19 11:25:22 +00:00
+								    ...
-												docs ru

											
										
										
											2019-01-21 18:35:29 +00:00
+								    INDEX index_name1 expr1 TYPE type1(...) GRANULARITY value1,
 								    INDEX index_name2 expr2 TYPE type2(...) GRANULARITY value2
-												Updates for Aggregating-,Collapsing-, Replacing- and SummingMergeTree. (#3346)

* Update of english version of descriprion of the table function `file`.

* New syntax for ReplacingMergeTree.
Some improvements in text.

* Significantly change article about SummingMergeTree.
Article is restructured, text is changed in many places of the document. New syntax for table creation is described.

* Descriptions of AggregateFunction and AggregatingMergeTree are updated. Russian version.

* New syntax for new syntax of CREATE TABLE

* Added english docs on Aggregating, Replacing and SummingMergeTree.

* CollapsingMergeTree docs. English version.

* 1. Update of CollapsingMergeTree. 2. Minor changes in markup

* Update aggregatefunction.md

* Update aggregatefunction.md

* Update aggregatefunction.md

* Update aggregatingmergetree.md

* GraphiteMergeTree docs update.
New syntax for creation of Replicated* tables.
Minor changes in *MergeTree tables creation syntax.

* Markup fix

* Markup and language fixes

* Clarification in the CollapsingMergeTree article

											
										
										
											2018-10-19 11:25:22 +00:00
+								) ENGINE = MergeTree()
-												DOCSUP-2037: Edit and translate PR to RU (#14439)

* DOCSUP-2037: Updated by PR#12010.

* DOCSUP-2037: Updated by PR#11865

* DOCSUP-2037: Update by PR#11032.

* DOCSUP-2037: Update by PR#11433.

* Update docs/ru/engines/table-engines/mergetree-family/mergetree.md

Co-authored-by: BayoNet <da-daos@yandex.ru>

* Update docs/ru/engines/table-engines/mergetree-family/mergetree.md

Co-authored-by: BayoNet <da-daos@yandex.ru>

* Update docs/ru/operations/system-tables/index.md

Co-authored-by: BayoNet <da-daos@yandex.ru>

* Update docs/ru/operations/system-tables/index.md

Co-authored-by: BayoNet <da-daos@yandex.ru>

Co-authored-by: romanzhukov <romanzhukov@yandex-team.ru>
Co-authored-by: BayoNet <da-daos@yandex.ru>
											
										
										
											2020-09-08 15:20:02 +00:00
+								ORDER BY expr
-												Updates for Aggregating-,Collapsing-, Replacing- and SummingMergeTree. (#3346)

* Update of english version of descriprion of the table function `file`.

* New syntax for ReplacingMergeTree.
Some improvements in text.

* Significantly change article about SummingMergeTree.
Article is restructured, text is changed in many places of the document. New syntax for table creation is described.

* Descriptions of AggregateFunction and AggregatingMergeTree are updated. Russian version.

* New syntax for new syntax of CREATE TABLE

* Added english docs on Aggregating, Replacing and SummingMergeTree.

* CollapsingMergeTree docs. English version.

* 1. Update of CollapsingMergeTree. 2. Minor changes in markup

* Update aggregatefunction.md

* Update aggregatefunction.md

* Update aggregatefunction.md

* Update aggregatingmergetree.md

* GraphiteMergeTree docs update.
New syntax for creation of Replicated* tables.
Minor changes in *MergeTree tables creation syntax.

* Markup fix

* Markup and language fixes

* Clarification in the CollapsingMergeTree article

											
										
										
											2018-10-19 11:25:22 +00:00
+								[PARTITION BY expr]
-												add ru docs for ALTER ORDER BY [#CLICKHOUSE-3859]

											
										
										
											2018-12-04 17:51:09 +00:00
+								[PRIMARY KEY expr]
-												Updates for Aggregating-,Collapsing-, Replacing- and SummingMergeTree. (#3346)

* Update of english version of descriprion of the table function `file`.

* New syntax for ReplacingMergeTree.
Some improvements in text.

* Significantly change article about SummingMergeTree.
Article is restructured, text is changed in many places of the document. New syntax for table creation is described.

* Descriptions of AggregateFunction and AggregatingMergeTree are updated. Russian version.

* New syntax for new syntax of CREATE TABLE

* Added english docs on Aggregating, Replacing and SummingMergeTree.

* CollapsingMergeTree docs. English version.

* 1. Update of CollapsingMergeTree. 2. Minor changes in markup

* Update aggregatefunction.md

* Update aggregatefunction.md

* Update aggregatefunction.md

* Update aggregatingmergetree.md

* GraphiteMergeTree docs update.
New syntax for creation of Replicated* tables.
Minor changes in *MergeTree tables creation syntax.

* Markup fix

* Markup and language fixes

* Clarification in the CollapsingMergeTree article

											
										
										
											2018-10-19 11:25:22 +00:00
+								[SAMPLE BY expr]
-												better

											
										
										
											2021-06-01 14:23:46 +00:00
+								[TTL expr
-												Syntax updated, examples added.

											
										
										
											2021-01-23 18:16:59 +00:00
+								    [DELETE|TO DISK 'xxx'|TO VOLUME 'xxx' [, ...] ]
-												better

											
										
										
											2021-06-01 14:23:46 +00:00
+								    [WHERE conditions]
 								    [GROUP BY key_expr [SET v1 = aggr_func(v1) [, v2 = aggr_func(v2) ...]] ] ]
-												Updates for Aggregating-,Collapsing-, Replacing- and SummingMergeTree. (#3346)

* Update of english version of descriprion of the table function `file`.

* New syntax for ReplacingMergeTree.
Some improvements in text.

* Significantly change article about SummingMergeTree.
Article is restructured, text is changed in many places of the document. New syntax for table creation is described.

* Descriptions of AggregateFunction and AggregatingMergeTree are updated. Russian version.

* New syntax for new syntax of CREATE TABLE

* Added english docs on Aggregating, Replacing and SummingMergeTree.

* CollapsingMergeTree docs. English version.

* 1. Update of CollapsingMergeTree. 2. Minor changes in markup

* Update aggregatefunction.md

* Update aggregatefunction.md

* Update aggregatefunction.md

* Update aggregatingmergetree.md

* GraphiteMergeTree docs update.
New syntax for creation of Replicated* tables.
Minor changes in *MergeTree tables creation syntax.

* Markup fix

* Markup and language fixes

* Clarification in the CollapsingMergeTree article

											
										
										
											2018-10-19 11:25:22 +00:00
+								[SETTINGS name=value, ...]
 								```
-												Updated description of MergeTree.

											
										
										
											2018-08-21 07:54:37 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								Описание параметров смотрите в [описании запроса CREATE](../../../engines/table-engines/mergetree-family/mergetree.md).
-												DOCAPI-7430: EN review, RU translation. MergeTree INDEX bloom filter docs. (#7025)

* Update mergetree.md (#38)

* DOCAPI-7430: RU translation.

											
										
										
											2019-09-24 00:02:36 +00:00
-												Links fixed.

											
										
										
											2020-01-28 15:27:44 +00:00
+								### Секции запроса {#mergetree-query-clauses}
-												Updated description of MergeTree.

											
										
										
											2018-08-21 07:54:37 +00:00
-												[experimental] add "es" docs language as machine translated draft (#9787)

* replace exit with assert in test_single_page

* improve save_raw_single_page docs option

* More grammar fixes

* "Built from" link in new tab

* fix mistype

* Example of include in docs

* add anchor to meeting form

* Draft of translation helper

* WIP on translation helper

* Replace some fa docs content with machine translation

* add normalize-en-markdown.sh

* normalize some en markdown

* normalize some en markdown

* admonition support

* normalize

* normalize

* normalize

* support wide tables

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* lightly edited machine translation of introdpection.md

* lightly edited machhine translation of lazy.md

* WIP on translation utils

* Normalize ru docs

* Normalize other languages

* some fixes

* WIP on normalize/translate tools

* add requirements.txt

* [experimental] add es docs language as machine translated draft

* remove duplicate script

* Back to wider tab-stop (narrow renders not so well)
											
										
										
											2020-03-21 04:11:51 +00:00
+								-   `ENGINE` — имя и параметры движка. `ENGINE = MergeTree()`. `MergeTree` не имеет параметров.
-												Updated description of MergeTree.

											
										
										
											2018-08-21 07:54:37 +00:00
-												DOCSUP-2037: Edit and translate PR to RU (#14439)

* DOCSUP-2037: Updated by PR#12010.

* DOCSUP-2037: Updated by PR#11865

* DOCSUP-2037: Update by PR#11032.

* DOCSUP-2037: Update by PR#11433.

* Update docs/ru/engines/table-engines/mergetree-family/mergetree.md

Co-authored-by: BayoNet <da-daos@yandex.ru>

* Update docs/ru/engines/table-engines/mergetree-family/mergetree.md

Co-authored-by: BayoNet <da-daos@yandex.ru>

* Update docs/ru/operations/system-tables/index.md

Co-authored-by: BayoNet <da-daos@yandex.ru>

* Update docs/ru/operations/system-tables/index.md

Co-authored-by: BayoNet <da-daos@yandex.ru>

Co-authored-by: romanzhukov <romanzhukov@yandex-team.ru>
Co-authored-by: BayoNet <da-daos@yandex.ru>
											
										
										
											2020-09-08 15:20:02 +00:00
+								-   `ORDER BY` — ключ сортировки.
-												better

											
										
										
											2021-06-01 14:23:46 +00:00
-												DOCSUP-2037: Edit and translate PR to RU (#14439)

* DOCSUP-2037: Updated by PR#12010.

* DOCSUP-2037: Updated by PR#11865

* DOCSUP-2037: Update by PR#11032.

* DOCSUP-2037: Update by PR#11433.

* Update docs/ru/engines/table-engines/mergetree-family/mergetree.md

Co-authored-by: BayoNet <da-daos@yandex.ru>

* Update docs/ru/engines/table-engines/mergetree-family/mergetree.md

Co-authored-by: BayoNet <da-daos@yandex.ru>

* Update docs/ru/operations/system-tables/index.md

Co-authored-by: BayoNet <da-daos@yandex.ru>

* Update docs/ru/operations/system-tables/index.md

Co-authored-by: BayoNet <da-daos@yandex.ru>

Co-authored-by: romanzhukov <romanzhukov@yandex-team.ru>
Co-authored-by: BayoNet <da-daos@yandex.ru>
											
										
										
											2020-09-08 15:20:02 +00:00
+								    Кортеж столбцов или произвольных выражений. Пример: `ORDER BY (CounterID, EventDate)`.
 								    ClickHouse использует ключ сортировки в качестве первичного ключа, если первичный ключ не задан в секции `PRIMARY KEY`.
-												better

											
										
										
											2021-06-01 14:23:46 +00:00
+								    Чтобы отключить сортировку, используйте синтаксис `ORDER BY tuple()`. Смотрите [выбор первичного ключа](#primary-keys-and-indexes-in-queries).
-												DOCSUP-2037: Edit and translate PR to RU (#14439)

* DOCSUP-2037: Updated by PR#12010.

* DOCSUP-2037: Updated by PR#11865

* DOCSUP-2037: Update by PR#11032.

* DOCSUP-2037: Update by PR#11433.

* Update docs/ru/engines/table-engines/mergetree-family/mergetree.md

Co-authored-by: BayoNet <da-daos@yandex.ru>

* Update docs/ru/engines/table-engines/mergetree-family/mergetree.md

Co-authored-by: BayoNet <da-daos@yandex.ru>

* Update docs/ru/operations/system-tables/index.md

Co-authored-by: BayoNet <da-daos@yandex.ru>

* Update docs/ru/operations/system-tables/index.md

Co-authored-by: BayoNet <da-daos@yandex.ru>

Co-authored-by: romanzhukov <romanzhukov@yandex-team.ru>
Co-authored-by: BayoNet <da-daos@yandex.ru>
											
										
										
											2020-09-08 15:20:02 +00:00
 								-   `PARTITION BY` — [ключ партиционирования](custom-partitioning-key.md). Необязательный параметр.
 								    Для партиционирования по месяцам используйте выражение `toYYYYMM(date_column)`, где `date_column` — столбец с датой типа [Date](../../../engines/table-engines/mergetree-family/mergetree.md). В этом случае имена партиций имеют формат `"YYYYMM"`.
-												Update mergetree.md
											
										
										
											2018-08-22 06:32:16 +00:00
-												Links fixed.

											
										
										
											2021-03-06 11:25:37 +00:00
+								-   `PRIMARY KEY` — первичный ключ, если он [отличается от ключа сортировки](#choosing-a-primary-key-that-differs-from-the-sorting-key). Необязательный параметр.
-												better

											
										
										
											2021-06-01 14:23:46 +00:00
-												DOCSUP-2037: Edit and translate PR to RU (#14439)

* DOCSUP-2037: Updated by PR#12010.

* DOCSUP-2037: Updated by PR#11865

* DOCSUP-2037: Update by PR#11032.

* DOCSUP-2037: Update by PR#11433.

* Update docs/ru/engines/table-engines/mergetree-family/mergetree.md

Co-authored-by: BayoNet <da-daos@yandex.ru>

* Update docs/ru/engines/table-engines/mergetree-family/mergetree.md

Co-authored-by: BayoNet <da-daos@yandex.ru>

* Update docs/ru/operations/system-tables/index.md

Co-authored-by: BayoNet <da-daos@yandex.ru>

* Update docs/ru/operations/system-tables/index.md

Co-authored-by: BayoNet <da-daos@yandex.ru>

Co-authored-by: romanzhukov <romanzhukov@yandex-team.ru>
Co-authored-by: BayoNet <da-daos@yandex.ru>
											
										
										
											2020-09-08 15:20:02 +00:00
+								    По умолчанию первичный ключ совпадает с ключом сортировки (который задаётся секцией `ORDER BY`.) Поэтому в большинстве случаев секцию `PRIMARY KEY` отдельно указывать не нужно.
-												TTL for columns and tables (#4212)

Add TTL for columns and tables.

											
										
										
											2019-04-15 09:30:45 +00:00
-												DOCSUP-2037: Edit and translate PR to RU (#14439)

* DOCSUP-2037: Updated by PR#12010.

* DOCSUP-2037: Updated by PR#11865

* DOCSUP-2037: Update by PR#11032.

* DOCSUP-2037: Update by PR#11433.

* Update docs/ru/engines/table-engines/mergetree-family/mergetree.md

Co-authored-by: BayoNet <da-daos@yandex.ru>

* Update docs/ru/engines/table-engines/mergetree-family/mergetree.md

Co-authored-by: BayoNet <da-daos@yandex.ru>

* Update docs/ru/operations/system-tables/index.md

Co-authored-by: BayoNet <da-daos@yandex.ru>

* Update docs/ru/operations/system-tables/index.md

Co-authored-by: BayoNet <da-daos@yandex.ru>

Co-authored-by: romanzhukov <romanzhukov@yandex-team.ru>
Co-authored-by: BayoNet <da-daos@yandex.ru>
											
										
										
											2020-09-08 15:20:02 +00:00
+								-   `SAMPLE BY` — выражение для сэмплирования. Необязательный параметр.
-												better

											
										
										
											2021-06-01 14:23:46 +00:00
-												translated parts in MergeTree

											
										
										
											2021-08-05 19:55:19 +00:00
+								    Если используется выражение для сэмплирования, то первичный ключ должен содержать его. Результат выражения для сэмплирования должен быть беззнаковым целым числом. Пример: `SAMPLE BY intHash32(UserID) ORDER BY (CounterID, EventDate, intHash32(UserID))`.
-												Added documentation for extended TTL syntax.

											
										
										
											2019-12-06 06:18:57 +00:00
-												DOCSUP-2037: Edit and translate PR to RU (#14439)

* DOCSUP-2037: Updated by PR#12010.

* DOCSUP-2037: Updated by PR#11865

* DOCSUP-2037: Update by PR#11032.

* DOCSUP-2037: Update by PR#11433.

* Update docs/ru/engines/table-engines/mergetree-family/mergetree.md

Co-authored-by: BayoNet <da-daos@yandex.ru>

* Update docs/ru/engines/table-engines/mergetree-family/mergetree.md

Co-authored-by: BayoNet <da-daos@yandex.ru>

* Update docs/ru/operations/system-tables/index.md

Co-authored-by: BayoNet <da-daos@yandex.ru>

* Update docs/ru/operations/system-tables/index.md

Co-authored-by: BayoNet <da-daos@yandex.ru>

Co-authored-by: romanzhukov <romanzhukov@yandex-team.ru>
Co-authored-by: BayoNet <da-daos@yandex.ru>
											
										
										
											2020-09-08 15:20:02 +00:00
+								-   `TTL` — список правил, определяющих длительности хранения строк, а также задающих правила перемещения частей на определённые тома или диски. Необязательный параметр.
-												better

											
										
										
											2021-06-01 14:23:46 +00:00
 								    Выражение должно возвращать столбец `Date` или `DateTime`. Пример: `TTL date + INTERVAL 1 DAY`.
-												TTL for columns and tables (#4212)

Add TTL for columns and tables.

											
										
										
											2019-04-15 09:30:45 +00:00
-												Fixes

											
										
										
											2021-02-01 23:44:40 +00:00
+								    Тип правила `DELETE|TO DISK 'xxx'|TO VOLUME 'xxx'|GROUP BY` указывает действие, которое будет выполнено с частью: удаление строк (прореживание), перемещение (при выполнении условия для всех строк части) на определённый диск (`TO DISK 'xxx'`) или том (`TO VOLUME 'xxx'`), или агрегирование данных в устаревших строках. Поведение по умолчанию соответствует удалению строк (`DELETE`). В списке правил может быть указано только одно выражение с поведением `DELETE`.
-												better

											
										
										
											2021-06-01 14:23:46 +00:00
-												DOCSUP-2037: Edit and translate PR to RU (#14439)

* DOCSUP-2037: Updated by PR#12010.

* DOCSUP-2037: Updated by PR#11865

* DOCSUP-2037: Update by PR#11032.

* DOCSUP-2037: Update by PR#11433.

* Update docs/ru/engines/table-engines/mergetree-family/mergetree.md

Co-authored-by: BayoNet <da-daos@yandex.ru>

* Update docs/ru/engines/table-engines/mergetree-family/mergetree.md

Co-authored-by: BayoNet <da-daos@yandex.ru>

* Update docs/ru/operations/system-tables/index.md

Co-authored-by: BayoNet <da-daos@yandex.ru>

* Update docs/ru/operations/system-tables/index.md

Co-authored-by: BayoNet <da-daos@yandex.ru>

Co-authored-by: romanzhukov <romanzhukov@yandex-team.ru>
Co-authored-by: BayoNet <da-daos@yandex.ru>
											
										
										
											2020-09-08 15:20:02 +00:00
+								    Дополнительные сведения смотрите в разделе [TTL для столбцов и таблиц](#table_engine-mergetree-ttl)
-												TTL for columns and tables (#4212)

Add TTL for columns and tables.

											
										
										
											2019-04-15 09:30:45 +00:00
-												DOCSUP-2037: Edit and translate PR to RU (#14439)

* DOCSUP-2037: Updated by PR#12010.

* DOCSUP-2037: Updated by PR#11865

* DOCSUP-2037: Update by PR#11032.

* DOCSUP-2037: Update by PR#11433.

* Update docs/ru/engines/table-engines/mergetree-family/mergetree.md

Co-authored-by: BayoNet <da-daos@yandex.ru>

* Update docs/ru/engines/table-engines/mergetree-family/mergetree.md

Co-authored-by: BayoNet <da-daos@yandex.ru>

* Update docs/ru/operations/system-tables/index.md

Co-authored-by: BayoNet <da-daos@yandex.ru>

* Update docs/ru/operations/system-tables/index.md

Co-authored-by: BayoNet <da-daos@yandex.ru>

Co-authored-by: romanzhukov <romanzhukov@yandex-team.ru>
Co-authored-by: BayoNet <da-daos@yandex.ru>
											
										
										
											2020-09-08 15:20:02 +00:00
+								-   `SETTINGS` — дополнительные параметры, регулирующие поведение `MergeTree` (необязательные):
-												Updated description of MergeTree.

											
										
										
											2018-08-21 07:54:37 +00:00
-												DOCSUP-5169: Document the min_compress_block_size and max_compress_block_size settings (#18248)

Co-authored-by: Alexander Kazakov <Akazz@users.noreply.github.com>
											
										
										
											2021-01-10 20:21:32 +00:00
+								    -   `index_granularity` — максимальное количество строк данных между засечками индекса. По умолчанию — 8192. Смотрите [Хранение данных](#mergetree-data-storage).
 								    -   `index_granularity_bytes` — максимальный размер гранул данных в байтах. По умолчанию — 10Mb. Чтобы ограничить размер гранул только количеством строк, установите значение 0 (не рекомендовано). Смотрите [Хранение данных](#mergetree-data-storage).
-												DOCSUP-3172: Edit and translate to Russian (#16153)

* Edit and traslate to Russian.

* Update docs/ru/engines/table-engines/integrations/kafka.md

Co-authored-by: BayoNet <da-daos@yandex.ru>

* Update docs/ru/interfaces/http.md

Co-authored-by: BayoNet <da-daos@yandex.ru>

* Update docs/ru/interfaces/http.md

Co-authored-by: BayoNet <da-daos@yandex.ru>

* Ticket.

* http.

* kafka ru

Co-authored-by: Daria Mozhaeva <dmozhaeva@yandex-team.ru>
Co-authored-by: BayoNet <da-daos@yandex.ru>
											
										
										
											2020-11-02 16:54:23 +00:00
+								    -   `min_index_granularity_bytes` — минимально допустимый размер гранул данных в байтах. Значение по умолчанию — 1024b. Для обеспечения защиты от случайного создания таблиц с очень низким значением `index_granularity_bytes`. Смотрите [Хранение данных](#mergetree-data-storage).
-												DOCSUP-5169: Document the min_compress_block_size and max_compress_block_size settings (#18248)

Co-authored-by: Alexander Kazakov <Akazz@users.noreply.github.com>
											
										
										
											2021-01-10 20:21:32 +00:00
+								    -   `enable_mixed_granularity_parts` — включает или выключает переход к ограничению размера гранул с помощью настройки `index_granularity_bytes`. Настройка `index_granularity_bytes` улучшает производительность ClickHouse при выборке данных из таблиц с большими (десятки и сотни мегабайтов) строками. Если у вас есть таблицы с большими строками, можно включить эту настройку, чтобы повысить эффективность запросов `SELECT`.
 								    -   `use_minimalistic_part_header_in_zookeeper` — Способ хранения заголовков кусков данных в ZooKeeper. Если  `use_minimalistic_part_header_in_zookeeper = 1`, то ZooKeeper хранит меньше данных. Подробнее читайте в [описании настройки](../../../operations/server-configuration-parameters/settings.md#server-settings-use_minimalistic_part_header_in_zookeeper) в разделе "Конфигурационные параметры сервера".
 								    -   `min_merge_bytes_to_use_direct_io` — минимальный объём данных при слиянии, необходимый для прямого (небуферизованного) чтения/записи (direct I/O) на диск. При слиянии частей данных ClickHouse вычисляет общий объём хранения всех данных, подлежащих слиянию. Если общий объём хранения всех данных для чтения превышает `min_bytes_to_use_direct_io` байт, тогда ClickHouse  использует флаг `O_DIRECT` при чтении данных с диска. Если `min_merge_bytes_to_use_direct_io = 0`, тогда прямой ввод-вывод отключен. Значение по умолчанию: `10 * 1024 * 1024 * 1024` байтов.
 								    -   <a name="mergetree_setting-merge_with_ttl_timeout"></a>`merge_with_ttl_timeout` — минимальное время в секундах перед повторным слиянием с TTL. По умолчанию — 86400 (1 день).
 								    -   `write_final_mark` — включает или отключает запись последней засечки индекса в конце куска данных, указывающей за последний байт. По умолчанию — 1. Не отключайте её.
 								    -   `merge_max_block_size` — максимальное количество строк в блоке для операций слияния. Значение по умолчанию: 8192.
 								    -   `storage_policy` — политика хранения данных. Смотрите [Хранение данных таблицы на нескольких блочных устройствах](#table_engine-mergetree-multiple-volumes).
-												DOCSUP-1315 Updated description of the 'parts' system table  (#134) (#12535)

* Updated description of the 'parts' system table and 2 new settings for the MergeTree table

* Apply suggestions from code review

Co-authored-by: BayoNet <da-daos@yandex.ru>

* Data part format description moved to the data storage section.

* An error fixed in english version and russian version added.

* Minor bug fixed in russian version.

Co-authored-by: Olga Revyakina <revolg@yandex-team.ru>
Co-authored-by: BayoNet <da-daos@yandex.ru>

Co-authored-by: olgarev <56617294+olgarev@users.noreply.github.com>
Co-authored-by: Olga Revyakina <revolg@yandex-team.ru>
Co-authored-by: Sergei Shtykov <bayonet@yandex-team.ru>
											
										
										
											2020-07-17 15:05:07 +00:00
+								    -   `min_bytes_for_wide_part`, `min_rows_for_wide_part` — минимальное количество байт/строк в куске данных для хранения в формате `Wide`. Можно задать одну или обе настройки или не задавать ни одной. Подробнее см. в разделе [Хранение данных](#mergetree-data-storage).
-												Edit and translate to Russian

Внес поправки в английскую версию и выполнил перевод на русский язык.

											
										
										
											2021-01-18 15:24:17 +00:00
+									-   `max_parts_in_total` — максимальное количество кусков во всех партициях.
-												DOCSUP-5169: Document the min_compress_block_size and max_compress_block_size settings (#18248)

Co-authored-by: Alexander Kazakov <Akazz@users.noreply.github.com>
											
										
										
											2021-01-10 20:21:32 +00:00
+									-   `max_compress_block_size` — максимальный размер блоков несжатых данных перед сжатием для записи в таблицу. Вы также можете задать этот параметр в глобальных настройках (смотрите [max_compress_block_size](../../../operations/settings/settings.md#max-compress-block-size)). Настройка, которая задается при создании таблицы, имеет более высокий приоритет, чем глобальная.
 									-   `min_compress_block_size` — минимальный размер блоков несжатых данных, необходимых для сжатия при записи следующей засечки. Вы также можете задать этот параметр в глобальных настройках (смотрите [min_compress_block_size](../../../operations/settings/settings.md#min-compress-block-size)). Настройка, которая задается при создании таблицы, имеет более высокий приоритет, чем глобальная.
-												Added translation

											
										
										
											2021-02-05 09:46:59 +00:00
+								    -   `max_partitions_to_read` — Ограничивает максимальное число партиций для чтения в одном запросе. Также возможно указать настройку [max_partitions_to_read](../../../operations/settings/merge-tree-settings.md#max-partitions-to-read) в глобальных настройках.
-												WIP on docs translation/normalization tools (#9783)


											
										
										
											2020-03-20 18:20:59 +00:00
-												Updates for Aggregating-,Collapsing-, Replacing- and SummingMergeTree. (#3346)

* Update of english version of descriprion of the table function `file`.

* New syntax for ReplacingMergeTree.
Some improvements in text.

* Significantly change article about SummingMergeTree.
Article is restructured, text is changed in many places of the document. New syntax for table creation is described.

* Descriptions of AggregateFunction and AggregatingMergeTree are updated. Russian version.

* New syntax for new syntax of CREATE TABLE

* Added english docs on Aggregating, Replacing and SummingMergeTree.

* CollapsingMergeTree docs. English version.

* 1. Update of CollapsingMergeTree. 2. Minor changes in markup

* Update aggregatefunction.md

* Update aggregatefunction.md

* Update aggregatefunction.md

* Update aggregatingmergetree.md

* GraphiteMergeTree docs update.
New syntax for creation of Replicated* tables.
Minor changes in *MergeTree tables creation syntax.

* Markup fix

* Markup and language fixes

* Clarification in the CollapsingMergeTree article

											
										
										
											2018-10-19 11:25:22 +00:00
+								**Пример задания секций**
-												Updated description of MergeTree.

											
										
										
											2018-08-21 07:54:37 +00:00
-												WIP on docs translation/normalization tools (#9783)


											
										
										
											2020-03-20 18:20:59 +00:00
+								``` sql
-												Updated description of MergeTree.

											
										
										
											2018-08-21 07:54:37 +00:00
+								ENGINE MergeTree() PARTITION BY toYYYYMM(EventDate) ORDER BY (CounterID, EventDate, intHash32(UserID)) SAMPLE BY intHash32(UserID) SETTINGS index_granularity=8192
 								```
 								В примере мы устанавливаем партиционирование по месяцам.
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								Также мы задаем выражение для сэмплирования в виде хэша по идентификатору посетителя. Это позволяет псевдослучайным образом перемешать данные в таблице для каждого `CounterID` и `EventDate`. Если при выборке данных задать секцию [SAMPLE](../../../engines/table-engines/mergetree-family/mergetree.md#select-sample-clause), то ClickHouse вернёт равномерно-псевдослучайную выборку данных для подмножества посетителей.
-												DOCAPI-5203: Direct I/O settings for MergeTree descriptions. EN review and RU translation. (#4848)


											
										
										
											2019-04-08 16:25:37 +00:00
-												Updated description of MergeTree.

											
										
										
											2018-08-21 07:54:37 +00:00
+								`index_granularity` можно было не указывать, поскольку 8192 — это значение по умолчанию.
-												WIP on docs translation/normalization tools (#9783)


											
										
										
											2020-03-20 18:20:59 +00:00
+								<details markdown="1">
 								<summary>Устаревший способ создания таблицы</summary>
-												Updated description of MergeTree.

											
										
										
											2018-08-21 07:54:37 +00:00
-												WIP on docs translation/normalization tools (#9783)


											
										
										
											2020-03-20 18:20:59 +00:00
+								!!! attention "Attention"
-												Doc fix: Add info about EXTRACT FROM (en, ru) (#4950)


											
										
										
											2019-04-10 18:58:42 +00:00
+								    Не используйте этот способ в новых проектах и по возможности переведите старые проекты на способ, описанный выше.
-												Fixed newlines in .rst files before code blocks [#CLICKHOUSE-2].
for i in $(find . -name '*.rst'); do grep -F -q '.. code-block:: ' $i && cat $i | sed -r -e 's/$/<NEWLINE>/' | tr -d '\n' | sed -r -e 's/([^>])<NEWLINE>.. code-block::/\1<NEWLINE><NEWLINE>.. code-block::/g' | sed -r -e 's/<NEWLINE>/\n/g' > ${i}.tmp && mv ${i}.tmp ${i}; done

											
										
										
											2017-06-13 20:35:07 +00:00
-												WIP on docs translation/normalization tools (#9783)


											
										
										
											2020-03-20 18:20:59 +00:00
+								``` sql
-												Updates for Aggregating-,Collapsing-, Replacing- and SummingMergeTree. (#3346)

* Update of english version of descriprion of the table function `file`.

* New syntax for ReplacingMergeTree.
Some improvements in text.

* Significantly change article about SummingMergeTree.
Article is restructured, text is changed in many places of the document. New syntax for table creation is described.

* Descriptions of AggregateFunction and AggregatingMergeTree are updated. Russian version.

* New syntax for new syntax of CREATE TABLE

* Added english docs on Aggregating, Replacing and SummingMergeTree.

* CollapsingMergeTree docs. English version.

* 1. Update of CollapsingMergeTree. 2. Minor changes in markup

* Update aggregatefunction.md

* Update aggregatefunction.md

* Update aggregatefunction.md

* Update aggregatingmergetree.md

* GraphiteMergeTree docs update.
New syntax for creation of Replicated* tables.
Minor changes in *MergeTree tables creation syntax.

* Markup fix

* Markup and language fixes

* Clarification in the CollapsingMergeTree article

											
										
										
											2018-10-19 11:25:22 +00:00
+								CREATE TABLE [IF NOT EXISTS] [db.]table_name [ON CLUSTER cluster]
 								(
 								    name1 [type1] [DEFAULT|MATERIALIZED|ALIAS expr1],
 								    name2 [type2] [DEFAULT|MATERIALIZED|ALIAS expr2],
 								    ...
 								) ENGINE [=] MergeTree(date-column [, sampling_expression], (primary, key), index_granularity)
-												Updated description of MergeTree.

											
										
										
											2018-08-21 07:54:37 +00:00
+								```
 								**Параметры MergeTree()**
-												Added documentation in RST format. (ReadTheDocs ready)

											
										
										
											2017-03-12 17:58:51 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								-   `date-column` — имя столбца с типом [Date](../../../engines/table-engines/mergetree-family/mergetree.md). На основе этого столбца ClickHouse автоматически создаёт партиции по месяцам. Имена партиций имеют формат `"YYYYMM"`.
-												[experimental] add "es" docs language as machine translated draft (#9787)

* replace exit with assert in test_single_page

* improve save_raw_single_page docs option

* More grammar fixes

* "Built from" link in new tab

* fix mistype

* Example of include in docs

* add anchor to meeting form

* Draft of translation helper

* WIP on translation helper

* Replace some fa docs content with machine translation

* add normalize-en-markdown.sh

* normalize some en markdown

* normalize some en markdown

* admonition support

* normalize

* normalize

* normalize

* support wide tables

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* lightly edited machine translation of introdpection.md

* lightly edited machhine translation of lazy.md

* WIP on translation utils

* Normalize ru docs

* Normalize other languages

* some fixes

* WIP on normalize/translate tools

* add requirements.txt

* [experimental] add es docs language as machine translated draft

* remove duplicate script

* Back to wider tab-stop (narrow renders not so well)
											
										
										
											2020-03-21 04:11:51 +00:00
+								-   `sampling_expression` — выражение для сэмплирования.
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								-   `(primary, key)` — первичный ключ. Тип — [Tuple()](../../../engines/table-engines/mergetree-family/mergetree.md)
-												[experimental] add "es" docs language as machine translated draft (#9787)

* replace exit with assert in test_single_page

* improve save_raw_single_page docs option

* More grammar fixes

* "Built from" link in new tab

* fix mistype

* Example of include in docs

* add anchor to meeting form

* Draft of translation helper

* WIP on translation helper

* Replace some fa docs content with machine translation

* add normalize-en-markdown.sh

* normalize some en markdown

* normalize some en markdown

* admonition support

* normalize

* normalize

* normalize

* support wide tables

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* lightly edited machine translation of introdpection.md

* lightly edited machhine translation of lazy.md

* WIP on translation utils

* Normalize ru docs

* Normalize other languages

* some fixes

* WIP on normalize/translate tools

* add requirements.txt

* [experimental] add es docs language as machine translated draft

* remove duplicate script

* Back to wider tab-stop (narrow renders not so well)
											
										
										
											2020-03-21 04:11:51 +00:00
+								-   `index_granularity` — гранулярность индекса. Число строк данных между «засечками» индекса. Для большинства задач подходит значение 8192.
-												Fixed newlines in .rst files before code blocks [#CLICKHOUSE-2].
for i in $(find . -name '*.rst'); do grep -F -q '.. code-block:: ' $i && cat $i | sed -r -e 's/$/<NEWLINE>/' | tr -d '\n' | sed -r -e 's/([^>])<NEWLINE>.. code-block::/\1<NEWLINE><NEWLINE>.. code-block::/g' | sed -r -e 's/<NEWLINE>/\n/g' > ${i}.tmp && mv ${i}.tmp ${i}; done

											
										
										
											2017-06-13 20:35:07 +00:00
-												Updated description of MergeTree.

											
										
										
											2018-08-21 07:54:37 +00:00
+								**Пример**
-												WIP on docs translation/normalization tools (#9783)


											
										
										
											2020-03-20 18:20:59 +00:00
+								``` sql
-												Replacing 'RestructuredText' sources with the 'Markdown' ones.

											
										
										
											2017-10-25 05:27:09 +00:00
+								MergeTree(EventDate, intHash32(UserID), (CounterID, EventDate, intHash32(UserID)), 8192)
 								```
-												Added documentation in RST format. (ReadTheDocs ready)

											
										
										
											2017-03-12 17:58:51 +00:00
-												Updated description of MergeTree.

											
										
										
											2018-08-21 07:54:37 +00:00
+								Движок `MergeTree` сконфигурирован таким же образом, как и в примере выше для основного способа конфигурирования движка.
-												DOCAPI-7062: MySQL database engine and MergeTree TTL docs. EN review, RU translation (#6407)

* Update create.md

* Update mergetree.md

* Update index.md

* Update mysql.md

* DOCAPI-7062: RU translation.

* DOCAPI-7062: Fixes

* Update docs/ru/database_engines/index.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/database_engines/mysql.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/database_engines/mysql.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/database_engines/mysql.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/query_language/create.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* DOCAPI-7062: Clarifications and fixes.

* DOCAPI-7062: Clarifications.

* Update docs/en/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/en/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

											
										
										
											2019-08-14 16:42:09 +00:00
-												Updates for Aggregating-,Collapsing-, Replacing- and SummingMergeTree. (#3346)

* Update of english version of descriprion of the table function `file`.

* New syntax for ReplacingMergeTree.
Some improvements in text.

* Significantly change article about SummingMergeTree.
Article is restructured, text is changed in many places of the document. New syntax for table creation is described.

* Descriptions of AggregateFunction and AggregatingMergeTree are updated. Russian version.

* New syntax for new syntax of CREATE TABLE

* Added english docs on Aggregating, Replacing and SummingMergeTree.

* CollapsingMergeTree docs. English version.

* 1. Update of CollapsingMergeTree. 2. Minor changes in markup

* Update aggregatefunction.md

* Update aggregatefunction.md

* Update aggregatefunction.md

* Update aggregatingmergetree.md

* GraphiteMergeTree docs update.
New syntax for creation of Replicated* tables.
Minor changes in *MergeTree tables creation syntax.

* Markup fix

* Markup and language fixes

* Clarification in the CollapsingMergeTree article

											
										
										
											2018-10-19 11:25:22 +00:00
+								</details>
-												Updated description of MergeTree.

											
										
										
											2018-08-21 07:54:37 +00:00
-												DOCAPI-6422: EN review, RU translation. Docs for adaptive index granularity and some settings (#7381)

* Typo fix.

* Links fix.

* Fixed links in docs.

* More fixes.

* Link fixes.

* Update settings.md (#64)

* Update mergetree.md (#65)

* DOCAPI-6422: EN review. RU translation.

* Update docs/en/operations/settings/settings.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/en/operations/settings/settings.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* DOCAPI-6422: Update.

											
										
										
											2019-11-06 05:24:33 +00:00
+								## Хранение данных {#mergetree-data-storage}
-												Updated description of MergeTree.

											
										
										
											2018-08-21 07:54:37 +00:00
-												Update mergetree.md
											
										
										
											2018-08-22 06:44:04 +00:00
+								Таблица состоит из *кусков* данных (data parts), отсортированных по первичному ключу.
-												Updated description of MergeTree.

											
										
										
											2018-08-21 07:54:37 +00:00
-												Update mergetree.md
											
										
										
											2018-08-22 06:44:04 +00:00
+								При вставке в таблицу создаются отдельные куски данных, каждый из которых лексикографически отсортирован по первичному ключу. Например, если первичный ключ — `(CounterID, Date)`, то данные в куске будут лежать в порядке `CounterID`, а для каждого `CounterID` в порядке `Date`.
-												Updated description of MergeTree.

											
										
										
											2018-08-21 07:54:37 +00:00
-												Updates for Aggregating-,Collapsing-, Replacing- and SummingMergeTree. (#3346)

* Update of english version of descriprion of the table function `file`.

* New syntax for ReplacingMergeTree.
Some improvements in text.

* Significantly change article about SummingMergeTree.
Article is restructured, text is changed in many places of the document. New syntax for table creation is described.

* Descriptions of AggregateFunction and AggregatingMergeTree are updated. Russian version.

* New syntax for new syntax of CREATE TABLE

* Added english docs on Aggregating, Replacing and SummingMergeTree.

* CollapsingMergeTree docs. English version.

* 1. Update of CollapsingMergeTree. 2. Minor changes in markup

* Update aggregatefunction.md

* Update aggregatefunction.md

* Update aggregatefunction.md

* Update aggregatingmergetree.md

* GraphiteMergeTree docs update.
New syntax for creation of Replicated* tables.
Minor changes in *MergeTree tables creation syntax.

* Markup fix

* Markup and language fixes

* Clarification in the CollapsingMergeTree article

											
										
										
											2018-10-19 11:25:22 +00:00
+								Данные, относящиеся к разным партициям, разбиваются на разные куски. В фоновом режиме ClickHouse выполняет слияния (merge) кусков данных для более эффективного хранения. Куски, относящиеся к разным партициям не объединяются. Механизм слияния не гарантирует, что все строки с одинаковым первичным ключом окажутся в одном куске.
-												Updated description of MergeTree.

											
										
										
											2018-08-21 07:54:37 +00:00
-												better

											
										
										
											2021-06-01 14:23:46 +00:00
+								Куски данных могут храниться в формате `Wide` или `Compact`. В формате `Wide` каждый столбец хранится в отдельном файле, а в формате `Compact` все столбцы хранятся в одном файле. Формат `Compact` может быть полезен для повышения производительности при частом добавлении небольших объемов данных.
-												DOCSUP-1315 Updated description of the 'parts' system table  (#134) (#12535)

* Updated description of the 'parts' system table and 2 new settings for the MergeTree table

* Apply suggestions from code review

Co-authored-by: BayoNet <da-daos@yandex.ru>

* Data part format description moved to the data storage section.

* An error fixed in english version and russian version added.

* Minor bug fixed in russian version.

Co-authored-by: Olga Revyakina <revolg@yandex-team.ru>
Co-authored-by: BayoNet <da-daos@yandex.ru>

Co-authored-by: olgarev <56617294+olgarev@users.noreply.github.com>
Co-authored-by: Olga Revyakina <revolg@yandex-team.ru>
Co-authored-by: Sergei Shtykov <bayonet@yandex-team.ru>
											
										
										
											2020-07-17 15:05:07 +00:00
 								Формат хранения определяется настройками движка `min_bytes_for_wide_part` и `min_rows_for_wide_part`. Если число байт или строк в куске данных меньше значения, указанного в соответствующей настройке, тогда этот кусок данных хранится в формате `Compact`. В противном случае кусок данных хранится в формате `Wide`. Если ни одна из настроек не задана, куски данных хранятся в формате `Wide`.
-												DOCAPI-6422: EN review, RU translation. Docs for adaptive index granularity and some settings (#7381)

* Typo fix.

* Links fix.

* Fixed links in docs.

* More fixes.

* Link fixes.

* Update settings.md (#64)

* Update mergetree.md (#65)

* DOCAPI-6422: EN review. RU translation.

* Update docs/en/operations/settings/settings.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/en/operations/settings/settings.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* DOCAPI-6422: Update.

											
										
										
											2019-11-06 05:24:33 +00:00
+								Каждый кусок данных логически делится на гранулы. Гранула — это минимальный неделимый набор данных, который ClickHouse считывает при выборке данных. ClickHouse не разбивает строки и значения и гранула всегда содержит целое число строк. Первая строка гранулы помечается значением первичного ключа для этой строки (засечка). Для каждого куска данных ClickHouse создаёт файл с засечками (индексный файл). Для каждого столбца, независимо от того, входит он в первичный ключ или нет, ClickHouse также сохраняет эти же засечки. Засечки используются для поиска данных напрямую в файлах столбцов.
 								Размер гранул оганичен настройками движка `index_granularity` и `index_granularity_bytes`. Количество строк в грануле лежит в диапазоне `[1, index_granularity]`, в зависимости от размера строк. Размер гранулы может превышать `index_granularity_bytes` в том случае, когда размер единственной строки в грануле превышает значение настройки. В этом случае, размер гранулы равен размеру строки.
-												Updated description of MergeTree.

											
										
										
											2018-08-21 07:54:37 +00:00
-												Doc fix: updating sections about the partitioning (en, ru) (#4677)


											
										
										
											2019-03-18 12:48:06 +00:00
+								## Первичные ключи и индексы в запросах {#primary-keys-and-indexes-in-queries}
-												Updated description of MergeTree.

											
										
										
											2018-08-21 07:54:37 +00:00
-												DOCAPI-5203: Direct I/O settings for MergeTree descriptions. EN review and RU translation. (#4848)


											
										
										
											2019-04-08 16:25:37 +00:00
+								Рассмотрим первичный ключ — `(CounterID, Date)`. В этом случае сортировку и индекс можно проиллюстрировать следующим образом:
-												Updated description of MergeTree.

											
										
										
											2018-08-21 07:54:37 +00:00
-												WIP on docs translation/normalization tools (#9783)


											
										
										
											2020-03-20 18:20:59 +00:00
+								``` text
-												Updated description of MergeTree.

											
										
										
											2018-08-21 07:54:37 +00:00
+								Whole data:     [-------------------------------------------------------------------------]
 								CounterID:      [aaaaaaaaaaaaaaaaaabbbbcdeeeeeeeeeeeeefgggggggghhhhhhhhhiiiiiiiiikllllllll]
 								Date:           [1111111222222233331233211111222222333211111112122222223111112223311122333]
 								Marks:           |      |      |      |      |      |      |      |      |      |      |
 								                a,1    a,2    a,3    b,3    e,2    e,3    g,1    h,2    i,1    i,3    l,3
 								Marks numbers:   0      1      2      3      4      5      6      7      8      9      10
 								```
 								Если в запросе к данным указать:
-												[experimental] add "es" docs language as machine translated draft (#9787)

* replace exit with assert in test_single_page

* improve save_raw_single_page docs option

* More grammar fixes

* "Built from" link in new tab

* fix mistype

* Example of include in docs

* add anchor to meeting form

* Draft of translation helper

* WIP on translation helper

* Replace some fa docs content with machine translation

* add normalize-en-markdown.sh

* normalize some en markdown

* normalize some en markdown

* admonition support

* normalize

* normalize

* normalize

* support wide tables

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* lightly edited machine translation of introdpection.md

* lightly edited machhine translation of lazy.md

* WIP on translation utils

* Normalize ru docs

* Normalize other languages

* some fixes

* WIP on normalize/translate tools

* add requirements.txt

* [experimental] add es docs language as machine translated draft

* remove duplicate script

* Back to wider tab-stop (narrow renders not so well)
											
										
										
											2020-03-21 04:11:51 +00:00
+								-   `CounterID IN ('a', 'h')`, то сервер читает данные в диапазонах засечек `[0, 3)` и `[6, 8)`.
 								-   `CounterID IN ('a', 'h') AND Date = 3`, то сервер читает данные в диапазонах засечек `[1, 3)` и `[7, 8)`.
 								-   `Date = 3`, то сервер читает данные в диапазоне засечек `[1, 10]`.
-												Updated description of MergeTree.

											
										
										
											2018-08-21 07:54:37 +00:00
 								Примеры выше показывают, что использование индекса всегда эффективнее, чем full scan.
-												Added documentation in RST format. (ReadTheDocs ready)

											
										
										
											2017-03-12 17:58:51 +00:00
-												DOCAPI-6422: EN review, RU translation. Docs for adaptive index granularity and some settings (#7381)

* Typo fix.

* Links fix.

* Fixed links in docs.

* More fixes.

* Link fixes.

* Update settings.md (#64)

* Update mergetree.md (#65)

* DOCAPI-6422: EN review. RU translation.

* Update docs/en/operations/settings/settings.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/en/operations/settings/settings.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* DOCAPI-6422: Update.

											
										
										
											2019-11-06 05:24:33 +00:00
+								Разреженный индекс допускает чтение лишних строк. При чтении одного диапазона первичного ключа, может быть прочитано до `index_granularity * 2` лишних строк в каждом блоке данных.
-												Added documentation in RST format. (ReadTheDocs ready)

											
										
										
											2017-03-12 17:58:51 +00:00
-												Fix typo (#9683)


											
										
										
											2020-03-16 15:02:03 +00:00
+								Разреженный индекс почти всегда помещаеся в оперативную память и позволяет работать с очень большим количеством строк в таблицах.
-												Added documentation in RST format. (ReadTheDocs ready)

											
										
										
											2017-03-12 17:58:51 +00:00
-												Updated description of MergeTree.

											
										
										
											2018-08-21 07:54:37 +00:00
+								ClickHouse не требует уникального первичного ключа. Можно вставить много строк с одинаковым первичным ключом.
-												Added documentation in RST format. (ReadTheDocs ready)

											
										
										
											2017-03-12 17:58:51 +00:00
-												DOCSUP-4435: Allow nullable key in MergeTree (#17345)

* Update settings.md and mergetree.md

Задокументировал настройку allow_nullable_key. Добавил пару предложений в mergetree.md.

* Update mergetree.md

Исправляю битую ссылку.

* Update mergetree.md

Вставил ссылку на allow_nullable_key.

* Update mergetree.md

Правлю битую ссылку.

* Update mergetree.md

Исправляю битую ссылку.

* Update settings.md

Правлю битую ссылку.

* Update mergetree.md and settings.md

Выполнил перевод на русский язык и поправил немного английскую версию.

* Update mergetree.md

Убрал выражение 'для семейства mergetree'.

* Update settings.md

Внес поправки в русскую версию.

* Update mergetree.md and settings.md

Сделал поправки в английскую версию на основе комментарий в PR.

Co-authored-by: Dmitriy <sevirov@yandex-team.ru>
											
										
										
											2020-12-04 18:17:58 +00:00
+								Ключ в `PRIMARY KEY` и `ORDER BY` может иметь тип `Nullable`. За поддержку этой возможности отвечает настройка [allow_nullable_key](../../../operations/settings/settings.md#allow-nullable-key).
 								При сортировке с использованием выражения `ORDER BY` для значений `NULL` всегда работает принцип [NULLS_LAST](../../../sql-reference/statements/select/order-by.md#sorting-of-special-values).
-												First commit

											
										
										
											2021-03-06 11:13:14 +00:00
+								### Выбор первичного ключа {#selecting-the-primary-key}
-												Added documentation in RST format. (ReadTheDocs ready)

											
										
										
											2017-03-12 17:58:51 +00:00
-												Updated description of MergeTree.

											
										
										
											2018-08-21 07:54:37 +00:00
+								Количество столбцов в первичном ключе не ограничено явным образом. В зависимости от структуры данных в первичный ключ можно включать больше или меньше столбцов. Это может:
-												Added documentation in RST format. (ReadTheDocs ready)

											
										
										
											2017-03-12 17:58:51 +00:00
-												[experimental] add "es" docs language as machine translated draft (#9787)

* replace exit with assert in test_single_page

* improve save_raw_single_page docs option

* More grammar fixes

* "Built from" link in new tab

* fix mistype

* Example of include in docs

* add anchor to meeting form

* Draft of translation helper

* WIP on translation helper

* Replace some fa docs content with machine translation

* add normalize-en-markdown.sh

* normalize some en markdown

* normalize some en markdown

* admonition support

* normalize

* normalize

* normalize

* support wide tables

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* lightly edited machine translation of introdpection.md

* lightly edited machhine translation of lazy.md

* WIP on translation utils

* Normalize ru docs

* Normalize other languages

* some fixes

* WIP on normalize/translate tools

* add requirements.txt

* [experimental] add es docs language as machine translated draft

* remove duplicate script

* Back to wider tab-stop (narrow renders not so well)
											
										
										
											2020-03-21 04:11:51 +00:00
+								-   Увеличить эффективность индекса.
-												Added documentation in RST format. (ReadTheDocs ready)

											
										
										
											2017-03-12 17:58:51 +00:00
-												fixed formatting
											
										
										
											2020-12-01 03:18:16 +00:00
+								    Пусть первичный ключ — `(a, b)`, тогда добавление ещё одного столбца `c` повысит эффективность, если выполнены условия:
-												Added documentation in RST format. (ReadTheDocs ready)

											
										
										
											2017-03-12 17:58:51 +00:00
-												fixed formatting
											
										
										
											2020-12-01 03:18:16 +00:00
+								    - Есть запросы с условием на столбец `c`.
 								    - Часто встречаются достаточно длинные (в несколько раз больше `index_granularity`) диапазоны данных с одинаковыми значениями `(a, b)`. Иначе говоря, когда добавление ещё одного столбца позволит пропускать достаточно длинные диапазоны данных.
-												Added documentation in RST format. (ReadTheDocs ready)

											
										
										
											2017-03-12 17:58:51 +00:00
-												[experimental] add "es" docs language as machine translated draft (#9787)

* replace exit with assert in test_single_page

* improve save_raw_single_page docs option

* More grammar fixes

* "Built from" link in new tab

* fix mistype

* Example of include in docs

* add anchor to meeting form

* Draft of translation helper

* WIP on translation helper

* Replace some fa docs content with machine translation

* add normalize-en-markdown.sh

* normalize some en markdown

* normalize some en markdown

* admonition support

* normalize

* normalize

* normalize

* support wide tables

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* lightly edited machine translation of introdpection.md

* lightly edited machhine translation of lazy.md

* WIP on translation utils

* Normalize ru docs

* Normalize other languages

* some fixes

* WIP on normalize/translate tools

* add requirements.txt

* [experimental] add es docs language as machine translated draft

* remove duplicate script

* Back to wider tab-stop (narrow renders not so well)
											
										
										
											2020-03-21 04:11:51 +00:00
+								-   Улучшить сжатие данных.
-												Updated description of MergeTree.

											
										
										
											2018-08-21 07:54:37 +00:00
-												fixed formatting
											
										
										
											2020-12-01 03:18:16 +00:00
+								    ClickHouse сортирует данные по первичному ключу, поэтому чем выше однородность, тем лучше сжатие.
-												Updated description of MergeTree.

											
										
										
											2018-08-21 07:54:37 +00:00
-												[experimental] add "es" docs language as machine translated draft (#9787)

* replace exit with assert in test_single_page

* improve save_raw_single_page docs option

* More grammar fixes

* "Built from" link in new tab

* fix mistype

* Example of include in docs

* add anchor to meeting form

* Draft of translation helper

* WIP on translation helper

* Replace some fa docs content with machine translation

* add normalize-en-markdown.sh

* normalize some en markdown

* normalize some en markdown

* admonition support

* normalize

* normalize

* normalize

* support wide tables

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* lightly edited machine translation of introdpection.md

* lightly edited machhine translation of lazy.md

* WIP on translation utils

* Normalize ru docs

* Normalize other languages

* some fixes

* WIP on normalize/translate tools

* add requirements.txt

* [experimental] add es docs language as machine translated draft

* remove duplicate script

* Back to wider tab-stop (narrow renders not so well)
											
										
										
											2020-03-21 04:11:51 +00:00
+								-   Обеспечить дополнительную логику при слиянии кусков данных в движках [CollapsingMergeTree](collapsingmergetree.md#table_engine-collapsingmergetree) и [SummingMergeTree](summingmergetree.md).
-												Updated description of MergeTree.

											
										
										
											2018-08-21 07:54:37 +00:00
-												fixed formatting
											
										
										
											2020-12-01 03:18:16 +00:00
+								    В этом случае имеет смысл указать отдельный *ключ сортировки*, отличающийся от первичного ключа.
-												Updated description of MergeTree.

											
										
										
											2018-08-21 07:54:37 +00:00
 								Длинный первичный ключ будет негативно влиять на производительность вставки и потребление памяти, однако на производительность ClickHouse при запросах `SELECT` лишние столбцы в первичном ключе не влияют.
-												Fix broken links in docs

											
										
										
											2020-10-13 17:23:29 +00:00
+								Вы можете создать таблицу без первичного ключа, используя синтаксис `ORDER BY tuple()`. В этом случае ClickHouse хранит данные в порядке вставки. Если вы хотите сохранить порядок данных при вставке данных с помощью запросов `INSERT ... SELECT`, установите [max_insert_threads = 1](../../../operations/settings/settings.md#settings-max-insert-threads).
-												DOCSUP-2037: Edit and translate PR to RU (#14439)

* DOCSUP-2037: Updated by PR#12010.

* DOCSUP-2037: Updated by PR#11865

* DOCSUP-2037: Update by PR#11032.

* DOCSUP-2037: Update by PR#11433.

* Update docs/ru/engines/table-engines/mergetree-family/mergetree.md

Co-authored-by: BayoNet <da-daos@yandex.ru>

* Update docs/ru/engines/table-engines/mergetree-family/mergetree.md

Co-authored-by: BayoNet <da-daos@yandex.ru>

* Update docs/ru/operations/system-tables/index.md

Co-authored-by: BayoNet <da-daos@yandex.ru>

* Update docs/ru/operations/system-tables/index.md

Co-authored-by: BayoNet <da-daos@yandex.ru>

Co-authored-by: romanzhukov <romanzhukov@yandex-team.ru>
Co-authored-by: BayoNet <da-daos@yandex.ru>
											
										
										
											2020-09-08 15:20:02 +00:00
-												better

											
										
										
											2021-06-01 14:23:46 +00:00
+								Чтобы выбрать данные в первоначальном порядке, используйте
-												DOCSUP-2037: Edit and translate PR to RU (#14439)

* DOCSUP-2037: Updated by PR#12010.

* DOCSUP-2037: Updated by PR#11865

* DOCSUP-2037: Update by PR#11032.

* DOCSUP-2037: Update by PR#11433.

* Update docs/ru/engines/table-engines/mergetree-family/mergetree.md

Co-authored-by: BayoNet <da-daos@yandex.ru>

* Update docs/ru/engines/table-engines/mergetree-family/mergetree.md

Co-authored-by: BayoNet <da-daos@yandex.ru>

* Update docs/ru/operations/system-tables/index.md

Co-authored-by: BayoNet <da-daos@yandex.ru>

* Update docs/ru/operations/system-tables/index.md

Co-authored-by: BayoNet <da-daos@yandex.ru>

Co-authored-by: romanzhukov <romanzhukov@yandex-team.ru>
Co-authored-by: BayoNet <da-daos@yandex.ru>
											
										
										
											2020-09-08 15:20:02 +00:00
+								[однопоточные](../../../operations/settings/settings.md#settings-max_threads) запросы `SELECT.
-												First commit

											
										
										
											2021-03-06 11:13:14 +00:00
+								### Первичный ключ, отличный от ключа сортировки {#choosing-a-primary-key-that-differs-from-the-sorting-key}
-												add ru docs for ALTER ORDER BY [#CLICKHOUSE-3859]

											
										
										
											2018-12-04 17:51:09 +00:00
-												docs improvements based on comments [#CLICKHOUSE-3859]

											
										
										
											2018-12-05 11:37:45 +00:00
+								Существует возможность задать первичный ключ (выражение, значения которого будут записаны в индексный файл для
-												Fix typos
											
										
										
											2019-03-21 10:53:46 +00:00
+								каждой засечки), отличный от ключа сортировки (выражение, по которому будут упорядочены строки в кусках
-												docs improvements based on comments [#CLICKHOUSE-3859]

											
										
										
											2018-12-05 11:37:45 +00:00
+								данных). Кортеж выражения первичного ключа при этом должен быть префиксом кортежа выражения ключа
-												add ru docs for ALTER ORDER BY [#CLICKHOUSE-3859]

											
										
										
											2018-12-04 17:51:09 +00:00
+								сортировки.
 								Данная возможность особенно полезна при использовании движков [SummingMergeTree](summingmergetree.md)
 								и [AggregatingMergeTree](aggregatingmergetree.md). В типичном сценарии использования этих движков таблица
 								содержит столбцы двух типов: *измерения* (dimensions) и *меры* (measures). Типичные запросы агрегируют
-												DOCAPI-5203: Direct I/O settings for MergeTree descriptions. EN review and RU translation. (#4848)


											
										
										
											2019-04-08 16:25:37 +00:00
+								значения столбцов-мер с произвольной группировкой и фильтрацией по измерениям. Так как `SummingMergeTree`
 								и `AggregatingMergeTree` производят фоновую агрегацию строк с одинаковым значением ключа сортировки, приходится
-												add ru docs for ALTER ORDER BY [#CLICKHOUSE-3859]

											
										
										
											2018-12-04 17:51:09 +00:00
+								добавлять в него все столбцы-измерения. В результате выражение ключа содержит большой список столбцов,
 								который приходится постоянно расширять при добавлении новых измерений.
-												DOCAPI-5203: Direct I/O settings for MergeTree descriptions. EN review and RU translation. (#4848)


											
										
										
											2019-04-08 16:25:37 +00:00
+								В этом сценарии имеет смысл оставить в первичном ключе всего несколько столбцов, которые обеспечат эффективную фильтрацию по индексу, а остальные столбцы-измерения добавить в выражение ключа сортировки.
-												add ru docs for ALTER ORDER BY [#CLICKHOUSE-3859]

											
										
										
											2018-12-04 17:51:09 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								[ALTER ключа сортировки](../../../engines/table-engines/mergetree-family/mergetree.md) — лёгкая операция, так как при одновременном добавлении нового столбца в таблицу и ключ сортировки не нужно изменять данные кусков (они остаются упорядоченными и по новому выражению ключа).
-												add ru docs for ALTER ORDER BY [#CLICKHOUSE-3859]

											
										
										
											2018-12-04 17:51:09 +00:00
-												First commit

											
										
										
											2021-03-06 11:13:14 +00:00
+								### Использование индексов и партиций в запросах {#use-of-indexes-and-partitions-in-queries}
-												Updated description of MergeTree.

											
										
										
											2018-08-21 07:54:37 +00:00
 								Для запросов `SELECT` ClickHouse анализирует возможность использования индекса. Индекс может использоваться, если в секции `WHERE/PREWHERE`, в качестве одного из элементов конъюнкции, или целиком, есть выражение, представляющее операции сравнения на равенства, неравенства, а также `IN` или `LIKE` с фиксированным префиксом, над столбцами или выражениями, входящими в первичный ключ или ключ партиционирования, либо над некоторыми частично монотонными функциями от этих столбцов, а также логические связки над такими выражениями.
-												Added documentation in RST format. (ReadTheDocs ready)

											
										
										
											2017-03-12 17:58:51 +00:00
-												Update mergetree.md
											
										
										
											2018-03-15 11:48:19 +00:00
+								Таким образом, обеспечивается возможность быстро выполнять запросы по одному или многим диапазонам первичного ключа. Например, в указанном примере будут быстро работать запросы для конкретного счётчика; для конкретного счётчика и диапазона дат; для конкретного счётчика и даты, для нескольких счётчиков и диапазона дат и т. п.
-												Added documentation in RST format. (ReadTheDocs ready)

											
										
										
											2017-03-12 17:58:51 +00:00
-												Updated description of MergeTree.

											
										
										
											2018-08-21 07:54:37 +00:00
+								Рассмотрим движок сконфигурированный следующим образом:
-												WIP on docs translation/normalization tools (#9783)


											
										
										
											2020-03-20 18:20:59 +00:00
+								``` sql
-												Updated description of MergeTree.

											
										
										
											2018-08-21 07:54:37 +00:00
+								ENGINE MergeTree() PARTITION BY toYYYYMM(EventDate) ORDER BY (CounterID, EventDate) SETTINGS index_granularity=8192
 								```
 								В этом случае в запросах:
-												WIP on docs translation/normalization tools (#9783)


											
										
										
											2020-03-20 18:20:59 +00:00
+								``` sql
-												Replacing 'RestructuredText' sources with the 'Markdown' ones.

											
										
										
											2017-10-25 05:27:09 +00:00
+								SELECT count() FROM table WHERE EventDate = toDate(now()) AND CounterID = 34
 								SELECT count() FROM table WHERE EventDate = toDate(now()) AND (CounterID = 34 OR CounterID = 42)
 								SELECT count() FROM table WHERE ((EventDate >= toDate('2014-01-01') AND EventDate <= toDate('2014-01-31')) OR EventDate = toDate('2014-05-01')) AND CounterID IN (101500, 731962, 160656) AND (CounterID = 101500 OR EventDate != toDate('2014-05-01'))
 								```
-												Added documentation in RST format. (ReadTheDocs ready)

											
										
										
											2017-03-12 17:58:51 +00:00
-												Updated description of MergeTree.

											
										
										
											2018-08-21 07:54:37 +00:00
+								ClickHouse будет использовать индекс по первичному ключу для отсечения не подходящих данных, а также ключ партиционирования по месяцам для отсечения партиций, которые находятся в не подходящих диапазонах дат.
 								Запросы выше показывают, что индекс используется даже для сложных выражений. Чтение из таблицы организовано так, что использование индекса не может быть медленнее, чем full scan.
-												Added documentation in RST format. (ReadTheDocs ready)

											
										
										
											2017-03-12 17:58:51 +00:00
-												Updated description of MergeTree.

											
										
										
											2018-08-21 07:54:37 +00:00
+								В примере ниже индекс не может использоваться.
-												Added documentation in RST format. (ReadTheDocs ready)

											
										
										
											2017-03-12 17:58:51 +00:00
-												WIP on docs translation/normalization tools (#9783)


											
										
										
											2020-03-20 18:20:59 +00:00
+								``` sql
-												Replacing 'RestructuredText' sources with the 'Markdown' ones.

											
										
										
											2017-10-25 05:27:09 +00:00
+								SELECT count() FROM table WHERE CounterID = 34 OR URL LIKE '%upyachka%'
 								```
-												Added documentation in RST format. (ReadTheDocs ready)

											
										
										
											2017-03-12 17:58:51 +00:00
-												Fix broken links in docs

											
										
										
											2020-10-13 17:23:29 +00:00
+								Чтобы проверить, сможет ли ClickHouse использовать индекс при выполнении запроса, используйте настройки [force_index_by_date](../../../operations/settings/settings.md#settings-force_index_by_date) и [force_primary_key](../../../operations/settings/settings.md#settings-force_primary_key).
-												`force_index_by_date` and `force_primary_key` are documented.

											
										
										
											2017-09-15 09:00:53 +00:00
-												Updated description of MergeTree.

											
										
										
											2018-08-21 07:54:37 +00:00
+								Ключ партиционирования по месяцам обеспечивает чтение только тех блоков данных, которые содержат даты из нужного диапазона. При этом блок данных может содержать данные за многие даты (до целого месяца). В пределах одного блока данные упорядочены по первичному ключу, который может не содержать дату в качестве первого столбца. В связи с этим, при использовании запроса с указанием условия только на дату, но не на префикс первичного ключа, будет читаться данных больше, чем за одну дату.
-												Added documentation in RST format. (ReadTheDocs ready)

											
										
										
											2017-03-12 17:58:51 +00:00
-												First commit

											
										
										
											2021-03-06 11:13:14 +00:00
+								### Использование индекса для частично-монотонных первичных ключей {#use-of-index-for-partially-monotonic-primary-keys}
-												DOCAPI-4148: EN review, RU translation. MergeTree partially monotonic keys (#6085)

* Update http.md

* Update settings.md

* Update mergetree.md

* DOCAPI-6213: RU translastion.

* DOCAPI-4148: 4148

											
										
										
											2019-07-29 10:19:30 +00:00
 								Рассмотрим, например, дни месяца. Они образуют последовательность [монотонную](https://ru.wikipedia.org/wiki/Монотонная_последовательность) в течение одного месяца, но не монотонную на более длительных периодах. Это частично-монотонная последовательность. Если пользователь создаёт таблицу с частично-монотонным первичным ключом, ClickHouse как обычно создаёт разреженный индекс. Когда пользователь выбирает данные из такого рода таблиц, ClickHouse анализирует условия запроса. Если пользователь хочет получить данные между двумя метками индекса, и обе эти метки находятся внутри одного месяца, ClickHouse может использовать индекс в данном конкретном случае, поскольку он может рассчитать расстояние между параметрами запроса и индексными метками.
 								ClickHouse не может использовать индекс, если значения первичного ключа в диапазоне параметров запроса не представляют собой монотонную последовательность. В этом случае ClickHouse использует метод полного сканирования.
 								ClickHouse использует эту логику не только для последовательностей дней месяца, но и для любого частично-монотонного первичного ключа.
-												Translated into Russian.

											
										
										
											2020-09-16 06:13:28 +00:00
+								### Индексы пропуска данных {#table_engine-mergetree-data_skipping-indexes}
-												DOCAPI-5203: Direct I/O settings for MergeTree descriptions. EN review and RU translation. (#4848)


											
										
										
											2019-04-08 16:25:37 +00:00
 								Объявление индексов при определении столбцов в запросе `CREATE`.
-												WIP on docs translation/normalization tools (#9783)


											
										
										
											2020-03-20 18:20:59 +00:00
+								``` sql
-												DOCAPI-5203: Direct I/O settings for MergeTree descriptions. EN review and RU translation. (#4848)


											
										
										
											2019-04-08 16:25:37 +00:00
+								INDEX index_name expr TYPE type(...) GRANULARITY granularity_value
 								```
-												docs

											
										
										
											2019-02-12 18:02:45 +00:00
-												docs ru

											
										
										
											2019-01-21 18:35:29 +00:00
+								Для таблиц семейства `*MergeTree` можно задать дополнительные индексы в секции столбцов.
-												Fixed bad documentation

											
										
										
											2020-02-02 21:46:31 +00:00
+								Индексы агрегируют для заданного выражения некоторые данные, а потом при `SELECT` запросе используют для пропуска блоков данных (пропускаемый блок состоит из гранул данных в количестве равном гранулярности данного индекса), на которых секция `WHERE` не может быть выполнена, тем самым уменьшая объём данных читаемых с диска.
-												docs ru

											
										
										
											2019-01-21 18:35:29 +00:00
-												DOCAPI-5203: Direct I/O settings for MergeTree descriptions. EN review and RU translation. (#4848)


											
										
										
											2019-04-08 16:25:37 +00:00
+								**Пример**
-												WIP on docs translation/normalization tools (#9783)


											
										
										
											2020-03-20 18:20:59 +00:00
+								``` sql
-												docs ru

											
										
										
											2019-01-21 18:35:29 +00:00
+								CREATE TABLE table_name
 								(
 								    u64 UInt64,
 								    i32 Int32,
 								    s String,
 								    ...
 								    INDEX a (u64 * i32, s) TYPE minmax GRANULARITY 3,
-												DOCAPI-5203: Direct I/O settings for MergeTree descriptions. EN review and RU translation. (#4848)


											
										
										
											2019-04-08 16:25:37 +00:00
+								    INDEX b (u64 * length(s)) TYPE set(1000) GRANULARITY 4
-												docs ru

											
										
										
											2019-01-21 18:35:29 +00:00
+								) ENGINE = MergeTree()
 								...
 								```
-												fix docs

											
										
										
											2019-01-22 18:22:16 +00:00
+								Эти индексы смогут использоваться для оптимизации следующих запросов
-												DOCAPI-5203: Direct I/O settings for MergeTree descriptions. EN review and RU translation. (#4848)


											
										
										
											2019-04-08 16:25:37 +00:00
-												WIP on docs translation/normalization tools (#9783)


											
										
										
											2020-03-20 18:20:59 +00:00
+								``` sql
-												docs ru

											
										
										
											2019-01-21 18:35:29 +00:00
+								SELECT count() FROM table WHERE s < 'z'
 								SELECT count() FROM table WHERE u64 * i32 == 10 AND u64 * length(s) >= 1234
 								```
-												First commit

											
										
										
											2021-03-06 11:13:14 +00:00
+								#### Доступные индексы {#available-types-of-indices}
-												docs ru

											
										
										
											2019-01-21 18:35:29 +00:00
-												[experimental] add "es" docs language as machine translated draft (#9787)

* replace exit with assert in test_single_page

* improve save_raw_single_page docs option

* More grammar fixes

* "Built from" link in new tab

* fix mistype

* Example of include in docs

* add anchor to meeting form

* Draft of translation helper

* WIP on translation helper

* Replace some fa docs content with machine translation

* add normalize-en-markdown.sh

* normalize some en markdown

* normalize some en markdown

* admonition support

* normalize

* normalize

* normalize

* support wide tables

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* lightly edited machine translation of introdpection.md

* lightly edited machhine translation of lazy.md

* WIP on translation utils

* Normalize ru docs

* Normalize other languages

* some fixes

* WIP on normalize/translate tools

* add requirements.txt

* [experimental] add es docs language as machine translated draft

* remove duplicate script

* Back to wider tab-stop (narrow renders not so well)
											
										
										
											2020-03-21 04:11:51 +00:00
+								-   `minmax` — Хранит минимум и максимум выражения (если выражение - `tuple`, то для каждого элемента `tuple`), используя их для пропуска блоков аналогично первичному ключу.
-												DOCAPI-7430: EN review, RU translation. MergeTree INDEX bloom filter docs. (#7025)

* Update mergetree.md (#38)

* DOCAPI-7430: RU translation.

											
										
										
											2019-09-24 00:02:36 +00:00
-												[experimental] add "es" docs language as machine translated draft (#9787)

* replace exit with assert in test_single_page

* improve save_raw_single_page docs option

* More grammar fixes

* "Built from" link in new tab

* fix mistype

* Example of include in docs

* add anchor to meeting form

* Draft of translation helper

* WIP on translation helper

* Replace some fa docs content with machine translation

* add normalize-en-markdown.sh

* normalize some en markdown

* normalize some en markdown

* admonition support

* normalize

* normalize

* normalize

* support wide tables

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* lightly edited machine translation of introdpection.md

* lightly edited machhine translation of lazy.md

* WIP on translation utils

* Normalize ru docs

* Normalize other languages

* some fixes

* WIP on normalize/translate tools

* add requirements.txt

* [experimental] add es docs language as machine translated draft

* remove duplicate script

* Back to wider tab-stop (narrow renders not so well)
											
										
										
											2020-03-21 04:11:51 +00:00
+								-   `set(max_rows)` — Хранит уникальные значения выражения на блоке в количестве не более `max_rows` (если `max_rows = 0`, то ограничений нет), используя их для пропуска блоков, оценивая выполнимость `WHERE` выражения на хранимых данных.
-												DOCAPI-7430: EN review, RU translation. MergeTree INDEX bloom filter docs. (#7025)

* Update mergetree.md (#38)

* DOCAPI-7430: RU translation.

											
										
										
											2019-09-24 00:02:36 +00:00
-												[experimental] add "es" docs language as machine translated draft (#9787)

* replace exit with assert in test_single_page

* improve save_raw_single_page docs option

* More grammar fixes

* "Built from" link in new tab

* fix mistype

* Example of include in docs

* add anchor to meeting form

* Draft of translation helper

* WIP on translation helper

* Replace some fa docs content with machine translation

* add normalize-en-markdown.sh

* normalize some en markdown

* normalize some en markdown

* admonition support

* normalize

* normalize

* normalize

* support wide tables

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* lightly edited machine translation of introdpection.md

* lightly edited machhine translation of lazy.md

* WIP on translation utils

* Normalize ru docs

* Normalize other languages

* some fixes

* WIP on normalize/translate tools

* add requirements.txt

* [experimental] add es docs language as machine translated draft

* remove duplicate script

* Back to wider tab-stop (narrow renders not so well)
											
										
										
											2020-03-21 04:11:51 +00:00
+								-   `bloom_filter([false_positive])` — [фильтр Блума](https://en.wikipedia.org/wiki/Bloom_filter) для указанных стоблцов.
-												DOCAPI-7430: EN review, RU translation. MergeTree INDEX bloom filter docs. (#7025)

* Update mergetree.md (#38)

* DOCAPI-7430: RU translation.

											
										
										
											2019-09-24 00:02:36 +00:00
-												fixed formatting
											
										
										
											2020-12-01 03:18:16 +00:00
+								    Необязательный параметр `false_positive` — это вероятность получения ложноположительного срабатывания. Возможные значения: (0, 1). Значение по умолчанию: 0.025.
-												DOCAPI-7430: EN review, RU translation. MergeTree INDEX bloom filter docs. (#7025)

* Update mergetree.md (#38)

* DOCAPI-7430: RU translation.

											
										
										
											2019-09-24 00:02:36 +00:00
-												fixed formatting
											
										
										
											2020-12-01 03:18:16 +00:00
+								    Поддержанные типы данных: `Int*`, `UInt*`, `Float*`, `Enum`, `Date`, `DateTime`, `String`, `FixedString`.
-												better

											
										
										
											2021-06-01 14:23:46 +00:00
-												Update mergetree.md
											
										
										
											2020-12-01 17:51:08 +00:00
+								    Фильтром могут пользоваться функции: [equals](../../../engines/table-engines/mergetree-family/mergetree.md), [notEquals](../../../engines/table-engines/mergetree-family/mergetree.md), [in](../../../engines/table-engines/mergetree-family/mergetree.md), [notIn](../../../engines/table-engines/mergetree-family/mergetree.md).
-												docs ru

											
										
										
											2019-01-21 18:35:29 +00:00
-												DOCAPI-5203: Direct I/O settings for MergeTree descriptions. EN review and RU translation. (#4848)


											
										
										
											2019-04-08 16:25:37 +00:00
+								**Примеры**
-												unique

											
										
										
											2019-01-29 18:22:12 +00:00
-												WIP on docs translation/normalization tools (#9783)


											
										
										
											2020-03-20 18:20:59 +00:00
+								``` sql
-												fix docs

											
										
										
											2019-01-22 18:22:16 +00:00
+								INDEX b (u64 * length(str), i32 + f64 * 100, date, str) TYPE minmax GRANULARITY 4
-												unique -> set : docs

											
										
										
											2019-02-06 20:08:43 +00:00
+								INDEX b (u64 * length(str), i32 + f64 * 100, date, str) TYPE set(100) GRANULARITY 4
-												docs ru

											
										
										
											2019-01-21 18:35:29 +00:00
+								```
-												CLICKHOUSEDOCS-649: Repaired table (#11156)

Co-authored-by: Sergei Shtykov <bayonet@yandex-team.ru>
											
										
										
											2020-05-23 10:22:37 +00:00
+								#### Поддержка для функций {#functions-support}
-												DOCAPI-7695: EN review, RU translation. Functions support for indexes (#7045)

* Typo fix.

* DOCAPI-7695: Typo fixed

* Update mergetree.md (#49)

* DOCAPI-7695: RU translation

* Update mergetree.md

											
										
										
											2019-09-23 23:50:26 +00:00
 								Условия в секции `WHERE` содержат вызовы функций, оперирующих со столбцами. Если столбец - часть индекса, ClickHouse пытается использовать индекс при выполнении функции. Для разных видов индексов, ClickHouse поддерживает различные наборы функций, которые могут использоваться индексами.
 								Индекс `set` используется со всеми функциями. Наборы функций для остальных индексов представлены в таблице ниже.
-												Fix broken links in docs

											
										
										
											2020-10-13 17:23:29 +00:00
+								| Функция (оператор) / Индекс                                                                                | primary key | minmax | ngrambf_v1 | tokenbf_v1 | bloom_filter |
-												CLICKHOUSEDOCS-649: Repaired table (#11156)

Co-authored-by: Sergei Shtykov <bayonet@yandex-team.ru>
											
										
										
											2020-05-23 10:22:37 +00:00
+								|------------------------------------------------------------------------------------------------------------|-------------|--------|-------------|-------------|---------------|
 								| [equals (=, ==)](../../../sql-reference/functions/comparison-functions.md#function-equals)                 | ✔           | ✔      | ✔           | ✔           | ✔             |
 								| [notEquals(!=, \<\>)](../../../sql-reference/functions/comparison-functions.md#function-notequals)         | ✔           | ✔      | ✔           | ✔           | ✔             |
-												Update mergetree.md

tokenbf_v1 supports like
											
										
										
											2020-11-05 15:05:56 +00:00
+								| [like](../../../sql-reference/functions/string-search-functions.md#function-like)                          | ✔           | ✔      | ✔           | ✔           | ✗             |
 								| [notLike](../../../sql-reference/functions/string-search-functions.md#function-notlike)                    | ✔           | ✔      | ✔           | ✔           | ✗             |
-												CLICKHOUSEDOCS-649: Repaired table (#11156)

Co-authored-by: Sergei Shtykov <bayonet@yandex-team.ru>
											
										
										
											2020-05-23 10:22:37 +00:00
+								| [startsWith](../../../sql-reference/functions/string-functions.md#startswith)                              | ✔           | ✔      | ✔           | ✔           | ✗             |
 								| [endsWith](../../../sql-reference/functions/string-functions.md#endswith)                                  | ✗           | ✗      | ✔           | ✔           | ✗             |
 								| [multiSearchAny](../../../sql-reference/functions/string-search-functions.md#function-multisearchany)      | ✗           | ✗      | ✔           | ✗           | ✗             |
 								| [in](../../../sql-reference/functions/in-functions.md#in-functions)                                        | ✔           | ✔      | ✔           | ✔           | ✔             |
 								| [notIn](../../../sql-reference/functions/in-functions.md#in-functions)                                     | ✔           | ✔      | ✔           | ✔           | ✔             |
 								| [less (\<)](../../../sql-reference/functions/comparison-functions.md#function-less)                        | ✔           | ✔      | ✗           | ✗           | ✗             |
 								| [greater (\>)](../../../sql-reference/functions/comparison-functions.md#function-greater)                  | ✔           | ✔      | ✗           | ✗           | ✗             |
 								| [lessOrEquals (\<=)](../../../sql-reference/functions/comparison-functions.md#function-lessorequals)       | ✔           | ✔      | ✗           | ✗           | ✗             |
 								| [greaterOrEquals (\>=)](../../../sql-reference/functions/comparison-functions.md#function-greaterorequals) | ✔           | ✔      | ✗           | ✗           | ✗             |
 								| [empty](../../../sql-reference/functions/array-functions.md#function-empty)                                | ✔           | ✔      | ✗           | ✗           | ✗             |
 								| [notEmpty](../../../sql-reference/functions/array-functions.md#function-notempty)                          | ✔           | ✔      | ✗           | ✗           | ✗             |
 								| hasToken                                                                                                   | ✗           | ✗      | ✗           | ✔           | ✗             |
-												DOCAPI-7695: EN review, RU translation. Functions support for indexes (#7045)

* Typo fix.

* DOCAPI-7695: Typo fixed

* Update mergetree.md (#49)

* DOCAPI-7695: RU translation

* Update mergetree.md

											
										
										
											2019-09-23 23:50:26 +00:00
 								Функции с постоянным агрументом, который меньше, чем размер ngram не могут использовать индекс `ngrambf_v1` для оптимизации запроса.
 								Фильтры Блума могут иметь ложнопозитивные срабатывания, следовательно индексы `ngrambf_v1`, `tokenbf_v1` и `bloom_filter` невозможно использовать для оптимизации запросов, в которых результат функции предполается false, например:
-												[experimental] add "es" docs language as machine translated draft (#9787)

* replace exit with assert in test_single_page

* improve save_raw_single_page docs option

* More grammar fixes

* "Built from" link in new tab

* fix mistype

* Example of include in docs

* add anchor to meeting form

* Draft of translation helper

* WIP on translation helper

* Replace some fa docs content with machine translation

* add normalize-en-markdown.sh

* normalize some en markdown

* normalize some en markdown

* admonition support

* normalize

* normalize

* normalize

* support wide tables

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* lightly edited machine translation of introdpection.md

* lightly edited machhine translation of lazy.md

* WIP on translation utils

* Normalize ru docs

* Normalize other languages

* some fixes

* WIP on normalize/translate tools

* add requirements.txt

* [experimental] add es docs language as machine translated draft

* remove duplicate script

* Back to wider tab-stop (narrow renders not so well)
											
										
										
											2020-03-21 04:11:51 +00:00
+								-   Можно оптимизировать:
 								    -   `s LIKE '%test%'`
 								    -   `NOT s NOT LIKE '%test%'`
 								    -   `s = 1`
 								    -   `NOT s != 1`
 								    -   `startsWith(s, 'test')`
 								-   Нельзя оптимизировать:
 								    -   `NOT s LIKE '%test%'`
 								    -   `s NOT LIKE '%test%'`
 								    -   `NOT s = 1`
 								    -   `s != 1`
 								    -   `NOT startsWith(s, 'test')`
-												DOCAPI-7695: EN review, RU translation. Functions support for indexes (#7045)

* Typo fix.

* DOCAPI-7695: Typo fixed

* Update mergetree.md (#49)

* DOCAPI-7695: RU translation

* Update mergetree.md

											
										
										
											2019-09-23 23:50:26 +00:00
-												Update mergetree.md
											
										
										
											2021-08-12 21:59:16 +00:00
+								### Проекции {#projections}
 								Проекции похожи на материализованные представления, но определяются на уровне партов. Это обеспечивает гарантии согласованности наряду с автоматическим использованием в запросах.
 								#### Запрос {#projection-query}
-												Update docs/ru/engines/table-engines/mergetree-family/mergetree.md

Co-authored-by: Alexey Boykov <33257111+mathalex@users.noreply.github.com>
											
										
										
											2021-08-13 12:32:13 +00:00
+								Запрос проекции — это то, что определяет проекцию. Он имеет следующую грамматику:
-												Update mergetree.md
											
										
										
											2021-08-12 21:59:16 +00:00
 								`SELECT <COLUMN LIST EXPR> [GROUP BY] [ORDER BY]`
-												Update docs/ru/engines/table-engines/mergetree-family/mergetree.md

Co-authored-by: Alexey Boykov <33257111+mathalex@users.noreply.github.com>
											
										
										
											2021-08-13 12:32:23 +00:00
+								Он неявно выбирает данные из родительской таблицы.
-												Update mergetree.md
											
										
										
											2021-08-12 21:59:16 +00:00
 								#### Хранение {#projection-storage}
 								Проекции хранятся в каталоге парта. Это похоже на хранение индексов, но используется подкаталог, в котором хранится анонимный парт таблицы MergeTree. Таблица создается запросом определения проекции. Если есть конструкция GROUP BY, то базовый механизм хранения становится AggregatedMergeTree, а все агрегатные функции преобразуются в AggregateFunction. Если есть конструкция ORDER BY, таблица MergeTree будет использовать его в качестве выражения первичного ключа. Во время процесса слияния парт проекции будет слит с помощью процедуры слияния ее хранилища. Контрольная сумма парта родительской таблицы будет включать парт проекции. Другие процедуры аналогичны индексам пропуска данных.
 								#### Анализ запросов {#projection-query-analysis}
-												Update docs/ru/engines/table-engines/mergetree-family/mergetree.md

Co-authored-by: Alexey Boykov <33257111+mathalex@users.noreply.github.com>
											
										
										
											2021-08-13 12:33:03 +00:00
+. Проверить, можно ли использовать проекцию в данном запросе, то есть, что с ней выходит тот же результат, что и с запросом к базовой таблице.
-												Update mergetree.md
											
										
										
											2021-08-12 21:59:16 +00:00
+. Выбрать наиболее подходящее совпадение, содержащее наименьшее количество гранул для чтения.
-												Update docs/ru/engines/table-engines/mergetree-family/mergetree.md

Co-authored-by: Alexey Boykov <33257111+mathalex@users.noreply.github.com>
											
										
										
											2021-08-13 12:33:52 +00:00
+. План запроса, который использует проекции, будет отличаться от того, который использует исходные парты. При отсутствии проекции в некоторых партах можно расширить план, чтобы «проецировать» на лету.
-												Update mergetree.md
											
										
										
											2021-08-12 21:59:16 +00:00
-												First commit

											
										
										
											2021-03-06 11:13:14 +00:00
+								## Конкурентный доступ к данным {#concurrent-data-access}
-												Added documentation in RST format. (ReadTheDocs ready)

											
										
										
											2017-03-12 17:58:51 +00:00
-												Updated description of MergeTree.

											
										
										
											2018-08-21 07:54:37 +00:00
+								Для конкурентного доступа к таблице используется мультиверсионность. То есть, при одновременном чтении и обновлении таблицы, данные будут читаться из набора кусочков, актуального на момент запроса. Длинных блокировок нет. Вставки никак не мешают чтениям.
-												Added documentation in RST format. (ReadTheDocs ready)

											
										
										
											2017-03-12 17:58:51 +00:00
-												Updated description of MergeTree.

											
										
										
											2018-08-21 07:54:37 +00:00
+								Чтения из таблицы автоматически распараллеливаются.
-												WIP on docs/website (#3383)

* CLICKHOUSE-4063: less manual html @ index.md

* CLICKHOUSE-4063: recommend markdown="1" in README.md

* CLICKHOUSE-4003: manually purge custom.css for now

* CLICKHOUSE-4064: expand <details> before any print (including to pdf)

* CLICKHOUSE-3927: rearrange interfaces/formats.md a bit

* CLICKHOUSE-3306: add few http headers

* Remove copy-paste introduced in #3392

* Hopefully better chinese fonts #3392

* get rid of tabs @ custom.css

* Apply comments and patch from #3384

* Add jdbc.md to ToC and some translation, though it still looks badly incomplete

* minor punctuation

* Add some backlinks to official website from mirrors that just blindly take markdown sources

* Do not make fonts extra light

* find . -name '*.md' -type f | xargs -I{} perl -pi -e 's//g' {}

* find . -name '*.md' -type f | xargs -I{} perl -pi -e 's/ sql/g' {}

* Remove outdated stuff from roadmap.md

* Not so light font on front page too

* Refactor Chinese formats.md to match recent changes in other languages

											
										
										
											2018-10-16 10:47:17 +00:00
-												Restore some old manual anchors in docs (#9803)

* Simplify 404 page

* add es array_functions.md

* restore some old manual anchors

* update sitemaps

* trigger checks

* restore more old manual anchors

* refactor test.md + temporary disable failure again

* fix mistype
											
										
										
											2020-03-22 09:14:59 +00:00
+								## TTL для столбцов и таблиц {#table_engine-mergetree-ttl}
-												DOCAPI-7062: MySQL database engine and MergeTree TTL docs. EN review, RU translation (#6407)

* Update create.md

* Update mergetree.md

* Update index.md

* Update mysql.md

* DOCAPI-7062: RU translation.

* DOCAPI-7062: Fixes

* Update docs/ru/database_engines/index.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/database_engines/mysql.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/database_engines/mysql.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/database_engines/mysql.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/query_language/create.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* DOCAPI-7062: Clarifications and fixes.

* DOCAPI-7062: Clarifications.

* Update docs/en/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/en/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

											
										
										
											2019-08-14 16:42:09 +00:00
-												Added documentation for extended TTL syntax.

											
										
										
											2019-12-06 06:18:57 +00:00
+								Определяет время жизни значений, а также правила перемещения данных на другой диск или том.
 								Секция `TTL` может быть установлена как для всей таблицы, так и для каждого отдельного столбца. Правила `TTL` для таблицы позволяют указать целевые диски или тома для фонового перемещения на них частей данных.
-												DOCAPI-7062: MySQL database engine and MergeTree TTL docs. EN review, RU translation (#6407)

* Update create.md

* Update mergetree.md

* Update index.md

* Update mysql.md

* DOCAPI-7062: RU translation.

* DOCAPI-7062: Fixes

* Update docs/ru/database_engines/index.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/database_engines/mysql.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/database_engines/mysql.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/database_engines/mysql.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/query_language/create.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* DOCAPI-7062: Clarifications and fixes.

* DOCAPI-7062: Clarifications.

* Update docs/en/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/en/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

											
										
										
											2019-08-14 16:42:09 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								Выражения должны возвращать тип [Date](../../../engines/table-engines/mergetree-family/mergetree.md) или [DateTime](../../../engines/table-engines/mergetree-family/mergetree.md).
-												DOCAPI-7062: MySQL database engine and MergeTree TTL docs. EN review, RU translation (#6407)

* Update create.md

* Update mergetree.md

* Update index.md

* Update mysql.md

* DOCAPI-7062: RU translation.

* DOCAPI-7062: Fixes

* Update docs/ru/database_engines/index.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/database_engines/mysql.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/database_engines/mysql.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/database_engines/mysql.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/query_language/create.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* DOCAPI-7062: Clarifications and fixes.

* DOCAPI-7062: Clarifications.

* Update docs/en/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/en/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

											
										
										
											2019-08-14 16:42:09 +00:00
-												Added documentation for extended TTL syntax.

											
										
										
											2019-12-06 06:18:57 +00:00
+								Для задания времени жизни столбца, например:
-												DOCAPI-7062: MySQL database engine and MergeTree TTL docs. EN review, RU translation (#6407)

* Update create.md

* Update mergetree.md

* Update index.md

* Update mysql.md

* DOCAPI-7062: RU translation.

* DOCAPI-7062: Fixes

* Update docs/ru/database_engines/index.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/database_engines/mysql.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/database_engines/mysql.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/database_engines/mysql.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/query_language/create.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* DOCAPI-7062: Clarifications and fixes.

* DOCAPI-7062: Clarifications.

* Update docs/en/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/en/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

											
										
										
											2019-08-14 16:42:09 +00:00
-												WIP on docs translation/normalization tools (#9783)


											
										
										
											2020-03-20 18:20:59 +00:00
+								``` sql
-												DOCAPI-7062: MySQL database engine and MergeTree TTL docs. EN review, RU translation (#6407)

* Update create.md

* Update mergetree.md

* Update index.md

* Update mysql.md

* DOCAPI-7062: RU translation.

* DOCAPI-7062: Fixes

* Update docs/ru/database_engines/index.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/database_engines/mysql.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/database_engines/mysql.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/database_engines/mysql.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/query_language/create.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* DOCAPI-7062: Clarifications and fixes.

* DOCAPI-7062: Clarifications.

* Update docs/en/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/en/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

											
										
										
											2019-08-14 16:42:09 +00:00
+								TTL time_column
 								TTL time_column + interval
 								```
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								Чтобы задать `interval`, используйте операторы [интервала времени](../../../engines/table-engines/mergetree-family/mergetree.md#operators-datetime).
-												DOCAPI-7062: MySQL database engine and MergeTree TTL docs. EN review, RU translation (#6407)

* Update create.md

* Update mergetree.md

* Update index.md

* Update mysql.md

* DOCAPI-7062: RU translation.

* DOCAPI-7062: Fixes

* Update docs/ru/database_engines/index.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/database_engines/mysql.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/database_engines/mysql.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/database_engines/mysql.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/query_language/create.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* DOCAPI-7062: Clarifications and fixes.

* DOCAPI-7062: Clarifications.

* Update docs/en/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/en/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

											
										
										
											2019-08-14 16:42:09 +00:00
-												WIP on docs translation/normalization tools (#9783)


											
										
										
											2020-03-20 18:20:59 +00:00
+								``` sql
-												DOCAPI-7062: MySQL database engine and MergeTree TTL docs. EN review, RU translation (#6407)

* Update create.md

* Update mergetree.md

* Update index.md

* Update mysql.md

* DOCAPI-7062: RU translation.

* DOCAPI-7062: Fixes

* Update docs/ru/database_engines/index.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/database_engines/mysql.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/database_engines/mysql.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/database_engines/mysql.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/query_language/create.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* DOCAPI-7062: Clarifications and fixes.

* DOCAPI-7062: Clarifications.

* Update docs/en/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/en/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

											
										
										
											2019-08-14 16:42:09 +00:00
+								TTL date_time + INTERVAL 1 MONTH
 								TTL date_time + INTERVAL 15 HOUR
 								```
-												CLICKHOUSEDOCS-446: Tranlsated to Russian. Fixed links in ZH version.

											
										
										
											2020-02-20 14:38:57 +00:00
+								### TTL столбца {#mergetree-column-ttl}
-												DOCAPI-7062: MySQL database engine and MergeTree TTL docs. EN review, RU translation (#6407)

* Update create.md

* Update mergetree.md

* Update index.md

* Update mysql.md

* DOCAPI-7062: RU translation.

* DOCAPI-7062: Fixes

* Update docs/ru/database_engines/index.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/database_engines/mysql.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/database_engines/mysql.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/database_engines/mysql.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/query_language/create.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* DOCAPI-7062: Clarifications and fixes.

* DOCAPI-7062: Clarifications.

* Update docs/en/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/en/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

											
										
										
											2019-08-14 16:42:09 +00:00
 								Когда срок действия значений в столбце истечет, ClickHouse заменит их значениями по умолчанию для типа данных столбца. Если срок действия всех значений столбцов в части данных истек, ClickHouse удаляет столбец из куска данных в файловой системе.
 								Секцию `TTL` нельзя использовать для ключевых столбцов.
-												Update mergetree.md

TTL examples
											
										
										
											2019-09-06 15:16:14 +00:00
+								Примеры:
-												Update mergetree.md

TTL examples / Requested change
											
										
										
											2019-09-06 16:57:23 +00:00
+								Создание таблицы с TTL
-												WIP on docs translation/normalization tools (#9783)


											
										
										
											2020-03-20 18:20:59 +00:00
+								``` sql
-												Renamed "storage_policy_name" to "storage_policy"

											
										
										
											2019-09-20 20:35:50 +00:00
+								CREATE TABLE example_table
-												Update mergetree.md

TTL examples
											
										
										
											2019-09-06 15:16:14 +00:00
+								(
 								    d DateTime,
-												Update mergetree.md

TTL examples / Requested change
											
										
										
											2019-09-06 16:57:23 +00:00
+								    a Int TTL d + INTERVAL 1 MONTH,
 								    b Int TTL d + INTERVAL 1 MONTH,
-												Update mergetree.md

TTL examples
											
										
										
											2019-09-06 15:16:14 +00:00
+								    c String
 								)
 								ENGINE = MergeTree
 								PARTITION BY toYYYYMM(d)
 								ORDER BY d;
-												Update mergetree.md

TTL examples / Requested change
											
										
										
											2019-09-06 16:57:23 +00:00
+								```
-												Update mergetree.md

TTL examples
											
										
										
											2019-09-06 15:16:14 +00:00
-												Update mergetree.md

TTL examples / Requested change
											
										
										
											2019-09-06 16:57:23 +00:00
+								Добавление TTL на колонку существующей таблицы
-												Update mergetree.md

TTL examples
											
										
										
											2019-09-06 15:16:14 +00:00
-												WIP on docs translation/normalization tools (#9783)


											
										
										
											2020-03-20 18:20:59 +00:00
+								``` sql
-												Update mergetree.md

TTL examples
											
										
										
											2019-09-06 15:26:51 +00:00
+								ALTER TABLE example_table
-												Update mergetree.md

TTL examples
											
										
										
											2019-09-06 15:16:14 +00:00
+								    MODIFY COLUMN
-												Update mergetree.md

TTL examples / Requested change
											
										
										
											2019-09-06 16:57:23 +00:00
+								    c String TTL d + INTERVAL 1 DAY;
 								```
-												Update mergetree.md

TTL examples
											
										
										
											2019-09-06 15:16:14 +00:00
-												Update mergetree.md

TTL examples / Requested change
											
										
										
											2019-09-06 16:57:23 +00:00
+								Изменение TTL у колонки
-												WIP on docs translation/normalization tools (#9783)


											
										
										
											2020-03-20 18:20:59 +00:00
+								``` sql
-												Update mergetree.md

TTL examples
											
										
										
											2019-09-06 15:26:51 +00:00
+								ALTER TABLE example_table
-												Update mergetree.md

TTL examples
											
										
										
											2019-09-06 15:16:14 +00:00
+								    MODIFY COLUMN
-												Update mergetree.md

TTL examples / Requested change
											
										
										
											2019-09-06 16:57:23 +00:00
+								    c String TTL d + INTERVAL 1 MONTH;
-												Update mergetree.md

TTL examples
											
										
										
											2019-09-06 15:16:14 +00:00
+								```
-												CLICKHOUSEDOCS-446: Tranlsated to Russian. Fixed links in ZH version.

											
										
										
											2020-02-20 14:38:57 +00:00
+								### TTL таблицы {#mergetree-table-ttl}
-												DOCAPI-7062: MySQL database engine and MergeTree TTL docs. EN review, RU translation (#6407)

* Update create.md

* Update mergetree.md

* Update index.md

* Update mysql.md

* DOCAPI-7062: RU translation.

* DOCAPI-7062: Fixes

* Update docs/ru/database_engines/index.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/database_engines/mysql.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/database_engines/mysql.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/database_engines/mysql.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/query_language/create.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* DOCAPI-7062: Clarifications and fixes.

* DOCAPI-7062: Clarifications.

* Update docs/en/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/en/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

											
										
										
											2019-08-14 16:42:09 +00:00
-												Added documentation for extended TTL syntax.

											
										
										
											2019-12-06 06:18:57 +00:00
+								Для таблицы можно задать одно выражение для устаревания данных, а также несколько выражений, по срабатывании которых данные переместятся на [некоторый диск или том](#table_engine-mergetree-multiple-volumes). Когда некоторые данные в таблице устаревают, ClickHouse удаляет все соответствующие строки.
-												WIP on docs translation/normalization tools (#9783)


											
										
										
											2020-03-20 18:20:59 +00:00
+								``` sql
-												better

											
										
										
											2021-06-01 14:23:46 +00:00
+								TTL expr
-												Syntax updated, examples added.

											
										
										
											2021-01-23 18:16:59 +00:00
+								    [DELETE|TO DISK 'xxx'|TO VOLUME 'xxx'][, DELETE|TO DISK 'aaa'|TO VOLUME 'bbb'] ...
-												better

											
										
										
											2021-06-01 14:23:46 +00:00
+								    [WHERE conditions]
 								    [GROUP BY key_expr [SET v1 = aggr_func(v1) [, v2 = aggr_func(v2) ...]] ]
-												Added documentation for extended TTL syntax.

											
										
										
											2019-12-06 06:18:57 +00:00
+								```
 								За каждым TTL выражением может следовать тип действия, которое выполняется после достижения времени, соответствующего результату TTL выражения:
-												[experimental] add "es" docs language as machine translated draft (#9787)

* replace exit with assert in test_single_page

* improve save_raw_single_page docs option

* More grammar fixes

* "Built from" link in new tab

* fix mistype

* Example of include in docs

* add anchor to meeting form

* Draft of translation helper

* WIP on translation helper

* Replace some fa docs content with machine translation

* add normalize-en-markdown.sh

* normalize some en markdown

* normalize some en markdown

* admonition support

* normalize

* normalize

* normalize

* support wide tables

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* lightly edited machine translation of introdpection.md

* lightly edited machhine translation of lazy.md

* WIP on translation utils

* Normalize ru docs

* Normalize other languages

* some fixes

* WIP on normalize/translate tools

* add requirements.txt

* [experimental] add es docs language as machine translated draft

* remove duplicate script

* Back to wider tab-stop (narrow renders not so well)
											
										
										
											2020-03-21 04:11:51 +00:00
+								-   `DELETE` - удалить данные (действие по умолчанию);
 								-   `TO DISK 'aaa'` - переместить данные на диск `aaa`;
-												Fixes

											
										
										
											2021-02-01 23:44:40 +00:00
+								-   `TO VOLUME 'bbb'` - переместить данные на том `bbb`;
 								-   `GROUP BY` -  агрегировать данные.
-												TTL for columns and tables (#4212)

Add TTL for columns and tables.

											
										
										
											2019-04-15 09:30:45 +00:00
-												Fixes

											
										
										
											2021-02-01 23:44:40 +00:00
+								В секции `WHERE` можно задать условие удаления или агрегирования устаревших строк (для перемещения условие `WHERE` не применимо).
-												Syntax updated, examples added.

											
										
										
											2021-01-23 18:16:59 +00:00
-												better

											
										
										
											2021-06-01 14:23:46 +00:00
+								Колонки, по которым агрегируются данные в `GROUP BY`, должны являться префиксом первичного ключа таблицы.
-												Syntax updated, examples added.

											
										
										
											2021-01-23 18:16:59 +00:00
-												Fixes

											
										
										
											2021-02-01 23:44:40 +00:00
+								Если колонка не является частью выражения `GROUP BY` и не задается напрямую в секции `SET`, в результирующих строках она будет содержать случайное значение, взятое из одной из сгруппированных строк (как будто к ней применяется агрегирующая функция `any`).
-												Syntax updated, examples added.

											
										
										
											2021-01-23 18:16:59 +00:00
 								**Примеры**
-												better

											
										
										
											2021-06-01 14:23:46 +00:00
+								Создание таблицы с TTL:
-												Update mergetree.md

TTL examples
											
										
										
											2019-09-06 15:16:14 +00:00
-												WIP on docs translation/normalization tools (#9783)


											
										
										
											2020-03-20 18:20:59 +00:00
+								``` sql
-												Renamed "storage_policy_name" to "storage_policy"

											
										
										
											2019-09-20 20:35:50 +00:00
+								CREATE TABLE example_table
-												Update mergetree.md

TTL examples
											
										
										
											2019-09-06 15:16:14 +00:00
+								(
 								    d DateTime,
 								    a Int
 								)
 								ENGINE = MergeTree
 								PARTITION BY toYYYYMM(d)
 								ORDER BY d
-												Added documentation for extended TTL syntax.

											
										
										
											2019-12-06 06:18:57 +00:00
+								TTL d + INTERVAL 1 MONTH [DELETE],
 								    d + INTERVAL 1 WEEK TO VOLUME 'aaa',
 								    d + INTERVAL 2 WEEK TO DISK 'bbb';
-												Update mergetree.md

TTL examples / Requested change
											
										
										
											2019-09-06 16:57:23 +00:00
+								```
-												Update mergetree.md

TTL examples
											
										
										
											2019-09-06 15:16:14 +00:00
-												Syntax updated, examples added.

											
										
										
											2021-01-23 18:16:59 +00:00
+								Изменение TTL:
-												Update mergetree.md

TTL examples
											
										
										
											2019-09-06 15:16:14 +00:00
-												WIP on docs translation/normalization tools (#9783)


											
										
										
											2020-03-20 18:20:59 +00:00
+								``` sql
-												Update mergetree.md

TTL examples
											
										
										
											2019-09-06 15:26:51 +00:00
+								ALTER TABLE example_table
-												Update mergetree.md

TTL examples / Requested change
											
										
										
											2019-09-06 16:57:23 +00:00
+								    MODIFY TTL d + INTERVAL 1 DAY;
-												Update mergetree.md

TTL examples
											
										
										
											2019-09-06 15:16:14 +00:00
+								```
-												TTL for columns and tables (#4212)

Add TTL for columns and tables.

											
										
										
											2019-04-15 09:30:45 +00:00
-												Syntax updated, examples added.

											
										
										
											2021-01-23 18:16:59 +00:00
+								Создание таблицы, в которой строки устаревают через месяц. Устаревшие строки удаляются, если дата выпадает на понедельник:
 								``` sql
 								CREATE TABLE table_with_where
 								(
-												better

											
										
										
											2021-06-01 14:23:46 +00:00
+								    d DateTime,
-												Syntax updated, examples added.

											
										
										
											2021-01-23 18:16:59 +00:00
+								    a Int
 								)
 								ENGINE = MergeTree
 								PARTITION BY toYYYYMM(d)
 								ORDER BY d
 								TTL d + INTERVAL 1 MONTH DELETE WHERE toDayOfWeek(d) = 1;
 								```
 								Создание таблицы, где устаревшие строки агрегируются. В результирующих строках колонка `x` содержит максимальное значение по сгруппированным строкам, `y` — минимальное значение, а `d` — случайное значение из одной из сгуппированных строк.
 								``` sql
 								CREATE TABLE table_for_aggregation
 								(
-												better

											
										
										
											2021-06-01 14:23:46 +00:00
+								    d DateTime,
 								    k1 Int,
 								    k2 Int,
 								    x Int,
-												Syntax updated, examples added.

											
										
										
											2021-01-23 18:16:59 +00:00
+								    y Int
 								)
 								ENGINE = MergeTree
-												Fix ORDER BY syntax
											
										
										
											2021-03-12 18:13:20 +00:00
+								ORDER BY (k1, k2)
-												Syntax updated, examples added.

											
										
										
											2021-01-23 18:16:59 +00:00
+								TTL d + INTERVAL 1 MONTH GROUP BY k1, k2 SET x = max(x), y = min(y);
 								```
-												DOCAPI-7062: MySQL database engine and MergeTree TTL docs. EN review, RU translation (#6407)

* Update create.md

* Update mergetree.md

* Update index.md

* Update mysql.md

* DOCAPI-7062: RU translation.

* DOCAPI-7062: Fixes

* Update docs/ru/database_engines/index.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/database_engines/mysql.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/database_engines/mysql.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/database_engines/mysql.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/query_language/create.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* DOCAPI-7062: Clarifications and fixes.

* DOCAPI-7062: Clarifications.

* Update docs/en/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/en/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

											
										
										
											2019-08-14 16:42:09 +00:00
+								**Удаление данных**
-												TTL for columns and tables (#4212)

Add TTL for columns and tables.

											
										
										
											2019-04-15 09:30:45 +00:00
-												DOCAPI-7062: MySQL database engine and MergeTree TTL docs. EN review, RU translation (#6407)

* Update create.md

* Update mergetree.md

* Update index.md

* Update mysql.md

* DOCAPI-7062: RU translation.

* DOCAPI-7062: Fixes

* Update docs/ru/database_engines/index.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/database_engines/mysql.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/database_engines/mysql.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/database_engines/mysql.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/query_language/create.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* DOCAPI-7062: Clarifications and fixes.

* DOCAPI-7062: Clarifications.

* Update docs/en/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/en/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

											
										
										
											2019-08-14 16:42:09 +00:00
+								Данные с истекшим TTL удаляются, когда ClickHouse мёржит куски данных.
-												TTL for columns and tables (#4212)

Add TTL for columns and tables.

											
										
										
											2019-04-15 09:30:45 +00:00
-												DOCS-624: Fixing links to nowhere (#10675)

* enbaskakova-DOCSUP-652 (#101)

* "docs(orNull&orDefault): Functions 'orNull&orDefault' have been edited"

* "docs(orNull&orDefault): Functions 'orNull&orDefault' have been edited"

* "docs(orNull&orDefault): Functions 'orNull&orDefault' have been edited"

* Update docs/en/sql_reference/aggregate_functions/combinators.md

Co-Authored-By: BayoNet <da-daos@yandex.ru>

* Update docs/en/sql_reference/aggregate_functions/combinators.md

Co-Authored-By: BayoNet <da-daos@yandex.ru>

* Update docs/en/sql_reference/aggregate_functions/combinators.md

Co-Authored-By: BayoNet <da-daos@yandex.ru>

* Update docs/en/sql_reference/aggregate_functions/combinators.md

Co-Authored-By: BayoNet <da-daos@yandex.ru>

* Update docs/en/sql_reference/aggregate_functions/combinators.md

Co-Authored-By: BayoNet <da-daos@yandex.ru>

* "docs(orNull&orDefault): Functions 'orNull&orDefault' have been edited"

* "docs(orNull&orDefault): Functions 'orNull&orDefault' have been edited"

* "docs(orNull&orDefault): Functions 'orNull&orDefault' have been edited"

Co-authored-by: elenbaskakova <elenbaskakova@yandex-team.ru>
Co-authored-by: BayoNet <da-daos@yandex.ru>

* Revert "enbaskakova-DOCSUP-652 (#101)" (#107)

This reverts commit 639fee7610f28e421d14e535b7def3f466e7efca.

* CLICKHOUSEDOCS-624: Fixed links. Was 60, became 13.

* CLICKHOUSEDOCS-624: Finished fix links in Enlish version.

* CLICKHOUSEDOCS-624: Fixed RU links

Co-authored-by: elenaspb2019 <47083263+elenaspb2019@users.noreply.github.com>
Co-authored-by: elenbaskakova <elenbaskakova@yandex-team.ru>
Co-authored-by: Sergei Shtykov <bayonet@yandex-team.ru>
											
										
										
											2020-05-06 06:13:29 +00:00
+								Когда ClickHouse видит, что некоторые данные устарели, он выполняет внеплановые мёржи. Для управление частотой подобных мёржей, можно задать настройку `merge_with_ttl_timeout`. Если её значение слишком низкое, придется выполнять много внеплановых мёржей, которые могут начать потреблять значительную долю ресурсов сервера.
-												TTL for columns and tables (#4212)

Add TTL for columns and tables.

											
										
										
											2019-04-15 09:30:45 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								Если вы выполните запрос `SELECT` между слияниями вы можете получить устаревшие данные. Чтобы избежать этого используйте запрос [OPTIMIZE](../../../engines/table-engines/mergetree-family/mergetree.md#misc_operations-optimize) перед `SELECT`.
-												TTL for columns and tables (#4212)

Add TTL for columns and tables.

											
										
										
											2019-04-15 09:30:45 +00:00
-												Restore some old manual anchors in docs (#9803)

* Simplify 404 page

* add es array_functions.md

* restore some old manual anchors

* update sitemaps

* trigger checks

* restore more old manual anchors

* refactor test.md + temporary disable failure again

* fix mistype
											
										
										
											2020-03-22 09:14:59 +00:00
+								## Хранение данных таблицы на нескольких блочных устройствах {#table_engine-mergetree-multiple-volumes}
-												Add ru docs (first version)

											
										
										
											2019-09-12 17:31:19 +00:00
-												First commit

											
										
										
											2021-03-06 11:13:14 +00:00
+								### Введение {#introduction}
-												DOCS-439: RU review. EN translation. Data storage policies. (#7597)

* CLICKHOUSEDOCS-439: RU review. EN translation.

* Update docs/en/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/en/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/en/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/en/query_language/alter.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* CLICKHOUSEDOCS-439: The RU version is syncronized with EN.

											
										
										
											2019-11-07 12:24:42 +00:00
-												WIP on docs translation/normalization tools (#9783)


											
										
										
											2020-03-20 18:20:59 +00:00
+								Движки таблиц семейства `MergeTree` могут хранить данные на нескольких блочных устройствах. Это может оказаться полезным, например, при неявном разделении данных одной таблицы на «горячие» и «холодные». Наиболее свежая часть занимает малый объём и запрашивается регулярно, а большой хвост исторических данных запрашивается редко. При наличии в системе нескольких дисков, «горячая» часть данных может быть размещена на быстрых дисках (например, на NVMe SSD или в памяти), а холодная на более медленных (например, HDD).
-												Better docs

											
										
										
											2019-09-13 10:44:10 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								Минимальной перемещаемой единицей для `MergeTree` является кусок данных (data part). Данные одного куска могут находится только на одном диске. Куски могут перемещаться между дисками в фоне, согласно пользовательским настройкам, а также с помощью запросов [ALTER](../../../engines/table-engines/mergetree-family/mergetree.md#alter_move-partition).
-												Add ru docs (first version)

											
										
										
											2019-09-12 17:31:19 +00:00
-												First commit

											
										
										
											2021-03-06 11:13:14 +00:00
+								### Термины {#terms}
-												Add ru docs (first version)

											
										
										
											2019-09-12 17:31:19 +00:00
-												[experimental] add "es" docs language as machine translated draft (#9787)

* replace exit with assert in test_single_page

* improve save_raw_single_page docs option

* More grammar fixes

* "Built from" link in new tab

* fix mistype

* Example of include in docs

* add anchor to meeting form

* Draft of translation helper

* WIP on translation helper

* Replace some fa docs content with machine translation

* add normalize-en-markdown.sh

* normalize some en markdown

* normalize some en markdown

* admonition support

* normalize

* normalize

* normalize

* support wide tables

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* lightly edited machine translation of introdpection.md

* lightly edited machhine translation of lazy.md

* WIP on translation utils

* Normalize ru docs

* Normalize other languages

* some fixes

* WIP on normalize/translate tools

* add requirements.txt

* [experimental] add es docs language as machine translated draft

* remove duplicate script

* Back to wider tab-stop (narrow renders not so well)
											
										
										
											2020-03-21 04:11:51 +00:00
+								-   Диск — примонтированное в файловой системе блочное устройство.
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								-   Диск по умолчанию — диск, на котором находится путь, указанный в конфигурационной настройке сервера [path](../../../operations/server-configuration-parameters/settings.md#server_configuration_parameters-path).
-												[experimental] add "es" docs language as machine translated draft (#9787)

* replace exit with assert in test_single_page

* improve save_raw_single_page docs option

* More grammar fixes

* "Built from" link in new tab

* fix mistype

* Example of include in docs

* add anchor to meeting form

* Draft of translation helper

* WIP on translation helper

* Replace some fa docs content with machine translation

* add normalize-en-markdown.sh

* normalize some en markdown

* normalize some en markdown

* admonition support

* normalize

* normalize

* normalize

* support wide tables

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* lightly edited machine translation of introdpection.md

* lightly edited machhine translation of lazy.md

* WIP on translation utils

* Normalize ru docs

* Normalize other languages

* some fixes

* WIP on normalize/translate tools

* add requirements.txt

* [experimental] add es docs language as machine translated draft

* remove duplicate script

* Back to wider tab-stop (narrow renders not so well)
											
										
										
											2020-03-21 04:11:51 +00:00
+								-   Том (Volume) — упорядоченный набор равноценных дисков (схоже с [JBOD](https://ru.wikipedia.org/wiki/JBOD))
 								-   Политика хранения (StoragePolicy) — множество томов с правилами перемещения данных между ними.
-												DOCS-439: RU review. EN translation. Data storage policies. (#7597)

* CLICKHOUSEDOCS-439: RU review. EN translation.

* Update docs/en/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/en/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/en/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/en/query_language/alter.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* CLICKHOUSEDOCS-439: The RU version is syncronized with EN.

											
										
										
											2019-11-07 12:24:42 +00:00
-												Fix broken links in docs

											
										
										
											2020-10-13 17:23:29 +00:00
+								У всех описанных сущностей при создании указываются имена, можно найти в системных таблицах [system.storage_policies](../../../engines/table-engines/mergetree-family/mergetree.md#system_tables-storage_policies) и [system.disks](../../../engines/table-engines/mergetree-family/mergetree.md#system_tables-disks). Имя политики хранения можно указать в настройке `storage_policy` движков таблиц семейства `MergeTree`.
-												Add ru docs (first version)

											
										
										
											2019-09-12 17:31:19 +00:00
-												DOCS-624: Fixing links to nowhere (#10675)

* enbaskakova-DOCSUP-652 (#101)

* "docs(orNull&orDefault): Functions 'orNull&orDefault' have been edited"

* "docs(orNull&orDefault): Functions 'orNull&orDefault' have been edited"

* "docs(orNull&orDefault): Functions 'orNull&orDefault' have been edited"

* Update docs/en/sql_reference/aggregate_functions/combinators.md

Co-Authored-By: BayoNet <da-daos@yandex.ru>

* Update docs/en/sql_reference/aggregate_functions/combinators.md

Co-Authored-By: BayoNet <da-daos@yandex.ru>

* Update docs/en/sql_reference/aggregate_functions/combinators.md

Co-Authored-By: BayoNet <da-daos@yandex.ru>

* Update docs/en/sql_reference/aggregate_functions/combinators.md

Co-Authored-By: BayoNet <da-daos@yandex.ru>

* Update docs/en/sql_reference/aggregate_functions/combinators.md

Co-Authored-By: BayoNet <da-daos@yandex.ru>

* "docs(orNull&orDefault): Functions 'orNull&orDefault' have been edited"

* "docs(orNull&orDefault): Functions 'orNull&orDefault' have been edited"

* "docs(orNull&orDefault): Functions 'orNull&orDefault' have been edited"

Co-authored-by: elenbaskakova <elenbaskakova@yandex-team.ru>
Co-authored-by: BayoNet <da-daos@yandex.ru>

* Revert "enbaskakova-DOCSUP-652 (#101)" (#107)

This reverts commit 639fee7610f28e421d14e535b7def3f466e7efca.

* CLICKHOUSEDOCS-624: Fixed links. Was 60, became 13.

* CLICKHOUSEDOCS-624: Finished fix links in Enlish version.

* CLICKHOUSEDOCS-624: Fixed RU links

Co-authored-by: elenaspb2019 <47083263+elenaspb2019@users.noreply.github.com>
Co-authored-by: elenbaskakova <elenbaskakova@yandex-team.ru>
Co-authored-by: Sergei Shtykov <bayonet@yandex-team.ru>
											
										
										
											2020-05-06 06:13:29 +00:00
+								### Конфигурация {#table_engine-mergetree-multiple-volumes_configure}
-												Add ru docs (first version)

											
										
										
											2019-09-12 17:31:19 +00:00
-												WIP on docs translation/normalization tools (#9783)


											
										
										
											2020-03-20 18:20:59 +00:00
+								Диски, тома и политики хранения задаются внутри тега `<storage_configuration>` в основном файле `config.xml` или в отдельном файле в директории `config.d`.
-												DOCS-439: RU review. EN translation. Data storage policies. (#7597)

* CLICKHOUSEDOCS-439: RU review. EN translation.

* Update docs/en/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/en/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/en/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/en/query_language/alter.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* CLICKHOUSEDOCS-439: The RU version is syncronized with EN.

											
										
										
											2019-11-07 12:24:42 +00:00
 								Структура конфигурации:
-												Add ru docs (first version)

											
										
										
											2019-09-12 17:31:19 +00:00
-												WIP on docs translation/normalization tools (#9783)


											
										
										
											2020-03-20 18:20:59 +00:00
+								``` xml
-												Doc change. mergetree.md Added storage_configuration tag into examples (#8518)

* Update mergetree.md

added storage_configuration tag into examples

* Update mergetree.md

added storage_configuration tag to examples

											
										
										
											2020-01-04 15:43:15 +00:00
+								<storage_configuration>
 								    <disks>
 								        <disk_name_1> <!-- disk name -->
-												path должен быть терминирован `/`.
											
										
										
											2020-04-02 09:30:52 +00:00
+								            <path>/mnt/fast_ssd/clickhouse/</path>
-												Doc change. mergetree.md Added storage_configuration tag into examples (#8518)

* Update mergetree.md

added storage_configuration tag into examples

* Update mergetree.md

added storage_configuration tag to examples

											
										
										
											2020-01-04 15:43:15 +00:00
+								        </disk_name_1>
 								        <disk_name_2>
-												path должен быть терминирован `/`.
											
										
										
											2020-04-02 09:30:52 +00:00
+								            <path>/mnt/hdd1/clickhouse/</path>
-												Doc change. mergetree.md Added storage_configuration tag into examples (#8518)

* Update mergetree.md

added storage_configuration tag into examples

* Update mergetree.md

added storage_configuration tag to examples

											
										
										
											2020-01-04 15:43:15 +00:00
+								            <keep_free_space_bytes>10485760</keep_free_space_bytes>
 								        </disk_name_2>
 								        <disk_name_3>
-												path должен быть терминирован `/`.
											
										
										
											2020-04-02 09:30:52 +00:00
+								            <path>/mnt/hdd2/clickhouse/</path>
-												Doc change. mergetree.md Added storage_configuration tag into examples (#8518)

* Update mergetree.md

added storage_configuration tag into examples

* Update mergetree.md

added storage_configuration tag to examples

											
										
										
											2020-01-04 15:43:15 +00:00
+								            <keep_free_space_bytes>10485760</keep_free_space_bytes>
 								        </disk_name_3>
 								        ...
 								    </disks>
-												WIP on docs translation/normalization tools (#9783)


											
										
										
											2020-03-20 18:20:59 +00:00
-												Add ru docs (first version)

											
										
										
											2019-09-12 17:31:19 +00:00
+								    ...
-												Doc change. mergetree.md Added storage_configuration tag into examples (#8518)

* Update mergetree.md

added storage_configuration tag into examples

* Update mergetree.md

added storage_configuration tag to examples

											
										
										
											2020-01-04 15:43:15 +00:00
+								</storage_configuration>
-												Add ru docs (first version)

											
										
										
											2019-09-12 17:31:19 +00:00
+								```
-												Better docs

											
										
										
											2019-09-13 13:15:19 +00:00
-												DOCS-439: RU review. EN translation. Data storage policies. (#7597)

* CLICKHOUSEDOCS-439: RU review. EN translation.

* Update docs/en/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/en/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/en/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/en/query_language/alter.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* CLICKHOUSEDOCS-439: The RU version is syncronized with EN.

											
										
										
											2019-11-07 12:24:42 +00:00
+								Теги:
-												Better docs

											
										
										
											2019-09-13 13:15:19 +00:00
-												[experimental] add "es" docs language as machine translated draft (#9787)

* replace exit with assert in test_single_page

* improve save_raw_single_page docs option

* More grammar fixes

* "Built from" link in new tab

* fix mistype

* Example of include in docs

* add anchor to meeting form

* Draft of translation helper

* WIP on translation helper

* Replace some fa docs content with machine translation

* add normalize-en-markdown.sh

* normalize some en markdown

* normalize some en markdown

* admonition support

* normalize

* normalize

* normalize

* support wide tables

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* lightly edited machine translation of introdpection.md

* lightly edited machhine translation of lazy.md

* WIP on translation utils

* Normalize ru docs

* Normalize other languages

* some fixes

* WIP on normalize/translate tools

* add requirements.txt

* [experimental] add es docs language as machine translated draft

* remove duplicate script

* Back to wider tab-stop (narrow renders not so well)
											
										
										
											2020-03-21 04:11:51 +00:00
+								-   `<disk_name_N>` — имя диска. Имена должны быть разными для всех дисков.
 								-   `path` — путь по которому будут храниться данные сервера (каталоги `data` и `shadow`), должен быть терминирован `/`.
 								-   `keep_free_space_bytes` — размер зарезервированного свободного места на диске.
-												Add ru docs (first version)

											
										
										
											2019-09-12 17:31:19 +00:00
 								Порядок задания дисков не имеет значения.
-												DOCS-439: RU review. EN translation. Data storage policies. (#7597)

* CLICKHOUSEDOCS-439: RU review. EN translation.

* Update docs/en/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/en/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/en/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/en/query_language/alter.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* CLICKHOUSEDOCS-439: The RU version is syncronized with EN.

											
										
										
											2019-11-07 12:24:42 +00:00
+								Общий вид конфигурации политик хранения:
-												WIP on docs translation/normalization tools (#9783)


											
										
										
											2020-03-20 18:20:59 +00:00
+								``` xml
-												Doc change. mergetree.md Added storage_configuration tag into examples (#8518)

* Update mergetree.md

added storage_configuration tag into examples

* Update mergetree.md

added storage_configuration tag to examples

											
										
										
											2020-01-04 15:43:15 +00:00
+								<storage_configuration>
 								    ...
 								    <policies>
 								        <policy_name_1>
 								            <volumes>
 								                <volume_name_1>
 								                    <disk>disk_name_from_disks_configuration</disk>
 								                    <max_data_part_size_bytes>1073741824</max_data_part_size_bytes>
 								                </volume_name_1>
 								                <volume_name_2>
 								                    <!-- configuration -->
 								                </volume_name_2>
 								                <!-- more volumes -->
 								            </volumes>
 								            <move_factor>0.2</move_factor>
 								        </policy_name_1>
 								        <policy_name_2>
 								            <!-- configuration -->
 								        </policy_name_2>
 								        <!-- more policies -->
 								    </policies>
 								    ...
 								</storage_configuration>
-												DOCS-439: RU review. EN translation. Data storage policies. (#7597)

* CLICKHOUSEDOCS-439: RU review. EN translation.

* Update docs/en/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/en/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/en/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/en/query_language/alter.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* CLICKHOUSEDOCS-439: The RU version is syncronized with EN.

											
										
										
											2019-11-07 12:24:42 +00:00
+								```
 								Тэги:
-												[experimental] add "es" docs language as machine translated draft (#9787)

* replace exit with assert in test_single_page

* improve save_raw_single_page docs option

* More grammar fixes

* "Built from" link in new tab

* fix mistype

* Example of include in docs

* add anchor to meeting form

* Draft of translation helper

* WIP on translation helper

* Replace some fa docs content with machine translation

* add normalize-en-markdown.sh

* normalize some en markdown

* normalize some en markdown

* admonition support

* normalize

* normalize

* normalize

* support wide tables

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* lightly edited machine translation of introdpection.md

* lightly edited machhine translation of lazy.md

* WIP on translation utils

* Normalize ru docs

* Normalize other languages

* some fixes

* WIP on normalize/translate tools

* add requirements.txt

* [experimental] add es docs language as machine translated draft

* remove duplicate script

* Back to wider tab-stop (narrow renders not so well)
											
										
										
											2020-03-21 04:11:51 +00:00
+								-   `policy_name_N` — название политики. Названия политик должны быть уникальны.
 								-   `volume_name_N` — название тома. Названия томов должны быть уникальны.
 								-   `disk` — диск, находящийся внутри тома.
 								-   `max_data_part_size_bytes` — максимальный размер куска данных, который может находится на любом из дисков этого тома.
-												Update mergetree.md

описание move_factor
											
										
										
											2020-09-21 08:14:37 +00:00
+								-   `move_factor` — доля доступного свободного места на томе, если места становится меньше, то данные начнут перемещение на следующий том, если он есть (по умолчанию 0.1).
-												DOCSUP-3871: Document prefer_not_to_merge option (#17090)

* Init commit

* Translation

* Fixed

* Fixed

* Fixed

* Fixed
											
										
										
											2020-12-02 19:03:24 +00:00
+								-   `prefer_not_to_merge` — Отключает слияние кусков данных, хранящихся на данном томе. Если данная настройка включена, то слияние данных, хранящихся на данном томе, не допускается. Это позволяет контролировать работу ClickHouse с медленными дисками.
-												DOCS-439: RU review. EN translation. Data storage policies. (#7597)

* CLICKHOUSEDOCS-439: RU review. EN translation.

* Update docs/en/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/en/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/en/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/en/query_language/alter.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* CLICKHOUSEDOCS-439: The RU version is syncronized with EN.

											
										
										
											2019-11-07 12:24:42 +00:00
 								Примеры конфигураций:
-												Add ru docs (first version)

											
										
										
											2019-09-12 17:31:19 +00:00
-												WIP on docs translation/normalization tools (#9783)


											
										
										
											2020-03-20 18:20:59 +00:00
+								``` xml
-												Doc change. mergetree.md Added storage_configuration tag into examples (#8518)

* Update mergetree.md

added storage_configuration tag into examples

* Update mergetree.md

added storage_configuration tag to examples

											
										
										
											2020-01-04 15:43:15 +00:00
+								<storage_configuration>
 								    ...
 								    <policies>
 								        <hdd_in_order> <!-- policy name -->
 								            <volumes>
 								                <single> <!-- volume name -->
 								                    <disk>disk1</disk>
 								                    <disk>disk2</disk>
 								                </single>
 								            </volumes>
 								        </hdd_in_order>
 								        <moving_from_ssd_to_hdd>
 								            <volumes>
 								                <hot>
 								                    <disk>fast_ssd</disk>
 								                    <max_data_part_size_bytes>1073741824</max_data_part_size_bytes>
 								                </hot>
 								                <cold>
 								                    <disk>disk1</disk>
-												WIP on docs translation/normalization tools (#9783)


											
										
										
											2020-03-20 18:20:59 +00:00
+								                </cold>
-												Doc change. mergetree.md Added storage_configuration tag into examples (#8518)

* Update mergetree.md

added storage_configuration tag into examples

* Update mergetree.md

added storage_configuration tag to examples

											
										
										
											2020-01-04 15:43:15 +00:00
+								            </volumes>
 								            <move_factor>0.2</move_factor>
 								        </moving_from_ssd_to_hdd>
-												DOCSUP-3871: Document prefer_not_to_merge option (#17090)

* Init commit

* Translation

* Fixed

* Fixed

* Fixed

* Fixed
											
										
										
											2020-12-02 19:03:24 +00:00
 										<small_jbod_with_external_no_merges>
 								            <volumes>
 								                <main>
 								                    <disk>jbod1</disk>
 								                </main>
 								                <external>
 								                    <disk>external</disk>
 								                    <prefer_not_to_merge>true</prefer_not_to_merge>
 								                </external>
 								            </volumes>
 								        </small_jbod_with_external_no_merges>
-												Doc change. mergetree.md Added storage_configuration tag into examples (#8518)

* Update mergetree.md

added storage_configuration tag into examples

* Update mergetree.md

added storage_configuration tag to examples

											
										
										
											2020-01-04 15:43:15 +00:00
+								    </policies>
 								    ...
 								</storage_configuration>
-												Add ru docs (first version)

											
										
										
											2019-09-12 17:31:19 +00:00
+								```
-												DOCS-439: RU review. EN translation. Data storage policies. (#7597)

* CLICKHOUSEDOCS-439: RU review. EN translation.

* Update docs/en/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/en/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/en/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/en/query_language/alter.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* CLICKHOUSEDOCS-439: The RU version is syncronized with EN.

											
										
										
											2019-11-07 12:24:42 +00:00
+								В приведенном примере, политика `hdd_in_order` реализует прицип [round-robin](https://ru.wikipedia.org/wiki/Round-robin_(%D0%B0%D0%BB%D0%B3%D0%BE%D1%80%D0%B8%D1%82%D0%BC)). Так как в политике есть всего один том (`single`), то все записи производятся на его диски по круговому циклу. Такая политика может быть полезна при наличии в системе нескольких похожих дисков, но при этом не сконфигурирован RAID. Учтите, что каждый отдельный диск ненадёжен и чтобы не потерять важные данные это необходимо скомпенсировать за счет хранения данных в трёх копиях.
-												Add ru docs (first version)

											
										
										
											2019-09-12 17:31:19 +00:00
-												WIP on docs translation/normalization tools (#9783)


											
										
										
											2020-03-20 18:20:59 +00:00
+								Если система содержит диски различных типов, то может пригодиться политика `moving_from_ssd_to_hdd`. В томе `hot` находится один SSD-диск (`fast_ssd`), а также задается ограничение на максимальный размер куска, который может храниться на этом томе (1GB). Все куски такой таблицы больше 1GB будут записываться сразу на том `cold`, в котором содержится один HDD-диск `disk1`. Также, при заполнении диска `fast_ssd` более чем на 80% данные будут переносится на диск `disk1` фоновым процессом.
-												Better docs

											
										
										
											2019-09-13 13:15:19 +00:00
-												Better docs

											
										
										
											2019-09-13 10:44:10 +00:00
+								Порядок томов в политиках хранения важен, при достижении условий на переполнение тома данные переносятся на следующий. Порядок дисков в томах так же важен, данные пишутся по очереди на каждый из них.
-												Add ru docs (first version)

											
										
										
											2019-09-12 17:31:19 +00:00
-												Fix documentation on the tiered storage

Only storage policies can be set upon table creation. While disks
must be defined in order to configure a storage policy, this logically
follows from the above paragraph and does not need to be explicitly
repeated.

											
										
										
											2019-10-17 14:47:52 +00:00
+								После задания конфигурации политик хранения их можно использовать, как настройку при создании таблиц:
-												Add ru docs (first version)

											
										
										
											2019-09-12 17:31:19 +00:00
-												WIP on docs translation/normalization tools (#9783)


											
										
										
											2020-03-20 18:20:59 +00:00
+								``` sql
-												Add ru docs (first version)

											
										
										
											2019-09-12 17:31:19 +00:00
+								CREATE TABLE table_with_non_default_policy (
 								    EventDate Date,
 								    OrderID UInt64,
 								    BannerID UInt64,
 								    SearchPhrase String
-												Renamed "storage_policy_name" to "storage_policy"

											
										
										
											2019-09-20 20:35:50 +00:00
+								) ENGINE = MergeTree
-												Add ru docs (first version)

											
										
										
											2019-09-12 17:31:19 +00:00
+								ORDER BY (OrderID, BannerID)
 								PARTITION BY toYYYYMM(EventDate)
-												Renamed "storage_policy_name" to "storage_policy"

											
										
										
											2019-09-20 20:35:50 +00:00
+								SETTINGS storage_policy = 'moving_from_ssd_to_hdd'
-												Add ru docs (first version)

											
										
										
											2019-09-12 17:31:19 +00:00
+								```
-												Update change storage policy doc
											
										
										
											2021-06-17 08:46:42 +00:00
+								По умолчанию используется политика хранения `default` в которой есть один том и один диск, указанный в `<path>`.
 								Изменить политику хранения после создания таблицы можно при помощи запроса [ALTER TABLE ... MODIFY SETTING]. При этом необходимо учесть, что новая политика должна содержать все тома и диски предыдущей политики с теми же именами.
-												Add ru docs (first version)

											
										
										
											2019-09-12 17:31:19 +00:00
-												DOCS-620: Background pools settings (#11358)

* DOCSUP-1036: Describe settings for different pools (#118)

* describe settings for different pools

* minor changes

* add refs to and from distributed, server settings, kafka, replication, mergetree

* changes in links description

* add description and links to RU version

* add descrtiption and links to ru version

* minor changes

* CLICKHOUSEDOCS-620: Returned text lost by the last merge.

Co-authored-by: Evgenia Sudarikova <56156889+otrazhenia@users.noreply.github.com>
Co-authored-by: Sergei Shtykov <bayonet@yandex-team.ru>
											
										
										
											2020-06-02 18:11:56 +00:00
+								Количество потоков для фоновых перемещений кусков между дисками можно изменить с помощью настройки [background_move_pool_size](../../../operations/settings/settings.md#background_move_pool_size)
-												Headers order changed

											
										
										
											2021-03-12 10:00:46 +00:00
+								### Особенности работы {#details}
 								В таблицах `MergeTree` данные попадают на диск несколькими способами:
 								-   В результате вставки (запрос `INSERT`).
 								-   В фоновых операциях слияний и [мутаций](../../../sql-reference/statements/alter/index.md#mutations).
 								-   При скачивании данных с другой реплики.
 								-   В результате заморозки партиций [ALTER TABLE … FREEZE PARTITION](../../../engines/table-engines/mergetree-family/mergetree.md#alter_freeze-partition).
 								Во всех случаях, кроме мутаций и заморозки партиций, при записи куска выбирается том и диск в соответствии с указанной конфигурацией хранилища:
 .  Выбирается первый по порядку том, на котором есть свободное место для записи куска (`unreserved_space > current_part_size`) и который позволяет записывать куски требуемого размера `max_data_part_size_bytes > current_part_size`.
 .  Внутри тома выбирается следующий диск после того, на который была предыдущая запись и на котором свободного места больше чем размер куска (`unreserved_space - keep_free_space_bytes > current_part_size`)
 								Мутации и запросы заморозки партиций в реализации используют [жесткие ссылки](https://ru.wikipedia.org/wiki/%D0%96%D1%91%D1%81%D1%82%D0%BA%D0%B0%D1%8F_%D1%81%D1%81%D1%8B%D0%BB%D0%BA%D0%B0). Жесткие ссылки между различными дисками не поддерживаются, поэтому в случае таких операций куски размещаются на тех же дисках, что и исходные.
 								В фоне куски перемещаются между томами на основе информации о занятом месте (настройка `move_factor`) по порядку, в котором указаны тома в конфигурации. Данные никогда не перемещаются с последнего тома и на первый том. Следить за фоновыми перемещениями можно с помощью системных таблиц [system.part_log](../../../engines/table-engines/mergetree-family/mergetree.md#system_tables-part-log) (поле `type = MOVE_PART`) и [system.parts](../../../engines/table-engines/mergetree-family/mergetree.md#system_tables-parts) (поля `path` и `disk`). Также подробная информация о перемещениях доступна в логах сервера.
 								С помощью запроса [ALTER TABLE … MOVE PART\|PARTITION … TO VOLUME\|DISK …](../../../engines/table-engines/mergetree-family/mergetree.md#alter_move-partition) пользователь может принудительно перенести кусок или партицию с одного раздела на другой. При этом учитываются все ограничения, указанные для фоновых операций. Запрос самостоятельно инициирует процесс перемещения не дожидаясь фоновых операций. В случае недостатка места или неудовлетворения ограничениям пользователь получит сообщение об ошибке.
 								Перемещения данных не взаимодействуют с репликацией данных, поэтому на разных репликах одной и той же таблицы могут быть указаны разные политики хранения.
 								После выполнения фоновых слияний или мутаций старые куски не удаляются сразу, а через некоторое время (табличная настройка `old_parts_lifetime`). Также они не перемещаются на другие тома или диски, поэтому до момента удаления они продолжают учитываться при подсчёте занятого дискового пространства.
-												First commit

											
										
										
											2021-03-06 11:13:14 +00:00
+								## Использование сервиса S3 для хранения данных {#table_engine-mergetree-s3}
-												Apply suggestions from code review

Co-authored-by: Nikita Mikhaylov <mikhaylovnikitka@gmail.com>
											
										
										
											2021-03-12 02:12:28 +00:00
+								Таблицы семейства `MergeTree` могут хранить данные в сервисе [S3](https://aws.amazon.com/s3/) при использовании диска типа `s3`.
-												First commit

											
										
										
											2021-03-06 11:13:14 +00:00
 								Конфигурация:
 								``` xml
 								<storage_configuration>
 								    ...
 								    <disks>
 								        <s3>
 								            <type>s3</type>
 								            <endpoint>https://storage.yandexcloud.net/my-bucket/root-path/</endpoint>
 								            <access_key_id>your_access_key_id</access_key_id>
 								            <secret_access_key>your_secret_access_key</secret_access_key>
-												Added S3 `region` to documentation.

											
										
										
											2021-05-01 17:41:31 +00:00
+								            <region></region>
-												First commit

											
										
										
											2021-03-06 11:13:14 +00:00
+								            <proxy>
 								                <uri>http://proxy1</uri>
 								                <uri>http://proxy2</uri>
 								            </proxy>
 								            <connect_timeout_ms>10000</connect_timeout_ms>
 								            <request_timeout_ms>5000</request_timeout_ms>
 								            <retry_attempts>10</retry_attempts>
-												better

											
										
										
											2021-06-01 14:23:46 +00:00
+								            <single_read_retries>4</single_read_retries>
-												First commit

											
										
										
											2021-03-06 11:13:14 +00:00
+								            <min_bytes_for_seek>1000</min_bytes_for_seek>
 								            <metadata_path>/var/lib/clickhouse/disks/s3/</metadata_path>
 								            <cache_enabled>true</cache_enabled>
 								            <cache_path>/var/lib/clickhouse/disks/s3/cache/</cache_path>
 								            <skip_access_check>false</skip_access_check>
 								        </s3>
 								    </disks>
 								    ...
 								</storage_configuration>
 								```
 								Обязательные параметры:
-												Minor fixes

											
										
										
											2021-03-06 11:55:17 +00:00
-												Fix endpoint parameter

Поправил описание параметра endpoint.

											
										
										
											2021-07-26 19:23:32 +00:00
+								-   `endpoint` — URL точки приема запроса на стороне S3 в [форматах](https://docs.aws.amazon.com/AmazonS3/latest/userguide/VirtualHosting.html) `path` или `virtual hosted`. URL точки должен содержать бакет и путь к корневой директории на сервере, где хранятся данные.
-												better

											
										
										
											2021-06-01 14:23:46 +00:00
+								-   `access_key_id` — id ключа доступа к S3.
-												First commit

											
										
										
											2021-03-06 11:13:14 +00:00
+								-   `secret_access_key` — секретный ключ доступа к S3.
-												better

											
										
										
											2021-06-01 14:23:46 +00:00
+								Необязательные параметры:
-												Minor fixes

											
										
										
											2021-03-06 11:55:17 +00:00
-												Added S3 `region` to documentation.

											
										
										
											2021-05-01 17:41:31 +00:00
+								-   `region` — название региона S3.
-												Removed STS client.

											
										
										
											2021-03-30 00:32:26 +00:00
+								-   `use_environment_credentials` — признак, нужно ли считывать учетные данные AWS из сетевого окружения, а также из переменных окружения `AWS_ACCESS_KEY_ID`, `AWS_SECRET_ACCESS_KEY` и `AWS_SESSION_TOKEN`, если они есть. Значение по умолчанию: `false`.
 								-   `use_insecure_imds_request` — признак, нужно ли использовать менее безопасное соединение при выполнении запроса к IMDS при получении учётных данных из метаданных Amazon EC2. Значение по умолчанию: `false`.
-												better

											
										
										
											2021-06-01 14:23:46 +00:00
+								-   `proxy` — конфигурация прокси-сервера для конечной точки S3. Каждый элемент `uri` внутри блока `proxy` должен содержать URL прокси-сервера.
 								-   `connect_timeout_ms` — таймаут подключения к сокету в миллисекундах. Значение по умолчанию: 10 секунд.
 								-   `request_timeout_ms` — таймаут выполнения запроса в миллисекундах. Значение по умолчанию: 5 секунд.
 								-   `retry_attempts` — число попыток выполнения запроса в случае возникновения ошибки. Значение по умолчанию: `10`.
 								-   `single_read_retries` — число попыток выполнения запроса в случае возникновения ошибки в процессе чтения. Значение по умолчанию: `4`.
 								-   `min_bytes_for_seek` — минимальное количество байтов, которые используются для операций поиска вместо последовательного чтения. Значение по умолчанию: 1 МБайт.
 								-   `metadata_path` — путь к локальному файловому хранилищу для хранения файлов с метаданными для S3. Значение по умолчанию: `/var/lib/clickhouse/disks/<disk_name>/`.
 								-   `cache_enabled` — признак, разрешено ли хранение кэша засечек и файлов индекса в локальной файловой системе. Значение по умолчанию: `true`.
 								-   `cache_path` — путь в локальной файловой системе, где будут храниться кэш засечек и файлы индекса. Значение по умолчанию: `/var/lib/clickhouse/disks/<disk_name>/cache/`.
-												Apply suggestions from code review

Co-authored-by: Nikita Mikhaylov <mikhaylovnikitka@gmail.com>
											
										
										
											2021-03-12 02:12:28 +00:00
+								-   `skip_access_check` — признак, выполнять ли проверку доступов при запуске диска. Если установлено значение `true`, то проверка не выполняется. Значение по умолчанию: `false`.
-												First commit

											
										
										
											2021-03-06 11:13:14 +00:00
 								Диск S3 может быть сконфигурирован как `main` или `cold`:
-												Minor fixes

											
										
										
											2021-03-06 11:55:17 +00:00
-												First commit

											
										
										
											2021-03-06 11:13:14 +00:00
+								``` xml
 								<storage_configuration>
 								    ...
 								    <disks>
 								        <s3>
 								            <type>s3</type>
 								            <endpoint>https://storage.yandexcloud.net/my-bucket/root-path/</endpoint>
 								            <access_key_id>your_access_key_id</access_key_id>
 								            <secret_access_key>your_secret_access_key</secret_access_key>
 								        </s3>
 								    </disks>
 								    <policies>
 								        <s3_main>
 								            <volumes>
 								                <main>
 								                    <disk>s3</disk>
 								                </main>
 								            </volumes>
 								        </s3_main>
 								        <s3_cold>
 								            <volumes>
 								                <main>
 								                    <disk>default</disk>
 								                </main>
 								                <external>
 								                    <disk>s3</disk>
 								                </external>
 								            </volumes>
 								            <move_factor>0.2</move_factor>
 								        </s3_cold>
 								    </policies>
 								    ...
 								</storage_configuration>
 								```
-												better

											
										
										
											2021-06-01 14:23:46 +00:00
+								Если диск сконфигурирован как `cold`, данные будут переноситься в S3 при срабатывании правил TTL или когда свободное место на локальном диске станет меньше порогового значения, которое определяется как `move_factor * disk_size`.