ClickHouse/docs/ru/operations/table_engines/mergetree.md

# MergeTree {#table_engines-mergetree}

Движок `MergeTree`, а также другие движки этого семейства (`*MergeTree`) — это наиболее функциональные движки таблиц ClickHousе.

Основная идея, заложенная в основу движков семейства `MergeTree` следующая. Когда у вас есть огромное количество данных, которые должны быть вставлены в таблицу, вы должны быстро записать их по частям, а затем объединить части по некоторым правилам в фоновом режиме. Этот метод намного эффективнее, чем постоянная перезапись данных в хранилище при вставке.

Основные возможности:

- Хранит данные, отсортированные по первичному ключу.

    Это позволяет создавать разреженный индекс небольшого объёма, который позволяет быстрее находить данные.

- Позволяет оперировать партициями, если задан [ключ партиционирования](custom_partitioning_key.md).

    ClickHouse поддерживает отдельные операции с партициями, которые работают эффективнее, чем общие операции с этим же результатом над этими же данными. Также, ClickHouse автоматически отсекает данные по партициям там, где ключ партиционирования указан в запросе. Это также увеличивает эффективность выполнения запросов.

- Поддерживает репликацию данных.

    Для этого используется семейство таблиц `ReplicatedMergeTree`. Подробнее читайте в разделе [Репликация данных](replication.md).

- Поддерживает сэмплирование данных.

    При необходимости можно задать способ сэмплирования данных в таблице.

!!! info
    Движок [Merge](merge.md) не относится к семейству `*MergeTree`.

## Создание таблицы {#table_engine-mergetree-creating-a-table}

```sql
CREATE TABLE [IF NOT EXISTS] [db.]table_name [ON CLUSTER cluster]
(
    name1 [type1] [DEFAULT|MATERIALIZED|ALIAS expr1] [TTL expr1],
    name2 [type2] [DEFAULT|MATERIALIZED|ALIAS expr2] [TTL expr2],
    ...
    INDEX index_name1 expr1 TYPE type1(...) GRANULARITY value1,
    INDEX index_name2 expr2 TYPE type2(...) GRANULARITY value2
) ENGINE = MergeTree()
[PARTITION BY expr]
[ORDER BY expr]
[PRIMARY KEY expr]
[SAMPLE BY expr]
[TTL expr]
[SETTINGS name=value, ...]
```

Описание параметров запроса смотрите в [описании запроса](../../query_language/create.md).

### Секции запроса

- `ENGINE` — имя и параметры движка. `ENGINE = MergeTree()`. `MergeTree` не имеет параметров.

- `PARTITION BY` — [ключ партиционирования](custom_partitioning_key.md).

    Для партиционирования по месяцам используйте выражение `toYYYYMM(date_column)`, где `date_column` — столбец с датой типа [Date](../../data_types/date.md). В этом случае имена партиций имеют формат `"YYYYMM"`.

- `ORDER BY` — ключ сортировки.

    Кортеж столбцов или произвольных выражений. Пример: `ORDER BY (CounterID, EventDate)`.

- `PRIMARY KEY` — первичный ключ, если он [отличается от ключа сортировки](mergetree.md).

    По умолчанию первичный ключ совпадает с ключом сортировки (который задаётся секцией `ORDER BY`.) Поэтому в большинстве случаев секцию `PRIMARY KEY` отдельно указывать не нужно.

- `SAMPLE BY` — выражение для сэмплирования.

    Если используется выражение для сэмплирования, то первичный ключ должен содержать его. Пример:
`SAMPLE BY intHash32(UserID) ORDER BY (CounterID, EventDate, intHash32(UserID))`.

- `TTL` — выражение, определяющее длительность хранения строк.

    Должно зависеть от столбца `Date` или `DateTime` и возвращать столбец `Date` или `DateTime`. Пример:`TTL date + INTERVAL 1 DAY`

    Дополнительные сведения смотрите в разделе [TTL для столбцов и таблиц](mergetree.md)

- `SETTINGS` — дополнительные параметры, регулирующие поведение `MergeTree`:

    - `index_granularity` — гранулярность индекса. Число строк данных между «засечками» индекса. По умолчанию — 8192. Список всех доступных параметров можно посмотреть в [MergeTreeSettings.h](https://github.com/yandex/ClickHouse/blob/master/dbms/src/Storages/MergeTree/MergeTreeSettings.h).
    - `min_merge_bytes_to_use_direct_io` — минимальный объем данных, необходимый для прямого (небуферизованного) чтения/записи (direct I/O) на диск. При слиянии частей данных ClickHouse вычисляет общий объем хранения всех данных, подлежащих слиянию. Если общий объем хранения всех данных для чтения превышает `min_bytes_to_use_direct_io` байт, тогда ClickHouse  использует флаг `O_DIRECT` при чтении данных с диска. Если `min_merge_bytes_to_use_direct_io = 0`, тогда прямой ввод-вывод отключен. Значение по умолчанию: `10 * 1024 * 1024 * 1024` байт.
    <a name="mergetree_setting-merge_with_ttl_timeout"></a>
    - `merge_with_ttl_timeout` - Минимальное время в секундах для повторного выполнения слияний с TTL. По умолчанию - 86400 (1 день).

**Пример задания секций**

```sql
ENGINE MergeTree() PARTITION BY toYYYYMM(EventDate) ORDER BY (CounterID, EventDate, intHash32(UserID)) SAMPLE BY intHash32(UserID) SETTINGS index_granularity=8192
```

В примере мы устанавливаем партиционирование по месяцам.

Также мы задаем выражение для сэмплирования в виде хэша по идентификатору посетителя. Это позволяет псевдослучайным образом перемешать данные в таблице для каждого `CounterID` и `EventDate`. Если при выборке данных задать секцию [SAMPLE](../../query_language/select.md#select-sample-clause), то ClickHouse вернёт равномерно-псевдослучайную выборку данных для подмножества посетителей.

`index_granularity` можно было не указывать, поскольку 8192 — это значение по умолчанию.

<details markdown="1"><summary>Устаревший способ создания таблицы</summary>

!!! attention
    Не используйте этот способ в новых проектах и по возможности переведите старые проекты на способ, описанный выше.

```sql
CREATE TABLE [IF NOT EXISTS] [db.]table_name [ON CLUSTER cluster]
(
    name1 [type1] [DEFAULT|MATERIALIZED|ALIAS expr1],
    name2 [type2] [DEFAULT|MATERIALIZED|ALIAS expr2],
    ...
) ENGINE [=] MergeTree(date-column [, sampling_expression], (primary, key), index_granularity)
```

**Параметры MergeTree()**

- `date-column` — имя столбца с типом [Date](../../data_types/date.md). На основе этого столбца ClickHouse автоматически создаёт партиции по месяцам. Имена партиций имеют формат `"YYYYMM"`.
- `sampling_expression` — выражение для сэмплирования.
- `(primary, key)` — первичный ключ. Тип — [Tuple()](../../data_types/tuple.md)
- `index_granularity` — гранулярность индекса. Число строк данных между «засечками» индекса. Для большинства задач подходит значение 8192.

**Пример**

```
MergeTree(EventDate, intHash32(UserID), (CounterID, EventDate, intHash32(UserID)), 8192)
```

Движок `MergeTree` сконфигурирован таким же образом, как и в примере выше для основного способа конфигурирования движка.

</details>

## Хранение данных

Таблица состоит из *кусков* данных (data parts), отсортированных по первичному ключу.

При вставке в таблицу создаются отдельные куски данных, каждый из которых лексикографически отсортирован по первичному ключу. Например, если первичный ключ — `(CounterID, Date)`, то данные в куске будут лежать в порядке `CounterID`, а для каждого `CounterID` в порядке `Date`.

Данные, относящиеся к разным партициям, разбиваются на разные куски. В фоновом режиме ClickHouse выполняет слияния (merge) кусков данных для более эффективного хранения. Куски, относящиеся к разным партициям не объединяются. Механизм слияния не гарантирует, что все строки с одинаковым первичным ключом окажутся в одном куске.

Для каждого куска данных ClickHouse создаёт индексный файл, который содержит значение первичного ключа для каждой индексной строки («засечка»). Номера строк индекса определяются как `n * index_granularity`. Максимальное значение `n` равно целой части деления общего числа строк на `index_granularity`. Для каждого столбца "засечки" также записываются для тех же строк индекса, что и первичный ключ. Эти "засечки" позволяют находить данные непосредственно в столбцах.

Вы можете использовать одну большую таблицу, постоянно добавляя в неё данные пачками, именно для этого предназначен движок `MergeTree`.

## Первичные ключи и индексы в запросах {#primary-keys-and-indexes-in-queries}

Рассмотрим первичный ключ — `(CounterID, Date)`. В этом случае сортировку и индекс можно проиллюстрировать следующим образом:

```
Whole data:     [-------------------------------------------------------------------------]
CounterID:      [aaaaaaaaaaaaaaaaaabbbbcdeeeeeeeeeeeeefgggggggghhhhhhhhhiiiiiiiiikllllllll]
Date:           [1111111222222233331233211111222222333211111112122222223111112223311122333]
Marks:           |      |      |      |      |      |      |      |      |      |      |
                a,1    a,2    a,3    b,3    e,2    e,3    g,1    h,2    i,1    i,3    l,3
Marks numbers:   0      1      2      3      4      5      6      7      8      9      10
```

Если в запросе к данным указать:

- `CounterID IN ('a', 'h')`, то сервер читает данные в диапазонах засечек `[0, 3)` и `[6, 8)`.
- `CounterID IN ('a', 'h') AND Date = 3`, то сервер читает данные в диапазонах засечек `[1, 3)` и `[7, 8)`.
- `Date = 3`, то сервер читает данные в диапазоне засечек `[1, 10]`.

Примеры выше показывают, что использование индекса всегда эффективнее, чем full scan.

Разреженный индекс допускает чтение лишних строк. При чтении одного диапазона первичного ключа, может быть прочитано до `index_granularity * 2` лишних строк в каждом блоке данных. В большинстве случаев ClickHouse не теряет производительности при `index_granularity = 8192`.

Разреженность индекса позволяет работать даже с очень большим количеством строк в таблицах, поскольку такой индекс всегда помещается в оперативную память компьютера.

ClickHouse не требует уникального первичного ключа. Можно вставить много строк с одинаковым первичным ключом.

### Выбор первичного ключа

Количество столбцов в первичном ключе не ограничено явным образом. В зависимости от структуры данных в первичный ключ можно включать больше или меньше столбцов. Это может:

- Увеличить эффективность индекса.

    Пусть первичный ключ — `(a, b)`, тогда добавление ещё одного столбца `c` повысит эффективность, если выполнены условия:

    - Есть запросы с условием на столбец `c`.
    - Часто встречаются достаточно длинные (в несколько раз больше `index_granularity`) диапазоны данных с одинаковыми значениями `(a, b)`. Иначе говоря, когда добавление ещё одного столбца позволит пропускать достаточно длинные диапазоны данных.

- Улучшить сжатие данных.

    ClickHouse сортирует данные по первичному ключу, поэтому чем выше однородность, тем лучше сжатие.

- Обеспечить дополнительную логику при слиянии кусков данных в движках [CollapsingMergeTree](collapsingmergetree.md#table_engine-collapsingmergetree) и [SummingMergeTree](summingmergetree.md).

    В этом случае имеет смысл указать отдельный *ключ сортировки*, отличающийся от первичного ключа.

Длинный первичный ключ будет негативно влиять на производительность вставки и потребление памяти, однако на производительность ClickHouse при запросах `SELECT` лишние столбцы в первичном ключе не влияют.

### Первичный ключ, отличный от ключа сортировки

Существует возможность задать первичный ключ (выражение, значения которого будут записаны в индексный файл для
каждой засечки), отличный от ключа сортировки (выражение, по которому будут упорядочены строки в кусках
данных). Кортеж выражения первичного ключа при этом должен быть префиксом кортежа выражения ключа
сортировки.

Данная возможность особенно полезна при использовании движков [SummingMergeTree](summingmergetree.md)
и [AggregatingMergeTree](aggregatingmergetree.md). В типичном сценарии использования этих движков таблица
содержит столбцы двух типов: *измерения* (dimensions) и *меры* (measures). Типичные запросы агрегируют
значения столбцов-мер с произвольной группировкой и фильтрацией по измерениям. Так как `SummingMergeTree`
и `AggregatingMergeTree` производят фоновую агрегацию строк с одинаковым значением ключа сортировки, приходится
добавлять в него все столбцы-измерения. В результате выражение ключа содержит большой список столбцов,
который приходится постоянно расширять при добавлении новых измерений.

В этом сценарии имеет смысл оставить в первичном ключе всего несколько столбцов, которые обеспечат эффективную фильтрацию по индексу, а остальные столбцы-измерения добавить в выражение ключа сортировки.

[ALTER ключа сортировки](../../query_language/alter.md) — лёгкая операция, так как при одновременном добавлении нового столбца в таблицу и ключ сортировки не нужно изменять данные кусков (они остаются упорядоченными и по новому выражению ключа).

### Использование индексов и партиций в запросах

Для запросов `SELECT` ClickHouse анализирует возможность использования индекса. Индекс может использоваться, если в секции `WHERE/PREWHERE`, в качестве одного из элементов конъюнкции, или целиком, есть выражение, представляющее операции сравнения на равенства, неравенства, а также `IN` или `LIKE` с фиксированным префиксом, над столбцами или выражениями, входящими в первичный ключ или ключ партиционирования, либо над некоторыми частично монотонными функциями от этих столбцов, а также логические связки над такими выражениями.

Таким образом, обеспечивается возможность быстро выполнять запросы по одному или многим диапазонам первичного ключа. Например, в указанном примере будут быстро работать запросы для конкретного счётчика; для конкретного счётчика и диапазона дат; для конкретного счётчика и даты, для нескольких счётчиков и диапазона дат и т. п.

Рассмотрим движок сконфигурированный следующим образом:

```
ENGINE MergeTree() PARTITION BY toYYYYMM(EventDate) ORDER BY (CounterID, EventDate) SETTINGS index_granularity=8192
```

В этом случае в запросах:

```sql
SELECT count() FROM table WHERE EventDate = toDate(now()) AND CounterID = 34
SELECT count() FROM table WHERE EventDate = toDate(now()) AND (CounterID = 34 OR CounterID = 42)
SELECT count() FROM table WHERE ((EventDate >= toDate('2014-01-01') AND EventDate <= toDate('2014-01-31')) OR EventDate = toDate('2014-05-01')) AND CounterID IN (101500, 731962, 160656) AND (CounterID = 101500 OR EventDate != toDate('2014-05-01'))
```

ClickHouse будет использовать индекс по первичному ключу для отсечения не подходящих данных, а также ключ партиционирования по месяцам для отсечения партиций, которые находятся в не подходящих диапазонах дат.

Запросы выше показывают, что индекс используется даже для сложных выражений. Чтение из таблицы организовано так, что использование индекса не может быть медленнее, чем full scan.

В примере ниже индекс не может использоваться.

```sql
SELECT count() FROM table WHERE CounterID = 34 OR URL LIKE '%upyachka%'
```

Чтобы проверить, сможет ли ClickHouse использовать индекс при выполнении запроса, используйте настройки [force_index_by_date](../settings/settings.md#settings-force_index_by_date) и [force_primary_key](../settings/settings.md#settings-force_primary_key).

Ключ партиционирования по месяцам обеспечивает чтение только тех блоков данных, которые содержат даты из нужного диапазона. При этом блок данных может содержать данные за многие даты (до целого месяца). В пределах одного блока данные упорядочены по первичному ключу, который может не содержать дату в качестве первого столбца. В связи с этим, при использовании запроса с указанием условия только на дату, но не на префикс первичного ключа, будет читаться данных больше, чем за одну дату.

### Использование индекса для частично-монотонных первичных ключей

Рассмотрим, например, дни месяца. Они образуют последовательность [монотонную](https://ru.wikipedia.org/wiki/Монотонная_последовательность) в течение одного месяца, но не монотонную на более длительных периодах. Это частично-монотонная последовательность. Если пользователь создаёт таблицу с частично-монотонным первичным ключом, ClickHouse как обычно создаёт разреженный индекс. Когда пользователь выбирает данные из такого рода таблиц, ClickHouse анализирует условия запроса. Если пользователь хочет получить данные между двумя метками индекса, и обе эти метки находятся внутри одного месяца, ClickHouse может использовать индекс в данном конкретном случае, поскольку он может рассчитать расстояние между параметрами запроса и индексными метками.

ClickHouse не может использовать индекс, если значения первичного ключа в диапазоне параметров запроса не представляют собой монотонную последовательность. В этом случае ClickHouse использует метод полного сканирования.

ClickHouse использует эту логику не только для последовательностей дней месяца, но и для любого частично-монотонного первичного ключа.

### Дополнительные индексы (Экспериментальная функциональность)

Для использования требуется установить настройку `allow_experimental_data_skipping_indices` в 1. (запустить `SET allow_experimental_data_skipping_indices = 1`).

Объявление индексов при определении столбцов в запросе `CREATE`.

```sql
INDEX index_name expr TYPE type(...) GRANULARITY granularity_value
```

Для таблиц семейства `*MergeTree` можно задать дополнительные индексы в секции столбцов.

Индексы агрегируют для заданного выражения некоторые данные, а потом при `SELECT` запросе используют для пропуска блоков данных (пропускаемый блок состоит из гранул данных в количестве равном гранулярности данного индекса), на которых секция `WHERE` не может быть выполнена, тем самым уменьшая объем данных читаемых с диска.

**Пример**

```sql
CREATE TABLE table_name
(
    u64 UInt64,
    i32 Int32,
    s String,
    ...
    INDEX a (u64 * i32, s) TYPE minmax GRANULARITY 3,
    INDEX b (u64 * length(s)) TYPE set(1000) GRANULARITY 4
) ENGINE = MergeTree()
...
```

Эти индексы смогут использоваться для оптимизации следующих запросов

```sql
SELECT count() FROM table WHERE s < 'z'
SELECT count() FROM table WHERE u64 * i32 == 10 AND u64 * length(s) >= 1234
```

#### Доступные индексы

* `minmax`
Хранит минимум и максимум выражения (если выражение - `tuple`, то для каждого элемента `tuple`), используя их для пропуска блоков аналогично первичному ключу.

* `set(max_rows)`
Хранит уникальные значения выражения на блоке в количестве не более `max_rows` (если `max_rows = 0`, то ограничений нет), используя их для пропуска блоков, оценивая выполнимость `WHERE` выражения на хранимых данных.

**Примеры**

```sql
INDEX b (u64 * length(str), i32 + f64 * 100, date, str) TYPE minmax GRANULARITY 4
INDEX b (u64 * length(str), i32 + f64 * 100, date, str) TYPE set(100) GRANULARITY 4
```

## Конкурентный доступ к данным

Для конкурентного доступа к таблице используется мультиверсионность. То есть, при одновременном чтении и обновлении таблицы, данные будут читаться из набора кусочков, актуального на момент запроса. Длинных блокировок нет. Вставки никак не мешают чтениям.

Чтения из таблицы автоматически распараллеливаются.

## TTL для столбцов и таблиц {#table_engine-mergetree-ttl}

Определяет время жизни значений.

Секция `TTL` может быть установлена как для всей таблицы, так и для каждого отдельного столбца. Если установлены оба `TTL`, то ClickHouse использует тот, что истекает раньше.

Таблица должна иметь столбец типа [Date](../../data_types/date.md) или [DateTime](../../data_types/datetime.md). Для установки времени жизни данных, следует использовать операцию со столбцом с временем, например:

```
TTL time_column
TTL time_column + interval
```

Чтобы задать `interval`, используйте операторы [интервала времени](../../query_language/operators.md#operators-datetime).

```
TTL date_time + INTERVAL 1 MONTH
TTL date_time + INTERVAL 15 HOUR
```

**TTL столбца**

Когда срок действия значений в столбце истечет, ClickHouse заменит их значениями по умолчанию для типа данных столбца. Если срок действия всех значений столбцов в части данных истек, ClickHouse удаляет столбец из куска данных в файловой системе.

Секцию `TTL` нельзя использовать для ключевых столбцов.

Примеры:

Создание таблицы с TTL

```sql
CREATE TABLE example_table 
(
    d DateTime,
    a Int TTL d + INTERVAL 1 MONTH,
    b Int TTL d + INTERVAL 1 MONTH,
    c String
)
ENGINE = MergeTree
PARTITION BY toYYYYMM(d)
ORDER BY d;
```

Добавление TTL на колонку существующей таблицы

```sql
ALTER TABLE example_table
    MODIFY COLUMN
    c String TTL d + INTERVAL 1 DAY;
```

Изменение TTL у колонки

```sql
ALTER TABLE example_table
    MODIFY COLUMN
    c String TTL d + INTERVAL 1 MONTH;
```

**TTL таблицы**

Когда некоторые данные в таблице устаревают, ClickHouse удаляет все соответствующие строки.

Примеры:

```sql
CREATE TABLE example_table 
(
    d DateTime,
    a Int
)
ENGINE = MergeTree
PARTITION BY toYYYYMM(d)
ORDER BY d
TTL d + INTERVAL 1 MONTH;
```

Изменение TTL 

```sql
ALTER TABLE example_table
    MODIFY TTL d + INTERVAL 1 DAY;
```

**Удаление данных**

Данные с истекшим TTL удаляются, когда ClickHouse мёржит куски данных.

Когда ClickHouse видит, что некоторые данные устарели, он выполняет внеплановые мёржи. Для управление частотой подобных мёржей, можно задать настройку [merge_with_ttl_timeout](#mergetree_setting-merge_with_ttl_timeout). Если её значение слишком низкое, придется выполнять много внеплановых мёржей, которые могут начать потреблять значительную долю ресурсов сервера.

Если вы выполните запрос `SELECT` между слияниями вы можете получить устаревшие данные. Чтобы избежать этого используйте запрос [OPTIMIZE](../../query_language/misc.md#misc_operations-optimize) перед `SELECT`.

[Оригинальная статья](https://clickhouse.yandex/docs/ru/operations/table_engines/mergetree/) <!--hide-->


## Хранение данных таблицы на нескольких блочных устройствах {#table_engine-mergetree-multiple-volumes}

### Общее
Данные таблиц семейства MergeTree могут храниться на нескольких блочных устройствах. Это может оказаться полезным, например, при неявном разделении данных одной таблицы на "горячие" и "холодные", когда наиболее свежая часть занимает малый объем и запрашивается регулярно, а большой хвост исторических данных запрашивается редко. При наличии в системе нескольких дисков, "горячая" часть данных может быть размещена на быстрых дисках (NVMe SSDs), а холодная на более медленных (HDD).

Минимальной перемещаемой единицей для MergeTree является кусок (part). Данные одного куска могут находится только на одном диске. Куски могут перемещаться между дисками в фоне, согласно пользовательским настройкам, а также с помощью [`ALTER`](../../query_language/alter.md#alter_move-partition) запросов.

### Термины
* Диск — примонтированное в файловой системе блочное устройство.
* Диск по умолчанию — путь на файловой системе, указанный в `<path>` в основной конфигурации.
* Том (Volume) — упорядоченный набор равноценных дисков (схоже с [JBOD](https://ru.wikipedia.org/wiki/JBOD))
* Политика хранения (StoragePolicy) — множество томов с правилами перемещения данных между ними.

У всех описанных сущностей, при создании, указываются имена, которые будут отражены в системных таблицах `system.storage_policies` и `system.disks`. Имя политики хранения используется как настройка у таблиц семейства MergeTree.

### Конфигурация

Диски, тома и политики хранения задаются в конфигурации сервера.

Конфигурация дисков имеет следующую структуру:

```xml
<disks>
    <fast_disk> <!-- disk name -->
        <path>/mnt/fast_ssd/clickhouse</path>
    </fast_disk>
    <disk1>
        <path>/mnt/hdd1/clickhouse</path>
        <keep_free_space_bytes>10485760</keep_free_space_bytes>_
    </disk1>
    <disk2>
        <path>/mnt/hdd2/clickhouse</path>
        <keep_free_space_bytes>10485760</keep_free_space_bytes>_
    </disk2>

    ...
</disks>
```
* имя диска задается внутри имени тега.
* `path` — путь по которому будут храниться данные сервера (каталоги `data`, `shadow`), должен быть терминирован `/`.
* `keep_free_space_bytes` — размер зарезервированного свободного места на диске.

Порядок задания дисков не имеет значения.

Конфигурация политик хранения:

```xml
<policies>
    <hdd_in_order> <!-- policy name -->
        <volumes>
            <single> <!-- volume name -->
                <disk>disk1</disk>
                <disk>disk2</disk>
            </single>
        </volumes>
    </hdd_in_order>

    <moving_from_ssd_to_hdd>
        <volumes>
            <hot>
                <disk>fast_ssd</disk>
                <max_data_part_size_bytes>1073741824</max_data_part_size_bytes>
            </hot>
            <cold>
                <disk>disk1</disk>
            </cold>
            <move_factor>0.2</move_factor>
        </volumes>
    </moving_from_ssd_to_hdd>
</policies>
```

* имя политики и тома задаются внутри имен тегов.
* `disk` — диск, находящийся внутри тома.
* `max_data_part_size_bytes` — максимальный размер куска, который может находится на любом из дисков этого тома.
* `move_factor` — доля свободного места, при превышении которого данные начинают перемещаться на следующий том, если он есть (по умолчанию 0.1).

Порядок томов в политиках хранения важен, при достижении условий на переполнение тома данные переносятся на следующий. Порядок дисков в томах так же важен, данные пишутся по очереди на каждый из них.

После задания конфигурации дисков и политик хранения их можно использовать, как настройку при создании таблиц:

```sql
CREATE TABLE table_with_non_default_policy (
    EventDate Date,
    OrderID UInt64,
    BannerID UInt64,
    SearchPhrase String
) ENGINE = MergeTree()
ORDER BY (OrderID, BannerID)
PARTITION BY toYYYYMM(EventDate)
SETTINGS storage_policy_name='moving_from_ssd_to_hdd'
```

Все куски такой таблицы больше 1GB будут писаться сразу на диск `disk1`. Также, при заполнении диска `fast_ssd` более чем на 80% данные будут переносится на диск `disk1` фоновым процессом.

По умолчанию используется политика хранения `default` в которой есть один том и один диск, указанный в `<path>`.

### Особенности работы

В таблицах MergeTree данные попадают на диск несколькими способами:
* В результате вставки (запрос `INSERT`).
* В фоновых операциях слияний и мутаций.
* При скачивании данных с другой реплики. 
* В результате заморозки партиций [`ALTER TABLE ... FREEZE PARTITION`](../../query_language/alter.md#alter_freeze-partition).

Во всех случаях, кроме мутаций и заморозки партиций, при записи куска выбирается том и диск в соответствии с указанной конфигурацией хранилища:

1. Выбирается первый по порядку том, на котором есть свободное место для записи куска (`unreserved_space > current_part_size`) и который позволяет записывать куски требуемого размера `max_data_part_size_bytes > current_part_size`.
2. Внутри тома выбирается следующий диск после того, на который была предыдущая запись и на котором свободного места больше чем размер куска (`unreserved_space - keep_free_space_bytes > current_part_size`)

Мутации и запросы заморозки партиций в реализации используют [жесткие ссылки](https://ru.wikipedia.org/wiki/%D0%96%D1%91%D1%81%D1%82%D0%BA%D0%B0%D1%8F_%D1%81%D1%81%D1%8B%D0%BB%D0%BA%D0%B0). Жесткие ссылки между различными дисками не поддерживаются, поэтому в случае таких операций куски размещаются на тех же дисках, что и исходные.

В фоне куски перемещаются между томами на основе информации о занятом месте (настройка `move_factor`) по порядку, в котором указаны тома в конфигурации. Данные никогда не перемещаются с последнего тома и на первый том.

С помощью запроса `ALTER TABLE ... MOVE PART|PARTITION ... TO VOLUME|DISK ...` пользователь может принудительно перенести кусок или партицию с одного раздела на другой. При этом учитываются все ограничения, указанные для фоновых операций. В случае недостатка места или неудовлетворения ограничениям пользователь получит сообщение об ошибки.

Перемещения данных не взаимодействуют с репликацией данных, поэтому на разных репликах одной и той же таблицы могут быть указаны разные политики хранения.

После выполнения фоновых слияний или мутаций старые куски не удаляются сразу, а через некоторое время (табличная настройка `old_parts_lifetime`). Также они не перемещаются на другие тома или диски, поэтому до момента удаления они продолжают учитываться при подсчёте занятого дискового пространства.
-												Doc fixes: remove all anchors <a> (#3897)

* Doc fixes: rm anchors <a>

* Doc fixes: rm anchors <a>

* Doc fixes: fix links

* Doc fixes: fix the links

											
										
										
											2018-12-21 19:23:55 +00:00
+								# MergeTree {#table_engines-mergetree}
-												Added documentation in RST format. (ReadTheDocs ready)

											
										
										
											2017-03-12 17:58:51 +00:00
-												Updated description of MergeTree.

											
										
										
											2018-08-21 07:54:37 +00:00
+								Движок `MergeTree`, а также другие движки этого семейства (`*MergeTree`) — это наиболее функциональные движки таблиц ClickHousе.
-												Added documentation in RST format. (ReadTheDocs ready)

											
										
										
											2017-03-12 17:58:51 +00:00
-												DOCAPI-5203: Direct I/O settings for MergeTree descriptions. EN review and RU translation. (#4848)


											
										
										
											2019-04-08 16:25:37 +00:00
+								Основная идея, заложенная в основу движков семейства `MergeTree` следующая. Когда у вас есть огромное количество данных, которые должны быть вставлены в таблицу, вы должны быстро записать их по частям, а затем объединить части по некоторым правилам в фоновом режиме. Этот метод намного эффективнее, чем постоянная перезапись данных в хранилище при вставке.
-												Added documentation in RST format. (ReadTheDocs ready)

											
										
										
											2017-03-12 17:58:51 +00:00
-												Updated description of MergeTree.

											
										
										
											2018-08-21 07:54:37 +00:00
+								Основные возможности:
 								- Хранит данные, отсортированные по первичному ключу.
 								    Это позволяет создавать разреженный индекс небольшого объёма, который позволяет быстрее находить данные.
-												WIP on docs (#3813)

* CLICKHOUSE-4063: less manual html @ index.md

* CLICKHOUSE-4063: recommend markdown="1" in README.md

* CLICKHOUSE-4003: manually purge custom.css for now

* CLICKHOUSE-4064: expand <details> before any print (including to pdf)

* CLICKHOUSE-3927: rearrange interfaces/formats.md a bit

* CLICKHOUSE-3306: add few http headers

* Remove copy-paste introduced in #3392

* Hopefully better chinese fonts #3392

* get rid of tabs @ custom.css

* Apply comments and patch from #3384

* Add jdbc.md to ToC and some translation, though it still looks badly incomplete

* minor punctuation

* Add some backlinks to official website from mirrors that just blindly take markdown sources

* Do not make fonts extra light

* find . -name '*.md' -type f | xargs -I{} perl -pi -e 's//g' {}

* find . -name '*.md' -type f | xargs -I{} perl -pi -e 's/ sql/g' {}

* Remove outdated stuff from roadmap.md

* Not so light font on front page too

* Refactor Chinese formats.md to match recent changes in other languages

* Update some links on front page

* Remove some outdated comment

* Add twitter link to front page

* More front page links tuning

* Add Amsterdam meetup link

* Smaller font to avoid second line

* Add Amsterdam link to README.md

* Proper docs nav translation

* Back to 300 font-weight except Chinese

* fix docs build

* Update Amsterdam link

* remove symlinks

* more zh punctuation

* apply lost comment by @zhang2014

* Apply comments by @zhang2014 from #3417

* Remove Beijing link

* rm incorrect symlink

* restore content of docs/zh/operations/table_engines/index.md

* CLICKHOUSE-3751: stem terms while searching docs

* CLICKHOUSE-3751: use English stemmer in non-English docs too

* CLICKHOUSE-4135 fix

* Remove past meetup link

* Add blog link to top nav

* Add ContentSquare article link

* Add form link to front page + refactor some texts

* couple markup fixes

* minor

* Introduce basic ODBC driver page in docs

* More verbose 3rd party libs disclaimer

* Put third-party stuff into a separate folder

* Separate third-party stuff in ToC too

* Update links

* Move stuff that is not really (only) a client library into a separate page

* Add clickhouse-hdfs-loader link

* Some introduction for "interfaces" section

* Rewrite tcp.md

* http_interface.md -> http.md

* fix link

* Remove unconvenient error for now

* try to guess anchor instead of failing

* remove symlink

* Remove outdated info from introduction

* remove ru roadmap.md

* replace ru roadmap.md with symlink

* Update roadmap.md

* lost file

* Title case in toc_en.yml

* Sync "Functions" ToC section with en

* Remove reference to pretty old ClickHouse release from docs

* couple lost symlinks in fa

* Close quote in proper place

* Rewrite en/getting_started/index.md

* Sync en<>ru getting_started/index.md

* minor changes

* Some gui.md refactoring

* Translate DataGrip section to ru

* Translate DataGrip section to zh

* Translate DataGrip section to fa

* Translate DBeaver section to fa

* Translate DBeaver section to zh

* Split third-party GUI to open-source and commercial

* Mention some RDBMS integrations + ad-hoc translation fixes

* Add rel="external nofollow" to outgoing links from docs

* Lost blank lines

* Fix class name

* More rel="external nofollow"

* Apply suggestions by @sundy-li

* Mobile version of front page improvements

* test

* test 2

* test 3

* Update LICENSE

* minor docs fix

* Highlight current article as suggested by @sundy-li

* fix link destination

* Introduce backup.md (only "en" for now)

* Mention INSERT+SELECT in backup.md

* Some improvements for replication.md

* Add backup.md to toc

* Mention clickhouse-backup tool

* Mention LightHouse in third-party GUI list

* Introduce interfaces/third-party/proxy.md

* Add clickhouse-bulk to proxy.md

* Major extension of integrations.md contents

* fix link target

* remove unneeded file

* better toc item name

* fix markdown

* better ru punctuation

* Add yet another possible backup approach

* Simplify copying permalinks to headers

* Support non-eng link anchors in docs + update some deps

* Generate anchors for single-page mode automatically

* Remove anchors to top of pages

* Remove anchors that nobody links to

* build fixes

* fix few links

* restore css

* fix some links

* restore gifs

* fix lost words

* more docs fixes

* docs fixes

* NULL anchor

* update urllib3 dependency

* more fixes

											
										
										
											2018-12-12 17:28:00 +00:00
+								- Позволяет оперировать партициями, если задан [ключ партиционирования](custom_partitioning_key.md).
-												Updated description of MergeTree.

											
										
										
											2018-08-21 07:54:37 +00:00
 								    ClickHouse поддерживает отдельные операции с партициями, которые работают эффективнее, чем общие операции с этим же результатом над этими же данными. Также, ClickHouse автоматически отсекает данные по партициям там, где ключ партиционирования указан в запросе. Это также увеличивает эффективность выполнения запросов.
 								- Поддерживает репликацию данных.
-												WIP on docs (#3813)

* CLICKHOUSE-4063: less manual html @ index.md

* CLICKHOUSE-4063: recommend markdown="1" in README.md

* CLICKHOUSE-4003: manually purge custom.css for now

* CLICKHOUSE-4064: expand <details> before any print (including to pdf)

* CLICKHOUSE-3927: rearrange interfaces/formats.md a bit

* CLICKHOUSE-3306: add few http headers

* Remove copy-paste introduced in #3392

* Hopefully better chinese fonts #3392

* get rid of tabs @ custom.css

* Apply comments and patch from #3384

* Add jdbc.md to ToC and some translation, though it still looks badly incomplete

* minor punctuation

* Add some backlinks to official website from mirrors that just blindly take markdown sources

* Do not make fonts extra light

* find . -name '*.md' -type f | xargs -I{} perl -pi -e 's//g' {}

* find . -name '*.md' -type f | xargs -I{} perl -pi -e 's/ sql/g' {}

* Remove outdated stuff from roadmap.md

* Not so light font on front page too

* Refactor Chinese formats.md to match recent changes in other languages

* Update some links on front page

* Remove some outdated comment

* Add twitter link to front page

* More front page links tuning

* Add Amsterdam meetup link

* Smaller font to avoid second line

* Add Amsterdam link to README.md

* Proper docs nav translation

* Back to 300 font-weight except Chinese

* fix docs build

* Update Amsterdam link

* remove symlinks

* more zh punctuation

* apply lost comment by @zhang2014

* Apply comments by @zhang2014 from #3417

* Remove Beijing link

* rm incorrect symlink

* restore content of docs/zh/operations/table_engines/index.md

* CLICKHOUSE-3751: stem terms while searching docs

* CLICKHOUSE-3751: use English stemmer in non-English docs too

* CLICKHOUSE-4135 fix

* Remove past meetup link

* Add blog link to top nav

* Add ContentSquare article link

* Add form link to front page + refactor some texts

* couple markup fixes

* minor

* Introduce basic ODBC driver page in docs

* More verbose 3rd party libs disclaimer

* Put third-party stuff into a separate folder

* Separate third-party stuff in ToC too

* Update links

* Move stuff that is not really (only) a client library into a separate page

* Add clickhouse-hdfs-loader link

* Some introduction for "interfaces" section

* Rewrite tcp.md

* http_interface.md -> http.md

* fix link

* Remove unconvenient error for now

* try to guess anchor instead of failing

* remove symlink

* Remove outdated info from introduction

* remove ru roadmap.md

* replace ru roadmap.md with symlink

* Update roadmap.md

* lost file

* Title case in toc_en.yml

* Sync "Functions" ToC section with en

* Remove reference to pretty old ClickHouse release from docs

* couple lost symlinks in fa

* Close quote in proper place

* Rewrite en/getting_started/index.md

* Sync en<>ru getting_started/index.md

* minor changes

* Some gui.md refactoring

* Translate DataGrip section to ru

* Translate DataGrip section to zh

* Translate DataGrip section to fa

* Translate DBeaver section to fa

* Translate DBeaver section to zh

* Split third-party GUI to open-source and commercial

* Mention some RDBMS integrations + ad-hoc translation fixes

* Add rel="external nofollow" to outgoing links from docs

* Lost blank lines

* Fix class name

* More rel="external nofollow"

* Apply suggestions by @sundy-li

* Mobile version of front page improvements

* test

* test 2

* test 3

* Update LICENSE

* minor docs fix

* Highlight current article as suggested by @sundy-li

* fix link destination

* Introduce backup.md (only "en" for now)

* Mention INSERT+SELECT in backup.md

* Some improvements for replication.md

* Add backup.md to toc

* Mention clickhouse-backup tool

* Mention LightHouse in third-party GUI list

* Introduce interfaces/third-party/proxy.md

* Add clickhouse-bulk to proxy.md

* Major extension of integrations.md contents

* fix link target

* remove unneeded file

* better toc item name

* fix markdown

* better ru punctuation

* Add yet another possible backup approach

* Simplify copying permalinks to headers

* Support non-eng link anchors in docs + update some deps

* Generate anchors for single-page mode automatically

* Remove anchors to top of pages

* Remove anchors that nobody links to

* build fixes

* fix few links

* restore css

* fix some links

* restore gifs

* fix lost words

* more docs fixes

* docs fixes

* NULL anchor

* update urllib3 dependency

* more fixes

											
										
										
											2018-12-12 17:28:00 +00:00
+								    Для этого используется семейство таблиц `ReplicatedMergeTree`. Подробнее читайте в разделе [Репликация данных](replication.md).
-												Updated description of MergeTree.

											
										
										
											2018-08-21 07:54:37 +00:00
 								- Поддерживает сэмплирование данных.
 								    При необходимости можно задать способ сэмплирования данных в таблице.
-												DOCAPI-5203: Direct I/O settings for MergeTree descriptions. EN review and RU translation. (#4848)


											
										
										
											2019-04-08 16:25:37 +00:00
+								!!! info
 								    Движок [Merge](merge.md) не относится к семейству `*MergeTree`.
-												Updates for Aggregating-,Collapsing-, Replacing- and SummingMergeTree. (#3346)

* Update of english version of descriprion of the table function `file`.

* New syntax for ReplacingMergeTree.
Some improvements in text.

* Significantly change article about SummingMergeTree.
Article is restructured, text is changed in many places of the document. New syntax for table creation is described.

* Descriptions of AggregateFunction and AggregatingMergeTree are updated. Russian version.

* New syntax for new syntax of CREATE TABLE

* Added english docs on Aggregating, Replacing and SummingMergeTree.

* CollapsingMergeTree docs. English version.

* 1. Update of CollapsingMergeTree. 2. Minor changes in markup

* Update aggregatefunction.md

* Update aggregatefunction.md

* Update aggregatefunction.md

* Update aggregatingmergetree.md

* GraphiteMergeTree docs update.
New syntax for creation of Replicated* tables.
Minor changes in *MergeTree tables creation syntax.

* Markup fix

* Markup and language fixes

* Clarification in the CollapsingMergeTree article

											
										
										
											2018-10-19 11:25:22 +00:00
-												Docapi 4479 merge tree new syntax translate (#4085)

* Update of english version of descriprion of the table function `file`.

* New syntax for ReplacingMergeTree.
Some improvements in text.

* Significantly change article about SummingMergeTree.
Article is restructured, text is changed in many places of the document. New syntax for table creation is described.

* Descriptions of AggregateFunction and AggregatingMergeTree are updated. Russian version.

* New syntax for new syntax of CREATE TABLE

* Added english docs on Aggregating, Replacing and SummingMergeTree.

* CollapsingMergeTree docs. English version.

* 1. Update of CollapsingMergeTree. 2. Minor changes in markup

* Update aggregatefunction.md

* Update aggregatefunction.md

* Update aggregatefunction.md

* Update aggregatingmergetree.md

* GraphiteMergeTree docs update.
New syntax for creation of Replicated* tables.
Minor changes in *MergeTree tables creation syntax.

* Markup fix

* Markup and language fixes

* Clarification in the CollapsingMergeTree article

* DOCAPI-4821. Sync between ru and en versions of docs.

* Fixed the ambiguity in geo functions description.

* Example of JOIN in ru docs

* Deleted misinforming example.

* Fixed links to IN operators.

* Updated the description of ALTER MODIFY.

* [RU] Updated ALTER MODIFY description.

* DOCAPI-4479. English changes are translated into russian.

* DOCAPI-4479. Minor text and markup fixes.

* DOCAPI-4479. Minor text edits.

											
										
										
											2019-01-18 16:07:48 +00:00
+								## Создание таблицы {#table_engine-mergetree-creating-a-table}
-												Updates for Aggregating-,Collapsing-, Replacing- and SummingMergeTree. (#3346)

* Update of english version of descriprion of the table function `file`.

* New syntax for ReplacingMergeTree.
Some improvements in text.

* Significantly change article about SummingMergeTree.
Article is restructured, text is changed in many places of the document. New syntax for table creation is described.

* Descriptions of AggregateFunction and AggregatingMergeTree are updated. Russian version.

* New syntax for new syntax of CREATE TABLE

* Added english docs on Aggregating, Replacing and SummingMergeTree.

* CollapsingMergeTree docs. English version.

* 1. Update of CollapsingMergeTree. 2. Minor changes in markup

* Update aggregatefunction.md

* Update aggregatefunction.md

* Update aggregatefunction.md

* Update aggregatingmergetree.md

* GraphiteMergeTree docs update.
New syntax for creation of Replicated* tables.
Minor changes in *MergeTree tables creation syntax.

* Markup fix

* Markup and language fixes

* Clarification in the CollapsingMergeTree article

											
										
										
											2018-10-19 11:25:22 +00:00
 								```sql
 								CREATE TABLE [IF NOT EXISTS] [db.]table_name [ON CLUSTER cluster]
 								(
-												TTL for columns and tables (#4212)

Add TTL for columns and tables.

											
										
										
											2019-04-15 09:30:45 +00:00
+								    name1 [type1] [DEFAULT|MATERIALIZED|ALIAS expr1] [TTL expr1],
 								    name2 [type2] [DEFAULT|MATERIALIZED|ALIAS expr2] [TTL expr2],
-												Updates for Aggregating-,Collapsing-, Replacing- and SummingMergeTree. (#3346)

* Update of english version of descriprion of the table function `file`.

* New syntax for ReplacingMergeTree.
Some improvements in text.

* Significantly change article about SummingMergeTree.
Article is restructured, text is changed in many places of the document. New syntax for table creation is described.

* Descriptions of AggregateFunction and AggregatingMergeTree are updated. Russian version.

* New syntax for new syntax of CREATE TABLE

* Added english docs on Aggregating, Replacing and SummingMergeTree.

* CollapsingMergeTree docs. English version.

* 1. Update of CollapsingMergeTree. 2. Minor changes in markup

* Update aggregatefunction.md

* Update aggregatefunction.md

* Update aggregatefunction.md

* Update aggregatingmergetree.md

* GraphiteMergeTree docs update.
New syntax for creation of Replicated* tables.
Minor changes in *MergeTree tables creation syntax.

* Markup fix

* Markup and language fixes

* Clarification in the CollapsingMergeTree article

											
										
										
											2018-10-19 11:25:22 +00:00
+								    ...
-												docs ru

											
										
										
											2019-01-21 18:35:29 +00:00
+								    INDEX index_name1 expr1 TYPE type1(...) GRANULARITY value1,
 								    INDEX index_name2 expr2 TYPE type2(...) GRANULARITY value2
-												Updates for Aggregating-,Collapsing-, Replacing- and SummingMergeTree. (#3346)

* Update of english version of descriprion of the table function `file`.

* New syntax for ReplacingMergeTree.
Some improvements in text.

* Significantly change article about SummingMergeTree.
Article is restructured, text is changed in many places of the document. New syntax for table creation is described.

* Descriptions of AggregateFunction and AggregatingMergeTree are updated. Russian version.

* New syntax for new syntax of CREATE TABLE

* Added english docs on Aggregating, Replacing and SummingMergeTree.

* CollapsingMergeTree docs. English version.

* 1. Update of CollapsingMergeTree. 2. Minor changes in markup

* Update aggregatefunction.md

* Update aggregatefunction.md

* Update aggregatefunction.md

* Update aggregatingmergetree.md

* GraphiteMergeTree docs update.
New syntax for creation of Replicated* tables.
Minor changes in *MergeTree tables creation syntax.

* Markup fix

* Markup and language fixes

* Clarification in the CollapsingMergeTree article

											
										
										
											2018-10-19 11:25:22 +00:00
+								) ENGINE = MergeTree()
 								[PARTITION BY expr]
 								[ORDER BY expr]
-												add ru docs for ALTER ORDER BY [#CLICKHOUSE-3859]

											
										
										
											2018-12-04 17:51:09 +00:00
+								[PRIMARY KEY expr]
-												Updates for Aggregating-,Collapsing-, Replacing- and SummingMergeTree. (#3346)

* Update of english version of descriprion of the table function `file`.

* New syntax for ReplacingMergeTree.
Some improvements in text.

* Significantly change article about SummingMergeTree.
Article is restructured, text is changed in many places of the document. New syntax for table creation is described.

* Descriptions of AggregateFunction and AggregatingMergeTree are updated. Russian version.

* New syntax for new syntax of CREATE TABLE

* Added english docs on Aggregating, Replacing and SummingMergeTree.

* CollapsingMergeTree docs. English version.

* 1. Update of CollapsingMergeTree. 2. Minor changes in markup

* Update aggregatefunction.md

* Update aggregatefunction.md

* Update aggregatefunction.md

* Update aggregatingmergetree.md

* GraphiteMergeTree docs update.
New syntax for creation of Replicated* tables.
Minor changes in *MergeTree tables creation syntax.

* Markup fix

* Markup and language fixes

* Clarification in the CollapsingMergeTree article

											
										
										
											2018-10-19 11:25:22 +00:00
+								[SAMPLE BY expr]
-												DOCAPI-7062: MySQL database engine and MergeTree TTL docs. EN review, RU translation (#6407)

* Update create.md

* Update mergetree.md

* Update index.md

* Update mysql.md

* DOCAPI-7062: RU translation.

* DOCAPI-7062: Fixes

* Update docs/ru/database_engines/index.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/database_engines/mysql.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/database_engines/mysql.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/database_engines/mysql.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/query_language/create.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* DOCAPI-7062: Clarifications and fixes.

* DOCAPI-7062: Clarifications.

* Update docs/en/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/en/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

											
										
										
											2019-08-14 16:42:09 +00:00
+								[TTL expr]
-												Updates for Aggregating-,Collapsing-, Replacing- and SummingMergeTree. (#3346)

* Update of english version of descriprion of the table function `file`.

* New syntax for ReplacingMergeTree.
Some improvements in text.

* Significantly change article about SummingMergeTree.
Article is restructured, text is changed in many places of the document. New syntax for table creation is described.

* Descriptions of AggregateFunction and AggregatingMergeTree are updated. Russian version.

* New syntax for new syntax of CREATE TABLE

* Added english docs on Aggregating, Replacing and SummingMergeTree.

* CollapsingMergeTree docs. English version.

* 1. Update of CollapsingMergeTree. 2. Minor changes in markup

* Update aggregatefunction.md

* Update aggregatefunction.md

* Update aggregatefunction.md

* Update aggregatingmergetree.md

* GraphiteMergeTree docs update.
New syntax for creation of Replicated* tables.
Minor changes in *MergeTree tables creation syntax.

* Markup fix

* Markup and language fixes

* Clarification in the CollapsingMergeTree article

											
										
										
											2018-10-19 11:25:22 +00:00
+								[SETTINGS name=value, ...]
 								```
-												Updated description of MergeTree.

											
										
										
											2018-08-21 07:54:37 +00:00
-												WIP on docs (#3813)

* CLICKHOUSE-4063: less manual html @ index.md

* CLICKHOUSE-4063: recommend markdown="1" in README.md

* CLICKHOUSE-4003: manually purge custom.css for now

* CLICKHOUSE-4064: expand <details> before any print (including to pdf)

* CLICKHOUSE-3927: rearrange interfaces/formats.md a bit

* CLICKHOUSE-3306: add few http headers

* Remove copy-paste introduced in #3392

* Hopefully better chinese fonts #3392

* get rid of tabs @ custom.css

* Apply comments and patch from #3384

* Add jdbc.md to ToC and some translation, though it still looks badly incomplete

* minor punctuation

* Add some backlinks to official website from mirrors that just blindly take markdown sources

* Do not make fonts extra light

* find . -name '*.md' -type f | xargs -I{} perl -pi -e 's//g' {}

* find . -name '*.md' -type f | xargs -I{} perl -pi -e 's/ sql/g' {}

* Remove outdated stuff from roadmap.md

* Not so light font on front page too

* Refactor Chinese formats.md to match recent changes in other languages

* Update some links on front page

* Remove some outdated comment

* Add twitter link to front page

* More front page links tuning

* Add Amsterdam meetup link

* Smaller font to avoid second line

* Add Amsterdam link to README.md

* Proper docs nav translation

* Back to 300 font-weight except Chinese

* fix docs build

* Update Amsterdam link

* remove symlinks

* more zh punctuation

* apply lost comment by @zhang2014

* Apply comments by @zhang2014 from #3417

* Remove Beijing link

* rm incorrect symlink

* restore content of docs/zh/operations/table_engines/index.md

* CLICKHOUSE-3751: stem terms while searching docs

* CLICKHOUSE-3751: use English stemmer in non-English docs too

* CLICKHOUSE-4135 fix

* Remove past meetup link

* Add blog link to top nav

* Add ContentSquare article link

* Add form link to front page + refactor some texts

* couple markup fixes

* minor

* Introduce basic ODBC driver page in docs

* More verbose 3rd party libs disclaimer

* Put third-party stuff into a separate folder

* Separate third-party stuff in ToC too

* Update links

* Move stuff that is not really (only) a client library into a separate page

* Add clickhouse-hdfs-loader link

* Some introduction for "interfaces" section

* Rewrite tcp.md

* http_interface.md -> http.md

* fix link

* Remove unconvenient error for now

* try to guess anchor instead of failing

* remove symlink

* Remove outdated info from introduction

* remove ru roadmap.md

* replace ru roadmap.md with symlink

* Update roadmap.md

* lost file

* Title case in toc_en.yml

* Sync "Functions" ToC section with en

* Remove reference to pretty old ClickHouse release from docs

* couple lost symlinks in fa

* Close quote in proper place

* Rewrite en/getting_started/index.md

* Sync en<>ru getting_started/index.md

* minor changes

* Some gui.md refactoring

* Translate DataGrip section to ru

* Translate DataGrip section to zh

* Translate DataGrip section to fa

* Translate DBeaver section to fa

* Translate DBeaver section to zh

* Split third-party GUI to open-source and commercial

* Mention some RDBMS integrations + ad-hoc translation fixes

* Add rel="external nofollow" to outgoing links from docs

* Lost blank lines

* Fix class name

* More rel="external nofollow"

* Apply suggestions by @sundy-li

* Mobile version of front page improvements

* test

* test 2

* test 3

* Update LICENSE

* minor docs fix

* Highlight current article as suggested by @sundy-li

* fix link destination

* Introduce backup.md (only "en" for now)

* Mention INSERT+SELECT in backup.md

* Some improvements for replication.md

* Add backup.md to toc

* Mention clickhouse-backup tool

* Mention LightHouse in third-party GUI list

* Introduce interfaces/third-party/proxy.md

* Add clickhouse-bulk to proxy.md

* Major extension of integrations.md contents

* fix link target

* remove unneeded file

* better toc item name

* fix markdown

* better ru punctuation

* Add yet another possible backup approach

* Simplify copying permalinks to headers

* Support non-eng link anchors in docs + update some deps

* Generate anchors for single-page mode automatically

* Remove anchors to top of pages

* Remove anchors that nobody links to

* build fixes

* fix few links

* restore css

* fix some links

* restore gifs

* fix lost words

* more docs fixes

* docs fixes

* NULL anchor

* update urllib3 dependency

* more fixes

											
										
										
											2018-12-12 17:28:00 +00:00
+								Описание параметров запроса смотрите в [описании запроса](../../query_language/create.md).
-												Updated description of MergeTree.

											
										
										
											2018-08-21 07:54:37 +00:00
-												DOCAPI-7062: MySQL database engine and MergeTree TTL docs. EN review, RU translation (#6407)

* Update create.md

* Update mergetree.md

* Update index.md

* Update mysql.md

* DOCAPI-7062: RU translation.

* DOCAPI-7062: Fixes

* Update docs/ru/database_engines/index.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/database_engines/mysql.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/database_engines/mysql.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/database_engines/mysql.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/query_language/create.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* DOCAPI-7062: Clarifications and fixes.

* DOCAPI-7062: Clarifications.

* Update docs/en/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/en/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

											
										
										
											2019-08-14 16:42:09 +00:00
+								### Секции запроса
-												Updated description of MergeTree.

											
										
										
											2018-08-21 07:54:37 +00:00
-												DOCAPI-7062: MySQL database engine and MergeTree TTL docs. EN review, RU translation (#6407)

* Update create.md

* Update mergetree.md

* Update index.md

* Update mysql.md

* DOCAPI-7062: RU translation.

* DOCAPI-7062: Fixes

* Update docs/ru/database_engines/index.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/database_engines/mysql.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/database_engines/mysql.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/database_engines/mysql.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/query_language/create.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* DOCAPI-7062: Clarifications and fixes.

* DOCAPI-7062: Clarifications.

* Update docs/en/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/en/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

											
										
										
											2019-08-14 16:42:09 +00:00
+								- `ENGINE` — имя и параметры движка. `ENGINE = MergeTree()`. `MergeTree` не имеет параметров.
-												Updated description of MergeTree.

											
										
										
											2018-08-21 07:54:37 +00:00
-												WIP on docs (#3813)

* CLICKHOUSE-4063: less manual html @ index.md

* CLICKHOUSE-4063: recommend markdown="1" in README.md

* CLICKHOUSE-4003: manually purge custom.css for now

* CLICKHOUSE-4064: expand <details> before any print (including to pdf)

* CLICKHOUSE-3927: rearrange interfaces/formats.md a bit

* CLICKHOUSE-3306: add few http headers

* Remove copy-paste introduced in #3392

* Hopefully better chinese fonts #3392

* get rid of tabs @ custom.css

* Apply comments and patch from #3384

* Add jdbc.md to ToC and some translation, though it still looks badly incomplete

* minor punctuation

* Add some backlinks to official website from mirrors that just blindly take markdown sources

* Do not make fonts extra light

* find . -name '*.md' -type f | xargs -I{} perl -pi -e 's//g' {}

* find . -name '*.md' -type f | xargs -I{} perl -pi -e 's/ sql/g' {}

* Remove outdated stuff from roadmap.md

* Not so light font on front page too

* Refactor Chinese formats.md to match recent changes in other languages

* Update some links on front page

* Remove some outdated comment

* Add twitter link to front page

* More front page links tuning

* Add Amsterdam meetup link

* Smaller font to avoid second line

* Add Amsterdam link to README.md

* Proper docs nav translation

* Back to 300 font-weight except Chinese

* fix docs build

* Update Amsterdam link

* remove symlinks

* more zh punctuation

* apply lost comment by @zhang2014

* Apply comments by @zhang2014 from #3417

* Remove Beijing link

* rm incorrect symlink

* restore content of docs/zh/operations/table_engines/index.md

* CLICKHOUSE-3751: stem terms while searching docs

* CLICKHOUSE-3751: use English stemmer in non-English docs too

* CLICKHOUSE-4135 fix

* Remove past meetup link

* Add blog link to top nav

* Add ContentSquare article link

* Add form link to front page + refactor some texts

* couple markup fixes

* minor

* Introduce basic ODBC driver page in docs

* More verbose 3rd party libs disclaimer

* Put third-party stuff into a separate folder

* Separate third-party stuff in ToC too

* Update links

* Move stuff that is not really (only) a client library into a separate page

* Add clickhouse-hdfs-loader link

* Some introduction for "interfaces" section

* Rewrite tcp.md

* http_interface.md -> http.md

* fix link

* Remove unconvenient error for now

* try to guess anchor instead of failing

* remove symlink

* Remove outdated info from introduction

* remove ru roadmap.md

* replace ru roadmap.md with symlink

* Update roadmap.md

* lost file

* Title case in toc_en.yml

* Sync "Functions" ToC section with en

* Remove reference to pretty old ClickHouse release from docs

* couple lost symlinks in fa

* Close quote in proper place

* Rewrite en/getting_started/index.md

* Sync en<>ru getting_started/index.md

* minor changes

* Some gui.md refactoring

* Translate DataGrip section to ru

* Translate DataGrip section to zh

* Translate DataGrip section to fa

* Translate DBeaver section to fa

* Translate DBeaver section to zh

* Split third-party GUI to open-source and commercial

* Mention some RDBMS integrations + ad-hoc translation fixes

* Add rel="external nofollow" to outgoing links from docs

* Lost blank lines

* Fix class name

* More rel="external nofollow"

* Apply suggestions by @sundy-li

* Mobile version of front page improvements

* test

* test 2

* test 3

* Update LICENSE

* minor docs fix

* Highlight current article as suggested by @sundy-li

* fix link destination

* Introduce backup.md (only "en" for now)

* Mention INSERT+SELECT in backup.md

* Some improvements for replication.md

* Add backup.md to toc

* Mention clickhouse-backup tool

* Mention LightHouse in third-party GUI list

* Introduce interfaces/third-party/proxy.md

* Add clickhouse-bulk to proxy.md

* Major extension of integrations.md contents

* fix link target

* remove unneeded file

* better toc item name

* fix markdown

* better ru punctuation

* Add yet another possible backup approach

* Simplify copying permalinks to headers

* Support non-eng link anchors in docs + update some deps

* Generate anchors for single-page mode automatically

* Remove anchors to top of pages

* Remove anchors that nobody links to

* build fixes

* fix few links

* restore css

* fix some links

* restore gifs

* fix lost words

* more docs fixes

* docs fixes

* NULL anchor

* update urllib3 dependency

* more fixes

											
										
										
											2018-12-12 17:28:00 +00:00
+								- `PARTITION BY` — [ключ партиционирования](custom_partitioning_key.md).
-												docs improvements based on comments [#CLICKHOUSE-3859]

											
										
										
											2018-12-05 11:37:45 +00:00
-												WIP on docs (#3813)

* CLICKHOUSE-4063: less manual html @ index.md

* CLICKHOUSE-4063: recommend markdown="1" in README.md

* CLICKHOUSE-4003: manually purge custom.css for now

* CLICKHOUSE-4064: expand <details> before any print (including to pdf)

* CLICKHOUSE-3927: rearrange interfaces/formats.md a bit

* CLICKHOUSE-3306: add few http headers

* Remove copy-paste introduced in #3392

* Hopefully better chinese fonts #3392

* get rid of tabs @ custom.css

* Apply comments and patch from #3384

* Add jdbc.md to ToC and some translation, though it still looks badly incomplete

* minor punctuation

* Add some backlinks to official website from mirrors that just blindly take markdown sources

* Do not make fonts extra light

* find . -name '*.md' -type f | xargs -I{} perl -pi -e 's//g' {}

* find . -name '*.md' -type f | xargs -I{} perl -pi -e 's/ sql/g' {}

* Remove outdated stuff from roadmap.md

* Not so light font on front page too

* Refactor Chinese formats.md to match recent changes in other languages

* Update some links on front page

* Remove some outdated comment

* Add twitter link to front page

* More front page links tuning

* Add Amsterdam meetup link

* Smaller font to avoid second line

* Add Amsterdam link to README.md

* Proper docs nav translation

* Back to 300 font-weight except Chinese

* fix docs build

* Update Amsterdam link

* remove symlinks

* more zh punctuation

* apply lost comment by @zhang2014

* Apply comments by @zhang2014 from #3417

* Remove Beijing link

* rm incorrect symlink

* restore content of docs/zh/operations/table_engines/index.md

* CLICKHOUSE-3751: stem terms while searching docs

* CLICKHOUSE-3751: use English stemmer in non-English docs too

* CLICKHOUSE-4135 fix

* Remove past meetup link

* Add blog link to top nav

* Add ContentSquare article link

* Add form link to front page + refactor some texts

* couple markup fixes

* minor

* Introduce basic ODBC driver page in docs

* More verbose 3rd party libs disclaimer

* Put third-party stuff into a separate folder

* Separate third-party stuff in ToC too

* Update links

* Move stuff that is not really (only) a client library into a separate page

* Add clickhouse-hdfs-loader link

* Some introduction for "interfaces" section

* Rewrite tcp.md

* http_interface.md -> http.md

* fix link

* Remove unconvenient error for now

* try to guess anchor instead of failing

* remove symlink

* Remove outdated info from introduction

* remove ru roadmap.md

* replace ru roadmap.md with symlink

* Update roadmap.md

* lost file

* Title case in toc_en.yml

* Sync "Functions" ToC section with en

* Remove reference to pretty old ClickHouse release from docs

* couple lost symlinks in fa

* Close quote in proper place

* Rewrite en/getting_started/index.md

* Sync en<>ru getting_started/index.md

* minor changes

* Some gui.md refactoring

* Translate DataGrip section to ru

* Translate DataGrip section to zh

* Translate DataGrip section to fa

* Translate DBeaver section to fa

* Translate DBeaver section to zh

* Split third-party GUI to open-source and commercial

* Mention some RDBMS integrations + ad-hoc translation fixes

* Add rel="external nofollow" to outgoing links from docs

* Lost blank lines

* Fix class name

* More rel="external nofollow"

* Apply suggestions by @sundy-li

* Mobile version of front page improvements

* test

* test 2

* test 3

* Update LICENSE

* minor docs fix

* Highlight current article as suggested by @sundy-li

* fix link destination

* Introduce backup.md (only "en" for now)

* Mention INSERT+SELECT in backup.md

* Some improvements for replication.md

* Add backup.md to toc

* Mention clickhouse-backup tool

* Mention LightHouse in third-party GUI list

* Introduce interfaces/third-party/proxy.md

* Add clickhouse-bulk to proxy.md

* Major extension of integrations.md contents

* fix link target

* remove unneeded file

* better toc item name

* fix markdown

* better ru punctuation

* Add yet another possible backup approach

* Simplify copying permalinks to headers

* Support non-eng link anchors in docs + update some deps

* Generate anchors for single-page mode automatically

* Remove anchors to top of pages

* Remove anchors that nobody links to

* build fixes

* fix few links

* restore css

* fix some links

* restore gifs

* fix lost words

* more docs fixes

* docs fixes

* NULL anchor

* update urllib3 dependency

* more fixes

											
										
										
											2018-12-12 17:28:00 +00:00
+								    Для партиционирования по месяцам используйте выражение `toYYYYMM(date_column)`, где `date_column` — столбец с датой типа [Date](../../data_types/date.md). В этом случае имена партиций имеют формат `"YYYYMM"`.
-												docs improvements based on comments [#CLICKHOUSE-3859]

											
										
										
											2018-12-05 11:37:45 +00:00
 								- `ORDER BY` — ключ сортировки.
-												Updated description of MergeTree.

											
										
										
											2018-08-21 07:54:37 +00:00
-												DOCAPI-5203: Direct I/O settings for MergeTree descriptions. EN review and RU translation. (#4848)


											
										
										
											2019-04-08 16:25:37 +00:00
+								    Кортеж столбцов или произвольных выражений. Пример: `ORDER BY (CounterID, EventDate)`.
-												Updated description of MergeTree.

											
										
										
											2018-08-21 07:54:37 +00:00
-												DOCAPI-5203: Direct I/O settings for MergeTree descriptions. EN review and RU translation. (#4848)


											
										
										
											2019-04-08 16:25:37 +00:00
+								- `PRIMARY KEY` — первичный ключ, если он [отличается от ключа сортировки](mergetree.md).
-												add ru docs for ALTER ORDER BY [#CLICKHOUSE-3859]

											
										
										
											2018-12-04 17:51:09 +00:00
-												DOCAPI-5203: Direct I/O settings for MergeTree descriptions. EN review and RU translation. (#4848)


											
										
										
											2019-04-08 16:25:37 +00:00
+								    По умолчанию первичный ключ совпадает с ключом сортировки (который задаётся секцией `ORDER BY`.) Поэтому в большинстве случаев секцию `PRIMARY KEY` отдельно указывать не нужно.
-												Update mergetree.md
											
										
										
											2018-08-22 06:37:35 +00:00
-												docs improvements based on comments [#CLICKHOUSE-3859]

											
										
										
											2018-12-05 11:37:45 +00:00
+								- `SAMPLE BY` — выражение для сэмплирования.
-												Update mergetree.md
											
										
										
											2018-08-22 06:37:35 +00:00
-												DOCAPI-5203: Direct I/O settings for MergeTree descriptions. EN review and RU translation. (#4848)


											
										
										
											2019-04-08 16:25:37 +00:00
+								    Если используется выражение для сэмплирования, то первичный ключ должен содержать его. Пример:
 								`SAMPLE BY intHash32(UserID) ORDER BY (CounterID, EventDate, intHash32(UserID))`.
-												Update mergetree.md
											
										
										
											2018-08-22 06:32:16 +00:00
-												DOCAPI-7062: MySQL database engine and MergeTree TTL docs. EN review, RU translation (#6407)

* Update create.md

* Update mergetree.md

* Update index.md

* Update mysql.md

* DOCAPI-7062: RU translation.

* DOCAPI-7062: Fixes

* Update docs/ru/database_engines/index.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/database_engines/mysql.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/database_engines/mysql.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/database_engines/mysql.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/query_language/create.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* DOCAPI-7062: Clarifications and fixes.

* DOCAPI-7062: Clarifications.

* Update docs/en/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/en/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

											
										
										
											2019-08-14 16:42:09 +00:00
+								- `TTL` — выражение, определяющее длительность хранения строк.
-												TTL for columns and tables (#4212)

Add TTL for columns and tables.

											
										
										
											2019-04-15 09:30:45 +00:00
-												DOCAPI-7062: MySQL database engine and MergeTree TTL docs. EN review, RU translation (#6407)

* Update create.md

* Update mergetree.md

* Update index.md

* Update mysql.md

* DOCAPI-7062: RU translation.

* DOCAPI-7062: Fixes

* Update docs/ru/database_engines/index.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/database_engines/mysql.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/database_engines/mysql.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/database_engines/mysql.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/query_language/create.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* DOCAPI-7062: Clarifications and fixes.

* DOCAPI-7062: Clarifications.

* Update docs/en/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/en/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

											
										
										
											2019-08-14 16:42:09 +00:00
+								    Должно зависеть от столбца `Date` или `DateTime` и возвращать столбец `Date` или `DateTime`. Пример:`TTL date + INTERVAL 1 DAY`
-												TTL for columns and tables (#4212)

Add TTL for columns and tables.

											
										
										
											2019-04-15 09:30:45 +00:00
-												DOCAPI-7062: MySQL database engine and MergeTree TTL docs. EN review, RU translation (#6407)

* Update create.md

* Update mergetree.md

* Update index.md

* Update mysql.md

* DOCAPI-7062: RU translation.

* DOCAPI-7062: Fixes

* Update docs/ru/database_engines/index.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/database_engines/mysql.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/database_engines/mysql.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/database_engines/mysql.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/query_language/create.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* DOCAPI-7062: Clarifications and fixes.

* DOCAPI-7062: Clarifications.

* Update docs/en/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/en/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

											
										
										
											2019-08-14 16:42:09 +00:00
+								    Дополнительные сведения смотрите в разделе [TTL для столбцов и таблиц](mergetree.md)
-												TTL for columns and tables (#4212)

Add TTL for columns and tables.

											
										
										
											2019-04-15 09:30:45 +00:00
-												Updates for Aggregating-,Collapsing-, Replacing- and SummingMergeTree. (#3346)

* Update of english version of descriprion of the table function `file`.

* New syntax for ReplacingMergeTree.
Some improvements in text.

* Significantly change article about SummingMergeTree.
Article is restructured, text is changed in many places of the document. New syntax for table creation is described.

* Descriptions of AggregateFunction and AggregatingMergeTree are updated. Russian version.

* New syntax for new syntax of CREATE TABLE

* Added english docs on Aggregating, Replacing and SummingMergeTree.

* CollapsingMergeTree docs. English version.

* 1. Update of CollapsingMergeTree. 2. Minor changes in markup

* Update aggregatefunction.md

* Update aggregatefunction.md

* Update aggregatefunction.md

* Update aggregatingmergetree.md

* GraphiteMergeTree docs update.
New syntax for creation of Replicated* tables.
Minor changes in *MergeTree tables creation syntax.

* Markup fix

* Markup and language fixes

* Clarification in the CollapsingMergeTree article

											
										
										
											2018-10-19 11:25:22 +00:00
+								- `SETTINGS` — дополнительные параметры, регулирующие поведение `MergeTree`:
-												Updated description of MergeTree.

											
										
										
											2018-08-21 07:54:37 +00:00
-												DOCAPI-5203: Direct I/O settings for MergeTree descriptions. EN review and RU translation. (#4848)


											
										
										
											2019-04-08 16:25:37 +00:00
+								    - `index_granularity` — гранулярность индекса. Число строк данных между «засечками» индекса. По умолчанию — 8192. Список всех доступных параметров можно посмотреть в [MergeTreeSettings.h](https://github.com/yandex/ClickHouse/blob/master/dbms/src/Storages/MergeTree/MergeTreeSettings.h).
 								    - `min_merge_bytes_to_use_direct_io` — минимальный объем данных, необходимый для прямого (небуферизованного) чтения/записи (direct I/O) на диск. При слиянии частей данных ClickHouse вычисляет общий объем хранения всех данных, подлежащих слиянию. Если общий объем хранения всех данных для чтения превышает `min_bytes_to_use_direct_io` байт, тогда ClickHouse  использует флаг `O_DIRECT` при чтении данных с диска. Если `min_merge_bytes_to_use_direct_io = 0`, тогда прямой ввод-вывод отключен. Значение по умолчанию: `10 * 1024 * 1024 * 1024` байт.
-												DOCAPI-7062: MySQL database engine and MergeTree TTL docs. EN review, RU translation (#6407)

* Update create.md

* Update mergetree.md

* Update index.md

* Update mysql.md

* DOCAPI-7062: RU translation.

* DOCAPI-7062: Fixes

* Update docs/ru/database_engines/index.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/database_engines/mysql.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/database_engines/mysql.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/database_engines/mysql.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/query_language/create.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* DOCAPI-7062: Clarifications and fixes.

* DOCAPI-7062: Clarifications.

* Update docs/en/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/en/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

											
										
										
											2019-08-14 16:42:09 +00:00
+								    <a name="mergetree_setting-merge_with_ttl_timeout"></a>
-												TTL for columns and tables (#4212)

Add TTL for columns and tables.

											
										
										
											2019-04-15 09:30:45 +00:00
+								    - `merge_with_ttl_timeout` - Минимальное время в секундах для повторного выполнения слияний с TTL. По умолчанию - 86400 (1 день).
-												Updated description of MergeTree.

											
										
										
											2018-08-21 07:54:37 +00:00
-												Updates for Aggregating-,Collapsing-, Replacing- and SummingMergeTree. (#3346)

* Update of english version of descriprion of the table function `file`.

* New syntax for ReplacingMergeTree.
Some improvements in text.

* Significantly change article about SummingMergeTree.
Article is restructured, text is changed in many places of the document. New syntax for table creation is described.

* Descriptions of AggregateFunction and AggregatingMergeTree are updated. Russian version.

* New syntax for new syntax of CREATE TABLE

* Added english docs on Aggregating, Replacing and SummingMergeTree.

* CollapsingMergeTree docs. English version.

* 1. Update of CollapsingMergeTree. 2. Minor changes in markup

* Update aggregatefunction.md

* Update aggregatefunction.md

* Update aggregatefunction.md

* Update aggregatingmergetree.md

* GraphiteMergeTree docs update.
New syntax for creation of Replicated* tables.
Minor changes in *MergeTree tables creation syntax.

* Markup fix

* Markup and language fixes

* Clarification in the CollapsingMergeTree article

											
										
										
											2018-10-19 11:25:22 +00:00
+								**Пример задания секций**
-												Updated description of MergeTree.

											
										
										
											2018-08-21 07:54:37 +00:00
-												DOCAPI-7062: MySQL database engine and MergeTree TTL docs. EN review, RU translation (#6407)

* Update create.md

* Update mergetree.md

* Update index.md

* Update mysql.md

* DOCAPI-7062: RU translation.

* DOCAPI-7062: Fixes

* Update docs/ru/database_engines/index.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/database_engines/mysql.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/database_engines/mysql.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/database_engines/mysql.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/query_language/create.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* DOCAPI-7062: Clarifications and fixes.

* DOCAPI-7062: Clarifications.

* Update docs/en/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/en/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

											
										
										
											2019-08-14 16:42:09 +00:00
+								```sql
-												Updated description of MergeTree.

											
										
										
											2018-08-21 07:54:37 +00:00
+								ENGINE MergeTree() PARTITION BY toYYYYMM(EventDate) ORDER BY (CounterID, EventDate, intHash32(UserID)) SAMPLE BY intHash32(UserID) SETTINGS index_granularity=8192
 								```
 								В примере мы устанавливаем партиционирование по месяцам.
-												DOCAPI-6126: Clarification of the 'round' function description. (#4939)

* DOCAPI-6126: Clarification of the 'round' function description.

* DOCAPI-6126: More text for round. EN

* DOCAPI-6126: RU

* DOCAPI-6126: Link fixes.

											
										
										
											2019-04-10 07:17:40 +00:00
+								Также мы задаем выражение для сэмплирования в виде хэша по идентификатору посетителя. Это позволяет псевдослучайным образом перемешать данные в таблице для каждого `CounterID` и `EventDate`. Если при выборке данных задать секцию [SAMPLE](../../query_language/select.md#select-sample-clause), то ClickHouse вернёт равномерно-псевдослучайную выборку данных для подмножества посетителей.
-												DOCAPI-5203: Direct I/O settings for MergeTree descriptions. EN review and RU translation. (#4848)


											
										
										
											2019-04-08 16:25:37 +00:00
-												Updated description of MergeTree.

											
										
										
											2018-08-21 07:54:37 +00:00
+								`index_granularity` можно было не указывать, поскольку 8192 — это значение по умолчанию.
-												Updates for Aggregating-,Collapsing-, Replacing- and SummingMergeTree. (#3346)

* Update of english version of descriprion of the table function `file`.

* New syntax for ReplacingMergeTree.
Some improvements in text.

* Significantly change article about SummingMergeTree.
Article is restructured, text is changed in many places of the document. New syntax for table creation is described.

* Descriptions of AggregateFunction and AggregatingMergeTree are updated. Russian version.

* New syntax for new syntax of CREATE TABLE

* Added english docs on Aggregating, Replacing and SummingMergeTree.

* CollapsingMergeTree docs. English version.

* 1. Update of CollapsingMergeTree. 2. Minor changes in markup

* Update aggregatefunction.md

* Update aggregatefunction.md

* Update aggregatefunction.md

* Update aggregatingmergetree.md

* GraphiteMergeTree docs update.
New syntax for creation of Replicated* tables.
Minor changes in *MergeTree tables creation syntax.

* Markup fix

* Markup and language fixes

* Clarification in the CollapsingMergeTree article

											
										
										
											2018-10-19 11:25:22 +00:00
+								<details markdown="1"><summary>Устаревший способ создания таблицы</summary>
-												Updated description of MergeTree.

											
										
										
											2018-08-21 07:54:37 +00:00
-												Updates for Aggregating-,Collapsing-, Replacing- and SummingMergeTree. (#3346)

* Update of english version of descriprion of the table function `file`.

* New syntax for ReplacingMergeTree.
Some improvements in text.

* Significantly change article about SummingMergeTree.
Article is restructured, text is changed in many places of the document. New syntax for table creation is described.

* Descriptions of AggregateFunction and AggregatingMergeTree are updated. Russian version.

* New syntax for new syntax of CREATE TABLE

* Added english docs on Aggregating, Replacing and SummingMergeTree.

* CollapsingMergeTree docs. English version.

* 1. Update of CollapsingMergeTree. 2. Minor changes in markup

* Update aggregatefunction.md

* Update aggregatefunction.md

* Update aggregatefunction.md

* Update aggregatingmergetree.md

* GraphiteMergeTree docs update.
New syntax for creation of Replicated* tables.
Minor changes in *MergeTree tables creation syntax.

* Markup fix

* Markup and language fixes

* Clarification in the CollapsingMergeTree article

											
										
										
											2018-10-19 11:25:22 +00:00
+								!!! attention
-												Doc fix: Add info about EXTRACT FROM (en, ru) (#4950)


											
										
										
											2019-04-10 18:58:42 +00:00
+								    Не используйте этот способ в новых проектах и по возможности переведите старые проекты на способ, описанный выше.
-												Fixed newlines in .rst files before code blocks [#CLICKHOUSE-2].
for i in $(find . -name '*.rst'); do grep -F -q '.. code-block:: ' $i && cat $i | sed -r -e 's/$/<NEWLINE>/' | tr -d '\n' | sed -r -e 's/([^>])<NEWLINE>.. code-block::/\1<NEWLINE><NEWLINE>.. code-block::/g' | sed -r -e 's/<NEWLINE>/\n/g' > ${i}.tmp && mv ${i}.tmp ${i}; done

											
										
										
											2017-06-13 20:35:07 +00:00
-												Updates for Aggregating-,Collapsing-, Replacing- and SummingMergeTree. (#3346)

* Update of english version of descriprion of the table function `file`.

* New syntax for ReplacingMergeTree.
Some improvements in text.

* Significantly change article about SummingMergeTree.
Article is restructured, text is changed in many places of the document. New syntax for table creation is described.

* Descriptions of AggregateFunction and AggregatingMergeTree are updated. Russian version.

* New syntax for new syntax of CREATE TABLE

* Added english docs on Aggregating, Replacing and SummingMergeTree.

* CollapsingMergeTree docs. English version.

* 1. Update of CollapsingMergeTree. 2. Minor changes in markup

* Update aggregatefunction.md

* Update aggregatefunction.md

* Update aggregatefunction.md

* Update aggregatingmergetree.md

* GraphiteMergeTree docs update.
New syntax for creation of Replicated* tables.
Minor changes in *MergeTree tables creation syntax.

* Markup fix

* Markup and language fixes

* Clarification in the CollapsingMergeTree article

											
										
										
											2018-10-19 11:25:22 +00:00
+								```sql
 								CREATE TABLE [IF NOT EXISTS] [db.]table_name [ON CLUSTER cluster]
 								(
 								    name1 [type1] [DEFAULT|MATERIALIZED|ALIAS expr1],
 								    name2 [type2] [DEFAULT|MATERIALIZED|ALIAS expr2],
 								    ...
 								) ENGINE [=] MergeTree(date-column [, sampling_expression], (primary, key), index_granularity)
-												Updated description of MergeTree.

											
										
										
											2018-08-21 07:54:37 +00:00
+								```
 								**Параметры MergeTree()**
-												Added documentation in RST format. (ReadTheDocs ready)

											
										
										
											2017-03-12 17:58:51 +00:00
-												WIP on docs (#3813)

* CLICKHOUSE-4063: less manual html @ index.md

* CLICKHOUSE-4063: recommend markdown="1" in README.md

* CLICKHOUSE-4003: manually purge custom.css for now

* CLICKHOUSE-4064: expand <details> before any print (including to pdf)

* CLICKHOUSE-3927: rearrange interfaces/formats.md a bit

* CLICKHOUSE-3306: add few http headers

* Remove copy-paste introduced in #3392

* Hopefully better chinese fonts #3392

* get rid of tabs @ custom.css

* Apply comments and patch from #3384

* Add jdbc.md to ToC and some translation, though it still looks badly incomplete

* minor punctuation

* Add some backlinks to official website from mirrors that just blindly take markdown sources

* Do not make fonts extra light

* find . -name '*.md' -type f | xargs -I{} perl -pi -e 's//g' {}

* find . -name '*.md' -type f | xargs -I{} perl -pi -e 's/ sql/g' {}

* Remove outdated stuff from roadmap.md

* Not so light font on front page too

* Refactor Chinese formats.md to match recent changes in other languages

* Update some links on front page

* Remove some outdated comment

* Add twitter link to front page

* More front page links tuning

* Add Amsterdam meetup link

* Smaller font to avoid second line

* Add Amsterdam link to README.md

* Proper docs nav translation

* Back to 300 font-weight except Chinese

* fix docs build

* Update Amsterdam link

* remove symlinks

* more zh punctuation

* apply lost comment by @zhang2014

* Apply comments by @zhang2014 from #3417

* Remove Beijing link

* rm incorrect symlink

* restore content of docs/zh/operations/table_engines/index.md

* CLICKHOUSE-3751: stem terms while searching docs

* CLICKHOUSE-3751: use English stemmer in non-English docs too

* CLICKHOUSE-4135 fix

* Remove past meetup link

* Add blog link to top nav

* Add ContentSquare article link

* Add form link to front page + refactor some texts

* couple markup fixes

* minor

* Introduce basic ODBC driver page in docs

* More verbose 3rd party libs disclaimer

* Put third-party stuff into a separate folder

* Separate third-party stuff in ToC too

* Update links

* Move stuff that is not really (only) a client library into a separate page

* Add clickhouse-hdfs-loader link

* Some introduction for "interfaces" section

* Rewrite tcp.md

* http_interface.md -> http.md

* fix link

* Remove unconvenient error for now

* try to guess anchor instead of failing

* remove symlink

* Remove outdated info from introduction

* remove ru roadmap.md

* replace ru roadmap.md with symlink

* Update roadmap.md

* lost file

* Title case in toc_en.yml

* Sync "Functions" ToC section with en

* Remove reference to pretty old ClickHouse release from docs

* couple lost symlinks in fa

* Close quote in proper place

* Rewrite en/getting_started/index.md

* Sync en<>ru getting_started/index.md

* minor changes

* Some gui.md refactoring

* Translate DataGrip section to ru

* Translate DataGrip section to zh

* Translate DataGrip section to fa

* Translate DBeaver section to fa

* Translate DBeaver section to zh

* Split third-party GUI to open-source and commercial

* Mention some RDBMS integrations + ad-hoc translation fixes

* Add rel="external nofollow" to outgoing links from docs

* Lost blank lines

* Fix class name

* More rel="external nofollow"

* Apply suggestions by @sundy-li

* Mobile version of front page improvements

* test

* test 2

* test 3

* Update LICENSE

* minor docs fix

* Highlight current article as suggested by @sundy-li

* fix link destination

* Introduce backup.md (only "en" for now)

* Mention INSERT+SELECT in backup.md

* Some improvements for replication.md

* Add backup.md to toc

* Mention clickhouse-backup tool

* Mention LightHouse in third-party GUI list

* Introduce interfaces/third-party/proxy.md

* Add clickhouse-bulk to proxy.md

* Major extension of integrations.md contents

* fix link target

* remove unneeded file

* better toc item name

* fix markdown

* better ru punctuation

* Add yet another possible backup approach

* Simplify copying permalinks to headers

* Support non-eng link anchors in docs + update some deps

* Generate anchors for single-page mode automatically

* Remove anchors to top of pages

* Remove anchors that nobody links to

* build fixes

* fix few links

* restore css

* fix some links

* restore gifs

* fix lost words

* more docs fixes

* docs fixes

* NULL anchor

* update urllib3 dependency

* more fixes

											
										
										
											2018-12-12 17:28:00 +00:00
+								- `date-column` — имя столбца с типом [Date](../../data_types/date.md). На основе этого столбца ClickHouse автоматически создаёт партиции по месяцам. Имена партиций имеют формат `"YYYYMM"`.
-												Updated description of MergeTree.

											
										
										
											2018-08-21 07:54:37 +00:00
+								- `sampling_expression` — выражение для сэмплирования.
-												DOCAPI-7062: MySQL database engine and MergeTree TTL docs. EN review, RU translation (#6407)

* Update create.md

* Update mergetree.md

* Update index.md

* Update mysql.md

* DOCAPI-7062: RU translation.

* DOCAPI-7062: Fixes

* Update docs/ru/database_engines/index.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/database_engines/mysql.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/database_engines/mysql.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/database_engines/mysql.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/query_language/create.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* DOCAPI-7062: Clarifications and fixes.

* DOCAPI-7062: Clarifications.

* Update docs/en/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/en/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

											
										
										
											2019-08-14 16:42:09 +00:00
+								- `(primary, key)` — первичный ключ. Тип — [Tuple()](../../data_types/tuple.md)
 								- `index_granularity` — гранулярность индекса. Число строк данных между «засечками» индекса. Для большинства задач подходит значение 8192.
-												Fixed newlines in .rst files before code blocks [#CLICKHOUSE-2].
for i in $(find . -name '*.rst'); do grep -F -q '.. code-block:: ' $i && cat $i | sed -r -e 's/$/<NEWLINE>/' | tr -d '\n' | sed -r -e 's/([^>])<NEWLINE>.. code-block::/\1<NEWLINE><NEWLINE>.. code-block::/g' | sed -r -e 's/<NEWLINE>/\n/g' > ${i}.tmp && mv ${i}.tmp ${i}; done

											
										
										
											2017-06-13 20:35:07 +00:00
-												Updated description of MergeTree.

											
										
										
											2018-08-21 07:54:37 +00:00
+								**Пример**
 								```
-												Replacing 'RestructuredText' sources with the 'Markdown' ones.

											
										
										
											2017-10-25 05:27:09 +00:00
+								MergeTree(EventDate, intHash32(UserID), (CounterID, EventDate, intHash32(UserID)), 8192)
 								```
-												Added documentation in RST format. (ReadTheDocs ready)

											
										
										
											2017-03-12 17:58:51 +00:00
-												Updated description of MergeTree.

											
										
										
											2018-08-21 07:54:37 +00:00
+								Движок `MergeTree` сконфигурирован таким же образом, как и в примере выше для основного способа конфигурирования движка.
-												DOCAPI-7062: MySQL database engine and MergeTree TTL docs. EN review, RU translation (#6407)

* Update create.md

* Update mergetree.md

* Update index.md

* Update mysql.md

* DOCAPI-7062: RU translation.

* DOCAPI-7062: Fixes

* Update docs/ru/database_engines/index.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/database_engines/mysql.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/database_engines/mysql.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/database_engines/mysql.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/query_language/create.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* DOCAPI-7062: Clarifications and fixes.

* DOCAPI-7062: Clarifications.

* Update docs/en/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/en/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

											
										
										
											2019-08-14 16:42:09 +00:00
-												Updates for Aggregating-,Collapsing-, Replacing- and SummingMergeTree. (#3346)

* Update of english version of descriprion of the table function `file`.

* New syntax for ReplacingMergeTree.
Some improvements in text.

* Significantly change article about SummingMergeTree.
Article is restructured, text is changed in many places of the document. New syntax for table creation is described.

* Descriptions of AggregateFunction and AggregatingMergeTree are updated. Russian version.

* New syntax for new syntax of CREATE TABLE

* Added english docs on Aggregating, Replacing and SummingMergeTree.

* CollapsingMergeTree docs. English version.

* 1. Update of CollapsingMergeTree. 2. Minor changes in markup

* Update aggregatefunction.md

* Update aggregatefunction.md

* Update aggregatefunction.md

* Update aggregatingmergetree.md

* GraphiteMergeTree docs update.
New syntax for creation of Replicated* tables.
Minor changes in *MergeTree tables creation syntax.

* Markup fix

* Markup and language fixes

* Clarification in the CollapsingMergeTree article

											
										
										
											2018-10-19 11:25:22 +00:00
+								</details>
-												Updated description of MergeTree.

											
										
										
											2018-08-21 07:54:37 +00:00
 								## Хранение данных
-												Update mergetree.md
											
										
										
											2018-08-22 06:44:04 +00:00
+								Таблица состоит из *кусков* данных (data parts), отсортированных по первичному ключу.
-												Updated description of MergeTree.

											
										
										
											2018-08-21 07:54:37 +00:00
-												Update mergetree.md
											
										
										
											2018-08-22 06:44:04 +00:00
+								При вставке в таблицу создаются отдельные куски данных, каждый из которых лексикографически отсортирован по первичному ключу. Например, если первичный ключ — `(CounterID, Date)`, то данные в куске будут лежать в порядке `CounterID`, а для каждого `CounterID` в порядке `Date`.
-												Updated description of MergeTree.

											
										
										
											2018-08-21 07:54:37 +00:00
-												Updates for Aggregating-,Collapsing-, Replacing- and SummingMergeTree. (#3346)

* Update of english version of descriprion of the table function `file`.

* New syntax for ReplacingMergeTree.
Some improvements in text.

* Significantly change article about SummingMergeTree.
Article is restructured, text is changed in many places of the document. New syntax for table creation is described.

* Descriptions of AggregateFunction and AggregatingMergeTree are updated. Russian version.

* New syntax for new syntax of CREATE TABLE

* Added english docs on Aggregating, Replacing and SummingMergeTree.

* CollapsingMergeTree docs. English version.

* 1. Update of CollapsingMergeTree. 2. Minor changes in markup

* Update aggregatefunction.md

* Update aggregatefunction.md

* Update aggregatefunction.md

* Update aggregatingmergetree.md

* GraphiteMergeTree docs update.
New syntax for creation of Replicated* tables.
Minor changes in *MergeTree tables creation syntax.

* Markup fix

* Markup and language fixes

* Clarification in the CollapsingMergeTree article

											
										
										
											2018-10-19 11:25:22 +00:00
+								Данные, относящиеся к разным партициям, разбиваются на разные куски. В фоновом режиме ClickHouse выполняет слияния (merge) кусков данных для более эффективного хранения. Куски, относящиеся к разным партициям не объединяются. Механизм слияния не гарантирует, что все строки с одинаковым первичным ключом окажутся в одном куске.
-												Updated description of MergeTree.

											
										
										
											2018-08-21 07:54:37 +00:00
-												DOCAPI-5203: Direct I/O settings for MergeTree descriptions. EN review and RU translation. (#4848)


											
										
										
											2019-04-08 16:25:37 +00:00
+								Для каждого куска данных ClickHouse создаёт индексный файл, который содержит значение первичного ключа для каждой индексной строки («засечка»). Номера строк индекса определяются как `n * index_granularity`. Максимальное значение `n` равно целой части деления общего числа строк на `index_granularity`. Для каждого столбца "засечки" также записываются для тех же строк индекса, что и первичный ключ. Эти "засечки" позволяют находить данные непосредственно в столбцах.
-												Updated description of MergeTree.

											
										
										
											2018-08-21 07:54:37 +00:00
-												Update mergetree.md
											
										
										
											2018-08-22 06:44:04 +00:00
+								Вы можете использовать одну большую таблицу, постоянно добавляя в неё данные пачками, именно для этого предназначен движок `MergeTree`.
-												Updated description of MergeTree.

											
										
										
											2018-08-21 07:54:37 +00:00
-												Doc fix: updating sections about the partitioning (en, ru) (#4677)


											
										
										
											2019-03-18 12:48:06 +00:00
+								## Первичные ключи и индексы в запросах {#primary-keys-and-indexes-in-queries}
-												Updated description of MergeTree.

											
										
										
											2018-08-21 07:54:37 +00:00
-												DOCAPI-5203: Direct I/O settings for MergeTree descriptions. EN review and RU translation. (#4848)


											
										
										
											2019-04-08 16:25:37 +00:00
+								Рассмотрим первичный ключ — `(CounterID, Date)`. В этом случае сортировку и индекс можно проиллюстрировать следующим образом:
-												Updated description of MergeTree.

											
										
										
											2018-08-21 07:54:37 +00:00
 								```
 								Whole data:     [-------------------------------------------------------------------------]
 								CounterID:      [aaaaaaaaaaaaaaaaaabbbbcdeeeeeeeeeeeeefgggggggghhhhhhhhhiiiiiiiiikllllllll]
 								Date:           [1111111222222233331233211111222222333211111112122222223111112223311122333]
 								Marks:           |      |      |      |      |      |      |      |      |      |      |
 								                a,1    a,2    a,3    b,3    e,2    e,3    g,1    h,2    i,1    i,3    l,3
 								Marks numbers:   0      1      2      3      4      5      6      7      8      9      10
 								```
 								Если в запросе к данным указать:
 								- `CounterID IN ('a', 'h')`, то сервер читает данные в диапазонах засечек `[0, 3)` и `[6, 8)`.
 								- `CounterID IN ('a', 'h') AND Date = 3`, то сервер читает данные в диапазонах засечек `[1, 3)` и `[7, 8)`.
-'th path have to be included

It seems like 10th path should be included in scanning.
											
										
										
											2018-08-28 12:03:26 +00:00
+								- `Date = 3`, то сервер читает данные в диапазоне засечек `[1, 10]`.
-												Updated description of MergeTree.

											
										
										
											2018-08-21 07:54:37 +00:00
 								Примеры выше показывают, что использование индекса всегда эффективнее, чем full scan.
-												Added documentation in RST format. (ReadTheDocs ready)

											
										
										
											2017-03-12 17:58:51 +00:00
-												Updated description of MergeTree.

											
										
										
											2018-08-21 07:54:37 +00:00
+								Разреженный индекс допускает чтение лишних строк. При чтении одного диапазона первичного ключа, может быть прочитано до `index_granularity * 2` лишних строк в каждом блоке данных. В большинстве случаев ClickHouse не теряет производительности при `index_granularity = 8192`.
-												Added documentation in RST format. (ReadTheDocs ready)

											
										
										
											2017-03-12 17:58:51 +00:00
-												Updated description of MergeTree.

											
										
										
											2018-08-21 07:54:37 +00:00
+								Разреженность индекса позволяет работать даже с очень большим количеством строк в таблицах, поскольку такой индекс всегда помещается в оперативную память компьютера.
-												Added documentation in RST format. (ReadTheDocs ready)

											
										
										
											2017-03-12 17:58:51 +00:00
-												Updated description of MergeTree.

											
										
										
											2018-08-21 07:54:37 +00:00
+								ClickHouse не требует уникального первичного ключа. Можно вставить много строк с одинаковым первичным ключом.
-												Added documentation in RST format. (ReadTheDocs ready)

											
										
										
											2017-03-12 17:58:51 +00:00
-												Updated description of MergeTree.

											
										
										
											2018-08-21 07:54:37 +00:00
+								### Выбор первичного ключа
-												Added documentation in RST format. (ReadTheDocs ready)

											
										
										
											2017-03-12 17:58:51 +00:00
-												Updated description of MergeTree.

											
										
										
											2018-08-21 07:54:37 +00:00
+								Количество столбцов в первичном ключе не ограничено явным образом. В зависимости от структуры данных в первичный ключ можно включать больше или меньше столбцов. Это может:
-												Added documentation in RST format. (ReadTheDocs ready)

											
										
										
											2017-03-12 17:58:51 +00:00
-												Updated description of MergeTree.

											
										
										
											2018-08-21 07:54:37 +00:00
+								- Увеличить эффективность индекса.
-												Added documentation in RST format. (ReadTheDocs ready)

											
										
										
											2017-03-12 17:58:51 +00:00
-												Updated description of MergeTree.

											
										
										
											2018-08-21 07:54:37 +00:00
+								    Пусть первичный ключ — `(a, b)`, тогда добавление ещё одного столбца `c` повысит эффективность, если выполнены условия:
-												Added documentation in RST format. (ReadTheDocs ready)

											
										
										
											2017-03-12 17:58:51 +00:00
-												Updated description of MergeTree.

											
										
										
											2018-08-21 07:54:37 +00:00
+								    - Есть запросы с условием на столбец `c`.
 								    - Часто встречаются достаточно длинные (в несколько раз больше `index_granularity`) диапазоны данных с одинаковыми значениями `(a, b)`. Иначе говоря, когда добавление ещё одного столбца позволит пропускать достаточно длинные диапазоны данных.
-												Added documentation in RST format. (ReadTheDocs ready)

											
										
										
											2017-03-12 17:58:51 +00:00
-												Updated description of MergeTree.

											
										
										
											2018-08-21 07:54:37 +00:00
+								- Улучшить сжатие данных.
 								    ClickHouse сортирует данные по первичному ключу, поэтому чем выше однородность, тем лучше сжатие.
-												WIP on docs (#3813)

* CLICKHOUSE-4063: less manual html @ index.md

* CLICKHOUSE-4063: recommend markdown="1" in README.md

* CLICKHOUSE-4003: manually purge custom.css for now

* CLICKHOUSE-4064: expand <details> before any print (including to pdf)

* CLICKHOUSE-3927: rearrange interfaces/formats.md a bit

* CLICKHOUSE-3306: add few http headers

* Remove copy-paste introduced in #3392

* Hopefully better chinese fonts #3392

* get rid of tabs @ custom.css

* Apply comments and patch from #3384

* Add jdbc.md to ToC and some translation, though it still looks badly incomplete

* minor punctuation

* Add some backlinks to official website from mirrors that just blindly take markdown sources

* Do not make fonts extra light

* find . -name '*.md' -type f | xargs -I{} perl -pi -e 's//g' {}

* find . -name '*.md' -type f | xargs -I{} perl -pi -e 's/ sql/g' {}

* Remove outdated stuff from roadmap.md

* Not so light font on front page too

* Refactor Chinese formats.md to match recent changes in other languages

* Update some links on front page

* Remove some outdated comment

* Add twitter link to front page

* More front page links tuning

* Add Amsterdam meetup link

* Smaller font to avoid second line

* Add Amsterdam link to README.md

* Proper docs nav translation

* Back to 300 font-weight except Chinese

* fix docs build

* Update Amsterdam link

* remove symlinks

* more zh punctuation

* apply lost comment by @zhang2014

* Apply comments by @zhang2014 from #3417

* Remove Beijing link

* rm incorrect symlink

* restore content of docs/zh/operations/table_engines/index.md

* CLICKHOUSE-3751: stem terms while searching docs

* CLICKHOUSE-3751: use English stemmer in non-English docs too

* CLICKHOUSE-4135 fix

* Remove past meetup link

* Add blog link to top nav

* Add ContentSquare article link

* Add form link to front page + refactor some texts

* couple markup fixes

* minor

* Introduce basic ODBC driver page in docs

* More verbose 3rd party libs disclaimer

* Put third-party stuff into a separate folder

* Separate third-party stuff in ToC too

* Update links

* Move stuff that is not really (only) a client library into a separate page

* Add clickhouse-hdfs-loader link

* Some introduction for "interfaces" section

* Rewrite tcp.md

* http_interface.md -> http.md

* fix link

* Remove unconvenient error for now

* try to guess anchor instead of failing

* remove symlink

* Remove outdated info from introduction

* remove ru roadmap.md

* replace ru roadmap.md with symlink

* Update roadmap.md

* lost file

* Title case in toc_en.yml

* Sync "Functions" ToC section with en

* Remove reference to pretty old ClickHouse release from docs

* couple lost symlinks in fa

* Close quote in proper place

* Rewrite en/getting_started/index.md

* Sync en<>ru getting_started/index.md

* minor changes

* Some gui.md refactoring

* Translate DataGrip section to ru

* Translate DataGrip section to zh

* Translate DataGrip section to fa

* Translate DBeaver section to fa

* Translate DBeaver section to zh

* Split third-party GUI to open-source and commercial

* Mention some RDBMS integrations + ad-hoc translation fixes

* Add rel="external nofollow" to outgoing links from docs

* Lost blank lines

* Fix class name

* More rel="external nofollow"

* Apply suggestions by @sundy-li

* Mobile version of front page improvements

* test

* test 2

* test 3

* Update LICENSE

* minor docs fix

* Highlight current article as suggested by @sundy-li

* fix link destination

* Introduce backup.md (only "en" for now)

* Mention INSERT+SELECT in backup.md

* Some improvements for replication.md

* Add backup.md to toc

* Mention clickhouse-backup tool

* Mention LightHouse in third-party GUI list

* Introduce interfaces/third-party/proxy.md

* Add clickhouse-bulk to proxy.md

* Major extension of integrations.md contents

* fix link target

* remove unneeded file

* better toc item name

* fix markdown

* better ru punctuation

* Add yet another possible backup approach

* Simplify copying permalinks to headers

* Support non-eng link anchors in docs + update some deps

* Generate anchors for single-page mode automatically

* Remove anchors to top of pages

* Remove anchors that nobody links to

* build fixes

* fix few links

* restore css

* fix some links

* restore gifs

* fix lost words

* more docs fixes

* docs fixes

* NULL anchor

* update urllib3 dependency

* more fixes

											
										
										
											2018-12-12 17:28:00 +00:00
+								- Обеспечить дополнительную логику при слиянии кусков данных в движках [CollapsingMergeTree](collapsingmergetree.md#table_engine-collapsingmergetree) и [SummingMergeTree](summingmergetree.md).
-												Updated description of MergeTree.

											
										
										
											2018-08-21 07:54:37 +00:00
-												DOCAPI-5203: Direct I/O settings for MergeTree descriptions. EN review and RU translation. (#4848)


											
										
										
											2019-04-08 16:25:37 +00:00
+								    В этом случае имеет смысл указать отдельный *ключ сортировки*, отличающийся от первичного ключа.
-												Updated description of MergeTree.

											
										
										
											2018-08-21 07:54:37 +00:00
 								Длинный первичный ключ будет негативно влиять на производительность вставки и потребление памяти, однако на производительность ClickHouse при запросах `SELECT` лишние столбцы в первичном ключе не влияют.
-												docs improvements based on comments [#CLICKHOUSE-3859]

											
										
										
											2018-12-05 11:37:45 +00:00
+								### Первичный ключ, отличный от ключа сортировки
-												add ru docs for ALTER ORDER BY [#CLICKHOUSE-3859]

											
										
										
											2018-12-04 17:51:09 +00:00
-												docs improvements based on comments [#CLICKHOUSE-3859]

											
										
										
											2018-12-05 11:37:45 +00:00
+								Существует возможность задать первичный ключ (выражение, значения которого будут записаны в индексный файл для
-												Fix typos
											
										
										
											2019-03-21 10:53:46 +00:00
+								каждой засечки), отличный от ключа сортировки (выражение, по которому будут упорядочены строки в кусках
-												docs improvements based on comments [#CLICKHOUSE-3859]

											
										
										
											2018-12-05 11:37:45 +00:00
+								данных). Кортеж выражения первичного ключа при этом должен быть префиксом кортежа выражения ключа
-												add ru docs for ALTER ORDER BY [#CLICKHOUSE-3859]

											
										
										
											2018-12-04 17:51:09 +00:00
+								сортировки.
 								Данная возможность особенно полезна при использовании движков [SummingMergeTree](summingmergetree.md)
 								и [AggregatingMergeTree](aggregatingmergetree.md). В типичном сценарии использования этих движков таблица
 								содержит столбцы двух типов: *измерения* (dimensions) и *меры* (measures). Типичные запросы агрегируют
-												DOCAPI-5203: Direct I/O settings for MergeTree descriptions. EN review and RU translation. (#4848)


											
										
										
											2019-04-08 16:25:37 +00:00
+								значения столбцов-мер с произвольной группировкой и фильтрацией по измерениям. Так как `SummingMergeTree`
 								и `AggregatingMergeTree` производят фоновую агрегацию строк с одинаковым значением ключа сортировки, приходится
-												add ru docs for ALTER ORDER BY [#CLICKHOUSE-3859]

											
										
										
											2018-12-04 17:51:09 +00:00
+								добавлять в него все столбцы-измерения. В результате выражение ключа содержит большой список столбцов,
 								который приходится постоянно расширять при добавлении новых измерений.
-												DOCAPI-5203: Direct I/O settings for MergeTree descriptions. EN review and RU translation. (#4848)


											
										
										
											2019-04-08 16:25:37 +00:00
+								В этом сценарии имеет смысл оставить в первичном ключе всего несколько столбцов, которые обеспечат эффективную фильтрацию по индексу, а остальные столбцы-измерения добавить в выражение ключа сортировки.
-												add ru docs for ALTER ORDER BY [#CLICKHOUSE-3859]

											
										
										
											2018-12-04 17:51:09 +00:00
-												DOCAPI-5203: Direct I/O settings for MergeTree descriptions. EN review and RU translation. (#4848)


											
										
										
											2019-04-08 16:25:37 +00:00
+								[ALTER ключа сортировки](../../query_language/alter.md) — лёгкая операция, так как при одновременном добавлении нового столбца в таблицу и ключ сортировки не нужно изменять данные кусков (они остаются упорядоченными и по новому выражению ключа).
-												add ru docs for ALTER ORDER BY [#CLICKHOUSE-3859]

											
										
										
											2018-12-04 17:51:09 +00:00
-												Updated description of MergeTree.

											
										
										
											2018-08-21 07:54:37 +00:00
+								### Использование индексов и партиций в запросах
 								Для запросов `SELECT` ClickHouse анализирует возможность использования индекса. Индекс может использоваться, если в секции `WHERE/PREWHERE`, в качестве одного из элементов конъюнкции, или целиком, есть выражение, представляющее операции сравнения на равенства, неравенства, а также `IN` или `LIKE` с фиксированным префиксом, над столбцами или выражениями, входящими в первичный ключ или ключ партиционирования, либо над некоторыми частично монотонными функциями от этих столбцов, а также логические связки над такими выражениями.
-												Added documentation in RST format. (ReadTheDocs ready)

											
										
										
											2017-03-12 17:58:51 +00:00
-												Update mergetree.md
											
										
										
											2018-03-15 11:48:19 +00:00
+								Таким образом, обеспечивается возможность быстро выполнять запросы по одному или многим диапазонам первичного ключа. Например, в указанном примере будут быстро работать запросы для конкретного счётчика; для конкретного счётчика и диапазона дат; для конкретного счётчика и даты, для нескольких счётчиков и диапазона дат и т. п.
-												Added documentation in RST format. (ReadTheDocs ready)

											
										
										
											2017-03-12 17:58:51 +00:00
-												Updated description of MergeTree.

											
										
										
											2018-08-21 07:54:37 +00:00
+								Рассмотрим движок сконфигурированный следующим образом:
 								```
 								ENGINE MergeTree() PARTITION BY toYYYYMM(EventDate) ORDER BY (CounterID, EventDate) SETTINGS index_granularity=8192
 								```
 								В этом случае в запросах:
-												DOCAPI-5203: Direct I/O settings for MergeTree descriptions. EN review and RU translation. (#4848)


											
										
										
											2019-04-08 16:25:37 +00:00
+								```sql
-												Replacing 'RestructuredText' sources with the 'Markdown' ones.

											
										
										
											2017-10-25 05:27:09 +00:00
+								SELECT count() FROM table WHERE EventDate = toDate(now()) AND CounterID = 34
 								SELECT count() FROM table WHERE EventDate = toDate(now()) AND (CounterID = 34 OR CounterID = 42)
 								SELECT count() FROM table WHERE ((EventDate >= toDate('2014-01-01') AND EventDate <= toDate('2014-01-31')) OR EventDate = toDate('2014-05-01')) AND CounterID IN (101500, 731962, 160656) AND (CounterID = 101500 OR EventDate != toDate('2014-05-01'))
 								```
-												Added documentation in RST format. (ReadTheDocs ready)

											
										
										
											2017-03-12 17:58:51 +00:00
-												Updated description of MergeTree.

											
										
										
											2018-08-21 07:54:37 +00:00
+								ClickHouse будет использовать индекс по первичному ключу для отсечения не подходящих данных, а также ключ партиционирования по месяцам для отсечения партиций, которые находятся в не подходящих диапазонах дат.
 								Запросы выше показывают, что индекс используется даже для сложных выражений. Чтение из таблицы организовано так, что использование индекса не может быть медленнее, чем full scan.
-												Added documentation in RST format. (ReadTheDocs ready)

											
										
										
											2017-03-12 17:58:51 +00:00
-												Updated description of MergeTree.

											
										
										
											2018-08-21 07:54:37 +00:00
+								В примере ниже индекс не может использоваться.
-												Added documentation in RST format. (ReadTheDocs ready)

											
										
										
											2017-03-12 17:58:51 +00:00
-												DOCAPI-5203: Direct I/O settings for MergeTree descriptions. EN review and RU translation. (#4848)


											
										
										
											2019-04-08 16:25:37 +00:00
+								```sql
-												Replacing 'RestructuredText' sources with the 'Markdown' ones.

											
										
										
											2017-10-25 05:27:09 +00:00
+								SELECT count() FROM table WHERE CounterID = 34 OR URL LIKE '%upyachka%'
 								```
-												Added documentation in RST format. (ReadTheDocs ready)

											
										
										
											2017-03-12 17:58:51 +00:00
-												DOCAPI-5203: Direct I/O settings for MergeTree descriptions. EN review and RU translation. (#4848)


											
										
										
											2019-04-08 16:25:37 +00:00
+								Чтобы проверить, сможет ли ClickHouse использовать индекс при выполнении запроса, используйте настройки [force_index_by_date](../settings/settings.md#settings-force_index_by_date) и [force_primary_key](../settings/settings.md#settings-force_primary_key).
-												`force_index_by_date` and `force_primary_key` are documented.

											
										
										
											2017-09-15 09:00:53 +00:00
-												Updated description of MergeTree.

											
										
										
											2018-08-21 07:54:37 +00:00
+								Ключ партиционирования по месяцам обеспечивает чтение только тех блоков данных, которые содержат даты из нужного диапазона. При этом блок данных может содержать данные за многие даты (до целого месяца). В пределах одного блока данные упорядочены по первичному ключу, который может не содержать дату в качестве первого столбца. В связи с этим, при использовании запроса с указанием условия только на дату, но не на префикс первичного ключа, будет читаться данных больше, чем за одну дату.
-												Added documentation in RST format. (ReadTheDocs ready)

											
										
										
											2017-03-12 17:58:51 +00:00
-												DOCAPI-4148: EN review, RU translation. MergeTree partially monotonic keys (#6085)

* Update http.md

* Update settings.md

* Update mergetree.md

* DOCAPI-6213: RU translastion.

* DOCAPI-4148: 4148

											
										
										
											2019-07-29 10:19:30 +00:00
+								### Использование индекса для частично-монотонных первичных ключей
 								Рассмотрим, например, дни месяца. Они образуют последовательность [монотонную](https://ru.wikipedia.org/wiki/Монотонная_последовательность) в течение одного месяца, но не монотонную на более длительных периодах. Это частично-монотонная последовательность. Если пользователь создаёт таблицу с частично-монотонным первичным ключом, ClickHouse как обычно создаёт разреженный индекс. Когда пользователь выбирает данные из такого рода таблиц, ClickHouse анализирует условия запроса. Если пользователь хочет получить данные между двумя метками индекса, и обе эти метки находятся внутри одного месяца, ClickHouse может использовать индекс в данном конкретном случае, поскольку он может рассчитать расстояние между параметрами запроса и индексными метками.
 								ClickHouse не может использовать индекс, если значения первичного ключа в диапазоне параметров запроса не представляют собой монотонную последовательность. В этом случае ClickHouse использует метод полного сканирования.
 								ClickHouse использует эту логику не только для последовательностей дней месяца, но и для любого частично-монотонного первичного ключа.
-												DOCAPI-5203: Direct I/O settings for MergeTree descriptions. EN review and RU translation. (#4848)


											
										
										
											2019-04-08 16:25:37 +00:00
+								### Дополнительные индексы (Экспериментальная функциональность)
 								Для использования требуется установить настройку `allow_experimental_data_skipping_indices` в 1. (запустить `SET allow_experimental_data_skipping_indices = 1`).
-												docs ru

											
										
										
											2019-01-21 18:35:29 +00:00
-												DOCAPI-5203: Direct I/O settings for MergeTree descriptions. EN review and RU translation. (#4848)


											
										
										
											2019-04-08 16:25:37 +00:00
+								Объявление индексов при определении столбцов в запросе `CREATE`.
 								```sql
 								INDEX index_name expr TYPE type(...) GRANULARITY granularity_value
 								```
-												docs

											
										
										
											2019-02-12 18:02:45 +00:00
-												docs ru

											
										
										
											2019-01-21 18:35:29 +00:00
+								Для таблиц семейства `*MergeTree` можно задать дополнительные индексы в секции столбцов.
-												Fix typos
											
										
										
											2019-03-21 10:53:46 +00:00
+								Индексы агрегируют для заданного выражения некоторые данные, а потом при `SELECT` запросе используют для пропуска блоков данных (пропускаемый блок состоит из гранул данных в количестве равном гранулярности данного индекса), на которых секция `WHERE` не может быть выполнена, тем самым уменьшая объем данных читаемых с диска.
-												docs ru

											
										
										
											2019-01-21 18:35:29 +00:00
-												DOCAPI-5203: Direct I/O settings for MergeTree descriptions. EN review and RU translation. (#4848)


											
										
										
											2019-04-08 16:25:37 +00:00
+								**Пример**
-												docs ru

											
										
										
											2019-01-21 18:35:29 +00:00
+								```sql
 								CREATE TABLE table_name
 								(
 								    u64 UInt64,
 								    i32 Int32,
 								    s String,
 								    ...
 								    INDEX a (u64 * i32, s) TYPE minmax GRANULARITY 3,
-												DOCAPI-5203: Direct I/O settings for MergeTree descriptions. EN review and RU translation. (#4848)


											
										
										
											2019-04-08 16:25:37 +00:00
+								    INDEX b (u64 * length(s)) TYPE set(1000) GRANULARITY 4
-												docs ru

											
										
										
											2019-01-21 18:35:29 +00:00
+								) ENGINE = MergeTree()
 								...
 								```
-												fix docs

											
										
										
											2019-01-22 18:22:16 +00:00
+								Эти индексы смогут использоваться для оптимизации следующих запросов
-												DOCAPI-5203: Direct I/O settings for MergeTree descriptions. EN review and RU translation. (#4848)


											
										
										
											2019-04-08 16:25:37 +00:00
-												docs ru

											
										
										
											2019-01-21 18:35:29 +00:00
+								```sql
 								SELECT count() FROM table WHERE s < 'z'
 								SELECT count() FROM table WHERE u64 * i32 == 10 AND u64 * length(s) >= 1234
 								```
-												docs en

											
										
										
											2019-01-22 14:39:18 +00:00
+								#### Доступные индексы
-												docs ru

											
										
										
											2019-01-21 18:35:29 +00:00
-												unique

											
										
										
											2019-01-29 18:22:12 +00:00
+								* `minmax`
 								Хранит минимум и максимум выражения (если выражение - `tuple`, то для каждого элемента `tuple`), используя их для пропуска блоков аналогично первичному ключу.
-												docs ru

											
										
										
											2019-01-21 18:35:29 +00:00
-												unique -> set : docs

											
										
										
											2019-02-06 20:08:43 +00:00
+								* `set(max_rows)`
-												set(0)

											
										
										
											2019-03-09 18:17:29 +00:00
+								Хранит уникальные значения выражения на блоке в количестве не более `max_rows` (если `max_rows = 0`, то ограничений нет), используя их для пропуска блоков, оценивая выполнимость `WHERE` выражения на хранимых данных.
-												set args

											
										
										
											2019-02-13 19:29:31 +00:00
-												DOCAPI-5203: Direct I/O settings for MergeTree descriptions. EN review and RU translation. (#4848)


											
										
										
											2019-04-08 16:25:37 +00:00
+								**Примеры**
-												unique

											
										
										
											2019-01-29 18:22:12 +00:00
-												docs ru

											
										
										
											2019-01-21 18:35:29 +00:00
+								```sql
-												fix docs

											
										
										
											2019-01-22 18:22:16 +00:00
+								INDEX b (u64 * length(str), i32 + f64 * 100, date, str) TYPE minmax GRANULARITY 4
-												unique -> set : docs

											
										
										
											2019-02-06 20:08:43 +00:00
+								INDEX b (u64 * length(str), i32 + f64 * 100, date, str) TYPE set(100) GRANULARITY 4
-												docs ru

											
										
										
											2019-01-21 18:35:29 +00:00
+								```
-												Updated description of MergeTree.

											
										
										
											2018-08-21 07:54:37 +00:00
+								## Конкурентный доступ к данным
-												Added documentation in RST format. (ReadTheDocs ready)

											
										
										
											2017-03-12 17:58:51 +00:00
-												Updated description of MergeTree.

											
										
										
											2018-08-21 07:54:37 +00:00
+								Для конкурентного доступа к таблице используется мультиверсионность. То есть, при одновременном чтении и обновлении таблицы, данные будут читаться из набора кусочков, актуального на момент запроса. Длинных блокировок нет. Вставки никак не мешают чтениям.
-												Added documentation in RST format. (ReadTheDocs ready)

											
										
										
											2017-03-12 17:58:51 +00:00
-												Updated description of MergeTree.

											
										
										
											2018-08-21 07:54:37 +00:00
+								Чтения из таблицы автоматически распараллеливаются.
-												WIP on docs/website (#3383)

* CLICKHOUSE-4063: less manual html @ index.md

* CLICKHOUSE-4063: recommend markdown="1" in README.md

* CLICKHOUSE-4003: manually purge custom.css for now

* CLICKHOUSE-4064: expand <details> before any print (including to pdf)

* CLICKHOUSE-3927: rearrange interfaces/formats.md a bit

* CLICKHOUSE-3306: add few http headers

* Remove copy-paste introduced in #3392

* Hopefully better chinese fonts #3392

* get rid of tabs @ custom.css

* Apply comments and patch from #3384

* Add jdbc.md to ToC and some translation, though it still looks badly incomplete

* minor punctuation

* Add some backlinks to official website from mirrors that just blindly take markdown sources

* Do not make fonts extra light

* find . -name '*.md' -type f | xargs -I{} perl -pi -e 's//g' {}

* find . -name '*.md' -type f | xargs -I{} perl -pi -e 's/ sql/g' {}

* Remove outdated stuff from roadmap.md

* Not so light font on front page too

* Refactor Chinese formats.md to match recent changes in other languages

											
										
										
											2018-10-16 10:47:17 +00:00
-												DOCAPI-7062: MySQL database engine and MergeTree TTL docs. EN review, RU translation (#6407)

* Update create.md

* Update mergetree.md

* Update index.md

* Update mysql.md

* DOCAPI-7062: RU translation.

* DOCAPI-7062: Fixes

* Update docs/ru/database_engines/index.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/database_engines/mysql.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/database_engines/mysql.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/database_engines/mysql.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/query_language/create.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* DOCAPI-7062: Clarifications and fixes.

* DOCAPI-7062: Clarifications.

* Update docs/en/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/en/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

											
										
										
											2019-08-14 16:42:09 +00:00
+								## TTL для столбцов и таблиц {#table_engine-mergetree-ttl}
 								Определяет время жизни значений.
 								Секция `TTL` может быть установлена как для всей таблицы, так и для каждого отдельного столбца. Если установлены оба `TTL`, то ClickHouse использует тот, что истекает раньше.
 								Таблица должна иметь столбец типа [Date](../../data_types/date.md) или [DateTime](../../data_types/datetime.md). Для установки времени жизни данных, следует использовать операцию со столбцом с временем, например:
 								```
 								TTL time_column
 								TTL time_column + interval
 								```
 								Чтобы задать `interval`, используйте операторы [интервала времени](../../query_language/operators.md#operators-datetime).
 								```
 								TTL date_time + INTERVAL 1 MONTH
 								TTL date_time + INTERVAL 15 HOUR
 								```
 								**TTL столбца**
 								Когда срок действия значений в столбце истечет, ClickHouse заменит их значениями по умолчанию для типа данных столбца. Если срок действия всех значений столбцов в части данных истек, ClickHouse удаляет столбец из куска данных в файловой системе.
 								Секцию `TTL` нельзя использовать для ключевых столбцов.
-												Update mergetree.md

TTL examples
											
										
										
											2019-09-06 15:16:14 +00:00
+								Примеры:
-												Update mergetree.md

TTL examples / Requested change
											
										
										
											2019-09-06 16:57:23 +00:00
+								Создание таблицы с TTL
-												Update mergetree.md

TTL examples
											
										
										
											2019-09-06 15:16:14 +00:00
+								```sql
-												Update mergetree.md

TTL examples
											
										
										
											2019-09-06 15:26:51 +00:00
+								CREATE TABLE example_table
-												Update mergetree.md

TTL examples
											
										
										
											2019-09-06 15:16:14 +00:00
+								(
 								    d DateTime,
-												Update mergetree.md

TTL examples / Requested change
											
										
										
											2019-09-06 16:57:23 +00:00
+								    a Int TTL d + INTERVAL 1 MONTH,
 								    b Int TTL d + INTERVAL 1 MONTH,
-												Update mergetree.md

TTL examples
											
										
										
											2019-09-06 15:16:14 +00:00
+								    c String
 								)
 								ENGINE = MergeTree
 								PARTITION BY toYYYYMM(d)
 								ORDER BY d;
-												Update mergetree.md

TTL examples / Requested change
											
										
										
											2019-09-06 16:57:23 +00:00
+								```
-												Update mergetree.md

TTL examples
											
										
										
											2019-09-06 15:16:14 +00:00
-												Update mergetree.md

TTL examples / Requested change
											
										
										
											2019-09-06 16:57:23 +00:00
+								Добавление TTL на колонку существующей таблицы
-												Update mergetree.md

TTL examples
											
										
										
											2019-09-06 15:16:14 +00:00
-												Update mergetree.md

TTL examples / Requested change
											
										
										
											2019-09-06 16:57:23 +00:00
+								```sql
-												Update mergetree.md

TTL examples
											
										
										
											2019-09-06 15:26:51 +00:00
+								ALTER TABLE example_table
-												Update mergetree.md

TTL examples
											
										
										
											2019-09-06 15:16:14 +00:00
+								    MODIFY COLUMN
-												Update mergetree.md

TTL examples / Requested change
											
										
										
											2019-09-06 16:57:23 +00:00
+								    c String TTL d + INTERVAL 1 DAY;
 								```
-												Update mergetree.md

TTL examples
											
										
										
											2019-09-06 15:16:14 +00:00
-												Update mergetree.md

TTL examples / Requested change
											
										
										
											2019-09-06 16:57:23 +00:00
+								Изменение TTL у колонки
 								```sql
-												Update mergetree.md

TTL examples
											
										
										
											2019-09-06 15:26:51 +00:00
+								ALTER TABLE example_table
-												Update mergetree.md

TTL examples
											
										
										
											2019-09-06 15:16:14 +00:00
+								    MODIFY COLUMN
-												Update mergetree.md

TTL examples / Requested change
											
										
										
											2019-09-06 16:57:23 +00:00
+								    c String TTL d + INTERVAL 1 MONTH;
-												Update mergetree.md

TTL examples
											
										
										
											2019-09-06 15:16:14 +00:00
+								```
-												DOCAPI-7062: MySQL database engine and MergeTree TTL docs. EN review, RU translation (#6407)

* Update create.md

* Update mergetree.md

* Update index.md

* Update mysql.md

* DOCAPI-7062: RU translation.

* DOCAPI-7062: Fixes

* Update docs/ru/database_engines/index.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/database_engines/mysql.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/database_engines/mysql.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/database_engines/mysql.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/query_language/create.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* DOCAPI-7062: Clarifications and fixes.

* DOCAPI-7062: Clarifications.

* Update docs/en/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/en/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

											
										
										
											2019-08-14 16:42:09 +00:00
+								**TTL таблицы**
 								Когда некоторые данные в таблице устаревают, ClickHouse удаляет все соответствующие строки.
-												TTL for columns and tables (#4212)

Add TTL for columns and tables.

											
										
										
											2019-04-15 09:30:45 +00:00
-												Update mergetree.md

TTL examples
											
										
										
											2019-09-06 15:16:14 +00:00
+								Примеры:
 								```sql
-												Update mergetree.md

TTL examples
											
										
										
											2019-09-06 15:26:51 +00:00
+								CREATE TABLE example_table
-												Update mergetree.md

TTL examples
											
										
										
											2019-09-06 15:16:14 +00:00
+								(
 								    d DateTime,
 								    a Int
 								)
 								ENGINE = MergeTree
 								PARTITION BY toYYYYMM(d)
 								ORDER BY d
-												Update mergetree.md

TTL examples / Requested change
											
										
										
											2019-09-06 16:57:23 +00:00
+								TTL d + INTERVAL 1 MONTH;
 								```
-												Update mergetree.md

TTL examples
											
										
										
											2019-09-06 15:16:14 +00:00
-												Update mergetree.md

TTL examples / Requested change
											
										
										
											2019-09-06 16:57:23 +00:00
+								Изменение TTL
-												Update mergetree.md

TTL examples
											
										
										
											2019-09-06 15:16:14 +00:00
-												Update mergetree.md

TTL examples / Requested change
											
										
										
											2019-09-06 16:57:23 +00:00
+								```sql
-												Update mergetree.md

TTL examples
											
										
										
											2019-09-06 15:26:51 +00:00
+								ALTER TABLE example_table
-												Update mergetree.md

TTL examples / Requested change
											
										
										
											2019-09-06 16:57:23 +00:00
+								    MODIFY TTL d + INTERVAL 1 DAY;
-												Update mergetree.md

TTL examples
											
										
										
											2019-09-06 15:16:14 +00:00
+								```
-												TTL for columns and tables (#4212)

Add TTL for columns and tables.

											
										
										
											2019-04-15 09:30:45 +00:00
-												DOCAPI-7062: MySQL database engine and MergeTree TTL docs. EN review, RU translation (#6407)

* Update create.md

* Update mergetree.md

* Update index.md

* Update mysql.md

* DOCAPI-7062: RU translation.

* DOCAPI-7062: Fixes

* Update docs/ru/database_engines/index.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/database_engines/mysql.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/database_engines/mysql.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/database_engines/mysql.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/query_language/create.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* DOCAPI-7062: Clarifications and fixes.

* DOCAPI-7062: Clarifications.

* Update docs/en/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/en/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

											
										
										
											2019-08-14 16:42:09 +00:00
+								**Удаление данных**
-												TTL for columns and tables (#4212)

Add TTL for columns and tables.

											
										
										
											2019-04-15 09:30:45 +00:00
-												DOCAPI-7062: MySQL database engine and MergeTree TTL docs. EN review, RU translation (#6407)

* Update create.md

* Update mergetree.md

* Update index.md

* Update mysql.md

* DOCAPI-7062: RU translation.

* DOCAPI-7062: Fixes

* Update docs/ru/database_engines/index.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/database_engines/mysql.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/database_engines/mysql.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/database_engines/mysql.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/query_language/create.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* DOCAPI-7062: Clarifications and fixes.

* DOCAPI-7062: Clarifications.

* Update docs/en/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/en/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

											
										
										
											2019-08-14 16:42:09 +00:00
+								Данные с истекшим TTL удаляются, когда ClickHouse мёржит куски данных.
-												TTL for columns and tables (#4212)

Add TTL for columns and tables.

											
										
										
											2019-04-15 09:30:45 +00:00
-												DOCAPI-7062: MySQL database engine and MergeTree TTL docs. EN review, RU translation (#6407)

* Update create.md

* Update mergetree.md

* Update index.md

* Update mysql.md

* DOCAPI-7062: RU translation.

* DOCAPI-7062: Fixes

* Update docs/ru/database_engines/index.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/database_engines/mysql.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/database_engines/mysql.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/database_engines/mysql.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/query_language/create.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* DOCAPI-7062: Clarifications and fixes.

* DOCAPI-7062: Clarifications.

* Update docs/en/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/en/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

											
										
										
											2019-08-14 16:42:09 +00:00
+								Когда ClickHouse видит, что некоторые данные устарели, он выполняет внеплановые мёржи. Для управление частотой подобных мёржей, можно задать настройку [merge_with_ttl_timeout](#mergetree_setting-merge_with_ttl_timeout). Если её значение слишком низкое, придется выполнять много внеплановых мёржей, которые могут начать потреблять значительную долю ресурсов сервера.
-												TTL for columns and tables (#4212)

Add TTL for columns and tables.

											
										
										
											2019-04-15 09:30:45 +00:00
-												DOCAPI-7062: MySQL database engine and MergeTree TTL docs. EN review, RU translation (#6407)

* Update create.md

* Update mergetree.md

* Update index.md

* Update mysql.md

* DOCAPI-7062: RU translation.

* DOCAPI-7062: Fixes

* Update docs/ru/database_engines/index.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/database_engines/mysql.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/database_engines/mysql.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/database_engines/mysql.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/ru/query_language/create.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* DOCAPI-7062: Clarifications and fixes.

* DOCAPI-7062: Clarifications.

* Update docs/en/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

* Update docs/en/operations/table_engines/mergetree.md

Co-Authored-By: Ivan Blinkov <github@blinkov.ru>

											
										
										
											2019-08-14 16:42:09 +00:00
+								Если вы выполните запрос `SELECT` между слияниями вы можете получить устаревшие данные. Чтобы избежать этого используйте запрос [OPTIMIZE](../../query_language/misc.md#misc_operations-optimize) перед `SELECT`.
-												TTL for columns and tables (#4212)

Add TTL for columns and tables.

											
										
										
											2019-04-15 09:30:45 +00:00
-												WIP on docs/website (#3383)

* CLICKHOUSE-4063: less manual html @ index.md

* CLICKHOUSE-4063: recommend markdown="1" in README.md

* CLICKHOUSE-4003: manually purge custom.css for now

* CLICKHOUSE-4064: expand <details> before any print (including to pdf)

* CLICKHOUSE-3927: rearrange interfaces/formats.md a bit

* CLICKHOUSE-3306: add few http headers

* Remove copy-paste introduced in #3392

* Hopefully better chinese fonts #3392

* get rid of tabs @ custom.css

* Apply comments and patch from #3384

* Add jdbc.md to ToC and some translation, though it still looks badly incomplete

* minor punctuation

* Add some backlinks to official website from mirrors that just blindly take markdown sources

* Do not make fonts extra light

* find . -name '*.md' -type f | xargs -I{} perl -pi -e 's//g' {}

* find . -name '*.md' -type f | xargs -I{} perl -pi -e 's/ sql/g' {}

* Remove outdated stuff from roadmap.md

* Not so light font on front page too

* Refactor Chinese formats.md to match recent changes in other languages

											
										
										
											2018-10-16 10:47:17 +00:00
+								[Оригинальная статья](https://clickhouse.yandex/docs/ru/operations/table_engines/mergetree/) <!--hide-->
-												Add ru docs (first version)

											
										
										
											2019-09-12 17:31:19 +00:00
 								## Хранение данных таблицы на нескольких блочных устройствах {#table_engine-mergetree-multiple-volumes}
 								### Общее
-												Better docs

											
										
										
											2019-09-13 10:44:10 +00:00
+								Данные таблиц семейства MergeTree могут храниться на нескольких блочных устройствах. Это может оказаться полезным, например, при неявном разделении данных одной таблицы на "горячие" и "холодные", когда наиболее свежая часть занимает малый объем и запрашивается регулярно, а большой хвост исторических данных запрашивается редко. При наличии в системе нескольких дисков, "горячая" часть данных может быть размещена на быстрых дисках (NVMe SSDs), а холодная на более медленных (HDD).
 								Минимальной перемещаемой единицей для MergeTree является кусок (part). Данные одного куска могут находится только на одном диске. Куски могут перемещаться между дисками в фоне, согласно пользовательским настройкам, а также с помощью [`ALTER`](../../query_language/alter.md#alter_move-partition) запросов.
-												Add ru docs (first version)

											
										
										
											2019-09-12 17:31:19 +00:00
 								### Термины
-												Better docs

											
										
										
											2019-09-13 10:44:10 +00:00
+								* Диск — примонтированное в файловой системе блочное устройство.
 								* Диск по умолчанию — путь на файловой системе, указанный в `<path>` в основной конфигурации.
 								* Том (Volume) — упорядоченный набор равноценных дисков (схоже с [JBOD](https://ru.wikipedia.org/wiki/JBOD))
 								* Политика хранения (StoragePolicy) — множество томов с правилами перемещения данных между ними.
-												Add ru docs (first version)

											
										
										
											2019-09-12 17:31:19 +00:00
-												Better docs

											
										
										
											2019-09-13 10:44:10 +00:00
+								У всех описанных сущностей, при создании, указываются имена, которые будут отражены в системных таблицах `system.storage_policies` и `system.disks`. Имя политики хранения используется как настройка у таблиц семейства MergeTree.
-												Add ru docs (first version)

											
										
										
											2019-09-12 17:31:19 +00:00
 								### Конфигурация
-												Better docs

											
										
										
											2019-09-13 10:44:10 +00:00
+								Диски, тома и политики хранения задаются в конфигурации сервера.
-												Add ru docs (first version)

											
										
										
											2019-09-12 17:31:19 +00:00
 								Конфигурация дисков имеет следующую структуру:
-												Better docs

											
										
										
											2019-09-13 10:44:10 +00:00
+								```xml
-												Add ru docs (first version)

											
										
										
											2019-09-12 17:31:19 +00:00
+								<disks>
 								    <fast_disk> <!-- disk name -->
 								        <path>/mnt/fast_ssd/clickhouse</path>
 								    </fast_disk>
-												Better docs

											
										
										
											2019-09-13 10:44:10 +00:00
+								    <disk1>
 								        <path>/mnt/hdd1/clickhouse</path>
-												Add ru docs (first version)

											
										
										
											2019-09-12 17:31:19 +00:00
+								        <keep_free_space_bytes>10485760</keep_free_space_bytes>_
-												Better docs

											
										
										
											2019-09-13 10:44:10 +00:00
+								    </disk1>
 								    <disk2>
 								        <path>/mnt/hdd2/clickhouse</path>
 								        <keep_free_space_bytes>10485760</keep_free_space_bytes>_
 								    </disk2>
-												Add ru docs (first version)

											
										
										
											2019-09-12 17:31:19 +00:00
+								    ...
 								</disks>
 								```
 								* имя диска задается внутри имени тега.
-												Better docs

											
										
										
											2019-09-13 10:44:10 +00:00
+								* `path` — путь по которому будут храниться данные сервера (каталоги `data`, `shadow`), должен быть терминирован `/`.
 								* `keep_free_space_bytes` — размер зарезервированного свободного места на диске.
-												Add ru docs (first version)

											
										
										
											2019-09-12 17:31:19 +00:00
 								Порядок задания дисков не имеет значения.
 								Конфигурация политик хранения:
-												Better docs

											
										
										
											2019-09-13 10:44:10 +00:00
+								```xml
-												Add ru docs (first version)

											
										
										
											2019-09-12 17:31:19 +00:00
+								<policies>
-												Better docs

											
										
										
											2019-09-13 10:44:10 +00:00
+								    <hdd_in_order> <!-- policy name -->
-												Add ru docs (first version)

											
										
										
											2019-09-12 17:31:19 +00:00
+								        <volumes>
 								            <single> <!-- volume name -->
-												Better docs

											
										
										
											2019-09-13 10:44:10 +00:00
+								                <disk>disk1</disk>
 								                <disk>disk2</disk>
-												Add ru docs (first version)

											
										
										
											2019-09-12 17:31:19 +00:00
+								            </single>
 								        </volumes>
-												Better docs

											
										
										
											2019-09-13 10:44:10 +00:00
+								    </hdd_in_order>
-												Add ru docs (first version)

											
										
										
											2019-09-12 17:31:19 +00:00
 								    <moving_from_ssd_to_hdd>
 								        <volumes>
 								            <hot>
 								                <disk>fast_ssd</disk>
 								                <max_data_part_size_bytes>1073741824</max_data_part_size_bytes>
 								            </hot>
 								            <cold>
-												Better docs

											
										
										
											2019-09-13 10:44:10 +00:00
+								                <disk>disk1</disk>
-												Add ru docs (first version)

											
										
										
											2019-09-12 17:31:19 +00:00
+								            </cold>
 								            <move_factor>0.2</move_factor>
 								        </volumes>
 								    </moving_from_ssd_to_hdd>
 								</policies>
 								```
 								* имя политики и тома задаются внутри имен тегов.
-												Better docs

											
										
										
											2019-09-13 10:44:10 +00:00
+								* `disk` — диск, находящийся внутри тома.
 								* `max_data_part_size_bytes` — максимальный размер куска, который может находится на любом из дисков этого тома.
 								* `move_factor` — доля свободного места, при превышении которого данные начинают перемещаться на следующий том, если он есть (по умолчанию 0.1).
-												Add ru docs (first version)

											
										
										
											2019-09-12 17:31:19 +00:00
-												Better docs

											
										
										
											2019-09-13 10:44:10 +00:00
+								Порядок томов в политиках хранения важен, при достижении условий на переполнение тома данные переносятся на следующий. Порядок дисков в томах так же важен, данные пишутся по очереди на каждый из них.
-												Add ru docs (first version)

											
										
										
											2019-09-12 17:31:19 +00:00
-												Better docs

											
										
										
											2019-09-13 10:44:10 +00:00
+								После задания конфигурации дисков и политик хранения их можно использовать, как настройку при создании таблиц:
-												Add ru docs (first version)

											
										
										
											2019-09-12 17:31:19 +00:00
-												Better docs

											
										
										
											2019-09-13 10:44:10 +00:00
+								```sql
-												Add ru docs (first version)

											
										
										
											2019-09-12 17:31:19 +00:00
+								CREATE TABLE table_with_non_default_policy (
 								    EventDate Date,
 								    OrderID UInt64,
 								    BannerID UInt64,
 								    SearchPhrase String
 								) ENGINE = MergeTree()
 								ORDER BY (OrderID, BannerID)
 								PARTITION BY toYYYYMM(EventDate)
 								SETTINGS storage_policy_name='moving_from_ssd_to_hdd'
 								```
-												Better docs

											
										
										
											2019-09-13 10:44:10 +00:00
+								Все куски такой таблицы больше 1GB будут писаться сразу на диск `disk1`. Также, при заполнении диска `fast_ssd` более чем на 80% данные будут переносится на диск `disk1` фоновым процессом.
-												Add ru docs (first version)

											
										
										
											2019-09-12 17:31:19 +00:00
-												Better docs

											
										
										
											2019-09-13 10:44:10 +00:00
+								По умолчанию используется политика хранения `default` в которой есть один том и один диск, указанный в `<path>`.
-												Add ru docs (first version)

											
										
										
											2019-09-12 17:31:19 +00:00
 								### Особенности работы
 								В таблицах MergeTree данные попадают на диск несколькими способами:
 								* В результате вставки (запрос `INSERT`).
 								* В фоновых операциях слияний и мутаций.
 								* При скачивании данных с другой реплики.
-												Better docs

											
										
										
											2019-09-13 10:44:10 +00:00
+								* В результате заморозки партиций [`ALTER TABLE ... FREEZE PARTITION`](../../query_language/alter.md#alter_freeze-partition).
 								Во всех случаях, кроме мутаций и заморозки партиций, при записи куска выбирается том и диск в соответствии с указанной конфигурацией хранилища:
 . Выбирается первый по порядку том, на котором есть свободное место для записи куска (`unreserved_space > current_part_size`) и который позволяет записывать куски требуемого размера `max_data_part_size_bytes > current_part_size`.
 . Внутри тома выбирается следующий диск после того, на который была предыдущая запись и на котором свободного места больше чем размер куска (`unreserved_space - keep_free_space_bytes > current_part_size`)
 								Мутации и запросы заморозки партиций в реализации используют [жесткие ссылки](https://ru.wikipedia.org/wiki/%D0%96%D1%91%D1%81%D1%82%D0%BA%D0%B0%D1%8F_%D1%81%D1%81%D1%8B%D0%BB%D0%BA%D0%B0). Жесткие ссылки между различными дисками не поддерживаются, поэтому в случае таких операций куски размещаются на тех же дисках, что и исходные.
 								В фоне куски перемещаются между томами на основе информации о занятом месте (настройка `move_factor`) по порядку, в котором указаны тома в конфигурации. Данные никогда не перемещаются с последнего тома и на первый том.
 								С помощью запроса `ALTER TABLE ... MOVE PART|PARTITION ... TO VOLUME|DISK ...` пользователь может принудительно перенести кусок или партицию с одного раздела на другой. При этом учитываются все ограничения, указанные для фоновых операций. В случае недостатка места или неудовлетворения ограничениям пользователь получит сообщение об ошибки.
 								Перемещения данных не взаимодействуют с репликацией данных, поэтому на разных репликах одной и той же таблицы могут быть указаны разные политики хранения.
 								После выполнения фоновых слияний или мутаций старые куски не удаляются сразу, а через некоторое время (табличная настройка `old_parts_lifetime`). Также они не перемещаются на другие тома или диски, поэтому до момента удаления они продолжают учитываться при подсчёте занятого дискового пространства.