ClickHouse/docs/ru/operations/settings/merge-tree-settings.md

96 lines
6.7 KiB
Markdown
Raw Normal View History

2020-04-09 21:45:29 +00:00
# Настройки MergeTree таблиц {#merge-tree-settings}
2020-04-10 13:48:53 +00:00
Значения настроек merge-tree (для всех MergeTree таблиц) можно посмотреть в таблице `system.merge_tree_settings`, их можно переопределить в `config.xml` в секции `merge_tree`, или задать в секции `SETTINGS` у каждой таблицы.
2020-04-09 21:45:29 +00:00
2020-04-10 13:38:58 +00:00
Пример переопределения в `config.xml`:
``` text
2020-04-09 21:45:29 +00:00
<merge_tree>
<max_suspicious_broken_parts>5</max_suspicious_broken_parts>
</merge_tree>
```
2020-04-10 13:38:58 +00:00
Пример для определения в `SETTINGS` у конкретной таблицы:
``` sql
2020-04-09 21:45:29 +00:00
CREATE TABLE foo
(
`A` Int64
)
ENGINE = MergeTree
ORDER BY tuple()
SETTINGS max_suspicious_broken_parts = 500;
```
2020-04-10 13:48:53 +00:00
Пример изменения настроек у конкретной таблицы командой `ALTER TABLE ... MODIFY SETTING`:
``` sql
2020-04-09 21:45:29 +00:00
ALTER TABLE foo
MODIFY SETTING max_suspicious_broken_parts = 100;
```
## parts\_to\_throw\_insert {#parts-to-throw-insert}
2020-04-09 21:45:29 +00:00
2020-04-10 01:35:28 +00:00
Eсли число кусков в партиции превышает значение `parts_to_throw_insert`, INSERT прерывается с исключением `Too many parts (N). Merges are processing significantly slower than inserts`.
2020-04-09 21:45:29 +00:00
Возможные значения:
- Положительное целое число.
2020-04-09 21:45:29 +00:00
Значение по умолчанию: 300.
Для достижения максимальной производительности запросов `SELECT` необходимо минимизировать количество обрабатываемых кусков, см. [Дизайн MergeTree](../../development/architecture.md#merge-tree).
2020-04-09 22:19:42 +00:00
2020-04-10 01:35:28 +00:00
Можно установить большее значение 600 (1200), это уменьшит вероятность возникновения ошибки `Too many parts`, но в тоже время вы позже обнаружите возможную проблему со слияниями (например, из-за недостатка места на диске) и деградацию производительности `SELECT`.
2020-04-09 21:45:29 +00:00
## parts\_to\_delay\_insert {#parts-to-delay-insert}
2020-04-09 21:45:29 +00:00
2020-04-10 01:35:28 +00:00
Eсли число кусков в партиции превышает значение `parts_to_delay_insert`, `INSERT` искусственно замедляется.
2020-04-09 21:45:29 +00:00
Возможные значения:
- Положительное целое число.
2020-04-09 21:45:29 +00:00
Значение по умолчанию: 150.
ClickHouse искусственно выполняет `INSERT` дольше (добавляет sleep), чтобы фоновый механизм слияния успевал слиять куски быстрее, чем они добавляются.
2020-04-09 21:45:29 +00:00
## max\_delay\_to\_insert {#max-delay-to-insert}
2020-04-09 21:45:29 +00:00
Величина в секундах, которая используется для расчета задержки `INSERT`, если число кусков в партиции превышает значение [parts\_to\_delay\_insert](#parts-to-delay-insert).
2020-04-09 21:45:29 +00:00
Возможные значения:
- Положительное целое число.
2020-04-09 21:45:29 +00:00
Значение по умолчанию: 1.
2020-04-09 22:17:12 +00:00
Величина задержи (в миллисекундах) для `INSERT` вычисляется по формуле:
``` code
max_k = parts_to_throw_insert - parts_to_delay_insert
k = 1 + parts_count_in_partition - parts_to_delay_insert
delay_milliseconds = pow(max_delay_to_insert * 1000, k / max_k)
```
Т.е. если в партиции уже 299 кусков и parts\_to\_throw\_insert = 300, parts\_to\_delay\_insert = 150, max\_delay\_to\_insert = 1, `INSERT` замедлится на `pow( 1 * 1000, (1 + 299 - 150) / (300 - 150) ) = 1000` миллисекунд.
## old\_parts\_lifetime {#old-parts-lifetime}
2020-04-10 00:16:48 +00:00
Время (в секундах) хранения неактивных кусков, для защиты от потери данных при спонтанной перезагрузке сервера или О.С.
Возможные значения:
- Положительное целое число.
2020-04-10 00:16:48 +00:00
Значение по умолчанию: 480.
2020-04-10 00:23:12 +00:00
После слияния нескольких кусков в новый кусок, ClickHouse помечает исходные куски как неактивные и удаляет их после `old_parts_lifetime` секунд.
Неактивные куски удаляются, если они не используются в текущих запросах, т.е. если счетчик ссылок куска `refcount` равен нулю.
2020-04-10 00:23:12 +00:00
Неактивные куски удаляются не сразу, потому что при записи нового куска не вызывается `fsync`, т.е. некоторое время новый кусок находится только в оперативной памяти сервера (кеше О.С.). Т.о. при спонтанной перезагрузке сервера новый (смерженный) кусок может быть потерян или испорчен. В этом случае ClickHouse в процессе старта при проверке целостности кусков обнаружит проблему, вернет неактивные куски в список активных и позже заново их смержит. Сломанный кусок в этом случае переименовывается (добавляется префикс broken\_) и перемещается в папку detached. Если проверка целостности не обнаруживает проблем в смерженном куске, то исходные неактивные куски переименовываются (добавляется префикс ignored\_) и перемещаются в папку detached.
2020-04-09 21:45:29 +00:00
Стандартное значение Linux dirty\_expire\_centisecs - 30 секунд (максимальное время, которое записанные данные хранятся только в оперативной памяти), но при больших нагрузках на дисковую систему, данные могут быть записаны намного позже. Экспериментально было найдено время - 480 секунд, за которое гарантированно новый кусок будет записан на диск.
2020-04-09 21:45:29 +00:00
[Оригинальная статья](https://clickhouse.tech/docs/ru/operations/settings/merge_tree_settings/) <!--hide-->