--- toc_priority: 38 toc_title: GraphiteMergeTree --- # GraphiteMergeTree {#graphitemergetree} Движок предназначен для прореживания и агрегирования/усреднения (rollup) данных [Graphite](http://graphite.readthedocs.io/en/latest/index.html). Он может быть интересен разработчикам, которые хотят использовать ClickHouse как хранилище данных для Graphite. Если rollup не требуется, то для хранения данных Graphite можно использовать любой движок таблиц ClickHouse, в противном случае используйте `GraphiteMergeTree`. Движок уменьшает объём хранения и повышает эффективность запросов от Graphite. Движок наследует свойства от [MergeTree](mergetree.md). ## Создание таблицы {#creating-table} ``` sql CREATE TABLE [IF NOT EXISTS] [db.]table_name [ON CLUSTER cluster] ( Path String, Time DateTime, Value , Version ... ) ENGINE = GraphiteMergeTree(config_section) [PARTITION BY expr] [ORDER BY expr] [SAMPLE BY expr] [SETTINGS name=value, ...] ``` Смотрите описание запроса [CREATE TABLE](../../../engines/table-engines/mergetree-family/graphitemergetree.md#create-table-query). В таблице должны быть столбцы для следующих данных: - Название метрики (сенсора Graphite). Тип данных: `String`. - Время измерения метрики. Тип данных `DateTime`. - Значение метрики. Тип данных: любой числовой. - Версия метрики. Тип данных: любой числовой. ClickHouse сохраняет строки с последней версией или последнюю записанную строку, если версии совпадают. Другие строки удаляются при слиянии кусков данных. Имена этих столбцов должны быть заданы в конфигурации rollup. **Параметры GraphiteMergeTree** - `config_section` — имя раздела в конфигурационном файле, в котором находятся правила rollup. **Секции запроса** При создании таблицы `GraphiteMergeTree` используются те же [секции](mergetree.md#table_engine-mergetree-creating-a-table) запроса, что и при создании таблицы `MergeTree`.
Устаревший способ создания таблицы !!! attention "Attention" Не используйте этот способ в новых проектах и по возможности переведите старые проекты на способ описанный выше. ``` sql CREATE TABLE [IF NOT EXISTS] [db.]table_name [ON CLUSTER cluster] ( EventDate Date, Path String, Time DateTime, Value , Version ... ) ENGINE [=] GraphiteMergeTree(date-column [, sampling_expression], (primary, key), index_granularity, config_section) ``` Все параметры, кроме `config_section` имеют то же значение, что в `MergeTree`. - `config_section` — имя раздела в конфигурационном файле, в котором находятся правила rollup.
## Конфигурация Rollup {#rollup-configuration} Настройки прореживания данных задаются параметром [graphite_rollup](../../../operations/server-configuration-parameters/settings.md#server_configuration_parameters-graphite) в конфигурации сервера . Имя параметра может быть любым. Можно создать несколько конфигураций и использовать их для разных таблиц. Структура конфигурации rollup: ``` text required-columns patterns ``` ### Требуемые столбцы (required-columns) {#required-columns} - `path_column_name` — столбец, в котором хранится название метрики (сенсор Graphite). Значение по умолчанию: `Path`. - `time_column_name` — столбец, в котором хранится время измерения метрики. Значение по умолчанию: `Time`. - `value_column_name` — столбец со значением метрики в момент времени, установленный в `time_column_name`. Значение по умолчанию: `Value`. - `version_column_name` — столбец, в котором хранится версия метрики. Значение по умолчанию: `Timestamp`. ### Правила (patterns) {#patterns} Структура раздела `patterns`: ``` text pattern regexp function pattern regexp age + precision ... pattern regexp function age + precision ... pattern ... default function age + precision ... ``` !!! warning "Внимание" Правила должны быть строго упорядочены: 1. Правила без `function` или `retention`. 1. Правила одновремено содержащие `function` и `retention`. 1. Правило `default`. При обработке строки ClickHouse проверяет правила в разделе `pattern`. Каждый `pattern` (включая `default`) может содержать параметр агрегации `function`, параметр `retention`, или оба параметра одновременно. Если имя метрики соответствует шаблону `regexp`, то применяются правила `pattern`, в противном случае правило `default`. Поля для разделов `pattern` и `default`: - `regexp` – шаблон имени метрики. - `age` – минимальный возраст данных в секундах. - `precision` – точность определения возраста данных в секундах. Должен быть делителем для 86400 (количество секунд в сутках). - `function` – имя агрегирующей функции, которую следует применить к данным, чей возраст оказался в интервале `[age, age + precision]`. Допустимые функции: min/max/any/avg. Avg вычисляется неточно, как среднее от средних. ### Пример конфигурации {#configuration-example} ``` xml Version click_cost any 0 5 86400 60 max 0 60 3600 300 86400 3600 ``` !!! warning "Внимание" Прореживание данных производится во время слияний. Обычно для старых партций слияния не запускаются, поэтому для прореживания надо иницировать незапланированное слияние используя [optimize](../../../sql-reference/statements/optimize/). Или использовать дополнительные инструменты, например [graphite-ch-optimizer](https://github.com/innogames/graphite-ch-optimizer).