From d895b39fa05a0b797006b27fef20172ad052af5b Mon Sep 17 00:00:00 2001 From: BayoNet Date: Tue, 4 Jun 2019 17:09:19 +0300 Subject: [PATCH] DOCAPI-6427: Settings for formats. EN review and RU translation. (#5423) --- docs/en/interfaces/formats.md | 2 +- docs/en/operations/settings/settings.md | 16 ++++++--- docs/ru/interfaces/formats.md | 2 ++ docs/ru/operations/settings/settings.md | 46 ++++++++++++++++++++++--- 4 files changed, 57 insertions(+), 9 deletions(-) diff --git a/docs/en/interfaces/formats.md b/docs/en/interfaces/formats.md index 875c28b31d3..d72b77b1737 100644 --- a/docs/en/interfaces/formats.md +++ b/docs/en/interfaces/formats.md @@ -31,7 +31,7 @@ The table below lists supported formats and how they can be used in `INSERT` and | [XML](#xml) | ✗ | ✔ | | [CapnProto](#capnproto) | ✔ | ✗ | -You can control some format processing parameters by the ClickHouse settings. For more information read the [Settings](../operations/settings/settings.md) section. +You can control some format processing parameters with the ClickHouse settings. For more information read the [Settings](../operations/settings/settings.md) section. ## TabSeparated {#tabseparated} diff --git a/docs/en/operations/settings/settings.md b/docs/en/operations/settings/settings.md index c9e9a343fd3..420ae9b7a3e 100644 --- a/docs/en/operations/settings/settings.md +++ b/docs/en/operations/settings/settings.md @@ -210,11 +210,16 @@ Default value: 0. ## input_format_skip_unknown_fields {#settings-input_format_skip_unknown_fields} -Enables or disables skipping of insertion of extra data. +Enables or disables skipping insertion of extra data. When writing data, ClickHouse throws an exception if input data contain columns that do not exist in the target table. If skipping is enabled, ClickHouse doesn't insert extra data and doesn't throw an exception. -Supported formats: [JSONEachRow](../../interfaces/formats.md#jsoneachrow), [CSVWithNames](../../interfaces/formats.md#csvwithnames), [TabSeparatedWithNames](../../interfaces/formats.md#tabseparatedwithnames), [TSKV](../../interfaces/formats.md#tskv). +Supported formats: + +- [JSONEachRow](../../interfaces/formats.md#jsoneachrow) +- [CSVWithNames](../../interfaces/formats.md#csvwithnames) +- [TabSeparatedWithNames](../../interfaces/formats.md#tabseparatedwithnames) +- [TSKV](../../interfaces/formats.md#tskv) Possible values: @@ -227,9 +232,12 @@ Default value: 0. Enables or disables checking the column order when inserting data. -We recommend disabling check, if you are sure that the column order of the input data is the same as in the target table. It increases ClickHouse performance. +To improve insert performance, we recommend disabling this check if you are sure that the column order of the input data is the same as in the target table. -Supported formats: [CSVWithNames](../../interfaces/formats.md#csvwithnames), [TabSeparatedWithNames](../../interfaces/formats.md#tabseparatedwithnames). +Supported formats: + +- [CSVWithNames](../../interfaces/formats.md#csvwithnames) +- [TabSeparatedWithNames](../../interfaces/formats.md#tabseparatedwithnames) Possible values: diff --git a/docs/ru/interfaces/formats.md b/docs/ru/interfaces/formats.md index abaa8fd8fdd..0168439d297 100644 --- a/docs/ru/interfaces/formats.md +++ b/docs/ru/interfaces/formats.md @@ -30,6 +30,8 @@ ClickHouse может принимать (`INSERT`) и отдавать (`SELECT | [XML](#xml) | ✗ | ✔ | | [CapnProto](#capnproto) | ✔ | ✗ | +Вы можете регулировать некоторые параметры работы с форматами с помощью настроек ClickHouse. За дополнительной информацией обращайтесь к разделу [Настройки](../operations/settings/settings.md). + ## TabSeparated {#tabseparated} В TabSeparated формате данные пишутся по строкам. Каждая строчка содержит значения, разделённые табами. После каждого значения идёт таб, кроме последнего значения в строке, после которого идёт перевод строки. Везде подразумеваются исключительно unix-переводы строк. Последняя строка также обязана содержать перевод строки на конце. Значения пишутся в текстовом виде, без обрамляющих кавычек, с экранированием служебных символов. diff --git a/docs/ru/operations/settings/settings.md b/docs/ru/operations/settings/settings.md index c53c71bb8f4..010d2153a35 100644 --- a/docs/ru/operations/settings/settings.md +++ b/docs/ru/operations/settings/settings.md @@ -196,12 +196,50 @@ Ok. !!! note "Примечание" Функциональность расширенного обмена данными потребляет дополнительные вычислительные ресурсы на сервере и может снизить производительность. -**Возможные значения** +Возможные значения: - 0 — выключена. - 1 — включена. -**Значение по умолчанию**: 0. +Значение по умолчанию: 0. + +## input_format_skip_unknown_fields {#settings-input_format_skip_unknown_fields} + +Включает или отключает пропускание вставки неизвестных данных. + +При записи данных, если входные данные содержат столбцы, которых нет в целевой таблице, ClickHouse генерирует исключение. Если пропускание вставки включено, ClickHouse не вставляет неизвестные данные и не генерирует исключение. + +Поддерживаемые форматы: + +- [JSONEachRow](../../interfaces/formats.md#jsoneachrow) +- [CSVWithNames](../../interfaces/formats.md#csvwithnames) +- [TabSeparatedWithNames](../../interfaces/formats.md#tabseparatedwithnames) +- [TSKV](../../interfaces/formats.md#tskv) + +Возможные значения: + +- 0 — выключена. +- 1 — включена. + +Значение по умолчанию: 0. + +## input_format_with_names_use_header {#settings-input_format_with_names_use_header} + +Включает или отключает проверку порядка столбцов при вставке данных. + +Чтобы повысить производительность вставки, рекомендуется отключить эту проверку, если вы уверены, что порядок столбцов входных данных такой же, как в целевой таблице. + +Поддерживаемые форматы: + +- [CSVWithNames](../../interfaces/formats.md#csvwithnames) +- [TabSeparatedWithNames](../../interfaces/formats.md#tabseparatedwithnames) + +Возможные значения: + +- 0 — выключена. +- 1 — включена. + +Значение по умолчанию: 1. ## join_default_strictness {#settings-join_default_strictness} @@ -222,7 +260,7 @@ Ok. **Возможные значения** - 0 — пустые ячейки заполняются значением по умолчанию соответствующего типа поля. -- 1 — `JOIN` ведет себя как в стандартном SQL. Тип соответствующего поля преобразуется в [Nullable](../../data_types/nullable.md#data_type-nullable), а пустые ячейки заполняются значениями [NULL](../../query_language/syntax.md). +- 1 — `JOIN` ведёт себя как в стандартном SQL. Тип соответствующего поля преобразуется в [Nullable](../../data_types/nullable.md#data_type-nullable), а пустые ячейки заполняются значениями [NULL](../../query_language/syntax.md). **Значение по умолчанию**: 0. @@ -432,7 +470,7 @@ ClickHouse использует этот параметр при чтении д Использовать ли кэш разжатых блоков. Принимает 0 или 1. По умолчанию - 0 (выключено). -Использование кэша несжатых блоков (только для таблиц семейства MergeTree) может существенно сократить задержку и увеличить пропускную способность при работе с большим количеством коротких запросов. Включите эту настройку для пользователей, от которых идут частые короткие запросы. Также обратите внимание на конфигурационный параметр [uncompressed_cache_size](../server_settings/settings.md#server-settings-uncompressed_cache_size) (настраивается только в конфигурационном файле) - размер кэша разжатых блоков. По умолчанию - 8 GiB. Кэш разжатых блоков заполняется по мере надобности, а наиболее невостребованные данные автоматически удаляются. +Использование кэша несжатых блоков (только для таблиц семейства MergeTree) может существенно сократить задержку и увеличить пропускную способность при работе с большим количеством коротких запросов. Включите эту настройку для пользователей, от которых идут частые короткие запросы. Также обратите внимание на конфигурационный параметр [uncompressed_cache_size](../server_settings/settings.md#server-settings-uncompressed_cache_size) (настраивается только в конфигурационном файле) – размер кэша разжатых блоков. По умолчанию - 8 GiB. Кэш разжатых блоков заполняется по мере надобности, а наиболее невостребованные данные автоматически удаляются. Для запросов, читающих хоть немного приличный объём данных (миллион строк и больше), кэш разжатых блоков автоматически выключается, чтобы оставить место для действительно мелких запросов. Поэтому, можно держать настройку `use_uncompressed_cache` всегда выставленной в 1.