ClickHouse/docs/ru/engines/table-engines/integrations/kafka.md

---
slug: /ru/engines/table-engines/integrations/kafka
sidebar_position: 8
sidebar_label: Kafka
---

# Kafka {#kafka}

Движок работает с [Apache Kafka](http://kafka.apache.org/).

Kafka позволяет:

-   Публиковать/подписываться на потоки данных.
-   Организовать отказоустойчивое хранилище.
-   Обрабатывать потоки по мере их появления.

## Создание таблицы {#table_engine-kafka-creating-a-table}

``` sql
CREATE TABLE [IF NOT EXISTS] [db.]table_name [ON CLUSTER cluster]
(
    name1 [type1] [DEFAULT|MATERIALIZED|ALIAS expr1],
    name2 [type2] [DEFAULT|MATERIALIZED|ALIAS expr2],
    ...
) ENGINE = Kafka()
SETTINGS
    kafka_broker_list = 'host:port',
    kafka_topic_list = 'topic1,topic2,...',
    kafka_group_name = 'group_name',
    kafka_format = 'data_format'[,]
    [kafka_row_delimiter = 'delimiter_symbol',]
    [kafka_schema = '',]
    [kafka_num_consumers = N,]
    [kafka_max_block_size = 0,]
    [kafka_skip_broken_messages = N]
    [kafka_commit_every_batch = 0,]
    [kafka_client_id = '',]
    [kafka_poll_timeout_ms = 0,]
    [kafka_poll_max_batch_size = 0,]
    [kafka_flush_interval_ms = 0,]
    [kafka_thread_per_consumer = 0,]
    [kafka_handle_error_mode = 'default',]
    [kafka_commit_on_select = false,]
    [kafka_max_rows_per_message = 1];
```

Обязательные параметры:

-   `kafka_broker_list` — перечень брокеров, разделенный запятыми (`localhost:9092`).
-   `kafka_topic_list` — перечень необходимых топиков Kafka.
-   `kafka_group_name` — группа потребителя Kafka. Отступы для чтения отслеживаются для каждой группы отдельно. Если необходимо, чтобы сообщения не повторялись на кластере, используйте везде одно имя группы.
-   `kafka_format` — формат сообщений. Названия форматов должны быть теми же, что можно использовать в секции `FORMAT`, например, `JSONEachRow`. Подробнее читайте в разделе [Форматы](../../../interfaces/formats.md).

Опциональные параметры:

-   `kafka_row_delimiter` — символ-разделитель записей (строк), которым завершается сообщение.
-   `kafka_schema` — опциональный параметр, необходимый, если используется формат, требующий определения схемы. Например, [Cap’n Proto](https://capnproto.org/) требует путь к файлу со схемой и название корневого объекта `schema.capnp:Message`.
-   `kafka_num_consumers` — количество потребителей (consumer) на таблицу. По умолчанию: `1`. Укажите больше потребителей, если пропускная способность одного потребителя недостаточна. Общее число потребителей не должно превышать количество партиций в топике, так как на одну партицию может быть назначено не более одного потребителя.
-   `kafka_max_block_size` — максимальный размер пачек (в сообщениях) для poll (по умолчанию `max_block_size`).
-   `kafka_skip_broken_messages` — максимальное количество некорректных сообщений в блоке. Если `kafka_skip_broken_messages = N`, то движок отбрасывает `N` сообщений Кафки, которые не получилось обработать. Одно сообщение в точности соответствует одной записи (строке). Значение по умолчанию – 0.
-   `kafka_commit_every_batch` — включает или отключает режим записи каждой принятой и обработанной пачки по отдельности вместо единой записи целого блока (по умолчанию `0`).
-   `kafka_client_id` — идентификатор клиента. Значение по умолчанию пусто – ''.
-   `kafka_poll_timeout_ms` - Таймаут для poll. По умолчанию: (../../../operations/settings/settings.md#stream_poll_timeout_ms)
-   `kafka_poll_max_batch_size` - Максимальное количество сообщений в одном poll Kafka. По умолчанию: (../../../operations/settings/settings.md#setting-max_block_size)
-   `kafka_flush_interval_ms` - Таймаут для сброса данных из Kafka. По умолчанию: (../../../operations/settings/settings.md#stream-flush-interval-ms)
-   `kafka_thread_per_consumer` — включает или отключает предоставление отдельного потока каждому потребителю (по умолчанию `0`). При включенном режиме каждый потребитель сбрасывает данные независимо и параллельно, при отключённом — строки с данными от нескольких потребителей собираются в один блок.
-   `kafka_handle_error_mode` - Способ обработки ошибок для Kafka. Возможные значения: default, stream.
-   `kafka_commit_on_select` - Сообщение о commit при запросе select. По умолчанию: `false`.
-   `kafka_max_rows_per_message` - Максимальное количество строк записанных в одно сообщение Kafka для формата row-based. По умолчанию: `1`.

Примеры

``` sql
  CREATE TABLE queue (
    timestamp UInt64,
    level String,
    message String
  ) ENGINE = Kafka('localhost:9092', 'topic', 'group1', 'JSONEachRow');

  SELECT * FROM queue LIMIT 5;

  CREATE TABLE queue2 (
    timestamp UInt64,
    level String,
    message String
  ) ENGINE = Kafka SETTINGS kafka_broker_list = 'localhost:9092',
                            kafka_topic_list = 'topic',
                            kafka_group_name = 'group1',
                            kafka_format = 'JSONEachRow',
                            kafka_num_consumers = 4;

  CREATE TABLE queue2 (
    timestamp UInt64,
    level String,
    message String
  ) ENGINE = Kafka('localhost:9092', 'topic', 'group1')
              SETTINGS kafka_format = 'JSONEachRow',
                       kafka_num_consumers = 4;
```

<details markdown="1">

<summary>Устаревший способ создания таблицы</summary>

:::note "Attention"
Не используйте этот метод в новых проектах. По возможности переключите старые проекты на метод, описанный выше.
:::

``` sql
Kafka(kafka_broker_list, kafka_topic_list, kafka_group_name, kafka_format
      [, kafka_row_delimiter, kafka_schema, kafka_num_consumers, kafka_skip_broken_messages])
```

</details>

## Описание {#opisanie}

Полученные сообщения отслеживаются автоматически, поэтому из одной группы каждое сообщение считывается только один раз. Если необходимо получить данные дважды, то создайте копию таблицы с другим именем группы.

Группы пластичны и синхронизированы на кластере. Например, если есть 10 топиков и 5 копий таблицы в кластере, то в каждую копию попадет по 2 топика. Если количество копий изменится, то распределение топиков по копиям изменится автоматически. Подробно читайте об этом на http://kafka.apache.org/intro.

Чтение сообщения с помощью `SELECT` не слишком полезно (разве что для отладки), поскольку каждое сообщения может быть прочитано только один раз. Практичнее создавать потоки реального времени с помощью материализованных преставлений. Для этого:

1.  Создайте потребителя Kafka с помощью движка и рассматривайте его как поток данных.
2.  Создайте таблицу с необходимой структурой.
3.  Создайте материализованное представление, которое преобразует данные от движка и помещает их в ранее созданную таблицу.

Когда к движку присоединяется материализованное представление (`MATERIALIZED VIEW`), оно начинает в фоновом режиме собирать данные. Это позволяет непрерывно получать сообщения от Kafka и преобразовывать их в необходимый формат с помощью `SELECT`.
Материализованных представлений у одной kafka таблицы может быть сколько угодно, они не считывают данные из таблицы kafka непосредственно, а получают новые записи (блоками), таким образом можно писать в несколько таблиц с разным уровнем детализации (с группировкой - агрегацией и без).

Пример:

``` sql
  CREATE TABLE queue (
    timestamp UInt64,
    level String,
    message String
  ) ENGINE = Kafka('localhost:9092', 'topic', 'group1', 'JSONEachRow');

  CREATE TABLE daily (
    day Date,
    level String,
    total UInt64
  ) ENGINE = SummingMergeTree(day, (day, level), 8192);

  CREATE MATERIALIZED VIEW consumer TO daily
    AS SELECT toDate(toDateTime(timestamp)) AS day, level, count() as total
    FROM queue GROUP BY day, level;

  SELECT level, sum(total) FROM daily GROUP BY level;
```

Для улучшения производительности полученные сообщения группируются в блоки размера [max_insert_block_size](../../../operations/settings/settings.md#settings-max_insert_block_size). Если блок не удалось сформировать за [stream_flush_interval_ms](../../../operations/settings/settings.md#stream-flush-interval-ms) миллисекунд, то данные будут сброшены в таблицу независимо от полноты блока.

Чтобы остановить получение данных топика или изменить логику преобразования, отсоедините материализованное представление:

``` sql
  DETACH TABLE consumer;
  ATTACH TABLE consumer;
```

Если необходимо изменить целевую таблицу с помощью `ALTER`, то материализованное представление рекомендуется отключить, чтобы избежать несостыковки между целевой таблицей и данными от представления.

## Конфигурация {#konfiguratsiia}

Аналогично GraphiteMergeTree, движок Kafka поддерживает расширенную конфигурацию с помощью конфигурационного файла ClickHouse. Существует два конфигурационных ключа, которые можно использовать: глобальный (`kafka`) и по топикам (`kafka_topic_*`). Сначала применяется глобальная конфигурация, затем конфигурация по топикам (если она существует).

``` xml
  <!-- Global configuration options for all tables of Kafka engine type -->
  <kafka>
    <debug>cgrp</debug>
    <auto_offset_reset>smallest</auto_offset_reset>
  </kafka>

  <!-- Configuration specific for topic "logs" -->
  <kafka_logs>
    <retry_backoff_ms>250</retry_backoff_ms>
    <fetch_min_bytes>100000</fetch_min_bytes>
  </kafka_logs>
```

В документе [librdkafka configuration reference](https://github.com/edenhill/librdkafka/blob/master/CONFIGURATION.md) можно увидеть список возможных опций конфигурации. Используйте подчеркивание (`_`) вместо точки в конфигурации ClickHouse. Например, `check.crcs=true` будет соответствовать `<check_crcs>true</check_crcs>`.

### Поддержка Kerberos {#kafka-kerberos-support}

Чтобы начать работу с Kafka с поддержкой Kerberos, добавьте дочерний элемент `security_protocol` со значением `sasl_plaintext`. Этого будет достаточно, если получен тикет на получение тикета (ticket-granting ticket) Kerberos и он кэшируется средствами ОС.
ClickHouse может поддерживать учетные данные Kerberos с помощью файла keytab. Рассмотрим дочерние элементы `sasl_kerberos_service_name`, `sasl_kerberos_keytab` и `sasl_kerberos_principal`.

Пример:

``` xml
  <!-- Kerberos-aware Kafka -->
  <kafka>
    <security_protocol>SASL_PLAINTEXT</security_protocol>
	<sasl_kerberos_keytab>/home/kafkauser/kafkauser.keytab</sasl_kerberos_keytab>
	<sasl_kerberos_principal>kafkauser/kafkahost@EXAMPLE.COM</sasl_kerberos_principal>
  </kafka>
```

## Виртуальные столбцы {#virtualnye-stolbtsy}

-   `_topic` — топик Kafka.
-   `_key` — ключ сообщения.
-   `_offset` — оффсет сообщения.
-   `_timestamp` — временная метка сообщения.
-   `_timestamp_ms` — временная метка сообщения в миллисекундах.
-   `_partition` — секция топика Kafka.
-   `_headers.name` - Массив ключей заголовков сообщений.
-   `_headers.value` - Массив значений заголовков сообщений.

**Смотрите также**

-   [Виртуальные столбцы](index.md#table_engines-virtual_columns)
-   [background_message_broker_schedule_pool_size](../../../operations/server-configuration-parameters/settings.md#background_message_broker_schedule_pool_size)
-												DOCSUP-2806: Add meta header in RU (#15801)

* DOCSUP-2806: Add meta intro.

* DOCSUP-2806: Update meta intro.

* DOCSUP-2806: Fix meta.

* DOCSUP-2806: Add quotes for meta headers.

* DOCSUP-2806: Remove quotes from meta headers.

* DOCSUP-2806: Add meta headers.

* DOCSUP-2806: Fix quotes in meta headers.

* DOCSUP-2806: Update meta headers.

* DOCSUP-2806: Fix link to nowhere in EN.

* DOCSUP-2806: Fix link (settings to tune)

* DOCSUP-2806: Fix links.

* DOCSUP-2806:Fix links EN

* DOCSUP-2806: Fix build errors.

* DOCSUP-2806: Fix meta intro.

* DOCSUP-2806: Fix toc_priority in examples datasets TOC.

* DOCSUP-2806: Fix items order in toc.

* DOCSUP-2806: Fix order in toc.

* DOCSUP-2806: Fix toc order.

* DOCSUP-2806: Fix order in toc.

* DOCSUP-2806: Fix toc index in create

* DOCSUP-2806: Fix toc order in create.

Co-authored-by: romanzhukov <romanzhukov@yandex-team.ru>
Co-authored-by: alexey-milovidov <milovidov@yandex-team.ru>
											
										
										
											2020-10-26 10:29:30 +00:00
+								---
-												add slugs to all docs

											
										
										
											2022-08-26 17:37:11 +00:00
+								slug: /ru/engines/table-engines/integrations/kafka
-												Removed /ja folder, cleaned up /ru markdown

											
										
										
											2022-04-09 13:29:05 +00:00
+								sidebar_position: 8
 								sidebar_label: Kafka
-												DOCSUP-2806: Add meta header in RU (#15801)

* DOCSUP-2806: Add meta intro.

* DOCSUP-2806: Update meta intro.

* DOCSUP-2806: Fix meta.

* DOCSUP-2806: Add quotes for meta headers.

* DOCSUP-2806: Remove quotes from meta headers.

* DOCSUP-2806: Add meta headers.

* DOCSUP-2806: Fix quotes in meta headers.

* DOCSUP-2806: Update meta headers.

* DOCSUP-2806: Fix link to nowhere in EN.

* DOCSUP-2806: Fix link (settings to tune)

* DOCSUP-2806: Fix links.

* DOCSUP-2806:Fix links EN

* DOCSUP-2806: Fix build errors.

* DOCSUP-2806: Fix meta intro.

* DOCSUP-2806: Fix toc_priority in examples datasets TOC.

* DOCSUP-2806: Fix items order in toc.

* DOCSUP-2806: Fix order in toc.

* DOCSUP-2806: Fix toc order.

* DOCSUP-2806: Fix order in toc.

* DOCSUP-2806: Fix toc index in create

* DOCSUP-2806: Fix toc order in create.

Co-authored-by: romanzhukov <romanzhukov@yandex-team.ru>
Co-authored-by: alexey-milovidov <milovidov@yandex-team.ru>
											
										
										
											2020-10-26 10:29:30 +00:00
+								---
-												WIP on docs translation/normalization tools (#9783)


											
										
										
											2020-03-20 18:20:59 +00:00
+								# Kafka {#kafka}
-												Removed server setting belongs to resharding.
Some links are fixed.

											
										
										
											2017-12-28 14:27:52 +00:00
-												Added SETTINGS clause for Kafka storage engine

											
										
										
											2018-08-01 17:23:50 +00:00
+								Движок работает с [Apache Kafka](http://kafka.apache.org/).
-												Removed server setting belongs to resharding.
Some links are fixed.

											
										
										
											2017-12-28 14:27:52 +00:00
 								Kafka позволяет:
-												[experimental] add "es" docs language as machine translated draft (#9787)

* replace exit with assert in test_single_page

* improve save_raw_single_page docs option

* More grammar fixes

* "Built from" link in new tab

* fix mistype

* Example of include in docs

* add anchor to meeting form

* Draft of translation helper

* WIP on translation helper

* Replace some fa docs content with machine translation

* add normalize-en-markdown.sh

* normalize some en markdown

* normalize some en markdown

* admonition support

* normalize

* normalize

* normalize

* support wide tables

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* lightly edited machine translation of introdpection.md

* lightly edited machhine translation of lazy.md

* WIP on translation utils

* Normalize ru docs

* Normalize other languages

* some fixes

* WIP on normalize/translate tools

* add requirements.txt

* [experimental] add es docs language as machine translated draft

* remove duplicate script

* Back to wider tab-stop (narrow renders not so well)
											
										
										
											2020-03-21 04:11:51 +00:00
+								-   Публиковать/подписываться на потоки данных.
 								-   Организовать отказоустойчивое хранилище.
 								-   Обрабатывать потоки по мере их появления.
-												Removed server setting belongs to resharding.
Some links are fixed.

											
										
										
											2017-12-28 14:27:52 +00:00
-												Restore some old manual anchors in docs (#9803)

* Simplify 404 page

* add es array_functions.md

* restore some old manual anchors

* update sitemaps

* trigger checks

* restore more old manual anchors

* refactor test.md + temporary disable failure again

* fix mistype
											
										
										
											2020-03-22 09:14:59 +00:00
+								## Создание таблицы {#table_engine-kafka-creating-a-table}
-												Added SETTINGS clause for Kafka storage engine

											
										
										
											2018-08-01 17:23:50 +00:00
-												WIP on docs translation/normalization tools (#9783)


											
										
										
											2020-03-20 18:20:59 +00:00
+								``` sql
-												DOCAPI-5758: EN review and RU translation of the Kafka engine descrip… (#4660)

* DOCAPI-5758: EN review and RU translation of the Kafka engine description.

* DOCAPI-5758: Markup fix.

* DOCAPI-5758: Markup fixes in the Kafka topic.

* DOCAPI-5758: Link fix.

											
										
										
											2019-03-15 16:39:59 +00:00
+								CREATE TABLE [IF NOT EXISTS] [db.]table_name [ON CLUSTER cluster]
 								(
 								    name1 [type1] [DEFAULT|MATERIALIZED|ALIAS expr1],
 								    name2 [type2] [DEFAULT|MATERIALIZED|ALIAS expr2],
 								    ...
 								) ENGINE = Kafka()
 								SETTINGS
 								    kafka_broker_list = 'host:port',
 								    kafka_topic_list = 'topic1,topic2,...',
 								    kafka_group_name = 'group_name',
 								    kafka_format = 'data_format'[,]
 								    [kafka_row_delimiter = 'delimiter_symbol',]
 								    [kafka_schema = '',]
 								    [kafka_num_consumers = N,]
-												add info for Kafka engine

add info for Kafka engine
											
										
										
											2023-02-16 16:53:40 +00:00
+								    [kafka_max_block_size = 0,]
-												DOCAPI-7444: RU <-> EN docs regular sync. (#5944)

* DOCAPI-7444: RU <-> EN docs regular sync.
											
										
										
											2019-07-18 11:04:45 +00:00
+								    [kafka_skip_broken_messages = N]
-												Edit and translated Kafka

											
										
										
											2021-02-11 18:07:38 +00:00
+								    [kafka_commit_every_batch = 0,]
-												add info for Kafka engine

add info for Kafka engine
											
										
										
											2023-02-16 16:53:40 +00:00
+								    [kafka_client_id = '',]
 								    [kafka_poll_timeout_ms = 0,]
 								    [kafka_poll_max_batch_size = 0,]
 								    [kafka_flush_interval_ms = 0,]
 								    [kafka_thread_per_consumer = 0,]
 								    [kafka_handle_error_mode = 'default',]
 								    [kafka_commit_on_select = false,]
 								    [kafka_max_rows_per_message = 1];
-												Added SETTINGS clause for Kafka storage engine

											
										
										
											2018-08-01 17:23:50 +00:00
+								```
-												Removed server setting belongs to resharding.
Some links are fixed.

											
										
										
											2017-12-28 14:27:52 +00:00
-												Added SETTINGS clause for Kafka storage engine

											
										
										
											2018-08-01 17:23:50 +00:00
+								Обязательные параметры:
-												Edit and translated Kafka

											
										
										
											2021-02-11 18:07:38 +00:00
+								-   `kafka_broker_list` — перечень брокеров, разделенный запятыми (`localhost:9092`).
 								-   `kafka_topic_list` — перечень необходимых топиков Kafka.
 								-   `kafka_group_name` — группа потребителя Kafka. Отступы для чтения отслеживаются для каждой группы отдельно. Если необходимо, чтобы сообщения не повторялись на кластере, используйте везде одно имя группы.
 								-   `kafka_format` — формат сообщений. Названия форматов должны быть теми же, что можно использовать в секции `FORMAT`, например, `JSONEachRow`. Подробнее читайте в разделе [Форматы](../../../interfaces/formats.md).
-												Added SETTINGS clause for Kafka storage engine

											
										
										
											2018-08-01 17:23:50 +00:00
 								Опциональные параметры:
-												Edit and translated Kafka

											
										
										
											2021-02-11 18:07:38 +00:00
+								-   `kafka_row_delimiter` — символ-разделитель записей (строк), которым завершается сообщение.
 								-   `kafka_schema` — опциональный параметр, необходимый, если используется формат, требующий определения схемы. Например, [Cap’n Proto](https://capnproto.org/) требует путь к файлу со схемой и название корневого объекта `schema.capnp:Message`.
 								-   `kafka_num_consumers` — количество потребителей (consumer) на таблицу. По умолчанию: `1`. Укажите больше потребителей, если пропускная способность одного потребителя недостаточна. Общее число потребителей не должно превышать количество партиций в топике, так как на одну партицию может быть назначено не более одного потребителя.
-												Update kafka.md
											
										
										
											2021-02-16 21:25:34 +00:00
+								-   `kafka_max_block_size` — максимальный размер пачек (в сообщениях) для poll (по умолчанию `max_block_size`).
-												Edit and translated Kafka

											
										
										
											2021-02-11 18:07:38 +00:00
+								-   `kafka_skip_broken_messages` — максимальное количество некорректных сообщений в блоке. Если `kafka_skip_broken_messages = N`, то движок отбрасывает `N` сообщений Кафки, которые не получилось обработать. Одно сообщение в точности соответствует одной записи (строке). Значение по умолчанию – 0.
-												Update docs/ru/engines/table-engines/integrations/kafka.md

Co-authored-by: olgarev <56617294+olgarev@users.noreply.github.com>
											
										
										
											2021-02-16 22:41:47 +00:00
+								-   `kafka_commit_every_batch` — включает или отключает режим записи каждой принятой и обработанной пачки по отдельности вместо единой записи целого блока (по умолчанию `0`).
-												add info for Kafka engine

add info for Kafka engine
											
										
										
											2023-02-16 16:53:40 +00:00
+								-   `kafka_client_id` — идентификатор клиента. Значение по умолчанию пусто – ''.
 								-   `kafka_poll_timeout_ms` - Таймаут для poll. По умолчанию: (../../../operations/settings/settings.md#stream_poll_timeout_ms)
 								-   `kafka_poll_max_batch_size` - Максимальное количество сообщений в одном poll Kafka. По умолчанию: (../../../operations/settings/settings.md#setting-max_block_size)
 								-   `kafka_flush_interval_ms` - Таймаут для сброса данных из Kafka. По умолчанию: (../../../operations/settings/settings.md#stream-flush-interval-ms)
-												Update docs/ru/engines/table-engines/integrations/kafka.md

Co-authored-by: olgarev <56617294+olgarev@users.noreply.github.com>
											
										
										
											2021-02-16 22:41:47 +00:00
+								-   `kafka_thread_per_consumer` — включает или отключает предоставление отдельного потока каждому потребителю (по умолчанию `0`). При включенном режиме каждый потребитель сбрасывает данные независимо и параллельно, при отключённом — строки с данными от нескольких потребителей собираются в один блок.
-												add info for Kafka engine

add info for Kafka engine
											
										
										
											2023-02-16 16:53:40 +00:00
+								-   `kafka_handle_error_mode` - Способ обработки ошибок для Kafka. Возможные значения: default, stream.
 								-   `kafka_commit_on_select` - Сообщение о commit при запросе select. По умолчанию: `false`.
 								-   `kafka_max_rows_per_message` - Максимальное количество строк записанных в одно сообщение Kafka для формата row-based. По умолчанию: `1`.
-												Added SETTINGS clause for Kafka storage engine

											
										
										
											2018-08-01 17:23:50 +00:00
-												DOCAPI-5758: EN review and RU translation of the Kafka engine descrip… (#4660)

* DOCAPI-5758: EN review and RU translation of the Kafka engine description.

* DOCAPI-5758: Markup fix.

* DOCAPI-5758: Markup fixes in the Kafka topic.

* DOCAPI-5758: Link fix.

											
										
										
											2019-03-15 16:39:59 +00:00
+								Примеры
-												Removed server setting belongs to resharding.
Some links are fixed.

											
										
										
											2017-12-28 14:27:52 +00:00
-												WIP on docs translation/normalization tools (#9783)


											
										
										
											2020-03-20 18:20:59 +00:00
+								``` sql
-												Removed server setting belongs to resharding.
Some links are fixed.

											
										
										
											2017-12-28 14:27:52 +00:00
+								  CREATE TABLE queue (
 								    timestamp UInt64,
 								    level String,
 								    message String
 								  ) ENGINE = Kafka('localhost:9092', 'topic', 'group1', 'JSONEachRow');
 								  SELECT * FROM queue LIMIT 5;
-												Added SETTINGS clause for Kafka storage engine

											
										
										
											2018-08-01 17:23:50 +00:00
 								  CREATE TABLE queue2 (
 								    timestamp UInt64,
 								    level String,
 								    message String
 								  ) ENGINE = Kafka SETTINGS kafka_broker_list = 'localhost:9092',
 								                            kafka_topic_list = 'topic',
 								                            kafka_group_name = 'group1',
 								                            kafka_format = 'JSONEachRow',
 								                            kafka_num_consumers = 4;
 								  CREATE TABLE queue2 (
 								    timestamp UInt64,
 								    level String,
 								    message String
 								  ) ENGINE = Kafka('localhost:9092', 'topic', 'group1')
 								              SETTINGS kafka_format = 'JSONEachRow',
 								                       kafka_num_consumers = 4;
-												Removed server setting belongs to resharding.
Some links are fixed.

											
										
										
											2017-12-28 14:27:52 +00:00
+								```
-												WIP on docs translation/normalization tools (#9783)


											
										
										
											2020-03-20 18:20:59 +00:00
+								<details markdown="1">
-												DOCAPI-5758: EN review and RU translation of the Kafka engine descrip… (#4660)

* DOCAPI-5758: EN review and RU translation of the Kafka engine description.

* DOCAPI-5758: Markup fix.

* DOCAPI-5758: Markup fixes in the Kafka topic.

* DOCAPI-5758: Link fix.

											
										
										
											2019-03-15 16:39:59 +00:00
-												WIP on docs translation/normalization tools (#9783)


											
										
										
											2020-03-20 18:20:59 +00:00
+								<summary>Устаревший способ создания таблицы</summary>
-												Fix docs

											
										
										
											2022-10-27 10:41:45 +00:00
+								:::note "Attention"
 								Не используйте этот метод в новых проектах. По возможности переключите старые проекты на метод, описанный выше.
 								:::
-												DOCAPI-5758: EN review and RU translation of the Kafka engine descrip… (#4660)

* DOCAPI-5758: EN review and RU translation of the Kafka engine description.

* DOCAPI-5758: Markup fix.

* DOCAPI-5758: Markup fixes in the Kafka topic.

* DOCAPI-5758: Link fix.

											
										
										
											2019-03-15 16:39:59 +00:00
-												WIP on docs translation/normalization tools (#9783)


											
										
										
											2020-03-20 18:20:59 +00:00
+								``` sql
-												DOCAPI-5758: EN review and RU translation of the Kafka engine descrip… (#4660)

* DOCAPI-5758: EN review and RU translation of the Kafka engine description.

* DOCAPI-5758: Markup fix.

* DOCAPI-5758: Markup fixes in the Kafka topic.

* DOCAPI-5758: Link fix.

											
										
										
											2019-03-15 16:39:59 +00:00
+								Kafka(kafka_broker_list, kafka_topic_list, kafka_group_name, kafka_format
 								      [, kafka_row_delimiter, kafka_schema, kafka_num_consumers, kafka_skip_broken_messages])
 								```
-												Fix docs

											
										
										
											2022-10-27 10:41:45 +00:00
-												DOCAPI-5758: EN review and RU translation of the Kafka engine descrip… (#4660)

* DOCAPI-5758: EN review and RU translation of the Kafka engine description.

* DOCAPI-5758: Markup fix.

* DOCAPI-5758: Markup fixes in the Kafka topic.

* DOCAPI-5758: Link fix.

											
										
										
											2019-03-15 16:39:59 +00:00
+								</details>
-												WIP on docs translation/normalization tools (#9783)


											
										
										
											2020-03-20 18:20:59 +00:00
+								## Описание {#opisanie}
-												DOCAPI-5758: EN review and RU translation of the Kafka engine descrip… (#4660)

* DOCAPI-5758: EN review and RU translation of the Kafka engine description.

* DOCAPI-5758: Markup fix.

* DOCAPI-5758: Markup fixes in the Kafka topic.

* DOCAPI-5758: Link fix.

											
										
										
											2019-03-15 16:39:59 +00:00
-												Removed server setting belongs to resharding.
Some links are fixed.

											
										
										
											2017-12-28 14:27:52 +00:00
+								Полученные сообщения отслеживаются автоматически, поэтому из одной группы каждое сообщение считывается только один раз. Если необходимо получить данные дважды, то создайте копию таблицы с другим именем группы.
-												WIP on docs translation/normalization tools (#9783)


											
										
										
											2020-03-20 18:20:59 +00:00
+								Группы пластичны и синхронизированы на кластере. Например, если есть 10 топиков и 5 копий таблицы в кластере, то в каждую копию попадет по 2 топика. Если количество копий изменится, то распределение топиков по копиям изменится автоматически. Подробно читайте об этом на http://kafka.apache.org/intro.
-												Removed server setting belongs to resharding.
Some links are fixed.

											
										
										
											2017-12-28 14:27:52 +00:00
 								Чтение сообщения с помощью `SELECT` не слишком полезно (разве что для отладки), поскольку каждое сообщения может быть прочитано только один раз. Практичнее создавать потоки реального времени с помощью материализованных преставлений. Для этого:
-												WIP on docs translation/normalization tools (#9783)


											
										
										
											2020-03-20 18:20:59 +00:00
+.  Создайте потребителя Kafka с помощью движка и рассматривайте его как поток данных.
 .  Создайте таблицу с необходимой структурой.
 .  Создайте материализованное представление, которое преобразует данные от движка и помещает их в ранее созданную таблицу.
-												Removed server setting belongs to resharding.
Some links are fixed.

											
										
										
											2017-12-28 14:27:52 +00:00
 								Когда к движку присоединяется материализованное представление (`MATERIALIZED VIEW`), оно начинает в фоновом режиме собирать данные. Это позволяет непрерывно получать сообщения от Kafka и преобразовывать их в необходимый формат с помощью `SELECT`.
-												замечание что MV может быть более одного
											
										
										
											2019-06-29 16:58:46 +00:00
+								Материализованных представлений у одной kafka таблицы может быть сколько угодно, они не считывают данные из таблицы kafka непосредственно, а получают новые записи (блоками), таким образом можно писать в несколько таблиц с разным уровнем детализации (с группировкой - агрегацией и без).
-												Removed server setting belongs to resharding.
Some links are fixed.

											
										
										
											2017-12-28 14:27:52 +00:00
 								Пример:
-												WIP on docs translation/normalization tools (#9783)


											
										
										
											2020-03-20 18:20:59 +00:00
+								``` sql
-												Removed server setting belongs to resharding.
Some links are fixed.

											
										
										
											2017-12-28 14:27:52 +00:00
+								  CREATE TABLE queue (
 								    timestamp UInt64,
 								    level String,
 								    message String
 								  ) ENGINE = Kafka('localhost:9092', 'topic', 'group1', 'JSONEachRow');
 								  CREATE TABLE daily (
 								    day Date,
 								    level String,
 								    total UInt64
 								  ) ENGINE = SummingMergeTree(day, (day, level), 8192);
-												Added SETTINGS clause for Kafka storage engine

											
										
										
											2018-08-01 17:23:50 +00:00
-												Removed server setting belongs to resharding.
Some links are fixed.

											
										
										
											2017-12-28 14:27:52 +00:00
+								  CREATE MATERIALIZED VIEW consumer TO daily
 								    AS SELECT toDate(toDateTime(timestamp)) AS day, level, count() as total
 								    FROM queue GROUP BY day, level;
-												Minor fixes and improvements in documentation for Kafka table engine.

											
										
										
											2018-03-11 15:58:09 +00:00
+								  SELECT level, sum(total) FROM daily GROUP BY level;
-												Removed server setting belongs to resharding.
Some links are fixed.

											
										
										
											2017-12-28 14:27:52 +00:00
+								```
-												Fix broken links in docs

											
										
										
											2020-10-13 17:23:29 +00:00
+								Для улучшения производительности полученные сообщения группируются в блоки размера [max_insert_block_size](../../../operations/settings/settings.md#settings-max_insert_block_size). Если блок не удалось сформировать за [stream_flush_interval_ms](../../../operations/settings/settings.md#stream-flush-interval-ms) миллисекунд, то данные будут сброшены в таблицу независимо от полноты блока.
-												Removed server setting belongs to resharding.
Some links are fixed.

											
										
										
											2017-12-28 14:27:52 +00:00
 								Чтобы остановить получение данных топика или изменить логику преобразования, отсоедините материализованное представление:
-												WIP on docs translation/normalization tools (#9783)


											
										
										
											2020-03-20 18:20:59 +00:00
+								``` sql
-												Minor fixes and improvements in documentation for Kafka table engine.

											
										
										
											2018-03-11 15:58:09 +00:00
+								  DETACH TABLE consumer;
-												docs/kafka: use ATTACH TABLE over ATTACH MATERIALIZED VIEW (all langs)

Since later requires full specification (engine and so on).

											
										
										
											2020-04-25 00:08:00 +00:00
+								  ATTACH TABLE consumer;
-												Removed server setting belongs to resharding.
Some links are fixed.

											
										
										
											2017-12-28 14:27:52 +00:00
+								```
-												The lost information in the Kafka engine documentation has been restored, modified and translated (from commit: https://github.com/yandex/ClickHouse/pull/1654/files#diff-c9ba89e2414c83b5dcc579233c5c80b5)

											
										
										
											2018-03-22 17:31:25 +00:00
+								Если необходимо изменить целевую таблицу с помощью `ALTER`, то материализованное представление рекомендуется отключить, чтобы избежать несостыковки между целевой таблицей и данными от представления.
-												WIP on docs translation/normalization tools (#9783)


											
										
										
											2020-03-20 18:20:59 +00:00
+								## Конфигурация {#konfiguratsiia}
-												The lost information in the Kafka engine documentation has been restored, modified and translated (from commit: https://github.com/yandex/ClickHouse/pull/1654/files#diff-c9ba89e2414c83b5dcc579233c5c80b5)

											
										
										
											2018-03-22 17:31:25 +00:00
-												DOCAPI-5758: EN review and RU translation of the Kafka engine descrip… (#4660)

* DOCAPI-5758: EN review and RU translation of the Kafka engine description.

* DOCAPI-5758: Markup fix.

* DOCAPI-5758: Markup fixes in the Kafka topic.

* DOCAPI-5758: Link fix.

											
										
										
											2019-03-15 16:39:59 +00:00
+								Аналогично GraphiteMergeTree, движок Kafka поддерживает расширенную конфигурацию с помощью конфигурационного файла ClickHouse. Существует два конфигурационных ключа, которые можно использовать: глобальный (`kafka`) и по топикам (`kafka_topic_*`). Сначала применяется глобальная конфигурация, затем конфигурация по топикам (если она существует).
-												The lost information in the Kafka engine documentation has been restored, modified and translated (from commit: https://github.com/yandex/ClickHouse/pull/1654/files#diff-c9ba89e2414c83b5dcc579233c5c80b5)

											
										
										
											2018-03-22 17:31:25 +00:00
-												WIP on docs translation/normalization tools (#9783)


											
										
										
											2020-03-20 18:20:59 +00:00
+								``` xml
-												Doc fixes: remove double placeholders; add them where missing. (#3923)

* Doc fix: add spaces where missing

* Doc fixes: rm double spaces

* Doc fixes: edit spaces

* Doc fixes: rm double spaces in /fa

* Revert "Doc fixes: rm double spaces in /fa"

This reverts commit bb879a62ef5fa965d989fea3b1b2a693d2016a2d.

* Doc fix: resolve all problems with double spaces in /fa

* Doc fix: add spaces for readability

* Doc fix: add spaces

* Fix spaces

											
										
										
											2018-12-25 15:25:43 +00:00
+								  <!-- Global configuration options for all tables of Kafka engine type -->
-												The lost information in the Kafka engine documentation has been restored, modified and translated (from commit: https://github.com/yandex/ClickHouse/pull/1654/files#diff-c9ba89e2414c83b5dcc579233c5c80b5)

											
										
										
											2018-03-22 17:31:25 +00:00
+								  <kafka>
 								    <debug>cgrp</debug>
 								    <auto_offset_reset>smallest</auto_offset_reset>
 								  </kafka>
 								  <!-- Configuration specific for topic "logs" -->
-												fix documentation kafka per topic configuration

											
										
										
											2018-09-18 12:59:12 +00:00
+								  <kafka_logs>
-												The lost information in the Kafka engine documentation has been restored, modified and translated (from commit: https://github.com/yandex/ClickHouse/pull/1654/files#diff-c9ba89e2414c83b5dcc579233c5c80b5)

											
										
										
											2018-03-22 17:31:25 +00:00
+								    <retry_backoff_ms>250</retry_backoff_ms>
 								    <fetch_min_bytes>100000</fetch_min_bytes>
-												fix documentation kafka per topic configuration

											
										
										
											2018-09-18 12:59:12 +00:00
+								  </kafka_logs>
-												The lost information in the Kafka engine documentation has been restored, modified and translated (from commit: https://github.com/yandex/ClickHouse/pull/1654/files#diff-c9ba89e2414c83b5dcc579233c5c80b5)

											
										
										
											2018-03-22 17:31:25 +00:00
+								```
-												DOCAPI-5758: EN review and RU translation of the Kafka engine descrip… (#4660)

* DOCAPI-5758: EN review and RU translation of the Kafka engine description.

* DOCAPI-5758: Markup fix.

* DOCAPI-5758: Markup fixes in the Kafka topic.

* DOCAPI-5758: Link fix.

											
										
										
											2019-03-15 16:39:59 +00:00
+								В документе [librdkafka configuration reference](https://github.com/edenhill/librdkafka/blob/master/CONFIGURATION.md) можно увидеть список возможных опций конфигурации. Используйте подчеркивание (`_`) вместо точки в конфигурации ClickHouse. Например, `check.crcs=true` будет соответствовать `<check_crcs>true</check_crcs>`.
-												WIP on docs/website (#3383)

* CLICKHOUSE-4063: less manual html @ index.md

* CLICKHOUSE-4063: recommend markdown="1" in README.md

* CLICKHOUSE-4003: manually purge custom.css for now

* CLICKHOUSE-4064: expand <details> before any print (including to pdf)

* CLICKHOUSE-3927: rearrange interfaces/formats.md a bit

* CLICKHOUSE-3306: add few http headers

* Remove copy-paste introduced in #3392

* Hopefully better chinese fonts #3392

* get rid of tabs @ custom.css

* Apply comments and patch from #3384

* Add jdbc.md to ToC and some translation, though it still looks badly incomplete

* minor punctuation

* Add some backlinks to official website from mirrors that just blindly take markdown sources

* Do not make fonts extra light

* find . -name '*.md' -type f | xargs -I{} perl -pi -e 's//g' {}

* find . -name '*.md' -type f | xargs -I{} perl -pi -e 's/ sql/g' {}

* Remove outdated stuff from roadmap.md

* Not so light font on front page too

* Refactor Chinese formats.md to match recent changes in other languages

											
										
										
											2018-10-16 10:47:17 +00:00
-												DOCSUP-3172: Edit and translate to Russian (#16153)

* Edit and traslate to Russian.

* Update docs/ru/engines/table-engines/integrations/kafka.md

Co-authored-by: BayoNet <da-daos@yandex.ru>

* Update docs/ru/interfaces/http.md

Co-authored-by: BayoNet <da-daos@yandex.ru>

* Update docs/ru/interfaces/http.md

Co-authored-by: BayoNet <da-daos@yandex.ru>

* Ticket.

* http.

* kafka ru

Co-authored-by: Daria Mozhaeva <dmozhaeva@yandex-team.ru>
Co-authored-by: BayoNet <da-daos@yandex.ru>
											
										
										
											2020-11-02 16:54:23 +00:00
+								### Поддержка Kerberos {#kafka-kerberos-support}
 								Чтобы начать работу с Kafka с поддержкой Kerberos, добавьте дочерний элемент `security_protocol` со значением `sasl_plaintext`. Этого будет достаточно, если получен тикет на получение тикета (ticket-granting ticket) Kerberos и он кэшируется средствами ОС.
-												Cleanup code in KerberosInit, HDFSCommon and StorageKafka; update English and Russian documentation.

											
										
										
											2022-06-08 14:57:45 +00:00
+								ClickHouse может поддерживать учетные данные Kerberos с помощью файла keytab. Рассмотрим дочерние элементы `sasl_kerberos_service_name`, `sasl_kerberos_keytab` и `sasl_kerberos_principal`.
-												DOCSUP-3172: Edit and translate to Russian (#16153)

* Edit and traslate to Russian.

* Update docs/ru/engines/table-engines/integrations/kafka.md

Co-authored-by: BayoNet <da-daos@yandex.ru>

* Update docs/ru/interfaces/http.md

Co-authored-by: BayoNet <da-daos@yandex.ru>

* Update docs/ru/interfaces/http.md

Co-authored-by: BayoNet <da-daos@yandex.ru>

* Ticket.

* http.

* kafka ru

Co-authored-by: Daria Mozhaeva <dmozhaeva@yandex-team.ru>
Co-authored-by: BayoNet <da-daos@yandex.ru>
											
										
										
											2020-11-02 16:54:23 +00:00
 								Пример:
 								``` xml
 								  <!-- Kerberos-aware Kafka -->
 								  <kafka>
 								    <security_protocol>SASL_PLAINTEXT</security_protocol>
 									<sasl_kerberos_keytab>/home/kafkauser/kafkauser.keytab</sasl_kerberos_keytab>
 									<sasl_kerberos_principal>kafkauser/kafkahost@EXAMPLE.COM</sasl_kerberos_principal>
 								  </kafka>
 								```
-												WIP on docs translation/normalization tools (#9783)


											
										
										
											2020-03-20 18:20:59 +00:00
+								## Виртуальные столбцы {#virtualnye-stolbtsy}
-												DOCAPI-7443: Virtual columns docs update. EN review. RU translation. (#6640)

* Update index.md (#35)

* DOCAPI-7443: RU translation.

* Link fix.

* DOCAPI-7443: Fixes.

* DOCAPI-7443: Fixes.

											
										
										
											2019-08-27 11:04:52 +00:00
-												[experimental] add "es" docs language as machine translated draft (#9787)

* replace exit with assert in test_single_page

* improve save_raw_single_page docs option

* More grammar fixes

* "Built from" link in new tab

* fix mistype

* Example of include in docs

* add anchor to meeting form

* Draft of translation helper

* WIP on translation helper

* Replace some fa docs content with machine translation

* add normalize-en-markdown.sh

* normalize some en markdown

* normalize some en markdown

* admonition support

* normalize

* normalize

* normalize

* support wide tables

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* lightly edited machine translation of introdpection.md

* lightly edited machhine translation of lazy.md

* WIP on translation utils

* Normalize ru docs

* Normalize other languages

* some fixes

* WIP on normalize/translate tools

* add requirements.txt

* [experimental] add es docs language as machine translated draft

* remove duplicate script

* Back to wider tab-stop (narrow renders not so well)
											
										
										
											2020-03-21 04:11:51 +00:00
+								-   `_topic` — топик Kafka.
 								-   `_key` — ключ сообщения.
 								-   `_offset` — оффсет сообщения.
 								-   `_timestamp` — временная метка сообщения.
-												add info for Kafka engine

add info for Kafka engine
											
										
										
											2023-02-16 16:53:40 +00:00
+								-   `_timestamp_ms` — временная метка сообщения в миллисекундах.
-												[experimental] add "es" docs language as machine translated draft (#9787)

* replace exit with assert in test_single_page

* improve save_raw_single_page docs option

* More grammar fixes

* "Built from" link in new tab

* fix mistype

* Example of include in docs

* add anchor to meeting form

* Draft of translation helper

* WIP on translation helper

* Replace some fa docs content with machine translation

* add normalize-en-markdown.sh

* normalize some en markdown

* normalize some en markdown

* admonition support

* normalize

* normalize

* normalize

* support wide tables

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* lightly edited machine translation of introdpection.md

* lightly edited machhine translation of lazy.md

* WIP on translation utils

* Normalize ru docs

* Normalize other languages

* some fixes

* WIP on normalize/translate tools

* add requirements.txt

* [experimental] add es docs language as machine translated draft

* remove duplicate script

* Back to wider tab-stop (narrow renders not so well)
											
										
										
											2020-03-21 04:11:51 +00:00
+								-   `_partition` — секция топика Kafka.
-												add info for Kafka engine

add info for Kafka engine
											
										
										
											2023-02-16 16:53:40 +00:00
+								-   `_headers.name` - Массив ключей заголовков сообщений.
 								-   `_headers.value` - Массив значений заголовков сообщений.
-												DOCAPI-7443: Virtual columns docs update. EN review. RU translation. (#6640)

* Update index.md (#35)

* DOCAPI-7443: RU translation.

* Link fix.

* DOCAPI-7443: Fixes.

* DOCAPI-7443: Fixes.

											
										
										
											2019-08-27 11:04:52 +00:00
 								**Смотрите также**
-												[experimental] add "es" docs language as machine translated draft (#9787)

* replace exit with assert in test_single_page

* improve save_raw_single_page docs option

* More grammar fixes

* "Built from" link in new tab

* fix mistype

* Example of include in docs

* add anchor to meeting form

* Draft of translation helper

* WIP on translation helper

* Replace some fa docs content with machine translation

* add normalize-en-markdown.sh

* normalize some en markdown

* normalize some en markdown

* admonition support

* normalize

* normalize

* normalize

* support wide tables

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* lightly edited machine translation of introdpection.md

* lightly edited machhine translation of lazy.md

* WIP on translation utils

* Normalize ru docs

* Normalize other languages

* some fixes

* WIP on normalize/translate tools

* add requirements.txt

* [experimental] add es docs language as machine translated draft

* remove duplicate script

* Back to wider tab-stop (narrow renders not so well)
											
										
										
											2020-03-21 04:11:51 +00:00
+								-   [Виртуальные столбцы](index.md#table_engines-virtual_columns)
-												Refactor reading the pool setting & from server config. (#48055)

After #36425 there was a lot of confusions/problems with configuring pools - when the message was confusing, and settings need to be ajusted in several places.
See some examples in #44251, #43351, #47900, #46515.

The commit includes the following changes:
1) Introduced a unified mechanism for reading pool sizes from the configuration file(s). Previously, pool sizes were read from the Context.cpp with fallbacks to profiles, whereas main_config_reloader in Server.cpp read them directly without fallbacks.
2) Corrected the data type for background_merges_mutations_concurrency_ratio. It should be float instead of int.
3) Refactored the default values for settings. Previously, they were defined in multiple places throughout the codebase, but they are now defined in one place (or two, to be exact: Settings.h and ServerSettings.h).
4) Improved documentation, including the correct message in system.settings.

Additionally make the code more conform with #46550.
											
										
										
											2023-03-30 14:44:11 +00:00
+								-   [background_message_broker_schedule_pool_size](../../../operations/server-configuration-parameters/settings.md#background_message_broker_schedule_pool_size)