ClickHouse/docs/ru/whats-new/extended-roadmap.md

# Планы разработки ClickHouse 2020 {#plany-razrabotki-clickhouse-2020}

Здесь собраны важные задачи на 2020 год. Многие из них присутствуют в GitHub Issues. Данный текст следует рассматривать как рабочий черновик со сводкой и кратким описанием задач, ссылками и материалами для быстрого доступа на одной странице. Классификация задач условная.

Так как ClickHouse - open-source продукт, мы хотим, чтобы рабочий процесс был также максимально открытым. В связи с этим, вам следует ожидать наличия на данной странице несколько большего количества деталей описания рабочего процесса, чем вы могли бы предположить - настолько близко, насколько рабочий процесс видят разработчики. Так как неотъемлимой частью процесса разработки является исправление недостатков продукта и улучшение качества кода, на данной странице вы найдёте весьма подробные описания таких деталей. Для других open-source продуктов такой подход к разработке обычно нехарактерен. Благодаря тому, что для каждой задачи указаны её зависимости, вы сможете понять, какие подготовительные работы требуются, что позволяет более точно понимать сроки реализации.

## 1. Хранение данных, индексация {#khranenie-dannykh-indeksatsiia}

### 1.1. Индексы по z-Order curve, normalized z-Order curve {#indeksy-po-z-order-curve-normalized-z-order-curve}

[\#6286](https://github.com/ClickHouse/ClickHouse/pull/6286)

Задача также относится к категории «17. Работа с географическими данными», так как geoHash - это частный случай z-Order curve.
Также связана с задачей 24.27 для нечёткого поиска полудубликатов строк, так как позволит индексировать min-hash.
Задача «normalized z-Order curve» в перспективе может быть полезна для БК и Метрики, так как позволяет смешивать OrderID и PageID и избежать дублирования данных.
В задаче также вводится способ индексации путём обращения функции нескольких аргументов на интервале, что имеет смысл для дальнейшего развития.

[Андрей Чулков](https://github.com/achulkov2), ВШЭ.

### 1.2. + Wait-free каталог баз данных {#wait-free-katalog-baz-dannykh}

Q2. Делает [Александр Токмаков](https://github.com/tavplubix), первый рабочий вариант в декабре 2019. Нужно для DataLens и Яндекс.Метрики.

Манипуляции с каталогом баз данных: запросы CREATE TABLE, DROP TABLE, RENAME TABLE и DATABASE, требуют синхронизации с помощью блокировок. Эта синхронизация становится весьма сложной, так как на неё полагается много внутренних структур данных.

Предлагается реализовать альтернативный подход, в котором таблицы и базы данных являются всего лишь ссылками на persistent объекты. Подробное описание задачи: [\#6787](https://github.com/ClickHouse/ClickHouse/issues/6787)

Upd. Сделана крупная часть задачи, но ориентироваться стоит уже на Q2.
Upd. Pull request готов для мержа.
Upd. Попало 20.4. Доступно под флагом allow_experimental_database_atomic.

### 1.3. + Неблокирующие ALTER {#neblokiruiushchie-alter}

Q1. И полностью immutable куски. Делает [Александр Сапин](https://github.com/alesapin). Готов приступить к задаче в конце ноября 2019. Нужно для Яндекс.Метрики.

Upd. Большая часть задачи реализована и добавлена в master. Есть незначительные технические долги. Остаётся реализация неблокирующего изменения метаданных таблицы.
Upd. Всё доделано, ожидается в релизе 20.6.

### 1.4. + Нетранзитивные ALTER столбцов {#netranzitivnye-alter-stolbtsov}

Требует 1.3. Будет делать [Александр Сапин](https://github.com/alesapin). Ура, сделано.

### 1.5. + ALTER RENAME COLUMN {#alter-rename-column}

[\#6861](https://github.com/ClickHouse/ClickHouse/issues/6861)

Требует 1.3. Будет делать [Александр Сапин](https://github.com/alesapin).

### 1.6. + Полиморфные куски данных {#polimorfnye-kuski-dannykh}

Компактные куски - Q1, куски в оперативке Q1/Q2 - пункт 1.7.

Компактные куски реализованы, ещё не включены по-умолчанию. Первым шагом включаем по-умолчанию для системных таблиц.

Upd. Включено для системных таблиц.

Делает [Антон Попов](https://github.com/CurtizJ), первый рабочий вариант в декабре. Пререквизит чтобы снизить сложность мелких INSERT, что в свою очередь нужно для 1.12, иначе задача 1.12 не сможет нормально работать. Особенно нужно для Яндекс.Облака.

Данные в таблицах типа MergeTree в ClickHouse хранятся в виде набора независимых «кусков». Внутри куска, каждый столбец, а также индекс, хранится в отдельных файлах. Это сделано для возможности быстрых манипуляций со столбцами (пример - запрос ALTER DROP COLUMN). При вставке данных (INSERT), создаётся новый кусок. Для таблиц с большим количеством столбцов, запросы INSERT с маленьким количеством строк являются неэффективными, так как требуют создания большого количества файлов в файловой системе. Это является врождённой особенностью ClickHouse - одной из первой проблем, с которыми сталкиваются пользователи. Пользователям приходится буферизовывать данные и собирать их в более крупные пачки перед вставкой в ClickHouse.

Для смягчения эффекта от этой проблемы, в ClickHouse существуют таблицы типа Buffer. Они накапливают данные в оперативке перед записью в другую таблицу. Впрочем, таблицы Buffer не являются полноценным решением проблемы из-за: - наличия блокировок при вставке; - переупорядочивание вставляемых данных; - неатомарность перекладывания данных из Buffer в результирующую таблицу.

Вместо этого предлагается разрешить кускам таблиц типа MergeTree располагать данные в разных форматах. А именно: - в оперативной памяти; - на диске со всеми столбцами в одном файле; - на диске со столбцами в отдельных файлах: в зависимости от размера куска и прошедшего времени. Для размещения кусков в оперативной памяти, придётся также реализовать опциональную поддержку write-ahead log с настраиваемыми правилами по сбросу на диск. Это позволит избавиться от проблем с мелкими вставками для MergeTree таблиц. Для ReplicatedMergeTree таблиц, это решит проблему лишь частично.

### 1.7. + Буферизация и WAL в MergeTree {#buferizatsiia-i-wal-v-mergetree}

Требует 1.6. Антон Попов. Задача взята в работу. Q2.
Есть pull request.
Upd. В стадии код-ревью.
Upd. Готово для использования начиная с версии 20.6 в экспериментальном режиме.

### 1.8. + Перенос между разделами по TTL {#perenos-mezhdu-razdelami-po-ttl}

Делает [Владимир Чеботарёв](https://github.com/excitoon), Altinity. Декабрь 2019.

Q1. Закоммичено, но есть технический долг, который исправляется сейчас.
Готово. Нет, не готово - там всё ещё технический долг.

### 1.9. + Использование TTL для прореживания данных {#ispolzovanie-ttl-dlia-prorezhivaniia-dannykh}

Будет делать Сорокин Николай, ВШЭ и Яндекс.
Upd. Есть pull request. Upd. Сделано.

Сейчас пользователь может задать в таблице выражение, которое определяет, сколько времени хранятся данные. Обычно это выражение задаётся относительно значения столбца с датой - например: удалять данные через три месяца. https://clickhouse.tech/docs/ru/operations/table_engines/mergetree/\#table_engine-mergetree-ttl

Это может быть задано для всей таблицы (тогда строки целиком удаляются после указанного времени) или для отдельных столбцов (тогда данные столбца физически удаляются с диска, а строки в таблице остаются; при чтении значений столбца, они читаются как значения по-умолчанию).

Но пользователи также хотят более продвинутый вариант этой функциональности: не удалять строки или столбцы целиком, а прореживать их - оставлять меньшее количество строк.

И тут есть несколько вариантов:
1. По прошествии времени, оставлять каждую N-ую строку.
2. По прошествии времени, выполнять агрегацию данных, заменяя значения некоторых столбцов на значения агрегатных функций от множества значений в нескольких строках.

Пункт 1 не представляет интереса, так как уже реализован с помощью TTL выражений для удаления данных. В качестве этого выражения можно прописать, например, `cityHash64(*) % 10 = 0 ? now() : event_time + INTERVAL 3 MONTH`. Правда как-то неудобно получается.

А вот пункт 2 требуется продумать. Не очевидно даже, какой лучше использовать синтаксис для этого при создании таблицы. Но мы придумаем - сразу видно несколько вариантов.

Частный случай такой задачи уже есть в https://clickhouse.tech/docs/ru/operations/table_engines/graphitemergetree/ Но это было сделано для конкретной задачи. А надо обобщить.

### 1.10. Пережатие старых данных в фоне {#perezhatie-starykh-dannykh-v-fone}

Будет делать Кирилл Барухов, ВШЭ, экспериментальная реализация к весне 2020. Нужно для Яндекс.Метрики.

Алгоритмы сжатия типа LZ77 позволяют потратить больше времени на сжатие данных, чтобы сжать данные сильнее, но при этом без проигрыша по скорости разжатия данных. В частности, этим свойством обладает LZ4 и ZSTD, которые используются в ClickHouse. Это позволяет использовать свободные ресурсы CPU, когда сервер не нагружен, для пережатия данных, чтобы данные занимали меньше места на дисках, и при этом сохранить или даже улучшить скорость обработки запросов.

В то же время, ClickHouse обычно используется для «импульсного» сценария нагрузки. Запрос от пользователя обрабатывается максимально быстро, используя все ресурсы CPU, но в среднем по времени, сервер недостаточно нагружен.

Предлагается добавить в ClickHouse настройки по пережатию данных и фоновые потоки, выполняющие эту задачу.

Upd. Представлен прототип неизвестной степени готовности.

### 1.11. + Виртуальная файловая система {#virtualnaia-failovaia-sistema}

На VFS переведены Log, TinyLog, StripeLog, а также MergeTree, что доказывает состоятельность реализации.

Нужно для Яндекс.Облака. Делает Александр, Яндекс.Облако.

ClickHouse использует для хранения данных локальную файловую систему. Существует сценарий работы, в котором размещение старых (архивных) данных было бы выгодно на удалённой файловой системе. Если файловая система POSIX совместимая, то это не составляет проблем: ClickHouse успешно работает с Ceph, GlusterFS, MooseFS. Также востребованным является сценарий использования S3 (из-за доступности в облаке) или HDFS (для интеграции с Hadoop). Но эти файловые системы не являются POSIX совместимыми. Хотя для них существуют FUSE драйверы, но скорость работы сильно страдает и поддержка неполная.

ClickHouse использует небольшое подмножество функций ФС, но в то же время, и некоторые специфические части: симлинки и хардлинки, O\_DIRECT. Предлагается выделить всё взаимодействие с файловой системой в отдельный интерфейс.

### 1.12. Экспериментальная реализация VFS поверх S3 и HDFS {#eksperimentalnaia-realizatsiia-vfs-poverkh-s3-i-hdfs}

Q4.

Нужно для Яндекс.Облака. Требует 1.11. Желательно 1.6 и 1.18.
Делает Александр, Яндекс.Облако (сначала часть для S3), а также Олег Ершов, ВШЭ и Яндекс.

Upd. Олег будет делать только часть про HDFS.
Upd. Реализация поверх S3 является рабочей на уровне PoC.
Upd. Реализация поверх S3 ужасно тормозит и сейчас доделывается.
Upd. Реализацию поверх HDFS взял AmosBird для Kuaishou.

### 1.13. + Ускорение запросов с FINAL {#uskorenie-zaprosov-s-final}

Требует 2.1. Делает [Николай Кочетов](https://github.com/KochetovNicolai). Нужно для Яндекс.Метрики. Q2.
Upd: PR [#10463](https://github.com/ClickHouse/ClickHouse/pull/10463)

### 1.14. Не писать столбцы, полностью состоящие из нулей {#ne-pisat-stolbtsy-polnostiu-sostoiashchie-iz-nulei}

Антон Попов. Q3.
В очереди. Простая задача, является небольшим пререквизитом для потенциальной поддержки полуструктурированных данных.

### 1.15. Возможность иметь разный первичный ключ в разных кусках {#vozmozhnost-imet-raznyi-pervichnyi-kliuch-v-raznykh-kuskakh}

Сложная задача, только после 1.3.
Upd. В обсуждении.

### 1.16. Несколько физических представлений для одного куска данных {#neskolko-fizicheskikh-predstavlenii-dlia-odnogo-kuska-dannykh}

Сложная задача, только после 1.3 и 1.6. Позволяет компенсировать 21.20.
Upd. В обсуждении.

### 1.17. Несколько сортировок для одной таблицы {#neskolko-sortirovok-dlia-odnoi-tablitsy}

Сложная задача, только после 1.3 и 1.6.
Upd. В обсуждении.

### 1.18. Отдельное хранение файлов кусков {#otdelnoe-khranenie-failov-kuskov}

Требует 1.3 и 1.6. Полная замена hard links на sym links, что будет лучше для 1.12.


## 2. Крупные рефакторинги {#krupnye-refaktoringi}

Для обоснования необходимости смотрите ссылки в описании других задач.

### 2.1. + Переделка конвейера выполнения запросов на Processors {#peredelka-konveiera-vypolneniia-zaprosov-na-processors}

Делает [Николай Кочетов](https://github.com/KochetovNicolai). Финальная стадия разработки. Включение по-умолчанию в конце декабря 2019. Удаление старого кода в начале 2020.

Upd. На данный момент исправляются проблемы с регрессиями производительности в отдельных случаях. Кажется, что все проблемы исправлены.
Включение по-умолчанию в Q1, но остаётся вторая часть задачи по корректному выделению async части.

Upd. Включили по-умолчанию. Удаление старого кода не раньше, чем после первого релиза, в котором это включено по-умолчанию и всё ещё можно выключить обратно.

Upd. Уже есть первый релиз, в котором это включено по-умолчанию.

Upd. Всё ещё ждём удаление старого кода, которое должно случиться после релиза 20.4.

Upd. Старый код по большей части удалён.

### 2.2. Инфраструктура событий/метрик/ограничений/квот/трассировки {#infrastruktura-sobytiimetrikogranicheniikvottrassirovki}

В очереди. https://gist.github.com/alexey-milovidov/d62d73222d83b9319dc519cbb13aeff6

### 2.3. Перенос столбцового ser/de из DataType в Column {#perenos-stolbtsovogo-serde-iz-datatype-v-column}

В очереди. Антон Попов.

### 2.4. Перевод LowCardinality из DataType в Column. Добавление ColumnSparse {#perevod-lowcardinality-iz-datatype-v-column-dobavlenie-columnsparse}

Требует 2.3.

### 2.5. Версионирование состояний агрегатных функций {#versionirovanie-sostoianii-agregatnykh-funktsii}

В очереди.

### 2.6. Правая часть IN как тип данных. Выполнение IN в виде скалярного подзапроса {#pravaia-chast-in-kak-tip-dannykh-vypolnenie-in-v-vide-skaliarnogo-podzaprosa}

Требует 2.1.

### 2.7. Нормализация Context {#normalizatsiia-context}

В очереди. Нужно для YQL.

Александр Токмаков исправил множество проблем с использованием Context и сейчас переносит каталог БД наружу.

Upd. Каталог БД вынесен из Context.
Upd. SharedContext вынесен из Context.
Upd. Проблема нейтрализована и перестала быть актуальной.

### 2.8. Декларативный парсер запросов {#deklarativnyi-parser-zaprosov}

Средний приоритет. Нужно для YQL.

Upd. В очереди. Иван Лежанкин.

### 2.9. + Логгировние в format-стиле {#loggirovnie-v-format-stile}

[#6049](https://github.com/ClickHouse/ClickHouse/issues/6049#issuecomment-570836998)

Сделано.

### 2.10. Запрашивать у таблиц не столбцы, а срезы {#zaprashivat-u-tablits-ne-stolbtsy-a-srezy}

В очереди.

### 2.11. Разбирательство и нормализация функциональности для bitmap {#razbiratelstvo-i-normalizatsiia-funktsionalnosti-dlia-bitmap}

В очереди.

### 2.12. Декларативные сигнатуры функций {#deklarativnye-signatury-funktsii}

[\#3775](https://github.com/ClickHouse/ClickHouse/pull/3775)

Задачу делает Алексей Миловидов. Прогресс 50% и разработка временно приостановлена.

Upd. Разработка всё ещё приостановлена.

### 2.13. Каждая функция в отдельном файле {#kazhdaia-funktsiia-v-otdelnom-faile}

Задачу делает Алексей Миловидов. Прогресс 80%. Потребуется помощь других разработчиков.

Upd. Поползновения наблюдаются.

### 2.14. Все функции с состоянием переделать на FunctionBuilder {#vse-funktsii-s-sostoianiem-peredelat-na-functionbuilder}

Долг [Николай Кочетов](https://github.com/KochetovNicolai). Сейчас код находится в переходном состоянии, что неприемлемо.

### 2.15. Функция subscribe для IStorage {#funktsiia-subscribe-dlia-istorage}

Для нормализации работы materialized views поверх Merge, Distributed, Kafka.


## 3. Документация {#dokumentatsiia}

Здесь задачи только по инфраструктуре документации.

### 3.1. Перенос документации по функциям в код {#perenos-dokumentatsii-po-funktsiiam-v-kod}

Требует 2.12 и 2.13. Хотим в Q2, средний приоритет.

### 3.2. Перенос однородных частей документации в код {#perenos-odnorodnykh-chastei-dokumentatsii-v-kod}

Требует 3.1.

### + 3.3. Исправить катастрофически отвратительно неприемлемый поиск по документации {#ispravit-katastroficheski-otvratitelno-nepriemlemyi-poisk-po-dokumentatsii}

[Иван Блинков](https://github.com/blinkov/) - очень хороший человек. Сам сайт документации основан на технологиях, не удовлетворяющих требованиям задачи, и эти технологии трудно исправить. Задачу будет делать первый встретившийся нам frontend разработчик, которого мы сможем заставить это сделать.

Upd. Иван Блинков сделал эту задачу путём замены треш-технологий на нормальные.

### 3.4. + Добавить японский язык в документацию {#dobavit-iaponskii-iazyk-v-dokumentatsiiu}

Эту задачу сделает [Иван Блинков](https://github.com/blinkov/), до конца декабря 2019. Сделано.


## 4. Сетевое взаимодействие {#setevoe-vzaimodeistvie}

### 4.1. Уменьшение числа потоков при распределённых запросах {#umenshenie-chisla-potokov-pri-raspredelionnykh-zaprosakh}

Весна 2020. Upd. Есть прототип. Upd. Он не работает. Upd. Человек отказался от задачи, теперь сроки не определены.

### 4.2. Спекулятивное выполнение запросов на нескольких репликах {#spekuliativnoe-vypolnenie-zaprosov-na-neskolkikh-replikakh}

Нужно для Яндекс.Метрики. Требует 4.1.

Если распределённый запрос затрагивает большое количество серверов, то время выполнения запросов часто становится большим из-за tail latencies - случайных редких замедлений отдельных серверов. Эту проблему можно избежать, отправляя один и тот же запрос сразу на несколько реплик, и используя данные с наиболее быстрой.

Задача скрывает в себе много тонкостей, связанных с обработкой стадий выполнения запроса (соединение, обмен handshake, отправка запроса, получение заголовка результата, получение пакетов прогресса, получение данных), правильной возможностью настройки таймаутов, правильной отменой запросов.

Сейчас для распределённых запросов используется по потоку на соединение. Это позволяет хорошо распараллелить вычисления над полученными данными и утилизировать сеть, но становится сильно избыточным для больших кластеров. Для примера, создание 1000 потоков для чтения данных из 1000 серверов кластера - лишь расходует ресурсы и увеличивает время выполнения запроса. Вместо этого необходимо использовать количество потоков не большее количества процессорных ядер, и мультиплексировать в одном потоке общение с серверами. Реализация нетривиальна, так как мультиплексировать необходимо каждую стадию общения по сети, включая установку соединения и обмен handshake.

Upd. Сейчас обсуждается, как сделать другую задачу вместо этой.

### 4.3. Ограничение числа одновременных скачиваний с реплик {#ogranichenie-chisla-odnovremennykh-skachivanii-s-replik}

Изначально делал Олег Алексеенков, но пока решение не готово, хотя там не так уж много доделывать.

### 4.4. Ограничение сетевой полосы при репликации {#ogranichenie-setevoi-polosy-pri-replikatsii}

Нужно для Метрики.

### 4.5. Возможность продолжить передачу куска данных при репликации после сбоя {#vozmozhnost-prodolzhit-peredachu-kuska-dannykh-pri-replikatsii-posle-sboia}

### 4.6. p2p передача для GLOBAL подзапросов {#p2p-peredacha-dlia-global-podzaprosov}

### 4.7. Ленивая загрузка множеств для IN и JOIN с помощью k/v запросов {#lenivaia-zagruzka-mnozhestv-dlia-in-i-join-s-pomoshchiu-kv-zaprosov}

### 4.8. Разделить background pool для fetch и merge {#razdelit-background-pool-dlia-fetch-i-merge}

В очереди. Исправить проблему, что восстанавливающаяся реплика перестаёт мержить. Частично компенсируется 4.3.
Александр Казаков.


## 5. Операции {#operatsii}

### 5.1. + Разделение задач на более мелкие куски в clickhouse-copier {#razdelenie-zadach-na-bolee-melkie-kuski-v-clickhouse-copier}

[\#9075](https://github.com/ClickHouse/ClickHouse/pull/9075)
Q1. Нужно для Метрики, в очереди. Никита Михайлов.

Upd. Задача на финальной стадии разработки.
Upd. Сделано. Эффективность работы под вопросом. Есть варианты, как сделать лучше.

### 5.2. + Автонастройка лимита на оперативку и размера кэшей {#avtonastroika-limita-na-operativku-i-razmera-keshei}

### 5.3. + Встроенная ручка для Prometheus {#vstroennaia-ruchka-dlia-prometheus}

Сделано. https://github.com/Vdimir

### 5.4. Opt-in сообщать в клиенте, если вышла новая версия {#opt-in-soobshchat-v-kliente-esli-vyshla-novaia-versiia}

Есть поползновения.

### 5.5. + LTS релизы {#lts-relizy}

Требует 7.5. Задачу хочет Метрика, Облако, БК, Маркет и Altinity. Первой LTS версией уже стала версия 19.14.
Метрика, БК, Маркет, Altinity уже используют более свежие версии чем LTS.
Upd. Появилась вторая версия LTS - 20.3.


## 6. Инструментирование {#instrumentirovanie}

### 6.1. + Исправления сэмплирующего профайлера запросов {#ispravleniia-sempliruiushchego-profailera-zaprosov}

Михаил Филимонов, Altinity. Ноябрь 2019. Сделано.
Осталось ещё проверить работоспособность профайлера в первом потоке (что важно для INSERT). Иван Лежанкин. Q1. Сделано.

### 6.2. + Добавление memory profiler {#dobavlenie-memory-profiler}

[\#6387](https://github.com/ClickHouse/ClickHouse/issues/6387)

Сравнительно простая задача, но только для опытных разработчиков. Нужна всем. Иван Лежанкин. Q1. Сделано.

### 6.3. + Учёт оперативки total расширить не только на запросы {#uchiot-operativki-total-rasshirit-ne-tolko-na-zaprosy}

Исправление долгоживущей проблемы с дрифтом учёта оперативки. Нужна для Метрики и БК.

### 6.4. + Поддержка perf events как метрик запроса {#podderzhka-perf-events-kak-metrik-zaprosa}

Делает Андрей Скобцов, ВШЭ.

В Linux существует возможность получать в программе информацию о счётчиках производительности и событиях, относящихся к CPU и ядру ОС. Подробнее смотрите `man perf_event_open`. Предлагается добавить эти метрики в ClickHouse для инструментирования запросов.

Есть прототип. 
Сделано.

### 6.5. Эксперименты с LLVM X-Ray {#eksperimenty-s-llvm-x-ray}

Требует 2.2.

### 6.6. + Стек трейс для любых исключений {#stek-treis-dlia-liubykh-iskliuchenii}

Сейчас есть стек трейс для почти всех, но не всех исключений. Требует 7.4.

### 6.7. + Таблица system.stack_trace {#tablitsa-system-stack-trace}

Сравнительно простая задача, но только для опытных разработчиков.

### 6.8. Таблица system.crashes {#tablitsa-system-crashes}

Сравнительно простая задача, но только для опытных разработчиков.
Upd. В разработке.

### 6.9. + Отправлять информацию клиенту, если сервер падает по сигналу {#otpravliat-informatsiiu-klientu-esli-server-padaet-po-signalu}

Сделано.

### 6.10. Сбор общих системных метрик {#sbor-obshchikh-sistemnykh-metrik}


## 7. Сопровождение разработки {#soprovozhdenie-razrabotki}

### 7.1. + ICU в submodules {#icu-v-submodules}

Добавление в submodules также нужно для Аркадии (7.26).

### 7.2. + LLVM в submodules {#llvm-v-submodules}

Сделал Алексей Миловидов.

### 7.3. + Обновление Poco {#obnovlenie-poco}

Алексанр Кузьменков.

### 7.4. + Включить libc++, libc++-abi при сборке с gcc {#vkliuchit-libc-libc-abi-pri-sborke-s-gcc}

Сейчас включено только при сборке с clang, но продакшен сборка использует gcc.
Требует 7.2 и, возможно, 7.1 (только в случае новой версии ICU).

### 7.5. + Начать публиковать LTS релизы {#nachat-publikovat-lts-relizy}

[Александр Сапин](https://github.com/alesapin).

### 7.6. + Правильный статистический тест для comparison mode в clickhouse-performance-test {#pravilnyi-statisticheskii-test-dlia-comparison-mode-v-clickhouse-performance-test}

Задачу начал делать Дмитрий Рубашкин (ВШЭ). Сейчас продолжает [Александр Кузьменков](https://github.com/akuzm). Сделано, работает в CI. Долгое время не были определены надёжные критерии для результата теста. Сейчас проблема решена, но остались не решёнными некоторые вопросы.

### 7.7. + Доделать тесты под MSan {#dodelat-testy-pod-msan}

Уже есть ASan, TSan, UBSan. Не хватает тестов под MSan. Они уже добавлены в CI, но не проходят.
[Александр Кузьменков](https://github.com/akuzm) и [Александр Токмаков](https://github.com/tavplubix).

Upd. Задача всё ещё медленно тащится.
Upd. Доделал Алексей Миловидов.

### 7.8. + Добавить clang-tidy {#dobavit-clang-tidy}

Уже есть PVS-Studio. Мы очень довольны, но этого недостаточно.

Upd. Алексей Миловидов. Добавлено некоторое множество проверок, но нужно рассмотреть все проверки подряд и добавить всё, что можно.
Upd. Рассмотрели все проверки подряд.

### 7.9. + Проверки на стиль имён с помощью clang-tidy {#proverki-na-stil-imion-s-pomoshchiu-clang-tidy}

Сделано. Только в .cpp файлах и только для имён локальных переменных. Остальное слишком сложно.

### 7.10. Включение UBSan и MSan в интеграционных тестах {#vkliuchenie-ubsan-i-msan-v-integratsionnykh-testakh}

UBSan включен в функциональных тестах, но не включен в интеграционных тестах. Требует 7.7.

### 7.11. + Включение \*San в unit тестах {#vkliuchenie-san-v-unit-testakh}

У нас мало unit тестов по сравнению с функциональными тестами и их использование не обязательно. Но они всё-равно важны и нет причин не запускать их под всеми видами sanitizers.

Илья Яцишин. Сделано.

### 7.12. Показывать тестовое покрытие нового кода в PR {#pokazyvat-testovoe-pokrytie-novogo-koda-v-pr}

Пока есть просто показ тестового покрытия всего кода.

### 7.13. + Включение аналога -Weverything в gcc {#vkliuchenie-analoga-weverything-v-gcc}

Мы используем -Wall -Wextra -Weverything -Werror.
При сборке с clang, -Weverything уже включено. Но в gcc есть уникальные warning-и, отсутствующие в clang.
Сделал Wolf Kreuzerkrieg.

### 7.14. + Альтернатива для readline и libedit {#alternativa-dlia-readline-i-libedit}

Подключение replxx вместо readline сделал Иван Лежанкин.

Есть технический долг с лицензиями файлов консорциума Unicode.
Есть технический долг с работой \G в multiline режиме.

### 7.14.1. + Улучшение возможностей интерактивного режима clickhouse-client {#uluchshenie-vozmozhnostei-interaktivnogo-rezhima-clickhouse-client}

Тагир Кускаров, ВШЭ.

Upd. В рамках данной задачи добавляем подстветку синтаксиса и исправление проблем со вставкой больших запросов.
Upd. Минимальная подсветка добавлена, а все остальные задачи не сделаны.

Для ввода запросов в интерактивном режиме в клиенте командной строки clickhouse-client использовалась библиотека readline или libedit.

Библиотеки readline и libedit обладает следующими недостатками:
- (исправлено в новых версиях readline) Очень низкая производительность вставки больших кусков текста. Вставка каждого следующего символа имеет сложность O(n = количество предыдущих символов) и при вставке 1 МБ текста, скорость падает до десятков байт в секунду.
- Крайне сложно или невозможно реализовать подсветку синтаксиса по мере набора текста, а также autocomplete без нажатия дополнительных клавиш для вызова.
- Лицензия GPL (для readline) препятствует её включению в кодовую базу продукта.
- Плохо работает навигация по истории, если история вкючает запросы, не помещающиеся на экран.
- История сохраняется лишь при завершении работы клиента.
- При параллельной работе нескольких клиентов с одним файлом истории, сохраняется история только одного из клиентов.
- Плохо работает история для многострочных запросов.
- Излишняя экономия пересылаемых данных, что часто приводит к остаткам мусора в терминале.

Кроме того, имеются следующие сложно достижимые достоинства:
- Поддержка right-to-left текста;
- Поддержка editrc конфигураций.

В качестве альтернатив можно рассмотреть следующие варианты:
- Linenoise от Salvatore Sanfilippo. Достоинства: простота и компактность кода; высокая скорость работы. Недостатки: отсутствует поддержка Unicode; отсутствует автоматический перенос текста, что затрудняет работу с многострочными запросами.
- Linenoise с патчами для поддержки Unicode. Недостаток: теряется преимущество по скорости работы.
- Fish shell. Не является библиотекой, но представляет собой отличный пример, как можно реализовать подстветку синтаксиса и удобный autocomplete. Поддерживает Unicode, но работает весьма медленно.
- Python Prompt Toolkit. Не является подходящим решением для интеграции в C++ проект. Хорошие возможности по подсветке синтаксиса и autocomplete.

Вместо этого предлагается в качестве примера изучить прототип текстового редактора Kilo: https://viewsourcecode.org/snaptoken/kilo/ и реализовать всю необходимую функциональность.

### 7.15. + Замена libressl обратно на openssl {#zamena-libressl-obratno-na-openssl}

Поводом использования libressl послужило желание нашего хорошего друга из известной компании несколько лет назад. Но сейчас ситуация состоит в том, что openssl продолжает развиваться, а libressl не особо, и можно спокойно менять обратно.

Нужно для Яндекс.Облака для поддержки TLS 1.3.

### 7.16. + tzdata внутри бинарника {#tzdata-vnutri-binarnika}

Как в Аркадии, fallback на системные.

### 7.17. + Доделать tgz пакеты {#dodelat-tgz-pakety}

Уже давно собираются универсальные tgz пакеты, но по нелепой случайности из них исчез install скрипт.
[Александр Сапин](https://github.com/alesapin). Может делегировать эту задачу кому угодно.
Upd. Сделано всё кроме инструкции на сайте. Для этого требуется создать директории testing/stable/prestable на repo.yandex.ru. Внезапно оказалось, что человек, отвечающий за это, в отпуске, и он не отвечает на вопрос, кто его заместитель. Q1.

### 7.18. + Доделать бинарники под Mac {#dodelat-binarniki-pod-mac}

Уже есть автосборка бинарников под Mac на каждый коммит и PR, но с недостатками.
[Иван Лежанкин](https://github.com/abyss7). Требует 7.1, 7.2. Рекомендуется 7.14. Сейчас не хватает по крайней мере SSL и ICU. Нужно для Яндекс.Облака.
Upd. Сделано SSL. Ориентируемся в Q1, но приоритет средний и может потеряться.

### 7.18.1. Поместить ссылку на собранные бинарники под Mac на сайт {#pomestit-ssylku-na-sobrannye-binarniki-pod-mac-na-sait}

Сейчас людям приходится делать несколько кликов, чтобы их скачать.
[Александр Сапин](https://github.com/alesapin).
Upd. Добавлены прямые ссылки и инструкция в документации. Но всё ещё нет инструкции на главной странице сайта.

### 7.19. + Доделать (проверить) автосборку под AArch64 {#dodelat-proverit-avtosborku-pod-aarch64}

https://github.com/ClickHouse/ClickHouse/issues/8027\#issuecomment-566670282
Проверили на настоящем сервере Huawei, а также в специальном Docker контейнере, который содержит внутри qemu-user-static.
Также можно проверить на Cavium, на Raspberry Pi а также на твоём Android телефоне.

### 7.20. + Автосборка для FreeBSD x86_64 {#avtosborka-dlia-freebsd-x86-64}

[Иван Лежанкин](https://github.com/abyss7).

Upd. В процессе реализации, есть pull request.
Upd. Есть сборки, [пример](https://clickhouse-builds.s3.yandex.net/0/2cb4c91c0286b774534fcbe80e5ef8835a74a83a/report.html)
Всё ещё нет инструкции на сайте!

### 7.21. Автосборка для Linux ppc64 {#avtosborka-dlia-linux-ppc64}

[Иван Лежанкин](https://github.com/abyss7).
Как-то медленно тащится.
Как-то вообще не тащится. Также договорились, что сделаем ещё автосборку для MIPS64.

### 7.22. + Дэшборд для pull requests {#deshbord-dlia-pull-requests}

Дарья Петрова, УрФУ.

Рабочий прототип: https://pulls-dashboard-demo.herokuapp.com/dashboard/ClickHouse/ClickHouse
Upd. Мы пользуемся этим инструментом в ежедневной работе.

Над ClickHouse одновременно работает большое количество разработчиков, которые оформляют свои изменения в виде pull requests. Когда непомерженных pull requests много, то возникает сложность с организацией работы - непонятно, на какой pull request смотреть в первую очередь.

Предлагается реализовать простое одностраничное веб-приложение, в котором отображается список pull requests со следующей информацией:
- размер diff - количество изменённых строк;
- как давно было последнее обновление;
- типы изменённых файлов: C++, документация, скрипты сборки;
- наличие добавленных тестов;
- есть ли описание для changelog;
- изменены ли submodules;
- был ли разрешён запуск проверок CI;
- статусы проверок CI;
- количество approve от ревьюеров;

Статусы проверок - наиболее важная часть. Так как для каждого PR выполняется несколько десятков проверок и наиболее медленные работают до нескольких часов, придётся:
- отображать сразу все проверки для каждого PR в виде красивой разноцветной матрицы с информацией по наведению мыши;
- отсортировать проверки по важности: например, если у внешнего разработчика проходят все проверки кроме стиля кода, то мы можем взять это в работу сами;
- если для предыдущего коммита проверка была завершена, а для последнего коммита ещё только идёт - то можно отображать в таблице статус предыдущей проверки более блёклым цветом.

Предлагается реализовать несколько вариантов сортировок. Очевидное - по времени обновления, более интересно - некое ранжирование с целью выяснить, «что лучше взять в работу прямо сейчас».

Похожие продукты уже есть, например: http://prs.mozilla.io/yandex:ClickHouse К сожалению, этот продукт заброшен, да и делает не совсем то, что нужно. По своему усмотрению, можно взять из него что-нибудь полезное.

### 7.23. + Функции для fuzzing {#funktsii-dlia-fuzzing}

Андрей Некрашевич, ВШЭ.

Fuzzing тестирование - это тестирование случайными данными. Мы рассмотрим несколько подходов к этой задачи:

1.  Добавление в SQL диалект ClickHouse функций для генерации случайных данных (пример - случайные бинарные строки заданной длины, случайные валидные UTF-8 строки) и «порчи» данных (например, поменять значения случайных бит с заданной частотой). Это будет использовано для тестирования SQL-функций ClickHouse.

Можно добавить функции:
`randomString(length)`
`randomFixedString(length)`
- строка заданной длины с равномерно распределёнными случайными байтами;
`randomStringASCII(length)`
`randomStringUTF8(length)`

`fuzzBits(s, inverse_probability)` - изменить каждый бит строки на противоположный с заданной вероятностью;
`fuzzBytes(s, inverse_probability)` - изменить каждый байт строки на равномерно случайный с заданной вероятностью;

У каждой функции опциональный аргумент против склейки одинаковых выражений в запросе.

Также можно сделать функции с детерминированным генератором случайных чисел (аргументом передаётся seed) для воспроизводимости тестовых кейсов.

Upd. Сергей Штыков сделал функцию `randomPrintableASCII`.
Upd. Илья Яцишин сделал табличную функцию `generateRandom`.
Upd. Эльдар Заитов добавляет OSS Fuzz.
Upd. Сделаны randomString, randomFixedString.
Upd. Сделаны fuzzBits, fuzzBytes.

### 7.24. Fuzzing лексера и парсера запросов; кодеков и форматов {#fuzzing-leksera-i-parsera-zaprosov-kodekov-i-formatov}

Продолжение 7.23.

1.  Использование AFL или LibFuzzer для тестирования отдельных частей кодовой базы ClickHouse.

2.  Генерация и выполнение случайных синтаксически корректных запросов на случайных данных.

Upd. Александр Кузьменков сделал фазер запросов на основе мутаций AST.

### 7.25. + Синхронизация релизов в Аркадию {#sinkhronizatsiia-relizov-v-arkadiiu}

Изначально занимался Олег Алексеенков. Сейчас он перешёл работать в дружественный отдел, но обещает продолжать синхронизацию.
Затем, возможно, [Иван Лежанкин](https://github.com/abyss7). Но сейчас приостановлено, так как Максим из YT должен исправить регрессию производительности в анализе индекса.

Максим из YT сказал, что сделает это после нового года.
Максим из YT сказал, что «мы планируем в январе добиться».
Максим сейчас занимается собираемостью YT с новой версией ClickHouse.

Нужно для CHYT и YQL.

Upd: Все патчи Максима отправлены в master. Задача взята в работу.
Upd: Задача в процессе реализации. Синхронизироваться будет master. Делает [Иван Лежанкин](https://github.com/abyss7)
Upd: Есть собирающийся прототип, но сборка как будто ещё не в trunk Аркадии.
Upd: Добавлено в Аркадию, но не все файлы (не побайтово).
Upd: Добавлены все файлы побайтово.

### 7.26. + Побайтовая идентичность репозитория с Аркадией {#pobaitovaia-identichnost-repozitoriia-s-arkadiei}

Команда DevTools. Прогресс по задаче под вопросом.
Upd. Готово (все директории кроме contrib).

### 7.27. + Запуск автотестов в Аркадии {#zapusk-avtotestov-v-arkadii}

Требует 7.26. Коллеги начали делать, есть результат.
Upd. В Аркадии частично работает небольшая часть тестов. И этого достаточно.

### 7.29. Опции clickhouse install, stop, start вместо postinst, init.d, systemd скриптов {#optsii-clickhouse-install-stop-start-vmesto-postinst-init-d-systemd-skriptov}

Низкий приоритет.

### 7.30. Возможность переключения бинарных файлов на продакшене без выкладки пакетов {#vozmozhnost-perekliucheniia-binarnykh-failov-na-prodakshene-bez-vykladki-paketov}

Низкий приоритет.

### 7.31. Зеркалирование нагрузки между серверами {#zerkalirovanie-nagruzki-mezhdu-serverami}

В очереди. Нужно для Яндекс.Метрики.

### 7.32. Обфускация продакшен запросов {#obfuskatsiia-prodakshen-zaprosov}

Роман Ильговский. Нужно для Яндекс.Метрики.
Есть pull request, почти готово: https://github.com/ClickHouse/ClickHouse/pull/10973

Имея SQL запрос, требуется вывести структуру таблиц, на которых этот запрос будет выполнен, и заполнить эти таблицы случайными данными, такими, что результат этого запроса зависит от выбора подмножества данных.

Для примера, если есть запрос `SELECT SearchPhrase, count(*) FROM table WHERE CounterID = 34 AND SearchPhrase LIKE '%ClickHouse%'`, то мы можем сделать вывод, что CounterID имеет числовой тип, а SearchPhrase - строковый. Заполнить таблицу данными, на которых отдельные условия `CounterID = 34` и `SearchPhrase LIKE '%ClickHouse%'` для некоторых строк выполнены, а для некоторых строк не выполнены.

Обфускация запросов: имея секретные запросы и структуру таблиц, заменить имена полей и константы, чтобы запросы можно было использовать в качестве публично доступных тестов.

### 7.33. Выкладывать патч релизы в репозиторий автоматически {#vykladyvat-patch-relizy-v-repozitorii-avtomaticheski}

В очереди. Иван Лежанкин.
Отсутствует прогресс.

### 7.34. + Бэкпортировать bugfix автоматически {#bekportirovat-bugfix-avtomaticheski}

В очереди. Иван Лежанкин.
Присутствует прогресс.
Сделано.

### 7.35. Начальные правила для авто-merge {#nachalnye-pravila-dlia-avto-merge}

Зелёные проверки и два ревью.
[Александр Сапин](https://github.com/alesapin). Может делегировать эту задачу кому угодно.

### 7.36. Понятие доверенных контрибьюторов {#poniatie-doverennykh-kontribiutorov}

Контрибьюторы, у которых есть 5 померженных PR. Для их новых PR автотесты запускаются сразу.
[Александр Сапин](https://github.com/alesapin). Может делегировать эту задачу кому угодно.
Сейчас добавляем некоторых доверенных контрибьюторов в ручном режиме.
Upd. Всё ещё добавляем в ручном режиме.

### 7.37. + Разобраться с repo.yandex.ru {#razobratsia-s-repo-yandex-ru}

Есть жалобы на скорость загрузки и неудобство maintenance, operations, visibility.

Upd. Иван Блинков настроил CDN repo.clickhouse.tech, что решает проблему с доступностью зарубежом.
Вопрос с operations, visibility пока актуален.

Upd. Частично решён вопрос с visibility - есть какой-то дэшборд.


## 8. Интеграция с внешними системами {#integratsiia-s-vneshnimi-sistemami}

### 8.1. Поддержка ALTER MODIFY SETTING для Kafka {#podderzhka-alter-modify-setting-dlia-kafka}

Также - возможность указать все настройки форматов в Kafka.

Altinity. Никто не делает эту задачу.

### 8.2. Поддержка Mongo Atlas URI {#podderzhka-mongo-atlas-uri}

[Александр Кузьменков](https://github.com/akuzm).
Upd. Задача взята в работу.

### 8.3. + Доработки globs (правильная поддержка диапазонов, уменьшение числа одновременных stream-ов) {#dorabotki-globs-pravilnaia-podderzhka-diapazonov-umenshenie-chisla-odnovremennykh-stream-ov}

[Ольга Хвостикова](https://github.com/stavrolia).

Уменьшение числа stream-ов сделано, а вот правильная поддержка диапазонов - нет. Будем надеяться на Q1/Q2. Сделано.

### 8.4. Унификация File, HDFS, S3 под URL {#unifikatsiia-file-hdfs-s3-pod-url}

### 8.5. + Аутентификация в S3 {#autentifikatsiia-v-s3}

[Владимир Чеботарёв](https://github.com/excitoon), Altinity.

### 8.6. Kerberos аутентификация для HDFS и Kafka {#kerberos-autentifikatsiia-dlia-hdfs-i-kafka}

Андрей Коняев, ArenaData. Он куда-то пропал.

### 8.7. + Исправление мелочи HDFS на очень старых ядрах Linux {#ispravlenie-melochi-hdfs-na-ochen-starykh-iadrakh-linux}

В ядрах 2.6 отсутствует один системный вызов, который библиотека hdfs3 использует без необходимости.
Сделал Amos Bird.

### 8.8. + Поддержка виртуальных столбцов с именем файла и путём {#podderzhka-virtualnykh-stolbtsov-s-imenem-faila-i-putiom}

[Ольга Хвостикова](https://github.com/stavrolia).

### 8.9. + Поддержка сжатых файлов (gz, bz) на чтение и запись {#podderzhka-szhatykh-failov-gz-bz-na-chtenie-i-zapis}

Сделал [Andrey Bodrov](https://github.com/apbodrov)

### 8.10. + Запись в табличную функцию ODBC {#zapis-v-tablichnuiu-funktsiiu-odbc}

Артемий Бобровский, ВШЭ
Есть pull request.

### 8.11. + Движок таблиц для чтения из Mongo {#dvizhok-tablits-dlia-chteniia-iz-mongo}

Артемий Бобровский, ВШЭ
Есть pull request.
Upd. В стадии код-ревью.
Готово.

### 8.12. Пропуск столбцов в форматах Parquet, ORC {#propusk-stolbtsov-v-formatakh-parquet-orc}

Реализовано возможно частично - проверить.

### 8.13. Поддержка массивов в Parquet, ORC {#podderzhka-massivov-v-parquet-orc}

### 8.14. + Запись данных в ORC {#zapis-dannykh-v-orc}

Павел Круглов, ВШЭ. Есть pull request. Готово.

### 8.15. Запись данных в CapNProto {#zapis-dannykh-v-capnproto}

### 8.16. + Поддержка формата Avro {#podderzhka-formata-avro}

Andrew Onyshchuk. Есть pull request. Q1. Сделано.

Формат Apache Avro является компактным структурированным построчным бинарным форматом данных с внешней схемой. Этот формат часто используется совместно с Kafka и поддержка его в качестве одного из форматов ввода-вывода в ClickHouse является востребованной пользователями.

### 8.16.1. + Поддержка формата JSONEachRow, засунутого в массив {#podderzhka-formata-jsoneachrow-zasunutogo-v-massiv}

Павел Круглов, ВШЭ и Яндекс. Есть pull request.

### 8.16.2. - Поддержка формата Thrift {#podderzhka-formata-thrift}

Павел Круглов, ВШЭ и Яндекс. Задача отменена.

### 8.16.3. + Поддержка формата MsgPack {#podderzhka-formata-msgpack}

Павел Круглов, ВШЭ и Яндекс.
Задача взята в работу.

Upd. Почти готово - есть лишь небольшой технический долг.
Upd. Готово.

### 8.16.4. + Формат Regexp {#format-regexp}

Павел Круглов, ВШЭ и Яндекс.
Есть pull request. Готово.

### 8.17. ClickHouse как MySQL реплика {#clickhouse-kak-mysql-replika}

Задачу делает BohuTANG.

Реализовать возможность подписаться на row-based репликацию MySQL и сохранять полученные данные в CollapsingMergeTree или ReplacingMergeTree таблицы. Сторонние решения для этой задачи уже существуют: https://www.altinity.com/blog/2018/6/30/realtime-mysql-clickhouse-replication-in-practice Также существует стороннее решение для PostgreSQL: https://github.com/mkabilov/pg2ch

Встроенная в ClickHouse возможность работать в качестве реплики MySQL даст преимущества для дальнейшего развития.

### 8.18. + ClickHouse как Federated MySQL {#clickhouse-kak-federated-mysql}

Maxim Fedotov, Wargaming + Yuri Baranov, Яндекс.

### 8.19. + Интеграция с RabbitMQ {#integratsiia-s-rabbitmq}

Ксения Сумарокова, ВШЭ.

В ClickHouse часто используется потоковый импорт данных из распределённой очереди. Наиболее популярно использование совместно с Kafka. Эта возможность уже есть.

Следующей по востребованности является система очередей RabbitMQ. Её поддержка в ClickHouse отсутствует.

Есть pull request в процессе разработки.
Upd. В процессе code review.
Upd. Готово.

### 8.20. - Интеграция с SQS {#integratsiia-s-sqs}

Низкий приоритет. Отменено.

### 8.21. Поддержка произвольного количества языков для имён регионов {#podderzhka-proizvolnogo-kolichestva-iazykov-dlia-imion-regionov}

Нужно для БК. Декабрь 2019.
В декабре для БК сделан минимальный вариант этой задачи.
Максимальный вариант, вроде, никому не нужен.
Upd. Всё ещё кажется, что задача не нужна.

### 8.22. + Поддержка синтаксиса для переменных в стиле MySQL {#podderzhka-sintaksisa-dlia-peremennykh-v-stile-mysql}

При парсинге запроса преобразовывать синтаксис вида `@@version_full` в вызов функции `getGlobalVariable('version_full')`. Поддержать популярные MySQL переменные. Может быть поможет Юрий Баранов, если будет энтузиазм.

Upd. Юрий Баранов работает в Google, там запрещено разрабатывать ClickHouse.
Upd. Сделано теми людьми, кому не запрещено разрабатывать ClickHouse.

### 8.23. Подписка для импорта обновляемых и ротируемых логов в ФС {#podpiska-dlia-importa-obnovliaemykh-i-rotiruemykh-logov-v-fs}

Желательно 2.15.


## 9. Безопасность {#bezopasnost}

### 9.1. + Ограничение на хосты в запросах ко внешним системам {#ogranichenie-na-khosty-v-zaprosakh-ko-vneshnim-sistemam}

Михаил Коротов.

### 9.2. Преднастроенные именованные соединения к внешним БД {#prednastroennye-imenovannye-soedineniia-k-vneshnim-bd}

ClickHouse предоставляет возможность обратиться к внешней базе данных из языка запросов. Это реализовано в виде табличных функций. В параметрах к табличной функции указывается адрес удалённой базы данных (хост, порт), а также аутентификационные данные (имя пользователя, пароль). Аутентификационные данные указываются в запросе в открытом виде и, таким образом, попадают в историю запросов и в логи, что компрометирует безопасность системы.

Вместо этого предлагается описывать необходимые данные в конфигурационном файле сервера или в отдельном сервисе и ссылаться на них по именам.

### 9.3. + Поддержка TLS для ZooKeeper {#podderzhka-tls-dlia-zookeeper}

[\#10174](https://github.com/ClickHouse/ClickHouse/issues/10174)

Есть pull request.


## 10. Внешние словари {#vneshnie-slovari}

### 10.1. + Исправление зависания в библиотеке доступа к YT {#ispravlenie-zavisaniia-v-biblioteke-dostupa-k-yt}

Библиотека для доступа к YT не переживает учения.
Нужно для БК и Метрики. Поиск причин - [Александр Сапин](https://github.com/alesapin). Дальшейшее исправление возможно на стороне YT.

Цитата: «Оказывается для YT-клиента зависания на несколько минут это нормально. Убрал внутренние ретраи, снизил таймауты. Однозначно станет лучше».

### 10.2. + Исправление SIGILL в библиотеке доступа к YT {#ispravlenie-sigill-v-biblioteke-dostupa-k-yt}

Код YT использует SIGILL вместо abort. Это, опять же, происходит при учениях.
Нужно для БК и Метрики. Поиск причин - [Александр Сапин](https://github.com/alesapin). Дальшейшее исправление возможно на стороне YT.

Upd. Одну причину устранили, но ещё что-то неизвестное осталось.
Upd. Нас заставляют переписать эту библиотеку с одного API на другое, так как старое внезапно устарело. Кажется, что переписывание случайно исправит все проблемы.
Upd. Ура, нашли причину и исправили.

### 10.3. Возможность чтения данных из статических таблиц в YT словарях {#vozmozhnost-chteniia-dannykh-iz-staticheskikh-tablits-v-yt-slovariakh}

Нужно для БК и Метрики.

### 10.4. - Словарь из YDB (KikiMR) {#slovar-iz-ydb-kikimr}

Нужно для Метрики, а делать будет таинственный незнакомец из команды KikiMR (под вопросом). Таинственный незнакомец не подтверждает, что он будет делать эту задачу.

### 10.5. Закрытие соединений и уменьшение числа соединений для MySQL и ODBC {#zakrytie-soedinenii-i-umenshenie-chisla-soedinenii-dlia-mysql-i-odbc}

Нужно для Метрики.

Для MySQL сделал Clément Rodriguez.

### 10.6. Словари из Cassandra и Couchbase {#slovari-iz-cassandra-i-couchbase}

Готова Cassandra.

### 10.7. Поддержка Nullable в словарях {#podderzhka-nullable-v-slovariakh}

### 10.8. Поддержка массивов в словарях {#podderzhka-massivov-v-slovariakh}

### 10.9. - Уменьшение блокировок для cache словарей за счёт одновременных запросов одного и того же {#umenshenie-blokirovok-dlia-cache-slovarei-za-schiot-odnovremennykh-zaprosov-odnogo-i-togo-zhe}

Заменено в пользу 10.10, 10.11.

### 10.10. + Возможность использования старых значений из cache словаря пока они перезапрашиваются {#vozmozhnost-ispolzovaniia-starykh-znachenii-iz-cache-slovaria-poka-oni-perezaprashivaiutsia}

Никита Михайлов. Q1. Нужно для БК и Метрики.

### 10.11. + Возможность исключительно асинхронных запросов в cache словарях {#vozmozhnost-iskliuchitelno-asinkhronnykh-zaprosov-v-cache-slovariakh}

Никита Михайлов. Q1. Нужно для БК и Метрики. Требует 10.10.

### 10.12. + Layout direct для словарей {#layout-direct-dlia-slovarei}

Артём Стрельцов, Николай Дегтеринский, Наталия Михненко, ВШЭ.
Приступили к этой задаче.
Готов direct, есть pull request complex_key_direct.
Готово всё.

### 10.13. Использование Join как generic layout для словарей {#ispolzovanie-join-kak-generic-layout-dlia-slovarei}

### 10.14. Поддержка всех типов в функции transform {#podderzhka-vsekh-tipov-v-funktsii-transform}

### 10.15. + Использование словарей как специализированного layout для Join {#ispolzovanie-slovarei-kak-spetsializirovannogo-layout-dlia-join}

### 10.16. + Словари на локальном SSD {#slovari-na-lokalnom-ssd}

Никита Васильев, ВШЭ и Яндекс. Есть pull request.

Реализовать в ClickHouse специализированный движок таблиц, подходящий для быстрых key-value запросов и оптимизированный для расположения данных на SSD. Это может быть: реализация на основе RocksDB; сериализованные RowBinary данные с индексом в оперативке; секретная очень эффективная структура данных, о которой я расскажу.

Использовать эту структуру данных как отдельный вид словарей, как источник для cache словарей или как дополнительный уровень кэширования для cache словарей.

Upd. Задача в финальной стадии готовности.

### 10.17. Локальный дамп состояния словаря для быстрого старта сервера {#lokalnyi-damp-sostoianiia-slovaria-dlia-bystrogo-starta-servera}

### 10.18. Таблица Join или словарь на удалённом сервере как key-value БД для cache словаря {#tablitsa-join-ili-slovar-na-udalionnom-servere-kak-key-value-bd-dlia-cache-slovaria}

### 10.19. Возможность зарегистрировать некоторые функции, использующие словари, под пользовательскими именами {#vozmozhnost-zaregistrirovat-nekotorye-funktsii-ispolzuiushchie-slovari-pod-polzovatelskimi-imenami}


## 11. Интерфейсы {#interfeisy}

### 11.1. Вставка состояний агрегатных функций в виде кортежа аргументов или массива кортежей аргументов {#vstavka-sostoianii-agregatnykh-funktsii-v-vide-kortezha-argumentov-ili-massiva-kortezhei-argumentov}

### 11.2. Возможность использовать движок JDBC из коробки {#vozmozhnost-ispolzovat-dvizhok-jdbc-iz-korobki}

Нужно разобраться, как упаковывать Java в статический бинарник, возможно AppImage. Или предоставить максимально простую инструкцию по установке jdbc-bridge. Может быть будет заинтересован Александр Крашенинников, Badoo, так как он разработал jdbc-bridge.

Upd. Александр Крашенинников перешёл в другую компанию и больше не занимается этим.

### 11.3. + Интеграционные тесты ODBC драйвера путём подключения ClickHouse к самому себе через ODBC {#integratsionnye-testy-odbc-draivera-putiom-podkliucheniia-clickhouse-k-samomu-sebe-cherez-odbc}

Михаил Филимонов, Altinity. Готово.

### 11.4. Исправление упячек с типами Date и Decimal в clickhouse-cpp {#ispravlenie-upiachek-s-tipami-date-i-decimal-v-clickhouse-cpp}

Altinity целиком взяли на себя поддержку clickhouse-cpp драйвера.

### 11.5. Поддержка TLS в clickhouse-cpp {#podderzhka-tls-v-clickhouse-cpp}

А знаете ли вы, что библиотеку clickhouse-cpp разрабатывал один хороший человек в свободное время?

### 11.6. Интеграционные тесты clickhouse-cpp {#integratsionnye-testy-clickhouse-cpp}

### 11.7. Интерактивный режим работы программы clickhouse-local {#interaktivnyi-rezhim-raboty-programmy-clickhouse-local}

### 11.8. + Поддержка протокола PostgreSQL {#podderzhka-protokola-postgresql}

Элбакян Мовсес Андраникович, ВШЭ.

В ClickHouse в прошлом году добавили поддержку wire-протокола MySQL. PostgreSQL, так же как MySQL, использует несложный протокол общения между клиентом и сервером, но свой собственный. Поддержка этого протокола является востребованной и откроет новые возможности для ClickHouse.

Задача в процессе разработки.
Задача в финальной стадии разработки.

### 11.9. + Доработки ODBC драйвера {#dorabotki-odbc-draivera}

Денис Глазачев, Altinity. Хороший прогресс по этой задаче.

### 11.10. + Преднастроенные HTTP handlers для запросов {#prednastroennye-http-handlers-dlia-zaprosov}

zhang2014, есть pull request.

Возможность описать в конфигурационном файле handler (путь в URL) для HTTP запросов к серверу, которому соответствует некоторый параметризованный запрос. Пользователь может вызвать этот обработчик и не должен передавать SQL запрос.


## 12. Управление пользователями и доступом {#upravlenie-polzovateliami-i-dostupom}

### 12.1. + Role Based Access Control {#role-based-access-control}

[Виталий Баранов](https://github.com/vitlibar). Финальная стадия разработки, рабочая версия в начале апреля 2019.
Q2. Сейчас сделаны все интерфейсы в коде и запросы, но не сделаны варианты хранения прав кроме прототипа.
Upd. Сделано хранение прав. До готового к использованию состояния осталось несколько доработок.

### 12.2. + Управление пользователями и правами доступа с помощью SQL запросов {#upravlenie-polzovateliami-i-pravami-dostupa-s-pomoshchiu-sql-zaprosov}

[Виталий Баранов](https://github.com/vitlibar). Финальная стадия разработки, рабочая версия в декабре 2019.
Q1. Сделано управление правами полностью, но не реализовано их хранение, см. 12.1.

### 12.3. Подключение справочника пользователей и прав доступа из LDAP {#podkliuchenie-spravochnika-polzovatelei-i-prav-dostupa-iz-ldap}

Аутентификация через LDAP - Денис Глазачев.
[Виталий Баранов](https://github.com/vitlibar) и Денис Глазачев, Altinity. Требует 12.1.
Q3.

### 12.4. Подключение IDM системы Яндекса как справочника пользователей и прав доступа {#podkliuchenie-idm-sistemy-iandeksa-kak-spravochnika-polzovatelei-i-prav-dostupa}

Пока низкий приоритет. Нужно для Метрики. Требует 12.3.

### 12.5. Pluggable аутентификация с помощью Kerberos (возможно, подключение GSASL) {#pluggable-autentifikatsiia-s-pomoshchiu-kerberos-vozmozhno-podkliuchenie-gsasl}

[Виталий Баранов](https://github.com/vitlibar) и Денис Глазачев, Altinity. Требует 12.1.

### 12.6. + Информация о пользователях и квотах в системной таблице {#informatsiia-o-polzovateliakh-i-kvotakh-v-sistemnoi-tablitse}

[Виталий Баранов](https://github.com/vitlibar). Требует 12.1.
Есть pull request. Q2. Готово.


## 13. Разделение ресурсов, multi-tenancy {#razdelenie-resursov-multi-tenancy}

### 13.1. Overcommit запросов по памяти и вытеснение {#overcommit-zaprosov-po-pamiati-i-vytesnenie}

Требует 2.1. Способ реализации обсуждается. Александр Казаков.

### 13.2. Общий конвейер выполнения на сервер {#obshchii-konveier-vypolneniia-na-server}

Требует 2.1. [Николай Кочетов](https://github.com/KochetovNicolai).

### 13.3. Пулы ресурсов {#puly-resursov}

Александр Казаков.

Требует 13.2 или сможем сделать более неудобную реализацию раньше.
Обсуждается вариант неудобной реализации. Пока средний приоритет, целимся на Q1/Q2.
Вариант реализации выбрал Александр Казаков.
Upd. Не уследили, и задачу стали обсуждать менеджеры.
Upd. Задачу смотрит Александр Казаков.
Upd. Задача взята в работу.


## 14. Диалект SQL {#dialekt-sql}

### 14.1. + Исправление семантики CAST для Nullable {#ispravlenie-semantiki-cast-dlia-nullable}

Нужно для DataLens. А также для внедрения в BI инструмент Looker.

### 14.2. Поддержка WITH для подзапросов {#podderzhka-with-dlia-podzaprosov}

### 14.3. Поддержка подстановок для множеств в правой части IN {#podderzhka-podstanovok-dlia-mnozhestv-v-pravoi-chasti-in}

### 14.4. Поддержка подстановок для идентификаторов (имён) в SQL запросе {#podderzhka-podstanovok-dlia-identifikatorov-imion-v-sql-zaprose}

zhang2014
Задача на паузе.

### 14.5. + Поддержка задания множества как массива в правой части секции IN {#podderzhka-zadaniia-mnozhestva-kak-massiva-v-pravoi-chasti-sektsii-in}

Василий Немков, Altinity, делал эту задачу, но забросил её в пользу других задач.
В результате, сейчас доделывает Антон Попов.

### 14.6. Глобальный scope для WITH {#globalnyi-scope-dlia-with}

### 14.7. Nullable для WITH ROLLUP, WITH CUBE, WITH TOTALS {#nullable-dlia-with-rollup-with-cube-with-totals}

Простая задача.

### 14.8. Модификаторы DISTINCT, ORDER BY для агрегатных функций {#modifikatory-distinct-order-by-dlia-agregatnykh-funktsii}

В ClickHouse поддерживается вычисление COUNT(DISTINCT x). Предлагается добавить возможность использования модификатора DISTINCT для всех агрегатных функций. Например, AVG(DISTINCT x) - вычислить среднее значение для всех различных значений x. Под вопросом вариант, в котором фильтрация уникальных значений выполняется по одному выражению, а агрегация по другому.

Результат некоторых агрегатных функций зависит от порядка данных. Предлагается реализовать модификатор ORDER BY, задающий порядок явно. Пример: groupArray(x ORDER BY y, z).

Upd. Есть pull request-ы.
Upd. DISTINCT готов.

### 14.9. + Поддержка запроса EXPLAIN {#podderzhka-zaprosa-explain}

Требует 2.1. [Николай Кочетов](https://github.com/KochetovNicolai).
Upd. Есть pull request. Готово.

### 14.10. arrayReduce как функция высшего порядка {#arrayreduce-kak-funktsiia-vysshego-poriadka}

### 14.11. Функции для grouping sets {#funktsii-dlia-grouping-sets}

### 14.12. Функции обработки временных рядов {#funktsii-obrabotki-vremennykh-riadov}

Сложная задача, так как вводит новый класс функций и требует его обработку в оптимизаторе запросов.

В time-series СУБД нужны функции, которые зависят от последовательности значений. Или даже от последовательности значений и их меток времени. Примеры: moving average, exponential smoothing, derivative, Holt-Winters forecast. Вычисление таких функций поддерживается в ClickHouse лишь частично. Так, ClickHouse поддерживает тип данных «массив» и позволяет реализовать эти функции как функции, принимающие массивы. Но гораздо удобнее для пользователя было бы иметь возможность применить такие функции к таблице (промежуточному результату запроса после сортировки).

Это требует введение нового класса функций (помимо обычных и агрегатных функций) - такие функции будут иметь в коде ClickHouse свой собственный интерфейс, и их вычисление придётся отдельно учитывать в конвейере выполнения запросов. Для примера, вычисление обычных функций тривиально распараллеливается по процессорным ядрам и по серверам; вычисление агрегатных функций распараллеливается с некоторыми особенностями (работа с промежуточными состояниями вычислений, операция merge); а для функций по обработке временных рядов этот вопрос остаётся открытым - возможно, их придётся вычислять на одном сервере и в одном потоке.

### 14.13. Применимость функций высшего порядка для кортежей и Nested {#primenimost-funktsii-vysshego-poriadka-dlia-kortezhei-i-nested}

### 14.14. Неявные преобразования типов констант {#neiavnye-preobrazovaniia-tipov-konstant}

Сделано для операторов сравнения с константами (подавляющее большинство use cases).
В общем виде требует 2.12.

### 14.15. Неявные преобразования типов под настройкой {#neiavnye-preobrazovaniia-tipov-pod-nastroikoi}

Требует 2.12. Для внедрения в BI инструмент Looker.

### 14.16. Синонимы для функций из MySQL {#sinonimy-dlia-funktsii-iz-mysql}

### 14.17. + Ввести понятие stateful функций {#vvesti-poniatie-stateful-funktsii}

zhang2014.
Для runningDifference, neighbour - их учёт в оптимизаторе запросов.
В интерфейсе уже сделано. Надо проверить, что учитывается в нужных местах (например, что работает predicate pushdown сквозь ORDER BY, если таких функций нет).

### 14.18. UNION DISTINCT и возможность включить его по-умолчанию {#union-distinct-i-vozmozhnost-vkliuchit-ego-po-umolchaniiu}

Для BI систем.

### 14.19. + Совместимость парсера типов данных с SQL {#sovmestimost-parsera-tipov-dannykh-s-sql}

Павел Потёмкин, ВШЭ.
Для BI систем.

### 14.20. Позиционные аргументы для GROUP BY и ORDER BY {#pozitsionnye-argumenty-dlia-group-by-i-order-by}

Тривиально и используется многими системами, но не входит в стандарт SQL.

### 14.21. Приведение типов для IN (подзапрос) и для JOIN {#privedenie-tipov-dlia-in-podzapros-i-dlia-join}


## 15. Улучшение поддержки JOIN {#uluchshenie-podderzhki-join}

### 15.1. + Доведение merge JOIN до продакшена {#dovedenie-merge-join-do-prodakshena}

Артём Зуйков. Сейчас merge JOIN включается вручную опцией и всегда замедляет запросы. Хотим, чтобы он замедлял запросы только когда это неизбежно.
Кстати, смысл merge JOIN появляется только совместно с 15.2 и 15.3.
Q1. Сделали адаптивный вариант, но вроде он что-то всё-ещё замедляет.
Задача сделана, но всё работает слишком медленно.

### 15.1.1. Алгоритм two-level merge JOIN {#algoritm-two-level-merge-join}

Также известен как grace hash join.
Артём Зуйков. В очереди.

### 15.1.2. Тестирование реализации JOIN в Greenplum {#testirovanie-realizatsii-join-v-greenplum}

В очереди. Как будто задача самоотменилась.

### 15.2. Прокидывание условий в OUTER JOIN {#prokidyvanie-uslovii-v-outer-join}

Возможно, Артём Зуйков, но задача ещё не продумана до конца. Возможно, требует 2.1.

### 15.3. Логический вывод для цепочек вида ON t1.x = t2.y WHERE t1.x = 10 {#logicheskii-vyvod-dlia-tsepochek-vida-on-t1-x-t2-y-where-t1-x-10}

Возможно, Артём Зуйков. Для полноценной работы 15.2.

### 15.4. Distributed JOIN с помощью перераспределения данных {#distributed-join-s-pomoshchiu-pereraspredeleniia-dannykh}

Артём Зуйков.

### 15.5. Использование ключа таблицы для оптимизации merge JOIN {#ispolzovanie-kliucha-tablitsy-dlia-optimizatsii-merge-join}

### 15.6. + SEMI и ANTI JOIN {#semi-i-anti-join}

Артём Зуйков.


## 16. Типы данных и функции {#tipy-dannykh-i-funktsii}

### 16.1. + DateTime64 {#datetime64}

Василий Немков, Altinity, декабрь 2019.

### 16.2. Тип данных для JSON {#tip-dannykh-dlia-json}

zhang2014

Есть PR, в процессе ревью.

### 16.3. Поддержка неконстантных аргументов с регулярными выражениями в функциях {#podderzhka-nekonstantnykh-argumentov-s-reguliarnymi-vyrazheniiami-v-funktsiiakh}

Данила Кутенин, но только после секретного изменения в работе.
Upd. Секретного изменения в работе не будет, задачу будет делать другой человек.

### 16.4. Функция rowNumberForKey {#funktsiia-rownumberforkey}

### 16.5. Функции для XML и HTML escape {#funktsii-dlia-xml-i-html-escape}

### 16.6. Функции нормализации и хэширования SQL запросов {#funktsii-normalizatsii-i-kheshirovaniia-sql-zaprosov}


## 17. Работа с географическими данными {#rabota-s-geograficheskimi-dannymi}

### 17.1. Гео-словари для определения региона по координатам {#geo-slovari-dlia-opredeleniia-regiona-po-koordinatam}

[Андрей Чулков](https://github.com/achulkov2), Антон Кваша, Артур Петуховский, ВШЭ.
Будет основано на коде от Арслана Урташева.

ClickHouse не является geospatial СУБД. Тем не менее, в ClickHouse есть несколько функций для таких задач. Например, функция `pointInPolygon` позволяет быстро проверить попадание точек в полигон на плоскости. При этом, полигон задаётся в явном виде и должен быть константным для вызова функции (то есть - проверяется принадлежность многих точек одному полигону). Эта функциональность нужна, например, для рекламного таргетинга мобильных устройств по координатам.

Похожая, но более сложная задача, которую ClickHouse пока не умеет решать - определение полигона среди множества полигонов, в которые попадают точки. Для примера: определение района города по географическим координатам. Для решения этой задачи нужно будет реализовать поддержку словарей с полигонами, в которых данные проиндексированы для быстрого поиска.

Upd. Андрей сделал прототип интерфейса и реализацию-заглушку внутри него.
Upd. Андрей сделал прототип более оптимальной структуры данных.
Upd. Есть обнадёживающие результаты.
Upd. В ревью.

### 17.2. GIS типы данных и операции {#gis-tipy-dannykh-i-operatsii}

Алексей Коряков, Алексей Илюхов, ВШЭ, Яндекс.Карты.

Реализовать в ClickHouse типы данных для задач обработки геоинформационных данных: Point, Line, MultiLine, Polygon и операции над ними - проверка вхождения, пересечения. Вариантом минимум будет реализация этих операций в евклидовой системе координат. Дополнительно - на сфере и WGS84.

Upd. Есть pull request.

### 17.3. + Ускорение greatCircleDistance {#uskorenie-greatcircledistance}

[Ольга Хвостикова](https://github.com/stavrolia), основано на коде Андрея Аксёнова, получено разрешение на использование кода.

### 17.4. Ускорение geohash с помощью библиотеки из Аркадии {#uskorenie-geohash-s-pomoshchiu-biblioteki-iz-arkadii}

Получено одобрение от руководства.

### 17.5. + Проверки в функции pointInPolygon {#proverki-v-funktsii-pointinpolygon}

Сейчас функция тихо не работает в случае полигонов с самопересечениями, надо кидать исключение.


## 18. Машинное обучение и статистика {#mashinnoe-obuchenie-i-statistika}

### 18.1. Инкрементальная кластеризация данных {#inkrementalnaia-klasterizatsiia-dannykh}

Александр Кожихов, Максим Кузнецов. Обнаружена фундаментальная проблема в реализации, доделывает предположительно [Николай Кочетов](https://github.com/KochetovNicolai). Он может делегировать задачу кому угодно.

Исправление фундаментальной проблемы - есть PR.

### 18.2. Агрегатные функции для статистических тестов {#agregatnye-funktsii-dlia-statisticheskikh-testov}

Артём Цыганов, Руденский Константин Игоревич, Семёнов Денис, ВШЭ.

Предлагается реализовать в ClickHouse статистические тесты (Analysis of Variance, тесты нормальности распределения и т. п.) в виде агрегатных функций. Пример: `welchTTest(value, sample_idx)`.

Сделали прототип двух тестов, есть pull request. Также есть pull request для корелляции рангов.

### 18.3. Инфраструктура для тренировки моделей в ClickHouse {#infrastruktura-dlia-trenirovki-modelei-v-clickhouse}

В очереди.


## 19. Улучшение работы кластера {#uluchshenie-raboty-klastera}

### 19.1. Параллельные кворумные вставки без линеаризуемости {#parallelnye-kvorumnye-vstavki-bez-linearizuemosti}

Репликация данных в ClickHouse по-умолчанию является асинхронной без выделенного мастера. Это значит, что клиент, осуществляющий вставку данных, получает успешный ответ после того, как данные попали на один сервер; репликация данных по остальным серверам осуществляется в другой момент времени. Это ненадёжно, потому что допускает потерю только что вставленных данных при потере лишь одного сервера.

Для решения этой проблемы, в ClickHouse есть возможность включить «кворумную» вставку. Это значит, что клиент, осуществляющий вставку данных, получает успешный ответ после того, как данные попали на несколько (кворум) серверов. Обеспечивается линеаризуемость: клиент, получает успешный ответ после того, как данные попали на несколько реплик, *которые содержат все предыдущие данные, вставленные с кворумом* (такие реплики можно называть «синхронными»), и при запросе SELECT можно выставить настройку, разрешающую только чтение с синхронных реплик.

Если бы свойства линеаризуемости не было, то для трёх серверов A, B, C, значения кворума = 2, и для трёх вставок данных 1, 2, 3, возможна ситуация, что первая вставка прошла на серверы A и B, вторая прошла на серверы B и C, а третья - на серверы A и C, и теперь ни один из серверов не содержит полный набор данных 1, 2, 3.

Как ни странно, такое свойство не нужно большинству пользователей. Оно запрещает параллельно выполняющиеся вставки. А пользователи хотят вставлять данные надёжно (на более чем одну реплику), но не важно, в каком порядке. Предлагается сделать опцию, которая отключает линеаризуемость.

Иногда пользователь хочет реализовать кворумную вставку вручную: просто соединиться с несколькими репликами и вставть на них одинаковые данные (чтобы обеспечить надёжную вставку, не ориентируясь на то, как работает механизм репликации). Сейчас ожидания пользователя не оправдываются. В ClickHouse есть механизм дедупликации для обеспечения идемпотентности вставок. Вторая вставка с такими же данными (пусть даже на другую реплику) будет проигнорирована. Надо сделать так, чтобы вместо этого, вставка одинаковых данных на другую реплику, имела такой же эффект, как если бы эти данные были получены с помощью механизма репликации.

### 19.2. Подключение Etcd или Consul как альтернативы ZooKeeper {#podkliuchenie-etcd-ili-consul-kak-alternativy-zookeeper}

Алексей Лёвушкин, ВШЭ и Яндекс.

Для координации реплик в ClickHouse используется ZooKeeper. Многие пользователи ClickHouse хотели бы иметь возможность использовать для координации некоторые другие системы вместо ZooKeeper. Рассматриваемыми вариантами таких систем являются Etcd, Consul, FoundationDB. Это весьма проблематично, так как эти системы существенно отличаются по интерфейсам и возможностям. Тем не менее, для того, чтобы эта задача стала возможной, в ClickHouse обобщён интерфейс взаимодействия с ZooKeeper, и теперь на его место можно подставлять другие реализации.

В прошлом году, Алексей добавил модельную реализацию (mock) интерфейса ZooKeeper для тестирования. Сейчас предлагается сделать реализацию поверх Etcd, а также расширить возможности тестовой реализации.

Upd. Алексей сделал какой-то вариант, но борется с тем, что ничего не работает.
Upd. Есть pull request на начальной стадии.

### 19.3. - Подключение YT Cypress или YDB как альтернативы ZooKeeper {#podkliuchenie-yt-cypress-ili-ydb-kak-alternativy-zookeeper}

Hold. Полезно для заказчиков внутри Яндекса, но есть риски. Эту задачу никто не будет делать.

### 19.4. internal_replication = ‘auto’ {#internal-replication-auto}

### 19.5. Реплицируемые базы данных {#replitsiruemye-bazy-dannykh}

В очереди, возможно Валерий Батурин, ВШЭ.

Репликация в ClickHouse работает на уровне отдельных таблиц. Это является очень гибким решением: на одном сервере одна из таблиц может быть не реплицирована, другая иметь двухкратную репликацию, а третья - реплицирована по всем серверам. Но если все таблицы в базе данных реплицированы одинаковым образом. то это затрудняет управление кластером. Например, при восстановлени сервера, требуется отдельно создавать реплику для каждой таблицы.

Предлагается реализовать «движок баз данных», который осуществляет репликацию метаданных (множество имеющихся таблиц и лог DDL операций над ними: CREATE, DROP, RENAME, ALTER). Пользователь сможет создать реплицируемую базу данных; при её создании или восстановлении на другом сервере, все реплицируемые таблицы будут созданы автоматически.

Upd. Задача в разработке.

### 19.6. + Одновременный выбор кусков для слияния многими репликами, отказ от leader election в ZK {#odnovremennyi-vybor-kuskov-dlia-sliianiia-mnogimi-replikami-otkaz-ot-leader-election-v-zk}

Готово.

### 19.7. Возможность записи данных при недоступности ZK и отказ от линейного порядка кусков в большинстве случаев {#vozmozhnost-zapisi-dannykh-pri-nedostupnosti-zk-i-otkaz-ot-lineinogo-poriadka-kuskov-v-bolshinstve-sluchaev}

### 19.8. Отказ от хранения в ZK множества кусков для каждой реплики отдельно {#otkaz-ot-khraneniia-v-zk-mnozhestva-kuskov-dlia-kazhdoi-repliki-otdelno}

### 19.9. Отказ от хранения в ZK лога вставок и мержей. Обмен данными о кусках напрямую {#otkaz-ot-khraneniia-v-zk-loga-vstavok-i-merzhei-obmen-dannymi-o-kuskakh-napriamuiu}

Три задачи выше обсуждаются, есть варианты.

### 19.10. Облачные таблицы {#oblachnye-tablitsy}

Требует 1.6, 19.1, 19.6, 19.7, 19.8, 19.9.

## 20. Мутации данных {#mutatsii-dannykh}

Пока все задачи по точечным UPDATE/DELETE имеют низкий приоритет, но ожидаем взять в работу в середине 2020.

### 20.1. Поддержка DELETE путём запоминания множества затронутых кусков и ключей {#podderzhka-delete-putiom-zapominaniia-mnozhestva-zatronutykh-kuskov-i-kliuchei}

### 20.2. Поддержка DELETE путём преобразования множества ключей в множество row\_numbers на реплике, столбца флагов и индекса по диапазонам {#podderzhka-delete-putiom-preobrazovaniia-mnozhestva-kliuchei-v-mnozhestvo-row-numbers-na-replike-stolbtsa-flagov-i-indeksa-po-diapazonam}

### 20.3. Поддержка ленивых DELETE путём запоминания выражений и преобразования к множеству ключей в фоне {#podderzhka-lenivykh-delete-putiom-zapominaniia-vyrazhenii-i-preobrazovaniia-k-mnozhestvu-kliuchei-v-fone}

### 20.4. Поддержка UPDATE с помощью преобразования в DELETE и вставок {#podderzhka-update-s-pomoshchiu-preobrazovaniia-v-delete-i-vstavok}


## 21. Оптимизации производительности {#optimizatsii-proizvoditelnosti}

### 21.1. + Параллельный парсинг форматов {#parallelnyi-parsing-formatov}

Начинал Олег Ершов, доделывает Никита Михайлов, помогает [Александр Кузьменков](https://github.com/akuzm). Готово.

### 21.1.1. Избавление от лишнего копирования при параллельном парсинге форматов, если возможен mmap файла целиком {#izbavlenie-ot-lishnego-kopirovaniia-pri-parallelnom-parsinge-formatov-esli-vozmozhen-mmap-faila-tselikom}

### 21.2. Параллельное форматирование форматов {#parallelnoe-formatirovanie-formatov}

После 21.1, предположительно Никита Михайлов. Задача сильно проще чем 21.1.
В процессе.

### 21.3. + Исправление низкой производительности анализа индекса в случае большого множества в секции IN {#ispravlenie-nizkoi-proizvoditelnosti-analiza-indeksa-v-sluchae-bolshogo-mnozhestva-v-sektsii-in}

Нужно всем (Zen, БК, DataLens, TestEnv…). Антон Попов, Q1/Q2.

Upd. Антон делает эту задачу. Большая часть уже реализована.

### 21.4. Использование ORDER BY ключа для оптимизации GROUP BY и DISTINCT {#ispolzovanie-order-by-kliucha-dlia-optimizatsii-group-by-i-distinct}

Дмитрий Рубашкин, ВШЭ. Помогает Антон Попов.

Если таблица имеет ключ сортировки, то возможно эффективное чтение упорядоченных данных. Если запрос содержит операцию GROUP BY, содержащую по крайней мере префикс от ключа сортировки таблицы, либо инъективные функции от него, то возможно более эффективное выполнение GROUP BY: промежуточный результат агрегации финализируется и отправляется клиенту как только в потоке данных при чтении из таблицы встретился следующий ключ.

Аналогичную оптимизацию следует реализовать для DISTINCT и LIMIT BY.

В прошлом году, аналогичное решение сделали для операции ORDER BY.

Upd. Есть pull request для GROUP BY. Приличные результаты.
Upd. Для GROUP BY готово, в процессе для DISTINCT.
Upd. Для DISTINCT есть pull request.

### 21.5. + Распараллеливание INSERT при INSERT SELECT, если это необходимо {#rasparallelivanie-insert-pri-insert-select-esli-eto-neobkhodimo}

[Vxider](https://github.com/Vxider), ICT
Есть pull request.

### 21.6. Уменьшение числа потоков для SELECT в случае тривиального INSERT SELECT {#umenshenie-chisla-potokov-dlia-select-v-sluchae-trivialnogo-insert-select}

ucasFL, в разработке.

### 21.7. Кэш результатов запросов {#kesh-rezultatov-zaprosov}

[Achimbab](https://github.com/achimbab).
Есть pull request. Но это не совсем то.
Upd. В обсуждении.

### 21.8. Взаимная интеграция аллокатора и кэша {#vzaimnaia-integratsiia-allokatora-i-kesha}

Михаил Кот, ВШЭ. Задача сложная и рискованная.

Для выделения памяти, аллокаторы запрашивают её у операционной системы (`mmap`). Это возможно только для достаточно крупных кусков памяти является довольно медленной операцией. Поэтому, современные аллокаторы кэшируют крупные куски памяти в программе. При вызове free, кусок памяти, как правило, не отдаётся ОС, а остаётся для последующего переиспользования. Для выделения мелких кусков памяти, крупные куски разбиваются с помощью специальных структур данных (free-list, heap, bitmap). Для уменьшения contention в многопоточных программах, эти структуры также делаются thread-локальными.

Часто в программе есть кэши некоторых данных. Например - кэш данных после разжатия, использующийся чтобы сэкономить на повторных запросах одних и тех же данных. При вытеснении из кэша, блок данных освобождается (`free`) и данные, бывшие в кэше, становятся недоступными для переиспользования. Но если принимать во внимание то, как работает аллокатор памяти, то оказывается, что после освобождения памяти, данные всё ещё остаются доступными в программе. И если этот кусок памяти не будет выделен аллокатором снова, его можно было бы продолжить использовать в качестве кэша. Иными словами, в программе есть domain-specific кэш, а аллокатор имеет свой кэш, и они не знают друг о друге.

Для domain-specific кэшей (как например, кэш разжатых данных) выгодно, чтобы они использовали как можно больший объём свободной памяти. Но в этом случае, памяти может не хватить для других структур данных в программе. Если аллокатор памяти знает про кэш, то выделение памяти можно было бы делать путём вытеснения данных из кэша.

Upd. Есть нерабочий прототип, скорее всего будет отложено.
Upd. Отложено до осени.

### 21.8.1. Отдельный аллокатор для кэшей с ASLR {#otdelnyi-allokator-dlia-keshei-s-aslr}

В прошлом году задачу пытался сделать Данила Кутенин с помощью lfalloc из Аркадии и mimalloc из Microsoft, но оба решения не были квалифицированы для использования в продакшене. Успешная реализация задачи 21.8 отменит необходимость в этой задаче, поэтому холд.

### 21.9. Исправить push-down выражений с помощью Processors {#ispravit-push-down-vyrazhenii-s-pomoshchiu-processors}

[Николай Кочетов](https://github.com/KochetovNicolai). Требует 2.1.

### 21.10. + Улучшение эвристики PREWHERE {#uluchshenie-evristiki-prewhere}

Amos Bird.

### 21.11. Peephole оптимизации запросов {#peephole-optimizatsii-zaprosov}

Руслан Камалов, Михаил Малафеев, Виктор Гришанин, ВШЭ

Реализовать в ClickHouse оптимизации запросов, основанные на упрощении отдельных небольших кусков выражений (так называемые «peephole» оптимизации). Примеры:
- Замена цепочек if на multiIf.
- Удаление min/max/any-агрегатов от выражений от ключей GROUP BY.
- Вынесение арифметических операций из агрегатных функций;
- Вынесение любых функций наружу any, anyLast.
- При GROUP BY по transform или if по строкам, замена строк на Enum.

Сделана замена цепочек if на multiIf, но внезапно оказалось, что это является не оптимизацией, а наоборот.
Сделано ещё несколько оптимизаций.
Upd. Все вышеперечисленные оптимизации доступны в pull requests.
Upd. Из них почти все помержены, осталась одна.

### 21.12. Алгебраические оптимизации запросов {#algebraicheskie-optimizatsii-zaprosov}

Руслан Камалов, Михаил Малафеев, Виктор Гришанин, ВШЭ

Реализовать в ClickHouse оптимизации запросов, основанные на алгебраических свойствах функций. Примеры:
- Обращение инъективных функций в сравнениях на равенство.
- Вынесение инъективных функцию наружу uniq.
- Удаление монотонных функций из ORDER BY.
- Удаление избыточных выражений из ORDER BY.
- Удаление из GROUP BY функций от других ключей GROUP BY.
- Удаление дублирующихся DISTINCT, ORDER BY из подзапросов.

Несколько оптимизаций есть в PR.
Upd. Все оптимизации кроме "Обращение инъективных функций в сравнениях на равенство" есть в PR.
Upd. Из них больше половины помержены, осталось ещё две.

### 21.13. Fusion агрегатных функций {#fusion-agregatnykh-funktsii}

После или совместно с 21.11.

### 21.14. Оптимизация запросов с помощью constraints {#optimizatsiia-zaprosov-s-pomoshchiu-constraints}

Constraints позволяют задать выражение, истинность которого проверяется при вставке данных в таблицу. Предположение о том, что выражение истинно, может использоваться и для оптимизации запросов. Например, встретив в запросе точно такое же выражение, можно заменить его на константу 1.

Если выражение содержит равенство, то встретив в запросе одну из частей равенства, её можно заменить на другую часть равенства, если это сделает проще чтение данных или вычисление выражения. Например, задан constraint: `URLDomain = domain(URL)`. Значит, выражение `domain(URL)` можно заменить на `URLDomain`.

Upd. Возможно будет отложено на следующий год.

### 21.15. Многоступенчатое чтение данных вместо PREWHERE {#mnogostupenchatoe-chtenie-dannykh-vmesto-prewhere}

Требует 2.1 и 21.10.

### 21.16. Оптимизация GROUP BY с большим количеством агрегатных функций путём вычисления в два прохода {#optimizatsiia-group-by-s-bolshim-kolichestvom-agregatnykh-funktsii-putiom-vychisleniia-v-dva-prokhoda}

Нужно для БК.

### 21.17. Оптимизация GROUP BY при наличии ORDER BY по тем же ключам с LIMIT {#optimizatsiia-group-by-pri-nalichii-order-by-po-tem-zhe-kliucham-s-limit}

Нужно для БК.

### 21.18. Внутренняя параллелизация мержа больших состояний агрегатных функций {#vnutrenniaia-parallelizatsiia-merzha-bolshikh-sostoianii-agregatnykh-funktsii}

### 21.19. Оптимизация сортировки {#optimizatsiia-sortirovki}

Василий Морозов, Арслан Гумеров, Альберт Кидрачев, ВШЭ.
В прошлом году задачу начинал делать другой человек, но не добился достаточного прогресса.

+ 1.  Оптимизация top sort.

В ClickHouse используется неоптимальный вариант top sort. Суть его в том, что из каждого блока достаётся top N записей, а затем, все блоки мержатся. Но доставание top N записей у каждого следующего блока бессмысленно, если мы знаем, что из них в глобальный top N войдёт меньше. Конечно нужно реализовать вариацию на тему priority queue (heap) с быстрым пропуском целых блоков, если ни одна строка не попадёт в накопленный top.

+ 2.  Рекурсивный вариант сортировки по кортежам.

Для сортировки по кортежам используется обычная сортировка с компаратором, который в цикле по элементам кортежа делает виртуальные вызовы `IColumn::compareAt`. Это неоптимально - как из-за короткого цикла по неизвестному в compile-time количеству элементов, так и из-за виртуальных вызовов. Чтобы обойтись без виртуальных вызовов, есть метод `IColumn::getPermutation`. Он используется в случае сортировки по одному столбцу. Есть вариант, что в случае сортировки по кортежу, что-то похожее тоже можно применить… например, сделать метод `updatePermutation`, принимающий аргументы offset и limit, и допереставляющий перестановку в диапазоне значений, в которых предыдущий столбец имел равные значения.

3.  RadixSort для сортировки.

Один наш знакомый начал делать задачу по попытке использования RadixSort для сортировки столбцов. Был сделан вариант indirect сортировки (для `getPermutation`), но не оптимизирован до конца - есть лишние ненужные перекладывания элементов. Для того, чтобы его оптимизировать, придётся добавить немного шаблонной магии (на последнем шаге что-то не копировать, вместо перекладывания индексов - складывать их в готовое место). Также этот человек добавил метод MSD Radix Sort для реализации radix partial sort. Но даже не проверил производительность.

Наиболее содержательная часть задачи может состоять в применении Radix Sort для сортировки кортежей, расположенных в оперативке в виде Structure Of Arrays неизвестного в compile-time размера. Это может работать хуже, чем то, что описано в пункте 2… Но попробовать не помешает.

4.  Three-way comparison sort.

Виртуальный метод `compareAt` возвращает -1, 0, 1. Но алгоритмы сортировки сравнениями обычно рассчитаны на `operator<` и не могут получить преимущества от three-way comparison. А можно ли написать так, чтобы преимущество было?

5.  pdq partial sort

Хороший алгоритм сортировки сравнениями `pdqsort` не имеет варианта partial sort. Заметим, что на практике, почти все сортировки в запросах ClickHouse являются partial_sort, так как `ORDER BY` почти всегда идёт с `LIMIT`. Кстати, Данила Кутенин уже попробовал это и показал, что в тривиальном случае преимущества нет. Но не очевидно, что нельзя сделать лучше.

### 21.20. Использование материализованных представлений для оптимизации запросов {#ispolzovanie-materializovannykh-predstavlenii-dlia-optimizatsii-zaprosov}

В ByteDance есть готовая реализация, но они её боятся из-за, возможно, низкого качества кода.
Upd. Вместо этого будем делать задачу 1.16.

### 21.21. + Чтение больших файлов с помощью mmap {#chtenie-bolshikh-failov-s-pomoshchiu-mmap}

Сделан вариант, но достаточно топорный. Без тестирования в продакшене включать по-умолчанию нельзя.

### 21.22. Userspace page cache {#userspace-page-cache}

Требует 21.8.

### 21.23. Ускорение работы с вторичными индексами {#uskorenie-raboty-s-vtorichnymi-indeksami}

zhang2014.
Есть pull request.


## 22. Долги и недоделанные возможности {#dolgi-i-nedodelannye-vozmozhnosti}

### 22.1. + Исправление неработающих таймаутов, если используется TLS {#ispravlenie-nerabotaiushchikh-taimautov-esli-ispolzuetsia-tls}

Нужно для Яндекс.Облака. Сделал Алексей Миловидов.

### 22.2. + Убрать возможность изменить настройки в native протоколе в случае readonly {#ubrat-vozmozhnost-izmenit-nastroiki-v-native-protokole-v-sluchae-readonly}

N.Vartolomei.

### 22.3. + Защита от абсурдно заданных пользователем кодеков {#zashchita-ot-absurdno-zadannykh-polzovatelem-kodekov}

### 22.4. + Исправление оставшихся deadlocks в табличных RWLock-ах {#ispravlenie-ostavshikhsia-deadlocks-v-tablichnykh-rwlock-akh}

Александр Казаков. Нужно для Яндекс.Метрики и Datalens. Задача постепенно тащится и исправлениями в соседних местах стала менее актуальна.
В Q1 будет сделана или отменена с учётом 1.2. и 1.3.
Upd. Добавили таймауты.

### 22.5. + Исправление редких срабатываний TSan в stress тестах в CI {#ispravlenie-redkikh-srabatyvanii-tsan-v-stress-testakh-v-ci}

Александр Казаков сделал эту задачу.

### 22.6. + Изменение только DEFAULT в ALTER TABLE может поменять тип столбца {#izmenenie-tolko-default-v-alter-table-mozhet-pomeniat-tip-stolbtsa}

Александр Сапин сделал эту задачу.

### 22.7. + Row-Level Security не работает в случае наличия в запросе IN подзапросов {#row-level-security-ne-rabotaet-v-sluchae-nalichiia-v-zaprose-in-podzaprosov}

Нужно для Метрики. Иван Лежанкин.

### 22.8. + Исправить десериализацию параметров для параметризованных запросов {#ispravit-deserializatsiiu-parametrov-dlia-parametrizovannykh-zaprosov}

Хотел исправить Василий Немков, Altinity, но есть маленькие затруднения, наверное переделает Алексей Миловидов.

### 22.9. Разобраться с десериализацией массивов со значениями по-умолчанию в Protobuf формате в случае protobuf 3 {#razobratsia-s-deserializatsiei-massivov-so-znacheniiami-po-umolchaniiu-v-protobuf-formate-v-sluchae-protobuf-3}

[Виталий Баранов](https://github.com/vitlibar). Возможно, это - фундаментальная проблема и следует её только документировать.
Кажется, отменяем, но пока ещё не всё ясно.

### 22.10. + Исправление дрифта при отслеживании потребления памяти запросами {#ispravlenie-drifta-pri-otslezhivanii-potrebleniia-pamiati-zaprosami}

Требует 6.3., но можно улучшить отдельными хаками. Нужно Метрике и БК.

### 22.11. + Более простая ser/de настроек запросов {#bolee-prostaia-serde-nastroek-zaprosov}

И пропуск неизвестных настроек. Важно для Метрики для упрощения апгрейда без изменения конфига.
[Виталий Баранов](https://github.com/vitlibar), готово.

### 22.12. + Исправление низкой производительности чтения из Kafka {#ispravlenie-nizkoi-proizvoditelnosti-chteniia-iz-kafka}

Для ClickHouse нехарактерно наличие кода, обладающего столь низкой производительностью. Практики разработки не подразумевают, что такой код должен попасть в продакшен без надлежащего тестирования производительности.

Изначально было назначено на [Ивана Лежанкина](https://github.com/abyss7), но по неизвестной причине было не сделано в течение нескольких месяцев.
Сделал Михаил Филимонов, Altinity.

### 22.13. + Посмотреть, почему не работают некоторые collations {#posmotret-pochemu-ne-rabotaiut-nekotorye-collations}

Изначально было назначено на [Ивана Лежанкина](https://github.com/abyss7), но в результате сделал Александр Сапин.

### 22.14. + Посмотреть, почему не работает StorageSet для MergeTree таблиц при некоторых условиях {#posmotret-pochemu-ne-rabotaet-storageset-dlia-mergetree-tablits-pri-nekotorykh-usloviiakh}

Вроде бы сделал Никита Михайлов - проверить существующие issues на эту тему.

### 22.15. Нормализация коммитов в Kafka и идемпотентности операций {#normalizatsiia-kommitov-v-kafka-i-idempotentnosti-operatsii}

Altinity.
Я не в курсе, какой статус.

### 22.16. + Исправление низкой производительности кодека DoubleDelta {#ispravlenie-nizkoi-proizvoditelnosti-kodeka-doubledelta}

Василий Немков, Altinity - в процессе.
Upd. Готово.

### 22.17. Консистентно работающий POPULATE для MaterializedView {#konsistentno-rabotaiushchii-populate-dlia-materializedview}

### 22.18. Исправление заметного падения производительности форматов после добавления доменов типов {#ispravlenie-zametnogo-padeniia-proizvoditelnosti-formatov-posle-dobavleniia-domenov-tipov}

Василий Немков, Altinity.

### 22.19. + Одновременное использование SAMPLE и PREWHERE {#odnovremennoe-ispolzovanie-sample-i-prewhere}

Нужно для Метрики. [Николай Кочетов](https://github.com/KochetovNicolai), ноябрь 2019.

### 22.20. + Неправильная работа PREWHERE при некоторых условиях {#nepravilnaia-rabota-prewhere-pri-nekotorykh-usloviiakh}

[Николай Кочетов](https://github.com/KochetovNicolai), декабрь 2019.

### 22.21. + Неправильное поведение DateTime в районе начала unix epoch {#nepravilnoe-povedenie-datetime-v-raione-nachala-unix-epoch}

Алексей Миловидов.

### 22.22. Nullable в функции transform и в CASE по множеству значений {#nullable-v-funktsii-transform-i-v-case-po-mnozhestvu-znachenii}

После 10.14.

[\#7237](https://github.com/ClickHouse/ClickHouse/issues/7237)
[\#2655](https://github.com/ClickHouse/ClickHouse/issues/2655)

### 22.23. Правильная обработка Nullable в функциях, которые кидают исключение на default значении: modulo, intDiv {#pravilnaia-obrabotka-nullable-v-funktsiiakh-kotorye-kidaiut-iskliuchenie-na-default-znachenii-modulo-intdiv}

### 22.24. + Излишняя фильтрация ODBC connection string {#izlishniaia-filtratsiia-odbc-connection-string}

Нужно для Метрики. Алексей Миловидов.

### 22.25. Избавиться от библиотеки btrie {#izbavitsia-ot-biblioteki-btrie}

Алексей Миловидов. Низкий приоритет.

### 22.26. Плохая производительность quantileTDigest {#plokhaia-proizvoditelnost-quantiletdigest}

[\#2668](https://github.com/ClickHouse/ClickHouse/issues/2668)

Алексей Миловидов или будет переназначено.

### 22.27. Проверить несколько PR, которые были закрыты zhang2014 и sundy-li {#proverit-neskolko-pr-kotorye-byli-zakryty-zhang2014-i-sundy-li}

Алексей Миловидов.

### 22.28. Изучить и исправить поведение работы с Kafka при ребалансировке {#izuchit-i-ispravit-povedenie-raboty-s-kafka-pri-rebalansirovke}

Altinity.

### 22.29. + Уязвимость DDL для словарей executable {#uiazvimost-ddl-dlia-slovarei-executable}

[Александр Сапин](https://github.com/alesapin)


## 23. Default Festival {#default-festival}

### 23.1. + Включение minimalistic_part_header в ZooKeeper {#vkliuchenie-minimalistic-part-header-v-zookeeper}

Сильно уменьшает объём данных в ZooKeeper. Уже год в продакшене в Яндекс.Метрике.
Алексей Миловидов, ноябрь 2019.

### 23.2. Включение distributed_aggregation_memory_efficient {#vkliuchenie-distributed-aggregation-memory-efficient}

Есть риски меньшей производительности лёгких запросов, хотя производительность тяжёлых запросов всегда увеличивается.

### 23.3. Включение min_bytes_to_external_sort и min_bytes_to_external_group_by {#vkliuchenie-min-bytes-to-external-sort-i-min-bytes-to-external-group-by}

Желательно 5.2. и 13.1.

### 23.4. Включение синхронной записи в Distributed таблицы по-умолчанию {#vkliuchenie-sinkhronnoi-zapisi-v-distributed-tablitsy-po-umolchaniiu}

Есть гипотеза, что плохо работает на очень больших кластерах.

### 23.5. Включение compile_expressions {#vkliuchenie-compile-expressions}

Требует 7.2. Задачу изначально на 99% сделал Денис Скоробогатов, ВШЭ и Яндекс. Остальной процент доделывал Алексей Миловидов, а затем [Александр Сапин](https://github.com/alesapin).

### 23.6. + Включение учёта порядка столбцов в CSV {#vkliuchenie-uchiota-poriadka-stolbtsov-v-csv}

Просто аккуратно включить.

### 23.7. Включение NULL as Default в CSV {#vkliuchenie-null-as-default-v-csv}

Просто аккуратно включить.

### 23.8. + Включение оптимизации VALUES {#vkliuchenie-optimizatsii-values}

Просто аккуратно включить.

### 23.9. + Включение Processors {#vkliuchenie-processors}

Q1. [Николай Кочетов](https://github.com/KochetovNicolai).

### 23.10. + Включение mlock бинарника {#vkliuchenie-mlock-binarnika}

Возможность mlock бинарника сделал Олег Алексеенков [\#3553](https://github.com/ClickHouse/ClickHouse/pull/3553)
. Поможет, когда на серверах кроме ClickHouse работает много посторонних программ (мы иногда называем их в шутку «треш-программами»).


## 24. Экспериментальные задачи {#eksperimentalnye-zadachi}

### 24.1. Веб-интерфейс для просмотра состояния кластера и профилирования запросов {#veb-interfeis-dlia-prosmotra-sostoianiia-klastera-i-profilirovaniia-zaprosov}

Антон Мамонов, УрФУ, Яндекс.

Внутри ClickHouse есть богатые возможности по интроспекции и профилированию. Эти возможности доступны через системные таблицы и использовать их приходится путём формулирования SQL запросов. Это неудобно.

Вместо этого предлагается сделать, чтобы ClickHouse отдавал HTML страницу, реализующую интерактивный web-интерфейс со следующими возможностями:
- отображение состояния кластеров (какие кластеры известны, статус каждого сервера);
- графики нагрузки текущего сервера или выбранного сервера кластера;
- обновляемый список запросов;
- просмотр лога запросов с наиболее востребованными фильтрациями по одной кнопке;
- просмотр лога на кластере, например - последние ошибки;
- просмотр метрик использования ресурсов, flame graph и pprof-граф для выбранных запросов;
- отчёт по использованию кластера (пример: количество ядер CPU по пользователям за сегодня).

### 24.2. Экспериментальные алгоритмы сжатия {#eksperimentalnye-algoritmy-szhatiia}

ClickHouse поддерживает LZ4 и ZSTD для сжатия данных. Эти алгоритмы являются парето-оптимальными по соотношению скорости и коэффициентам сжатия среди достаточно известных. Тем не менее, существуют менее известные алгоритмы сжатия, которые могут превзойти их по какому-либо критерию. Из потенциально более быстрых по сравнимом коэффициенте сжатия: Lizard, LZSSE, density. Из более сильных: bsc и csc. Необходимо изучить эти алгоритмы, добавить их поддержку в ClickHouse и исследовать их работу на тестовых датасетах.

### 24.3. Экспериментальные кодеки {#eksperimentalnye-kodeki}

Существуют специализированные алгоритмы кодирования числовых последовательностей: Group VarInt, MaskedVByte, PFOR. Необходимо изучить наиболее эффективные реализации этих алгоритмов. Примеры вы сможете найти на https://github.com/lemire и https://github.com/powturbo/ а также https://github.com/schizofreny/middle-out

Внедрить их в ClickHouse в виде кодеков и изучить их работу на тестовых датасетах.

Upd. Есть два pull requests в начальной стадии, отложено.

### 24.4. Шифрование в ClickHouse на уровне VFS {#shifrovanie-v-clickhouse-na-urovne-vfs}

Данные в ClickHouse хранятся без шифрования. При наличии доступа к дискам, злоумышленник может прочитать данные. Предлагается реализовать два подхода к шифрованию:

1.  Шифрование на уровне VFS.

Обсуждаются детали реализации. Q3/Q4.
Виталий Баранов.

### 24.5. Поддержка функций шифрования для отдельных значений {#podderzhka-funktsii-shifrovaniia-dlia-otdelnykh-znachenii}

Смотрите также 24.5.

2.  Шифрование отдельных значений.
    Для этого требуется реализовать функции шифрования и расшифрования, доступные из SQL. Для шифрования реализовать возможность добавления нужного количества случайных бит для исключения одинаковых зашифрованных значений на одинаковых данных. Это позволит реализовать возможность «забывания» данных без удаления строк таблицы: можно шифровать данные разных клиентов разными ключами, и для того, чтобы забыть данные одного клиента, потребуется всего лишь удалить ключ.
    
Делает Василий Немков, Altinity

### 24.6. Userspace RAID {#userspace-raid}

Глеб Новиков, ВШЭ.

RAID позволяет одновременно увеличить надёжность хранения данных на дисках и увеличить скорость работы дискового массива. Обычно RAID настраивается с помощью встроенных возможностей ядра Linux (mdraid) или с помощью hardware контроллера. У этого есть следующие ограничения:

1.  Иногда (в облачной инфраструктуре некоторых компаний) сервер предоставляется с отдельными дисками, подмонтированными в виде отдельных разделов (JBOD), без возможности создания RAID.

2.  В ClickHouse для обеспечения избыточности обычно используется репликация между серверами. Но при восстановлении одного из дисков RAID не используются данные с реплик, а в случае отказа одного из дисков в RAID-0, приходится передавать с реплики все данные, а не только данные, соответствующие одному из дисков. Это происходит, потому что RAID не интегрирован в ClickHouse и «не знает» про его особенности.

3.  Отсутствуют продвинутые варианты обеспечения избыточности, как например, LRC.

Для преодоления этих ограничений, предлагается реализовать в ClickHouse встроенный алгоритм расположения данных на дисках.

Есть pull request на начальной стадии.

### 24.7. Вероятностные структуры данных для фильтрации по подзапросам {#veroiatnostnye-struktury-dannykh-dlia-filtratsii-po-podzaprosam}

Рузель Ибрагимов, ВШЭ и Яндекс.

Частой задачей является выполнение запроса с фильтрацией по множеству, полученному по подзапросу. Пример: найти пользователей, которые заходили на сайт сегодня и заходили неделю назад. Это выражается в виде запроса: `SELECT UserID FROM table WHERE EventDate = today() AND UserID IN (SELECT ...)`. При выполнении этого запроса, сначала выполняется подзапрос в правой части `IN` и формируется хэш-таблица в оперативке; затем эта хэш-таблица используется для фильтрации.

Иногда объём данных достаточно большой, и хэш-таблица не помещается в оперативку. В этом случае можно рассмотреть в качестве варианта приближённый рассчёт: найти пользователей, которые заходили на сайт сегодня и наверное заходили неделю назад. Для этого можно вместо хэш-таблицы использовать Bloom Filter. Другая задача: найти пользователей, которые встречались, скорее всего, не менее некоторого количества раз. Для этого можно использовать Counting Bloom Filter. Также следует изучить структуры данных Quotient Filter и Cuckoo Filer, а ещё - секретный алгоритм Chaotic Map от Андрея Плахова.

Предлагается реализовать это в языке запросов ClickHouse с помощью специального синтаксиса, например `x IN BLOOM FILTER (n, m) (SELECT ...)`.

Есть pull request на стадии работающего прототипа.

### 24.8. + Специализация векторизованного кода для AVX/AVX2/AVX512 и ARM NEON {#spetsializatsiia-vektorizovannogo-koda-dlia-avxavx2avx512-i-arm-neon}

[\#1017](https://github.com/ClickHouse/ClickHouse/issues/1017)

Дмитрий Ковальков, ВШЭ и Яндекс.

Подавляющее большинство кода ClickHouse написана для x86\_64 с набором инструкций до SSE 4.2 включительно. Лишь отдельные редкие функции поддерживают AVX/AVX2/AVX512 с динамической диспетчеризацией.

В первой части задачи, следует добавить в ClickHouse реализации некоторых примитивов, оптимизированные под более новый набор инструкций. Например, AVX2 реализацию генератора случайных чисел pcg: https://github.com/lemire/simdpcg

Во второй части задачи, предлагается адаптировать существующие куски кода, использующие SSE intrinsics на AVX/AVX2 и сравнить производительность. Также рассматривается оптимизация под ARM NEON.

### 24.9. + Общий подход к CPU dispatching в фабрике функций {#obshchii-podkhod-k-cpu-dispatching-v-fabrike-funktsii}

Дмитрий Ковальков, ВШЭ и Яндекс.

Продолжение 24.8.

Upd. Есть pull request. В стадии ревью. Готово.

### 24.10. Поддержка типов half/bfloat16/unum {#podderzhka-tipov-halfbfloat16unum}

[\#7657](https://github.com/ClickHouse/ClickHouse/issues/7657)

Рустам Гусейн-заде, ВШЭ.

Есть pull request на промежуточной стадии.

### 24.11. User Defined Functions {#user-defined-functions}

Игорь Минеев, ВШЭ.

ClickHouse предоставляет достаточно богатый набор встроенных функций языка запросов, но не позволяет пользователю добавлять свои функции без редактировния исходников и перекомпиляции системы. Это мотивировано следующими потенциальными проблемами:

1.  ClickHouse является array-oriented системой, и все функции внутри кода принимают для обработки целые массивы, а не отдельные значения. Это усложняет внутренний интерфейс и делает его менее удобным для пользователя.
2.  Предоставление возможности подключения UDF в виде shared библиотек, потребовало бы фиксировать этот интерфейс или поддерживать обратную совместимость, тогда как мы бы хотели, при разработке ClickHouse, менять этот интерфейс по своему усмотрению без оглядки.
3.  Сложность внутренних структур данных повышает вероятность ошибок типа buffer overflow и повреждения памяти, что сильно затруднит сопровождение ClickHouse с пользовательскими функциями.

Тем не менее, можно выбрать более аккуратный подход, избегающий непосредственной линковки с shared библиотеками.

Сначала можно реализовать поддержку UDF в виде выражений, составленных из простых функций ClickHouse. В ClickHouse есть встроенная кодогенерация на LLVM, что позволит таким функциям работать весьма эффективно. Но этот подход весьма ограничен и поэтому не является исчерпывающим.

Затем предлагается реализовать поддержку UDF в виде исходников на C++, которые компилируются в runtime, с использованием заголовочных файлов ClickHouse. Требование компиляции из исходников вместо shared библиотек, позволит ослабить необходимость в поддержке совместимости ABI.

Для безопасности, потребуется исследовать возможность размещения буферов данных в shared memory для выполнения UDF в отдельных процессах с изоляцией по памяти. Возможно, для этого пригодится интеграция с Apache Arrow.

Также рассматривается возможность написания UDF на Rust, а также использование Web Assembly. Отдельно можно рассмотреть подключение NumPy и R и других технологий, которые предоставляют операции над целыми массивами.

Upd. В работе два варианта реализации UDF.

### 24.12. GPU offloading {#gpu-offloading}

Риск состоит в том, что даже известные GPU базы, такие как OmniSci, работают медленнее, чем ClickHouse.
Преимущество возможно только на полной сортировке и JOIN.
Алексей Соловей, nVidia и Рита Коннова, ВШЭ.

В компании nVidia сделали прототип offloading вычисления GROUP BY с некоторыми из агрегатных функций в ClickHouse и обещат предоставить исходники в публичный доступ для дальнейшего развития. Предлагается изучить этот прототип и расширить его применимость для более широкого сценария использования. В качестве альтернативы, предлагается изучить исходные коды системы `OmniSci` или `Alenka` или библиотеку `CUB` https://nvlabs.github.io/cub/ и применить некоторые из алгоритмов в ClickHouse.

Upd. В компании nVidia выложили прототип, теперь нужна интеграция в систему сборки.
Upd. Интеграция в систему сборки - Иван Лежанкин.
Upd. Есть прототип bitonic sort.
Upd. Прототип bitonic sort помержен, но целесообразность под вопросом (он работает медленнее).
Наверное надо будет подержать и удалить.

### 24.13. Stream запросы {#stream-zaprosy}

Пререквизит для ClickHouse как CEP-системы.

### 24.14. Window функции {#window-funktsii}

[\#1469](https://github.com/ClickHouse/ClickHouse/issues/1469)

Требует 2.1.

Upd. Есть два прототипа от внешних контрибьюторов.

### 24.15. Поддержка полуструктурированных данных {#podderzhka-polustrukturirovannykh-dannykh}

Требует 1.14 и 2.10.

### 24.16. Улучшение эвристики слияний {#uluchshenie-evristiki-sliianii}

В прошлом году исследование по этой задаче сделал Егор Соловьёв, ВШЭ и Яндекс.Такси. Его исследование показало, что алгоритм нельзя существенно улучшить путём изменения параметров. Но исследование лажовое, так как рассмотрен только уже использующийся алгоритм. То есть, задача остаётся открытой.

### 24.17. Экспериментальные способы ускорения параллельного GROUP BY {#eksperimentalnye-sposoby-uskoreniia-parallelnogo-group-by}

Максим Серебряков

Задача в работе.
Upd. Достигнуты обнадёживающие результаты.
Upd. Есть pull request - в большинстве случаев одновременно и ускорение и снижение потребления памяти, но требуются доработки.

### 24.18. Не TCP протокол передачи файлов при репликации {#ne-tcp-protokol-peredachi-failov-pri-replikatsii}

### 24.19. Промежуточное состояние GROUP BY как структура данных для key-value доступа {#promezhutochnoe-sostoianie-group-by-kak-struktura-dannykh-dlia-key-value-dostupa}

### 24.20. Short-circuit вычисления некоторых выражений {#short-circuit-vychisleniia-nekotorykh-vyrazhenii}

Два года назад задачу попробовала сделать Анастасия Царькова, ВШЭ и Яндекс, но реализация получилась слишком неудобной и её удалили.

### 24.21. Реализация в ClickHouse протокола распределённого консенсуса {#realizatsiia-v-clickhouse-protokola-raspredelionnogo-konsensusa}

Имеет смысл только после 19.2.

### 24.22. Вывод типов по блоку данных. Вывод формата данных по примеру {#vyvod-tipov-po-bloku-dannykh-vyvod-formata-dannykh-po-primeru}

Задача отложена.

ClickHouse является строго типизированной системой. Для того, чтобы прочитать данные в каком либо формате (например, CSV), требуется заранее указать типы данных. Если при чтении формата выясняется, что данные не могут быть прочитаны в рамках заданных типов, то кидается исключение.

ClickHouse также может использоваться для быстрой аналитики по локальным файлам, без загрузки их в базу данных (программа `clickhouse-local`). В этом случае, его использование может заменить `awk`, `sed`, `grep`. Но остаётся неудобство - необходимость указания типов данных.

Предлагается реализовать функциональность вывода типов по первому блоку данных путём применения эвристик и постепенного расширения типов.

Другая экспериментальная задача - реализация эвристик для обработки данных в неизвестном построчном текстовом формате. Детектирование CSV, TSV, JSON, детектирование разделителей и форматов значений.

### 24.23. Минимальная поддержка транзакций для множества вставок/чтений {#minimalnaia-podderzhka-tranzaktsii-dlia-mnozhestva-vstavokchtenii}

Максим Кузнецов, ВШЭ.

Таблицы типа MergeTree состоят из набора независимых неизменяемых «кусков» данных. При вставках данных (INSERT), формируются новые куски. При модификациях данных (слияние кусков), формируются новые куски, а старые - становятся неактивными и перестают использоваться следующими запросами. Чтение данных (SELECT) производится из снэпшота множества кусков на некоторый момент времени. Таким образом, чтения и вставки не блокируют друг друга.

Если же выполняется несколько запросов SELECT, то чтение данных может осуществляться из снэпшотов по состоянию на несколько разных моментов времени и быть неконсистентным. Пример: пользователю отображается отчёт из нескольких графиков и таблиц, но из-за того, что между разными запросами, данные успели обновиться, отображаемые данные не соответствуют друг другу.

Пример с другой стороны - пользователь хочет осуществить несколько вставок (INSERT) в одну или несколько таблиц, но так, чтобы данные появились в них атомарно с точки зрения других запросов (SELECT).

Для решения этих проблем, предлагается ввести глобальные метки времени для кусков данных (сейчас уже есть инкрементальные номера кусков, но они выделяются в рамках одной таблицы). Первым шагом сделаем эти метки времени в рамках сервера. Вторым шагом сделаем метки времени в рамках всех серверов, но неточные на основе локальных часов. Третьим шагом сделаем метки времени, выдаваемые сервисом координации.

### 24.24. Реализация алгоритмов differential privacy {#realizatsiia-algoritmov-differential-privacy}

[\#6874](https://github.com/ClickHouse/ClickHouse/issues/6874)

Артём Вишняков, ВШЭ. Есть pull request.

### 24.25. Интеграция в ClickHouse функциональности обработки HTTP User Agent {#integratsiia-v-clickhouse-funktsionalnosti-obrabotki-http-user-agent}

[\#157](https://github.com/ClickHouse/ClickHouse/issues/157)
Есть хороший код в Яндекс.Метрике. Получено согласие от руководства.
Михаил Филитов, ВШЭ.
Upd. Есть pull request. Нужно ещё чистить код библиотеки.

### 24.26. Поддержка open tracing или аналогов {#podderzhka-open-tracing-ili-analogov}

[\#5182](https://github.com/ClickHouse/ClickHouse/issues/5182)

Александр Кожихов, ВШЭ и Яндекс.YT.
Upd. Есть pull request с прототипом.

### 24.27. Реализация алгоритмов min-hash, sim-hash для нечёткого поиска полудубликатов {#realizatsiia-algoritmov-min-hash-sim-hash-dlia-nechiotkogo-poiska-poludublikatov}

[\#7649](https://github.com/ClickHouse/ClickHouse/pull/7649)

ucasFL, ICT.

Алгоритмы min-hash и sim-hash позволяют вычислить для текста несколько хэш-значений таких, что при небольшом изменении текста, по крайней мере один из хэшей не меняется. Вычисления можно реализовать на n-грамах и словарных шинглах. Предлагается добавить поддержку этих алгоритмов в виде функций в ClickHouse и изучить их применимость для задачи нечёткого поиска полудубликатов.

Есть pull request, есть что доделывать.

### 24.28. Другой sketch для квантилей {#drugoi-sketch-dlia-kvantilei}

Похоже на quantileTiming, но с логарифмическими корзинами. См. DDSketch.

### 24.29. Поддержка Arrow Flight {#podderzhka-arrow-flight}

[\#7554](https://github.com/ClickHouse/ClickHouse/issues/7554)

Жанна Зосимова, ВШЭ.
Upd. Пока поддержали Arrow как формат ввода-вывода.

### 24.30. - ClickHouse как графовая СУБД {#clickhouse-kak-grafovaia-subd}

Amos Bird, но его решение слишком громоздкое и пока не open-source. Отменено.

### 24.31. Кореллированные подзапросы {#korellirovannye-podzaprosy}

Перепиcывание в JOIN. Не раньше 21.11, 21.12, 21.9. Низкий приоритет.

### 24.32. Поддержка GRPC {#podderzhka-grpc}

Мария Конькова, ВШЭ и Яндекс.
Также смотрите 24.29.

В ClickHouse есть два основных протокола: родной протокол общения между серверами и HTTP/1.1 протокол. HTTP/1.1 протокол удобен для работы из самых разных языков программирования, но, в отличие от родного протокола, не поддерживает двусторонний обмен информацией во время запроса:
- передачу информации о прогрессе во время выполнения запроса;
- передачу логов во время выполнения запроса;
- отмену выполнения запроса в тот момент как данные ещё не начали передаваться;

Рассматривается вариант - поддержка GRPC в ClickHouse. Здесь есть неочевидные моменты, такие как - эффективная передача массивов данных в column-oriented формате - насколько удобно будет обернуть это в GRPC.

Задача в работе, есть pull request. [#10136](https://github.com/ClickHouse/ClickHouse/pull/10136)


## 25. DevRel {#devrel}

### 25.1. + Перевод инструкции для начинающих разработчиков {#perevod-instruktsii-dlia-nachinaiushchikh-razrabotchikov}

Александр Казаков, ноябрь 2019.

### 25.2. + Вычитка и выкладка статьи про обфускацию данных на английском {#vychitka-i-vykladka-stati-pro-obfuskatsiiu-dannykh-na-angliiskom}

Эми, Александр Казаков, Алексей Миловидов, Q1.
Готово к выкладке.

### 25.3. Подготовка статьи «Секреты оптимизации производительности ClickHouse» {#podgotovka-stati-sekrety-optimizatsii-proizvoditelnosti-clickhouse}

Алексей Миловидов, Леонид.

### 25.4. Подготовка статьи «Профайлер запросов: трудный путь» {#podgotovka-stati-profailer-zaprosov-trudnyi-put}

Алексей Миловидов, Леонид.

### 25.5. Подготовка статьи «Тестирование ClickHouse, которое мы заслужили» {#podgotovka-stati-testirovanie-clickhouse-kotoroe-my-zasluzhili}

### 25.6. Перевод этих статей на английский {#perevod-etikh-statei-na-angliiskii}

Требует 25.3, 25.4, 25.5. Эми

### 25.7. Перевод статьи Данилы Кутенина на английский {#perevod-stati-danily-kutenina-na-angliiskii}

Эми

### 25.8. + Выступление keynote на BDTC {#vystuplenie-keynote-na-bdtc}

Алексей Миловидов

### 25.9. Подготовка докладчиков: khvostikao, ilezhankin, nikitamikhailov, akuzm и другие {#podgotovka-dokladchikov-khvostikao-ilezhankin-nikitamikhailov-akuzm-i-drugie}

[Ольга Хвостикова](https://github.com/stavrolia), [Иван Лежанкин](https://github.com/abyss7), Никита Михайлов, [Александр Кузьменков](https://github.com/akuzm), Артём Зуйков.
Уже готовые докладчики: Алексей Миловидов, [Николай Кочетов](https://github.com/KochetovNicolai), [Александр Сапин](https://github.com/alesapin).
Получаем минимум 8 докладчиков в 2020 году.

### 25.10. Митапы в России и Беларуси: Москва x2 + митап для разработчиков или хакатон, Санкт-Петербург, Минск, Нижний Новгород, Екатеринбург, Новосибирск и/или Академгородок, Иннополис или Казань {#mitapy-v-rossii-i-belarusi-moskva-x2-mitap-dlia-razrabotchikov-ili-khakaton-sankt-peterburg-minsk-nizhnii-novgorod-ekaterinburg-novosibirsk-iili-akademgorodok-innopolis-ili-kazan}

Екатерина - организация. Upd. Проведено два онлайн митапа на русском и два на английском.

### 25.11. Митапы зарубежные: восток США (Нью Йорк, возможно Raleigh), возможно северо-запад (Сиэтл), Китай (Пекин снова, возможно митап для разработчиков или хакатон), Лондон {#mitapy-zarubezhnye-vostok-ssha-niu-iork-vozmozhno-raleigh-vozmozhno-severo-zapad-sietl-kitai-pekin-snova-vozmozhno-mitap-dlia-razrabotchikov-ili-khakaton-london}

[Иван Блинков](https://github.com/blinkov/) - организация. Две штуки в США запланированы. Upd. Два митапа в США и один в Европе проведены.

### 25.12. Статья «научная» - про устройство хранения данных и индексов или whitepaper по архитектуре. Есть вариант подать на VLDB {#statia-nauchnaia-pro-ustroistvo-khraneniia-dannykh-i-indeksov-ili-whitepaper-po-arkhitekture-est-variant-podat-na-vldb}

Низкий приоритет. Алексей Миловидов.

### 25.13. Участие во всех мероприятиях Яндекса, которые связаны с разработкой бэкенда, C++ разработкой или с базами данных, возможно участие в DevRel мероприятиях {#uchastie-vo-vsekh-meropriiatiiakh-iandeksa-kotorye-sviazany-s-razrabotkoi-bekenda-c-razrabotkoi-ili-s-bazami-dannykh-vozmozhno-uchastie-v-devrel-meropriiatiiakh}

Алексей Миловидов и все подготовленные докладчики

### 25.14. Конференции в России: все HighLoad, возможно CodeFest, DUMP или UWDC, возможно C++ Russia {#konferentsii-v-rossii-vse-highload-vozmozhno-codefest-dump-ili-uwdc-vozmozhno-c-russia}

Алексей Миловидов и все подготовленные докладчики.
Upd. Есть Saint HighLoad online.
Upd. Есть C++ Russia.
CodeFest, DUMP, UWDC отменились.

### 25.15. Конференции зарубежные: Percona, DataOps, попытка попасть на более крупные {#konferentsii-zarubezhnye-percona-dataops-popytka-popast-na-bolee-krupnye}

Алексей Миловидов и все подготовленные докладчики
Upd. Есть Percona.
DataOps отменилась.

### 25.16. Сайт play.clickhouse {#sait-play-clickhouse}

Цель состоит в реализации сайта, на котором можно попробовать задавать произвольные запросы к временному экземпляру ClickHouse и изучать его поведение. Из похожих проектов можно отметить: [Compiler Explorer](https://godbolt.org/), http://ideone.com/, [SQLFiddle](http://sqlfiddle.com/), [DB-Fiddle](https://www.db-fiddle.com/).

С помощью такого сайта можно решать следующие задачи:
- ознакомление с языком запросов ClickHouse;
- демонстрация примеров из документации;
- демонстрация скорости работы на тестовых датасетах;
- сравнение поведения разных версий ClickHouse друг с другом;
- демонстрация неожиданного поведения или багов;

Требуется проработать вопрос безопасности и изоляции инстансов (поднятие в контейнерах с ограничениями по сети), подключение тестовых датасетов с помощью copy-on-write файловой системы; органичения ресурсов.

Есть минимальный прототип. Сделал Илья Яцишин. Этот прототип не позволяет делиться ссылками на результаты запросов.

### 25.17. Взаимодействие с ВУЗами: ВШЭ, УрФУ, ICT Beijing {#vzaimodeistvie-s-vuzami-vshe-urfu-ict-beijing}

Алексей Миловидов и вся группа разработки.
Благодаря Robert Hodges добавлен CMU.
Upd. Взаимодействие с ВШЭ 2019/2020 успешно выполнено.

### 25.18. - Лекция в ШАД {#lektsiia-v-shad}

Алексей Миловидов

### 25.19. - Участие в курсе разработки на C++ в ШАД {#uchastie-v-kurse-razrabotki-na-c-v-shad}

### 25.20. Ещё одно сравнение производительности аналитических СУБД {#eshchio-odno-sravnenie-proizvoditelnosti-analiticheskikh-subd}

Матвей Бубнов, УрФУ

Существуют мало известные специализированные СУБД, способные конкурировать с ClickHouse по скорости обработки некоторых классов запросов. Пример: `TDEngine` и `DolphinDB`, `VictoriaMetrics`, а также `Apache Doris` и `LocustDB`. Предлагается изучить и классифицировать архитектурные особенности этих систем - их особенности и преимущества. Установить эти системы, загрузить тестовые данные, изучить производительность. Проанализировать, за счёт чего достигаются преимущества.

Upd. Есть поползновения с TDEngine.

### 25.21. Повторное награждение контрибьюторов в Китае {#povtornoe-nagrazhdenie-kontribiutorov-v-kitae}

Upd. Ждём снятия ограничений и восстановления активности по онлайн митапам.

### 25.22. On-site помощь с ClickHouse компаниям в дни рядом с мероприятиями {#on-site-pomoshch-s-clickhouse-kompaniiam-v-dni-riadom-s-meropriiatiiami}

[Иван Блинков](https://github.com/blinkov/) - организация. Провёл мероприятие для турецкой компании.
Upd. On-site заменяется на Online.

### 25.23. Новый мерч для ClickHouse {#novyi-merch-dlia-clickhouse}

Upd. Старого пока хватает, раздача уменьшилась.

### 25.24. Конкурсы bughunter или оптимизации кода на C++ {#konkursy-bughunter-ili-optimizatsii-koda-na-c}

Проведение конкурсов должно начинаться для сотрудников Яндекса, пока нет согласования.

### 25.25. Семинары для потенциальных клиентов Яндекс.Облака {#seminary-dlia-potentsialnykh-klientov-iandeks-oblaka}

По мере необходимости. Алексей Миловидов, организация - Яндекс.Облако.

### 25.26. - Участие в GSoC {#uchastie-v-gsoc}

Андрей Бородин пытается уговорить нас участвовать, но пока загружены задачей 25.17.

UPD: не участвуем.

### 25.27. + Обновить сайт ClickHouse {#obnovit-sait-clickhouse}

Иван Блинков. Нет рисков. Нужно для Яндекс.Облака. Upd. Сделано.
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								# Планы разработки ClickHouse 2020 {#plany-razrabotki-clickhouse-2020}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Updated roadmap

											
										
										
											2019-11-20 20:55:26 +00:00
+								Здесь собраны важные задачи на 2020 год. Многие из них присутствуют в GitHub Issues. Данный текст следует рассматривать как рабочий черновик со сводкой и кратким описанием задач, ссылками и материалами для быстрого доступа на одной странице. Классификация задач условная.
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Updated roadmap

											
										
										
											2019-11-20 20:57:38 +00:00
+								Так как ClickHouse - open-source продукт, мы хотим, чтобы рабочий процесс был также максимально открытым. В связи с этим, вам следует ожидать наличия на данной странице несколько большего количества деталей описания рабочего процесса, чем вы могли бы предположить - настолько близко, насколько рабочий процесс видят разработчики. Так как неотъемлимой частью процесса разработки является исправление недостатков продукта и улучшение качества кода, на данной странице вы найдёте весьма подробные описания таких деталей. Для других open-source продуктов такой подход к разработке обычно нехарактерен. Благодаря тому, что для каждой задачи указаны её зависимости, вы сможете понять, какие подготовительные работы требуются, что позволяет более точно понимать сроки реализации.
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								## 1. Хранение данных, индексация {#khranenie-dannykh-indeksatsiia}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 1.1. Индексы по z-Order curve, normalized z-Order curve {#indeksy-po-z-order-curve-normalized-z-order-curve}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												WIP on docs translation/normalization tools (#9783)


											
										
										
											2020-03-20 18:20:59 +00:00
+								[\#6286](https://github.com/ClickHouse/ClickHouse/pull/6286)
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												WIP on docs translation/normalization tools (#9783)


											
										
										
											2020-03-20 18:20:59 +00:00
+								Задача также относится к категории «17. Работа с географическими данными», так как geoHash - это частный случай z-Order curve.
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
+								Также связана с задачей 24.27 для нечёткого поиска полудубликатов строк, так как позволит индексировать min-hash.
-												WIP on docs translation/normalization tools (#9783)


											
										
										
											2020-03-20 18:20:59 +00:00
+								Задача «normalized z-Order curve» в перспективе может быть полезна для БК и Метрики, так как позволяет смешивать OrderID и PageID и избежать дублирования данных.
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
+								В задаче также вводится способ индексации путём обращения функции нескольких аргументов на интервале, что имеет смысл для дальнейшего развития.
-												Update extended_roadmap.md
											
										
										
											2020-04-16 16:44:49 +00:00
+								[Андрей Чулков](https://github.com/achulkov2), ВШЭ.
-												Update roadmap

											
										
										
											2020-01-18 16:54:56 +00:00
-												Update extended-roadmap.md
											
										
										
											2020-05-15 07:07:06 +00:00
+								### 1.2. + Wait-free каталог баз данных {#wait-free-katalog-baz-dannykh}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Small updates on roadmap

											
										
										
											2020-03-16 22:54:42 +00:00
+								Q2. Делает [Александр Токмаков](https://github.com/tavplubix), первый рабочий вариант в декабре 2019. Нужно для DataLens и Яндекс.Метрики.
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Added descriptions to some tasks

											
										
										
											2019-11-20 11:34:23 +00:00
+								Манипуляции с каталогом баз данных: запросы CREATE TABLE, DROP TABLE, RENAME TABLE и DATABASE, требуют синхронизации с помощью блокировок. Эта синхронизация становится весьма сложной, так как на неё полагается много внутренних структур данных.
-												WIP on docs translation/normalization tools (#9783)


											
										
										
											2020-03-20 18:20:59 +00:00
+								Предлагается реализовать альтернативный подход, в котором таблицы и базы данных являются всего лишь ссылками на persistent объекты. Подробное описание задачи: [\#6787](https://github.com/ClickHouse/ClickHouse/issues/6787)
-												Added descriptions to some tasks

											
										
										
											2019-11-20 11:34:23 +00:00
-												Small updates on roadmap

											
										
										
											2020-03-16 22:54:42 +00:00
+								Upd. Сделана крупная часть задачи, но ориентироваться стоит уже на Q2.
-												Update extended_roadmap.md
											
										
										
											2020-04-22 22:02:20 +00:00
+								Upd. Pull request готов для мержа.
-												Update extended-roadmap.md
											
										
										
											2020-05-08 08:29:11 +00:00
+								Upd. Попало 20.4. Доступно под флагом allow_experimental_database_atomic.
-												Small updates on roadmap

											
										
										
											2020-03-16 22:54:42 +00:00
-												Update extended-roadmap.md
											
										
										
											2020-06-27 21:11:36 +00:00
+								### 1.3. + Неблокирующие ALTER {#neblokiruiushchie-alter}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Update roadmap

											
										
										
											2020-01-18 16:54:56 +00:00
+								Q1. И полностью immutable куски. Делает [Александр Сапин](https://github.com/alesapin). Готов приступить к задаче в конце ноября 2019. Нужно для Яндекс.Метрики.
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Update roadmap

											
										
										
											2020-03-06 20:50:34 +00:00
+								Upd. Большая часть задачи реализована и добавлена в master. Есть незначительные технические долги. Остаётся реализация неблокирующего изменения метаданных таблицы.
-												Update extended-roadmap.md
											
										
										
											2020-06-27 21:11:36 +00:00
+								Upd. Всё доделано, ожидается в релизе 20.6.
-												Update roadmap

											
										
										
											2020-03-06 20:50:34 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 1.4. + Нетранзитивные ALTER столбцов {#netranzitivnye-alter-stolbtsov}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Update extended_roadmap.md
											
										
										
											2020-03-26 18:05:30 +00:00
+								Требует 1.3. Будет делать [Александр Сапин](https://github.com/alesapin). Ура, сделано.
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 1.5. + ALTER RENAME COLUMN {#alter-rename-column}
-												WIP on docs translation/normalization tools (#9783)


											
										
										
											2020-03-20 18:20:59 +00:00
 								[\#6861](https://github.com/ClickHouse/ClickHouse/issues/6861)
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
 								Требует 1.3. Будет делать [Александр Сапин](https://github.com/alesapin).
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 1.6. + Полиморфные куски данных {#polimorfnye-kuski-dannykh}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Update roadmap. Also revert digital degradation due to accidential changes with automatic scripts.

											
										
										
											2020-04-13 23:24:33 +00:00
+								Компактные куски - Q1, куски в оперативке Q1/Q2 - пункт 1.7.
-												Update roadmap

											
										
										
											2020-01-18 16:54:56 +00:00
-												Update roadmap

											
										
										
											2020-03-06 20:50:34 +00:00
+								Компактные куски реализованы, ещё не включены по-умолчанию. Первым шагом включаем по-умолчанию для системных таблиц.
-												Update roadmap. Also revert digital degradation due to accidential changes with automatic scripts.

											
										
										
											2020-04-13 23:24:33 +00:00
+								Upd. Включено для системных таблиц.
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
+								Делает [Антон Попов](https://github.com/CurtizJ), первый рабочий вариант в декабре. Пререквизит чтобы снизить сложность мелких INSERT, что в свою очередь нужно для 1.12, иначе задача 1.12 не сможет нормально работать. Особенно нужно для Яндекс.Облака.
-												WIP on docs translation/normalization tools (#9783)


											
										
										
											2020-03-20 18:20:59 +00:00
+								Данные в таблицах типа MergeTree в ClickHouse хранятся в виде набора независимых «кусков». Внутри куска, каждый столбец, а также индекс, хранится в отдельных файлах. Это сделано для возможности быстрых манипуляций со столбцами (пример - запрос ALTER DROP COLUMN). При вставке данных (INSERT), создаётся новый кусок. Для таблиц с большим количеством столбцов, запросы INSERT с маленьким количеством строк являются неэффективными, так как требуют создания большого количества файлов в файловой системе. Это является врождённой особенностью ClickHouse - одной из первой проблем, с которыми сталкиваются пользователи. Пользователям приходится буферизовывать данные и собирать их в более крупные пачки перед вставкой в ClickHouse.
-												Added descriptions to some tasks

											
										
										
											2019-11-20 11:34:23 +00:00
 								Для смягчения эффекта от этой проблемы, в ClickHouse существуют таблицы типа Buffer. Они накапливают данные в оперативке перед записью в другую таблицу. Впрочем, таблицы Buffer не являются полноценным решением проблемы из-за: - наличия блокировок при вставке; - переупорядочивание вставляемых данных; - неатомарность перекладывания данных из Buffer в результирующую таблицу.
 								Вместо этого предлагается разрешить кускам таблиц типа MergeTree располагать данные в разных форматах. А именно: - в оперативной памяти; - на диске со всеми столбцами в одном файле; - на диске со столбцами в отдельных файлах: в зависимости от размера куска и прошедшего времени. Для размещения кусков в оперативной памяти, придётся также реализовать опциональную поддержку write-ahead log с настраиваемыми правилами по сбросу на диск. Это позволит избавиться от проблем с мелкими вставками для MergeTree таблиц. Для ReplicatedMergeTree таблиц, это решит проблему лишь частично.
-												Update extended-roadmap.md
											
										
										
											2020-07-14 09:28:38 +00:00
+								### 1.7. + Буферизация и WAL в MergeTree {#buferizatsiia-i-wal-v-mergetree}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Update roadmap. Also revert digital degradation due to accidential changes with automatic scripts.

											
										
										
											2020-04-13 23:24:33 +00:00
+								Требует 1.6. Антон Попов. Задача взята в работу. Q2.
-												Update extended-roadmap.md
											
										
										
											2020-05-15 07:07:06 +00:00
+								Есть pull request.
-												Update extended-roadmap.md
											
										
										
											2020-06-27 21:11:36 +00:00
+								Upd. В стадии код-ревью.
-												Update extended-roadmap.md
											
										
										
											2020-07-14 09:28:38 +00:00
+								Upd. Готово для использования начиная с версии 20.6 в экспериментальном режиме.
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 1.8. + Перенос между разделами по TTL {#perenos-mezhdu-razdelami-po-ttl}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Updated roadmap

											
										
										
											2019-12-10 00:13:16 +00:00
+								Делает [Владимир Чеботарёв](https://github.com/excitoon), Altinity. Декабрь 2019.
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Update roadmap

											
										
										
											2020-01-18 16:54:56 +00:00
+								Q1. Закоммичено, но есть технический долг, который исправляется сейчас.
-												Update extended-roadmap.md
											
										
										
											2020-05-15 07:07:06 +00:00
+								Готово. Нет, не готово - там всё ещё технический долг.
-												Update roadmap

											
										
										
											2020-01-18 16:54:56 +00:00
-												Update extended-roadmap.md
											
										
										
											2020-05-28 19:27:31 +00:00
+								### 1.9. + Использование TTL для прореживания данных {#ispolzovanie-ttl-dlia-prorezhivaniia-dannykh}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Updated roadmap

											
										
										
											2019-12-10 00:13:16 +00:00
+								Будет делать Сорокин Николай, ВШЭ и Яндекс.
-												Update extended-roadmap.md
											
										
										
											2020-05-28 19:27:31 +00:00
+								Upd. Есть pull request. Upd. Сделано.
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Update extended-roadmap.md
											
										
										
											2020-05-08 08:29:11 +00:00
+								Сейчас пользователь может задать в таблице выражение, которое определяет, сколько времени хранятся данные. Обычно это выражение задаётся относительно значения столбца с датой - например: удалять данные через три месяца. https://clickhouse.tech/docs/ru/operations/table_engines/mergetree/\#table_engine-mergetree-ttl
-												Added descriptions to some tasks

											
										
										
											2019-11-20 11:34:23 +00:00
 								Это может быть задано для всей таблицы (тогда строки целиком удаляются после указанного времени) или для отдельных столбцов (тогда данные столбца физически удаляются с диска, а строки в таблице остаются; при чтении значений столбца, они читаются как значения по-умолчанию).
 								Но пользователи также хотят более продвинутый вариант этой функциональности: не удалять строки или столбцы целиком, а прореживать их - оставлять меньшее количество строк.
 								И тут есть несколько вариантов:
 . По прошествии времени, оставлять каждую N-ую строку.
 . По прошествии времени, выполнять агрегацию данных, заменяя значения некоторых столбцов на значения агрегатных функций от множества значений в нескольких строках.
-												update roadmap

											
										
										
											2020-02-14 14:31:29 +00:00
+								Пункт 1 не представляет интереса, так как уже реализован с помощью TTL выражений для удаления данных. В качестве этого выражения можно прописать, например, `cityHash64(*) % 10 = 0 ? now() : event_time + INTERVAL 3 MONTH`. Правда как-то неудобно получается.
-												Added descriptions to some tasks

											
										
										
											2019-11-20 11:34:23 +00:00
 								А вот пункт 2 требуется продумать. Не очевидно даже, какой лучше использовать синтаксис для этого при создании таблицы. Но мы придумаем - сразу видно несколько вариантов.
-												Update extended-roadmap.md
											
										
										
											2020-05-08 08:29:11 +00:00
+								Частный случай такой задачи уже есть в https://clickhouse.tech/docs/ru/operations/table_engines/graphitemergetree/ Но это было сделано для конкретной задачи. А надо обобщить.
-												Added descriptions to some tasks

											
										
										
											2019-11-20 11:34:23 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 1.10. Пережатие старых данных в фоне {#perezhatie-starykh-dannykh-v-fone}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
 								Будет делать Кирилл Барухов, ВШЭ, экспериментальная реализация к весне 2020. Нужно для Яндекс.Метрики.
-												Added descriptions to some tasks

											
										
										
											2019-11-20 11:34:23 +00:00
+								Алгоритмы сжатия типа LZ77 позволяют потратить больше времени на сжатие данных, чтобы сжать данные сильнее, но при этом без проигрыша по скорости разжатия данных. В частности, этим свойством обладает LZ4 и ZSTD, которые используются в ClickHouse. Это позволяет использовать свободные ресурсы CPU, когда сервер не нагружен, для пережатия данных, чтобы данные занимали меньше места на дисках, и при этом сохранить или даже улучшить скорость обработки запросов.
-												WIP on docs translation/normalization tools (#9783)


											
										
										
											2020-03-20 18:20:59 +00:00
+								В то же время, ClickHouse обычно используется для «импульсного» сценария нагрузки. Запрос от пользователя обрабатывается максимально быстро, используя все ресурсы CPU, но в среднем по времени, сервер недостаточно нагружен.
-												Added descriptions to some tasks

											
										
										
											2019-11-20 11:34:23 +00:00
 								Предлагается добавить в ClickHouse настройки по пережатию данных и фоновые потоки, выполняющие эту задачу.
-												Update extended-roadmap.md
											
										
										
											2020-06-27 21:11:36 +00:00
+								Upd. Представлен прототип неизвестной степени готовности.
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 1.11. + Виртуальная файловая система {#virtualnaia-failovaia-sistema}
-												Update roadmap

											
										
										
											2020-03-06 20:50:34 +00:00
-												Update roadmap. Also revert digital degradation due to accidential changes with automatic scripts.

											
										
										
											2020-04-13 23:24:33 +00:00
+								На VFS переведены Log, TinyLog, StripeLog, а также MergeTree, что доказывает состоятельность реализации.
-												Update roadmap

											
										
										
											2020-01-18 16:54:56 +00:00
-												Update roadmap. Also revert digital degradation due to accidential changes with automatic scripts.

											
										
										
											2020-04-13 23:24:33 +00:00
+								Нужно для Яндекс.Облака. Делает Александр, Яндекс.Облако.
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Added descriptions to some tasks

											
										
										
											2019-11-20 11:34:23 +00:00
+								ClickHouse использует для хранения данных локальную файловую систему. Существует сценарий работы, в котором размещение старых (архивных) данных было бы выгодно на удалённой файловой системе. Если файловая система POSIX совместимая, то это не составляет проблем: ClickHouse успешно работает с Ceph, GlusterFS, MooseFS. Также востребованным является сценарий использования S3 (из-за доступности в облаке) или HDFS (для интеграции с Hadoop). Но эти файловые системы не являются POSIX совместимыми. Хотя для них существуют FUSE драйверы, но скорость работы сильно страдает и поддержка неполная.
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								ClickHouse использует небольшое подмножество функций ФС, но в то же время, и некоторые специфические части: симлинки и хардлинки, O\_DIRECT. Предлагается выделить всё взаимодействие с файловой системой в отдельный интерфейс.
-												Added descriptions to some tasks

											
										
										
											2019-11-20 11:34:23 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 1.12. Экспериментальная реализация VFS поверх S3 и HDFS {#eksperimentalnaia-realizatsiia-vfs-poverkh-s3-i-hdfs}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Update extended-roadmap.md
											
										
										
											2020-06-27 21:11:36 +00:00
+								Q4.
-												Update roadmap

											
										
										
											2020-01-18 16:54:56 +00:00
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
+								Нужно для Яндекс.Облака. Требует 1.11. Желательно 1.6 и 1.18.
-												Updated roadmap

											
										
										
											2019-11-20 20:55:26 +00:00
+								Делает Александр, Яндекс.Облако (сначала часть для S3), а также Олег Ершов, ВШЭ и Яндекс.
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Update roadmap

											
										
										
											2020-03-06 20:50:34 +00:00
+								Upd. Олег будет делать только часть про HDFS.
-												Update roadmap. Also revert digital degradation due to accidential changes with automatic scripts.

											
										
										
											2020-04-13 23:24:33 +00:00
+								Upd. Реализация поверх S3 является рабочей на уровне PoC.
-												Update extended-roadmap.md
											
										
										
											2020-07-14 09:28:38 +00:00
+								Upd. Реализация поверх S3 ужасно тормозит и сейчас доделывается.
 								Upd. Реализацию поверх HDFS взял AmosBird для Kuaishou.
-												Update roadmap. Also revert digital degradation due to accidential changes with automatic scripts.

											
										
										
											2020-04-13 23:24:33 +00:00
-												Update extended-roadmap.md
											
										
										
											2020-05-28 20:53:13 +00:00
+								### 1.13. + Ускорение запросов с FINAL {#uskorenie-zaprosov-s-final}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Update roadmap. Also revert digital degradation due to accidential changes with automatic scripts.

											
										
										
											2020-04-13 23:24:33 +00:00
+								Требует 2.1. Делает [Николай Кочетов](https://github.com/KochetovNicolai). Нужно для Яндекс.Метрики. Q2.
-												Update extended-roadmap.md
											
										
										
											2020-05-08 08:29:11 +00:00
+								Upd: PR [#10463](https://github.com/ClickHouse/ClickHouse/pull/10463)
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 1.14. Не писать столбцы, полностью состоящие из нулей {#ne-pisat-stolbtsy-polnostiu-sostoiashchie-iz-nulei}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Update extended-roadmap.md
											
										
										
											2020-06-27 21:11:36 +00:00
+								Антон Попов. Q3.
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
+								В очереди. Простая задача, является небольшим пререквизитом для потенциальной поддержки полуструктурированных данных.
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 1.15. Возможность иметь разный первичный ключ в разных кусках {#vozmozhnost-imet-raznyi-pervichnyi-kliuch-v-raznykh-kuskakh}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
 								Сложная задача, только после 1.3.
-												Update extended-roadmap.md
											
										
										
											2020-06-27 21:11:36 +00:00
+								Upd. В обсуждении.
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 1.16. Несколько физических представлений для одного куска данных {#neskolko-fizicheskikh-predstavlenii-dlia-odnogo-kuska-dannykh}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
 								Сложная задача, только после 1.3 и 1.6. Позволяет компенсировать 21.20.
-												Update extended-roadmap.md
											
										
										
											2020-06-27 21:11:36 +00:00
+								Upd. В обсуждении.
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 1.17. Несколько сортировок для одной таблицы {#neskolko-sortirovok-dlia-odnoi-tablitsy}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
 								Сложная задача, только после 1.3 и 1.6.
-												Update extended-roadmap.md
											
										
										
											2020-06-27 21:11:36 +00:00
+								Upd. В обсуждении.
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 1.18. Отдельное хранение файлов кусков {#otdelnoe-khranenie-failov-kuskov}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
 								Требует 1.3 и 1.6. Полная замена hard links на sym links, что будет лучше для 1.12.
-												Update extended-roadmap.md
											
										
										
											2020-05-15 07:07:06 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								## 2. Крупные рефакторинги {#krupnye-refaktoringi}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
 								Для обоснования необходимости смотрите ссылки в описании других задач.
-												Update extended-roadmap.md
											
										
										
											2020-06-27 21:11:36 +00:00
+								### 2.1. + Переделка конвейера выполнения запросов на Processors {#peredelka-konveiera-vypolneniia-zaprosov-na-processors}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
 								Делает [Николай Кочетов](https://github.com/KochetovNicolai). Финальная стадия разработки. Включение по-умолчанию в конце декабря 2019. Удаление старого кода в начале 2020.
-												Update roadmap

											
										
										
											2020-01-18 16:54:56 +00:00
+								Upd. На данный момент исправляются проблемы с регрессиями производительности в отдельных случаях. Кажется, что все проблемы исправлены.
 								Включение по-умолчанию в Q1, но остаётся вторая часть задачи по корректному выделению async части.
-												Update roadmap

											
										
										
											2020-01-22 21:10:33 +00:00
+								Upd. Включили по-умолчанию. Удаление старого кода не раньше, чем после первого релиза, в котором это включено по-умолчанию и всё ещё можно выключить обратно.
-												Small updates on roadmap

											
										
										
											2020-03-16 22:54:42 +00:00
+								Upd. Уже есть первый релиз, в котором это включено по-умолчанию.
-												Update roadmap. Also revert digital degradation due to accidential changes with automatic scripts.

											
										
										
											2020-04-13 23:24:33 +00:00
+								Upd. Всё ещё ждём удаление старого кода, которое должно случиться после релиза 20.4.
-												Update extended-roadmap.md
											
										
										
											2020-06-27 21:11:36 +00:00
+								Upd. Старый код по большей части удалён.
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 2.2. Инфраструктура событий/метрик/ограничений/квот/трассировки {#infrastruktura-sobytiimetrikogranicheniikvottrassirovki}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
 								В очереди. https://gist.github.com/alexey-milovidov/d62d73222d83b9319dc519cbb13aeff6
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 2.3. Перенос столбцового ser/de из DataType в Column {#perenos-stolbtsovogo-serde-iz-datatype-v-column}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Update extended-roadmap.md
											
										
										
											2020-05-21 11:52:28 +00:00
+								В очереди. Антон Попов.
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 2.4. Перевод LowCardinality из DataType в Column. Добавление ColumnSparse {#perevod-lowcardinality-iz-datatype-v-column-dobavlenie-columnsparse}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
 								Требует 2.3.
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 2.5. Версионирование состояний агрегатных функций {#versionirovanie-sostoianii-agregatnykh-funktsii}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
 								В очереди.
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 2.6. Правая часть IN как тип данных. Выполнение IN в виде скалярного подзапроса {#pravaia-chast-in-kak-tip-dannykh-vypolnenie-in-v-vide-skaliarnogo-podzaprosa}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
 								Требует 2.1.
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 2.7. Нормализация Context {#normalizatsiia-context}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Update roadmap

											
										
										
											2020-01-18 16:54:56 +00:00
+								В очереди. Нужно для YQL.
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Update roadmap

											
										
										
											2020-03-06 20:50:34 +00:00
+								Александр Токмаков исправил множество проблем с использованием Context и сейчас переносит каталог БД наружу.
-												Small updates on roadmap

											
										
										
											2020-03-16 22:54:42 +00:00
+								Upd. Каталог БД вынесен из Context.
-												Update extended_roadmap.md
											
										
										
											2020-04-22 22:02:20 +00:00
+								Upd. SharedContext вынесен из Context.
-												Update extended-roadmap.md
											
										
										
											2020-06-27 21:11:36 +00:00
+								Upd. Проблема нейтрализована и перестала быть актуальной.
-												Small updates on roadmap

											
										
										
											2020-03-16 22:54:42 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 2.8. Декларативный парсер запросов {#deklarativnyi-parser-zaprosov}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Update roadmap

											
										
										
											2020-01-18 16:54:56 +00:00
+								Средний приоритет. Нужно для YQL.
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Update roadmap. Also revert digital degradation due to accidential changes with automatic scripts.

											
										
										
											2020-04-13 23:24:33 +00:00
+								Upd. В очереди. Иван Лежанкин.
-												Update extended-roadmap.md
											
										
										
											2020-05-28 19:26:20 +00:00
+								### 2.9. + Логгировние в format-стиле {#loggirovnie-v-format-stile}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Update extended-roadmap.md
											
										
										
											2020-05-28 19:26:20 +00:00
+								[#6049](https://github.com/ClickHouse/ClickHouse/issues/6049#issuecomment-570836998)
 								Сделано.
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 2.10. Запрашивать у таблиц не столбцы, а срезы {#zaprashivat-u-tablits-ne-stolbtsy-a-srezy}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
 								В очереди.
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 2.11. Разбирательство и нормализация функциональности для bitmap {#razbiratelstvo-i-normalizatsiia-funktsionalnosti-dlia-bitmap}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
 								В очереди.
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 2.12. Декларативные сигнатуры функций {#deklarativnye-signatury-funktsii}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												WIP on docs translation/normalization tools (#9783)


											
										
										
											2020-03-20 18:20:59 +00:00
+								[\#3775](https://github.com/ClickHouse/ClickHouse/pull/3775)
-												update roadmap

											
										
										
											2020-02-14 14:31:29 +00:00
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
+								Задачу делает Алексей Миловидов. Прогресс 50% и разработка временно приостановлена.
-												Update roadmap. Also revert digital degradation due to accidential changes with automatic scripts.

											
										
										
											2020-04-13 23:24:33 +00:00
+								Upd. Разработка всё ещё приостановлена.
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 2.13. Каждая функция в отдельном файле {#kazhdaia-funktsiia-v-otdelnom-faile}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
 								Задачу делает Алексей Миловидов. Прогресс 80%. Потребуется помощь других разработчиков.
-												Update roadmap. Also revert digital degradation due to accidential changes with automatic scripts.

											
										
										
											2020-04-13 23:24:33 +00:00
+								Upd. Поползновения наблюдаются.
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 2.14. Все функции с состоянием переделать на FunctionBuilder {#vse-funktsii-s-sostoianiem-peredelat-na-functionbuilder}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												typo

неприемлимо -> неприемлемо
											
										
										
											2019-11-20 18:17:49 +00:00
+								Долг [Николай Кочетов](https://github.com/KochetovNicolai). Сейчас код находится в переходном состоянии, что неприемлемо.
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 2.15. Функция subscribe для IStorage {#funktsiia-subscribe-dlia-istorage}
-												Update extended roadmap

											
										
										
											2019-11-19 08:25:14 +00:00
 								Для нормализации работы materialized views поверх Merge, Distributed, Kafka.
-												Update extended-roadmap.md
											
										
										
											2020-05-15 07:07:06 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								## 3. Документация {#dokumentatsiia}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
 								Здесь задачи только по инфраструктуре документации.
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 3.1. Перенос документации по функциям в код {#perenos-dokumentatsii-po-funktsiiam-v-kod}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Update roadmap. Also revert digital degradation due to accidential changes with automatic scripts.

											
										
										
											2020-04-13 23:24:33 +00:00
+								Требует 2.12 и 2.13. Хотим в Q2, средний приоритет.
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 3.2. Перенос однородных частей документации в код {#perenos-odnorodnykh-chastei-dokumentatsii-v-kod}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
 								Требует 3.1.
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### + 3.3. Исправить катастрофически отвратительно неприемлемый поиск по документации {#ispravit-katastroficheski-otvratitelno-nepriemlemyi-poisk-po-dokumentatsii}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Update roadmap

											
										
										
											2020-01-18 16:54:56 +00:00
+								[Иван Блинков](https://github.com/blinkov/) - очень хороший человек. Сам сайт документации основан на технологиях, не удовлетворяющих требованиям задачи, и эти технологии трудно исправить. Задачу будет делать первый встретившийся нам frontend разработчик, которого мы сможем заставить это сделать.
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Update roadmap

											
										
										
											2020-01-22 21:10:33 +00:00
+								Upd. Иван Блинков сделал эту задачу путём замены треш-технологий на нормальные.
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 3.4. + Добавить японский язык в документацию {#dobavit-iaponskii-iazyk-v-dokumentatsiiu}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Update extended_roadmap.md
											
										
										
											2019-12-10 20:12:18 +00:00
+								Эту задачу сделает [Иван Блинков](https://github.com/blinkov/), до конца декабря 2019. Сделано.
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Update extended-roadmap.md
											
										
										
											2020-05-15 07:07:06 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								## 4. Сетевое взаимодействие {#setevoe-vzaimodeistvie}
-												Update roadmap. Also revert digital degradation due to accidential changes with automatic scripts.

											
										
										
											2020-04-13 23:24:33 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 4.1. Уменьшение числа потоков при распределённых запросах {#umenshenie-chisla-potokov-pri-raspredelionnykh-zaprosakh}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Update roadmap. Also revert digital degradation due to accidential changes with automatic scripts.

											
										
										
											2020-04-13 23:24:33 +00:00
+								Весна 2020. Upd. Есть прототип. Upd. Он не работает. Upd. Человек отказался от задачи, теперь сроки не определены.
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 4.2. Спекулятивное выполнение запросов на нескольких репликах {#spekuliativnoe-vypolnenie-zaprosov-na-neskolkikh-replikakh}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												update roadmap

											
										
										
											2020-02-14 14:31:29 +00:00
+								Нужно для Яндекс.Метрики. Требует 4.1.
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Added descriptions to some tasks

											
										
										
											2019-11-20 11:34:23 +00:00
+								Если распределённый запрос затрагивает большое количество серверов, то время выполнения запросов часто становится большим из-за tail latencies - случайных редких замедлений отдельных серверов. Эту проблему можно избежать, отправляя один и тот же запрос сразу на несколько реплик, и используя данные с наиболее быстрой.
 								Задача скрывает в себе много тонкостей, связанных с обработкой стадий выполнения запроса (соединение, обмен handshake, отправка запроса, получение заголовка результата, получение пакетов прогресса, получение данных), правильной возможностью настройки таймаутов, правильной отменой запросов.
 								Сейчас для распределённых запросов используется по потоку на соединение. Это позволяет хорошо распараллелить вычисления над полученными данными и утилизировать сеть, но становится сильно избыточным для больших кластеров. Для примера, создание 1000 потоков для чтения данных из 1000 серверов кластера - лишь расходует ресурсы и увеличивает время выполнения запроса. Вместо этого необходимо использовать количество потоков не большее количества процессорных ядер, и мультиплексировать в одном потоке общение с серверами. Реализация нетривиальна, так как мультиплексировать необходимо каждую стадию общения по сети, включая установку соединения и обмен handshake.
-												Update roadmap. Also revert digital degradation due to accidential changes with automatic scripts.

											
										
										
											2020-04-13 23:24:33 +00:00
+								Upd. Сейчас обсуждается, как сделать другую задачу вместо этой.
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 4.3. Ограничение числа одновременных скачиваний с реплик {#ogranichenie-chisla-odnovremennykh-skachivanii-s-replik}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Updated roadmap

											
										
										
											2019-11-20 20:55:26 +00:00
+								Изначально делал Олег Алексеенков, но пока решение не готово, хотя там не так уж много доделывать.
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 4.4. Ограничение сетевой полосы при репликации {#ogranichenie-setevoi-polosy-pri-replikatsii}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Update extended-roadmap.md
											
										
										
											2020-05-28 20:58:25 +00:00
+								Нужно для Метрики.
-												Update extended_roadmap.md
											
										
										
											2019-11-29 14:08:24 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 4.5. Возможность продолжить передачу куска данных при репликации после сбоя {#vozmozhnost-prodolzhit-peredachu-kuska-dannykh-pri-replikatsii-posle-sboia}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 4.6. p2p передача для GLOBAL подзапросов {#p2p-peredacha-dlia-global-podzaprosov}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 4.7. Ленивая загрузка множеств для IN и JOIN с помощью k/v запросов {#lenivaia-zagruzka-mnozhestv-dlia-in-i-join-s-pomoshchiu-kv-zaprosov}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 4.8. Разделить background pool для fetch и merge {#razdelit-background-pool-dlia-fetch-i-merge}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
 								В очереди. Исправить проблему, что восстанавливающаяся реплика перестаёт мержить. Частично компенсируется 4.3.
-												Update extended-roadmap.md
											
										
										
											2020-06-27 21:11:36 +00:00
+								Александр Казаков.
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Update extended-roadmap.md
											
										
										
											2020-05-15 07:07:06 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								## 5. Операции {#operatsii}
-												Update roadmap. Also revert digital degradation due to accidential changes with automatic scripts.

											
										
										
											2020-04-13 23:24:33 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 5.1. + Разделение задач на более мелкие куски в clickhouse-copier {#razdelenie-zadach-na-bolee-melkie-kuski-v-clickhouse-copier}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												WIP on docs translation/normalization tools (#9783)


											
										
										
											2020-03-20 18:20:59 +00:00
+								[\#9075](https://github.com/ClickHouse/ClickHouse/pull/9075)
-												Update roadmap

											
										
										
											2020-01-18 16:54:56 +00:00
+								Q1. Нужно для Метрики, в очереди. Никита Михайлов.
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Update roadmap

											
										
										
											2020-03-06 20:50:34 +00:00
+								Upd. Задача на финальной стадии разработки.
-												Update roadmap. Also revert digital degradation due to accidential changes with automatic scripts.

											
										
										
											2020-04-13 23:24:33 +00:00
+								Upd. Сделано. Эффективность работы под вопросом. Есть варианты, как сделать лучше.
-												Update roadmap

											
										
										
											2020-03-06 20:50:34 +00:00
-												Update extended-roadmap.md
											
										
										
											2020-05-15 07:07:06 +00:00
+								### 5.2. + Автонастройка лимита на оперативку и размера кэшей {#avtonastroika-limita-na-operativku-i-razmera-keshei}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 5.3. + Встроенная ручка для Prometheus {#vstroennaia-ruchka-dlia-prometheus}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Update roadmap

											
										
										
											2020-01-18 16:54:56 +00:00
+								Сделано. https://github.com/Vdimir
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 5.4. Opt-in сообщать в клиенте, если вышла новая версия {#opt-in-soobshchat-v-kliente-esli-vyshla-novaia-versiia}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Update extended-roadmap.md
											
										
										
											2020-05-15 07:07:06 +00:00
+								Есть поползновения.
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 5.5. + LTS релизы {#lts-relizy}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Updated roadmap

											
										
										
											2019-11-20 20:55:26 +00:00
+								Требует 7.5. Задачу хочет Метрика, Облако, БК, Маркет и Altinity. Первой LTS версией уже стала версия 19.14.
-												Update roadmap

											
										
										
											2020-03-06 20:50:34 +00:00
+								Метрика, БК, Маркет, Altinity уже используют более свежие версии чем LTS.
-												Update roadmap. Also revert digital degradation due to accidential changes with automatic scripts.

											
										
										
											2020-04-13 23:24:33 +00:00
+								Upd. Появилась вторая версия LTS - 20.3.
-												Update extended-roadmap.md
											
										
										
											2020-05-28 20:58:25 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								## 6. Инструментирование {#instrumentirovanie}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 6.1. + Исправления сэмплирующего профайлера запросов {#ispravleniia-sempliruiushchego-profailera-zaprosov}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Updated roadmap

											
										
										
											2019-12-10 00:13:16 +00:00
+								Михаил Филимонов, Altinity. Ноябрь 2019. Сделано.
-												Update roadmap

											
										
										
											2020-03-06 20:50:34 +00:00
+								Осталось ещё проверить работоспособность профайлера в первом потоке (что важно для INSERT). Иван Лежанкин. Q1. Сделано.
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 6.2. + Добавление memory profiler {#dobavlenie-memory-profiler}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												WIP on docs translation/normalization tools (#9783)


											
										
										
											2020-03-20 18:20:59 +00:00
+								[\#6387](https://github.com/ClickHouse/ClickHouse/issues/6387)
-												update roadmap

											
										
										
											2020-02-14 14:31:29 +00:00
-												Update roadmap

											
										
										
											2020-03-06 20:50:34 +00:00
+								Сравнительно простая задача, но только для опытных разработчиков. Нужна всем. Иван Лежанкин. Q1. Сделано.
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 6.3. + Учёт оперативки total расширить не только на запросы {#uchiot-operativki-total-rasshirit-ne-tolko-na-zaprosy}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Update extended_roadmap.md
											
										
										
											2020-04-22 22:02:20 +00:00
+								Исправление долгоживущей проблемы с дрифтом учёта оперативки. Нужна для Метрики и БК.
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Update extended-roadmap.md
											
										
										
											2020-06-18 04:29:09 +00:00
+								### 6.4. + Поддержка perf events как метрик запроса {#podderzhka-perf-events-kak-metrik-zaprosa}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
 								Делает Андрей Скобцов, ВШЭ.
-												Added descriptions to some tasks

											
										
										
											2019-11-20 11:34:23 +00:00
+								В Linux существует возможность получать в программе информацию о счётчиках производительности и событиях, относящихся к CPU и ядру ОС. Подробнее смотрите `man perf_event_open`. Предлагается добавить эти метрики в ClickHouse для инструментирования запросов.
-												Update extended-roadmap.md
											
										
										
											2020-06-18 04:29:09 +00:00
+								Есть прототип.
 								Сделано.
-												Update roadmap

											
										
										
											2020-03-06 20:50:34 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 6.5. Эксперименты с LLVM X-Ray {#eksperimenty-s-llvm-x-ray}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
 								Требует 2.2.
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 6.6. + Стек трейс для любых исключений {#stek-treis-dlia-liubykh-iskliuchenii}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
 								Сейчас есть стек трейс для почти всех, но не всех исключений. Требует 7.4.
-												Update extended-roadmap.md
											
										
										
											2020-06-27 21:11:36 +00:00
+								### 6.7. + Таблица system.stack_trace {#tablitsa-system-stack-trace}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
 								Сравнительно простая задача, но только для опытных разработчиков.
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 6.8. Таблица system.crashes {#tablitsa-system-crashes}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
 								Сравнительно простая задача, но только для опытных разработчиков.
-												Update extended-roadmap.md
											
										
										
											2020-07-14 09:28:38 +00:00
+								Upd. В разработке.
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Update extended-roadmap.md
											
										
										
											2020-06-27 21:11:36 +00:00
+								### 6.9. + Отправлять информацию клиенту, если сервер падает по сигналу {#otpravliat-informatsiiu-klientu-esli-server-padaet-po-signalu}
 								Сделано.
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 6.10. Сбор общих системных метрик {#sbor-obshchikh-sistemnykh-metrik}
-												Update roadmap. Also revert digital degradation due to accidential changes with automatic scripts.

											
										
										
											2020-04-13 23:24:33 +00:00
-												Update extended-roadmap.md
											
										
										
											2020-05-15 07:07:06 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								## 7. Сопровождение разработки {#soprovozhdenie-razrabotki}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 7.1. + ICU в submodules {#icu-v-submodules}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
 								Добавление в submodules также нужно для Аркадии (7.26).
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 7.2. + LLVM в submodules {#llvm-v-submodules}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Update build instructions according to new libraries from contrib

											
										
										
											2019-12-19 22:13:42 +00:00
+								Сделал Алексей Миловидов.
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 7.3. + Обновление Poco {#obnovlenie-poco}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
 								Алексанр Кузьменков.
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 7.4. + Включить libc++, libc++-abi при сборке с gcc {#vkliuchit-libc-libc-abi-pri-sborke-s-gcc}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
 								Сейчас включено только при сборке с clang, но продакшен сборка использует gcc.
 								Требует 7.2 и, возможно, 7.1 (только в случае новой версии ICU).
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 7.5. + Начать публиковать LTS релизы {#nachat-publikovat-lts-relizy}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
 								[Александр Сапин](https://github.com/alesapin).
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 7.6. + Правильный статистический тест для comparison mode в clickhouse-performance-test {#pravilnyi-statisticheskii-test-dlia-comparison-mode-v-clickhouse-performance-test}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Update extended-roadmap.md
											
										
										
											2020-05-15 07:07:06 +00:00
+								Задачу начал делать Дмитрий Рубашкин (ВШЭ). Сейчас продолжает [Александр Кузьменков](https://github.com/akuzm). Сделано, работает в CI. Долгое время не были определены надёжные критерии для результата теста. Сейчас проблема решена, но остались не решёнными некоторые вопросы.
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Update extended-roadmap.md
											
										
										
											2020-05-15 07:07:06 +00:00
+								### 7.7. + Доделать тесты под MSan {#dodelat-testy-pod-msan}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
 								Уже есть ASan, TSan, UBSan. Не хватает тестов под MSan. Они уже добавлены в CI, но не проходят.
-												Small updates on roadmap

											
										
										
											2020-03-16 22:54:42 +00:00
+								[Александр Кузьменков](https://github.com/akuzm) и [Александр Токмаков](https://github.com/tavplubix).
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Update roadmap. Also revert digital degradation due to accidential changes with automatic scripts.

											
										
										
											2020-04-13 23:24:33 +00:00
+								Upd. Задача всё ещё медленно тащится.
-												Update extended-roadmap.md
											
										
										
											2020-05-15 07:07:06 +00:00
+								Upd. Доделал Алексей Миловидов.
-												Update roadmap. Also revert digital degradation due to accidential changes with automatic scripts.

											
										
										
											2020-04-13 23:24:33 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 7.8. + Добавить clang-tidy {#dobavit-clang-tidy}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Updated roadmap

											
										
										
											2019-11-20 20:55:26 +00:00
+								Уже есть PVS-Studio. Мы очень довольны, но этого недостаточно.
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Small updates on roadmap

											
										
										
											2020-03-16 22:54:42 +00:00
+								Upd. Алексей Миловидов. Добавлено некоторое множество проверок, но нужно рассмотреть все проверки подряд и добавить всё, что можно.
-												Update roadmap. Also revert digital degradation due to accidential changes with automatic scripts.

											
										
										
											2020-04-13 23:24:33 +00:00
+								Upd. Рассмотрели все проверки подряд.
-												Small updates on roadmap

											
										
										
											2020-03-16 22:54:42 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 7.9. + Проверки на стиль имён с помощью clang-tidy {#proverki-na-stil-imion-s-pomoshchiu-clang-tidy}
-												Update roadmap. Also revert digital degradation due to accidential changes with automatic scripts.

											
										
										
											2020-04-13 23:24:33 +00:00
 								Сделано. Только в .cpp файлах и только для имён локальных переменных. Остальное слишком сложно.
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 7.10. Включение UBSan и MSan в интеграционных тестах {#vkliuchenie-ubsan-i-msan-v-integratsionnykh-testakh}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
 								UBSan включен в функциональных тестах, но не включен в интеграционных тестах. Требует 7.7.
-												Update extended-roadmap.md
											
										
										
											2020-05-28 20:58:25 +00:00
+								### 7.11. + Включение \*San в unit тестах {#vkliuchenie-san-v-unit-testakh}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
 								У нас мало unit тестов по сравнению с функциональными тестами и их использование не обязательно. Но они всё-равно важны и нет причин не запускать их под всеми видами sanitizers.
-												Update extended-roadmap.md
											
										
										
											2020-05-28 20:58:25 +00:00
+								Илья Яцишин. Сделано.
-												Update roadmap. Also revert digital degradation due to accidential changes with automatic scripts.

											
										
										
											2020-04-13 23:24:33 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 7.12. Показывать тестовое покрытие нового кода в PR {#pokazyvat-testovoe-pokrytie-novogo-koda-v-pr}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
 								Пока есть просто показ тестового покрытия всего кода.
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 7.13. + Включение аналога -Weverything в gcc {#vkliuchenie-analoga-weverything-v-gcc}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
 								Мы используем -Wall -Wextra -Weverything -Werror.
 								При сборке с clang, -Weverything уже включено. Но в gcc есть уникальные warning-и, отсутствующие в clang.
-												Update extended_roadmap.md
											
										
										
											2019-12-22 12:41:18 +00:00
+								Сделал Wolf Kreuzerkrieg.
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 7.14. + Альтернатива для readline и libedit {#alternativa-dlia-readline-i-libedit}
-												Update roadmap

											
										
										
											2020-01-18 16:54:56 +00:00
 								Подключение replxx вместо readline сделал Иван Лежанкин.
-												Update roadmap. Also revert digital degradation due to accidential changes with automatic scripts.

											
										
										
											2020-04-13 23:24:33 +00:00
+								Есть технический долг с лицензиями файлов консорциума Unicode.
-												Update extended-roadmap.md
											
										
										
											2020-05-15 07:07:06 +00:00
+								Есть технический долг с работой \G в multiline режиме.
-												Update roadmap. Also revert digital degradation due to accidential changes with automatic scripts.

											
										
										
											2020-04-13 23:24:33 +00:00
-												Update extended-roadmap.md
											
										
										
											2020-06-27 21:11:36 +00:00
+								### 7.14.1. + Улучшение возможностей интерактивного режима clickhouse-client {#uluchshenie-vozmozhnostei-interaktivnogo-rezhima-clickhouse-client}
-												Update roadmap

											
										
										
											2020-01-18 16:54:56 +00:00
 								Тагир Кускаров, ВШЭ.
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Update roadmap

											
										
										
											2020-01-18 16:54:56 +00:00
+								Upd. В рамках данной задачи добавляем подстветку синтаксиса и исправление проблем со вставкой больших запросов.
-												Update extended-roadmap.md
											
										
										
											2020-06-27 21:11:36 +00:00
+								Upd. Минимальная подсветка добавлена, а все остальные задачи не сделаны.
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Update roadmap

											
										
										
											2020-01-18 16:54:56 +00:00
+								Для ввода запросов в интерактивном режиме в клиенте командной строки clickhouse-client использовалась библиотека readline или libedit.
-												Added descriptions to some tasks

											
										
										
											2019-11-20 11:34:23 +00:00
 								Библиотеки readline и libedit обладает следующими недостатками:
 								- (исправлено в новых версиях readline) Очень низкая производительность вставки больших кусков текста. Вставка каждого следующего символа имеет сложность O(n = количество предыдущих символов) и при вставке 1 МБ текста, скорость падает до десятков байт в секунду.
 								- Крайне сложно или невозможно реализовать подсветку синтаксиса по мере набора текста, а также autocomplete без нажатия дополнительных клавиш для вызова.
 								- Лицензия GPL (для readline) препятствует её включению в кодовую базу продукта.
 								- Плохо работает навигация по истории, если история вкючает запросы, не помещающиеся на экран.
 								- История сохраняется лишь при завершении работы клиента.
 								- При параллельной работе нескольких клиентов с одним файлом истории, сохраняется история только одного из клиентов.
 								- Плохо работает история для многострочных запросов.
 								- Излишняя экономия пересылаемых данных, что часто приводит к остаткам мусора в терминале.
 								Кроме того, имеются следующие сложно достижимые достоинства:
 								- Поддержка right-to-left текста;
 								- Поддержка editrc конфигураций.
 								В качестве альтернатив можно рассмотреть следующие варианты:
 								- Linenoise от Salvatore Sanfilippo. Достоинства: простота и компактность кода; высокая скорость работы. Недостатки: отсутствует поддержка Unicode; отсутствует автоматический перенос текста, что затрудняет работу с многострочными запросами.
 								- Linenoise с патчами для поддержки Unicode. Недостаток: теряется преимущество по скорости работы.
 								- Fish shell. Не является библиотекой, но представляет собой отличный пример, как можно реализовать подстветку синтаксиса и удобный autocomplete. Поддерживает Unicode, но работает весьма медленно.
 								- Python Prompt Toolkit. Не является подходящим решением для интеграции в C++ проект. Хорошие возможности по подсветке синтаксиса и autocomplete.
 								Вместо этого предлагается в качестве примера изучить прототип текстового редактора Kilo: https://viewsourcecode.org/snaptoken/kilo/ и реализовать всю необходимую функциональность.
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 7.15. + Замена libressl обратно на openssl {#zamena-libressl-obratno-na-openssl}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Updated roadmap

											
										
										
											2019-11-20 20:55:26 +00:00
+								Поводом использования libressl послужило желание нашего хорошего друга из известной компании несколько лет назад. Но сейчас ситуация состоит в том, что openssl продолжает развиваться, а libressl не особо, и можно спокойно менять обратно.
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Update extended_roadmap.md
											
										
										
											2019-12-12 13:22:48 +00:00
+								Нужно для Яндекс.Облака для поддержки TLS 1.3.
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 7.16. + tzdata внутри бинарника {#tzdata-vnutri-binarnika}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Update extended_roadmap.md
											
										
										
											2020-04-22 22:02:20 +00:00
+								Как в Аркадии, fallback на системные.
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 7.17. + Доделать tgz пакеты {#dodelat-tgz-pakety}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
 								Уже давно собираются универсальные tgz пакеты, но по нелепой случайности из них исчез install скрипт.
 								[Александр Сапин](https://github.com/alesapin). Может делегировать эту задачу кому угодно.
-												Update roadmap

											
										
										
											2020-01-18 16:54:56 +00:00
+								Upd. Сделано всё кроме инструкции на сайте. Для этого требуется создать директории testing/stable/prestable на repo.yandex.ru. Внезапно оказалось, что человек, отвечающий за это, в отпуске, и он не отвечает на вопрос, кто его заместитель. Q1.
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 7.18. + Доделать бинарники под Mac {#dodelat-binarniki-pod-mac}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
 								Уже есть автосборка бинарников под Mac на каждый коммит и PR, но с недостатками.
 								[Иван Лежанкин](https://github.com/abyss7). Требует 7.1, 7.2. Рекомендуется 7.14. Сейчас не хватает по крайней мере SSL и ICU. Нужно для Яндекс.Облака.
-												Update roadmap

											
										
										
											2020-01-18 16:54:56 +00:00
+								Upd. Сделано SSL. Ориентируемся в Q1, но приоритет средний и может потеряться.
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 7.18.1. Поместить ссылку на собранные бинарники под Mac на сайт {#pomestit-ssylku-na-sobrannye-binarniki-pod-mac-na-sait}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
 								Сейчас людям приходится делать несколько кликов, чтобы их скачать.
-												Update extended-roadmap.md
											
										
										
											2020-06-27 21:11:36 +00:00
+								[Александр Сапин](https://github.com/alesapin).
 								Upd. Добавлены прямые ссылки и инструкция в документации. Но всё ещё нет инструкции на главной странице сайта.
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 7.19. + Доделать (проверить) автосборку под AArch64 {#dodelat-proverit-avtosborku-pod-aarch64}
-												Update extended_roadmap.md
											
										
										
											2019-12-17 17:46:18 +00:00
-												WIP on docs translation/normalization tools (#9783)


											
										
										
											2020-03-20 18:20:59 +00:00
+								https://github.com/ClickHouse/ClickHouse/issues/8027\#issuecomment-566670282
-												Update extended_roadmap.md
											
										
										
											2019-12-17 17:46:18 +00:00
+								Проверили на настоящем сервере Huawei, а также в специальном Docker контейнере, который содержит внутри qemu-user-static.
 								Также можно проверить на Cavium, на Raspberry Pi а также на твоём Android телефоне.
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Update extended-roadmap.md
											
										
										
											2020-07-14 09:28:38 +00:00
+								### 7.20. + Автосборка для FreeBSD x86_64 {#avtosborka-dlia-freebsd-x86-64}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
 								[Иван Лежанкин](https://github.com/abyss7).
-												Small updates on roadmap

											
										
										
											2020-03-16 22:54:42 +00:00
+								Upd. В процессе реализации, есть pull request.
-												Update extended-roadmap.md
											
										
										
											2020-05-15 07:07:06 +00:00
+								Upd. Есть сборки, [пример](https://clickhouse-builds.s3.yandex.net/0/2cb4c91c0286b774534fcbe80e5ef8835a74a83a/report.html)
 								Всё ещё нет инструкции на сайте!
-												Small updates on roadmap

											
										
										
											2020-03-16 22:54:42 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 7.21. Автосборка для Linux ppc64 {#avtosborka-dlia-linux-ppc64}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
 								[Иван Лежанкин](https://github.com/abyss7).
-												Update extended-roadmap.md
											
										
										
											2020-05-15 07:07:06 +00:00
+								Как-то медленно тащится.
-												Update extended-roadmap.md
											
										
										
											2020-06-27 21:11:36 +00:00
+								Как-то вообще не тащится. Также договорились, что сделаем ещё автосборку для MIPS64.
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Update extended-roadmap.md
											
										
										
											2020-06-27 21:11:36 +00:00
+								### 7.22. + Дэшборд для pull requests {#deshbord-dlia-pull-requests}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
 								Дарья Петрова, УрФУ.
-												Update extended-roadmap.md
											
										
										
											2020-05-28 20:58:25 +00:00
+								Рабочий прототип: https://pulls-dashboard-demo.herokuapp.com/dashboard/ClickHouse/ClickHouse
-												Update extended-roadmap.md
											
										
										
											2020-06-27 21:11:36 +00:00
+								Upd. Мы пользуемся этим инструментом в ежедневной работе.
-												Update extended-roadmap.md
											
										
										
											2020-05-28 20:58:25 +00:00
-												Added descriptions to some tasks

											
										
										
											2019-11-20 11:34:23 +00:00
+								Над ClickHouse одновременно работает большое количество разработчиков, которые оформляют свои изменения в виде pull requests. Когда непомерженных pull requests много, то возникает сложность с организацией работы - непонятно, на какой pull request смотреть в первую очередь.
 								Предлагается реализовать простое одностраничное веб-приложение, в котором отображается список pull requests со следующей информацией:
 								- размер diff - количество изменённых строк;
 								- как давно было последнее обновление;
 								- типы изменённых файлов: C++, документация, скрипты сборки;
 								- наличие добавленных тестов;
 								- есть ли описание для changelog;
 								- изменены ли submodules;
 								- был ли разрешён запуск проверок CI;
 								- статусы проверок CI;
 								- количество approve от ревьюеров;
 								Статусы проверок - наиболее важная часть. Так как для каждого PR выполняется несколько десятков проверок и наиболее медленные работают до нескольких часов, придётся:
 								- отображать сразу все проверки для каждого PR в виде красивой разноцветной матрицы с информацией по наведению мыши;
 								- отсортировать проверки по важности: например, если у внешнего разработчика проходят все проверки кроме стиля кода, то мы можем взять это в работу сами;
 								- если для предыдущего коммита проверка была завершена, а для последнего коммита ещё только идёт - то можно отображать в таблице статус предыдущей проверки более блёклым цветом.
-												WIP on docs translation/normalization tools (#9783)


											
										
										
											2020-03-20 18:20:59 +00:00
+								Предлагается реализовать несколько вариантов сортировок. Очевидное - по времени обновления, более интересно - некое ранжирование с целью выяснить, «что лучше взять в работу прямо сейчас».
-												Added descriptions to some tasks

											
										
										
											2019-11-20 11:34:23 +00:00
 								Похожие продукты уже есть, например: http://prs.mozilla.io/yandex:ClickHouse К сожалению, этот продукт заброшен, да и делает не совсем то, что нужно. По своему усмотрению, можно взять из него что-нибудь полезное.
-												Update extended-roadmap.md
											
										
										
											2020-06-27 21:11:36 +00:00
+								### 7.23. + Функции для fuzzing {#funktsii-dlia-fuzzing}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
 								Андрей Некрашевич, ВШЭ.
-												Added descriptions to some tasks

											
										
										
											2019-11-20 11:34:23 +00:00
+								Fuzzing тестирование - это тестирование случайными данными. Мы рассмотрим несколько подходов к этой задачи:
-												WIP on docs translation/normalization tools (#9783)


											
										
										
											2020-03-20 18:20:59 +00:00
+.  Добавление в SQL диалект ClickHouse функций для генерации случайных данных (пример - случайные бинарные строки заданной длины, случайные валидные UTF-8 строки) и «порчи» данных (например, поменять значения случайных бит с заданной частотой). Это будет использовано для тестирования SQL-функций ClickHouse.
-												Added descriptions to some tasks

											
										
										
											2019-11-20 11:34:23 +00:00
-												Updated roadmap

											
										
										
											2019-12-02 22:38:07 +00:00
+								Можно добавить функции:
 								`randomString(length)`
 								`randomFixedString(length)`
-												WIP on docs translation/normalization tools (#9783)


											
										
										
											2020-03-20 18:20:59 +00:00
+								- строка заданной длины с равномерно распределёнными случайными байтами;
-												Updated roadmap

											
										
										
											2019-12-02 22:38:07 +00:00
+								`randomStringASCII(length)`
-												Update extended_roadmap.md
											
										
										
											2019-11-28 17:51:47 +00:00
+								`randomStringUTF8(length)`
-												Updated roadmap

											
										
										
											2019-12-02 22:38:07 +00:00
+								`fuzzBits(s, inverse_probability)` - изменить каждый бит строки на противоположный с заданной вероятностью;
-												Update extended_roadmap.md
											
										
										
											2019-11-28 17:51:47 +00:00
+								`fuzzBytes(s, inverse_probability)` - изменить каждый байт строки на равномерно случайный с заданной вероятностью;
 								У каждой функции опциональный аргумент против склейки одинаковых выражений в запросе.
 								Также можно сделать функции с детерминированным генератором случайных чисел (аргументом передаётся seed) для воспроизводимости тестовых кейсов.
-												Update roadmap

											
										
										
											2020-01-18 16:54:56 +00:00
+								Upd. Сергей Штыков сделал функцию `randomPrintableASCII`.
-												Update roadmap. Also revert digital degradation due to accidential changes with automatic scripts.

											
										
										
											2020-04-13 23:24:33 +00:00
+								Upd. Илья Яцишин сделал табличную функцию `generateRandom`.
 								Upd. Эльдар Заитов добавляет OSS Fuzz.
-												Update extended-roadmap.md
											
										
										
											2020-05-15 07:07:06 +00:00
+								Upd. Сделаны randomString, randomFixedString.
-												Update extended-roadmap.md
											
										
										
											2020-06-27 21:11:36 +00:00
+								Upd. Сделаны fuzzBits, fuzzBytes.
-												Update roadmap

											
										
										
											2020-01-18 16:54:56 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 7.24. Fuzzing лексера и парсера запросов; кодеков и форматов {#fuzzing-leksera-i-parsera-zaprosov-kodekov-i-formatov}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Added descriptions to some tasks

											
										
										
											2019-11-20 11:34:23 +00:00
+								Продолжение 7.23.
-												WIP on docs translation/normalization tools (#9783)


											
										
										
											2020-03-20 18:20:59 +00:00
+.  Использование AFL или LibFuzzer для тестирования отдельных частей кодовой базы ClickHouse.
-												Added descriptions to some tasks

											
										
										
											2019-11-20 11:34:23 +00:00
-												WIP on docs translation/normalization tools (#9783)


											
										
										
											2020-03-20 18:20:59 +00:00
+.  Генерация и выполнение случайных синтаксически корректных запросов на случайных данных.
-												Added descriptions to some tasks

											
										
										
											2019-11-20 11:34:23 +00:00
-												Update extended-roadmap.md
											
										
										
											2020-07-14 09:28:38 +00:00
+								Upd. Александр Кузьменков сделал фазер запросов на основе мутаций AST.
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 7.25. + Синхронизация релизов в Аркадию {#sinkhronizatsiia-relizov-v-arkadiiu}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Updated roadmap

											
										
										
											2019-11-20 20:55:26 +00:00
+								Изначально занимался Олег Алексеенков. Сейчас он перешёл работать в дружественный отдел, но обещает продолжать синхронизацию.
 								Затем, возможно, [Иван Лежанкин](https://github.com/abyss7). Но сейчас приостановлено, так как Максим из YT должен исправить регрессию производительности в анализе индекса.
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Update extended_roadmap.md
											
										
										
											2019-12-29 17:13:14 +00:00
+								Максим из YT сказал, что сделает это после нового года.
-												WIP on docs translation/normalization tools (#9783)


											
										
										
											2020-03-20 18:20:59 +00:00
+								Максим из YT сказал, что «мы планируем в январе добиться».
-												Update extended_roadmap.md
											
										
										
											2020-01-30 10:05:12 +00:00
+								Максим сейчас занимается собираемостью YT с новой версией ClickHouse.
-												Update roadmap

											
										
										
											2020-01-18 16:54:56 +00:00
 								Нужно для CHYT и YQL.
-												Update extended_roadmap.md
											
										
										
											2019-12-29 17:13:14 +00:00
-												Update roadmap. Also revert digital degradation due to accidential changes with automatic scripts.

											
										
										
											2020-04-13 23:24:33 +00:00
+								Upd: Все патчи Максима отправлены в master. Задача взята в работу.
-												Small updates on roadmap

											
										
										
											2020-03-16 22:54:42 +00:00
+								Upd: Задача в процессе реализации. Синхронизироваться будет master. Делает [Иван Лежанкин](https://github.com/abyss7)
-												Update roadmap. Also revert digital degradation due to accidential changes with automatic scripts.

											
										
										
											2020-04-13 23:24:33 +00:00
+								Upd: Есть собирающийся прототип, но сборка как будто ещё не в trunk Аркадии.
-												Update extended_roadmap.md
											
										
										
											2020-04-22 22:02:20 +00:00
+								Upd: Добавлено в Аркадию, но не все файлы (не побайтово).
-												Update extended-roadmap.md
											
										
										
											2020-06-27 21:11:36 +00:00
+								Upd: Добавлены все файлы побайтово.
-												Update roadmap. Also revert digital degradation due to accidential changes with automatic scripts.

											
										
										
											2020-04-13 23:24:33 +00:00
-												Update extended-roadmap.md
											
										
										
											2020-05-15 07:07:06 +00:00
+								### 7.26. + Побайтовая идентичность репозитория с Аркадией {#pobaitovaia-identichnost-repozitoriia-s-arkadiei}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Updated roadmap

											
										
										
											2019-11-20 20:55:26 +00:00
+								Команда DevTools. Прогресс по задаче под вопросом.
-												Update extended-roadmap.md
											
										
										
											2020-05-15 07:07:06 +00:00
+								Upd. Готово (все директории кроме contrib).
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Update extended-roadmap.md
											
										
										
											2020-07-14 09:28:38 +00:00
+								### 7.27. + Запуск автотестов в Аркадии {#zapusk-avtotestov-v-arkadii}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Update extended_roadmap.md
											
										
										
											2020-01-30 10:05:12 +00:00
+								Требует 7.26. Коллеги начали делать, есть результат.
-												Update extended-roadmap.md
											
										
										
											2020-07-14 09:28:38 +00:00
+								Upd. В Аркадии частично работает небольшая часть тестов. И этого достаточно.
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 7.29. Опции clickhouse install, stop, start вместо postinst, init.d, systemd скриптов {#optsii-clickhouse-install-stop-start-vmesto-postinst-init-d-systemd-skriptov}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
 								Низкий приоритет.
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 7.30. Возможность переключения бинарных файлов на продакшене без выкладки пакетов {#vozmozhnost-perekliucheniia-binarnykh-failov-na-prodakshene-bez-vykladki-paketov}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
 								Низкий приоритет.
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 7.31. Зеркалирование нагрузки между серверами {#zerkalirovanie-nagruzki-mezhdu-serverami}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
 								В очереди. Нужно для Яндекс.Метрики.
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 7.32. Обфускация продакшен запросов {#obfuskatsiia-prodakshen-zaprosov}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
 								Роман Ильговский. Нужно для Яндекс.Метрики.
-												Update extended-roadmap.md
											
										
										
											2020-05-28 21:21:03 +00:00
+								Есть pull request, почти готово: https://github.com/ClickHouse/ClickHouse/pull/10973
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Added descriptions to some tasks

											
										
										
											2019-11-20 11:34:23 +00:00
+								Имея SQL запрос, требуется вывести структуру таблиц, на которых этот запрос будет выполнен, и заполнить эти таблицы случайными данными, такими, что результат этого запроса зависит от выбора подмножества данных.
 								Для примера, если есть запрос `SELECT SearchPhrase, count(*) FROM table WHERE CounterID = 34 AND SearchPhrase LIKE '%ClickHouse%'`, то мы можем сделать вывод, что CounterID имеет числовой тип, а SearchPhrase - строковый. Заполнить таблицу данными, на которых отдельные условия `CounterID = 34` и `SearchPhrase LIKE '%ClickHouse%'` для некоторых строк выполнены, а для некоторых строк не выполнены.
 								Обфускация запросов: имея секретные запросы и структуру таблиц, заменить имена полей и константы, чтобы запросы можно было использовать в качестве публично доступных тестов.
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 7.33. Выкладывать патч релизы в репозиторий автоматически {#vykladyvat-patch-relizy-v-repozitorii-avtomaticheski}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Update roadmap

											
										
										
											2020-01-18 16:54:56 +00:00
+								В очереди. Иван Лежанкин.
-												Update extended-roadmap.md
											
										
										
											2020-05-15 07:07:06 +00:00
+								Отсутствует прогресс.
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Update extended-roadmap.md
											
										
										
											2020-07-14 09:28:38 +00:00
+								### 7.34. + Бэкпортировать bugfix автоматически {#bekportirovat-bugfix-avtomaticheski}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Update roadmap

											
										
										
											2020-01-18 16:54:56 +00:00
+								В очереди. Иван Лежанкин.
-												Update extended-roadmap.md
											
										
										
											2020-06-27 21:11:36 +00:00
+								Присутствует прогресс.
-												Update extended-roadmap.md
											
										
										
											2020-07-14 09:28:38 +00:00
+								Сделано.
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 7.35. Начальные правила для авто-merge {#nachalnye-pravila-dlia-avto-merge}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
 								Зелёные проверки и два ревью.
 								[Александр Сапин](https://github.com/alesapin). Может делегировать эту задачу кому угодно.
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 7.36. Понятие доверенных контрибьюторов {#poniatie-doverennykh-kontribiutorov}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
 								Контрибьюторы, у которых есть 5 померженных PR. Для их новых PR автотесты запускаются сразу.
 								[Александр Сапин](https://github.com/alesapin). Может делегировать эту задачу кому угодно.
-												Update extended_roadmap.md
											
										
										
											2020-01-30 10:05:12 +00:00
+								Сейчас добавляем некоторых доверенных контрибьюторов в ручном режиме.
-												Update extended-roadmap.md
											
										
										
											2020-06-27 21:11:36 +00:00
+								Upd. Всё ещё добавляем в ручном режиме.
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Update extended-roadmap.md
											
										
										
											2020-07-14 09:28:38 +00:00
+								### 7.37. + Разобраться с repo.yandex.ru {#razobratsia-s-repo-yandex-ru}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Updated roadmap

											
										
										
											2019-11-20 20:55:26 +00:00
+								Есть жалобы на скорость загрузки и неудобство maintenance, operations, visibility.
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Small updates on roadmap

											
										
										
											2020-03-16 22:54:42 +00:00
+								Upd. Иван Блинков настроил CDN repo.clickhouse.tech, что решает проблему с доступностью зарубежом.
 								Вопрос с operations, visibility пока актуален.
-												Update extended-roadmap.md
											
										
										
											2020-06-27 21:11:36 +00:00
+								Upd. Частично решён вопрос с visibility - есть какой-то дэшборд.
-												Update extended-roadmap.md
											
										
										
											2020-05-15 07:07:06 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								## 8. Интеграция с внешними системами {#integratsiia-s-vneshnimi-sistemami}
-												Update roadmap. Also revert digital degradation due to accidential changes with automatic scripts.

											
										
										
											2020-04-13 23:24:33 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 8.1. Поддержка ALTER MODIFY SETTING для Kafka {#podderzhka-alter-modify-setting-dlia-kafka}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Update roadmap

											
										
										
											2020-03-06 20:50:34 +00:00
+								Также - возможность указать все настройки форматов в Kafka.
 								Altinity. Никто не делает эту задачу.
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 8.2. Поддержка Mongo Atlas URI {#podderzhka-mongo-atlas-uri}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
 								[Александр Кузьменков](https://github.com/akuzm).
-												Update extended-roadmap.md
											
										
										
											2020-05-15 07:07:06 +00:00
+								Upd. Задача взята в работу.
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 8.3. + Доработки globs (правильная поддержка диапазонов, уменьшение числа одновременных stream-ов) {#dorabotki-globs-pravilnaia-podderzhka-diapazonov-umenshenie-chisla-odnovremennykh-stream-ov}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
 								[Ольга Хвостикова](https://github.com/stavrolia).
-												Update roadmap. Also revert digital degradation due to accidential changes with automatic scripts.

											
										
										
											2020-04-13 23:24:33 +00:00
+								Уменьшение числа stream-ов сделано, а вот правильная поддержка диапазонов - нет. Будем надеяться на Q1/Q2. Сделано.
-												Update roadmap

											
										
										
											2020-01-18 16:54:56 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 8.4. Унификация File, HDFS, S3 под URL {#unifikatsiia-file-hdfs-s3-pod-url}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 8.5. + Аутентификация в S3 {#autentifikatsiia-v-s3}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
 								[Владимир Чеботарёв](https://github.com/excitoon), Altinity.
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 8.6. Kerberos аутентификация для HDFS и Kafka {#kerberos-autentifikatsiia-dlia-hdfs-i-kafka}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Update roadmap

											
										
										
											2020-03-06 20:50:34 +00:00
+								Андрей Коняев, ArenaData. Он куда-то пропал.
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 8.7. + Исправление мелочи HDFS на очень старых ядрах Linux {#ispravlenie-melochi-hdfs-na-ochen-starykh-iadrakh-linux}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
 								В ядрах 2.6 отсутствует один системный вызов, который библиотека hdfs3 использует без необходимости.
-												Updated roadmap

											
										
										
											2019-12-10 00:13:16 +00:00
+								Сделал Amos Bird.
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 8.8. + Поддержка виртуальных столбцов с именем файла и путём {#podderzhka-virtualnykh-stolbtsov-s-imenem-faila-i-putiom}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
 								[Ольга Хвостикова](https://github.com/stavrolia).
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 8.9. + Поддержка сжатых файлов (gz, bz) на чтение и запись {#podderzhka-szhatykh-failov-gz-bz-na-chtenie-i-zapis}
-												Updated roadmap

											
										
										
											2019-12-10 00:13:16 +00:00
 								Сделал [Andrey Bodrov](https://github.com/apbodrov)
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Update extended-roadmap.md
											
										
										
											2020-06-18 05:00:55 +00:00
+								### 8.10. + Запись в табличную функцию ODBC {#zapis-v-tablichnuiu-funktsiiu-odbc}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Update extended_roadmap.md
											
										
										
											2019-11-28 08:52:17 +00:00
+								Артемий Бобровский, ВШЭ
-												Update extended-roadmap.md
											
										
										
											2020-05-15 07:07:06 +00:00
+								Есть pull request.
-												Update extended_roadmap.md
											
										
										
											2019-11-28 08:52:17 +00:00
-												Update extended-roadmap.md
											
										
										
											2020-07-14 09:28:38 +00:00
+								### 8.11. + Движок таблиц для чтения из Mongo {#dvizhok-tablits-dlia-chteniia-iz-mongo}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Update extended_roadmap.md
											
										
										
											2019-11-28 08:52:17 +00:00
+								Артемий Бобровский, ВШЭ
-												Update extended-roadmap.md
											
										
										
											2020-05-15 07:07:06 +00:00
+								Есть pull request.
-												Update extended-roadmap.md
											
										
										
											2020-06-27 21:11:36 +00:00
+								Upd. В стадии код-ревью.
-												Update extended-roadmap.md
											
										
										
											2020-07-14 09:28:38 +00:00
+								Готово.
-												Update extended_roadmap.md
											
										
										
											2019-11-28 08:52:17 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 8.12. Пропуск столбцов в форматах Parquet, ORC {#propusk-stolbtsov-v-formatakh-parquet-orc}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Update extended-roadmap.md
											
										
										
											2020-06-27 21:11:36 +00:00
+								Реализовано возможно частично - проверить.
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 8.13. Поддержка массивов в Parquet, ORC {#podderzhka-massivov-v-parquet-orc}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Update extended-roadmap.md
											
										
										
											2020-07-14 09:28:38 +00:00
+								### 8.14. + Запись данных в ORC {#zapis-dannykh-v-orc}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Update extended-roadmap.md
											
										
										
											2020-07-14 09:28:38 +00:00
+								Павел Круглов, ВШЭ. Есть pull request. Готово.
-												Updated roadmap

											
										
										
											2019-11-23 00:12:50 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 8.15. Запись данных в CapNProto {#zapis-dannykh-v-capnproto}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 8.16. + Поддержка формата Avro {#podderzhka-formata-avro}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Update extended_roadmap.md
											
										
										
											2020-01-30 10:05:12 +00:00
+								Andrew Onyshchuk. Есть pull request. Q1. Сделано.
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Added descriptions to some tasks

											
										
										
											2019-11-20 11:34:23 +00:00
+								Формат Apache Avro является компактным структурированным построчным бинарным форматом данных с внешней схемой. Этот формат часто используется совместно с Kafka и поддержка его в качестве одного из форматов ввода-вывода в ClickHouse является востребованной пользователями.
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 8.16.1. + Поддержка формата JSONEachRow, засунутого в массив {#podderzhka-formata-jsoneachrow-zasunutogo-v-massiv}
-												Update roadmap

											
										
										
											2020-01-18 16:54:56 +00:00
-												Update extended_roadmap.md
											
										
										
											2020-01-30 10:05:12 +00:00
+								Павел Круглов, ВШЭ и Яндекс. Есть pull request.
-												Update roadmap

											
										
										
											2020-01-18 16:54:56 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 8.16.2. - Поддержка формата Thrift {#podderzhka-formata-thrift}
-												Update roadmap

											
										
										
											2020-01-18 16:54:56 +00:00
-												Update roadmap. Also revert digital degradation due to accidential changes with automatic scripts.

											
										
										
											2020-04-13 23:24:33 +00:00
+								Павел Круглов, ВШЭ и Яндекс. Задача отменена.
-												Update roadmap

											
										
										
											2020-01-18 16:54:56 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 8.16.3. + Поддержка формата MsgPack {#podderzhka-formata-msgpack}
-												Update roadmap

											
										
										
											2020-01-18 16:54:56 +00:00
 								Павел Круглов, ВШЭ и Яндекс.
-												Small updates on roadmap

											
										
										
											2020-03-16 22:54:42 +00:00
+								Задача взята в работу.
-												Update roadmap

											
										
										
											2020-01-18 16:54:56 +00:00
-												Update roadmap. Also revert digital degradation due to accidential changes with automatic scripts.

											
										
										
											2020-04-13 23:24:33 +00:00
+								Upd. Почти готово - есть лишь небольшой технический долг.
-												Update extended-roadmap.md
											
										
										
											2020-06-27 21:11:36 +00:00
+								Upd. Готово.
-												Update roadmap. Also revert digital degradation due to accidential changes with automatic scripts.

											
										
										
											2020-04-13 23:24:33 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 8.16.4. + Формат Regexp {#format-regexp}
-												Update roadmap

											
										
										
											2020-01-18 16:54:56 +00:00
 								Павел Круглов, ВШЭ и Яндекс.
-												Update roadmap. Also revert digital degradation due to accidential changes with automatic scripts.

											
										
										
											2020-04-13 23:24:33 +00:00
+								Есть pull request. Готово.
-												Update roadmap

											
										
										
											2020-01-18 16:54:56 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 8.17. ClickHouse как MySQL реплика {#clickhouse-kak-mysql-replika}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Update extended-roadmap.md
											
										
										
											2020-06-27 21:11:36 +00:00
+								Задачу делает BohuTANG.
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Added descriptions to some tasks

											
										
										
											2019-11-20 11:34:23 +00:00
+								Реализовать возможность подписаться на row-based репликацию MySQL и сохранять полученные данные в CollapsingMergeTree или ReplacingMergeTree таблицы. Сторонние решения для этой задачи уже существуют: https://www.altinity.com/blog/2018/6/30/realtime-mysql-clickhouse-replication-in-practice Также существует стороннее решение для PostgreSQL: https://github.com/mkabilov/pg2ch
 								Встроенная в ClickHouse возможность работать в качестве реплики MySQL даст преимущества для дальнейшего развития.
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 8.18. + ClickHouse как Federated MySQL {#clickhouse-kak-federated-mysql}
-												Updated roadmap

											
										
										
											2019-12-10 00:13:16 +00:00
 								Maxim Fedotov, Wargaming + Yuri Baranov, Яндекс.
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Update extended-roadmap.md
											
										
										
											2020-07-14 09:28:38 +00:00
+								### 8.19. + Интеграция с RabbitMQ {#integratsiia-s-rabbitmq}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
 								Ксения Сумарокова, ВШЭ.
-												Added descriptions to some tasks

											
										
										
											2019-11-20 11:34:23 +00:00
+								В ClickHouse часто используется потоковый импорт данных из распределённой очереди. Наиболее популярно использование совместно с Kafka. Эта возможность уже есть.
 								Следующей по востребованности является система очередей RabbitMQ. Её поддержка в ClickHouse отсутствует.
-												Update roadmap

											
										
										
											2020-03-06 20:50:34 +00:00
+								Есть pull request в процессе разработки.
-												Update extended-roadmap.md
											
										
										
											2020-06-27 21:11:36 +00:00
+								Upd. В процессе code review.
-												Update extended-roadmap.md
											
										
										
											2020-07-14 09:28:38 +00:00
+								Upd. Готово.
-												Update roadmap

											
										
										
											2020-03-06 20:50:34 +00:00
-												Update extended-roadmap.md
											
										
										
											2020-07-14 09:28:38 +00:00
+								### 8.20. - Интеграция с SQS {#integratsiia-s-sqs}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Update extended-roadmap.md
											
										
										
											2020-07-14 09:28:38 +00:00
+								Низкий приоритет. Отменено.
-												Updated roadmap

											
										
										
											2019-11-23 00:12:50 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 8.21. Поддержка произвольного количества языков для имён регионов {#podderzhka-proizvolnogo-kolichestva-iazykov-dlia-imion-regionov}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
 								Нужно для БК. Декабрь 2019.
-												Update roadmap

											
										
										
											2020-01-18 16:54:56 +00:00
+								В декабре для БК сделан минимальный вариант этой задачи.
-												Update roadmap

											
										
										
											2020-03-06 20:50:34 +00:00
+								Максимальный вариант, вроде, никому не нужен.
-												Update roadmap. Also revert digital degradation due to accidential changes with automatic scripts.

											
										
										
											2020-04-13 23:24:33 +00:00
+								Upd. Всё ещё кажется, что задача не нужна.
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Update extended-roadmap.md
											
										
										
											2020-06-27 21:11:36 +00:00
+								### 8.22. + Поддержка синтаксиса для переменных в стиле MySQL {#podderzhka-sintaksisa-dlia-peremennykh-v-stile-mysql}
-												Updated roadmap

											
										
										
											2019-11-23 00:12:50 +00:00
 								При парсинге запроса преобразовывать синтаксис вида `@@version_full` в вызов функции `getGlobalVariable('version_full')`. Поддержать популярные MySQL переменные. Может быть поможет Юрий Баранов, если будет энтузиазм.
-												Update roadmap

											
										
										
											2020-03-06 20:50:34 +00:00
+								Upd. Юрий Баранов работает в Google, там запрещено разрабатывать ClickHouse.
-												Update extended-roadmap.md
											
										
										
											2020-06-27 21:11:36 +00:00
+								Upd. Сделано теми людьми, кому не запрещено разрабатывать ClickHouse.
-												Update roadmap

											
										
										
											2020-03-06 20:50:34 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 8.23. Подписка для импорта обновляемых и ротируемых логов в ФС {#podpiska-dlia-importa-obnovliaemykh-i-rotiruemykh-logov-v-fs}
-												Update extended_roadmap.md
											
										
										
											2019-12-12 00:37:16 +00:00
 								Желательно 2.15.
-												Update extended-roadmap.md
											
										
										
											2020-05-15 07:07:06 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								## 9. Безопасность {#bezopasnost}
-												Update roadmap. Also revert digital degradation due to accidential changes with automatic scripts.

											
										
										
											2020-04-13 23:24:33 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 9.1. + Ограничение на хосты в запросах ко внешним системам {#ogranichenie-na-khosty-v-zaprosakh-ko-vneshnim-sistemam}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
 								Михаил Коротов.
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 9.2. Преднастроенные именованные соединения к внешним БД {#prednastroennye-imenovannye-soedineniia-k-vneshnim-bd}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Added descriptions to some tasks

											
										
										
											2019-11-20 11:34:23 +00:00
+								ClickHouse предоставляет возможность обратиться к внешней базе данных из языка запросов. Это реализовано в виде табличных функций. В параметрах к табличной функции указывается адрес удалённой базы данных (хост, порт), а также аутентификационные данные (имя пользователя, пароль). Аутентификационные данные указываются в запросе в открытом виде и, таким образом, попадают в историю запросов и в логи, что компрометирует безопасность системы.
 								Вместо этого предлагается описывать необходимые данные в конфигурационном файле сервера или в отдельном сервисе и ссылаться на них по именам.
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 9.3. + Поддержка TLS для ZooKeeper {#podderzhka-tls-dlia-zookeeper}
-												Update roadmap. Also revert digital degradation due to accidential changes with automatic scripts.

											
										
										
											2020-04-13 23:24:33 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								[\#10174](https://github.com/ClickHouse/ClickHouse/issues/10174)
-												Update roadmap. Also revert digital degradation due to accidential changes with automatic scripts.

											
										
										
											2020-04-13 23:24:33 +00:00
 								Есть pull request.
-												Update extended-roadmap.md
											
										
										
											2020-05-15 07:07:06 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								## 10. Внешние словари {#vneshnie-slovari}
-												Update roadmap. Also revert digital degradation due to accidential changes with automatic scripts.

											
										
										
											2020-04-13 23:24:33 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 10.1. + Исправление зависания в библиотеке доступа к YT {#ispravlenie-zavisaniia-v-biblioteke-dostupa-k-yt}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Updated roadmap

											
										
										
											2019-11-20 20:55:26 +00:00
+								Библиотека для доступа к YT не переживает учения.
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
+								Нужно для БК и Метрики. Поиск причин - [Александр Сапин](https://github.com/alesapin). Дальшейшее исправление возможно на стороне YT.
-												WIP on docs translation/normalization tools (#9783)


											
										
										
											2020-03-20 18:20:59 +00:00
+								Цитата: «Оказывается для YT-клиента зависания на несколько минут это нормально. Убрал внутренние ретраи, снизил таймауты. Однозначно станет лучше».
-												Update extended_roadmap.md
											
										
										
											2019-12-29 17:13:14 +00:00
-												Update extended-roadmap.md
											
										
										
											2020-05-15 07:07:06 +00:00
+								### 10.2. + Исправление SIGILL в библиотеке доступа к YT {#ispravlenie-sigill-v-biblioteke-dostupa-k-yt}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Updated roadmap

											
										
										
											2019-11-20 20:55:26 +00:00
+								Код YT использует SIGILL вместо abort. Это, опять же, происходит при учениях.
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
+								Нужно для БК и Метрики. Поиск причин - [Александр Сапин](https://github.com/alesapin). Дальшейшее исправление возможно на стороне YT.
-												Update roadmap

											
										
										
											2020-03-06 20:50:34 +00:00
+								Upd. Одну причину устранили, но ещё что-то неизвестное осталось.
-												Update roadmap. Also revert digital degradation due to accidential changes with automatic scripts.

											
										
										
											2020-04-13 23:24:33 +00:00
+								Upd. Нас заставляют переписать эту библиотеку с одного API на другое, так как старое внезапно устарело. Кажется, что переписывание случайно исправит все проблемы.
-												Update extended-roadmap.md
											
										
										
											2020-05-15 07:07:06 +00:00
+								Upd. Ура, нашли причину и исправили.
-												Update roadmap

											
										
										
											2020-03-06 20:50:34 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 10.3. Возможность чтения данных из статических таблиц в YT словарях {#vozmozhnost-chteniia-dannykh-iz-staticheskikh-tablits-v-yt-slovariakh}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
 								Нужно для БК и Метрики.
-												Update extended-roadmap.md
											
										
										
											2020-06-27 21:11:36 +00:00
+								### 10.4. - Словарь из YDB (KikiMR) {#slovar-iz-ydb-kikimr}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Update roadmap

											
										
										
											2020-01-18 16:54:56 +00:00
+								Нужно для Метрики, а делать будет таинственный незнакомец из команды KikiMR (под вопросом). Таинственный незнакомец не подтверждает, что он будет делать эту задачу.
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 10.5. Закрытие соединений и уменьшение числа соединений для MySQL и ODBC {#zakrytie-soedinenii-i-umenshenie-chisla-soedinenii-dlia-mysql-i-odbc}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
 								Нужно для Метрики.
-												Update roadmap

											
										
										
											2020-03-06 20:50:34 +00:00
+								Для MySQL сделал Clément Rodriguez.
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 10.6. Словари из Cassandra и Couchbase {#slovari-iz-cassandra-i-couchbase}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Update extended-roadmap.md
											
										
										
											2020-06-18 05:00:55 +00:00
+								Готова Cassandra.
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 10.7. Поддержка Nullable в словарях {#podderzhka-nullable-v-slovariakh}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 10.8. Поддержка массивов в словарях {#podderzhka-massivov-v-slovariakh}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 10.9. - Уменьшение блокировок для cache словарей за счёт одновременных запросов одного и того же {#umenshenie-blokirovok-dlia-cache-slovarei-za-schiot-odnovremennykh-zaprosov-odnogo-i-togo-zhe}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Update roadmap

											
										
										
											2020-03-06 20:50:34 +00:00
+								Заменено в пользу 10.10, 10.11.
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 10.10. + Возможность использования старых значений из cache словаря пока они перезапрашиваются {#vozmozhnost-ispolzovaniia-starykh-znachenii-iz-cache-slovaria-poka-oni-perezaprashivaiutsia}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Update roadmap

											
										
										
											2020-01-18 16:54:56 +00:00
+								Никита Михайлов. Q1. Нужно для БК и Метрики.
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 10.11. + Возможность исключительно асинхронных запросов в cache словарях {#vozmozhnost-iskliuchitelno-asinkhronnykh-zaprosov-v-cache-slovariakh}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Update roadmap

											
										
										
											2020-01-18 16:54:56 +00:00
+								Никита Михайлов. Q1. Нужно для БК и Метрики. Требует 10.10.
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Update extended-roadmap.md
											
										
										
											2020-06-18 05:00:55 +00:00
+								### 10.12. + Layout direct для словарей {#layout-direct-dlia-slovarei}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
 								Артём Стрельцов, Николай Дегтеринский, Наталия Михненко, ВШЭ.
-												Update extended_roadmap.md
											
										
										
											2020-01-30 10:05:12 +00:00
+								Приступили к этой задаче.
-												Update extended-roadmap.md
											
										
										
											2020-05-15 07:07:06 +00:00
+								Готов direct, есть pull request complex_key_direct.
-												Update extended-roadmap.md
											
										
										
											2020-06-27 21:11:36 +00:00
+								Готово всё.
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 10.13. Использование Join как generic layout для словарей {#ispolzovanie-join-kak-generic-layout-dlia-slovarei}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 10.14. Поддержка всех типов в функции transform {#podderzhka-vsekh-tipov-v-funktsii-transform}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Update extended-roadmap.md
											
										
										
											2020-06-18 05:00:55 +00:00
+								### 10.15. + Использование словарей как специализированного layout для Join {#ispolzovanie-slovarei-kak-spetsializirovannogo-layout-dlia-join}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Update extended-roadmap.md
											
										
										
											2020-06-27 21:11:36 +00:00
+								### 10.16. + Словари на локальном SSD {#slovari-na-lokalnom-ssd}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Update roadmap

											
										
										
											2020-01-18 16:54:56 +00:00
+								Никита Васильев, ВШЭ и Яндекс. Есть pull request.
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Added descriptions to some tasks

											
										
										
											2019-11-20 11:34:23 +00:00
+								Реализовать в ClickHouse специализированный движок таблиц, подходящий для быстрых key-value запросов и оптимизированный для расположения данных на SSD. Это может быть: реализация на основе RocksDB; сериализованные RowBinary данные с индексом в оперативке; секретная очень эффективная структура данных, о которой я расскажу.
 								Использовать эту структуру данных как отдельный вид словарей, как источник для cache словарей или как дополнительный уровень кэширования для cache словарей.
-												Update extended-roadmap.md
											
										
										
											2020-05-15 07:07:06 +00:00
+								Upd. Задача в финальной стадии готовности.
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 10.17. Локальный дамп состояния словаря для быстрого старта сервера {#lokalnyi-damp-sostoianiia-slovaria-dlia-bystrogo-starta-servera}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 10.18. Таблица Join или словарь на удалённом сервере как key-value БД для cache словаря {#tablitsa-join-ili-slovar-na-udalionnom-servere-kak-key-value-bd-dlia-cache-slovaria}
-												Added descriptions to some tasks

											
										
										
											2019-11-20 11:34:23 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 10.19. Возможность зарегистрировать некоторые функции, использующие словари, под пользовательскими именами {#vozmozhnost-zaregistrirovat-nekotorye-funktsii-ispolzuiushchie-slovari-pod-polzovatelskimi-imenami}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Update extended-roadmap.md
											
										
										
											2020-05-15 07:07:06 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								## 11. Интерфейсы {#interfeisy}
-												Update roadmap. Also revert digital degradation due to accidential changes with automatic scripts.

											
										
										
											2020-04-13 23:24:33 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 11.1. Вставка состояний агрегатных функций в виде кортежа аргументов или массива кортежей аргументов {#vstavka-sostoianii-agregatnykh-funktsii-v-vide-kortezha-argumentov-ili-massiva-kortezhei-argumentov}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 11.2. Возможность использовать движок JDBC из коробки {#vozmozhnost-ispolzovat-dvizhok-jdbc-iz-korobki}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Added descriptions to some tasks

											
										
										
											2019-11-20 11:34:23 +00:00
+								Нужно разобраться, как упаковывать Java в статический бинарник, возможно AppImage. Или предоставить максимально простую инструкцию по установке jdbc-bridge. Может быть будет заинтересован Александр Крашенинников, Badoo, так как он разработал jdbc-bridge.
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Update roadmap. Also revert digital degradation due to accidential changes with automatic scripts.

											
										
										
											2020-04-13 23:24:33 +00:00
+								Upd. Александр Крашенинников перешёл в другую компанию и больше не занимается этим.
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 11.3. + Интеграционные тесты ODBC драйвера путём подключения ClickHouse к самому себе через ODBC {#integratsionnye-testy-odbc-draivera-putiom-podkliucheniia-clickhouse-k-samomu-sebe-cherez-odbc}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Small updates on roadmap

											
										
										
											2020-03-16 22:54:42 +00:00
+								Михаил Филимонов, Altinity. Готово.
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 11.4. Исправление упячек с типами Date и Decimal в clickhouse-cpp {#ispravlenie-upiachek-s-tipami-date-i-decimal-v-clickhouse-cpp}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Update extended-roadmap.md
											
										
										
											2020-06-27 21:11:36 +00:00
+								Altinity целиком взяли на себя поддержку clickhouse-cpp драйвера.
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 11.5. Поддержка TLS в clickhouse-cpp {#podderzhka-tls-v-clickhouse-cpp}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Updated roadmap

											
										
										
											2019-11-20 20:55:26 +00:00
+								А знаете ли вы, что библиотеку clickhouse-cpp разрабатывал один хороший человек в свободное время?
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 11.6. Интеграционные тесты clickhouse-cpp {#integratsionnye-testy-clickhouse-cpp}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 11.7. Интерактивный режим работы программы clickhouse-local {#interaktivnyi-rezhim-raboty-programmy-clickhouse-local}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Update extended-roadmap.md
											
										
										
											2020-06-27 21:11:36 +00:00
+								### 11.8. + Поддержка протокола PostgreSQL {#podderzhka-protokola-postgresql}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
 								Элбакян Мовсес Андраникович, ВШЭ.
-												Added descriptions to some tasks

											
										
										
											2019-11-20 11:34:23 +00:00
+								В ClickHouse в прошлом году добавили поддержку wire-протокола MySQL. PostgreSQL, так же как MySQL, использует несложный протокол общения между клиентом и сервером, но свой собственный. Поддержка этого протокола является востребованной и откроет новые возможности для ClickHouse.
-												Update extended_roadmap.md
											
										
										
											2020-04-22 22:02:20 +00:00
+								Задача в процессе разработки.
-												Update extended-roadmap.md
											
										
										
											2020-05-15 07:07:06 +00:00
+								Задача в финальной стадии разработки.
-												Update extended_roadmap.md
											
										
										
											2020-04-22 22:02:20 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 11.9. + Доработки ODBC драйвера {#dorabotki-odbc-draivera}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Updated roadmap

											
										
										
											2019-12-10 00:13:16 +00:00
+								Денис Глазачев, Altinity. Хороший прогресс по этой задаче.
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Update extended-roadmap.md
											
										
										
											2020-05-15 07:07:06 +00:00
+								### 11.10. + Преднастроенные HTTP handlers для запросов {#prednastroennye-http-handlers-dlia-zaprosov}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Update roadmap

											
										
										
											2020-01-18 16:54:56 +00:00
+								zhang2014, есть pull request.
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Added descriptions to some tasks

											
										
										
											2019-11-20 11:34:23 +00:00
+								Возможность описать в конфигурационном файле handler (путь в URL) для HTTP запросов к серверу, которому соответствует некоторый параметризованный запрос. Пользователь может вызвать этот обработчик и не должен передавать SQL запрос.
-												Update extended-roadmap.md
											
										
										
											2020-05-15 07:07:06 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								## 12. Управление пользователями и доступом {#upravlenie-polzovateliami-i-dostupom}
-												Update roadmap. Also revert digital degradation due to accidential changes with automatic scripts.

											
										
										
											2020-04-13 23:24:33 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 12.1. + Role Based Access Control {#role-based-access-control}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Update roadmap. Also revert digital degradation due to accidential changes with automatic scripts.

											
										
										
											2020-04-13 23:24:33 +00:00
+								[Виталий Баранов](https://github.com/vitlibar). Финальная стадия разработки, рабочая версия в начале апреля 2019.
 								Q2. Сейчас сделаны все интерфейсы в коде и запросы, но не сделаны варианты хранения прав кроме прототипа.
-												Small updates on roadmap

											
										
										
											2020-03-16 22:54:42 +00:00
+								Upd. Сделано хранение прав. До готового к использованию состояния осталось несколько доработок.
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 12.2. + Управление пользователями и правами доступа с помощью SQL запросов {#upravlenie-polzovateliami-i-pravami-dostupa-s-pomoshchiu-sql-zaprosov}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
 								[Виталий Баранов](https://github.com/vitlibar). Финальная стадия разработки, рабочая версия в декабре 2019.
-												Update roadmap

											
										
										
											2020-03-06 20:50:34 +00:00
+								Q1. Сделано управление правами полностью, но не реализовано их хранение, см. 12.1.
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 12.3. Подключение справочника пользователей и прав доступа из LDAP {#podkliuchenie-spravochnika-polzovatelei-i-prav-dostupa-iz-ldap}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Update extended-roadmap.md
											
										
										
											2020-05-15 07:07:06 +00:00
+								Аутентификация через LDAP - Денис Глазачев.
-												Assign some tasks to Altinity
											
										
										
											2020-05-09 00:18:30 +00:00
+								[Виталий Баранов](https://github.com/vitlibar) и Денис Глазачев, Altinity. Требует 12.1.
-												Update extended-roadmap.md
											
										
										
											2020-06-27 21:11:36 +00:00
+								Q3.
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 12.4. Подключение IDM системы Яндекса как справочника пользователей и прав доступа {#podkliuchenie-idm-sistemy-iandeksa-kak-spravochnika-polzovatelei-i-prav-dostupa}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
 								Пока низкий приоритет. Нужно для Метрики. Требует 12.3.
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 12.5. Pluggable аутентификация с помощью Kerberos (возможно, подключение GSASL) {#pluggable-autentifikatsiia-s-pomoshchiu-kerberos-vozmozhno-podkliuchenie-gsasl}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Assign some tasks to Altinity
											
										
										
											2020-05-09 00:18:30 +00:00
+								[Виталий Баранов](https://github.com/vitlibar) и Денис Глазачев, Altinity. Требует 12.1.
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Update extended-roadmap.md
											
										
										
											2020-05-21 11:52:28 +00:00
+								### 12.6. + Информация о пользователях и квотах в системной таблице {#informatsiia-o-polzovateliakh-i-kvotakh-v-sistemnoi-tablitse}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
 								[Виталий Баранов](https://github.com/vitlibar). Требует 12.1.
-												Update extended-roadmap.md
											
										
										
											2020-05-21 11:52:28 +00:00
+								Есть pull request. Q2. Готово.
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Update extended-roadmap.md
											
										
										
											2020-05-15 07:07:06 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								## 13. Разделение ресурсов, multi-tenancy {#razdelenie-resursov-multi-tenancy}
-												Update roadmap. Also revert digital degradation due to accidential changes with automatic scripts.

											
										
										
											2020-04-13 23:24:33 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 13.1. Overcommit запросов по памяти и вытеснение {#overcommit-zaprosov-po-pamiati-i-vytesnenie}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Update extended-roadmap.md
											
										
										
											2020-06-27 21:11:36 +00:00
+								Требует 2.1. Способ реализации обсуждается. Александр Казаков.
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 13.2. Общий конвейер выполнения на сервер {#obshchii-konveier-vypolneniia-na-server}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
 								Требует 2.1. [Николай Кочетов](https://github.com/KochetovNicolai).
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 13.3. Пулы ресурсов {#puly-resursov}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Update extended-roadmap.md
											
										
										
											2020-07-14 09:28:38 +00:00
+								Александр Казаков.
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
+								Требует 13.2 или сможем сделать более неудобную реализацию раньше.
-												Update roadmap

											
										
										
											2020-01-18 16:54:56 +00:00
+								Обсуждается вариант неудобной реализации. Пока средний приоритет, целимся на Q1/Q2.
-												Update roadmap

											
										
										
											2020-03-06 20:50:34 +00:00
+								Вариант реализации выбрал Александр Казаков.
-												Update roadmap. Also revert digital degradation due to accidential changes with automatic scripts.

											
										
										
											2020-04-13 23:24:33 +00:00
+								Upd. Не уследили, и задачу стали обсуждать менеджеры.
-												Update extended-roadmap.md
											
										
										
											2020-05-15 07:07:06 +00:00
+								Upd. Задачу смотрит Александр Казаков.
-												Update extended-roadmap.md
											
										
										
											2020-06-18 05:00:55 +00:00
+								Upd. Задача взята в работу.
-												Update extended-roadmap.md
											
										
										
											2020-05-15 07:07:06 +00:00
-												Update roadmap. Also revert digital degradation due to accidential changes with automatic scripts.

											
										
										
											2020-04-13 23:24:33 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								## 14. Диалект SQL {#dialekt-sql}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Update extended-roadmap.md
											
										
										
											2020-06-18 05:00:55 +00:00
+								### 14.1. + Исправление семантики CAST для Nullable {#ispravlenie-semantiki-cast-dlia-nullable}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
 								Нужно для DataLens. А также для внедрения в BI инструмент Looker.
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 14.2. Поддержка WITH для подзапросов {#podderzhka-with-dlia-podzaprosov}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 14.3. Поддержка подстановок для множеств в правой части IN {#podderzhka-podstanovok-dlia-mnozhestv-v-pravoi-chasti-in}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 14.4. Поддержка подстановок для идентификаторов (имён) в SQL запросе {#podderzhka-podstanovok-dlia-identifikatorov-imion-v-sql-zaprose}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
 								zhang2014
-												Update extended-roadmap.md
											
										
										
											2020-06-27 21:11:36 +00:00
+								Задача на паузе.
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 14.5. + Поддержка задания множества как массива в правой части секции IN {#podderzhka-zadaniia-mnozhestva-kak-massiva-v-pravoi-chasti-sektsii-in}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Update extended_roadmap.md
											
										
										
											2020-01-30 10:05:12 +00:00
+								Василий Немков, Altinity, делал эту задачу, но забросил её в пользу других задач.
 								В результате, сейчас доделывает Антон Попов.
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 14.6. Глобальный scope для WITH {#globalnyi-scope-dlia-with}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 14.7. Nullable для WITH ROLLUP, WITH CUBE, WITH TOTALS {#nullable-dlia-with-rollup-with-cube-with-totals}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
 								Простая задача.
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 14.8. Модификаторы DISTINCT, ORDER BY для агрегатных функций {#modifikatory-distinct-order-by-dlia-agregatnykh-funktsii}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Added descriptions to some tasks

											
										
										
											2019-11-20 11:34:23 +00:00
+								В ClickHouse поддерживается вычисление COUNT(DISTINCT x). Предлагается добавить возможность использования модификатора DISTINCT для всех агрегатных функций. Например, AVG(DISTINCT x) - вычислить среднее значение для всех различных значений x. Под вопросом вариант, в котором фильтрация уникальных значений выполняется по одному выражению, а агрегация по другому.
 								Результат некоторых агрегатных функций зависит от порядка данных. Предлагается реализовать модификатор ORDER BY, задающий порядок явно. Пример: groupArray(x ORDER BY y, z).
-												Update extended-roadmap.md
											
										
										
											2020-06-18 05:00:55 +00:00
+								Upd. Есть pull request-ы.
-												Update extended-roadmap.md
											
										
										
											2020-06-27 21:11:36 +00:00
+								Upd. DISTINCT готов.
-												Update extended-roadmap.md
											
										
										
											2020-05-15 07:07:06 +00:00
-												Update extended-roadmap.md
											
										
										
											2020-07-14 09:28:38 +00:00
+								### 14.9. + Поддержка запроса EXPLAIN {#podderzhka-zaprosa-explain}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
 								Требует 2.1. [Николай Кочетов](https://github.com/KochetovNicolai).
-												Update extended-roadmap.md
											
										
										
											2020-07-14 09:28:38 +00:00
+								Upd. Есть pull request. Готово.
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 14.10. arrayReduce как функция высшего порядка {#arrayreduce-kak-funktsiia-vysshego-poriadka}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 14.11. Функции для grouping sets {#funktsii-dlia-grouping-sets}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 14.12. Функции обработки временных рядов {#funktsii-obrabotki-vremennykh-riadov}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
 								Сложная задача, так как вводит новый класс функций и требует его обработку в оптимизаторе запросов.
-												WIP on docs translation/normalization tools (#9783)


											
										
										
											2020-03-20 18:20:59 +00:00
+								В time-series СУБД нужны функции, которые зависят от последовательности значений. Или даже от последовательности значений и их меток времени. Примеры: moving average, exponential smoothing, derivative, Holt-Winters forecast. Вычисление таких функций поддерживается в ClickHouse лишь частично. Так, ClickHouse поддерживает тип данных «массив» и позволяет реализовать эти функции как функции, принимающие массивы. Но гораздо удобнее для пользователя было бы иметь возможность применить такие функции к таблице (промежуточному результату запроса после сортировки).
-												Added descriptions to some tasks

											
										
										
											2019-11-20 11:34:23 +00:00
 								Это требует введение нового класса функций (помимо обычных и агрегатных функций) - такие функции будут иметь в коде ClickHouse свой собственный интерфейс, и их вычисление придётся отдельно учитывать в конвейере выполнения запросов. Для примера, вычисление обычных функций тривиально распараллеливается по процессорным ядрам и по серверам; вычисление агрегатных функций распараллеливается с некоторыми особенностями (работа с промежуточными состояниями вычислений, операция merge); а для функций по обработке временных рядов этот вопрос остаётся открытым - возможно, их придётся вычислять на одном сервере и в одном потоке.
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 14.13. Применимость функций высшего порядка для кортежей и Nested {#primenimost-funktsii-vysshego-poriadka-dlia-kortezhei-i-nested}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 14.14. Неявные преобразования типов констант {#neiavnye-preobrazovaniia-tipov-konstant}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Update extended-roadmap.md
											
										
										
											2020-06-18 05:00:55 +00:00
+								Сделано для операторов сравнения с константами (подавляющее большинство use cases).
 								В общем виде требует 2.12.
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 14.15. Неявные преобразования типов под настройкой {#neiavnye-preobrazovaniia-tipov-pod-nastroikoi}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
 								Требует 2.12. Для внедрения в BI инструмент Looker.
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 14.16. Синонимы для функций из MySQL {#sinonimy-dlia-funktsii-iz-mysql}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 14.17. + Ввести понятие stateful функций {#vvesti-poniatie-stateful-funktsii}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Updated roadmap

											
										
										
											2019-12-10 00:13:16 +00:00
+								zhang2014.
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
+								Для runningDifference, neighbour - их учёт в оптимизаторе запросов.
-												Updated roadmap

											
										
										
											2019-12-10 00:13:16 +00:00
+								В интерфейсе уже сделано. Надо проверить, что учитывается в нужных местах (например, что работает predicate pushdown сквозь ORDER BY, если таких функций нет).
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 14.18. UNION DISTINCT и возможность включить его по-умолчанию {#union-distinct-i-vozmozhnost-vkliuchit-ego-po-umolchaniiu}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
 								Для BI систем.
-												Update extended-roadmap.md
											
										
										
											2020-06-27 21:11:36 +00:00
+								### 14.19. + Совместимость парсера типов данных с SQL {#sovmestimost-parsera-tipov-dannykh-s-sql}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Update roadmap

											
										
										
											2020-01-18 16:54:56 +00:00
+								Павел Потёмкин, ВШЭ.
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
+								Для BI систем.
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 14.20. Позиционные аргументы для GROUP BY и ORDER BY {#pozitsionnye-argumenty-dlia-group-by-i-order-by}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
 								Тривиально и используется многими системами, но не входит в стандарт SQL.
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 14.21. Приведение типов для IN (подзапрос) и для JOIN {#privedenie-tipov-dlia-in-podzapros-i-dlia-join}
-												Update extended roadmap

											
										
										
											2019-11-19 08:25:14 +00:00
-												Update roadmap

											
										
										
											2020-01-18 16:54:56 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								## 15. Улучшение поддержки JOIN {#uluchshenie-podderzhki-join}
-												Update roadmap. Also revert digital degradation due to accidential changes with automatic scripts.

											
										
										
											2020-04-13 23:24:33 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 15.1. + Доведение merge JOIN до продакшена {#dovedenie-merge-join-do-prodakshena}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
 								Артём Зуйков. Сейчас merge JOIN включается вручную опцией и всегда замедляет запросы. Хотим, чтобы он замедлял запросы только когда это неизбежно.
 								Кстати, смысл merge JOIN появляется только совместно с 15.2 и 15.3.
-												Update roadmap

											
										
										
											2020-03-06 20:50:34 +00:00
+								Q1. Сделали адаптивный вариант, но вроде он что-то всё-ещё замедляет.
-												Update roadmap. Also revert digital degradation due to accidential changes with automatic scripts.

											
										
										
											2020-04-13 23:24:33 +00:00
+								Задача сделана, но всё работает слишком медленно.
-												Update roadmap

											
										
										
											2020-01-18 16:54:56 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 15.1.1. Алгоритм two-level merge JOIN {#algoritm-two-level-merge-join}
-												Update roadmap

											
										
										
											2020-01-18 16:54:56 +00:00
-												Update extended-roadmap.md
											
										
										
											2020-06-18 05:00:55 +00:00
+								Также известен как grace hash join.
 								Артём Зуйков. В очереди.
-												Update roadmap

											
										
										
											2020-01-18 16:54:56 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 15.1.2. Тестирование реализации JOIN в Greenplum {#testirovanie-realizatsii-join-v-greenplum}
-												Update roadmap

											
										
										
											2020-01-18 16:54:56 +00:00
-												Update extended-roadmap.md
											
										
										
											2020-06-18 05:00:55 +00:00
+								В очереди. Как будто задача самоотменилась.
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 15.2. Прокидывание условий в OUTER JOIN {#prokidyvanie-uslovii-v-outer-join}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
 								Возможно, Артём Зуйков, но задача ещё не продумана до конца. Возможно, требует 2.1.
-												WIP on docs translation/normalization tools (#9783)


											
										
										
											2020-03-20 18:20:59 +00:00
+								### 15.3. Логический вывод для цепочек вида ON t1.x = t2.y WHERE t1.x = 10 {#logicheskii-vyvod-dlia-tsepochek-vida-on-t1-x-t2-y-where-t1-x-10}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
 								Возможно, Артём Зуйков. Для полноценной работы 15.2.
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 15.4. Distributed JOIN с помощью перераспределения данных {#distributed-join-s-pomoshchiu-pereraspredeleniia-dannykh}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
 								Артём Зуйков.
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 15.5. Использование ключа таблицы для оптимизации merge JOIN {#ispolzovanie-kliucha-tablitsy-dlia-optimizatsii-merge-join}
-												Update extended roadmap

											
										
										
											2019-11-19 08:25:14 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 15.6. + SEMI и ANTI JOIN {#semi-i-anti-join}
-												Update extended_roadmap.md
											
										
										
											2019-11-19 16:03:55 +00:00
 								Артём Зуйков.
-												Update extended-roadmap.md
											
										
										
											2020-05-15 07:07:06 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								## 16. Типы данных и функции {#tipy-dannykh-i-funktsii}
-												Update roadmap. Also revert digital degradation due to accidential changes with automatic scripts.

											
										
										
											2020-04-13 23:24:33 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 16.1. + DateTime64 {#datetime64}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Updated roadmap

											
										
										
											2019-11-20 20:55:26 +00:00
+								Василий Немков, Altinity, декабрь 2019.
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 16.2. Тип данных для JSON {#tip-dannykh-dlia-json}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
 								zhang2014
-												Update extended_roadmap.md
											
										
										
											2020-04-22 22:02:20 +00:00
+								Есть PR, в процессе ревью.
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 16.3. Поддержка неконстантных аргументов с регулярными выражениями в функциях {#podderzhka-nekonstantnykh-argumentov-s-reguliarnymi-vyrazheniiami-v-funktsiiakh}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
 								Данила Кутенин, но только после секретного изменения в работе.
-												Small updates on roadmap

											
										
										
											2020-03-16 22:54:42 +00:00
+								Upd. Секретного изменения в работе не будет, задачу будет делать другой человек.
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 16.4. Функция rowNumberForKey {#funktsiia-rownumberforkey}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 16.5. Функции для XML и HTML escape {#funktsii-dlia-xml-i-html-escape}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 16.6. Функции нормализации и хэширования SQL запросов {#funktsii-normalizatsii-i-kheshirovaniia-sql-zaprosov}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Update extended-roadmap.md
											
										
										
											2020-05-15 07:07:06 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								## 17. Работа с географическими данными {#rabota-s-geograficheskimi-dannymi}
-												Update roadmap. Also revert digital degradation due to accidential changes with automatic scripts.

											
										
										
											2020-04-13 23:24:33 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 17.1. Гео-словари для определения региона по координатам {#geo-slovari-dlia-opredeleniia-regiona-po-koordinatam}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
 								[Андрей Чулков](https://github.com/achulkov2), Антон Кваша, Артур Петуховский, ВШЭ.
 								Будет основано на коде от Арслана Урташева.
-												Added descriptions to some tasks

											
										
										
											2019-11-20 11:34:23 +00:00
+								ClickHouse не является geospatial СУБД. Тем не менее, в ClickHouse есть несколько функций для таких задач. Например, функция `pointInPolygon` позволяет быстро проверить попадание точек в полигон на плоскости. При этом, полигон задаётся в явном виде и должен быть константным для вызова функции (то есть - проверяется принадлежность многих точек одному полигону). Эта функциональность нужна, например, для рекламного таргетинга мобильных устройств по координатам.
 								Похожая, но более сложная задача, которую ClickHouse пока не умеет решать - определение полигона среди множества полигонов, в которые попадают точки. Для примера: определение района города по географическим координатам. Для решения этой задачи нужно будет реализовать поддержку словарей с полигонами, в которых данные проиндексированы для быстрого поиска.
-												Update roadmap

											
										
										
											2020-01-18 16:54:56 +00:00
+								Upd. Андрей сделал прототип интерфейса и реализацию-заглушку внутри него.
-												Update roadmap

											
										
										
											2020-03-06 20:50:34 +00:00
+								Upd. Андрей сделал прототип более оптимальной структуры данных.
-												Update extended-roadmap.md
											
										
										
											2020-05-15 07:07:06 +00:00
+								Upd. Есть обнадёживающие результаты.
-												Update extended-roadmap.md
											
										
										
											2020-06-18 05:00:55 +00:00
+								Upd. В ревью.
-												Update roadmap

											
										
										
											2020-01-18 16:54:56 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 17.2. GIS типы данных и операции {#gis-tipy-dannykh-i-operatsii}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
 								Алексей Коряков, Алексей Илюхов, ВШЭ, Яндекс.Карты.
-												Added descriptions to some tasks

											
										
										
											2019-11-20 11:34:23 +00:00
+								Реализовать в ClickHouse типы данных для задач обработки геоинформационных данных: Point, Line, MultiLine, Polygon и операции над ними - проверка вхождения, пересечения. Вариантом минимум будет реализация этих операций в евклидовой системе координат. Дополнительно - на сфере и WGS84.
-												Update extended-roadmap.md
											
										
										
											2020-06-27 21:11:36 +00:00
+								Upd. Есть pull request.
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 17.3. + Ускорение greatCircleDistance {#uskorenie-greatcircledistance}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
 								[Ольга Хвостикова](https://github.com/stavrolia), основано на коде Андрея Аксёнова, получено разрешение на использование кода.
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 17.4. Ускорение geohash с помощью библиотеки из Аркадии {#uskorenie-geohash-s-pomoshchiu-biblioteki-iz-arkadii}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Update extended-roadmap.md
											
										
										
											2020-05-15 07:07:06 +00:00
+								Получено одобрение от руководства.
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 17.5. + Проверки в функции pointInPolygon {#proverki-v-funktsii-pointinpolygon}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Update extended_roadmap.md
											
										
										
											2020-03-26 18:04:43 +00:00
+								Сейчас функция тихо не работает в случае полигонов с самопересечениями, надо кидать исключение.
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Update extended-roadmap.md
											
										
										
											2020-05-15 07:07:06 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								## 18. Машинное обучение и статистика {#mashinnoe-obuchenie-i-statistika}
-												Update roadmap. Also revert digital degradation due to accidential changes with automatic scripts.

											
										
										
											2020-04-13 23:24:33 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 18.1. Инкрементальная кластеризация данных {#inkrementalnaia-klasterizatsiia-dannykh}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
 								Александр Кожихов, Максим Кузнецов. Обнаружена фундаментальная проблема в реализации, доделывает предположительно [Николай Кочетов](https://github.com/KochetovNicolai). Он может делегировать задачу кому угодно.
-												Update extended_roadmap.md
											
										
										
											2020-04-22 22:02:20 +00:00
+								Исправление фундаментальной проблемы - есть PR.
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 18.2. Агрегатные функции для статистических тестов {#agregatnye-funktsii-dlia-statisticheskikh-testov}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
 								Артём Цыганов, Руденский Константин Игоревич, Семёнов Денис, ВШЭ.
-												Added descriptions to some tasks

											
										
										
											2019-11-20 11:34:23 +00:00
+								Предлагается реализовать в ClickHouse статистические тесты (Analysis of Variance, тесты нормальности распределения и т. п.) в виде агрегатных функций. Пример: `welchTTest(value, sample_idx)`.
-												Update extended-roadmap.md
											
										
										
											2020-07-14 09:28:38 +00:00
+								Сделали прототип двух тестов, есть pull request. Также есть pull request для корелляции рангов.
-												Update roadmap

											
										
										
											2020-03-06 20:50:34 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 18.3. Инфраструктура для тренировки моделей в ClickHouse {#infrastruktura-dlia-trenirovki-modelei-v-clickhouse}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Update extended_roadmap.md
											
										
										
											2020-04-22 22:02:20 +00:00
+								В очереди.
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Update extended-roadmap.md
											
										
										
											2020-05-15 07:07:06 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								## 19. Улучшение работы кластера {#uluchshenie-raboty-klastera}
-												Update roadmap. Also revert digital degradation due to accidential changes with automatic scripts.

											
										
										
											2020-04-13 23:24:33 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 19.1. Параллельные кворумные вставки без линеаризуемости {#parallelnye-kvorumnye-vstavki-bez-linearizuemosti}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Added descriptions to some tasks

											
										
										
											2019-11-20 11:34:23 +00:00
+								Репликация данных в ClickHouse по-умолчанию является асинхронной без выделенного мастера. Это значит, что клиент, осуществляющий вставку данных, получает успешный ответ после того, как данные попали на один сервер; репликация данных по остальным серверам осуществляется в другой момент времени. Это ненадёжно, потому что допускает потерю только что вставленных данных при потере лишь одного сервера.
-												WIP on docs translation/normalization tools (#9783)


											
										
										
											2020-03-20 18:20:59 +00:00
+								Для решения этой проблемы, в ClickHouse есть возможность включить «кворумную» вставку. Это значит, что клиент, осуществляющий вставку данных, получает успешный ответ после того, как данные попали на несколько (кворум) серверов. Обеспечивается линеаризуемость: клиент, получает успешный ответ после того, как данные попали на несколько реплик, *которые содержат все предыдущие данные, вставленные с кворумом* (такие реплики можно называть «синхронными»), и при запросе SELECT можно выставить настройку, разрешающую только чтение с синхронных реплик.
-												Added descriptions to some tasks

											
										
										
											2019-11-20 11:34:23 +00:00
 								Если бы свойства линеаризуемости не было, то для трёх серверов A, B, C, значения кворума = 2, и для трёх вставок данных 1, 2, 3, возможна ситуация, что первая вставка прошла на серверы A и B, вторая прошла на серверы B и C, а третья - на серверы A и C, и теперь ни один из серверов не содержит полный набор данных 1, 2, 3.
 								Как ни странно, такое свойство не нужно большинству пользователей. Оно запрещает параллельно выполняющиеся вставки. А пользователи хотят вставлять данные надёжно (на более чем одну реплику), но не важно, в каком порядке. Предлагается сделать опцию, которая отключает линеаризуемость.
 								Иногда пользователь хочет реализовать кворумную вставку вручную: просто соединиться с несколькими репликами и вставть на них одинаковые данные (чтобы обеспечить надёжную вставку, не ориентируясь на то, как работает механизм репликации). Сейчас ожидания пользователя не оправдываются. В ClickHouse есть механизм дедупликации для обеспечения идемпотентности вставок. Вторая вставка с такими же данными (пусть даже на другую реплику) будет проигнорирована. Надо сделать так, чтобы вместо этого, вставка одинаковых данных на другую реплику, имела такой же эффект, как если бы эти данные были получены с помощью механизма репликации.
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 19.2. Подключение Etcd или Consul как альтернативы ZooKeeper {#podkliuchenie-etcd-ili-consul-kak-alternativy-zookeeper}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
 								Алексей Лёвушкин, ВШЭ и Яндекс.
-												Added descriptions to some tasks

											
										
										
											2019-11-20 11:34:23 +00:00
+								Для координации реплик в ClickHouse используется ZooKeeper. Многие пользователи ClickHouse хотели бы иметь возможность использовать для координации некоторые другие системы вместо ZooKeeper. Рассматриваемыми вариантами таких систем являются Etcd, Consul, FoundationDB. Это весьма проблематично, так как эти системы существенно отличаются по интерфейсам и возможностям. Тем не менее, для того, чтобы эта задача стала возможной, в ClickHouse обобщён интерфейс взаимодействия с ZooKeeper, и теперь на его место можно подставлять другие реализации.
 								В прошлом году, Алексей добавил модельную реализацию (mock) интерфейса ZooKeeper для тестирования. Сейчас предлагается сделать реализацию поверх Etcd, а также расширить возможности тестовой реализации.
-												Update roadmap

											
										
										
											2020-03-06 20:50:34 +00:00
+								Upd. Алексей сделал какой-то вариант, но борется с тем, что ничего не работает.
-												Update extended_roadmap.md
											
										
										
											2020-04-22 22:02:20 +00:00
+								Upd. Есть pull request на начальной стадии.
-												Update roadmap

											
										
										
											2020-03-06 20:50:34 +00:00
-												Update extended-roadmap.md
											
										
										
											2020-06-27 21:11:36 +00:00
+								### 19.3. - Подключение YT Cypress или YDB как альтернативы ZooKeeper {#podkliuchenie-yt-cypress-ili-ydb-kak-alternativy-zookeeper}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Update roadmap

											
										
										
											2020-03-06 20:50:34 +00:00
+								Hold. Полезно для заказчиков внутри Яндекса, но есть риски. Эту задачу никто не будет делать.
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Update extended-roadmap.md
											
										
										
											2020-06-27 21:11:36 +00:00
+								### 19.4. internal_replication = ‘auto’ {#internal-replication-auto}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 19.5. Реплицируемые базы данных {#replitsiruemye-bazy-dannykh}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
 								В очереди, возможно Валерий Батурин, ВШЭ.
-												Added descriptions to some tasks

											
										
										
											2019-11-20 11:34:23 +00:00
+								Репликация в ClickHouse работает на уровне отдельных таблиц. Это является очень гибким решением: на одном сервере одна из таблиц может быть не реплицирована, другая иметь двухкратную репликацию, а третья - реплицирована по всем серверам. Но если все таблицы в базе данных реплицированы одинаковым образом. то это затрудняет управление кластером. Например, при восстановлени сервера, требуется отдельно создавать реплику для каждой таблицы.
-												WIP on docs translation/normalization tools (#9783)


											
										
										
											2020-03-20 18:20:59 +00:00
+								Предлагается реализовать «движок баз данных», который осуществляет репликацию метаданных (множество имеющихся таблиц и лог DDL операций над ними: CREATE, DROP, RENAME, ALTER). Пользователь сможет создать реплицируемую базу данных; при её создании или восстановлении на другом сервере, все реплицируемые таблицы будут созданы автоматически.
-												Added descriptions to some tasks

											
										
										
											2019-11-20 11:34:23 +00:00
-												Update extended-roadmap.md
											
										
										
											2020-06-27 21:11:36 +00:00
+								Upd. Задача в разработке.
-												Update extended-roadmap.md
											
										
										
											2020-06-18 05:00:55 +00:00
+								### 19.6. + Одновременный выбор кусков для слияния многими репликами, отказ от leader election в ZK {#odnovremennyi-vybor-kuskov-dlia-sliianiia-mnogimi-replikami-otkaz-ot-leader-election-v-zk}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Update extended-roadmap.md
											
										
										
											2020-06-18 05:00:55 +00:00
+								Готово.
-												Update extended_roadmap.md
											
										
										
											2020-01-30 10:05:12 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 19.7. Возможность записи данных при недоступности ZK и отказ от линейного порядка кусков в большинстве случаев {#vozmozhnost-zapisi-dannykh-pri-nedostupnosti-zk-i-otkaz-ot-lineinogo-poriadka-kuskov-v-bolshinstve-sluchaev}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 19.8. Отказ от хранения в ZK множества кусков для каждой реплики отдельно {#otkaz-ot-khraneniia-v-zk-mnozhestva-kuskov-dlia-kazhdoi-repliki-otdelno}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 19.9. Отказ от хранения в ZK лога вставок и мержей. Обмен данными о кусках напрямую {#otkaz-ot-khraneniia-v-zk-loga-vstavok-i-merzhei-obmen-dannymi-o-kuskakh-napriamuiu}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Update extended_roadmap.md
											
										
										
											2020-04-22 22:02:20 +00:00
+								Три задачи выше обсуждаются, есть варианты.
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 19.10. Облачные таблицы {#oblachnye-tablitsy}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
 								Требует 1.6, 19.1, 19.6, 19.7, 19.8, 19.9.
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								## 20. Мутации данных {#mutatsii-dannykh}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
 								Пока все задачи по точечным UPDATE/DELETE имеют низкий приоритет, но ожидаем взять в работу в середине 2020.
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 20.1. Поддержка DELETE путём запоминания множества затронутых кусков и ключей {#podderzhka-delete-putiom-zapominaniia-mnozhestva-zatronutykh-kuskov-i-kliuchei}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 20.2. Поддержка DELETE путём преобразования множества ключей в множество row\_numbers на реплике, столбца флагов и индекса по диапазонам {#podderzhka-delete-putiom-preobrazovaniia-mnozhestva-kliuchei-v-mnozhestvo-row-numbers-na-replike-stolbtsa-flagov-i-indeksa-po-diapazonam}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 20.3. Поддержка ленивых DELETE путём запоминания выражений и преобразования к множеству ключей в фоне {#podderzhka-lenivykh-delete-putiom-zapominaniia-vyrazhenii-i-preobrazovaniia-k-mnozhestvu-kliuchei-v-fone}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 20.4. Поддержка UPDATE с помощью преобразования в DELETE и вставок {#podderzhka-update-s-pomoshchiu-preobrazovaniia-v-delete-i-vstavok}
-												Update roadmap. Also revert digital degradation due to accidential changes with automatic scripts.

											
										
										
											2020-04-13 23:24:33 +00:00
-												Update extended-roadmap.md
											
										
										
											2020-05-15 07:07:06 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								## 21. Оптимизации производительности {#optimizatsii-proizvoditelnosti}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 21.1. + Параллельный парсинг форматов {#parallelnyi-parsing-formatov}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Updated roadmap

											
										
										
											2019-12-10 00:13:16 +00:00
+								Начинал Олег Ершов, доделывает Никита Михайлов, помогает [Александр Кузьменков](https://github.com/akuzm). Готово.
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 21.1.1. Избавление от лишнего копирования при параллельном парсинге форматов, если возможен mmap файла целиком {#izbavlenie-ot-lishnego-kopirovaniia-pri-parallelnom-parsinge-formatov-esli-vozmozhen-mmap-faila-tselikom}
-												Update roadmap

											
										
										
											2020-01-18 16:54:56 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 21.2. Параллельное форматирование форматов {#parallelnoe-formatirovanie-formatov}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
 								После 21.1, предположительно Никита Михайлов. Задача сильно проще чем 21.1.
-												Update extended-roadmap.md
											
										
										
											2020-06-18 05:00:55 +00:00
+								В процессе.
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 21.3. + Исправление низкой производительности анализа индекса в случае большого множества в секции IN {#ispravlenie-nizkoi-proizvoditelnosti-analiza-indeksa-v-sluchae-bolshogo-mnozhestva-v-sektsii-in}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												WIP on docs translation/normalization tools (#9783)


											
										
										
											2020-03-20 18:20:59 +00:00
+								Нужно всем (Zen, БК, DataLens, TestEnv…). Антон Попов, Q1/Q2.
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Update roadmap

											
										
										
											2020-03-06 20:50:34 +00:00
+								Upd. Антон делает эту задачу. Большая часть уже реализована.
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 21.4. Использование ORDER BY ключа для оптимизации GROUP BY и DISTINCT {#ispolzovanie-order-by-kliucha-dlia-optimizatsii-group-by-i-distinct}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
 								Дмитрий Рубашкин, ВШЭ. Помогает Антон Попов.
-												Added descriptions to some tasks

											
										
										
											2019-11-20 11:34:23 +00:00
+								Если таблица имеет ключ сортировки, то возможно эффективное чтение упорядоченных данных. Если запрос содержит операцию GROUP BY, содержащую по крайней мере префикс от ключа сортировки таблицы, либо инъективные функции от него, то возможно более эффективное выполнение GROUP BY: промежуточный результат агрегации финализируется и отправляется клиенту как только в потоке данных при чтении из таблицы встретился следующий ключ.
 								Аналогичную оптимизацию следует реализовать для DISTINCT и LIMIT BY.
 								В прошлом году, аналогичное решение сделали для операции ORDER BY.
-												Update extended-roadmap.md
											
										
										
											2020-05-15 07:07:06 +00:00
+								Upd. Есть pull request для GROUP BY. Приличные результаты.
-												Update extended-roadmap.md
											
										
										
											2020-06-18 05:00:55 +00:00
+								Upd. Для GROUP BY готово, в процессе для DISTINCT.
-												Update extended-roadmap.md
											
										
										
											2020-06-27 21:11:36 +00:00
+								Upd. Для DISTINCT есть pull request.
-												Update extended-roadmap.md
											
										
										
											2020-05-15 07:07:06 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 21.5. + Распараллеливание INSERT при INSERT SELECT, если это необходимо {#rasparallelivanie-insert-pri-insert-select-esli-eto-neobkhodimo}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Update extended_roadmap.md
											
										
										
											2019-12-05 02:17:46 +00:00
+								[Vxider](https://github.com/Vxider), ICT
-												Update roadmap

											
										
										
											2020-01-18 16:54:56 +00:00
+								Есть pull request.
-												Update extended_roadmap.md
											
										
										
											2019-12-05 02:17:46 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 21.6. Уменьшение числа потоков для SELECT в случае тривиального INSERT SELECT {#umenshenie-chisla-potokov-dlia-select-v-sluchae-trivialnogo-insert-select}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Update extended-roadmap.md
											
										
										
											2020-07-14 09:28:38 +00:00
+								ucasFL, в разработке.
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 21.7. Кэш результатов запросов {#kesh-rezultatov-zaprosov}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
 								[Achimbab](https://github.com/achimbab).
-												Update roadmap

											
										
										
											2020-03-06 20:50:34 +00:00
+								Есть pull request. Но это не совсем то.
-												Update extended-roadmap.md
											
										
										
											2020-06-27 21:11:36 +00:00
+								Upd. В обсуждении.
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 21.8. Взаимная интеграция аллокатора и кэша {#vzaimnaia-integratsiia-allokatora-i-kesha}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
 								Михаил Кот, ВШЭ. Задача сложная и рискованная.
-												Added descriptions to some tasks

											
										
										
											2019-11-20 11:34:23 +00:00
+								Для выделения памяти, аллокаторы запрашивают её у операционной системы (`mmap`). Это возможно только для достаточно крупных кусков памяти является довольно медленной операцией. Поэтому, современные аллокаторы кэшируют крупные куски памяти в программе. При вызове free, кусок памяти, как правило, не отдаётся ОС, а остаётся для последующего переиспользования. Для выделения мелких кусков памяти, крупные куски разбиваются с помощью специальных структур данных (free-list, heap, bitmap). Для уменьшения contention в многопоточных программах, эти структуры также делаются thread-локальными.
 								Часто в программе есть кэши некоторых данных. Например - кэш данных после разжатия, использующийся чтобы сэкономить на повторных запросах одних и тех же данных. При вытеснении из кэша, блок данных освобождается (`free`) и данные, бывшие в кэше, становятся недоступными для переиспользования. Но если принимать во внимание то, как работает аллокатор памяти, то оказывается, что после освобождения памяти, данные всё ещё остаются доступными в программе. И если этот кусок памяти не будет выделен аллокатором снова, его можно было бы продолжить использовать в качестве кэша. Иными словами, в программе есть domain-specific кэш, а аллокатор имеет свой кэш, и они не знают друг о друге.
 								Для domain-specific кэшей (как например, кэш разжатых данных) выгодно, чтобы они использовали как можно больший объём свободной памяти. Но в этом случае, памяти может не хватить для других структур данных в программе. Если аллокатор памяти знает про кэш, то выделение памяти можно было бы делать путём вытеснения данных из кэша.
-												Update extended-roadmap.md
											
										
										
											2020-06-27 21:11:36 +00:00
+								Upd. Есть нерабочий прототип, скорее всего будет отложено.
-												Update extended-roadmap.md
											
										
										
											2020-07-14 09:28:38 +00:00
+								Upd. Отложено до осени.
-												Update extended-roadmap.md
											
										
										
											2020-06-27 21:11:36 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 21.8.1. Отдельный аллокатор для кэшей с ASLR {#otdelnyi-allokator-dlia-keshei-s-aslr}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Updated roadmap

											
										
										
											2019-11-20 20:55:26 +00:00
+								В прошлом году задачу пытался сделать Данила Кутенин с помощью lfalloc из Аркадии и mimalloc из Microsoft, но оба решения не были квалифицированы для использования в продакшене. Успешная реализация задачи 21.8 отменит необходимость в этой задаче, поэтому холд.
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 21.9. Исправить push-down выражений с помощью Processors {#ispravit-push-down-vyrazhenii-s-pomoshchiu-processors}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
 								[Николай Кочетов](https://github.com/KochetovNicolai). Требует 2.1.
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 21.10. + Улучшение эвристики PREWHERE {#uluchshenie-evristiki-prewhere}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
 								Amos Bird.
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 21.11. Peephole оптимизации запросов {#peephole-optimizatsii-zaprosov}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
 								Руслан Камалов, Михаил Малафеев, Виктор Гришанин, ВШЭ
-												WIP on docs translation/normalization tools (#9783)


											
										
										
											2020-03-20 18:20:59 +00:00
+								Реализовать в ClickHouse оптимизации запросов, основанные на упрощении отдельных небольших кусков выражений (так называемые «peephole» оптимизации). Примеры:
-												Added descriptions to some tasks

											
										
										
											2019-11-20 11:34:23 +00:00
+								- Замена цепочек if на multiIf.
 								- Удаление min/max/any-агрегатов от выражений от ключей GROUP BY.
 								- Вынесение арифметических операций из агрегатных функций;
 								- Вынесение любых функций наружу any, anyLast.
 								- При GROUP BY по transform или if по строкам, замена строк на Enum.
-												Update roadmap

											
										
										
											2020-01-18 16:54:56 +00:00
+								Сделана замена цепочек if на multiIf, но внезапно оказалось, что это является не оптимизацией, а наоборот.
-												Update extended-roadmap.md
											
										
										
											2020-06-18 05:00:55 +00:00
+								Сделано ещё несколько оптимизаций.
-												Update extended-roadmap.md
											
										
										
											2020-06-27 21:11:36 +00:00
+								Upd. Все вышеперечисленные оптимизации доступны в pull requests.
-												Update extended-roadmap.md
											
										
										
											2020-07-14 09:28:38 +00:00
+								Upd. Из них почти все помержены, осталась одна.
-												Update roadmap

											
										
										
											2020-01-18 16:54:56 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 21.12. Алгебраические оптимизации запросов {#algebraicheskie-optimizatsii-zaprosov}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
 								Руслан Камалов, Михаил Малафеев, Виктор Гришанин, ВШЭ
-												Added descriptions to some tasks

											
										
										
											2019-11-20 11:34:23 +00:00
+								Реализовать в ClickHouse оптимизации запросов, основанные на алгебраических свойствах функций. Примеры:
 								- Обращение инъективных функций в сравнениях на равенство.
 								- Вынесение инъективных функцию наружу uniq.
 								- Удаление монотонных функций из ORDER BY.
 								- Удаление избыточных выражений из ORDER BY.
 								- Удаление из GROUP BY функций от других ключей GROUP BY.
 								- Удаление дублирующихся DISTINCT, ORDER BY из подзапросов.
-												Update extended_roadmap.md
											
										
										
											2020-04-22 22:02:20 +00:00
+								Несколько оптимизаций есть в PR.
-												Update extended-roadmap.md
											
										
										
											2020-07-14 09:28:38 +00:00
+								Upd. Все оптимизации кроме "Обращение инъективных функций в сравнениях на равенство" есть в PR.
 								Upd. Из них больше половины помержены, осталось ещё две.
-												Update extended_roadmap.md
											
										
										
											2020-04-22 22:02:20 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 21.13. Fusion агрегатных функций {#fusion-agregatnykh-funktsii}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
 								После или совместно с 21.11.
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 21.14. Оптимизация запросов с помощью constraints {#optimizatsiia-zaprosov-s-pomoshchiu-constraints}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Added descriptions to some tasks

											
										
										
											2019-11-20 11:34:23 +00:00
+								Constraints позволяют задать выражение, истинность которого проверяется при вставке данных в таблицу. Предположение о том, что выражение истинно, может использоваться и для оптимизации запросов. Например, встретив в запросе точно такое же выражение, можно заменить его на константу 1.
 								Если выражение содержит равенство, то встретив в запросе одну из частей равенства, её можно заменить на другую часть равенства, если это сделает проще чтение данных или вычисление выражения. Например, задан constraint: `URLDomain = domain(URL)`. Значит, выражение `domain(URL)` можно заменить на `URLDomain`.
-												Update extended-roadmap.md
											
										
										
											2020-07-14 09:28:38 +00:00
+								Upd. Возможно будет отложено на следующий год.
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 21.15. Многоступенчатое чтение данных вместо PREWHERE {#mnogostupenchatoe-chtenie-dannykh-vmesto-prewhere}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
 								Требует 2.1 и 21.10.
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 21.16. Оптимизация GROUP BY с большим количеством агрегатных функций путём вычисления в два прохода {#optimizatsiia-group-by-s-bolshim-kolichestvom-agregatnykh-funktsii-putiom-vychisleniia-v-dva-prokhoda}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
 								Нужно для БК.
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 21.17. Оптимизация GROUP BY при наличии ORDER BY по тем же ключам с LIMIT {#optimizatsiia-group-by-pri-nalichii-order-by-po-tem-zhe-kliucham-s-limit}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
 								Нужно для БК.
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 21.18. Внутренняя параллелизация мержа больших состояний агрегатных функций {#vnutrenniaia-parallelizatsiia-merzha-bolshikh-sostoianii-agregatnykh-funktsii}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 21.19. Оптимизация сортировки {#optimizatsiia-sortirovki}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
 								Василий Морозов, Арслан Гумеров, Альберт Кидрачев, ВШЭ.
-												Updated roadmap

											
										
										
											2019-11-20 20:55:26 +00:00
+								В прошлом году задачу начинал делать другой человек, но не добился достаточного прогресса.
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Update extended-roadmap.md
											
										
										
											2020-05-28 21:22:18 +00:00
+								+ 1.  Оптимизация top sort.
-												Added descriptions to some tasks

											
										
										
											2019-11-20 11:34:23 +00:00
 								В ClickHouse используется неоптимальный вариант top sort. Суть его в том, что из каждого блока достаётся top N записей, а затем, все блоки мержатся. Но доставание top N записей у каждого следующего блока бессмысленно, если мы знаем, что из них в глобальный top N войдёт меньше. Конечно нужно реализовать вариацию на тему priority queue (heap) с быстрым пропуском целых блоков, если ни одна строка не попадёт в накопленный top.
-												Update extended-roadmap.md
											
										
										
											2020-05-28 21:22:18 +00:00
+								+ 2.  Рекурсивный вариант сортировки по кортежам.
-												Added descriptions to some tasks

											
										
										
											2019-11-20 11:34:23 +00:00
-												WIP on docs translation/normalization tools (#9783)


											
										
										
											2020-03-20 18:20:59 +00:00
+								Для сортировки по кортежам используется обычная сортировка с компаратором, который в цикле по элементам кортежа делает виртуальные вызовы `IColumn::compareAt`. Это неоптимально - как из-за короткого цикла по неизвестному в compile-time количеству элементов, так и из-за виртуальных вызовов. Чтобы обойтись без виртуальных вызовов, есть метод `IColumn::getPermutation`. Он используется в случае сортировки по одному столбцу. Есть вариант, что в случае сортировки по кортежу, что-то похожее тоже можно применить… например, сделать метод `updatePermutation`, принимающий аргументы offset и limit, и допереставляющий перестановку в диапазоне значений, в которых предыдущий столбец имел равные значения.
-												Added descriptions to some tasks

											
										
										
											2019-11-20 11:34:23 +00:00
-												Update extended-roadmap.md
											
										
										
											2020-05-15 07:07:06 +00:00
+.  RadixSort для сортировки.
-												Added descriptions to some tasks

											
										
										
											2019-11-20 11:34:23 +00:00
 								Один наш знакомый начал делать задачу по попытке использования RadixSort для сортировки столбцов. Был сделан вариант indirect сортировки (для `getPermutation`), но не оптимизирован до конца - есть лишние ненужные перекладывания элементов. Для того, чтобы его оптимизировать, придётся добавить немного шаблонной магии (на последнем шаге что-то не копировать, вместо перекладывания индексов - складывать их в готовое место). Также этот человек добавил метод MSD Radix Sort для реализации radix partial sort. Но даже не проверил производительность.
-												WIP on docs translation/normalization tools (#9783)


											
										
										
											2020-03-20 18:20:59 +00:00
+								Наиболее содержательная часть задачи может состоять в применении Radix Sort для сортировки кортежей, расположенных в оперативке в виде Structure Of Arrays неизвестного в compile-time размера. Это может работать хуже, чем то, что описано в пункте 2… Но попробовать не помешает.
-												Added descriptions to some tasks

											
										
										
											2019-11-20 11:34:23 +00:00
-												Update extended-roadmap.md
											
										
										
											2020-05-15 07:07:06 +00:00
+.  Three-way comparison sort.
-												Added descriptions to some tasks

											
										
										
											2019-11-20 11:34:23 +00:00
 								Виртуальный метод `compareAt` возвращает -1, 0, 1. Но алгоритмы сортировки сравнениями обычно рассчитаны на `operator<` и не могут получить преимущества от three-way comparison. А можно ли написать так, чтобы преимущество было?
-												Update extended-roadmap.md
											
										
										
											2020-05-15 07:07:06 +00:00
+.  pdq partial sort
-												Added descriptions to some tasks

											
										
										
											2019-11-20 11:34:23 +00:00
-												Update extended-roadmap.md
											
										
										
											2020-06-27 21:11:36 +00:00
+								Хороший алгоритм сортировки сравнениями `pdqsort` не имеет варианта partial sort. Заметим, что на практике, почти все сортировки в запросах ClickHouse являются partial_sort, так как `ORDER BY` почти всегда идёт с `LIMIT`. Кстати, Данила Кутенин уже попробовал это и показал, что в тривиальном случае преимущества нет. Но не очевидно, что нельзя сделать лучше.
-												Added descriptions to some tasks

											
										
										
											2019-11-20 11:34:23 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 21.20. Использование материализованных представлений для оптимизации запросов {#ispolzovanie-materializovannykh-predstavlenii-dlia-optimizatsii-zaprosov}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
 								В ByteDance есть готовая реализация, но они её боятся из-за, возможно, низкого качества кода.
-												Update extended-roadmap.md
											
										
										
											2020-07-14 09:28:38 +00:00
+								Upd. Вместо этого будем делать задачу 1.16.
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 21.21. + Чтение больших файлов с помощью mmap {#chtenie-bolshikh-failov-s-pomoshchiu-mmap}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Update roadmap

											
										
										
											2020-01-18 16:54:56 +00:00
+								Сделан вариант, но достаточно топорный. Без тестирования в продакшене включать по-умолчанию нельзя.
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 21.22. Userspace page cache {#userspace-page-cache}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
 								Требует 21.8.
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 21.23. Ускорение работы с вторичными индексами {#uskorenie-raboty-s-vtorichnymi-indeksami}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
 								zhang2014.
-												Update roadmap

											
										
										
											2020-01-18 16:54:56 +00:00
+								Есть pull request.
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Update extended-roadmap.md
											
										
										
											2020-05-15 07:07:06 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								## 22. Долги и недоделанные возможности {#dolgi-i-nedodelannye-vozmozhnosti}
-												Update roadmap. Also revert digital degradation due to accidential changes with automatic scripts.

											
										
										
											2020-04-13 23:24:33 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 22.1. + Исправление неработающих таймаутов, если используется TLS {#ispravlenie-nerabotaiushchikh-taimautov-esli-ispolzuetsia-tls}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Update extended_roadmap.md
											
										
										
											2019-12-11 02:50:11 +00:00
+								Нужно для Яндекс.Облака. Сделал Алексей Миловидов.
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 22.2. + Убрать возможность изменить настройки в native протоколе в случае readonly {#ubrat-vozmozhnost-izmenit-nastroiki-v-native-protokole-v-sluchae-readonly}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Update roadmap

											
										
										
											2020-01-18 16:54:56 +00:00
+								N.Vartolomei.
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Update extended-roadmap.md
											
										
										
											2020-05-15 07:07:06 +00:00
+								### 22.3. + Защита от абсурдно заданных пользователем кодеков {#zashchita-ot-absurdno-zadannykh-polzovatelem-kodekov}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 22.4. + Исправление оставшихся deadlocks в табличных RWLock-ах {#ispravlenie-ostavshikhsia-deadlocks-v-tablichnykh-rwlock-akh}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Update roadmap

											
										
										
											2020-01-18 16:54:56 +00:00
+								Александр Казаков. Нужно для Яндекс.Метрики и Datalens. Задача постепенно тащится и исправлениями в соседних местах стала менее актуальна.
 								В Q1 будет сделана или отменена с учётом 1.2. и 1.3.
-												Update roadmap. Also revert digital degradation due to accidential changes with automatic scripts.

											
										
										
											2020-04-13 23:24:33 +00:00
+								Upd. Добавили таймауты.
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 22.5. + Исправление редких срабатываний TSan в stress тестах в CI {#ispravlenie-redkikh-srabatyvanii-tsan-v-stress-testakh-v-ci}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Update roadmap

											
										
										
											2020-03-06 20:50:34 +00:00
+								Александр Казаков сделал эту задачу.
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 22.6. + Изменение только DEFAULT в ALTER TABLE может поменять тип столбца {#izmenenie-tolko-default-v-alter-table-mozhet-pomeniat-tip-stolbtsa}
-												Update roadmap

											
										
										
											2020-03-06 20:50:34 +00:00
 								Александр Сапин сделал эту задачу.
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 22.7. + Row-Level Security не работает в случае наличия в запросе IN подзапросов {#row-level-security-ne-rabotaet-v-sluchae-nalichiia-v-zaprose-in-podzaprosov}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Update roadmap

											
										
										
											2020-01-18 16:54:56 +00:00
+								Нужно для Метрики. Иван Лежанкин.
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 22.8. + Исправить десериализацию параметров для параметризованных запросов {#ispravit-deserializatsiiu-parametrov-dlia-parametrizovannykh-zaprosov}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
 								Хотел исправить Василий Немков, Altinity, но есть маленькие затруднения, наверное переделает Алексей Миловидов.
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 22.9. Разобраться с десериализацией массивов со значениями по-умолчанию в Protobuf формате в случае protobuf 3 {#razobratsia-s-deserializatsiei-massivov-so-znacheniiami-po-umolchaniiu-v-protobuf-formate-v-sluchae-protobuf-3}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
 								[Виталий Баранов](https://github.com/vitlibar). Возможно, это - фундаментальная проблема и следует её только документировать.
-												Update roadmap

											
										
										
											2020-01-18 16:54:56 +00:00
+								Кажется, отменяем, но пока ещё не всё ясно.
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 22.10. + Исправление дрифта при отслеживании потребления памяти запросами {#ispravlenie-drifta-pri-otslezhivanii-potrebleniia-pamiati-zaprosami}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
 								Требует 6.3., но можно улучшить отдельными хаками. Нужно Метрике и БК.
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 22.11. + Более простая ser/de настроек запросов {#bolee-prostaia-serde-nastroek-zaprosov}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Updated roadmap

											
										
										
											2019-12-10 00:13:16 +00:00
+								И пропуск неизвестных настроек. Важно для Метрики для упрощения апгрейда без изменения конфига.
 								[Виталий Баранов](https://github.com/vitlibar), готово.
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 22.12. + Исправление низкой производительности чтения из Kafka {#ispravlenie-nizkoi-proizvoditelnosti-chteniia-iz-kafka}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Updated roadmap

											
										
										
											2019-11-20 20:55:26 +00:00
+								Для ClickHouse нехарактерно наличие кода, обладающего столь низкой производительностью. Практики разработки не подразумевают, что такой код должен попасть в продакшен без надлежащего тестирования производительности.
-												Updated roadmap

											
										
										
											2019-12-10 00:13:16 +00:00
+								Изначально было назначено на [Ивана Лежанкина](https://github.com/abyss7), но по неизвестной причине было не сделано в течение нескольких месяцев.
 								Сделал Михаил Филимонов, Altinity.
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 22.13. + Посмотреть, почему не работают некоторые collations {#posmotret-pochemu-ne-rabotaiut-nekotorye-collations}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Updated roadmap

											
										
										
											2019-12-10 00:13:16 +00:00
+								Изначально было назначено на [Ивана Лежанкина](https://github.com/abyss7), но в результате сделал Александр Сапин.
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 22.14. + Посмотреть, почему не работает StorageSet для MergeTree таблиц при некоторых условиях {#posmotret-pochemu-ne-rabotaet-storageset-dlia-mergetree-tablits-pri-nekotorykh-usloviiakh}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Update extended_roadmap.md
											
										
										
											2019-12-11 02:50:11 +00:00
+								Вроде бы сделал Никита Михайлов - проверить существующие issues на эту тему.
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 22.15. Нормализация коммитов в Kafka и идемпотентности операций {#normalizatsiia-kommitov-v-kafka-i-idempotentnosti-operatsii}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Update extended_roadmap.md
											
										
										
											2019-12-13 19:16:23 +00:00
+								Altinity.
-												Update extended-roadmap.md
											
										
										
											2020-07-14 09:28:38 +00:00
+								Я не в курсе, какой статус.
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 22.16. + Исправление низкой производительности кодека DoubleDelta {#ispravlenie-nizkoi-proizvoditelnosti-kodeka-doubledelta}
-												Updated roadmap

											
										
										
											2019-11-20 20:55:26 +00:00
-												Updated roadmap

											
										
										
											2019-12-10 00:13:16 +00:00
+								Василий Немков, Altinity - в процессе.
-												Update extended-roadmap.md
											
										
										
											2020-07-14 09:28:38 +00:00
+								Upd. Готово.
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 22.17. Консистентно работающий POPULATE для MaterializedView {#konsistentno-rabotaiushchii-populate-dlia-materializedview}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 22.18. Исправление заметного падения производительности форматов после добавления доменов типов {#ispravlenie-zametnogo-padeniia-proizvoditelnosti-formatov-posle-dobavleniia-domenov-tipov}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
 								Василий Немков, Altinity.
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 22.19. + Одновременное использование SAMPLE и PREWHERE {#odnovremennoe-ispolzovanie-sample-i-prewhere}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
 								Нужно для Метрики. [Николай Кочетов](https://github.com/KochetovNicolai), ноябрь 2019.
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 22.20. + Неправильная работа PREWHERE при некоторых условиях {#nepravilnaia-rabota-prewhere-pri-nekotorykh-usloviiakh}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
 								[Николай Кочетов](https://github.com/KochetovNicolai), декабрь 2019.
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 22.21. + Неправильное поведение DateTime в районе начала unix epoch {#nepravilnoe-povedenie-datetime-v-raione-nachala-unix-epoch}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
 								Алексей Миловидов.
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 22.22. Nullable в функции transform и в CASE по множеству значений {#nullable-v-funktsii-transform-i-v-case-po-mnozhestvu-znachenii}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
 								После 10.14.
-												WIP on docs translation/normalization tools (#9783)


											
										
										
											2020-03-20 18:20:59 +00:00
+								[\#7237](https://github.com/ClickHouse/ClickHouse/issues/7237)
 								[\#2655](https://github.com/ClickHouse/ClickHouse/issues/2655)
-												Updated roadmap

											
										
										
											2019-12-02 22:38:07 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 22.23. Правильная обработка Nullable в функциях, которые кидают исключение на default значении: modulo, intDiv {#pravilnaia-obrabotka-nullable-v-funktsiiakh-kotorye-kidaiut-iskliuchenie-na-default-znachenii-modulo-intdiv}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Update extended-roadmap.md
											
										
										
											2020-06-27 21:11:36 +00:00
+								### 22.24. + Излишняя фильтрация ODBC connection string {#izlishniaia-filtratsiia-odbc-connection-string}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
 								Нужно для Метрики. Алексей Миловидов.
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 22.25. Избавиться от библиотеки btrie {#izbavitsia-ot-biblioteki-btrie}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
 								Алексей Миловидов. Низкий приоритет.
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 22.26. Плохая производительность quantileTDigest {#plokhaia-proizvoditelnost-quantiletdigest}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												WIP on docs translation/normalization tools (#9783)


											
										
										
											2020-03-20 18:20:59 +00:00
+								[\#2668](https://github.com/ClickHouse/ClickHouse/issues/2668)
-												update roadmap

											
										
										
											2020-02-14 14:31:29 +00:00
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
+								Алексей Миловидов или будет переназначено.
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 22.27. Проверить несколько PR, которые были закрыты zhang2014 и sundy-li {#proverit-neskolko-pr-kotorye-byli-zakryty-zhang2014-i-sundy-li}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
 								Алексей Миловидов.
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 22.28. Изучить и исправить поведение работы с Kafka при ребалансировке {#izuchit-i-ispravit-povedenie-raboty-s-kafka-pri-rebalansirovke}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Update extended_roadmap.md
											
										
										
											2019-12-13 19:16:23 +00:00
+								Altinity.
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 22.29. + Уязвимость DDL для словарей executable {#uiazvimost-ddl-dlia-slovarei-executable}
-												Updated roadmap

											
										
										
											2019-12-10 00:13:16 +00:00
 								[Александр Сапин](https://github.com/alesapin)
-												Update extended-roadmap.md
											
										
										
											2020-05-15 07:07:06 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								## 23. Default Festival {#default-festival}
-												Update roadmap. Also revert digital degradation due to accidential changes with automatic scripts.

											
										
										
											2020-04-13 23:24:33 +00:00
-												Update extended-roadmap.md
											
										
										
											2020-07-14 09:28:38 +00:00
+								### 23.1. + Включение minimalistic_part_header в ZooKeeper {#vkliuchenie-minimalistic-part-header-v-zookeeper}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
 								Сильно уменьшает объём данных в ZooKeeper. Уже год в продакшене в Яндекс.Метрике.
 								Алексей Миловидов, ноябрь 2019.
-												Update extended-roadmap.md
											
										
										
											2020-07-14 09:28:38 +00:00
+								### 23.2. Включение distributed_aggregation_memory_efficient {#vkliuchenie-distributed-aggregation-memory-efficient}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
 								Есть риски меньшей производительности лёгких запросов, хотя производительность тяжёлых запросов всегда увеличивается.
-												Update extended-roadmap.md
											
										
										
											2020-07-14 09:28:38 +00:00
+								### 23.3. Включение min_bytes_to_external_sort и min_bytes_to_external_group_by {#vkliuchenie-min-bytes-to-external-sort-i-min-bytes-to-external-group-by}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
 								Желательно 5.2. и 13.1.
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 23.4. Включение синхронной записи в Distributed таблицы по-умолчанию {#vkliuchenie-sinkhronnoi-zapisi-v-distributed-tablitsy-po-umolchaniiu}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
 								Есть гипотеза, что плохо работает на очень больших кластерах.
-												Update extended-roadmap.md
											
										
										
											2020-07-14 09:28:38 +00:00
+								### 23.5. Включение compile_expressions {#vkliuchenie-compile-expressions}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Updated roadmap

											
										
										
											2019-11-20 20:55:26 +00:00
+								Требует 7.2. Задачу изначально на 99% сделал Денис Скоробогатов, ВШЭ и Яндекс. Остальной процент доделывал Алексей Миловидов, а затем [Александр Сапин](https://github.com/alesapin).
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Update extended-roadmap.md
											
										
										
											2020-07-14 09:28:38 +00:00
+								### 23.6. + Включение учёта порядка столбцов в CSV {#vkliuchenie-uchiota-poriadka-stolbtsov-v-csv}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
 								Просто аккуратно включить.
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 23.7. Включение NULL as Default в CSV {#vkliuchenie-null-as-default-v-csv}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
 								Просто аккуратно включить.
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 23.8. + Включение оптимизации VALUES {#vkliuchenie-optimizatsii-values}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
 								Просто аккуратно включить.
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 23.9. + Включение Processors {#vkliuchenie-processors}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Update roadmap

											
										
										
											2020-01-18 16:54:56 +00:00
+								Q1. [Николай Кочетов](https://github.com/KochetovNicolai).
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Update extended-roadmap.md
											
										
										
											2020-06-18 05:00:55 +00:00
+								### 23.10. + Включение mlock бинарника {#vkliuchenie-mlock-binarnika}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												WIP on docs translation/normalization tools (#9783)


											
										
										
											2020-03-20 18:20:59 +00:00
+								Возможность mlock бинарника сделал Олег Алексеенков [\#3553](https://github.com/ClickHouse/ClickHouse/pull/3553)
 								. Поможет, когда на серверах кроме ClickHouse работает много посторонних программ (мы иногда называем их в шутку «треш-программами»).
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Update extended-roadmap.md
											
										
										
											2020-05-15 07:07:06 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								## 24. Экспериментальные задачи {#eksperimentalnye-zadachi}
-												Update roadmap. Also revert digital degradation due to accidential changes with automatic scripts.

											
										
										
											2020-04-13 23:24:33 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 24.1. Веб-интерфейс для просмотра состояния кластера и профилирования запросов {#veb-interfeis-dlia-prosmotra-sostoianiia-klastera-i-profilirovaniia-zaprosov}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
 								Антон Мамонов, УрФУ, Яндекс.
-												Added descriptions to some tasks

											
										
										
											2019-11-20 11:34:23 +00:00
+								Внутри ClickHouse есть богатые возможности по интроспекции и профилированию. Эти возможности доступны через системные таблицы и использовать их приходится путём формулирования SQL запросов. Это неудобно.
 								Вместо этого предлагается сделать, чтобы ClickHouse отдавал HTML страницу, реализующую интерактивный web-интерфейс со следующими возможностями:
 								- отображение состояния кластеров (какие кластеры известны, статус каждого сервера);
 								- графики нагрузки текущего сервера или выбранного сервера кластера;
 								- обновляемый список запросов;
 								- просмотр лога запросов с наиболее востребованными фильтрациями по одной кнопке;
 								- просмотр лога на кластере, например - последние ошибки;
 								- просмотр метрик использования ресурсов, flame graph и pprof-граф для выбранных запросов;
 								- отчёт по использованию кластера (пример: количество ядер CPU по пользователям за сегодня).
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 24.2. Экспериментальные алгоритмы сжатия {#eksperimentalnye-algoritmy-szhatiia}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Added descriptions to some tasks

											
										
										
											2019-11-20 11:34:23 +00:00
+								ClickHouse поддерживает LZ4 и ZSTD для сжатия данных. Эти алгоритмы являются парето-оптимальными по соотношению скорости и коэффициентам сжатия среди достаточно известных. Тем не менее, существуют менее известные алгоритмы сжатия, которые могут превзойти их по какому-либо критерию. Из потенциально более быстрых по сравнимом коэффициенте сжатия: Lizard, LZSSE, density. Из более сильных: bsc и csc. Необходимо изучить эти алгоритмы, добавить их поддержку в ClickHouse и исследовать их работу на тестовых датасетах.
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 24.3. Экспериментальные кодеки {#eksperimentalnye-kodeki}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Added descriptions to some tasks

											
										
										
											2019-11-20 11:34:23 +00:00
+								Существуют специализированные алгоритмы кодирования числовых последовательностей: Group VarInt, MaskedVByte, PFOR. Необходимо изучить наиболее эффективные реализации этих алгоритмов. Примеры вы сможете найти на https://github.com/lemire и https://github.com/powturbo/ а также https://github.com/schizofreny/middle-out
 								Внедрить их в ClickHouse в виде кодеков и изучить их работу на тестовых датасетах.
-												Update extended-roadmap.md
											
										
										
											2020-07-14 09:28:38 +00:00
+								Upd. Есть два pull requests в начальной стадии, отложено.
-												Update extended-roadmap.md
											
										
										
											2020-06-27 21:11:36 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 24.4. Шифрование в ClickHouse на уровне VFS {#shifrovanie-v-clickhouse-na-urovne-vfs}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Added descriptions to some tasks

											
										
										
											2019-11-20 11:34:23 +00:00
+								Данные в ClickHouse хранятся без шифрования. При наличии доступа к дискам, злоумышленник может прочитать данные. Предлагается реализовать два подхода к шифрованию:
-												WIP on docs translation/normalization tools (#9783)


											
										
										
											2020-03-20 18:20:59 +00:00
+.  Шифрование на уровне VFS.
-												Added descriptions to some tasks

											
										
										
											2019-11-20 11:34:23 +00:00
-												Update extended_roadmap.md
											
										
										
											2020-04-22 22:02:20 +00:00
+								Обсуждаются детали реализации. Q3/Q4.
-												Update extended-roadmap.md
											
										
										
											2020-06-27 21:11:36 +00:00
+								Виталий Баранов.
-												Update extended_roadmap.md
											
										
										
											2020-04-22 22:02:20 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 24.5. Поддержка функций шифрования для отдельных значений {#podderzhka-funktsii-shifrovaniia-dlia-otdelnykh-znachenii}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Added descriptions to some tasks

											
										
										
											2019-11-20 11:34:23 +00:00
+								Смотрите также 24.5.
-												Fixed roadmap that @blinkov accidentially corrupted.
											
										
										
											2020-05-09 00:27:45 +00:00
+.  Шифрование отдельных значений.
-												[experimental] add "es" docs language as machine translated draft (#9787)

* replace exit with assert in test_single_page

* improve save_raw_single_page docs option

* More grammar fixes

* "Built from" link in new tab

* fix mistype

* Example of include in docs

* add anchor to meeting form

* Draft of translation helper

* WIP on translation helper

* Replace some fa docs content with machine translation

* add normalize-en-markdown.sh

* normalize some en markdown

* normalize some en markdown

* admonition support

* normalize

* normalize

* normalize

* support wide tables

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* lightly edited machine translation of introdpection.md

* lightly edited machhine translation of lazy.md

* WIP on translation utils

* Normalize ru docs

* Normalize other languages

* some fixes

* WIP on normalize/translate tools

* add requirements.txt

* [experimental] add es docs language as machine translated draft

* remove duplicate script

* Back to wider tab-stop (narrow renders not so well)
											
										
										
											2020-03-21 04:11:51 +00:00
+								    Для этого требуется реализовать функции шифрования и расшифрования, доступные из SQL. Для шифрования реализовать возможность добавления нужного количества случайных бит для исключения одинаковых зашифрованных значений на одинаковых данных. Это позволит реализовать возможность «забывания» данных без удаления строк таблицы: можно шифровать данные разных клиентов разными ключами, и для того, чтобы забыть данные одного клиента, потребуется всего лишь удалить ключ.
-												Assign some tasks to Altinity
											
										
										
											2020-05-09 00:18:30 +00:00
-												Update extended-roadmap.md
											
										
										
											2020-07-14 09:28:38 +00:00
+								Делает Василий Немков, Altinity
-												Added descriptions to some tasks

											
										
										
											2019-11-20 11:34:23 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 24.6. Userspace RAID {#userspace-raid}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
 								Глеб Новиков, ВШЭ.
-												Added descriptions to some tasks

											
										
										
											2019-11-20 11:34:23 +00:00
+								RAID позволяет одновременно увеличить надёжность хранения данных на дисках и увеличить скорость работы дискового массива. Обычно RAID настраивается с помощью встроенных возможностей ядра Linux (mdraid) или с помощью hardware контроллера. У этого есть следующие ограничения:
-												WIP on docs translation/normalization tools (#9783)


											
										
										
											2020-03-20 18:20:59 +00:00
+.  Иногда (в облачной инфраструктуре некоторых компаний) сервер предоставляется с отдельными дисками, подмонтированными в виде отдельных разделов (JBOD), без возможности создания RAID.
-												Added descriptions to some tasks

											
										
										
											2019-11-20 11:34:23 +00:00
-												WIP on docs translation/normalization tools (#9783)


											
										
										
											2020-03-20 18:20:59 +00:00
+.  В ClickHouse для обеспечения избыточности обычно используется репликация между серверами. Но при восстановлении одного из дисков RAID не используются данные с реплик, а в случае отказа одного из дисков в RAID-0, приходится передавать с реплики все данные, а не только данные, соответствующие одному из дисков. Это происходит, потому что RAID не интегрирован в ClickHouse и «не знает» про его особенности.
-												Added descriptions to some tasks

											
										
										
											2019-11-20 11:34:23 +00:00
-												WIP on docs translation/normalization tools (#9783)


											
										
										
											2020-03-20 18:20:59 +00:00
+.  Отсутствуют продвинутые варианты обеспечения избыточности, как например, LRC.
-												Added descriptions to some tasks

											
										
										
											2019-11-20 11:34:23 +00:00
 								Для преодоления этих ограничений, предлагается реализовать в ClickHouse встроенный алгоритм расположения данных на дисках.
-												Update extended-roadmap.md
											
										
										
											2020-06-18 05:00:55 +00:00
+								Есть pull request на начальной стадии.
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 24.7. Вероятностные структуры данных для фильтрации по подзапросам {#veroiatnostnye-struktury-dannykh-dlia-filtratsii-po-podzaprosam}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
 								Рузель Ибрагимов, ВШЭ и Яндекс.
-												Added descriptions to some tasks

											
										
										
											2019-11-20 11:34:23 +00:00
+								Частой задачей является выполнение запроса с фильтрацией по множеству, полученному по подзапросу. Пример: найти пользователей, которые заходили на сайт сегодня и заходили неделю назад. Это выражается в виде запроса: `SELECT UserID FROM table WHERE EventDate = today() AND UserID IN (SELECT ...)`. При выполнении этого запроса, сначала выполняется подзапрос в правой части `IN` и формируется хэш-таблица в оперативке; затем эта хэш-таблица используется для фильтрации.
 								Иногда объём данных достаточно большой, и хэш-таблица не помещается в оперативку. В этом случае можно рассмотреть в качестве варианта приближённый рассчёт: найти пользователей, которые заходили на сайт сегодня и наверное заходили неделю назад. Для этого можно вместо хэш-таблицы использовать Bloom Filter. Другая задача: найти пользователей, которые встречались, скорее всего, не менее некоторого количества раз. Для этого можно использовать Counting Bloom Filter. Также следует изучить структуры данных Quotient Filter и Cuckoo Filer, а ещё - секретный алгоритм Chaotic Map от Андрея Плахова.
 								Предлагается реализовать это в языке запросов ClickHouse с помощью специального синтаксиса, например `x IN BLOOM FILTER (n, m) (SELECT ...)`.
-												Update extended-roadmap.md
											
										
										
											2020-06-18 05:00:55 +00:00
+								Есть pull request на стадии работающего прототипа.
-												Update extended-roadmap.md
											
										
										
											2020-06-27 21:11:36 +00:00
+								### 24.8. + Специализация векторизованного кода для AVX/AVX2/AVX512 и ARM NEON {#spetsializatsiia-vektorizovannogo-koda-dlia-avxavx2avx512-i-arm-neon}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												WIP on docs translation/normalization tools (#9783)


											
										
										
											2020-03-20 18:20:59 +00:00
+								[\#1017](https://github.com/ClickHouse/ClickHouse/issues/1017)
-												update roadmap

											
										
										
											2020-02-14 14:31:29 +00:00
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
+								Дмитрий Ковальков, ВШЭ и Яндекс.
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								Подавляющее большинство кода ClickHouse написана для x86\_64 с набором инструкций до SSE 4.2 включительно. Лишь отдельные редкие функции поддерживают AVX/AVX2/AVX512 с динамической диспетчеризацией.
-												Added descriptions to some tasks

											
										
										
											2019-11-20 11:34:23 +00:00
 								В первой части задачи, следует добавить в ClickHouse реализации некоторых примитивов, оптимизированные под более новый набор инструкций. Например, AVX2 реализацию генератора случайных чисел pcg: https://github.com/lemire/simdpcg
 								Во второй части задачи, предлагается адаптировать существующие куски кода, использующие SSE intrinsics на AVX/AVX2 и сравнить производительность. Также рассматривается оптимизация под ARM NEON.
-												Update extended-roadmap.md
											
										
										
											2020-06-27 21:11:36 +00:00
+								### 24.9. + Общий подход к CPU dispatching в фабрике функций {#obshchii-podkhod-k-cpu-dispatching-v-fabrike-funktsii}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
 								Дмитрий Ковальков, ВШЭ и Яндекс.
-												Added descriptions to some tasks

											
										
										
											2019-11-20 11:34:23 +00:00
+								Продолжение 24.8.
-												Update extended-roadmap.md
											
										
										
											2020-06-27 21:11:36 +00:00
+								Upd. Есть pull request. В стадии ревью. Готово.
-												Update roadmap. Also revert digital degradation due to accidential changes with automatic scripts.

											
										
										
											2020-04-13 23:24:33 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 24.10. Поддержка типов half/bfloat16/unum {#podderzhka-tipov-halfbfloat16unum}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												WIP on docs translation/normalization tools (#9783)


											
										
										
											2020-03-20 18:20:59 +00:00
+								[\#7657](https://github.com/ClickHouse/ClickHouse/issues/7657)
-												update roadmap

											
										
										
											2020-02-14 14:31:29 +00:00
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
+								Рустам Гусейн-заде, ВШЭ.
-												Update extended-roadmap.md
											
										
										
											2020-06-18 05:00:55 +00:00
+								Есть pull request на промежуточной стадии.
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 24.11. User Defined Functions {#user-defined-functions}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
 								Игорь Минеев, ВШЭ.
-												Added descriptions to some tasks

											
										
										
											2019-11-20 11:34:23 +00:00
+								ClickHouse предоставляет достаточно богатый набор встроенных функций языка запросов, но не позволяет пользователю добавлять свои функции без редактировния исходников и перекомпиляции системы. Это мотивировано следующими потенциальными проблемами:
-												WIP on docs translation/normalization tools (#9783)


											
										
										
											2020-03-20 18:20:59 +00:00
+.  ClickHouse является array-oriented системой, и все функции внутри кода принимают для обработки целые массивы, а не отдельные значения. Это усложняет внутренний интерфейс и делает его менее удобным для пользователя.
 .  Предоставление возможности подключения UDF в виде shared библиотек, потребовало бы фиксировать этот интерфейс или поддерживать обратную совместимость, тогда как мы бы хотели, при разработке ClickHouse, менять этот интерфейс по своему усмотрению без оглядки.
 .  Сложность внутренних структур данных повышает вероятность ошибок типа buffer overflow и повреждения памяти, что сильно затруднит сопровождение ClickHouse с пользовательскими функциями.
-												Added descriptions to some tasks

											
										
										
											2019-11-20 11:34:23 +00:00
 								Тем не менее, можно выбрать более аккуратный подход, избегающий непосредственной линковки с shared библиотеками.
 								Сначала можно реализовать поддержку UDF в виде выражений, составленных из простых функций ClickHouse. В ClickHouse есть встроенная кодогенерация на LLVM, что позволит таким функциям работать весьма эффективно. Но этот подход весьма ограничен и поэтому не является исчерпывающим.
 								Затем предлагается реализовать поддержку UDF в виде исходников на C++, которые компилируются в runtime, с использованием заголовочных файлов ClickHouse. Требование компиляции из исходников вместо shared библиотек, позволит ослабить необходимость в поддержке совместимости ABI.
 								Для безопасности, потребуется исследовать возможность размещения буферов данных в shared memory для выполнения UDF в отдельных процессах с изоляцией по памяти. Возможно, для этого пригодится интеграция с Apache Arrow.
 								Также рассматривается возможность написания UDF на Rust, а также использование Web Assembly. Отдельно можно рассмотреть подключение NumPy и R и других технологий, которые предоставляют операции над целыми массивами.
-												Update extended-roadmap.md
											
										
										
											2020-06-18 05:00:55 +00:00
+								Upd. В работе два варианта реализации UDF.
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 24.12. GPU offloading {#gpu-offloading}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
 								Риск состоит в том, что даже известные GPU базы, такие как OmniSci, работают медленнее, чем ClickHouse.
 								Преимущество возможно только на полной сортировке и JOIN.
 								Алексей Соловей, nVidia и Рита Коннова, ВШЭ.
-												Added descriptions to some tasks

											
										
										
											2019-11-20 11:34:23 +00:00
+								В компании nVidia сделали прототип offloading вычисления GROUP BY с некоторыми из агрегатных функций в ClickHouse и обещат предоставить исходники в публичный доступ для дальнейшего развития. Предлагается изучить этот прототип и расширить его применимость для более широкого сценария использования. В качестве альтернативы, предлагается изучить исходные коды системы `OmniSci` или `Alenka` или библиотеку `CUB` https://nvlabs.github.io/cub/ и применить некоторые из алгоритмов в ClickHouse.
-												Update roadmap

											
										
										
											2020-03-06 20:50:34 +00:00
+								Upd. В компании nVidia выложили прототип, теперь нужна интеграция в систему сборки.
-												Update roadmap. Also revert digital degradation due to accidential changes with automatic scripts.

											
										
										
											2020-04-13 23:24:33 +00:00
+								Upd. Интеграция в систему сборки - Иван Лежанкин.
-												Update extended_roadmap.md
											
										
										
											2020-04-22 22:02:20 +00:00
+								Upd. Есть прототип bitonic sort.
-												Update extended-roadmap.md
											
										
										
											2020-05-15 07:07:06 +00:00
+								Upd. Прототип bitonic sort помержен, но целесообразность под вопросом (он работает медленнее).
 								Наверное надо будет подержать и удалить.
-												Update roadmap

											
										
										
											2020-03-06 20:50:34 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 24.13. Stream запросы {#stream-zaprosy}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
 								Пререквизит для ClickHouse как CEP-системы.
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 24.14. Window функции {#window-funktsii}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												WIP on docs translation/normalization tools (#9783)


											
										
										
											2020-03-20 18:20:59 +00:00
+								[\#1469](https://github.com/ClickHouse/ClickHouse/issues/1469)
-												update roadmap

											
										
										
											2020-02-14 12:48:34 +00:00
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
+								Требует 2.1.
-												Update extended-roadmap.md
											
										
										
											2020-07-14 09:28:38 +00:00
+								Upd. Есть два прототипа от внешних контрибьюторов.
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 24.15. Поддержка полуструктурированных данных {#podderzhka-polustrukturirovannykh-dannykh}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
 								Требует 1.14 и 2.10.
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 24.16. Улучшение эвристики слияний {#uluchshenie-evristiki-sliianii}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
 								В прошлом году исследование по этой задаче сделал Егор Соловьёв, ВШЭ и Яндекс.Такси. Его исследование показало, что алгоритм нельзя существенно улучшить путём изменения параметров. Но исследование лажовое, так как рассмотрен только уже использующийся алгоритм. То есть, задача остаётся открытой.
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 24.17. Экспериментальные способы ускорения параллельного GROUP BY {#eksperimentalnye-sposoby-uskoreniia-parallelnogo-group-by}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
 								Максим Серебряков
-												Update extended_roadmap.md
											
										
										
											2020-04-22 22:02:20 +00:00
+								Задача в работе.
-												Update extended-roadmap.md
											
										
										
											2020-05-15 07:07:06 +00:00
+								Upd. Достигнуты обнадёживающие результаты.
-												Update extended-roadmap.md
											
										
										
											2020-06-18 05:00:55 +00:00
+								Upd. Есть pull request - в большинстве случаев одновременно и ускорение и снижение потребления памяти, но требуются доработки.
-												Update extended_roadmap.md
											
										
										
											2020-04-22 22:02:20 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 24.18. Не TCP протокол передачи файлов при репликации {#ne-tcp-protokol-peredachi-failov-pri-replikatsii}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 24.19. Промежуточное состояние GROUP BY как структура данных для key-value доступа {#promezhutochnoe-sostoianie-group-by-kak-struktura-dannykh-dlia-key-value-dostupa}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 24.20. Short-circuit вычисления некоторых выражений {#short-circuit-vychisleniia-nekotorykh-vyrazhenii}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
 								Два года назад задачу попробовала сделать Анастасия Царькова, ВШЭ и Яндекс, но реализация получилась слишком неудобной и её удалили.
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 24.21. Реализация в ClickHouse протокола распределённого консенсуса {#realizatsiia-v-clickhouse-protokola-raspredelionnogo-konsensusa}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
 								Имеет смысл только после 19.2.
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 24.22. Вывод типов по блоку данных. Вывод формата данных по примеру {#vyvod-tipov-po-bloku-dannykh-vyvod-formata-dannykh-po-primeru}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Update extended_roadmap.md
											
										
										
											2020-03-10 19:16:35 +00:00
+								Задача отложена.
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Added descriptions to some tasks

											
										
										
											2019-11-20 11:34:23 +00:00
+								ClickHouse является строго типизированной системой. Для того, чтобы прочитать данные в каком либо формате (например, CSV), требуется заранее указать типы данных. Если при чтении формата выясняется, что данные не могут быть прочитаны в рамках заданных типов, то кидается исключение.
 								ClickHouse также может использоваться для быстрой аналитики по локальным файлам, без загрузки их в базу данных (программа `clickhouse-local`). В этом случае, его использование может заменить `awk`, `sed`, `grep`. Но остаётся неудобство - необходимость указания типов данных.
 								Предлагается реализовать функциональность вывода типов по первому блоку данных путём применения эвристик и постепенного расширения типов.
 								Другая экспериментальная задача - реализация эвристик для обработки данных в неизвестном построчном текстовом формате. Детектирование CSV, TSV, JSON, детектирование разделителей и форматов значений.
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 24.23. Минимальная поддержка транзакций для множества вставок/чтений {#minimalnaia-podderzhka-tranzaktsii-dlia-mnozhestva-vstavokchtenii}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
 								Максим Кузнецов, ВШЭ.
-												WIP on docs translation/normalization tools (#9783)


											
										
										
											2020-03-20 18:20:59 +00:00
+								Таблицы типа MergeTree состоят из набора независимых неизменяемых «кусков» данных. При вставках данных (INSERT), формируются новые куски. При модификациях данных (слияние кусков), формируются новые куски, а старые - становятся неактивными и перестают использоваться следующими запросами. Чтение данных (SELECT) производится из снэпшота множества кусков на некоторый момент времени. Таким образом, чтения и вставки не блокируют друг друга.
-												Added descriptions to some tasks

											
										
										
											2019-11-20 11:34:23 +00:00
 								Если же выполняется несколько запросов SELECT, то чтение данных может осуществляться из снэпшотов по состоянию на несколько разных моментов времени и быть неконсистентным. Пример: пользователю отображается отчёт из нескольких графиков и таблиц, но из-за того, что между разными запросами, данные успели обновиться, отображаемые данные не соответствуют друг другу.
 								Пример с другой стороны - пользователь хочет осуществить несколько вставок (INSERT) в одну или несколько таблиц, но так, чтобы данные появились в них атомарно с точки зрения других запросов (SELECT).
 								Для решения этих проблем, предлагается ввести глобальные метки времени для кусков данных (сейчас уже есть инкрементальные номера кусков, но они выделяются в рамках одной таблицы). Первым шагом сделаем эти метки времени в рамках сервера. Вторым шагом сделаем метки времени в рамках всех серверов, но неточные на основе локальных часов. Третьим шагом сделаем метки времени, выдаваемые сервисом координации.
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 24.24. Реализация алгоритмов differential privacy {#realizatsiia-algoritmov-differential-privacy}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												WIP on docs translation/normalization tools (#9783)


											
										
										
											2020-03-20 18:20:59 +00:00
+								[\#6874](https://github.com/ClickHouse/ClickHouse/issues/6874)
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Update extended-roadmap.md
											
										
										
											2020-06-18 05:00:55 +00:00
+								Артём Вишняков, ВШЭ. Есть pull request.
-												Added descriptions to some tasks

											
										
										
											2019-11-20 11:34:23 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 24.25. Интеграция в ClickHouse функциональности обработки HTTP User Agent {#integratsiia-v-clickhouse-funktsionalnosti-obrabotki-http-user-agent}
-												WIP on docs translation/normalization tools (#9783)


											
										
										
											2020-03-20 18:20:59 +00:00
 								[\#157](https://github.com/ClickHouse/ClickHouse/issues/157)
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
+								Есть хороший код в Яндекс.Метрике. Получено согласие от руководства.
 								Михаил Филитов, ВШЭ.
-												Update extended-roadmap.md
											
										
										
											2020-05-15 07:07:06 +00:00
+								Upd. Есть pull request. Нужно ещё чистить код библиотеки.
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 24.26. Поддержка open tracing или аналогов {#podderzhka-open-tracing-ili-analogov}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												WIP on docs translation/normalization tools (#9783)


											
										
										
											2020-03-20 18:20:59 +00:00
+								[\#5182](https://github.com/ClickHouse/ClickHouse/issues/5182)
-												update roadmap

											
										
										
											2020-02-14 12:48:34 +00:00
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
+								Александр Кожихов, ВШЭ и Яндекс.YT.
-												Update extended-roadmap.md
											
										
										
											2020-05-15 07:07:06 +00:00
+								Upd. Есть pull request с прототипом.
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 24.27. Реализация алгоритмов min-hash, sim-hash для нечёткого поиска полудубликатов {#realizatsiia-algoritmov-min-hash-sim-hash-dlia-nechiotkogo-poiska-poludublikatov}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												WIP on docs translation/normalization tools (#9783)


											
										
										
											2020-03-20 18:20:59 +00:00
+								[\#7649](https://github.com/ClickHouse/ClickHouse/pull/7649)
-												update roadmap

											
										
										
											2020-02-14 12:48:34 +00:00
-												Update extended_roadmap.md
											
										
										
											2020-01-04 17:36:51 +00:00
+								ucasFL, ICT.
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Added descriptions to some tasks

											
										
										
											2019-11-20 11:34:23 +00:00
+								Алгоритмы min-hash и sim-hash позволяют вычислить для текста несколько хэш-значений таких, что при небольшом изменении текста, по крайней мере один из хэшей не меняется. Вычисления можно реализовать на n-грамах и словарных шинглах. Предлагается добавить поддержку этих алгоритмов в виде функций в ClickHouse и изучить их применимость для задачи нечёткого поиска полудубликатов.
-												Update roadmap

											
										
										
											2020-01-18 16:54:56 +00:00
+								Есть pull request, есть что доделывать.
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 24.28. Другой sketch для квантилей {#drugoi-sketch-dlia-kvantilei}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Update roadmap

											
										
										
											2020-01-18 16:54:56 +00:00
+								Похоже на quantileTiming, но с логарифмическими корзинами. См. DDSketch.
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 24.29. Поддержка Arrow Flight {#podderzhka-arrow-flight}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												WIP on docs translation/normalization tools (#9783)


											
										
										
											2020-03-20 18:20:59 +00:00
+								[\#7554](https://github.com/ClickHouse/ClickHouse/issues/7554)
-												update roadmap

											
										
										
											2020-02-14 12:48:34 +00:00
-												Update roadmap

											
										
										
											2020-01-18 16:54:56 +00:00
+								Жанна Зосимова, ВШЭ.
-												Update extended-roadmap.md
											
										
										
											2020-05-15 07:07:06 +00:00
+								Upd. Пока поддержали Arrow как формат ввода-вывода.
-												Update roadmap

											
										
										
											2020-01-18 16:54:56 +00:00
-												Update extended-roadmap.md
											
										
										
											2020-07-14 09:28:38 +00:00
+								### 24.30. - ClickHouse как графовая СУБД {#clickhouse-kak-grafovaia-subd}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Update extended-roadmap.md
											
										
										
											2020-06-18 05:00:55 +00:00
+								Amos Bird, но его решение слишком громоздкое и пока не open-source. Отменено.
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 24.31. Кореллированные подзапросы {#korellirovannye-podzaprosy}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												update roadmap

											
										
										
											2020-02-14 12:48:34 +00:00
+								Перепиcывание в JOIN. Не раньше 21.11, 21.12, 21.9. Низкий приоритет.
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 24.32. Поддержка GRPC {#podderzhka-grpc}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
 								Мария Конькова, ВШЭ и Яндекс.
 								Также смотрите 24.29.
-												Added descriptions to some tasks

											
										
										
											2019-11-20 11:34:23 +00:00
+								В ClickHouse есть два основных протокола: родной протокол общения между серверами и HTTP/1.1 протокол. HTTP/1.1 протокол удобен для работы из самых разных языков программирования, но, в отличие от родного протокола, не поддерживает двусторонний обмен информацией во время запроса:
 								- передачу информации о прогрессе во время выполнения запроса;
 								- передачу логов во время выполнения запроса;
 								- отмену выполнения запроса в тот момент как данные ещё не начали передаваться;
 								Рассматривается вариант - поддержка GRPC в ClickHouse. Здесь есть неочевидные моменты, такие как - эффективная передача массивов данных в column-oriented формате - насколько удобно будет обернуть это в GRPC.
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Update extended-roadmap.md
											
										
										
											2020-05-08 08:29:11 +00:00
+								Задача в работе, есть pull request. [#10136](https://github.com/ClickHouse/ClickHouse/pull/10136)
-												Update extended_roadmap.md
											
										
										
											2020-04-22 22:02:20 +00:00
-												Update extended-roadmap.md
											
										
										
											2020-05-15 07:07:06 +00:00
-												WIP on docs translation/normalization tools (#9783)


											
										
										
											2020-03-20 18:20:59 +00:00
+								## 25. DevRel {#devrel}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 25.1. + Перевод инструкции для начинающих разработчиков {#perevod-instruktsii-dlia-nachinaiushchikh-razrabotchikov}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
 								Александр Казаков, ноябрь 2019.
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 25.2. + Вычитка и выкладка статьи про обфускацию данных на английском {#vychitka-i-vykladka-stati-pro-obfuskatsiiu-dannykh-na-angliiskom}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Update extended_roadmap.md
											
										
										
											2020-01-18 16:58:26 +00:00
+								Эми, Александр Казаков, Алексей Миловидов, Q1.
-												Updated roadmap

											
										
										
											2019-12-10 00:13:16 +00:00
+								Готово к выкладке.
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 25.3. Подготовка статьи «Секреты оптимизации производительности ClickHouse» {#podgotovka-stati-sekrety-optimizatsii-proizvoditelnosti-clickhouse}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Updated roadmap

											
										
										
											2019-11-20 20:55:26 +00:00
+								Алексей Миловидов, Леонид.
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 25.4. Подготовка статьи «Профайлер запросов: трудный путь» {#podgotovka-stati-profailer-zaprosov-trudnyi-put}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Updated roadmap

											
										
										
											2019-11-20 20:55:26 +00:00
+								Алексей Миловидов, Леонид.
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 25.5. Подготовка статьи «Тестирование ClickHouse, которое мы заслужили» {#podgotovka-stati-testirovanie-clickhouse-kotoroe-my-zasluzhili}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 25.6. Перевод этих статей на английский {#perevod-etikh-statei-na-angliiskii}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Updated roadmap

											
										
										
											2019-11-20 20:55:26 +00:00
+								Требует 25.3, 25.4, 25.5. Эми
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 25.7. Перевод статьи Данилы Кутенина на английский {#perevod-stati-danily-kutenina-na-angliiskii}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Updated roadmap

											
										
										
											2019-11-20 20:55:26 +00:00
+								Эми
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 25.8. + Выступление keynote на BDTC {#vystuplenie-keynote-na-bdtc}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
 								Алексей Миловидов
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 25.9. Подготовка докладчиков: khvostikao, ilezhankin, nikitamikhailov, akuzm и другие {#podgotovka-dokladchikov-khvostikao-ilezhankin-nikitamikhailov-akuzm-i-drugie}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Update roadmap

											
										
										
											2020-01-18 16:54:56 +00:00
+								[Ольга Хвостикова](https://github.com/stavrolia), [Иван Лежанкин](https://github.com/abyss7), Никита Михайлов, [Александр Кузьменков](https://github.com/akuzm), Артём Зуйков.
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
+								Уже готовые докладчики: Алексей Миловидов, [Николай Кочетов](https://github.com/KochetovNicolai), [Александр Сапин](https://github.com/alesapin).
-												Update roadmap

											
										
										
											2020-01-18 16:54:56 +00:00
+								Получаем минимум 8 докладчиков в 2020 году.
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 25.10. Митапы в России и Беларуси: Москва x2 + митап для разработчиков или хакатон, Санкт-Петербург, Минск, Нижний Новгород, Екатеринбург, Новосибирск и/или Академгородок, Иннополис или Казань {#mitapy-v-rossii-i-belarusi-moskva-x2-mitap-dlia-razrabotchikov-ili-khakaton-sankt-peterburg-minsk-nizhnii-novgorod-ekaterinburg-novosibirsk-iili-akademgorodok-innopolis-ili-kazan}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Update extended-roadmap.md
											
										
										
											2020-05-15 07:07:06 +00:00
+								Екатерина - организация. Upd. Проведено два онлайн митапа на русском и два на английском.
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 25.11. Митапы зарубежные: восток США (Нью Йорк, возможно Raleigh), возможно северо-запад (Сиэтл), Китай (Пекин снова, возможно митап для разработчиков или хакатон), Лондон {#mitapy-zarubezhnye-vostok-ssha-niu-iork-vozmozhno-raleigh-vozmozhno-severo-zapad-sietl-kitai-pekin-snova-vozmozhno-mitap-dlia-razrabotchikov-ili-khakaton-london}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Update roadmap

											
										
										
											2020-03-06 20:50:34 +00:00
+								[Иван Блинков](https://github.com/blinkov/) - организация. Две штуки в США запланированы. Upd. Два митапа в США и один в Европе проведены.
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 25.12. Статья «научная» - про устройство хранения данных и индексов или whitepaper по архитектуре. Есть вариант подать на VLDB {#statia-nauchnaia-pro-ustroistvo-khraneniia-dannykh-i-indeksov-ili-whitepaper-po-arkhitekture-est-variant-podat-na-vldb}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
 								Низкий приоритет. Алексей Миловидов.
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 25.13. Участие во всех мероприятиях Яндекса, которые связаны с разработкой бэкенда, C++ разработкой или с базами данных, возможно участие в DevRel мероприятиях {#uchastie-vo-vsekh-meropriiatiiakh-iandeksa-kotorye-sviazany-s-razrabotkoi-bekenda-c-razrabotkoi-ili-s-bazami-dannykh-vozmozhno-uchastie-v-devrel-meropriiatiiakh}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
 								Алексей Миловидов и все подготовленные докладчики
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 25.14. Конференции в России: все HighLoad, возможно CodeFest, DUMP или UWDC, возможно C++ Russia {#konferentsii-v-rossii-vse-highload-vozmozhno-codefest-dump-ili-uwdc-vozmozhno-c-russia}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Update roadmap. Also revert digital degradation due to accidential changes with automatic scripts.

											
										
										
											2020-04-13 23:24:33 +00:00
+								Алексей Миловидов и все подготовленные докладчики.
 								Upd. Есть Saint HighLoad online.
-												Update extended-roadmap.md
											
										
										
											2020-07-14 09:28:38 +00:00
+								Upd. Есть C++ Russia.
 								CodeFest, DUMP, UWDC отменились.
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 25.15. Конференции зарубежные: Percona, DataOps, попытка попасть на более крупные {#konferentsii-zarubezhnye-percona-dataops-popytka-popast-na-bolee-krupnye}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
 								Алексей Миловидов и все подготовленные докладчики
-												Update extended-roadmap.md
											
										
										
											2020-07-14 09:28:38 +00:00
+								Upd. Есть Percona.
 								DataOps отменилась.
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 25.16. Сайт play.clickhouse {#sait-play-clickhouse}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Added descriptions to some tasks

											
										
										
											2019-11-20 11:34:23 +00:00
+								Цель состоит в реализации сайта, на котором можно попробовать задавать произвольные запросы к временному экземпляру ClickHouse и изучать его поведение. Из похожих проектов можно отметить: [Compiler Explorer](https://godbolt.org/), http://ideone.com/, [SQLFiddle](http://sqlfiddle.com/), [DB-Fiddle](https://www.db-fiddle.com/).
 								С помощью такого сайта можно решать следующие задачи:
 								- ознакомление с языком запросов ClickHouse;
 								- демонстрация примеров из документации;
 								- демонстрация скорости работы на тестовых датасетах;
 								- сравнение поведения разных версий ClickHouse друг с другом;
 								- демонстрация неожиданного поведения или багов;
 								Требуется проработать вопрос безопасности и изоляции инстансов (поднятие в контейнерах с ограничениями по сети), подключение тестовых датасетов с помощью copy-on-write файловой системы; органичения ресурсов.
-												Update extended_roadmap.md
											
										
										
											2020-04-22 22:02:20 +00:00
+								Есть минимальный прототип. Сделал Илья Яцишин. Этот прототип не позволяет делиться ссылками на результаты запросов.
-												Update roadmap

											
										
										
											2020-03-06 20:50:34 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 25.17. Взаимодействие с ВУЗами: ВШЭ, УрФУ, ICT Beijing {#vzaimodeistvie-s-vuzami-vshe-urfu-ict-beijing}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Update extended-roadmap.md
											
										
										
											2020-05-15 07:07:06 +00:00
+								Алексей Миловидов и вся группа разработки.
 								Благодаря Robert Hodges добавлен CMU.
-												Update extended-roadmap.md
											
										
										
											2020-07-14 09:28:38 +00:00
+								Upd. Взаимодействие с ВШЭ 2019/2020 успешно выполнено.
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 25.18. - Лекция в ШАД {#lektsiia-v-shad}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
 								Алексей Миловидов
-												Update extended-roadmap.md
											
										
										
											2020-05-15 07:07:06 +00:00
+								### 25.19. - Участие в курсе разработки на C++ в ШАД {#uchastie-v-kurse-razrabotki-na-c-v-shad}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 25.20. Ещё одно сравнение производительности аналитических СУБД {#eshchio-odno-sravnenie-proizvoditelnosti-analiticheskikh-subd}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
 								Матвей Бубнов, УрФУ
-												Added descriptions to some tasks

											
										
										
											2019-11-20 11:34:23 +00:00
+								Существуют мало известные специализированные СУБД, способные конкурировать с ClickHouse по скорости обработки некоторых классов запросов. Пример: `TDEngine` и `DolphinDB`, `VictoriaMetrics`, а также `Apache Doris` и `LocustDB`. Предлагается изучить и классифицировать архитектурные особенности этих систем - их особенности и преимущества. Установить эти системы, загрузить тестовые данные, изучить производительность. Проанализировать, за счёт чего достигаются преимущества.
-												Update extended-roadmap.md
											
										
										
											2020-05-15 07:07:06 +00:00
+								Upd. Есть поползновения с TDEngine.
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 25.21. Повторное награждение контрибьюторов в Китае {#povtornoe-nagrazhdenie-kontribiutorov-v-kitae}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Update extended-roadmap.md
											
										
										
											2020-07-14 09:28:38 +00:00
+								Upd. Ждём снятия ограничений и восстановления активности по онлайн митапам.
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 25.22. On-site помощь с ClickHouse компаниям в дни рядом с мероприятиями {#on-site-pomoshch-s-clickhouse-kompaniiam-v-dni-riadom-s-meropriiatiiami}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Update extended-roadmap.md
											
										
										
											2020-05-15 07:07:06 +00:00
+								[Иван Блинков](https://github.com/blinkov/) - организация. Провёл мероприятие для турецкой компании.
 								Upd. On-site заменяется на Online.
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 25.23. Новый мерч для ClickHouse {#novyi-merch-dlia-clickhouse}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Update extended-roadmap.md
											
										
										
											2020-07-14 09:28:38 +00:00
+								Upd. Старого пока хватает, раздача уменьшилась.
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 25.24. Конкурсы bughunter или оптимизации кода на C++ {#konkursy-bughunter-ili-optimizatsii-koda-na-c}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Removed some people

											
										
										
											2019-11-19 23:15:24 +00:00
+								Проведение конкурсов должно начинаться для сотрудников Яндекса, пока нет согласования.
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 25.25. Семинары для потенциальных клиентов Яндекс.Облака {#seminary-dlia-potentsialnykh-klientov-iandeks-oblaka}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Removed some people

											
										
										
											2019-11-19 23:15:24 +00:00
+								По мере необходимости. Алексей Миловидов, организация - Яндекс.Облако.
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 25.26. - Участие в GSoC {#uchastie-v-gsoc}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
 								Андрей Бородин пытается уговорить нас участвовать, но пока загружены задачей 25.17.
-												update roadmap

											
										
										
											2020-02-14 12:48:34 +00:00
+								UPD: не участвуем.
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								### 25.27. + Обновить сайт ClickHouse {#obnovit-sait-clickhouse}
-												Added roadmap for 2020 (draft)

											
										
										
											2019-11-18 19:10:48 +00:00
-												Minor update on roadmap

											
										
										
											2020-03-17 20:46:43 +00:00
+								Иван Блинков. Нет рисков. Нужно для Яндекс.Облака. Upd. Сделано.