mirror of
https://github.com/ClickHouse/ClickHouse.git
synced 2024-12-15 02:41:59 +00:00
351 KiB
351 KiB
ClickHouse release 19.9.4.1, 2019-07-05
Исправления ошибок
- Исправлен segmentation fault в кодеке сжатия Delta в колонках с величинами размером меньше 32 бит. Ошибка могла приводить к повреждениям памяти. #5786 (alesapin)
- Исправлена ошибка в проверке кусков в LowCardinality колонках. #5832 (alesapin)
- Исправлен segmentation fault при слиянии кусков с истекшим TTL в случае, когда в блоке присутствуют столбцы, не входящие в структуру таблицы. #5819 (Anton Popov)
- Исправлена существовавшая возможность ухода в бесконечное ожидание на низко-приоритетных запросах. #5842 (alexey-milovidov)
- Исправлена ошибка определения таймзоны по умолчанию (UCT вместо UTC). #5828 (alexey-milovidov)
- Исправлена ошибка в распределенных запросах вида DROP/ALTER/TRUNCATE/OPTIMIZE ON CLUSTER. #5757 (alesapin)
- Исправлена ошибка, которая при распределенных запросах могла привести к тому, что некоторые запросы не появлялись в query_log сразу после SYSTEM FLUSH LOGS запроса. #5685 (Anton Popov)
- Добавлена отсутствовавшая поддержка константных аргументов для функции
evalMLModel
. #5820 (alexey-milovidov)
ClickHouse release 19.7.6.1, 2019-07-05
Исправления ошибок
- Исправлена просадка производительности в методе JOIN в некоторых видах запросов. #5192 (Winter Zhang)
ClickHouse release 19.8.3.8, 2019-06-11
Новые возможности
- Добавлены функции для работы с JSON. #4686 (hcz) #5124. (Vitaly Baranov)
- Добавлена функция
basename
, аналогичная функцииbasename
в различных языках программирования (os.path.basename
в python,basename
в PHP, и т.д.). Работает с UNIX и Windows подобными путями. #5136 (Guillaume Tassery) - Добавлена возможность указать смещение в секции LIMIT BY с помощью синтаксиса
LIMIT n, m BY
илиLIMIT m OFFSET n BY
. #5138 (Anton Popov) - Добавлен новый тип данных
SimpleAggregateFunction
, который позволяет создавать столбцы с легковесной агрегацией в AggregatingMergeTree. Он может использоваться только с простыми функциями, такими какany
,anyLast
,sum
,min
,max
. #4629 (Boris Granveaud) - Добавлена поддержка неконстантных аргументов в функции
ngramDistance
#5198 (Danila Kutenin) - Добавлены функции
skewPop
,skewSamp
,kurtPop
иkurtSamp
, которые вычисляют для последовательности коэффициент асимметрии, выборочный коэффициент асимметрии, коэффициент эксцесса и выборочный коэффициент эксцесса соответсвенно. #5200 (hcz) - Добавлена поддержка операции
RENAME
для движкаMaterializedView
. #5209 (Guillaume Tassery) - Сервер, позволяющий подключаться к ClickHouse через клиент MySQL. #4715 (Yuriy Baranov)
- Добавлены функции
toDecimal*OrZero
иtoDecimal*OrNull
. #5291 (Artem Zuikov) - Добавлена поддержка Decimal в функциях:
quantile
,quantiles
,median
,quantileExactWeighted
,quantilesExactWeighted
,medianExactWeighted
. #5304 (Artem Zuikov) - Добавлена функция
toValidUTF8
, которая заменяет все некорректные символы в кодировке UTF-8 на заменяющий символ <20> (U+FFFD). #5322 (Danila Kutenin) - Добавлена функция
format
, которая выполняет подстановку в константный шаблон (упрощенный шаблон форматирования, используемый в Python) строк, переданных в аргументах функции. #5330 (Danila Kutenin) - Добавлена системная таблица
system.detached_parts
, содержащая информацию о кусках из директорииdetached
для таблиц семействаMergeTree
. #5353 (akuzm) - Добавлена функция
ngramSearch
для вычисления несимметричной разности междуneedle
иhaystack
. #5418#5422 (Danila Kutenin) - Реализованы основные методы машинного обучения (стохастическая линейная регрессия и логистическая регрессия) в виде агрегатных функций. Для вычисления весов могут использоваться различные методы (градиентный спуск, градиентный спуск с накоплением импульса, метод Нестерова). Также поддерживаются mini-batches произвольного размера. #4943 (Quid37)
- Добавлены функции
geohashEncode
иgeohashDecode
. #5003 (Vasily Nemkov) - Добавлена агрегатная функция
timeSeriesGroupSum
, которая агрегирует временные ряды в которых не совпадают моменты. Функция использует линейную интерполяцию между двумя значениями времени, а затем суммирует значения для одного и того же момента. Добавлена агрегатная функцияtimeSeriesGroupRateSum
, которая вычисляет производные по timestamp для рядов, а затем суммирует полученные производные для всех рядов для одного значения timestamp. #4542 (Yangkuan Liu) - Добавлены функции
IPv4CIDRtoIPv4Range
andIPv6CIDRtoIPv6Range
, которые вычисляют диапазон подсети, используя CIDR. #5095 (Guillaume Tassery) - Добавлен заголовок X-ClickHouse-Summary при отправке HTTP запроса с включенной настройкой
send_progress_in_http_headers
. Он содержит инфорцию о X-ClickHouse-Progress, а также информацию о том сколько строк и байт было записано в таблицу и подобное. #5116 (Guillaume Tassery)
Улучшения
- Добавлена настройка
max_parts_in_total
(по умолчанию: 100 000) для таблиц семейства MergeTree, предотвращающая неправильное задание ключа партиционирования #5166. #5171 (alexey-milovidov) clickhouse-obfuscator
: теперь seed вычисляется для столбцов путем комбинирования начального seed и имени колонки, а не ее позиции. Это необходимо для того, чтобы оставить таблицы пригодными для JOIN-ов при преобразовании датасетов с несколькими таблицами. #5178 (alexey-milovidov)- Добавлены функции
JSONExtractRaw
,JSONExtractKeyAndValues
. Функции видаjsonExtract<type>
переименованы вJSONExtract<type>
. Теперь, в случае ошибки эти функции возвращают соответсвующие типу значения, а неNULL
. Теперь возвращаемый тип передается в функциюJSONExtract
последним параметром. Если недоступны иструкции AVX2, то JSON функции выполняются с использованием бибилиотеки RapidJSON. Обновлена библиотека Simdjson. #5235 (Vitaly Baranov) - Теперь функции
if
andmultiIf
не зависят от условныхNullable
типов. #5238 (Jian Wu) - Оператор
IN
теперь возвращаетNull
для значений равныхNull
(аналогично функцииEqual
). #5152 (Jian Wu) - Добавлена проверка ограничения по времени выполенения запроса через каждые (flush_interval / poll_timeout) строк при чтении из движка Kafka. Это позволяет чаще прерывать чтение из движка Kafka и чаще проверять ограничение по времени на более высоком уровне конвеера выполнения запроса. #5249 (Ivan)
- Теперь библиотека rdkafka линкуется c bundled библиотекой SASL. Это позволяет использовать SASL SCRAM аутентификацию. #5253 (Ivan)
- clickhouse-server: более информативные сообщения об ошибках прослушивания. #5268 (proller)
- clickhouse-copier: добавлена поддержка словарей в функциях в секции
<sharding_key>
. #5270 (proller) - Добавлена настройка
kafka_commit_every_batch
для регулирования чтения данных из движка Kafka. Позволяет установить вид чтения: после каждого полученного пакета сообщений или после того как блок записан в таблицу. #5308 (Ivan) - Добавлена поддержка беззнаковых целых типов отличных от UInt32 в функциях
windowFunnel
,sequenceMatch
. #5339 #5320 (sundyli) - В движке Merge виртуальный столбец с названием
_table
(содержащий название таблицы) теперь недоступен, если он присутствует в таблицах-источниках. #5325 (Ivan) - Более понятные сообщения об ошибках, если чексуммы не совпадают вероятнее всего из-за ошибок на аппаратном уровне. #5355 (alexey-milovidov)
- Для движка
Merge
добавлена проверка на то, что таблицы-источники поддерживают семплирование. #5366 (Ivan) - Теперь после использования MySQL в качестве внешнего словаря закрывается соединение. #5395 (Clément Rodriguez)
- Улучшения в протоколе MySQL Wire. Формат переименован из
MySQL
toMySQLWire
. Теперь SSL недоступно, если не удалось создать SSL контекст. #5419 (Yuriy Baranov) - clickhouse-client: теперь можно запустить клиент, если файл истории недоступен. #5431 (proller)
- Теперь учитываются настройки запроса при асинхронных вставках в таблицу типа Distributed. #4936 (TCeason)
- Переименованы функции
leastSqr
вsimpleLinearRegression
,LinearRegression
вlinearRegression
,LogisticRegression
вlogisticRegression
. #5391 (Nikolai Kochetov)
Улучшения производительности
- Паралелльная обработка кусков в запросах
ALTER ... MODIFY
. #4639 (Ivan Kush) - Оптимизации в обработке регулярных выражений. #5193 #5191 (Danila Kutenin)
- Теперь столбец правой таблицы, который используется только в секции
JOIN ON
не добавляется в результат. #5260 (Artem Zuikov) - Теперь чтение из буфера движка Kafka приостанавливается после первого пустого ответа. Это позволяет не вызывать несколько раз метод
ReadBuffer::next()
для пустого результата. #5283 (Ivan) - Оптимизация функции
concat
для нескольких аргументов. #5357 (Danila Kutenin) - Оптимизация запросов. Прокидывание выражения оператора
IN
при конвертацииcommа/cross join
вinner
. #5396 (Artem Zuikov) - Улучшение реализации LZ4 для более быстрого разжатия данных. #5070 (Danila Kutenin)
- Реализована MSD-сортировка, а также на ее основе частичная сортировка. #5129 (Evgenii Pravda)
Исправления ошибок
- Исправлено прокидывание необходимых для чтения столбцов в join. #5192 (Winter Zhang)
- Исправлено неправильное поведение команды
sudo service clickhouse-server forcerestart
в случае, если сервер запущен при помощи systemd. #5204 (proller) - Исправлены коды ошибок при передаче кусков (раньше даже при ошибках возвращался код 200). #5216 (proller)
- Исправлено использование типа SimpleAggregateFunction со строками длиннее чем
MAX_SMALL_STRING_SIZE
#5311 (Azat Khuzhin) - Исправлена ошибка конвертации типа
Decimal
вNullable(Decimal)
в секции IN. Добавлена возможность конвертации между различными типами Decimal (including different scales). #5350 (Artem Zuikov) - Исправлено затирание регистров FPU в библиотеке simdjson, которое приводило к неправильным вычислениям в агрегатных функциях
uniqHLL
иuniqCombined
, а также математических функциях, таких какlog
. #5354 (alexey-milovidov) - Исправлены обработка константных и неконстантных аргументов одновременно в JSON функциях. #5435 (Vitaly Baranov)
- Исправлен возвращаемый тип в функции
quantileExact
с типомDecimal
. #5304 (Artem Zuikov)
Улучшения сборки, тестирования и пакетирования
- Исправлены срабатывания address-санитайзера, показывающие потенциальную ошибку use-after-free.#5139 #5143 #5393 (Ivan)
- Тесты производительности перемещены в одну директорию. #5158 (alexey-milovidov)
- Исправлены некоторые тесты производительности. #5255 (alesapin)
- Добавлена утилита, позволяющая вычислять чексуммы, полученные в результате возможных инверсий битов. Она помогает отлаживать аппаратные ошибки. #5334 (alexey-milovidov)
- Улучшение скрипта для запуска интеграционных тестов. #5340#5360 (filimonov)
- Добавлена инструкция о том, как писать тесты производительности. #5408 (alesapin)
- Добавлена возможность делать подстановки в запросах create, fill и drop в тестах производительности. #5367 (Olga Khvostikova)
ClickHouse release 19.7.5.27, 2019-06-09
Новые возможности
- Добавлены функции для битмапов
bitmapHasAny
иbitmapHasAll
(аналогично функциямhasAny
иhasAll
для массивов). #5279 (Sergi Vladykin)
Исправления ошибок
- Исправлен segfault при использовании
minmax
индекса со значениямиNull
. #5246 (Nikita Vasilev) - Исправлена ошибка 'Not found column', возникавшая в некоторых распределенных запросах. #5407 (Constantin S. Pan)
- Исправлена ошибка "Column '0' already exists" в запросах
SELECT .. PREWHERE
со столбцами с указаннымDEFAULT
#5397 (proller) - Исправлен запрос
ALTER MODIFY TTL
для таблиц типаReplicatedMergeTree
. #5539 (Anton Popov) - Теперь сервер не падает, если подписчики Kafka не смогли запуститься. #5285 (Ivan)
- Исправлены bitmap функции. #5359 (Andy Yang)
- Исправлено значение
element_count
в таблицеsystem.dictionaries
для словарей типа hashed (теперь не подсчитываются дубликаты). #5440 (Azat Khuzhin) - Для определения имени таймзоны теперь используется переменная среды TZ. В некоторых случаях это помогает правильно определять таймзону по умолчанию. #5443 (Ivan)
- Убрано неявное преобразование целых типов в функциях
dictGetT
, т.к. оно работало неправильно. Вместо этого теперь бросается исключение. #5446 (Artem Zuikov) - Исправлены настройки во внешних данных HTTP запроса. #5455 (Danila Kutenin)
- Исправлена ошибка, приводящая к тому, что куски удалялись только из файловой системы, но не из Zookeeper. #5520 (alesapin)
- Исправлен segfault в функции
bitmapHasAny
. #5528 (Zhichang Yu) - Исправлена ошибка, приводящая к тому, что при репликации не вычислялся заново адрес хоста, даже если DNS кеш был сброшен. #5534 (alesapin)
- Исправлен запрос
DROP INDEX IF EXISTS
. Теперь запросALTER TABLE ... DROP INDEX IF EXISTS ...
не выкидывает исключение. #5524 (Gleb Novikov) - Исправлен тип результируещего столбца в запросе
UNION ALL
. Раньше могли быть случаи, когда тип и данные столбца были несогласованы. #5503 (Artem Zuikov) - Исправлена ошибка, вследствие которой поток
DDLWorker
-а мог быть остановлен, если одна нода удалилаznode
из очереди задач, а другая уже получила ее, но не успела выполнить. #5489 (Azat Khuzhin) - Исправлена вставка в Distributed таблицы с материализованныси столбцами. #5429 (Azat Khuzhin)
ClickHouse release 19.7.3.9, 2019-05-30
Новые возможности
- Добавлена возможность ограничить значения конфигурационных параметров, которые может задать пользователь. Эти ограничения устанавливаются в профиле настроек пользователя. #4931 (Vitaly Baranov)
- Добавлен вариант функции
groupUniqArray
с дополнительным параметромmax_size
, который ограничивает размер результирующего массива, аналогично функцииgroupArray(max_size)(x)
. #5026 (Guillaume Tassery) - Для входных файлов формата TSVWithNames и CSVWithNames появилась возможность
определить порядок колонок в файле исходя из его заголовка. Это поведение
управляется конфигурационным параметром
input_format_with_names_use_header
. #5081 (Alexander)
Исправления ошибок
- Падение в процессе слияния при использовании uncompressed_cache и JOIN (#5197). #5133 (Danila Kutenin)
- Segmentation fault на запросе к системным таблицам (#5066). #5127 (Ivan)
- Потеря загружаемых данных при больших потоках загрузки через KafkaEngine (#4736). #5080 (Ivan)
- Исправлен очень редкий data race condition который мог произойти при выполнении запроса с UNION ALL включающего минимум два SELECT из таблиц system.columns, system.tables, system.parts, system.parts_tables или таблиц семейства Merge и одновременно выполняющихся запросов ALTER столбцов соответствующих таблиц. #5189 (alexey-milovidov)
Улучшения производительности
- Используется поразрядная сортировка числовых колонок для
ORDER BY
безLIMIT
. #5106, #4439 (Evgenii Pravda, alexey-milovidov
Документация
- Документация для некоторых табличных движков переведена на китайский. #5107, #5094, #5087 (张风啸, #5068 (never lee)
Улучшения сборки, тестирования и пакетирования
- Правильно отображаются символы в кодировке UTF-8 в
clickhouse-test
. #5084 (alexey-milovidov) - Добавлен параметр командной строки для
clickhouse-client
, позволяющий всегда загружать данные подсказок. #5102 (alexey-milovidov) - Исправлены некоторые предупреждения PVS-Studio. #5082 (alexey-milovidov)
- Обновлена библиотека LZ4. #5040 (Danila Kutenin)
- В зависимости сборки добавлен gperf для поддержки готовящегося PR #5030. #5110 (proller)
ClickHouse release 19.6.3.18, 2019-06-13
Исправления ошибок
- Исправлено прокидывание условий оператора IN для запросов с табличными функциями
mysql
andodbc
и соответсвующими движками таблиц. #5313 (alexey-milovidov) - Исправлен deadlock в Zookeeper. #5297 (github1youlc)
- Для формата CSV добавлена возможность указывать значения типа Decimal в кавычках. #5284 (Artem Zuikov
- Убрана возможность преобразований из float Inf/NaN в Decimal (теперь бросается исключение). #5282 (Artem Zuikov)
- Исправлен data race в запросе
RENAME
. #5247 (Winter Zhang) - Отключен LFAlloc. Использование LFAlloc могло приводить к ошибкам MAP_FAILED при использовании UncompressedCache и в результате к падению запросов на высоконагруженных серверах. cfdba93(Danila Kutenin)
ClickHouse release 19.6.2.11, 2019-05-13
Новые возможности
- TTL выражения, позволяющие настроить время жизни и автоматическую очистку данных в таблице или в отдельных её столбцах. #4212 (Anton Popov)
- Добавлена поддержка алгоритма сжатия
brotli
в HTTP ответах (Accept-Encoding: br
). Для тела POST запросов, эта возможность уже существовала. #4388 (Mikhail) - Добавлена функция
isValidUTF8
для проверки, содержит ли строка валидные данные в кодировке UTF-8. #4934 (Danila Kutenin) - Добавлены новое правило балансировки (
load_balancing
)first_or_random
по которому запросы посылаются на первый заданый хост и если он недоступен - на случайные хосты шарда. Полезно для топологий с кросс-репликацией. #5012 (nvartolomei)
Экспериментальные возможности
- Добавлена настройка
index_granularity_bytes
(адаптивная гранулярность индекса) для таблиц семейства MergeTree* . #4826 (alesapin)
Улучшения
- Добавлена поддержка для не константных и отрицательных значений аргументов смещения и длины для функции
substringUTF8
. #4989 (alexey-milovidov) - Отключение push-down в правую таблицы в left join, левую таблицу в right join, и в обе таблицы в full join. Это исправляет неправильные JOIN результаты в некоторых случаях. #4846 (Ivan)
clickhouse-copier
: Автоматическая загрузка конфигурации задачи в zookeeper из--task-file
опции #4876 (proller)- Добавлены подсказки с учётом опечаток для имён движков таблиц и табличных функций. #4891 (Danila Kutenin)
- Поддержка выражений
select *
иselect tablename.*
для множественных join без подзапросов #4898 (Artem Zuikov) - Сообщения об ошибках об отсутствующих столбцах стали более понятными. #4915 (Artem Zuikov)
Улучшение производительности
- Существенное ускорение ASOF JOIN #4924 (Martijn Bakker)
Обратно несовместимые изменения
Исправления ошибок
- Исправлены возможные разыменования нулевого указателя в
clickhouse-copier
. #4900 (proller) - Исправлены ошибки в запросах с JOIN + ARRAY JOIN #4938 (Artem Zuikov)
- Исправлено зависание на старте сервера если внешний словарь зависит от другого словаря через использование таблицы из БД с движком
Dictionary
. #4962 (Vitaly Baranov) - При использовании
distributed_product_mode = 'local'
корректно работает использование столбцов локальных таблиц в where/having/order by/... через табличные алиасы. Выкидывает исключение если таблица не имеет алиас. Доступ к столбцам без алиасов пока не возможен. #4986 (Artem Zuikov) - Исправлен потенциально некорректный результат для
SELECT DISTINCT
сJOIN
#5001 (Artem Zuikov) - Исправлен очень редкий data race condition который мог произойти при выполнении запроса с UNION ALL включающего минимум два SELECT из таблиц system.columns, system.tables, system.parts, system.parts_tables или таблиц семейства Merge и одновременно выполняющихся запросов ALTER столбцов соответствующих таблиц. #5189 (alexey-milovidov)
Улучшения сборки/тестирования/пакетирования
- Исправлена неработоспособность тестов, если
clickhouse-server
запущен на удалённом хосте #4713 (Vasily Nemkov) clickhouse-test
: Отключена раскраска результата, если команда запускается не в терминале. #4937 (alesapin)clickhouse-test
: Возможность использования не только базы данных test #5008 (proller)- Исправлены ошибки при запуске тестов под UBSan #5037 (Vitaly Baranov)
- Добавлен аллокатор Yandex LFAlloc для аллоцирования MarkCache и UncompressedCache данных разными способами для более надежного отлавливания проездов по памяти #4995 (Danila Kutenin)
- Утилита для упрощения бэкпортирования изменений в старые релизы и составления changelogs. #4949 (Ivan)
ClickHouse release 19.5.4.22, 2019-05-13
Исправления ошибок
- Исправлены возможные падения в bitmap* функциях #5220 #5228 (Andy Yang)
- Исправлен очень редкий data race condition который мог произойти при выполнении запроса с UNION ALL включающего минимум два SELECT из таблиц system.columns, system.tables, system.parts, system.parts_tables или таблиц семейства Merge и одновременно выполняющихся запросов ALTER столбцов соответствующих таблиц. #5189 (alexey-milovidov)
- Исправлена ошибка
Set for IN is not created yet in case of using single LowCardinality column in the left part of IN
. Эта ошибка возникала когда LowCardinality столбец была частью primary key. #5031 #5154 (Nikolai Kochetov) - Исправление функции retention: только первое соответствующее условие добавлялось в состояние данных. Сейчас все условия которые удовлетворяют в строке данных добавляются в состояние. #5119 (小路)
ClickHouse release 19.5.3.8, 2019-04-18
Исправления ошибок
- Исправлен тип настройки
max_partitions_per_insert_block
с булевого на UInt64. #5028 (Mohammad Hossein Sekhavat)
ClickHouse release 19.5.2.6, 2019-04-15
Новые возможности
- Добавлены функции для работы с несколькими регулярными выражениями с помощью библиотеки Hyperscan. (
multiMatchAny
,multiMatchAnyIndex
,multiFuzzyMatchAny
,multiFuzzyMatchAnyIndex
). #4780, #4841 (Danila Kutenin) - Добавлена функция
multiSearchFirstPosition
. #4780 (Danila Kutenin) - Реализована возможность указания построчного ограничения доступа к таблицам. #4792 (Ivan)
- Добавлен новый тип вторичного индекса на базе фильтра Блума (используется в функциях
equal
,in
иlike
). #4499 (Nikita Vasilev) - Добавлен
ASOF JOIN
которые позволяет джойнить строки по наиболее близкому известному значению. #4774 #4867 #4863 #4875 (Martijn Bakker, Artem Zuikov) - Теперь запрос
COMMA JOIN
переписываетсяCROSS JOIN
. И затем оба переписываются вINNER JOIN
, если это возможно. #4661 (Artem Zuikov)
Улучшения
- Функции
topK
иtopKWeighted
теперь поддерживают произвольныйloadFactor
(исправляет issue #4252). #4634 (Kirill Danshin) - Добавлена возможность использования настройки
parallel_replicas_count > 1
для таблиц без семплирования (ранее настройка просто игнорировалась). #4637 (Alexey Elymanov) - Поддержан запрос
CREATE OR REPLACE VIEW
. Позволяет создатьVIEW
или изменить запрос в одном выражении. #4654 (Boris Granveaud) - Движок таблиц
Buffer
теперь поддерживаетPREWHERE
. #4671 (Yangkuan Liu) - Теперь реплицируемые таблицы могу стартовать в
readonly
режиме даже при отсутствии zookeeper. #4691 (alesapin) - Исправлено мигание прогресс-бара в clickhouse-client. Проблема была наиболее заметна при использовании
FORMAT Null
в потоковых запросах. #4811 (alexey-milovidov) - Добавлена возможность отключения функций, использующих библиотеку
hyperscan
, для пользователей, чтобы ограничить возможное неконтролируемое потребление ресурсов. #4816 (alexey-milovidov) - Добавлено логирование номера версии во все исключения. #4824 (proller)
- Добавлено ограничение на размер строк и количество параметров в функции
multiMatch
. Теперь они принимают строки умещающиеся вunsigned int
. #4834 (Danila Kutenin) - Улучшено использование памяти и обработка ошибок в Hyperscan. #4866 (Danila Kutenin)
- Теперь системная таблица
system.graphite_detentions
заполняется из конфигурационного файла для таблиц семейства*GraphiteMergeTree
. #4584 (Mikhail f. Shiryaev) - Функция
trigramDistance
переименована в функциюngramDistance
. Добавлено несколько функций сCaseInsensitive
иUTF
. #4602 (Danila Kutenin) - Улучшено вычисление вторичных индексов. #4640 (Nikita Vasilev)
- Теперь обычные колонки, а также колонки
DEFAULT
,MATERIALIZED
иALIAS
хранятся в одном списке (исправляет issue #2867). #4707 (Alex Zatelepin)
Исправления ошибок
- В случае невозможности выделить память вместо вызова
std::terminate
бросается исключениеstd::bad_alloc
. #4665 (alexey-milovidov) - Исправлены ошибки чтения capnproto из буфера. Иногда файлы не загружались по HTTP. #4674 (Vladislav)
- Исправлена ошибка
Unknown log entry type: 0
после запросаOPTIMIZE TABLE FINAL
. #4683 (Amos Bird) - При передаче неправильных аргументов в
hasAny
иhasAll
могла происходить ошибка сегментирования. #4698 (alexey-milovidov) - Исправлен дедлок, который мог происходить при запросе
DROP DATABASE dictionary
. #4701 (alexey-milovidov) - Исправлено неопределенное поведение в функциях
median
иquantile
. #4702 (hcz) - Исправлено определение уровня сжатия при указании настройки
network_compression_method
в нижнем регистре. Было сломано в v19.1. #4706 (proller) - Настройка
<timezone>UTC</timezone>
больше не игнорируется (исправляет issue #4658). #4718 (proller) - Исправлено поведение функции
histogram
сDistributed
таблицами. #4741 (olegkv) - Исправлено срабатывание thread-санитайзера с ошибкой
destroy of a locked mutex
. #4742 (alexey-milovidov) - Исправлено срабатывание thread-санитайзера при завершении сервера, вызванное гонкой при использовании системных логов. Также исправлена потенциальная ошибка use-after-free при завершении сервера в котором был включен
part_log
. #4758 (alexey-milovidov) - Исправлена перепроверка кусков в
ReplicatedMergeTreeAlterThread
при появлении ошибок. #4772 (Nikolai Kochetov) - Исправлена работа арифметических операций с промежуточными состояниями агрегатных функций для константных аргументов (таких как результаты подзапросов). #4776 (alexey-milovidov)
- Теперь имена колонок всегда экранируются в файлах с метаинформацией. В противном случае было невозможно создать таблицу с колонкой с именем
index
. #4782 (alexey-milovidov) - Исправлено падение в запросе
ALTER ... MODIFY ORDER BY
кDistributed
таблице. #4790 (TCeason) - Исправлена ошибка сегментирования при запросах с
JOIN ON
и включенной настройкойenable_optimize_predicate_expression
. #4794 (Winter Zhang) - Исправлено добавление лишней строки после чтения protobuf-сообщения из таблицы с движком
Kafka
. #4808 (Vitaly Baranov) - Исправлено падение при запросе с
JOIN ON
с неnullable
и nullable колонкой. Также исправлено поведение при появленииNULLs
среди ключей справа вANY JOIN
+join_use_nulls
. #4815 (Artem Zuikov) - Исправлена ошибка сегментирования в
clickhouse-copier
. #4835 (proller) - Исправлена гонка при
SELECT
запросе изsystem.tables
если таблица была конкурентно переименована или к ней был примененALTER
запрос. #4836 (alexey-milovidov) - Исправлена гонка при скачивании куска, который уже является устаревшим. #4839 (alexey-milovidov)
- Исправлена редкая гонка при
RENAME
запросах к таблицам семейства MergeTree. #4844 (alexey-milovidov) - Исправлена ошибка сегментирования в функции
arrayIntersect
. Ошибка возникала при вызове функции с константными и не константными аргументами. #4847 (Lixiang Qian) - Исправлена редкая ошибка при чтении из колонки типа
Array(LowCardinality)
, которая возникала, если в колонке содержалось большее количество подряд идущих пустых массивов. #4850 (Nikolai Kochetov) - Исправлено паление в запроса с
FULL/RIGHT JOIN
когда объединение происходило по nullable и не nullable колонке. #4855 (Artem Zuikov) - Исправлена ошибка
No message received
, возникавшая при скачивании кусков между репликами. #4856 (alesapin) - Исправлена ошибка в функции
arrayIntersect
приводившая к неправильным результатам в случае нескольких повторяющихся значений в массиве. #4871 (Nikolai Kochetov) - Исправлена гонка при конкурентных
ALTER COLUMN
запросах, которая могла приводить к падению сервера (исправляет issue #3421). #4592 (Alex Zatelepin) - Исправлен некорректный результат в
FULL/RIGHT JOIN
запросах с константной колонкой. #4723 (Artem Zuikov) - Исправлено появление дубликатов в
GLOBAL JOIN
со звездочкой. #4705 (Artem Zuikov) - Исправлено определение параметров кодеков в запросах
ALTER MODIFY
, если тип колонки не был указан. #4883 (alesapin) - Функции
cutQueryStringAndFragment()
иqueryStringAndFragment()
теперь работают корректно, когдаURL
содержит фрагмент, но не содержит запроса. #4894 (Vitaly Baranov) - Исправлена редкая ошибка, возникавшая при установке настройки
min_bytes_to_use_direct_io
больше нуля. Она возникла при необходимости сдвинутся в файле, который уже прочитан до конца. #4897 (alesapin) - Исправлено неправильное определение типов аргументов для агрегатных функций с
LowCardinality
аргументами (исправляет #4919). #4922 (Nikolai Kochetov) - Исправлена неверная квалификация имён в
GLOBAL JOIN
. #4969 (Artem Zuikov) - Исправлен результат функции
toISOWeek
для 1970 года. #4988 (alexey-milovidov) - Исправлено дублирование
DROP
,TRUNCATE
иOPTIMIZE
запросов, когда они выполнялисьON CLUSTER
для семейства таблицReplicatedMergeTree*
. #4991 (alesapin)
Обратно несовместимые изменения
- Настройка
insert_sample_with_metadata
переименована вinput_format_defaults_for_omitted_fields
. #4771 (Artem Zuikov) - Добавлена настройка
max_partitions_per_insert_block
(со значением по умолчанию 100). Если вставляемый блок содержит большое количество партиций, то бросается исключение. Лимит можно убрать выставив настройку в 0 (не рекомендуется). #4845 (alexey-milovidov) - Функции мультипоиска были переименованы (
multiPosition
вmultiSearchAllPositions
,multiSearch
вmultiSearchAny
,firstMatch
вmultiSearchFirstIndex
). #4780 (Danila Kutenin)
Улучшение производительности
- Оптимизирован поиска с помощью алгоритма Volnitsky с помощью инлайнинга. Это дает около 5-10% улучшения производительности поиска для запросов ищущих множество слов или много одинаковых биграмм. #4862 (Danila Kutenin)
- Исправлено снижение производительности при выставлении настройки
use_uncompressed_cache
больше нуля для запросов, данные которых целиком лежат в кеше. #4913 (alesapin)
Улучшения сборки/тестирования/пакетирования
- Более строгие настройки для debug-сборок: более гранулярные маппинги памяти и использование ASLR; добавлена защита памяти для кеша засечек и индекса. Это позволяет найти больше ошибок порчи памяти, которые не обнаруживают address-санитайзер и thread-санитайзер. #4632 (alexey-milovidov)
- Добавлены настройки
ENABLE_PROTOBUF
,ENABLE_PARQUET
иENABLE_BROTLI
которые позволяют отключить соответствующие компоненты. #4669 (Silviu Caragea) - Теперь при зависании запросов во время работы тестов будет показан список запросов и стек-трейсы всех потоков. #4675 (alesapin)
- Добавлены ретраи при ошибке
Connection loss
вclickhouse-test
. #4682 (alesapin) - Добавлена возможность сборки под FreeBSD в
packager
-скрипт. #4712 #4748 (alesapin) - Теперь при установке предлагается установить пароль для пользователя
'default'
. #4725 (proller) - Убраны предупреждения из библиотеки
rdkafka
при сборке. #4740 (alexey-milovidov) - Добавлена возможность сборки без поддержки ssl. #4750 (proller)
- Добавлена возможность запускать докер-образ с clickhouse-server из под любого пользователя. #4753 (Mikhail f. Shiryaev)
- Boost обновлен до 1.69. #4793 (proller)
- Отключено использование
mremap
при сборке с thread-санитайзером, что приводило к ложным срабатываниям. Исправлены ошибки thread-санитайзера в stateful-тестах. #4859 (alexey-milovidov) - Добавлен тест проверяющий использование схемы форматов для HTTP-интерфейса. #4864 (Vitaly Baranov)
ClickHouse release 19.4.4.33, 2019-04-17
Исправление ошибок
- В случае невозможности выделить память вместо вызова
std::terminate
бросается исключениеstd::bad_alloc
. #4665 (alexey-milovidov) - Исправлены ошибки чтения capnproto из буфера. Иногда файлы не загружались по HTTP. #4674 (Vladislav)
- Исправлена ошибка
Unknown log entry type: 0
после запросаOPTIMIZE TABLE FINAL
. #4683 (Amos Bird) - При передаче неправильных аргументов в
hasAny
иhasAll
могла происходить ошибка сегментирования. #4698 (alexey-milovidov) - Исправлен дедлок, который мог происходить при запросе
DROP DATABASE dictionary
. #4701 (alexey-milovidov) - Исправлено неопределенное поведение в функциях
median
иquantile
. #4702 (hcz) - Исправлено определение уровня сжатия при указании настройки
network_compression_method
в нижнем регистре. Было сломано в v19.1. #4706 (proller) - Настройка
<timezone>UTC</timezone>
больше не игнорируется (исправляет issue #4658). #4718 (proller) - Исправлено поведение функции
histogram
сDistributed
таблицами. #4741 (olegkv) - Исправлено срабатывание thread-санитайзера с ошибкой
destroy of a locked mutex
. #4742 (alexey-milovidov) - Исправлено срабатывание thread-санитайзера при завершении сервера, вызванное гонкой при использовании системных логов. Также исправлена потенциальная ошибка use-after-free при завершении сервера в котором был включен
part_log
. #4758 (alexey-milovidov) - Исправлена перепроверка кусков в
ReplicatedMergeTreeAlterThread
при появлении ошибок. #4772 (Nikolai Kochetov) - Исправлена работа арифметических операций с промежуточными состояниями агрегатных функций для константных аргументов (таких как результаты подзапросов). #4776 (alexey-milovidov)
- Теперь имена колонок всегда экранируются в файлах с метаинформацией. В противном случае было невозможно создать таблицу с колонкой с именем
index
. #4782 (alexey-milovidov) - Исправлено падение в запросе
ALTER ... MODIFY ORDER BY
кDistributed
таблице. #4790 (TCeason) - Исправлена ошибка сегментирования при запросах с
JOIN ON
и включенной настройкойenable_optimize_predicate_expression
. #4794 (Winter Zhang) - Исправлено добавление лишней строки после чтения protobuf-сообщения из таблицы с движком
Kafka
. #4808 (Vitaly Baranov) - Исправлена ошибка сегментирования в
clickhouse-copier
. #4835 (proller) - Исправлена гонка при
SELECT
запросе изsystem.tables
если таблица была конкурентно переименована или к ней был примененALTER
запрос. #4836 (alexey-milovidov) - Исправлена гонка при скачивании куска, который уже является устаревшим. #4839 (alexey-milovidov)
- Исправлена редкая гонка при
RENAME
запросах к таблицам семейства MergeTree. #4844 (alexey-milovidov) - Исправлена ошибка сегментирования в функции
arrayIntersect
. Ошибка возникала при вызове функции с константными и не константными аргументами. #4847 (Lixiang Qian) - Исправлена редкая ошибка при чтении из колонки типа
Array(LowCardinality)
, которая возникала, если в колонке содержалось большее количество подряд идущих пустых массивов. #4850 (Nikolai Kochetov) - Исправлена ошибка
No message received
, возникавшая при скачивании кусков между репликами. #4856 (alesapin) - Исправлена ошибка в функции
arrayIntersect
приводившая к неправильным результатам в случае нескольких повторяющихся значений в массиве. #4871 (Nikolai Kochetov) - Исправлена гонка при конкурентных
ALTER COLUMN
запросах, которая могла приводить к падению сервера (исправляет issue #3421). #4592 (Alex Zatelepin) - Исправлено определение параметров кодеков в запросах
ALTER MODIFY
, если тип колонки не был указан. #4883 (alesapin) - Функции
cutQueryStringAndFragment()
иqueryStringAndFragment()
теперь работают корректно, когдаURL
содержит фрагмент, но не содержит запроса. #4894 (Vitaly Baranov) - Исправлена редкая ошибка, возникавшая при установке настройки
min_bytes_to_use_direct_io
больше нуля. Она возникла при необходимости сдвинутся в файле, который уже прочитан до конца. #4897 (alesapin) - Исправлено неправильное определение типов аргументов для агрегатных функций с
LowCardinality
аргументами (исправляет #4919). #4922 (Nikolai Kochetov) - Исправлен результат функции
toISOWeek
для 1970 года. #4988 (alexey-milovidov) - Исправлено дублирование
DROP
,TRUNCATE
иOPTIMIZE
запросов, когда они выполнялисьON CLUSTER
для семейства таблицReplicatedMergeTree*
. #4991 (alesapin)
Улучшения
- Теперь обычные колонки, а также колонки
DEFAULT
,MATERIALIZED
иALIAS
хранятся в одном списке (исправляет issue #2867). #4707 (Alex Zatelepin)
ClickHouse release 19.4.3.11, 2019-04-02
Исправление ошибок
- Исправлено паление в запроса с
FULL/RIGHT JOIN
когда объединение происходило по nullable и не nullable колонке. #4855 (Artem Zuikov) - Исправлена ошибка сегментирования в
clickhouse-copier
. #4835 (proller)
Улучшения сборки/тестирования/пакетирования
- Добавлена возможность запускать докер-образ с clickhouse-server из под любого пользователя. #4753 (Mikhail f. Shiryaev)
ClickHouse release 19.4.2.7, 2019-03-30
Исправление ошибок
- Исправлена редкая ошибка при чтении из колонки типа
Array(LowCardinality)
, которая возникала, если в колонке содержалось большее количество подряд идущих пустых массивов. #4850 (Nikolai Kochetov)
ClickHouse release 19.4.1.3, 2019-03-19
Исправление ошибок
- Исправлено поведение удаленных запросов, которые одновременно содержали
LIMIT BY
иLIMIT
. Раньше для таких запросовLIMIT
мог быть выполнен доLIMIT BY
, что приводило к перефильтрации. #4708 (Constantin S. Pan)
ClickHouse release 19.4.0.49, 2019-03-09
Новые возможности
- Добавлена полная поддержка формата
Protobuf
(чтение и запись, вложенные структуры данных). #4174 #4493 (Vitaly Baranov) - Добавлены функции для работы с битовыми масками с использованием библиотеки Roaring Bitmaps. #4207 (Andy Yang) #4568 (Vitaly Baranov)
- Поддержка формата
Parquet
#4448 (proller) - Вычисление расстояния между строками с помощью подсчёта N-грам - для приближённого сравнения строк. Алгоритм похож на q-gram metrics в языке R. #4466 (Danila Kutenin)
- Движок таблиц GraphiteMergeTree поддерживает отдельные шаблоны для правил агрегации и для правил времени хранения. #4426 (Mikhail f. Shiryaev)
- Добавлены настройки
max_execution_speed
иmax_execution_speed_bytes
для того, чтобы ограничить потребление ресурсов запросами. Добавлена настройкаmin_execution_speed_bytes
в дополнение кmin_execution_speed
. #4430 (Winter Zhang) - Добавлена функция
flatten
- конвертация многомерных массивов в плоский массив. #4555 #4409 (alexey-milovidov, kzon) - Добавлены функции
arrayEnumerateDenseRanked
иarrayEnumerateUniqRanked
(похожа наarrayEnumerateUniq
но позволяет указать глубину, на которую следует смотреть в многомерные массивы). #4475 (proller) #4601 (alexey-milovidov) - Добавлена поддержка множества JOIN в одном запросе без подзапросов, с некоторыми ограничениями: без звёздочки и без алиасов сложных выражений в ON/WHERE/GROUP BY/... #4462 (Artem Zuikov)
Исправления ошибок
- Этот релиз также содержит все исправления из 19.3 и 19.1.
- Исправлена ошибка во вторичных индексах (экспериментальная возможность): порядок гранул при INSERT был неверным. #4407 (Nikita Vasilev)
- Исправлена работа вторичного индекса (экспериментальная возможность) типа
set
для столбцов типаNullable
иLowCardinality
. Ранее их использование вызывало ошибкуData type must be deserialized with multiple streams
при запросе SELECT. #4594 (Nikolai Kochetov) - Правильное запоминание времени последнего обновления при полной перезагрузке словарей типа
executable
. #4551 (Tema Novikov) - Исправлена неработоспособность прогресс-бара, возникшая в версии 19.3 #4627 (filimonov)
- Исправлены неправильные значения MemoryTracker, если кусок памяти был уменьшен в размере, в очень редких случаях. #4619 (alexey-milovidov)
- Исправлено undefined behaviour в ThreadPool #4612 (alexey-milovidov)
- Исправлено очень редкое падение с сообщением
mutex lock failed: Invalid argument
, которое могло произойти, если таблица типа MergeTree удалялась одновременно с SELECT. #4608 (Alex Zatelepin) - Совместимость ODBC драйвера с типом данных
LowCardinality
#4381 (proller) - Исправление ошибки
AIOcontextPool: Found io_event with unknown id 0
под ОС FreeBSD #4438 (urgordeadbeef) - Таблица
system.part_log
создавалась независимо от того, была ли она объявлена в конфигурации. #4483 (alexey-milovidov) - Исправлено undefined behaviour в функции
dictIsIn
для словарей типаcache
. #4515 (alesapin) - Исправлен deadlock в случае, если запрос SELECT блокирует одну и ту же таблицу несколько раз (например - из разных потоков, либо при выполнении разных подзапросов) и одновременно с этим производится DDL запрос. #4535 (Alex Zatelepin)
- Настройка
compile_expressions
выключена по-умолчанию до тех пор, пока мы не зафиксируем исходники используемой библиотекиLLVM
и не будем проверять её подASan
(сейчас библиотека LLVM берётся из системы). #4579 (alesapin) - Исправлено падение по
std::terminate
, еслиinvalidate_query
для внешних словарей с источникомclickhouse
вернул неправильный результат (пустой; более чем одну строку; более чем один столбец). Исправлена ошибка, из-за которой запросinvalidate_query
производился каждые пять секунд, независимо от указанногоlifetime
. #4583 (alexey-milovidov) - Исправлен deadlock в случае, если запрос
invalidate_query
для внешнего словаря с источникомclickhouse
использовал таблицуsystem.dictionaries
или базу данных типаDictionary
(редкий случай). #4599 (alexey-milovidov) - Исправлена работа CROSS JOIN с пустым WHERE #4598 (Artem Zuikov)
- Исправлен segfault в функции
replicate
с константным аргументом. #4603 (alexey-milovidov) - Исправлена работа predicate pushdown (настройка
enable_optimize_predicate_expression
) с лямбда-функциями. #4408 (Winter Zhang) - Множественные исправления для множества JOIN в одном запросе. #4595 (Artem Zuikov)
Улучшения
- Поддержка алиасов в секции JOIN ON для правой таблицы #4412 (Artem Zuikov)
- Используются правильные алиасы в случае множественных JOIN с подзапросами. #4474 (Artem Zuikov)
- Исправлена логика работы predicate pushdown (настройка
enable_optimize_predicate_expression
) для JOIN. #4387 (Ivan)
Улучшения производительности
- Улучшена эвристика оптимизации "перенос в PREWHERE". #4405 (alexey-milovidov)
- Используются настоящие lookup таблицы вместо хэш-таблиц в случае 8 и 16 битных ключей. Интерфейс хэш-таблиц обобщён, чтобы поддерживать этот случай. #4536 (Amos Bird)
- Улучшена производительность сравнения строк. #4564 (alexey-milovidov)
- Очередь DDL операций (для запросов ON CLUSTER) очищается в отдельном потоке, чтобы не замедлять основную работу. #4502 (Alex Zatelepin)
- Даже если настройка
min_bytes_to_use_direct_io
выставлена в 1, не каждый файл открывался в режиме O_DIRECT, потому что размер файлов иногда недооценивался на размер одного сжатого блока. #4526 (alexey-milovidov)
Улучшения сборки/тестирования/пакетирования
- Добавлена поддержка компилятора clang-9 #4604 (alexey-milovidov)
- Исправлены неправильные
__asm__
инструкции #4621 (Konstantin Podshumok) - Добавлена поддержка задания настроек выполнения запросов для
clickhouse-performance-test
из командной строки. #4437 (alesapin) - Тесты словарей перенесены в интеграционные тесты. #4477 (alesapin)
- В набор автоматизированных тестов производительности добавлены запросы, находящиеся в разделе "benchmark" на официальном сайте. #4496 (alexey-milovidov)
- Исправления сборки в случае использования внешних библиотек lz4 и xxhash. #4495 (Orivej Desh)
- Исправлен undefined behaviour, если функция
quantileTiming
была вызвана с отрицательным или нецелым аргументом (обнаружено с помощью fuzz test под undefined behaviour sanitizer). #4506 (alexey-milovidov) - Исправлены опечатки в коде. #4531 (sdk2)
- Исправлена сборка под Mac. #4371 (Vitaly Baranov)
- Исправлена сборка под FreeBSD и для некоторых необычных конфигурациях сборки. #4444 (proller)
ClickHouse release 19.3.7, 2019-03-12
Исправления ошибок
- Исправлена ошибка в #3920. Ошибка проявлялась в виде случайных повреждений кэша (сообщения
Unknown codec family code
,Cannot seek through file
) и segfault. Ошибка впервые возникла в 19.1 и присутствует во всех версиях до 19.1.10 и 19.3.6. #4623 (alexey-milovidov)
ClickHouse release 19.3.6, 2019-03-02
Исправления ошибок
- Если в пуле потоков было более 1000 потоков, то при выходе из потока, вызывается
std::terminate
. Azat Khuzhin #4485 #4505 (alexey-milovidov) - Теперь возможно создавать таблицы
ReplicatedMergeTree*
с комментариями столбцов без указания DEFAULT, а также с CODEC но без COMMENT и DEFAULT. Исправлено сравнение CODEC друг с другом. #4523 (alesapin) - Исправлено падение при JOIN по массивам и кортежам. #4552 (Artem Zuikov)
- Исправлено падение
clickhouse-copier
с сообщениемThreadStatus not created
. #4540 (Artem Zuikov) - Исправлено зависание сервера при завершении работы в случае использования распределённых DDL. #4472 (Alex Zatelepin)
- В сообщениях об ошибке при парсинге текстовых форматов, выдавались неправильные номера столбцов, в случае, если номер больше 10. #4484 (alexey-milovidov)
Улучшения сборки/тестирования/пакетирования
- Исправлена сборка с включенным AVX. #4527 (alexey-milovidov)
- Исправлена поддержка расширенных метрик выполнения запроса в случае, если ClickHouse был собран на системе с новым ядром Linux, а запускается на системе с существенно более старым ядром. #4541 (nvartolomei)
- Продолжение работы в случае невозможности применить настройку
core_dump.size_limit
с выводом предупреждения. #4473 (proller) - Удалено
inline
дляvoid readBinary(...)
вField.cpp
. #4530 (hcz)
ClickHouse release 19.3.5, 2019-02-21
Исправления ошибок:
- Исправлена ошибка обработки длинных http-запросов на вставку на стороне сервера. #4454 (alesapin)
- Исправлена обратная несовместимость со старыми версиями, появившаяся из-за некорректной реализации настройки
send_logs_level
. #4445 (alexey-milovidov) - Исправлена обратная несовместимость табличной функции
remote
, появившаяся из-за добавления комментариев колонок. #4446 (alexey-milovidov)
ClickHouse release 19.3.4, 2019-02-16
Улучшения:
- При выполнении запроса
ATTACH TABLE
при проверке ограничений на используемую память теперь не учитывается память, занимаемая индексом таблицы. Это позволяет избежать ситуации, когда невозможно сделатьATTACH TABLE
после соответствующегоDETACH TABLE
. #4396 (alexey-milovidov) - Немного увеличены ограничения на максимальный размер строки и массива, полученные от ZooKeeper. Это позволяет продолжать работу после увеличения настройки ZooKeeper
CLIENT_JVMFLAGS=-Djute.maxbuffer=...
. #4398 (alexey-milovidov) - Теперь реплику, отключенную на длительный период, можно восстановить, даже если в её очереди скопилось огромное число записей. #4399 (alexey-milovidov)
- Для вторичных индексов типа
set
добавлен обязательный параметр (максимальное число хранимых значений). #4386 (Nikita Vasilev)
Исправления ошибок:
- Исправлен неверный результат запроса с модификатором
WITH ROLLUP
при группировке по единственному столбцу типаLowCardinality
. #4384 (Nikolai Kochetov) - Исправлена ошибка во вторичном индексе типа
set
(гранулы, в которых было больше, чемmax_rows
строк, игнорировались). #4386 (Nikita Vasilev) - Исправлена подстановка alias-ов в запросах с подзапросом, содержащим этот же alias (#4110). #4351 (Artem Zuikov)
Улучшения сборки/тестирования/пакетирования:
- Множество исправлений для сборки под FreeBSD. #4397 (proller)
- Возможность запускать
clickhouse-server
для stateless тестов из docker-образа. #4347 (Vasily Nemkov)
ClickHouse release 19.3.3, 2019-02-13
Новые возможности:
- Добавлен запрос
KILL MUTATION
, который позволяет удалять мутации, которые по какой-то причине не могут выполниться. В таблицуsystem.mutations
для облегчения диагностики добавлены столбцыlatest_failed_part
,latest_fail_time
,latest_fail_reason
. #4287 (Alex Zatelepin) - Добавлена агрегатная функция
entropy
, которая вычисляет энтропию Шеннона. #4238 (Quid37) - Добавлена обобщённая реализация функции
arrayWithConstant
. #4322 (alexey-milovidov) - Добавлен оператор сравнения
NOT BETWEEN
. #4228 (Dmitry Naumov) - Добавлена функция
sumMapFiltered
- вариантsumMap
, позволяющий указать набор ключей, по которым будет производиться суммирование. #4129 (Léo Ercolanelli) - Добавлена функция
sumMapWithOverflow
. #4151 (Léo Ercolanelli) - Добавлена поддержка
Nullable
типов в табличной функцииmysql
. #4198 (Emmanuel Donin de Rosière) - Добавлена поддержка произвольных константных выражений в секции
LIMIT
. #4246 (k3box) - Добавлена агрегатная функция
topKWeighted
- вариантtopK
, позволяющий задавать (целый неотрицательный) вес добавляемого значения. #4245 (Andrew Golman) - Движок
Join
теперь поддерживает настройкуjoin_any_take_last_row
, которая позволяет перезаписывать значения для существующих ключей. #3973 (Amos Bird) - Добавлена функция
toStartOfInterval
. #4304 (Vitaly Baranov) - Добавлена функция
toStartOfTenMinutes
. #4298 (Vitaly Baranov) - Добавлен формат
RowBinaryWithNamesAndTypes
. #4200 (Oleg V. Kozlyuk) - Добавлены типы
IPv4
иIPv6
. Более эффективная реализация функцийIPv*
. #3669 (Vasily Nemkov) - Добавлен выходной формат
Protobuf
. #4005 #4158 (Vitaly Baranov) - В HTTP-интерфейсе добавлена поддержка алгоритма сжатия brotli для вставляемых данных. #4235 (Mikhail)
- Клиент командной строки теперь подсказывает правильное имя, если пользователь опечатался в названии функции. #4239 (Danila Kutenin)
- В HTTP-ответ сервера добавлен заголовок
Query-Id
. #4231 (Mikhail)
Экспериментальные возможности:
- Добавлена поддержка вторичных индексов типа
minmax
иset
для таблиц семейства MergeTree (позволяют быстро пропускать целые блоки данных). #4143 (Nikita Vasilev) - Добавлена поддержка преобразования
CROSS JOIN
вINNER JOIN
, если это возможно. #4221 #4266 (Artem Zuikov)
Исправления ошибок:
- Исправлена ошибка
Not found column
для случая дублирующихся столбцов в секцииJOIN ON
. #4279 (Artem Zuikov) - Команда
START REPLICATED SENDS
теперь действительно включает посылку кусков данных при репликации. #4229 (nvartolomei) - Исправлена агрегация столбцов типа
Array(LowCardinality)
. #4055 (KochetovNicolai) - Исправлена ошибка, приводившая к тому, что при исполнении запроса
INSERT ... SELECT ... FROM file(...)
терялась первая строчка файла, если он был в форматеCSVWithNames
илиTSVWIthNames
. #4297 (alexey-milovidov) - Исправлено падение при перезагрузке внешнего словаря, если словарь недоступен. Ошибка возникла в 19.1.6. #4188 (proller)
- Исправлен неверный результат
ALL JOIN
, если в правой таблице присутствуют дубликаты ключа join. #4184 (Artem Zuikov) - Исправлено падение сервера при включённой опции
use_uncompressed_cache
, а также исключение о неправильном размере разжатых данных. #4186 (alesapin) - Исправлена ошибка, приводящая к неправильному результату сравнения больших (не помещающихся в Int16) дат при включённой настройке
compile_expressions
. #4341 (alesapin) - Исправлен бесконечный цикл при запросе из табличной функции
numbers(0)
. #4280 (alexey-milovidov) - Временно отключён pushdown предикатов в подзапрос, если он содержит
ORDER BY
. #3890 (Winter Zhang) - Исправлена ошибка
Illegal instruction
при использовании функций для работы с base64 на старых CPU. Ошибка проявлялась только, если ClickHouse был скомпилирован с gcc-8. #4275 (alexey-milovidov) - Исправлена ошибка
No message received
при запросах к PostgreSQL через ODBC-драйвер и TLS-соединение, исправлен segfault при использовании MySQL через ODBC-драйвер. #4170 (alexey-milovidov) - Исправлен неверный результат при использовании значений типа
Date
илиDateTime
в ветвях условного оператора (функцииif
). Функцияif
теперь работает для произвольного типа значений в ветвях. #4243 (alexey-milovidov) - Словари с источником из локального ClickHouse теперь исполняются локально, а не используя TCP-соединение. #4166 (alexey-milovidov)
- Исправлено зависание запросов к таблице с движком
File
после того, какSELECT
из этой таблицы завершился с ошибкойNo such file or directory
. #4161 (alexey-milovidov) - Исправлена ошибка, из-за которой при запросе к таблице
system.tables
могло возникать исключениеtable doesn't exist
. #4313 (alexey-milovidov) - Исправлена ошибка, приводившая к падению
clickhouse-client
в интерактивном режиме, если успеть выйти из него во время загрузки подсказок командной строки. #4317 (alexey-milovidov) - Исправлена ошибка, приводившая к неверным результатам исполнения мутаций, содержащих оператор
IN
. #4099 (Alex Zatelepin) - Исправлена ошибка, из-за которой, если была создана база данных с движком
Dictionary
, все словари загружались при старте сервера, а словари с источником из локального ClickHouse не могли загрузиться. #4255 (alexey-milovidov) - Исправлено повторное создание таблиц с системными логами (
system.query_log
,system.part_log
) при остановке сервера. #4254 (alexey-milovidov) - Исправлен вывод типа возвращаемого значения, а также использование блокировок в функции
joinGet
. #4153 (Amos Bird) - Исправлено падение сервера при использовании настройки
allow_experimental_multiple_joins_emulation
. 52de2c (Artem Zuikov) - Исправлено некорректное сравнение значений типа
Date
иDateTime
. #4237 (valexey) - Исправлена ошибка, проявлявшаяся при fuzz-тестировании с undefined behaviour-санитайзером: добавлена проверка типов параметров для семейства функций
quantile*Weighted
. #4145 (alexey-milovidov) - Исправлена редкая ошибка, из-за которой при удалении старых кусков данных может возникать ошибка
File not found
. #4378 (alexey-milovidov) - Исправлена установка пакета при отсутствующем файле /etc/clickhouse-server/config.xml. #4343 (proller)
Улучшения сборки/тестирования/пакетирования:
- При установке Debian-пакета символическая ссылка /etc/clickhouse-server/preprocessed теперь создаётся, учитывая пути, прописанные в конфигурационном файле. #4205 (proller)
- Исправления сборки под FreeBSD. #4225 (proller)
- Добавлена возможность создавать, заполнять и удалять таблицы в тестах производительности. #4220 (alesapin)
- Добавлен скрипт для поиска дублирующихся include-директив в исходных файлах. #4326 (alexey-milovidov)
- В тестах производительности добавлена возможность запускать запросы по номеру. #4264 (alesapin)
- Пакет с debug-символами добавлен в список рекомендованных для основного пакета. #4274 (alexey-milovidov)
- Рефакторинг утилиты performance-test. Улучшено логирование и обработка сигналов. #4171 (alesapin)
- Задокументирован анонимизированный датасет Яндекс.Метрики. #4164 (alesapin)
- Добавлен инструмент для конвертирования кусков данных таблиц, созданных с использованием старого синтаксиса с помесячным партиционированием, в новый формат. #4195 (Alex Zatelepin)
- Добавлена документация для двух датасетов, загруженных в s3. #4144 (alesapin)
- Добавлен инструмент, собирающий changelog из описаний pull request-ов. #4169 #4173 (KochetovNicolai) (KochetovNicolai)
- Добавлен puppet-модуль для Clickhouse. #4182 (Maxim Fedotov)
- Добавлена документация для нескольких недокументированных функций. #4168 (Winter Zhang)
- Исправления сборки под ARM. #4210#4306 #4291 (proller) (proller)
- Добавлена возможность запускать тесты словарей из
ctest
. #4189 (proller) - Теперь директорией с SSL-сертификатами по умолчанию является
/etc/ssl
. #4167 (alexey-milovidov) - Добавлена проверка доступности SSE и AVX-инструкций на старте. #4234 (Igr)
- Init-скрипт теперь дожидается, пока сервер запустится. #4281 (proller)
Обратно несовместимые изменения:
- Удалена настройка
allow_experimental_low_cardinality_type
. Семейство типов данныхLowCardinality
готово для использования в production. #4323 (alexey-milovidov) - Размер кэша засечек и кэша разжатых блоков теперь уменьшается в зависимости от доступного объёма памяти. #4240 (Lopatin Konstantin)
- Для запроса
CREATE TABLE
добавлено ключевое словоINDEX
. Имя столбцаindex
теперь надо оборачивать в двойные или обратные кавычки:`index`
. #4143 (Nikita Vasilev) - Функция
sumMap
теперь возвращает тип с большей областью значений вместо переполнения. Если необходимо старое поведение, следует использовать добавленную функциюsumMapWithOverflow
. #4151 (Léo Ercolanelli)
Улучшения производительности:
- Для запросов без секции
LIMIT
вместоstd::sort
теперь используетсяpdqsort
. #4236 (Evgenii Pravda) - Теперь сервер переиспользует потоки для выполнения запросов из глобального пула потоков. В краевых случаях это влияет на производительность. #4150 (alexey-milovidov)
Улучшения:
- Теперь, если в нативном протоколе послать запрос
INSERT INTO tbl VALUES (....
(с данными в запросе), отдельно посылать разобранные данные для вставки не нужно. #4301 (alesapin) - Добавлена поддержка AIO для FreeBSD. #4305 (urgordeadbeef)
- Запрос
SELECT * FROM a JOIN b USING a, b
теперь возвращает столбцыa
иb
только из левой таблицы. #4141 (Artem Zuikov) - Добавлена опция командной строки
-C
для клиента, которая работает так же, как и опция-c
. #4232 (syominsergey) - Если для опции
--password
клиента командной строки не указано значение, пароль запрашивается из стандартного входа. #4230 (BSD_Conqueror) - Добавлена подсветка метасимволов в строковых литералах, содержащих выражения для оператора
LIKE
и регулярные выражения. #4327 (alexey-milovidov) - Добавлена отмена HTTP-запроса, если сокет клиента отваливается. #4213 (nvartolomei)
- Теперь сервер время от времени посылает пакеты Progress для поддержания соединения. #4215 (Ivan)
- Немного улучшено сообщение о причине, почему запрос OPTIMIZE не может быть исполнен (если включена настройка
optimize_throw_if_noop
). #4294 (alexey-milovidov) - Добавлена поддержка опции
--version
дляclickhouse-server
. #4251 (Lopatin Konstantin) - Добавлена поддержка опции
--help/-h
дляclickhouse-server
. #4233 (Yuriy Baranov) - Добавлена поддержка скалярных подзапросов, возвращающих состояние агрегатной функции. #4348 (Nikolai Kochetov)
- Уменьшено время ожидания завершения сервера и завершения запросов
ALTER
. #4372 (alexey-milovidov) - Добавлена информация о значении настройки
replicated_can_become_leader
в таблицуsystem.replicas
. Добавлено логирование в случае, если реплика не собирается стать лидером. #4379 (Alex Zatelepin)
ClickHouse release 19.1.14, 2019-03-14
- Исправлена ошибка
Column ... queried more than once
, которая могла произойти в случае включенной настройкиasterisk_left_columns_only
в случае использованияGLOBAL JOIN
а такжеSELECT *
(редкий случай). Эта ошибка изначально отсутствует в версиях 19.3 и более новых. 6bac7d8d (Artem Zuikov)
ClickHouse release 19.1.13, 2019-03-12
Этот релиз содержит такие же исправления ошибок, как и 19.3.7.
ClickHouse release 19.1.10, 2019-03-03
Этот релиз содержит такие же исправления ошибок, как и 19.3.6.
ClickHouse release 19.1.9, 2019-02-21
Исправления ошибок:
- Исправлена обратная несовместимость со старыми версиями, появившаяся из-за некорректной реализации настройки
send_logs_level
. #4445 (alexey-milovidov) - Исправлена обратная несовместимость табличной функции
remote
, появившаяся из-за добавления комментариев колонок. #4446 (alexey-milovidov)
ClickHouse release 19.1.8, 2019-02-16
Исправления ошибок:
- Исправлена установка пакета при отсутствующем файле /etc/clickhouse-server/config.xml. #4343 (proller)
ClickHouse release 19.1.7, 2019-02-15
Исправления ошибок:
- Исправлен вывод типа возвращаемого значения, а также использование блокировок в функции
joinGet
. #4153 (Amos Bird) - Исправлено повторное создание таблиц с системными логами (
system.query_log
,system.part_log
) при остановке сервера. #4254 (alexey-milovidov) - Исправлена ошибка, из-за которой, если была создана база данных с движком
Dictionary
, все словари загружались при старте сервера, а словари с источником из локального ClickHouse не могли загрузиться. #4255 (alexey-milovidov) - Исправлена ошибка, приводившая к неверным результатам исполнения мутаций, содержащих оператор
IN
. #4099 (Alex Zatelepin) - Исправлена ошибка, приводившая к падению
clickhouse-client
в интерактивном режиме, если успеть выйти из него во время загрузки подсказок командной строки. #4317 (alexey-milovidov) - Исправлена ошибка, из-за которой при запросе к таблице
system.tables
могло возникать исключениеtable doesn't exist
. #4313 (alexey-milovidov) - Исправлено зависание запросов к таблице с движком
File
после того, какSELECT
из этой таблицы завершился с ошибкойNo such file or directory
. #4161 (alexey-milovidov) - Словари с источником из локального ClickHouse теперь исполняются локально, а не используя TCP-соединение. #4166 (alexey-milovidov)
- Исправлена ошибка
No message received
при запросах к PostgreSQL через ODBC-драйвер и TLS-соединение, исправлен segfault при использовании MySQL через ODBC-драйвер. #4170 (alexey-milovidov) - Временно отключён pushdown предикатов в подзапрос, если он содержит
ORDER BY
. #3890 (Winter Zhang) - Исправлен бесконечный цикл при запросе из табличной функции
numbers(0)
. #4280 (alexey-milovidov) - Исправлена ошибка, приводящая к неправильному результату сравнения больших (не помещающихся в Int16) дат при включённой настройке
compile_expressions
. #4341 (alesapin) - Исправлено падение сервера при включённой опции
uncompressed_cache
, а также исключение о неправильном размере разжатых данных. #4186 (alesapin) - Исправлен неверный результат
ALL JOIN
, если в правой таблице присутствуют дубликаты ключа join. #4184 (Artem Zuikov) - Исправлена ошибка, приводившая к тому, что при исполнении запроса
INSERT ... SELECT ... FROM file(...)
терялась первая строчка файла, если он был в форматеCSVWithNames
илиTSVWIthNames
. #4297 (alexey-milovidov) - Исправлена агрегация столбцов типа
Array(LowCardinality)
. #4055 (KochetovNicolai) - При установке Debian-пакета символическая ссылка /etc/clickhouse-server/preprocessed теперь создаётся, учитывая пути, прописанные в конфигурационном файле. #4205 (proller)
- Исправлена ошибка, проявлявшаяся при fuzz-тестировании с undefined behaviour-санитайзером: добавлена проверка типов параметров для семейства функций
quantile*Weighted
. #4145 (alexey-milovidov) - Команда
START REPLICATED SENDS
теперь действительно включает посылку кусков данных при репликации. #4229 (nvartolomei) - Исправлена ошибка
Not found column
для случая дублирующихся столбцов в секцииJOIN ON
. #4279 (Artem Zuikov) - Теперь директорией с SSL-сертификатами по умолчанию является
/etc/ssl
. #4167 (alexey-milovidov) - Исправлено падение при перезагрузке внешнего словаря, если словарь недоступен. Ошибка возникла в 19.1.6. #4188 (proller)
- Исправлено некорректное сравнение значений типа
Date
иDateTime
. #4237 (valexey) - Исправлен неверный результат при использовании значений типа
Date
илиDateTime
в ветвях условного оператора (функцииif
). Функцияif
теперь работает для произвольного типа значений в ветвях. #4243 (alexey-milovidov)
ClickHouse release 19.1.6, 2019-01-24
Новые возможности:
- Задание формата сжатия для отдельных столбцов. #3899 #4111 (alesapin, Winter Zhang, Anatoly)
- Формат сжатия
Delta
. #4052 (alesapin) - Изменение формата сжатия запросом
ALTER
. #4054 (alesapin) - Добавлены функции
left
,right
,trim
,ltrim
,rtrim
,timestampadd
,timestampsub
для совместимости со стандартом SQL. #3826 (Ivan Blinkov) - Поддержка записи в движок
HDFS
и табличную функциюhdfs
. #4084 (alesapin) - Добавлены функции поиска набора константных строк в тексте:
multiPosition
,multiSearch
,firstMatch
также с суффиксами-UTF8
,-CaseInsensitive
, и-CaseInsensitiveUTF8
. #4053 (Danila Kutenin) - Пропуск неиспользуемых шардов в случае, если запрос
SELECT
содержит фильтрацию по ключу шардирования (настройкаoptimize_skip_unused_shards
). #3851 (Gleb Kanterov, Ivan) - Пропуск строк в случае ошибки парсинга для движка
Kafka
(настройкаkafka_skip_broken_messages
). #4094 (Ivan) - Поддержка применения мультиклассовых моделей
CatBoost
. ФункцияmodelEvaluate
возвращает кортеж в случае использования мультиклассовой модели.libcatboostmodel.so
should be built with #607. #3959 (KochetovNicolai) - Добавлены функции
filesystemAvailable
,filesystemFree
,filesystemCapacity
. #4097 (Boris Granveaud) - Добавлены функции хеширования
xxHash64
иxxHash32
. #3905 (filimonov) - Добавлена функция хеширования
gccMurmurHash
(GCC flavoured Murmur hash), использующая те же hash seed, что и gcc #4000 (sundyli) - Добавлены функции хеширования
javaHash
,hiveHash
. #3811 (shangshujie365) - Добавлена функция
remoteSecure
. Функция работает аналогичноremote
, но использует безопасное соединение. #4088 (proller)
Экспериментальные возможности:
- Эмуляция запросов с несколькими секциями
JOIN
(настройкаallow_experimental_multiple_joins_emulation
). #3946 (Artem Zuikov)
Исправления ошибок:
- Ограничен размер кеша скомпилированных выражений в случае, если не указана настройка
compiled_expression_cache_size
для экономии потребляемой памяти. #4041 (alesapin) - Исправлена проблема зависания потоков, выполняющих запрос
ALTER
для таблиц семействаReplicated
, а также потоков, обновляющих конфигурацию из ZooKeeper. #2947 #3891 #3934 (Alex Zatelepin) - Исправлен race condition в случае выполнения распределенной задачи запроса
ALTER
. Race condition приводил к состоянию, когда более чем одна реплика пыталась выполнить задачу, в результате чего все такие реплики, кроме одной, падали с ошибкой обращения к ZooKeeper. #3904 (Alex Zatelepin) - Исправлена проблема обновления настройки
from_zk
. Настройка, указанная в файле конфигурации, не обновлялась в случае, если запрос к ZooKeeper падал по timeout. #2947 #3947 (Alex Zatelepin) - Исправлена ошибка в вычислении сетевого префикса при указании IPv4 маски подсети. #3945 (alesapin)
- Исправлено падение (
std::terminate
) в редком сценарии, когда новый поток не мог быть создан из-за нехватки ресурсов. #3956 (alexey-milovidov) - Исправлено падение табличной функции
remote
в случае, когда не удавалось получить структуру таблицы из-за ограничений пользователя. #4009 (alesapin) - Исправлена утечка сетевых сокетов. Сокеты создавались в пуле и никогда не закрывались. При создании потока, создавались новые сокеты в случае, если все доступные использовались. #4017 (Alex Zatelepin)
- Исправлена проблема закрывания
/proc/self/fd
раньше, чем все файловые дескрипторы были прочитаны из/proc
после создания процессаodbc-bridge
. #4120 (alesapin) - Исправлен баг в монотонном преобразовании String в UInt в случае использования String в первичном ключе. #3870 (Winter Zhang)
- Исправлен баг в вычислении монотонности функции преобразования типа целых значений. #3921 (alexey-milovidov)
- Исправлено падение в функциях
arrayEnumerateUniq
,arrayEnumerateDense
при передаче невалидных аргументов. #3909 (alexey-milovidov) - Исправлен undefined behavior в StorageMerge. #3910 (Amos Bird)
- Исправлено падение в функциях
addDays
,subtractDays
. #3913 (alexey-milovidov) - Исправлена проблема, в результате которой функции
round
,floor
,trunc
,ceil
могли возвращать неверный результат для отрицательных целочисленных аргументов с большим значением. #3914 (alexey-milovidov) - Исправлена проблема, в результате которой 'kill query sync' приводил к падению сервера. #3916 (muVulDeePecker)
- Исправлен баг, приводящий к большой задержке в случае пустой очереди репликации. #3928 #3932 (alesapin)
- Исправлено избыточное использование памяти в случае вставки в таблицу с
LowCardinality
в первичном ключе. #3955 (KochetovNicolai) - Исправлена сериализация пустых массивов типа
LowCardinality
для форматаNative
. #3907 #4011 (KochetovNicolai) - Исправлен неверный результат в случае использования distinct для числового столбца
LowCardinality
. #3895 #4012 (KochetovNicolai) - Исправлена компиляция вычисления агрегатных функций для ключа
LowCardinality
(для случая, когда включена настройкаcompile
). #3886 (KochetovNicolai) - Исправлена передача пользователя и пароля для запросов с реплик. #3957 (alesapin) (小路)
- Исправлен очень редкий race condition возникающий при перечислении таблиц из базы данных типа
Dictionary
во время перезагрузки словарей. #3970 (alexey-milovidov) - Исправлен неверный результат в случае использования HAVING с ROLLUP или CUBE. #3756 #3837 (Sam Chou)
- Исправлена проблема с алиасами столбцов для запросов с
JOIN ON
над распределенными таблицами. #3980 (Winter Zhang) - Исправлена ошибка в реализации функции
quantileTDigest
(нашел Artem Vakhrushev). Эта ошибка никогда не происходит в ClickHouse и актуальна только для тех, кто использует кодовую базу ClickHouse напрямую в качестве библиотеки. #3935 (alexey-milovidov)
Улучшения:
- Добавлена поддержка
IF NOT EXISTS
в выраженииALTER TABLE ADD COLUMN
,IF EXISTS
в выраженииDROP/MODIFY/CLEAR/COMMENT COLUMN
. #3900 (Boris Granveaud) - Функция
parseDateTimeBestEffort
теперь поддерживает форматыDD.MM.YYYY
,DD.MM.YY
,DD-MM-YYYY
,DD-Mon-YYYY
,DD/Month/YYYY
и аналогичные. #3922 (alexey-milovidov) CapnProtoInputStream
теперь поддерживает jagged структуры. #4063 (Odin Hultgren Van Der Horst)- Улучшение usability: добавлена проверка, что сервер запущен от пользователя, совпадающего с владельцем директории данных. Запрещен запуск от пользователя root в случае, если root не владеет директорией с данными. #3785 (sergey-v-galtsev)
- Улучшена логика проверки столбцов, необходимых для JOIN, на стадии анализа запроса. #3930 (Artem Zuikov)
- Уменьшено число поддерживаемых соединений в случае большого числа распределенных таблиц. #3726 (Winter Zhang)
- Добавлена поддержка строки с totals для запроса с
WITH TOTALS
через ODBC драйвер. #3836 (Maksim Koritckiy) - Поддержано использование
Enum
в качестве чисел в функцииif
. #3875 (Ivan) - Добавлена настройка
low_cardinality_allow_in_native_format
. Если она выключена, то типLowCadrinality
не используется в форматеNative
. #3879 (KochetovNicolai) - Удалены некоторые избыточные объекты из кеша скомпилированных выражений для уменьшения потребления памяти. #4042 (alesapin)
- Добавлена проверка того, что в запрос
SET send_logs_level = 'value'
передается верное значение. #3873 (Sabyanin Maxim) - Добавлена проверка типов для функций преобразования типов. #3896 (Winter Zhang)
Улучшения производительности:
- Добавлена настройка
use_minimalistic_part_header_in_zookeeper
для движка MergeTree. Если настройка включена, Replicated таблицы будут хранить метаданные куска в компактном виде (в соответствующем znode для этого куска). Это может значительно уменьшить размер для ZooKeeper snapshot (особенно для таблиц с большим числом столбцов). После включения данной настройки будет невозможно сделать откат к версии, которая эту настройку не поддерживает. #3960 (Alex Zatelepin) - Добавлена реализация функций
sequenceMatch
иsequenceCount
на основе конечного автомата в случае, если последовательность событий не содержит условия на время. #4004 (Léo Ercolanelli) - Улучшена производительность сериализации целых чисел. #3968 (Amos Bird)
- Добавлен zero left padding для PODArray. Теперь элемент с индексом -1 является валидным нулевым значением. Эта особенность используется для удаления условного выражения при вычислении оффсетов массивов. #3920 (Amos Bird)
- Откат версии
jemalloc
, приводящей к деградации производительности. #4018 (alexey-milovidov)
Обратно несовместимые изменения:
- Удалена недокументированная возможность
ALTER MODIFY PRIMARY KEY
, замененная выражениемALTER MODIFY ORDER BY
. #3887 (Alex Zatelepin) - Удалена функция
shardByHash
. #3833 (alexey-milovidov) - Запрещено использование скалярных подзапросов с результатом, имеющим тип
AggregateFunction
. #3865 (Ivan)
Улучшения сборки/тестирования/пакетирования:
- Добавлена поддержка сборки под PowerPC (
ppc64le
). #4132 (Danila Kutenin) - Функциональные stateful тесты запускаются на публично доступных данных. #3969 (alexey-milovidov)
- Исправлена ошибка, при которой сервер не мог запуститься с сообщением
bash: /usr/bin/clickhouse-extract-from-config: Operation not permitted
при использовании Docker или systemd-nspawn. #4136 (alexey-milovidov) - Обновлена библиотека
rdkafka
до версии v1.0.0-RC5. Использована cppkafka на замену интерфейса языка C. #4025 (Ivan) - Обновлена библиотека
mariadb-client
. Исправлена проблема, обнаруженная с использованием UBSan. #3924 (alexey-milovidov) - Исправления для сборок с UBSan. #3926 #3021 #3948 (alexey-milovidov)
- Добавлены покоммитные запуски тестов с UBSan сборкой.
- Добавлены покоммитные запуски тестов со статическим анализатором PVS-Studio.
- Исправлены проблемы, найденные с использованием PVS-Studio. #4013 (alexey-milovidov)
- Исправлены проблемы совместимости glibc. #4100 (alexey-milovidov)
- Docker образы перемещены на Ubuntu 18.10, добавлена совместимость с glibc >= 2.28 #3965 (alesapin)
- Добавлена переменная окружения
CLICKHOUSE_DO_NOT_CHOWN
, позволяющая не делать shown директории для Docker образа сервера. #3967 (alesapin) - Включены большинство предупреждений из
-Weverything
для clang. Включено-Wpedantic
. #3986 (alexey-milovidov) - Добавлены некоторые предупреждения, специфичные только для clang 8. #3993 (alexey-milovidov)
- При использовании динамической линковки используется
libLLVM
вместо библиотекиLLVM
. #3989 (Orivej Desh) - Добавлены переменные окружения для параметров
TSan
,UBSan
,ASan
в тестовом Docker образе. #4072 (alesapin) - Debian пакет
clickhouse-server
будет рекомендовать пакетlibcap2-bin
для того, чтобы использовать утилитуsetcap
для настроек. Данный пакет опционален. #4093 (alexey-milovidov) - Уменьшено время сборки, убраны ненужные включения заголовочных файлов. #3898 (proller)
- Добавлены тесты производительности для функций хеширования. #3918 (filimonov)
- Исправлены циклические зависимости библиотек. #3958 (proller)
- Улучшена компиляция при малом объеме памяти. #4030 (proller)
- Добавлен тестовый скрипт для воспроизведения деградации производительности в
jemalloc
. #4036 (alexey-milovidov) - Исправления опечаток в комментариях и строковых литералах. #4122 (maiha)
- Исправления опечаток в комментариях. #4089 (Evgenii Pravda)
ClickHouse release 18.16.1, 2018-12-21
Исправления ошибок:
- Исправлена проблема, приводившая к невозможности обновить словари с источником ODBC. #3825, #3829
- JIT-компиляция агрегатных функций теперь работает с LowCardinality столбцами. #3838
Улучшения:
- Добавлена настройка
low_cardinality_allow_in_native_format
(по умолчанию включена). Если её выключить, столбцы LowCardinality в Native формате будут преобразовываться в соответствующий обычный тип при SELECT и из этого типа при INSERT. #3879
Улучшения сборки:
- Исправления сборки под macOS и ARM.
ClickHouse release 18.16.0, 2018-12-14
Новые возможности:
- Вычисление
DEFAULT
выражений для отсутствующих полей при загрузке данных в полуструктурированных форматах (JSONEachRow
,TSKV
) (требуется включить настройку запросаinsert_sample_with_metadata
). #3555 - Для запроса
ALTER TABLE
добавлено действиеMODIFY ORDER BY
для изменения ключа сортировки при одновременном добавлении или удалении столбца таблицы. Это полезно для таблиц семействаMergeTree
, выполняющих дополнительную работу при слияниях, согласно этому ключу сортировки, как например,SummingMergeTree
,AggregatingMergeTree
и т. п. #3581 #3755 - Для таблиц семейства
MergeTree
появилась возможность указать различный ключ сортировки (ORDER BY
) и индекс (PRIMARY KEY
). Ключ сортировки может быть длиннее, чем индекс. #3581 - Добавлена табличная функция
hdfs
и движок таблицHDFS
для импорта и экспорта данных в HDFS. chenxing-xc - Добавлены функции для работы с base64:
base64Encode
,base64Decode
,tryBase64Decode
. Alexander Krasheninnikov - Для агрегатной функции
uniqCombined
появилась возможность настраивать точность работы с помощью параметра (выбирать количество ячеек HyperLogLog). #3406 - Добавлена таблица
system.contributors
, содержащая имена всех, кто делал коммиты в ClickHouse. #3452 - Добавлена возможность не указывать партицию для запроса
ALTER TABLE ... FREEZE
для бэкапа сразу всех партиций. #3514 - Добавлены функции
dictGet
,dictGetOrDefault
без указания типа возвращаемого значения. Тип определяется автоматически из описания словаря. Amos Bird - Возможность указания комментария для столбца в описании таблицы и изменения его с помощью
ALTER
. #3377 - Возможность чтения из таблицы типа
Join
в случае простых ключей. Amos Bird - Возможность указания настроек
join_use_nulls
,max_rows_in_join
,max_bytes_in_join
,join_overflow_mode
при создании таблицы типаJoin
. Amos Bird - Добавлена функция
joinGet
, позволяющая использовать таблицы типаJoin
как словарь. Amos Bird - Добавлены столбцы
partition_key
,sorting_key
,primary_key
,sampling_key
в таблицуsystem.tables
, позволяющие получить информацию о ключах таблицы. #3609 - Добавлены столбцы
is_in_partition_key
,is_in_sorting_key
,is_in_primary_key
,is_in_sampling_key
в таблицуsystem.columns
. #3609 - Добавлены столбцы
min_time
,max_time
в таблицуsystem.parts
. Эти столбцы заполняются, если ключ партиционирования является выражением от столбцов типаDateTime
. Emmanuel Donin de Rosière
Исправления ошибок:
- Исправления и улучшения производительности для типа данных
LowCardinality
.GROUP BY
поLowCardinality(Nullable(...))
. Получениеextremes
значений. Выполнение функций высшего порядка.LEFT ARRAY JOIN
. РаспределённыйGROUP BY
. Функции, возвращающиеArray
. ВыполнениеORDER BY
. Запись вDistributed
таблицы (nicelulu). Обратная совместимость для запросовINSERT
от старых клиентов, реализующихNative
протокол. ПоддержкаLowCardinality
дляJOIN
. Производительность при работе в один поток. #3823 #3803 #3799 #3769 #3744 #3681 #3651 #3649 #3641 #3632 #3568 #3523 #3518 - Исправлена работа настройки
select_sequential_consistency
. Ранее, при включенной настройке, после начала записи в новую партицию, мог возвращаться неполный результат. #2863 - Корректное указание базы данных при выполнении DDL запросов
ON CLUSTER
, а также при выполненииALTER UPDATE/DELETE
. #3772 #3460 - Корректное указание базы данных для подзапросов внутри VIEW. #3521
- Исправлена работа
PREWHERE
сFINAL
дляVersionedCollapsingMergeTree
. 7167bfd7 - Возможность с помощью запроса
KILL QUERY
отмены запросов, которые ещё не начали выполняться из-за ожидания блокировки таблицы. #3517 - Исправлены расчёты с датой и временем в случае, если стрелки часов были переведены назад в полночь (это происходит в Иране, а также было Москве с 1981 по 1983 год). Ранее это приводило к тому, что стрелки часов переводились на сутки раньше, чем нужно, а также приводило к некорректному форматированию даты-с-временем в текстовом виде. #3819
- Исправлена работа некоторых случаев
VIEW
и подзапросов без указания базы данных. Winter Zhang - Исправлен race condition при одновременном чтении из
MATERIALIZED VIEW
и удалениемMATERIALIZED VIEW
из-за отсутствия блокировки внутренней таблицыMATERIALIZED VIEW
. #3404 #3694 - Исправлена ошибка
Lock handler cannot be nullptr.
#3689 - Исправления выполнения запросов при включенной настройке
compile_expressions
(включена по-умолчанию) - убрана свёртка недетерминированных константных выражений, как например, функцииnow
. #3457 - Исправлено падение при указании неконстантного аргумента scale в функциях
toDecimal32/64/128
. - Исправлена ошибка при попытке вставки в формате
Values
массива сNULL
элементами в столбец типаArray
безNullable
(в случаеinput_format_values_interpret_expressions
= 1). #3487 #3503 - Исправлено непрерывное логгирование ошибок в
DDLWorker
, если ZooKeeper недоступен. 8f50c620 - Исправлен тип возвращаемого значения для функций
quantile*
от аргументов типаDate
иDateTime
. #3580 - Исправлена работа секции
WITH
, если она задаёт простой алиас без выражений. #3570 - Исправлена обработка запросов с именованными подзапросами и квалифицированными именами столбцов при включенной настройке
enable_optimize_predicate_expression
. Winter Zhang - Исправлена ошибка
Attempt to attach to nullptr thread group
при работе материализованных представлений. Marek Vavruša - Исправлено падение при передаче некоторых некорректных аргументов в функцию
arrayReverse
. 73e3a7b6 - Исправлен buffer overflow в функции
extractURLParameter
. Увеличена производительность. Добавлена корректная обработка строк, содержащих нулевые байты. 141e9799 - Исправлен buffer overflow в функциях
lowerUTF8
,upperUTF8
. Удалена возможность выполнения этих функций над аргументами типаFixedString
. #3662 - Исправлен редкий race condition при удалении таблиц типа
MergeTree
. #3680 - Исправлен race condition при чтении из таблиц типа
Buffer
и одновременномALTER
либоDROP
таблиц назначения. #3719 - Исправлен segfault в случае превышения ограничения
max_temporary_non_const_columns
. #3788
Улучшения:
- Обработанные конфигурационные файлы записываются сервером не в
/etc/clickhouse-server/
директорию, а в директориюpreprocessed_configs
внутриpath
. Это позволяет оставить директорию/etc/clickhouse-server/
недоступной для записи пользователемclickhouse
, что повышает безопасность. #2443 - Настройка
min_merge_bytes_to_use_direct_io
выставлена по-умолчанию в 10 GiB. Слияния, образующие крупные куски таблиц семейства MergeTree, будут производиться в режимеO_DIRECT
, что исключает вымывание кэша. #3504 - Ускорен запуск сервера в случае наличия очень большого количества таблиц. #3398
- Добавлен пул соединений и HTTP
Keep-Alive
для соединения между репликами. #3594 - В случае ошибки синтаксиса запроса, в
HTTP
интерфейсе возвращается код400 Bad Request
(ранее возвращался код 500). 31bc680a - Для настройки
join_default_strictness
выбрано значение по-умолчаниюALL
для совместимости. 120e2cbe - Убрано логгирование в
stderr
из библиотекиre2
в случае некорректных или сложных регулярных выражений. #3723 - Для движка таблиц
Kafka
: проверка наличия подписок перед началом чтения из Kafka; настройка таблицы kafka_max_block_size. Marek Vavruša - Функции
cityHash64
,farmHash64
,metroHash64
,sipHash64
,halfMD5
,murmurHash2_32
,murmurHash2_64
,murmurHash3_32
,murmurHash3_64
теперь работают для произвольного количества аргументов, а также для аргументов-кортежей. #3451 #3519 - Функция
arrayReverse
теперь работает с любыми типами массивов. 73e3a7b6 - Добавлен опциональный параметр - размер слота для функции
timeSlots
. Kirill Shvakov - Для
FULL
иRIGHT JOIN
учитывается настройкаmax_block_size
для потока неприсоединённых данных из правой таблицы. Amos Bird - В
clickhouse-benchmark
иclickhouse-performance-test
добавлен параметр командной строки--secure
для включения TLS. #3688 #3690 - Преобразование типов в случае, если структура таблицы типа
Buffer
не соответствует структуре таблицы назначения. Vitaly Baranov - Добавлена настройка
tcp_keep_alive_timeout
для включения keep-alive пакетов после неактивности в течение указанного интервала времени. #3441 - Убрано излишнее квотирование значений ключа партиции в таблице
system.parts
, если он состоит из одного столбца. #3652 - Функция деления с остатком работает для типов данных
Date
иDateTime
. #3385 - Добавлены синонимы функций
POWER
,LN
,LCASE
,UCASE
,REPLACE
,LOCATE
,SUBSTR
,MID
. #3774 #3763 Некоторые имена функций сделаны регистронезависимыми для совместимости со стандартом SQL. Добавлен синтаксический сахарSUBSTRING(expr FROM start FOR length)
для совместимости с SQL. #3804 - Добавлена возможность фиксации (
mlock
) страниц памяти, соответствующих исполняемому кодуclickhouse-server
для предотвращения вытеснения их из памяти. Возможность выключена по-умолчанию. #3553 - Увеличена производительность чтения с
O_DIRECT
(с включенной опциейmin_bytes_to_use_direct_io
). #3405 - Улучшена производительность работы функции
dictGet...OrDefault
в случае константного аргумента-ключа и неконстантного аргумента-default. Amos Bird - В функции
firstSignificantSubdomain
добавлена обработка доменовgov
,mil
,edu
. Igor Hatarist Увеличена производительность работы. #3628 - Возможность указания произвольных переменных окружения для запуска
clickhouse-server
посредствомSYS-V init.d
-скрипта с помощью указанияCLICKHOUSE_PROGRAM_ENV
в/etc/default/clickhouse
. Pavlo Bashynskyi - Правильный код возврата init-скрипта clickhouse-server. #3516
- В таблицу
system.metrics
добавлена метрикаVersionInteger
, а вsystem.build_options
добавлена строчкаVERSION_INTEGER
, содержащая версию ClickHouse в числовом представлении, вида18016000
. #3644 - Удалена возможность сравнения типа
Date
с числом, чтобы избежать потенциальных ошибок видаdate = 2018-12-17
, где ошибочно не указаны кавычки вокруг даты. #3687 - Исправлено поведение функций с состоянием типа
rowNumberInAllBlocks
- раньше они выдавали число на единицу больше вследствие их запуска во время анализа запроса. Amos Bird - При невозможности удалить файл
force_restore_data
, выводится сообщение об ошибке. Amos Bird
Улучшение сборки:
- Обновлена библиотека
jemalloc
, что исправляет потенциальную утечку памяти. Amos Bird - Для debug сборок включено по-умолчанию профилирование
jemalloc
. 2cc82f5c - Добавлена возможность запуска интеграционных тестов, при наличии установленным в системе лишь
Docker
. #3650 - Добавлен fuzz тест выражений в SELECT запросах. #3442
- Добавлен покоммитный стресс-тест, выполняющий функциональные тесты параллельно и в произвольном порядке, позволяющий обнаружить больше race conditions. #3438
- Улучшение способа запуска clickhouse-server в Docker образе. Elghazal Ahmed
- Для Docker образа добавлена поддержка инициализации базы данных с помощью файлов в директории
/docker-entrypoint-initdb.d
. Konstantin Lebedev - Исправления для сборки под ARM. #3709
Обратно несовместимые изменения:
- Удалена возможность сравнения типа
Date
с числом, необходимо вместоtoDate('2018-12-18') = 17883
, использовать явное приведение типов= toDate(17883)
#3687
ClickHouse release 18.14.19, 2018-12-19
Исправления ошибок:
- Исправлена проблема, приводившая к невозможности обновить словари с источником ODBC. #3825, #3829
- Исправлен segfault в случае превышения ограничения
max_temporary_non_const_columns
. #3788 - Корректное указание базы данных при выполнении DDL запросов
ON CLUSTER
. #3460
Улучшения сборки:
- Исправления сборки под ARM.
ClickHouse release 18.14.18, 2018-12-04
Исправления ошибок:
- Исправлена ошибка в функции
dictGet...
для словарей типаrange
, если один из аргументов константный, а другой - нет. #3751 - Исправлена ошибка, приводящая к выводу сообщений
netlink: '...': attribute type 1 has an invalid length
в логе ядра Linux, проявляющаяся на достаточно новых ядрах Linux. #3749 - Исправлен segfault при выполнении функции
empty
от аргумента типаFixedString
. Daniel, Dao Quang Minh - Исправлена избыточная аллокация памяти при большом значении настройки
max_query_size
(кусок памяти размераmax_query_size
выделялся сразу). #3720
Улучшения процесса сборки ClickHouse:
- Исправлена сборка с использованием библиотек LLVM/Clang версии 7 из пакетов ОС (эти библиотеки используются для динамической компиляции запросов). #3582
ClickHouse release 18.14.17, 2018-11-30
Исправления ошибок:
- Исправлена ситуация, при которой ODBC Bridge продолжал работу после завершения работы сервера ClickHouse. Теперь ODBC Bridge всегда завершает работу вместе с сервером. #3642
- Исправлена синхронная вставка в
Distributed
таблицу в случае явного указания неполного списка столбцов или списка столбцов в измененном порядке. #3673 - Исправлен редкий race condition, который мог привести к падению сервера при удалении MergeTree-таблиц. #3680
- Исправлен deadlock при выполнении запроса, возникающий если создание новых потоков выполнения невозможно из-за ошибки
Resource temporarily unavailable
. #3643 - Исправлена ошибка парсинга
ENGINE
при создании таблицы с синтаксисомAS table
в случае, когдаAS table
указывался послеENGINE
, что приводило к игнорированию указанного движка. #3692
ClickHouse release 18.14.15, 2018-11-21
Исправления ошибок:
- При чтении столбцов типа
Array(String)
, размер требуемого куска памяти оценивался слишком большим, что приводило к исключению "Memory limit exceeded" при выполнении запроса. Ошибка появилась в версии 18.12.13. #3589
ClickHouse release 18.14.14, 2018-11-20
Исправления ошибок:
- Исправлена работа запросов
ON CLUSTER
в случае, когда в конфигурации кластера включено шифрование (флаг<secure>
). #3599
Улучшения процесса сборки ClickHouse:
- Исправлены проблемы сборки (llvm-7 из системы, macos) #3582
ClickHouse release 18.14.13, 2018-11-08
Исправления ошибок:
- Исправлена ошибка
Block structure mismatch in MergingSorted stream
. #3162 - Исправлена работа запросов
ON CLUSTER
в случае, когда в конфигурации кластера включено шифрование (флаг<secure>
). #3465 - Исправлена ошибка при использовании
SAMPLE
,PREWHERE
и столбцов-алиасов. #3543 - Исправлена редкая ошибка
unknown compression method
при использовании настройкиmin_bytes_to_use_direct_io
. 3544
Улучшения производительности:
- Исправлена деградация производительности запросов с
GROUP BY
столбцов типа Int16, Date на процессорах AMD EPYC. Игорь Лапко - Исправлена деградация производительности при обработке длинных строк. #3530
Улучшения процесса сборки ClickHouse:
ClickHouse release 18.14.12, 2018-11-02
Исправления ошибок:
- Исправлена ошибка при join-запросе двух неименованных подзапросов. #3505
- Исправлена генерация пустой
WHERE
-части при запросах к внешним базам. hotid - Исправлена ошибка использования неправильной настройки таймаута в ODBC-словарях. Marek Vavruša
ClickHouse release 18.14.11, 2018-10-29
Исправления ошибок:
- Исправлена ошибка
Block structure mismatch in UNION stream: different number of columns
в запросах с LIMIT. #2156 - Исправлены ошибки при слиянии данных в таблицах, содержащих массивы внутри Nested структур. #3397
- Исправлен неправильный результат запросов при выключенной настройке
merge_tree_uniform_read_distribution
(включена по умолчанию). #3429 - Исправлена ошибка при вставке в Distributed таблицу в формате Native. #3411
ClickHouse release 18.14.10, 2018-10-23
- Настройка
compile_expressions
(JIT компиляция выражений) выключена по умолчанию. #3410 - Настройка
enable_optimize_predicate_expression
выключена по умолчанию.
ClickHouse release 18.14.9, 2018-10-16
Новые возможности:
- Модификатор
WITH CUBE
дляGROUP BY
(также доступен синтаксис:GROUP BY CUBE(...)
). #3172 - Добавлена функция
formatDateTime
. Alexandr Krasheninnikov - Добавлен движок таблиц
JDBC
и табличная функцияjdbc
(для работы требуется установка clickhouse-jdbc-bridge). Alexandr Krasheninnikov - Добавлены функции для работы с ISO номером недели:
toISOWeek
,toISOYear
,toStartOfISOYear
, а такжеtoDayOfYear
. #3146 - Добавлена возможность использования столбцов типа
Nullable
для таблиц типаMySQL
,ODBC
. #3362 - Возможность чтения вложенных структур данных как вложенных объектов в формате
JSONEachRow
. Добавлена настройкаinput_format_import_nested_json
. Veloman Yunkan - Возможность параллельной обработки многих
MATERIALIZED VIEW
при вставке данных. Настройкаparallel_view_processing
. Marek Vavruša - Добавлен запрос
SYSTEM FLUSH LOGS
(форсированный сброс логов в системные таблицы, такие как например,query_log
) #3321 - Возможность использования предопределённых макросов
database
иtable
в объявленииReplicated
таблиц. #3251 - Добавлена возможность чтения значения типа
Decimal
в инженерной нотации (с указанием десятичной экспоненты). #3153
Экспериментальные возможности:
- Оптимизация GROUP BY для типов данных
LowCardinality
#3138 - Оптимизации вычисления выражений для типов данных
LowCardinality
#3200
Улучшения:
- Существенно уменьшено потребление памяти для запросов с
ORDER BY
иLIMIT
. Настройкаmax_bytes_before_remerge_sort
. #3205 - При отсутствии указания типа
JOIN
(LEFT
,INNER
, ...), подразумеваетсяINNER JOIN
. #3147 - Корректная работа квалифицированных звёздочек в запросах с
JOIN
. Winter Zhang - Движок таблиц
ODBC
корректно выбирает способ квотирования идентификаторов в SQL диалекте удалённой СУБД. Alexandr Krasheninnikov - Настройка
compile_expressions
(JIT компиляция выражений) включена по-умолчанию. - Исправлено поведение при одновременном DROP DATABASE/TABLE IF EXISTS и CREATE DATABASE/TABLE IF NOT EXISTS. Ранее запрос
CREATE DATABASE ... IF NOT EXISTS
мог выдавать сообщение об ошибке вида "File ... already exists", а запросыCREATE TABLE ... IF NOT EXISTS
иDROP TABLE IF EXISTS
могли выдавать сообщениеTable ... is creating or attaching right now
. #3101 - Выражения LIKE и IN с константной правой частью пробрасываются на удалённый сервер при запросах из таблиц типа MySQL и ODBC. #3182
- Сравнения с константными выражениями в секции WHERE пробрасываются на удалённый сервер при запросах из таблиц типа MySQL и ODBC. Ранее пробрасывались только сравнения с константами. #3182
- Корректное вычисление ширины строк в терминале для
Pretty
форматов, в том числе для строк с иероглифами. Amos Bird. - Возможность указания
ON CLUSTER
для запросовALTER UPDATE
. - Увеличена производительность чтения данных в формате
JSONEachRow
. #3332 - Добавлены синонимы функций
LENGTH
,CHARACTER_LENGTH
для совместимости. ФункцияCONCAT
стала регистронезависимой. #3306 - Добавлен синоним
TIMESTAMP
для типаDateTime
. #3390 - В логах сервера всегда присутствует место для query_id, даже если строчка лога не относится к запросу. Это сделано для более простого парсинга текстовых логов сервера сторонними инструментами.
- Логгирование потребления памяти запросом при превышении очередной отметки целого числа гигабайт. #3205
- Добавлен режим совместимости для случая, когда клиентская библиотека, работающая по Native протоколу, по ошибке отправляет меньшее количество столбцов, чем сервер ожидает для запроса INSERT. Такой сценарий был возможен при использовании библиотеки clickhouse-cpp. Ранее этот сценарий приводил к падению сервера. #3171
- В
clickhouse-copier
, в задаваемом пользователем выражении WHERE, появилась возможность использовать алиасpartition_key
(для дополнительной фильтрации по партициям исходной таблицы). Это полезно, если схема партиционирования изменяется при копировании, но изменяется незначительно. #3166 - Рабочий поток движка
Kafka
перенесён в фоновый пул потоков для того, чтобы автоматически уменьшать скорость чтения данных при большой нагрузке. Marek Vavruša. - Поддержка чтения значений типа
Tuple
иNested
структур какstruct
в форматеCap'n'Proto
Marek Vavruša. - В список доменов верхнего уровня для функции
firstSignificantSubdomain
добавлен доменbiz
decaseal. - В конфигурации внешних словарей, пустое значение
null_value
интерпретируется, как значение типа данных по-умоланию. #3330 - Поддержка функций
intDiv
,intDivOrZero
дляDecimal
. b48402e8 - Поддержка типов
Date
,DateTime
,UUID
,Decimal
в качестве ключа для агрегатной функцииsumMap
. #3281 - Поддержка типа данных
Decimal
во внешних словарях. #3324 - Поддержка типа данных
Decimal
в таблицах типаSummingMergeTree
. #3348 - Добавлена специализация для
UUID
в функцииif
. #3366 - Уменьшено количество системных вызовов
open
,close
при чтении из таблиц семействаMergeTree
#3283. - Возможность выполнения запроса
TRUNCATE TABLE
на любой реплике (запрос пробрасывается на реплику-лидера). Kirill Shvakov
Исправление ошибок:
- Исправлена ошибка в работе таблиц типа
Dictionary
для словарей типаrange_hashed
. Ошибка возникла в версии 18.12.17. #1702 - Исправлена ошибка при загрузке словарей типа
range_hashed
(сообщениеUnsupported type Nullable(...)
). Ошибка возникла в версии 18.12.17. #3362 - Исправлена некорректная работа функции
pointInPolygon
из-за накопления погрешности при вычислениях для полигонов с большим количеством близко расположенных вершин. #3331 #3341 - Если после слияния кусков данных, у результирующего куска чексумма отличается от результата того же слияния на другой реплике, то результат слияния удаляется, и вместо этого кусок скачивается с другой реплики (это правильное поведение). Но после скачивания куска, он не мог добавиться в рабочий набор из-за ошибки, что кусок уже существует (так как кусок после слияния удалялся не сразу, а с задержкой). Это приводило к циклическим попыткам скачивания одних и тех же данных. #3194
- Исправлен некорректный учёт общего потребления оперативной памяти запросами (что приводило к неправильной работе настройки
max_memory_usage_for_all_queries
и неправильному значению метрикиMemoryTracking
). Ошибка возникла в версии 18.12.13. Marek Vavruša - Исправлена работоспособность запросов
CREATE TABLE ... ON CLUSTER ... AS SELECT ...
Ошибка возникла в версии 18.12.13. #3247 - Исправлена лишняя подготовка структуры данных для
JOIN
на сервере-инициаторе запроса, еслиJOIN
выполняется только на удалённых серверах. #3340 - Исправлены ошибки в движке
Kafka
: неработоспособность после исключения при начале чтения данных; блокировка при завершении Marek Vavruša. - Для таблиц
Kafka
не передавался опциональный параметрschema
(схема форматаCap'n'Proto
). Vojtech Splichal - Если ансамбль серверов ZooKeeper содержит серверы, которые принимают соединение, но сразу же разрывают его вместо ответа на рукопожатие, то ClickHouse выбирает для соединения другой сервер. Ранее в этом случае возникала ошибка
Cannot read all data. Bytes read: 0. Bytes expected: 4.
и сервер не мог стартовать. 8218cf3a - Если ансамбль серверов ZooKeeper содержит серверы, для которых DNS запрос возвращает ошибку, то такие серверы пропускаются. 17b8e209
- Исправлено преобразование типов между
Date
иDateTime
при вставке данных в форматеVALUES
(в случае, когдаinput_format_values_interpret_expressions = 1
). Ранее преобразование производилось между числовым значением количества дней с начала unix эпохи и unix timestamp, что приводило к неожиданным результатам. #3229 - Исправление преобразования типов между
Decimal
и целыми числами. #3211 - Исправлены ошибки в работе настройки
enable_optimize_predicate_expression
. Winter Zhang - Исправлена ошибка парсинга формата CSV с числами с плавающей запятой, если используется разделитель CSV не по-умолчанию, такой как например,
;
#3155. - Исправлена функция
arrayCumSumNonNegative
(она не накапливает отрицательные значения, если аккумулятор становится меньше нуля). Aleksey Studnev - Исправлена работа
Merge
таблицы поверхDistributed
таблиц при использованииPREWHERE
. #3165 - Исправления ошибок в запросе
ALTER UPDATE
. - Исправления ошибок в табличной функции
odbc
, которые возникли в версии 18.12. #3197 - Исправлена работа агрегатных функций с комбинаторами
StateArray
. #3188 - Исправлено падение при делении значения типа
Decimal
на ноль. 69dd6609 - Исправлен вывод типов для операций с использованием аргументов типа
Decimal
и целых чисел. #3224 - Исправлен segfault при
GROUP BY
поDecimal128
. 3359ba06 - Настройка
log_query_threads
(логгирование информации о каждом потоке исполнения запроса) теперь имеет эффект только если настройкаlog_queries
(логгирование информации о запросах) выставлена в 1. Так как настройкаlog_query_threads
включена по-умолчанию, ранее информация о потоках логгировалась даже если логгирование запросов выключено. #3241 - Исправлена ошибка в распределённой работе агрегатной функции quantiles (сообщение об ошибке вида
Not found column quantile...
). 292a8855 - Исправлена проблема совместимости при одновременной работе на кластере серверов версии 18.12.17 и более старых, приводящая к тому, что при распределённых запросах с GROUP BY по ключам одновременно фиксированной и не фиксированной длины, при условии, что количество данных в процессе агрегации большое, могли возвращаться не до конца агрегированные данные (одни и те же ключи агрегации в двух разных строках). #3254
- Исправлена обработка подстановок в
clickhouse-performance-test
, если запрос содержит только часть из объявленных в тесте подстановок. #3263 - Исправлена ошибка при использовании
FINAL
совместно сPREWHERE
. #3298 - Исправлена ошибка при использовании
PREWHERE
над столбцами, добавленными приALTER
. #3298 - Добавлена проверка отсутствия
arrayJoin
дляDEFAULT
,MATERIALIZED
выражений. Ранее наличиеarrayJoin
приводило к ошибке при вставке данных. #3337 - Добавлена проверка отсутствия
arrayJoin
в секцииPREWHERE
. Ранее это приводило к сообщениям видаSize ... doesn't match
илиUnknown compression method
при выполнении запросов. #3357 - Исправлен segfault, который мог возникать в редких случаях после оптимизации - замены цепочек AND из равенства выражения константам на соответствующее выражение IN. liuyimin-bytedance.
- Мелкие исправления
clickhouse-benchmark
: ранее информация о клиенте не передавалась на сервер; более корректный подсчёт числа выполненных запросов при завершении работы и для ограничения числа итераций. #3351 #3352
Обратно несовместимые изменения:
- Удалена настройка
allow_experimental_decimal_type
. Тип данныхDecimal
доступен для использования по-умолчанию. #3329
ClickHouse release 18.12.17, 2018-09-16
Новые возможности:
invalidate_query
(возможность задать запрос для проверки необходимости обновления внешнего словаря) реализована для источникаclickhouse
. #3126- Добавлена возможность использования типов данных
UInt*
,Int*
,DateTime
(наравне с типомDate
) в качестве ключа внешнего словаря типаrange_hashed
, определяющего границы диапазонов. Возможность использованияNULL
в качестве обозначения открытого диапазона. Vasily Nemkov - Для типа
Decimal
добавлена поддержка агрегатных функцийvar*
,stddev*
. #3129 - Для типа
Decimal
добавлена поддержка математических функций (exp
,sin
и т. п.) #3129 - В таблицу
system.part_log
добавлен столбецpartition_id
. #3089
Исправление ошибок:
- Исправлена работа
Merge
таблицы поверхDistributed
таблиц. Winter Zhang - Исправлена несовместимость (лишняя зависимость от версии
glibc
), приводящая к невозможности запуска ClickHouse наUbuntu Precise
и более старых. Несовместимость возникла в версии 18.12.13. #3130 - Исправлены ошибки в работе настройки
enable_optimize_predicate_expression
. Winter Zhang - Исправлено незначительное нарушение обратной совместимости, проявляющееся при одновременной работе на кластере реплик версий до 18.12.13 и создании новой реплики таблицы на сервере более новой версии (выдаётся сообщение
Can not clone replica, because the ... updated to new ClickHouse version
, что полностью логично, но не должно было происходить). #3122
Обратно несовместимые изменения:
- Настройка
enable_optimize_predicate_expression
включена по-умолчанию, что конечно очень оптимистично. При возникновении ошибок анализа запроса, связанных с поиском имён столбцов, следует выставитьenable_optimize_predicate_expression
в 0. Winter Zhang
ClickHouse release 18.12.14, 2018-09-13
Новые возможности:
- Добавлена поддержка запросов
ALTER UPDATE
. #3035 - Добавлена настройка
allow_ddl
, упраляющая доступом пользователя к DDL-запросам. #3104 - Добавлена настройка
min_merge_bytes_to_use_direct_io
для движков семействаMergeTree
, позволяющая задать порог на суммарный размер слияния после которого работа с файлами кусков будет происходить с O_DIRECT. #3117 - В системную таблицу
system.merges
добавлен столбецpartition_id
. #3099
Улучшения
- Если в процессе мутации кусок остался неизменённым, он не будет скачан репликами. #3103
- При работе с
clickhouse-client
добавлено автодополнение для имён настроек. #3106
Исправление ошибок
- Добавлена проверка размеров массивов, которые являются элементами полей типа
Nested
, при вставке. #3118 - Исправлена ошибка обновления внешних словарей с источником
ODBC
и форматом храненияhashed
. Ошибка возникла в версии 18.12.13. - Исправлено падение при создании временной таблицы таблицы из запроса с условием
IN
. Winter Zhang - Исправлена ошибка в работе агрегатных функций для массивов, элементами которых может быть
NULL
. Winter Zhang
ClickHouse release 18.12.13, 2018-09-10
Новые возможности:
- Добавлен тип данных
DECIMAL(digits, scale)
(Decimal32(scale)
,Decimal64(scale)
,Decimal128(scale)
). Возможность доступна под настройкойallow_experimental_decimal_type
. #2846 #2970 #3008 #3047 - Модификатор
WITH ROLLUP
дляGROUP BY
(также доступен синтаксис:GROUP BY ROLLUP(...)
). #2948 - В запросах с JOIN, звёздочка раскрывается в список столбцов всех таблиц, в соответствии со стандартом SQL. Вернуть старое поведение можно, выставив настройку (уровня пользователя)
asterisk_left_columns_only
в значение 1. Winter Zhang - Добавлена поддержка JOIN с табличной функцией. Winter Zhang
- Автодополнение по нажатию Tab в clickhouse-client. Sergey Shcherbin
- Нажатие Ctrl+C в clickhouse-client очищает запрос, если он был введён. #2877
- Добавлена настройка
join_default_strictness
(значения''
,'any'
,'all'
). Её использование позволяет не указыватьANY
илиALL
дляJOIN
. #2982 - В каждой строчке лога сервера, относящейся к обработке запроса, выводится идентификатор запроса. #2482
- Возможность получения логов выполнения запроса в clickhouse-client (настройка
send_logs_level
). При распределённой обработке запроса, логи отправляются каскадно со всех серверов. #2482 - В таблицах
system.query_log
иsystem.processes
(SHOW PROCESSLIST
) появилась информация о всех изменённых настройках при выполнении запроса (вложенная структура данныхSettings
). Добавлена настройкаlog_query_settings
. #2482 - В таблицах
system.query_log
иsystem.processes
появилась информация о номерах потоков, участвующих в исполнении запроса (столбецthread_numbers
). #2482 - Добавлены счётчики
ProfileEvents
, измеряющие время, потраченное на чтение и запись по сети; чтение и запись на диск; количество сетевых ошибок; время потраченное на ожидании при ограничении сетевой полосы. #2482 - Добавлены счётчики
ProfileEvents
, содержащие системные метрики из rusage (позволяющие получить информацию об использовании CPU в userspace и ядре, page faults, context switches) а также метрики taskstats (позволяющие получить информацию о времени ожидания IO, CPU, а также количество прочитанных и записанных данных с учётом и без учёта page cache). #2482 - Счётчики
ProfileEvents
учитываются не только глобально, но и на каждый запрос, а также на каждый поток выполнения запроса, что позволяет детально профилировать потребление ресурсов отдельными запросами. #2482 - Добавлена таблица
system.query_thread_log
, содержащая информацию о каждом потоке выполнения запроса. Добавлена настройкаlog_query_threads
. #2482 - В таблицах
system.metrics
иsystem.events
появилась встроенная документация. #3016 - Добавлена функция
arrayEnumerateDense
. Amos Bird - Добавлены функции
arrayCumSumNonNegative
иarrayDifference
. Aleksey Studnev - Добавлена агрегатная функция
retention
. Sundy Li - Возможность сложения (слияния) состояний агрегатных функций с помощью оператора плюс, а также умножения состояний агрегатных функций на целую неотрицательную константу. #3062 #3034
- В таблицах семейства MergeTree добавлен виртуальный столбец
_partition_id
. #3089
Экспериментальные возможности:
- Добавлен тип данных
LowCardinality(T)
. Тип данных автоматически создаёт локальный словарь значений и позволяет обрабатывать данные без распаковки словаря. #2830 - Добавлен кэш JIT-скомпилированных функций, а также счётчик числа использований перед компиляцией. Возможность JIT-компиляции выражений включается настройкой
compile_expressions
. #2990 #3077
Улучшения:
- Исправлена проблема неограниченного накопления лога репликации в случае наличия заброшенных реплик. Добавлен режим эффективного восстановления реплик после длительного отставания.
- Увеличена производительность при выполнении
GROUP BY
в случае, если есть несколько полей агрегации, одно из которых строковое, а другие - фиксированной длины. - Увеличена производительность при использовании
PREWHERE
и при неявном переносе выражений вPREWHERE
. - Увеличена производительность парсинга текстовых форматов (
CSV
,TSV
). Amos Bird #2980 - Увеличена производительность чтения строк и массивов в бинарных форматах. Amos Bird
- Увеличена производительность и уменьшено потребление памяти в запросах к таблицам
system.tables
иsystem.columns
в случае наличия очень большого количества таблиц на одном сервере. #2953 - Исправлена проблема низкой производительности в случае наличия большого потока запросов, для которых возвращается ошибка (в
perf top
видна функция_dl_addr
, при этом сервер использует мало CPU). #2938 - Прокидывание условий внутрь View (при включенной настройке
enable_optimize_predicate_expression
) Winter Zhang - Доработки недостающей функциональности для типа данных
UUID
. #3074 #2985 - Тип данных
UUID
поддержан в словарях The-Alchemist. #2822 - Функция
visitParamExtractRaw
корректно работает с вложенными структурами. Winter Zhang - При использовании настройки
input_format_skip_unknown_fields
корректно работает пропуск значений-объектов в форматеJSONEachRow
. BlahGeek - Для выражения
CASE
с условиями, появилась возможность не указыватьELSE
, что эквивалентноELSE NULL
. #2920 - Возможность конфигурирования operation timeout при работе с ZooKeeper. urykhy
- Возможность указания смещения для
LIMIT n, m
в видеLIMIT n OFFSET m
. #2840 - Возможность использования синтаксиса
SELECT TOP n
в качестве альтернативы дляLIMIT
. #2840 - Увеличен размер очереди записи в системные таблицы, что позволяет уменьшить количество ситуаций
SystemLog queue is full
. - В агрегатной функции
windowFunnel
добавлена поддержка событий, подходящих под несколько условий. Amos Bird - Возможность использования дублирующихся столбцов в секции
USING
дляJOIN
. #3006 - Для форматов
Pretty
введено ограничение выравнивания столбцов по ширине. Настройкаoutput_format_pretty_max_column_pad_width
. В случае более широкого значения, оно всё ещё будет выведено целиком, но остальные ячейки таблицы не будут излишне широкими. #3003 - В табличной функции
odbc
добавлена возможность указания имени базы данных/схемы. Amos Bird - Добавлена возможность использования имени пользователя, заданного в конфигурационном файле
clickhouse-client
. Vladimir Kozbin - Счётчик
ZooKeeperExceptions
разделён на три счётчикаZooKeeperUserExceptions
,ZooKeeperHardwareExceptions
,ZooKeeperOtherExceptions
. - Запросы
ALTER DELETE
работают для материализованных представлений. - Добавлена рандомизация во времени периодического запуска cleanup thread для таблиц типа
ReplicatedMergeTree
, чтобы избежать периодических всплесков нагрузки в случае очень большого количества таблиц типаReplicatedMergeTree
. - Поддержка запроса
ATTACH TABLE ... ON CLUSTER
. #3025
Исправление ошибок:
- Исправлена ошибка в работе таблиц типа
Dictionary
(кидается исключениеSize of offsets doesn't match size of column
илиUnknown compression method
). Ошибка появилась в версии 18.10.3. #2913 - Исправлена ошибка при мерже данных таблиц типа
CollapsingMergeTree
, если один из кусков данных пустой (такие куски, в свою очередь, образуются при слиянии или приALTER DELETE
в случае удаления всех данных), и для слияния был выбран алгоритмvertical
. #3049 - Исправлен race condition при
DROP
илиTRUNCATE
таблиц типаMemory
при одновременномSELECT
, который мог приводить к падениям сервера. Ошибка появилась в версии 1.1.54388. #3038 - Исправлена возможность потери данных при вставке в
Replicated
таблицы в случае получения ошибкиSession expired
(потеря данных может быть обнаружена по метрикеReplicatedDataLoss
). Ошибка возникла в версии 1.1.54378. #2939 #2949 #2964 - Исправлен segfault при
JOIN ... ON
. #3000 - Исправлена ошибка поиска имён столбцов в случае, если выражение
WHERE
состоит целиком из квалифицированного имени столбца, как напримерWHERE table.column
. #2994 - Исправлена ошибка вида "Not found column" при выполнении распределённых запросов в случае, если с удалённого сервера запрашивается единственный столбец, представляющий собой выражение IN с подзапросом. #3087
- Исправлена ошибка
Block structure mismatch in UNION stream: different number of columns
, возникающая при распределённых запросах, если один из шардов локальный, а другой - нет, и если при этом срабатывает оптимизация переноса вPREWHERE
. #2226 #3037 #3055 #3065 #3073 #3090 #3093 - Исправлена работа функции
pointInPolygon
для некоторого случая невыпуклых полигонов. #2910 - Исправлен некорректный результат при сравнении
nan
с целыми числами. #3024 - Исправлена ошибка в библиотеке
zlib-ng
, которая могла приводить к segfault в редких случаях. #2854 - Исправлена утечка памяти при вставке в таблицу со столбцами типа
AggregateFunction
, если состояние агрегатной функции нетривиальное (выделяет память отдельно), и если в одном запросе на вставку получается несколько маленьких блоков. #3084 - Исправлен race condition при одновременном создании и удалении одной и той же таблицы типа
Buffer
илиMergeTree
. - Исправлена возможность segfault при сравнении кортежей из некоторых нетривиальных типов, таких как, например, кортежей. #2989
- Исправлена возможность segfault при выполнении некоторых запросов
ON CLUSTER
. Winter Zhang - Исправлена ошибка в функции
arrayDistinct
в случаеNullable
элементов массивов. #2845 #2937 - Возможность
enable_optimize_predicate_expression
корректно поддерживает случаи сSELECT *
. Winter Zhang - Исправлена возможность segfault при переинициализации сессии с ZooKeeper. #2917
- Исправлена возможность блокировки при взаимодействии с ZooKeeper.
- Исправлен некорректный код суммирования вложенных структур данных в
SummingMergeTree
. - При выделении памяти для состояний агрегатных функций, корректно учитывается выравнивание, что позволяет использовать при реализации состояний агрегатных функций операции, для которых выравнивание является необходимым. chenxing-xc
Исправления безопасности:
- Безопасная работа с ODBC источниками данных. Взаимодействие с ODBC драйверами выполняется через отдельный процесс
clickhouse-odbc-bridge
. Ошибки в сторонних ODBC драйверах теперь не приводят к проблемам со стабильностью сервера или уязвимостям. #2828 #2879 #2886 #2893 #2921 - Исправлена некорректная валидация пути к файлу в табличной функции
catBoostPool
. #2894 - Содержимое системных таблиц (
tables
,databases
,parts
,columns
,parts_columns
,merges
,mutations
,replicas
,replication_queue
) фильтруется согласно конфигурации доступа к базам данных для пользователя (allow_databases
) Winter Zhang
Обратно несовместимые изменения:
- В запросах с JOIN, звёздочка раскрывается в список столбцов всех таблиц, в соответствии со стандартом SQL. Вернуть старое поведение можно, выставив настройку (уровня пользователя)
asterisk_left_columns_only
в значение 1.
Изменения сборки:
- Добавлен покоммитный запуск большинства интеграционных тестов.
- Добавлен покоммитный запуск проверки стиля кода.
- Корректный выбор реализации
memcpy
при сборке на CentOS7 / Fedora. Etienne Champetier - При сборке с помощью clang добавлены некоторые warnings из
-Weverything
в дополнение к обычным-Wall -Wextra -Werror
. #2957 - При debug сборке используется debug вариант
jemalloc
. - Абстрагирован интерфейс библиотеки для взаимодействия с ZooKeeper. #2950
ClickHouse release 18.10.3, 2018-08-13
Новые возможности:
- Возможность использования HTTPS для репликации. #2760
- Добавлены функции
murmurHash2_64
,murmurHash3_32
,murmurHash3_64
,murmurHash3_128
в дополнение к имеющемусяmurmurHash2_32
. #2791 - Поддержка Nullable типов в ODBC драйвере ClickHouse (формат вывода
ODBCDriver2
) #2834 - Поддержка
UUID
в ключевых столбцах.
Улучшения:
- Удаление кластеров без перезагрузки сервера при их удалении из конфигурационных файлов. #2777
- Удаление внешних словарей без перезагрузки сервера при их удалении из конфигурационных файлов. #2779
- Добавлена поддержка
SETTINGS
для движка таблицKafka
. Alexander Marshalov - Доработки для типа данных
UUID
(не полностью) Šimon Podlipský. #2618 - Поддежка пустых кусков после мержей в движках
SummingMergeTree
,CollapsingMergeTree
andVersionedCollapsingMergeTree
. #2815 - Удаление старых записей о полностью выполнившихся мутациях (
ALTER DELETE
) #2784 - Добавлена таблица
system.merge_tree_settings
. Kirill Shvakov - В таблицу
system.tables
добавлены столбцы зависимостей:dependencies_database
иdependencies_table
. Winter Zhang - Добавлена опция конфига
max_partition_size_to_drop
. #2782 - Добавлена настройка
output_format_json_escape_forward_slashes
. Alexander Bocharov - Добавлена настройка
max_fetch_partition_retries_count
. #2831 - Добавлена настройка
prefer_localhost_replica
, позволяющая отключить предпочтение локальной реплики и хождение на локальную реплику без межпроцессного взаимодействия. #2832 - Агрегатная функция
quantileExact
возвращаетnan
в случае агрегации по пустому множествуFloat32
/Float64
типов. Sundy Li
Исправление ошибок:
- Убрано излишнее экранирование параметров connection string для ODBC, котрое приводило к невозможности соединения. Ошибка возникла в версии 18.6.0.
- Исправлена логика обработки команд на
REPLACE PARTITION
в очереди репликации. Неправильная логика могла приводить к тому, что при наличии двухREPLACE
одной и той же партиции, один из них оставался в очереди репликации и не мог выполниться. #2814 - Исправлена ошибка при мерже, если все куски были пустыми (такие куски, в свою очередь, образуются при слиянии или при
ALTER DELETE
в случае удаления всех данных). Ошибка появилась в версии 18.1.0. #2930 - Исправлена ошибка при параллельной записи в таблицы типа
Set
илиJoin
. Amos Bird - Исправлена ошибка
Block structure mismatch in UNION stream: different number of columns
, возникающая при запросах сUNION ALL
внутри подзапроса, в случае, если один изSELECT
запросов содержит дублирующиеся имена столбцов. Winter Zhang - Исправлена утечка памяти в случае исключения при соединении с MySQL сервером.
- Исправлен некорректный код возврата clickhouse-client в случае ошибочного запроса
- Исправлен некорректная работа materialized views, содержащих DISTINCT. #2795
Обратно несовместимые изменения
- Убрана поддержка запросов CHECK TABLE для Distributed таблиц.
Изменения сборки:
- Заменен аллокатор, теперь используется
jemalloc
вместоtcmalloc
. На некоторых сценариях ускорение достигает 20%. В то же время, существуют запросы, замедлившиеся до 20%. Потребление памяти на некоторых сценариях примерно на 10% меньше и более стабильно. При высококонкурентной нагрузке, потребление CPU в userspace и в system незначительно вырастает. #2773 - Использование libressl из submodule. #1983 #2807
- Использование unixodbc из submodule. #2789
- Использование mariadb-connector-c из submodule. #2785
- В репозиторий добавлены файлы функциональных тестов, рассчитывающих на наличие тестовых данных (пока без самих тестовых данных).
ClickHouse release 18.6.0, 2018-08-02
Новые возможности:
- Добавлена поддержка ON выражений для JOIN ON синтаксиса:
JOIN ON Expr([table.]column, ...) = Expr([table.]column, ...) [AND Expr([table.]column, ...) = Expr([table.]column, ...) ...]
Выражение должно представлять из себя цепочку равенств, объединенных оператором AND. Каждая часть равенства может являться произвольным выражением над столбцами одной из таблиц. Поддержана возможность использования fully qualified имен столбцов (table.name
,database.table.name
,table_alias.name
,subquery_alias.name
) для правой таблицы. #2742 - Добавлена возможность включить HTTPS для репликации. #2760
Улучшения:
- Сервер передаёт на клиент также patch-компонент своей версии. Данные о patch компоненте версии добавлены в
system.processes
иquery_log
. #2646
ClickHouse release 18.5.1, 2018-07-31
Новые возможности:
- Добавлена функция хеширования
murmurHash2_32
. #2756.
Улучшения:
- Добавлена возможность указывать значения в конфигурационных файлах из переменных окружения с помощью атрибута
from_env
. #2741. - Добавлены регистронезависимые версии функций
coalesce
,ifNull
,nullIf
. #2752.
Исправление ошибок:
- Исправлена возможная ошибка при старте реплики. #2759.
ClickHouse release 18.4.0, 2018-07-28
Новые возможности:
- Добавлены системные таблицы
formats
,data_type_families
,aggregate_function_combinators
,table_functions
,table_engines
,collations
#2721. - Добавлена возможность использования табличной функции вместо таблицы в качестве аргумента табличной функции
remote
иcluster
#2708. - Поддержка
HTTP Basic
аутентификации в протоколе репликации #2727. - В функции
has
добавлена возможность поиска в массиве значений типаEnum
по числовому значению Maxim Khrisanfov. - Поддержка добавления произвольных разделителей сообщений в процессе чтения из
Kafka
Amos Bird.
Улучшения:
- Запрос
ALTER TABLE t DELETE WHERE
не перезаписывает куски данных, которые не были затронуты условием WHERE #2694. - Настройка
use_minimalistic_checksums_in_zookeeper
таблиц семействаReplicatedMergeTree
включена по-умолчанию. Эта настройка была добавлена в версии 1.1.54378, 2018-04-16. Установка версий, более старых, чем 1.1.54378, становится невозможной. - Поддерживается запуск запросов
KILL
иOPTIMIZE
с указаниемON CLUSTER
Winter Zhang.
Исправление ошибок:
- Исправлена ошибка
Column ... is not under aggregate function and not in GROUP BY
в случае агрегации по выражению с оператором IN. Ошибка появилась в версии 18.1.0. (bbdd780b) - Исправлена ошибка в агрегатной функции
windowFunnel
Winter Zhang. - Исправлена ошибка в агрегатной функции
anyHeavy
(a2101df2) - Исправлено падение сервера при использовании функции
countArray()
.
Обратно несовместимые изменения:
- Список параметров для таблиц
Kafka
был изменён сKafka(kafka_broker_list, kafka_topic_list, kafka_group_name, kafka_format[, kafka_schema, kafka_num_consumers])
наKafka(kafka_broker_list, kafka_topic_list, kafka_group_name, kafka_format[, kafka_row_delimiter, kafka_schema, kafka_num_consumers])
. Если вы использовали параметрыkafka_schema
илиkafka_num_consumers
, вам необходимо вручную отредактировать файлы с метаданнымиpath/metadata/database/table.sql
, добавив параметрkafka_row_delimiter
со значением''
в соответствующее место.
ClickHouse release 18.1.0, 2018-07-23
Новые возможности:
- Поддержка запроса
ALTER TABLE t DELETE WHERE
для нереплицированных MergeTree-таблиц (#2634). - Поддержка произвольных типов для семейства агрегатных функций
uniq*
(#2010). - Поддержка произвольных типов в операторах сравнения (#2026).
- Возможность в
users.xml
указывать маску подсети в формате10.0.0.1/255.255.255.0
. Это необходимо для использования "дырявых" масок IPv6 сетей (#2637). - Добавлена функция
arrayDistinct
(#2670). - Движок SummingMergeTree теперь может работать со столбцами типа AggregateFunction (Constantin S. Pan).
Улучшения:
- Изменена схема версионирования релизов. Теперь первый компонент содержит год релиза (A.D.; по московскому времени; из номера вычитается 2000), второй - номер крупных изменений (увеличивается для большинства релизов), третий - патч-версия. Релизы по-прежнему обратно совместимы, если другое не указано в changelog.
- Ускорено преобразование чисел с плавающей точкой в строку (Amos Bird).
- Теперь, если при вставке из-за ошибок парсинга пропущено некоторое количество строк (такое возможно про включённых настройках
input_allow_errors_num
,input_allow_errors_ratio
), это количество пишется в лог сервера (Leonardo Cecchi).
Исправление ошибок:
- Исправлена работа команды TRUNCATE для временных таблиц (Amos Bird).
- Исправлен редкий deadlock в клиентской библиотеке ZooKeeper, который возникал при сетевой ошибке во время вычитывания ответа (c315200).
- Исправлена ошибка при CAST в Nullable типы (#1322).
- Исправлен неправильный результат функции
maxIntersection()
в случае совпадения границ отрезков (Michael Furmur). - Исправлено неверное преобразование цепочки OR-выражений в аргументе функции (chenxing-xc).
- Исправлена деградация производительности запросов, содержащих выражение
IN (подзапрос)
внутри другого подзапроса (#2571). - Исправлена несовместимость серверов разных версий при распределённых запросах, использующих функцию
CAST
не в верхнем регистре (fe8c4d6). - Добавлено недостающее квотирование идентификаторов при запросах к внешним СУБД (#2635).
Обратно несовместимые изменения:
- Не работает преобразование строки, содержащей число ноль, в DateTime. Пример:
SELECT toDateTime('0')
. По той же причине не работаетDateTime DEFAULT '0'
в таблицах, а также<null_value>0</null_value>
в словарях. Решение: заменить0
на0000-00-00 00:00:00
.
ClickHouse release 1.1.54394, 2018-07-12
Новые возможности:
- Добавлена агрегатная функция
histogram
(Михаил Сурин). - Возможность использования
OPTIMIZE TABLE ... FINAL
без указания партиции дляReplicatedMergeTree
(Amos Bird).
Исправление ошибок:
- Исправлена ошибка - выставление слишком маленького таймаута у сокетов (одна секунда) для чтения и записи при отправке и скачивании реплицируемых данных, что приводило к невозможности скачать куски достаточно большого размера при наличии некоторой нагрузки на сеть или диск (попытки скачивания кусков циклически повторяются). Ошибка возникла в версии 1.1.54388.
- Исправлена работа при использовании chroot в ZooKeeper, в случае вставки дублирующихся блоков данных в таблицу.
- Исправлена работа функции
has
для случая массива с Nullable элементами (#2115). - Исправлена работа таблицы
system.tables
при её использовании в распределённых запросах; столбцыmetadata_modification_time
иengine_full
сделаны невиртуальными; исправлена ошибка в случае, если из таблицы были запрошены только эти столбцы. - Исправлена работа пустой таблицы типа
TinyLog
после вставки в неё пустого блока данных (#2563). - Таблица
system.zookeeper
работает в случае, если значение узла в ZooKeeper равно NULL.
ClickHouse release 1.1.54390, 2018-07-06
Новые возможности:
- Возможность отправки запроса в формате
multipart/form-data
(в полеquery
), что полезно, если при этом также отправляются внешние данные для обработки запроса (Ольга Хвостикова). - Добавлена возможность включить или отключить обработку одинарных или двойных кавычек при чтении данных в формате CSV. Это задаётся настройками
format_csv_allow_single_quotes
иformat_csv_allow_double_quotes
(Amos Bird) - Возможность использования
OPTIMIZE TABLE ... FINAL
без указания партиции для не реплицированных вариантовMergeTree
(Amos Bird).
Улучшения:
- Увеличена производительность, уменьшено потребление памяти, добавлен корректный учёт потребления памяти, при использовании оператора IN в случае, когда для его работы может использоваться индекс таблицы (#2584).
- Убраны избыточные проверки чексумм при добавлении куска. Это важно в случае большого количества реплик, так как в этом случае суммарное количество проверок было равно N^2.
- Добавлена поддержка аргументов типа
Array(Tuple(...))
для функцииarrayEnumerateUniq
(#2573). - Добавлена поддержка
Nullable
для функцииrunningDifference
. (#2594) - Увеличена производительность анализа запроса в случае очень большого количества выражений (#2572).
- Более быстрый выбор кусков для слияния в таблицах типа
ReplicatedMergeTree
. Более быстрое восстановление сессии с ZooKeeper. (#2597). - Файл
format_version.txt
для таблиц семействаMergeTree
создаётся заново при его отсутствии, что имеет смысл в случае запуска ClickHouse после копирования структуры директорий без файлов (Ciprian Hacman).
Исправление ошибок:
- Исправлена ошибка при работе с ZooKeeper, которая могла приводить к невозможности восстановления сессии и readonly состояниям таблиц до перезапуска сервера.
- Исправлена ошибка при работе с ZooKeeper, которая могла приводить к неудалению старых узлов при разрыве сессии.
- Исправлена ошибка в функции
quantileTDigest
для Float аргументов (ошибка появилась в версии 1.1.54388) (Михаил Сурин). - Исправлена ошибка работы индекса таблиц типа MergeTree, если в условии, столбец первичного ключа расположен внутри функции преобразования типов между знаковым и беззнаковым целым одного размера (#2603).
- Исправлен segfault, если в конфигурационном файле нет
macros
, но они используются (#2570). - Исправлено переключение на базу данных по-умолчанию при переподключении клиента (#2583).
- Исправлена ошибка в случае отключенной настройки
use_index_for_in_with_subqueries
.
Исправления безопасности:
- При соединениях с MySQL удалена возможность отправки файлов (
LOAD DATA LOCAL INFILE
).
ClickHouse release 1.1.54388, 2018-06-28
Новые возможности:
- Добавлена поддержка запроса
ALTER TABLE t DELETE WHERE
для реплицированных таблиц и таблицаsystem.mutations
. - Добавлена поддержка запроса
ALTER TABLE t [REPLACE|ATTACH] PARTITION
для *MergeTree-таблиц. - Добавлена поддержка запроса
TRUNCATE TABLE
(Winter Zhang) - Добавлено несколько новых
SYSTEM
-запросов для реплицированных таблиц (RESTART REPLICAS
,SYNC REPLICA
,[STOP|START] [MERGES|FETCHES|REPLICATED SENDS|REPLICATION QUEUES]
). - Добавлена возможность записи в таблицу с движком MySQL и соответствующую табличную функцию (sundy-li).
- Добавлена табличная функция
url()
и движок таблицURL
(Александр Сапин). - Добавлена агрегатная функция
windowFunnel
(sundy-li). - Добавлены функции
startsWith
иendsWith
для строк (Вадим Плахтинский). - В табличной функции
numbers()
добавлена возможность указывать offset (Winter Zhang). - Добавлена возможность интерактивного ввода пароля в
clickhouse-client
. - Добавлена возможность отправки логов сервера в syslog (Александр Крашенинников).
- Добавлена поддержка логирования в словарях с источником shared library (Александр Сапин).
- Добавлена поддержка произвольного разделителя в формате CSV (Иван Жуков)
- Добавлена настройка
date_time_input_format
. Если переключить эту настройку в значение'best_effort'
, значения DateTime будут читаться в широком диапазоне форматов. - Добавлена утилита
clickhouse-obfuscator
для обфускации данных. Пример использования: публикация данных, используемых в тестах производительности.
Экспериментальные возможности:
- Добавлена возможность вычислять аргументы функции
and
только там, где они нужны (Анастасия Царькова) - Добавлена возможность JIT-компиляции в нативный код некоторых выражений (pyos).
Исправление ошибок:
- Исправлено появление дублей в запросе с
DISTINCT
иORDER BY
. - Запросы с
ARRAY JOIN
иarrayFilter
раньше возвращали некорректный результат. - Исправлена ошибка при чтении столбца-массива из Nested-структуры (#2066).
- Исправлена ошибка при анализе запросов с секцией HAVING вида
HAVING tuple IN (...)
. - Исправлена ошибка при анализе запросов с рекурсивными алиасами.
- Исправлена ошибка при чтении из ReplacingMergeTree с условием в PREWHERE, фильтрующим все строки (#2525).
- Настройки профиля пользователя не применялись при использовании сессий в HTTP-интерфейсе.
- Исправлено применение настроек из параметров командной строки в программе clickhouse-local.
- Клиентская библиотека ZooKeeper теперь использует таймаут сессии, полученный от сервера.
- Исправлена ошибка в клиентской библиотеке ZooKeeper, из-за которой ожидание ответа от сервера могло длиться дольше таймаута.
- Исправлено отсечение ненужных кусков при запросе с условием на столбцы ключа партиционирования (#2342).
- После
CLEAR COLUMN IN PARTITION
в соответствующей партиции теперь возможны слияния (#2315). - Исправлено соответствие типов в табличной функции ODBC (sundy-li).
- Исправлено некорректное сравнение типов
DateTime
с таймзоной и без неё (Александр Бочаров). - Исправлен синтаксический разбор и форматирование оператора
CAST
. - Исправлена вставка в материализованное представление в случае, если движок таблицы представления - Distributed (Babacar Diassé).
- Исправлен race condition при записи данных из движка
Kafka
в материализованные представления (Yangkuan Liu). - Исправлена SSRF в табличной функции remote().
- Исправлен выход из
clickhouse-client
в multiline-режиме (#2510).
Улучшения:
- Фоновые задачи в реплицированных таблицах теперь выполняются не в отдельных потоках, а в пуле потоков (Silviu Caragea)
- Улучшена производительность разжатия LZ4.
- Ускорен анализ запроса с большим числом JOIN-ов и подзапросов.
- DNS-кэш теперь автоматически обновляется при большом числе сетевых ошибок.
- Вставка в таблицу теперь не происходит, если вставка в одно из её материализованных представлений невозможна из-за того, что в нём много кусков.
- Исправлено несоответствие в значениях счётчиков событий
Query
,SelectQuery
,InsertQuery
. - Разрешены выражения вида
tuple IN (SELECT tuple)
, если типы кортежей совпадают. - Сервер с реплицированными таблицами теперь может стартовать, даже если не сконфигурирован ZooKeeper.
- При расчёте количества доступных ядер CPU теперь учитываются ограничения cgroups (Atri Sharma).
- Добавлен chown директорий конфигов в конфигурационном файле systemd (Михаил Ширяев).
Изменения сборки:
- Добавлена возможность сборки компилятором gcc8.
- Добавлена возможность сборки llvm из submodule.
- Используемая версия библиотеки librdkafka обновлена до v0.11.4.
- Добавлена возможность использования библиотеки libcpuid из системы, используемая версия библиотеки обновлена до 0.4.0.
- Исправлена сборка с использованием библиотеки vectorclass (Babacar Diassé).
- Cmake теперь по умолчанию генерирует файлы для ninja (как при использовании
-G Ninja
). - Добавлена возможность использования библиотеки libtinfo вместо libtermcap (Георгий Кондратьев).
- Исправлен конфликт заголовочных файлов в Fedora Rawhide (#2520).
Обратно несовместимые изменения:
- Убран escaping в форматах
Vertical
иPretty*
, удалён форматVerticalRaw
. - Если в распределённых запросах одновременно участвуют серверы версии 1.1.54388 или новее и более старые, то при использовании выражения
cast(x, 'Type')
, записанного без указанияAS
, если словоcast
указано не в верхнем регистре, возникает ошибка видаNot found column cast(0, 'UInt8') in block
. Решение: обновить сервер на всём кластере.
ClickHouse release 1.1.54385, 2018-06-01
Исправление ошибок:
- Исправлена ошибка, которая в некоторых случаях приводила к блокировке операций с ZooKeeper.
ClickHouse release 1.1.54383, 2018-05-22
Исправление ошибок:
- Исправлена деградация скорости выполнения очереди репликации при большом количестве реплик
ClickHouse release 1.1.54381, 2018-05-14
Исправление ошибок:
- Исправлена ошибка, приводящая к "утеканию" метаданных в ZooKeeper при потере соединения с сервером ZooKeeper.
ClickHouse release 1.1.54380, 2018-04-21
Новые возможности:
- Добавлена табличная функция
file(path, format, structure)
. Пример, читающий байты из/dev/urandom
:ln -s /dev/urandom /var/lib/clickhouse/user_files/random
clickhouse-client -q "SELECT * FROM file('random', 'RowBinary', 'd UInt8') LIMIT 10"
.
Улучшения:
- Добавлена возможность оборачивать подзапросы скобками
()
для повышения читаемости запросов. Например:(SELECT 1) UNION ALL (SELECT 1)
. - Простые запросы
SELECT
из таблицыsystem.processes
не учитываются в ограниченииmax_concurrent_queries
.
Исправление ошибок:
- Исправлена неправильная работа оператора
IN
вMATERIALIZED VIEW
. - Исправлена неправильная работа индекса по ключу партиционирования в выражениях типа
partition_key_column IN (...)
. - Исправлена невозможность выполнить
OPTIMIZE
запрос на лидирующей реплике после выполненияRENAME
таблицы. - Исправлены ошибки авторизации возникающие при выполнении запросов
OPTIMIZE
иALTER
на нелидирующей реплике. - Исправлены зависания запросов
KILL QUERY
. - Исправлена ошибка в клиентской библиотеке ZooKeeper, которая при использовании непустого префикса
chroot
в конфигурации приводила к потере watch'ей, остановке очереди distributed DDL запросов и замедлению репликации.
Обратно несовместимые изменения:
- Убрана поддержка выражений типа
(a, b) IN (SELECT (a, b))
(можно использовать эквивалентные выражение(a, b) IN (SELECT a, b)
). Раньше такие запросы могли приводить к недетерминированной фильтрации вWHERE
.
ClickHouse release 1.1.54378, 2018-04-16
Новые возможности:
- Возможность изменения уровня логгирования без перезагрузки сервера.
- Добавлен запрос
SHOW CREATE DATABASE
. - Возможность передать
query_id
вclickhouse-client
(elBroom). - Добавлена настройка
max_network_bandwidth_for_all_users
. - Добавлена поддержка
ALTER TABLE ... PARTITION ...
дляMATERIALIZED VIEW
. - Добавлена информация о размере кусков данных в несжатом виде в системные таблицы.
- Поддержка межсерверного шифрования для distributed таблиц (
<secure>1</secure>
в конфигурации реплики в<remote_servers>
). - Добавлена настройка уровня таблицы семейства
ReplicatedMergeTree
для уменьшения объема данных, хранимых в zookeeper:use_minimalistic_checksums_in_zookeeper = 1
- Возможность настройки приглашения
clickhouse-client
. По-умолчанию добавлен вывод имени сервера в приглашение. Возможность изменить отображаемое имя сервера. Отправка его в HTTP заголовкеX-ClickHouse-Display-Name
(Kirill Shvakov). - Возможность указания нескольких
topics
через запятую для движкаKafka
(Tobias Adamson) - При остановке запроса по причине
KILL QUERY
илиreplace_running_query
, клиент получает исключениеQuery was cancelled
вместо неполного результата.
Улучшения:
- Запросы вида
ALTER TABLE ... DROP/DETACH PARTITION
выполняются впереди очереди репликации. - Возможность использовать
SELECT ... FINAL
иOPTIMIZE ... FINAL
даже в случае, если данные в таблице представлены одним куском. - Пересоздание таблицы
query_log
налету в случае если было произведено её удаление вручную (Kirill Shvakov). - Ускорение функции
lengthUTF8
(zhang2014). - Улучшена производительность синхронной вставки в
Distributed
таблицы (insert_distributed_sync = 1
) в случае очень большого количества шардов. - Сервер принимает настройки
send_timeout
иreceive_timeout
от клиента и применяет их на своей стороне для соединения с клиентом (в переставленном порядке:send_timeout
у сокета на стороне сервера выставляется в значениеreceive_timeout
принятое от клиента, и наоборот). - Более надёжное восстановление после сбоев при асинхронной вставке в
Distributed
таблицы. - Возвращаемый тип функции
countEqual
изменён сUInt32
наUInt64
(谢磊)
Исправление ошибок:
- Исправлена ошибка c
IN
где левая часть выраженияNullable
. - Исправлен неправильный результат при использовании кортежей с
IN
в случае, если часть компоненнтов кортежа есть в индексе таблицы. - Исправлена работа ограничения
max_execution_time
с распределенными запросами. - Исправлены ошибки при вычислении размеров составных столбцов в таблице
system.columns
. - Исправлена ошибка при создании временной таблицы
CREATE TEMPORARY TABLE IF NOT EXISTS
- Исправлены ошибки в
StorageKafka
(#2075) - Исправлены падения сервера от некорректных аргументов некоторых аггрегатных функций.
- Исправлена ошибка, из-за которой запрос
DETACH DATABASE
мог не приводить к остановке фоновых задач таблицы типаReplicatedMergeTree
. - Исправлена проблема с появлением
Too many parts
в агрегирующих материализованных представлениях (#2084). - Исправлена рекурсивная обработка подстановок в конфиге, если после одной подстановки, требуется другая подстановка на том же уровне.
- Исправлена ошибка с неправильным синтаксисом в файле с метаданными при создании
VIEW
, использующих запрос сUNION ALL
. - Исправлена работа
SummingMergeTree
в случае суммирования вложенных структур данных с составным ключом. - Исправлена возможность возникновения race condition при выборе лидера таблиц
ReplicatedMergeTree
.
Изменения сборки:
- Поддержка
ninja
вместоmake
при сборке.ninja
используется по-умолчанию при сборке релизов. - Переименованы пакеты
clickhouse-server-base
вclickhouse-common-static
;clickhouse-server-common
вclickhouse-server
;clickhouse-common-dbg
вclickhouse-common-static-dbg
. Для установки используйтеclickhouse-server clickhouse-client
. Для совместимости, пакеты со старыми именами продолжают загружаться в репозиторий.
Обратно несовместимые изменения:
- Удалена специальная интерпретация выражения IN, если слева указан массив. Ранее выражение вида
arr IN (set)
воспринималось как "хотя бы один элементarr
принадлежит множествуset
". Для получения такого же поведения в новой версии, напишитеarrayExists(x -> x IN (set), arr)
. - Отключено ошибочное использование опции сокета
SO_REUSEPORT
(которая по ошибке включена по-умолчанию в библиотеке Poco). Стоит обратить внимание, что на Linux системах теперь не имеет смысла указывать одновременно адреса::
и0.0.0.0
для listen - следует использовать лишь адрес::
, который (с настройками ядра по-умолчанию) позволяет слушать соединения как по IPv4 так и по IPv6. Также вы можете вернуть поведение старых версий, указав в конфиге<listen_reuse_port>1</listen_reuse_port>
.
ClickHouse release 1.1.54370, 2018-03-16
Новые возможности:
- Добавлена системная таблица
system.macros
и автоматическое обновление макросов при изменении конфигурационного файла. - Добавлен запрос
SYSTEM RELOAD CONFIG
. - Добавлена агрегатная функция
maxIntersections(left_col, right_col)
, возвращающая максимальное количество одновременно пересекающихся интервалов[left; right]
. ФункцияmaxIntersectionsPosition(left, right)
возвращает начало такого "максимального" интервала. (Michael Furmur).
Улучшения:
- При вставке данных в
Replicated
-таблицу делается меньше обращений кZooKeeper
(также из логаZooKeeper
исчезло большинство user-level ошибок). - Добавлена возможность создавать алиасы для множеств. Пример:
WITH (1, 2, 3) AS set SELECT number IN set FROM system.numbers LIMIT 10
.
Исправление ошибок:
- Исправлена ошибка
Illegal PREWHERE
при чтении из Merge-таблицы надDistributed
-таблицами. - Добавлены исправления, позволяющие запускать clickhouse-server в IPv4-only docker-контейнерах.
- Исправлен race condition при чтении из системной таблицы
system.parts_columns
- Убрана двойная буферизация при синхронной вставке в
Distributed
-таблицу, которая могла приводить к timeout-ам соединений. - Исправлена ошибка, вызывающая чрезмерно долгое ожидание недоступной реплики перед началом выполнения
SELECT
. - Исправлено некорректное отображение дат в таблице
system.parts
. - Исправлена ошибка, приводящая к невозможности вставить данные в
Replicated
-таблицу, если в конфигурации кластераZooKeeper
задан непустойchroot
. - Исправлен алгоритм вертикального мержа при пустом ключе
ORDER BY
таблицы. - Возвращена возможность использовать словари в запросах к удаленным таблицам, даже если этих словарей нет на сервере-инициаторе. Данная функциональность была потеряна в версии 1.1.54362.
- Восстановлено поведение, при котором в запросах типа
SELECT * FROM remote('server2', default.table) WHERE col IN (SELECT col2 FROM default.table)
в правой частиIN
должна использоваться удаленная таблицаdefault.table
, а не локальная. данное поведение было нарушено в версии 1.1.54358. - Устранено ненужное Error-level логирование
Not found column ... in block
.
Релиз ClickHouse 1.1.54362, 2018-03-11
Новые возможности:
- Агрегация без
GROUP BY
по пустому множеству (как например,SELECT count(*) FROM table WHERE 0
) теперь возвращает результат из одной строки с нулевыми значениями агрегатных функций, в соответствии со стандартом SQL. Вы можете вернуть старое поведение (возвращать пустой результат), выставив настройкуempty_result_for_aggregation_by_empty_set
в значение 1. - Добавлено приведение типов при
UNION ALL
. Допустимо использование столбцов с разными алиасами в соответствующих позицияхSELECT
вUNION ALL
, что соответствует стандарту SQL. - Поддержка произвольных выражений в секции
LIMIT BY
. Ранее было возможно лишь использование столбцов - результатаSELECT
. - Использование индекса таблиц семейства
MergeTree
при наличии условияIN
на кортеж от выражений от столбцов первичного ключа. ПримерWHERE (UserID, EventDate) IN ((123, '2000-01-01'), ...)
(Anastasiya Tsarkova). - Добавлен инструмент
clickhouse-copier
для межкластерного копирования и перешардирования данных (бета). - Добавлены функции консистентного хэширования
yandexConsistentHash
,jumpConsistentHash
,sumburConsistentHash
. Их можно использовать в качестве ключа шардирования для того, чтобы уменьшить объём сетевого трафика при последующих перешардированиях. - Добавлены функции
arrayAny
,arrayAll
,hasAny
,hasAll
,arrayIntersect
,arrayResize
. - Добавлена функция
arrayCumSum
(Javi Santana). - Добавлена функция
parseDateTimeBestEffort
,parseDateTimeBestEffortOrZero
,parseDateTimeBestEffortOrNull
, позволяющая прочитать DateTime из строки, содержащей текст в широком множестве возможных форматов. - Возможность частичной перезагрузки данных внешних словарей при их обновлении (загрузка лишь записей со значением заданного поля большим, чем при предыдущей загрузке) (Arsen Hakobyan).
- Добавлена табличная функция
cluster
. Пример:cluster(cluster_name, db, table)
. Табличная функцияremote
может принимать имя кластера в качестве первого аргумента, если оно указано в виде идентификатора. - Возможность использования табличных функций
remote
,cluster
вINSERT
запросах. - Добавлены виртуальные столбцы
create_table_query
,engine_full
в таблицеsystem.tables
. Столбецmetadata_modification_time
сделан виртуальным. - Добавлены столбцы
data_path
,metadata_path
в таблицыsystem.tables
иsystem.databases
, а также столбецpath
в таблицыsystem.parts
иsystem.parts_columns
. - Добавлена дополнительная информация о слияниях в таблице
system.part_log
. - Возможность использования произвольного ключа партиционирования для таблицы
system.query_log
(Kirill Shvakov). - Запрос
SHOW TABLES
теперь показывает также и временные таблицы. Добавлены временные таблицы и столбецis_temporary
в таблицеsystem.tables
(zhang2014). - Добавлен запрос
DROP TEMPORARY TABLE
,EXISTS TEMPORARY TABLE
(zhang2014). - Поддержка
SHOW CREATE TABLE
для временных таблиц (zhang2014). - Добавлен конфигурационный параметр
system_profile
для настроек, используемых внутренними процессами. - Поддержка загрузки
object_id
в качестве атрибута в словарях с источникомMongoDB
(Павел Литвиненко). - Возможность читать
null
как значение по-умолчанию при загрузке данных для внешнего словаря с источникомMongoDB
(Павел Литвиненко). - Возможность чтения значения типа
DateTime
в форматеValues
из unix timestamp без одинарных кавычек. - Поддержан failover в табличной функции
remote
для случая, когда на части реплик отсутствует запрошенная таблица. - Возможность переопределять параметры конфигурации в параметрах командной строки при запуске
clickhouse-server
, пример:clickhouse-server -- --logger.level=information
. - Реализована функция
empty
от аргумента типаFixedString
: функция возвращает 1, если строка состоит полностью из нулевых байт (zhang2014). - Добавлен конфигурационный параметр
listen_try
, позволяющий слушать хотя бы один из listen адресов и не завершать работу, если некоторые адреса не удаётся слушать (полезно для систем с выключенной поддержкой IPv4 или IPv6). - Добавлен движок таблиц
VersionedCollapsingMergeTree
. - Поддержка строк и произвольных числовых типов для источника словарей
library
. - Возможность использования таблиц семейства
MergeTree
без первичного ключа (для этого необходимо указатьORDER BY tuple()
). - Добавлена возможность выполнить преобразование (
CAST
)Nullable
типа в неNullable
тип, если аргумент не являетсяNULL
. - Возможность выполнения
RENAME TABLE
дляVIEW
. - Добавлена функция
throwIf
. - Добавлена настройка
odbc_default_field_size
, позволяющая расширить максимальный размер значения, загружаемого из ODBC источника (по-умолчанию - 1024). - В таблицу
system.processes
и вSHOW PROCESSLIST
добавлены столбцыis_cancelled
иpeak_memory_usage
.
Улучшения:
- Ограничения на результат и квоты на результат теперь не применяются к промежуточным данным для запросов
INSERT SELECT
и для подзапросов вSELECT
. - Уменьшено количество ложных срабатываний при проверке состояния
Replicated
таблиц при запуске сервера, приводивших к необходимости выставления флагаforce_restore_data
. - Добавлена настройка
allow_distributed_ddl
. - Запрещено использование недетерминированных функций в выражениях для ключей таблиц семейства
MergeTree
. - Файлы с подстановками из
config.d
директорий загружаются в алфавитном порядке. - Увеличена производительность функции
arrayElement
в случае константного многомерного массива с пустым массивом в качестве одного из элементов. Пример:[[1], []][x]
. - Увеличена скорость запуска сервера при использовании конфигурационных файлов с очень большими подстановками (например, очень большими списками IP-сетей).
- При выполнении запроса, табличные функции выполняются один раз. Ранее табличные функции
remote
,mysql
дважды делали одинаковый запрос на получение структуры таблицы с удалённого сервера. - Используется генератор документации
MkDocs
. - При попытке удалить столбец таблицы, от которого зависят
DEFAULT
/MATERIALIZED
выражения других столбцов, кидается исключение (zhang2014). - Добавлена возможность парсинга пустой строки в текстовых форматах как числа 0 для
Float
типов данных. Эта возможность присутствовала раньше, но была потеряна в релизе 1.1.54342. - Значения типа
Enum
можно использовать в функцияхmin
,max
,sum
и некоторых других - в этих случаях используются соответствующие числовые значения. Эта возможность присутствовала ранее, но была потеряна в релизе 1.1.54337. - Добавлено ограничение
max_expanded_ast_elements
действующее на размер AST после рекурсивного раскрытия алиасов.
Исправление ошибок:
- Исправлены случаи ошибочного удаления ненужных столбцов из подзапросов, а также отсутствие удаления ненужных столбцов из подзапросов, содержащих
UNION ALL
. - Исправлена ошибка в слияниях для таблиц типа
ReplacingMergeTree
. - Исправлена работа синхронного режима вставки в
Distributed
таблицы (insert_distributed_sync = 1
). - Исправлены segfault при некоторых случаях использования
FULL
иRIGHT JOIN
с дублирующимися столбцами в подзапросах. - Исправлены segfault, которые могут возникать при использовании функциональности
replace_running_query
иKILL QUERY
. - Исправлен порядок столбцов
source
иlast_exception
в таблицеsystem.dictionaries
. - Исправлена ошибка - запрос
DROP DATABASE
не удалял файл с метаданными. - Исправлен запрос
DROP DATABASE
для базы данных типаDictionary
. - Исправлена неоправданно низкая точность работы функций
uniqHLL12
иuniqCombined
для кардинальностей больше 100 млн. элементов (Alex Bocharov). - Исправлено вычисление неявных значений по-умолчанию при необходимости одновременного вычисления явных выражений по-умолчанию в запросах
INSERT
(zhang2014). - Исправлен редкий случай, в котором запрос к таблице типа
MergeTree
мог не завершаться (chenxing-xc). - Исправлено падение при выполнении запроса
CHECK
дляDistributed
таблиц, если все шарды локальные (chenxing.xc). - Исправлена незначительная регрессия производительности при работе функций, использующих регулярные выражения.
- Исправлена регрессия производительности при создании многомерных массивов от сложных выражений.
- Исправлена ошибка, из-за которой в
.sql
файл с метаданными может записываться лишняя секцияFORMAT
. - Исправлена ошибка, приводящая к тому, что ограничение
max_table_size_to_drop
действует при попытке удаленияMATERIALIZED VIEW
, смотрящего на явно указанную таблицу. - Исправлена несовместимость со старыми клиентами (на старые клиенты могли отправляться данные с типом
DateTime('timezone')
, который они не понимают). - Исправлена ошибка при чтении столбцов-элементов
Nested
структур, которые были добавлены с помощьюALTER
, но являются пустыми для старых партиций, когда условия на такие столбцы переносятся вPREWHERE
. - Исправлена ошибка при фильтрации таблиц по условию на виртуальных столбец
_table
в запросах к таблицам типаMerge
. - Исправлена ошибка при использовании
ALIAS
столбцов вDistributed
таблицах. - Исправлена ошибка, приводящая к невозможности динамической компиляции запросов с агрегатными функциями из семейства
quantile
. - Исправлен race condition в конвейере выполнения запроса, который мог проявляться в очень редких случаях при использовании
Merge
таблиц над большим количеством таблиц, а также при использованииGLOBAL
подзапросов. - Исправлено падение при передаче массивов разных размеров в функцию
arrayReduce
при использовании агрегатных функций от нескольких аргументов. - Запрещено использование запросов с
UNION ALL
вMATERIALIZED VIEW
. - Исправлена ошибка, которая может возникать при инициализации системной таблицы
part_log
при старте сервера (по-умолчаниюpart_log
выключен).
Обратно несовместимые изменения:
- Удалена настройка
distributed_ddl_allow_replicated_alter
. Соответствующее поведение включено по-умолчанию. - Удалена настройка
strict_insert_defaults
. Если вы использовали эту функциональность, напишите наclickhouse-feedback@yandex-team.com
. - Удалён движок таблиц
UnsortedMergeTree
.
Релиз ClickHouse 1.1.54343, 2018-02-05
- Добавлена возможность использовать макросы при задании имени кластера в распределенных DLL запросах и создании Distributed-таблиц:
CREATE TABLE distr ON CLUSTER '{cluster}' (...) ENGINE = Distributed('{cluster}', 'db', 'table')
. - Теперь при вычислении запросов вида
SELECT ... FROM table WHERE expr IN (subquery)
используется индекс таблицыtable
. - Улучшена обработка дубликатов при вставке в Replicated-таблицы, теперь они не приводят к излишнему замедлению выполнения очереди репликации.
Релиз ClickHouse 1.1.54342, 2018-01-22
Релиз содержит исправление к предыдущему релизу 1.1.54337:
- Исправлена регрессия в версии 1.1.54337: если пользователь по-умолчанию имеет readonly доступ, то сервер отказывался стартовать с сообщением
Cannot create database in readonly mode
. - Исправлена регрессия в версии 1.1.54337: на системах под управлением systemd, логи по ошибке всегда записываются в syslog; watchdog скрипт по ошибке использует init.d.
- Исправлена регрессия в версии 1.1.54337: неправильная конфигурация по-умоланию в Docker образе.
- Исправлена недетерминированная работа GraphiteMergeTree (в логах видно по сообщениям
Data after merge is not byte-identical to data on another replicas
). - Исправлена ошибка, в связи с которой запрос OPTIMIZE к Replicated таблицам мог приводить к неконсистентным мержам (в логах видно по сообщениям
Part ... intersects previous part
). - Таблицы типа Buffer теперь работают при наличии MATERIALIZED столбцов в таблице назначения (by zhang2014).
- Исправлена одна из ошибок в реализации NULL.
Релиз ClickHouse 1.1.54337, 2018-01-18
Новые возможности:
- Добавлена поддержка хранения многомерных массивов и кортежей (тип данных
Tuple
) в таблицах. - Поддержка табличных функций для запросов
DESCRIBE
иINSERT
. Поддержка подзапроса в запросеDESCRIBE
. Примеры:DESC TABLE remote('host', default.hits)
;DESC TABLE (SELECT 1)
;INSERT INTO TABLE FUNCTION remote('host', default.hits)
. Возможность писатьINSERT INTO TABLE
вместоINSERT INTO
. - Улучшена поддержка часовых поясов. В типе
DateTime
может быть указана таймзона, которая используется для парсинга и отображения данных в текстовом виде. Пример:DateTime('Europe/Moscow')
. При указании таймзоны в функциях работы сDateTime
, тип возвращаемого значения будет запоминать таймзону, для того, чтобы значение отображалось ожидаемым образом. - Добавлены функции
toTimeZone
,timeDiff
,toQuarter
,toRelativeQuarterNum
. В функциюtoRelativeHour
/Minute
/Second
можно передать аргумент типаDate
. Имя функцииnow
воспринимается без учёта регистра. - Добавлена функция
toStartOfFifteenMinutes
(Kirill Shvakov). - Добавлена программа
clickhouse format
для переформатирования запросов. - Добавлен конфигурационный параметр
format_schema_path
(Marek Vavruša). Он используется для задания схемы для форматаCap'n'Proto
. Файлы со схемой могут использоваться только из указанной директории. - Добавлена поддержка
incl
иconf.d
подстановок для конфигурации словарей и моделей (Pavel Yakunin). - В таблице
system.settings
появилось описание большинства настроек (Kirill Shvakov). - Добавлена таблица
system.parts_columns
, содержащая информацию о размерах столбцов в каждом куске данныхMergeTree
таблиц. - Добавлена таблица
system.models
, содержащая информацию о загруженных моделяхCatBoost
. - Добавлены табличные функции
mysql
иodbc
и соответствующие движки таблицMySQL
,ODBC
для обращения к удалённым базам данных. Функциональность в состоянии "бета". - Для функции
groupArray
разрешено использование аргументов типаAggregateFunction
(можно создать массив из состояний агрегатных функций). - Удалены ограничения на использование разных комбинаций комбинаторов агрегатных функций. Для примера, вы можете использовать как функцию
avgForEachIf
, так иavgIfForEach
, которые имеют разный смысл. - Комбинатор агрегатных функций
-ForEach
расширен для случая агрегатных функций с более чем одним аргументом. - Добавлена поддержка агрегатных функций от
Nullable
аргументов, для случаев, когда функция всегда возвращает неNullable
результат (реализовано с участием Silviu Caragea). Пример:groupArray
,groupUniqArray
,topK
. - Добавлен параметр командной строки
max_client_network_bandwidth
дляclickhouse-client
(Kirill Shvakov). - Пользователям с доступом
readonly = 2
разрешено работать с временными таблицами (CREATE, DROP, INSERT...) (Kirill Shvakov). - Добавлена возможность указания количества consumers для
Kafka
. Расширена возможность конфигурации движкаKafka
(Marek Vavruša). - Добавлены функции
intExp2
,intExp10
. - Добавлена агрегатная функция
sumKahan
. - Добавлены функции toNumberOrNull, где Number - числовой тип.
- Добавлена поддержка секции
WITH
для запросаINSERT SELECT
(автор: zhang2014). - Добавлены настройки
http_connection_timeout
,http_send_timeout
,http_receive_timeout
. Настройки используются, в том числе, при скачивании кусков для репликации. Изменение этих настроек позволяет сделать более быстрый failover в случае перегруженной сети. - Добавлена поддержка
ALTER
для таблиц типаNull
(Anastasiya Tsarkova). - Функция
reinterpretAsString
расширена на все типы данных, значения которых хранятся в памяти непрерывно. - Для программы
clickhouse-local
добавлена опция--silent
для подавления вывода информации о выполнении запроса в stderr. - Добавлена поддержка чтения
Date
в текстовом виде в формате, где месяц и день месяца могут быть указаны одной цифрой вместо двух (Amos Bird).
Увеличение производительности:
- Увеличена производительность агрегатных функций
min
,max
,any
,anyLast
,anyHeavy
,argMin
,argMax
от строковых аргументов. - Увеличена производительность функций
isInfinite
,isFinite
,isNaN
,roundToExp2
. - Увеличена производительность форматирования в текстовом виде и парсинга из текста значений типа
Date
иDateTime
. - Увеличена производительность и точность парсинга чисел с плавающей запятой.
- Уменьшено потребление памяти при
JOIN
, если левая и правая часть содержали столбцы с одинаковым именем, не входящие вUSING
. - Увеличена производительность агрегатных функций
varSamp
,varPop
,stddevSamp
,stddevPop
,covarSamp
,covarPop
,corr
за счёт уменьшения стойкости к вычислительной погрешности. Старые версии функций добавлены под именамиvarSampStable
,varPopStable
,stddevSampStable
,stddevPopStable
,covarSampStable
,covarPopStable
,corrStable
.
Исправления ошибок:
- Исправлена работа дедупликации блоков после
DROP
илиDETATH PARTITION
. Раньше удаление партиции и вставка тех же самых данных заново не работала, так как вставленные заново блоки считались дубликатами. - Исправлена ошибка, в связи с которой может неправильно обрабатываться
WHERE
для запросов на созданиеMATERIALIZED VIEW
с указаниемPOPULATE
. - Исправлена ошибка в работе параметра
root_path
в конфигурацииzookeeper_servers
. - Исправлен неожиданный результат при передаче аргумента типа
Date
в функциюtoStartOfDay
. - Исправлена работа функции
addMonths
,subtractMonths
, арифметика сINTERVAL n MONTH
, если в результате получается предыдущий год. - Добавлена недостающая поддержка типа данных
UUID
дляDISTINCT
,JOIN
, в агрегатных функцияхuniq
и во внешних словарях (Иванов Евгений). ПоддержкаUUID
всё ещё остаётся не полной. - Исправлено поведение
SummingMergeTree
для строк, в которых все значения после суммирования равны нулю. - Многочисленные доработки для движка таблиц
Kafka
(Marek Vavruša). - Исправлена некорректная работа движка таблиц
Join
(Amos Bird). - Исправлена работа аллокатора под FreeBSD и OS X.
- Функция
extractAll
теперь может доставать пустые вхождения. - Исправлена ошибка, не позволяющая подключить при сборке
libressl
вместоopenssl
. - Исправлена работа
CREATE TABLE AS SELECT
из временной таблицы. - Исправлена неатомарность обновления очереди репликации. Эта проблема могла приводить к рассинхронизации реплик и чинилась при перезапуске.
- Исправлено переполнение в функциях
gcd
,lcm
,modulo
(оператор%
) (Maks Skorokhod). - Файлы
-preprocessed
теперь создаются после измененияumask
(umask
может быть задан в конфигурационном файле). - Исправлена ошибка фоновой проверки кусков (
MergeTreePartChecker
) при использовании партиционирования по произвольному ключу. - Исправлен парсинг кортежей (значений типа
Tuple
) в текстовых форматах. - Исправлены сообщения о неподходящих типах аргументов для функций
multiIf
,array
и некоторых других. - Переработана поддержка
Nullable
типов. Исправлены ошибки, которые могут приводить к падению сервера. Исправлено подавляющее большинство других ошибок, связанных с поддержкойNULL
: неправильное приведение типов при INSERT SELECT, недостаточная поддержка Nullable в HAVING и в PREWHERE, режимjoin_use_nulls
, Nullable типы в оператореOR
и т. п. - Исправлена работа с внутренними свойствами типов данных, что позволило исправить проблемы следующего вида: ошибочное суммирование полей типа
Enum
вSummingMergeTree
; значения типаEnum
ошибочно выводятся с выравниванием по правому краю в таблицах вPretty
форматах, и т. п. - Более строгие проверки для допустимых комбинаций составных столбцов - это позволило исправить ошибок, которые могли приводить к падениям.
- Исправлено переполнение при задании очень большого значения параметра для типа
FixedString
. - Исправлена работа агрегатной функции
topK
для generic случая. - Добавлена отсутствующая проверка на совпадение размеров массивов для n-арных вариантов агрегатных функций с комбинатором
-Array
. - Исправлена работа
--pager
дляclickhouse-client
(автор: ks1322). - Исправлена точность работы функции
exp10
. - Исправлено поведение функции
visitParamExtract
согласно документации. - Исправлено падение при объявлении некорректных типов данных.
- Исправлена работа
DISTINCT
при условии, что все столбцы константные. - Исправлено форматирование запроса в случае наличия функции
tupleElement
со сложным константным выражением в качестве номера элемента. - Исправлена работа
Dictionary
таблиц для словарей типаrange_hashed
. - Исправлена ошибка, приводящая к появлению лишних строк при
FULL
иRIGHT JOIN
(Amos Bird). - Исправлено падение сервера в случае создания и удаления временных файлов в
config.d
директориях в момент перечитывания конфигурации. - Исправлена работа запроса
SYSTEM DROP DNS CACHE
: ранее сброс DNS кэша не приводил к повторному резолвингу имён хостов кластера. - Исправлено поведение
MATERIALIZED VIEW
послеDETACH TABLE
таблицы, на которую он смотрит (Marek Vavruša).
Улучшения сборки:
- Для сборки используется
pbuilder
. Сборка максимально независима от окружения на сборочной машине. - Для разных версий систем выкладывается один и тот же пакет, который совместим с широким диапазоном Linux систем.
- Добавлен пакет
clickhouse-test
, который может быть использован для запуска функциональных тестов. - Добавлена выкладка в репозиторий архива с исходниками. Этот архив может быть использован для воспроизведения сборки без использования GitHub.
- Добавлена частичная интеграция с Travis CI. В связи с ограничениями на время сборки в Travis, запускается только ограниченный набор тестов на Debug сборке.
- Добавлена поддержка
Cap'n'Proto
в сборку по-умолчанию. - Документация переведена с
Restructured Text
наMarkdown
. - Добавлена поддержка
systemd
(Vladimir Smirnov). В связи с несовместимостью с некоторыми образами, она выключена по-умолчанию и может быть включена вручную. - Для динамической компиляции запросов,
clang
иlld
встроены внутрьclickhouse
. Они также могут быть вызваны с помощьюclickhouse clang
иclickhouse lld
. - Удалено использование расширений GNU из кода и включена опция
-Wextra
. При сборке с помощьюclang
по-умолчанию используетсяlibc++
вместоlibstdc++
. - Выделены библиотеки
clickhouse_parsers
иclickhouse_common_io
для более быстрой сборки утилит.
Обратно несовместимые изменения:
- Формат засечек (marks) для таблиц типа
Log
, содержащихNullable
столбцы, изменён обратно-несовместимым образом. В случае наличия таких таблиц, вы можете преобразовать их вTinyLog
до запуска новой версии сервера. Для этого в соответствующем таблице файле.sql
в директорииmetadata
, заменитеENGINE = Log
наENGINE = TinyLog
. Если в таблице нетNullable
столбцов или тип таблицы неLog
, то ничего делать не нужно. - Удалена настройка
experimental_allow_extended_storage_definition_syntax
. Соответствующая функциональность включена по-умолчанию. - Функция
runningIncome
переименована вrunningDifferenceStartingWithFirstValue
во избежание путаницы. - Удалена возможность написания
FROM ARRAY JOIN arr
без указания таблицы после FROM (Amos Bird). - Удалён формат
BlockTabSeparated
, использовавшийся лишь для демонстрационных целей. - Изменён формат состояния агрегатных функций
varSamp
,varPop
,stddevSamp
,stddevPop
,covarSamp
,covarPop
,corr
. Если вы использовали эти состояния для хранения в таблицах (тип данныхAggregateFunction
от этих функций или материализованные представления, хранящие эти состояния), напишите на clickhouse-feedback@yandex-team.com. - В предыдущих версиях существовала недокументированная возможность: в типе данных AggregateFunction можно было не указывать параметры для агрегатной функции, которая зависит от параметров. Пример:
AggregateFunction(quantiles, UInt64)
вместоAggregateFunction(quantiles(0.5, 0.9), UInt64)
. Эта возможность потеряна. Не смотря на то, что возможность не документирована, мы собираемся вернуть её в ближайших релизах. - Значения типа данных Enum не могут быть переданы в агрегатные функции min/max. Возможность будет возвращена обратно в следующем релизе.
На что обратить внимание при обновлении:
- При обновлении кластера, на время, когда на одних репликах работает новая версия сервера, а на других - старая, репликация будет приостановлена и в логе появятся сообщения вида
unknown parameter 'shard'
. Репликация продолжится после обновления всех реплик кластера. - Если на серверах кластера работают разные версии ClickHouse, то возможен неправильный результат распределённых запросов, использующих функции
varSamp
,varPop
,stddevSamp
,stddevPop
,covarSamp
,covarPop
,corr
. Необходимо обновить все серверы кластера.
Релиз ClickHouse 1.1.54327, 2017-12-21
Релиз содержит исправление к предыдущему релизу 1.1.54318:
- Исправлена проблема с возможным race condition при репликации, которая может приводить к потере данных. Проблеме подвержены версии 1.1.54310 и 1.1.54318. Если вы их используете и у вас есть Replicated таблицы, то обновление обязательно. Понять, что эта проблема существует, можно по сообщениям в логе Warning вида
Part ... from own log doesn't exist.
Даже если таких сообщений нет, проблема всё-равно актуальна.
Релиз ClickHouse 1.1.54318, 2017-11-30
Релиз содержит изменения к предыдущему релизу 1.1.54310 с исправлением следующих багов:
- Исправлено некорректное удаление строк при слияниях в движке SummingMergeTree
- Исправлена утечка памяти в нереплицированных MergeTree-движках
- Исправлена деградация производительности при частых вставках в MergeTree-движках
- Исправлена проблема, приводящая к остановке выполнения очереди репликации
- Исправлено ротирование и архивация логов сервера
Релиз ClickHouse 1.1.54310, 2017-11-01
Новые возможности:
- Произвольный ключ партиционирования для таблиц семейства MergeTree.
- Движок таблиц Kafka.
- Возможность загружать модели CatBoost и применять их к данным, хранящимся в ClickHouse.
- Поддержка часовых поясов с нецелым смещением от UTC.
- Поддержка операций с временными интервалами.
- Диапазон значений типов Date и DateTime расширен до 2105 года.
- Запрос
CREATE MATERIALIZED VIEW x TO y
(позволяет указать существующую таблицу для хранения данных материализованного представления). - Запрос
ATTACH TABLE
без аргументов. - Логика обработки Nested-столбцов в SummingMergeTree, заканчивающихся на -Map, вынесена в агрегатную функцию sumMap. Такие столбцы теперь можно задавать явно.
- Максимальный размер IP trie-словаря увеличен до 128М записей.
- Функция getSizeOfEnumType.
- Агрегатная функция sumWithOverflow.
- Поддержка входного формата Cap’n Proto.
- Возможность задавать уровень сжатия при использовании алгоритма zstd.
Обратно несовместимые изменения:
- Запрещено создание временных таблиц с движком, отличным от Memory.
- Запрещено явное создание таблиц с движком View и MaterializedView.
- При создании таблицы теперь проверяется, что ключ сэмплирования входит в первичный ключ.
Исправления ошибок:
- Исправлено зависание при синхронной вставке в Distributed таблицу.
- Исправлена неатомарность при добавлении/удалении кусков в реплицированных таблицах.
- Данные, вставляемые в материализованное представление, теперь не подвергаются излишней дедупликации.
- Запрос в Distributed таблицу, для которого локальная реплика отстаёт, а удалённые недоступны, теперь не падает.
- Для создания временных таблиц теперь не требуется прав доступа к БД
default
. - Исправлено падение при указании типа Array без аргументов.
- Исправлено зависание при недостатке места на диске в разделе с логами.
- Исправлено переполнение в функции toRelativeWeekNum для первой недели Unix-эпохи.
Улучшения сборки:
- Несколько сторонних библиотек (в частности, Poco) обновлены и переведены на git submodules.
Релиз ClickHouse 1.1.54304, 2017-10-19
Новые возможности:
- Добавлена поддержка TLS в нативном протоколе (включается заданием
tcp_ssl_port
вconfig.xml
)
Исправления ошибок:
ALTER
для реплицированных таблиц теперь пытается начать выполнение как можно быстрее- Исправлены падения при чтении данных с настройкой
preferred_block_size_bytes=0
- Исправлено падение
clickhouse-client
при нажатииPage Down
- Корректная интепретация некоторых сложных запросов с
GLOBAL IN
иUNION ALL
- Операция
FREEZE PARTITION
теперь работает всегда атомарно - Исправлено зависание пустых POST-запросов (теперь возвращается код 411)
- Исправлены ошибки при интепретации выражений типа
CAST(1 AS Nullable(UInt8))
- Исправлена ошибка при чтении колонок типа
Array(Nullable(String))
изMergeTree
таблиц - Исправлено падение при парсинге запросов типа
SELECT dummy AS dummy, dummy AS b
- Корректное обновление пользователей при невалидном
users.xml
- Корректная обработка случаев, когда executable-словарь возвращает ненулевой код ответа
Релиз ClickHouse 1.1.54292, 2017-09-20
Новые возможности:
- Добавлена функция
pointInPolygon
для работы с координатами на плоскости. - Добавлена агрегатная функция
sumMap
, обеспечивающая суммирование массивов аналогичноSummingMergeTree
. - Добавлена функция
trunc
. Увеличена производительность функций округленияround
,floor
,ceil
,roundToExp2
. Исправлена логика работы функций округления. Изменена логика работы функцииroundToExp2
для дробных и отрицательных чисел. - Ослаблена зависимость исполняемого файла ClickHouse от версии libc. Один и тот же исполняемый файл ClickHouse может запускаться и работать на широком множестве Linux систем. Замечание: зависимость всё ещё присутствует при использовании скомпилированных запросов (настройка
compile = 1
, по-умолчанию не используется). - Уменьшено время динамической компиляции запросов.
Исправления ошибок:
- Исправлена ошибка, которая могла приводить к сообщениям
part ... intersects previous part
и нарушению консистентности реплик. - Исправлена ошибка, приводящая к блокировке при завершении работы сервера, если в это время ZooKeeper недоступен.
- Удалено избыточное логгирование при восстановлении реплик.
- Исправлена ошибка в реализации UNION ALL.
- Исправлена ошибка в функции concat, возникающая в случае, если первый столбец блока имеет тип Array.
- Исправлено отображение прогресса в таблице system.merges.
Релиз ClickHouse 1.1.54289, 2017-09-13
Новые возможности:
- Запросы
SYSTEM
для административных действий с сервером:SYSTEM RELOAD DICTIONARY
,SYSTEM RELOAD DICTIONARIES
,SYSTEM DROP DNS CACHE
,SYSTEM SHUTDOWN
,SYSTEM KILL
. - Добавлены функции для работы с массивами:
concat
,arraySlice
,arrayPushBack
,arrayPushFront
,arrayPopBack
,arrayPopFront
. - Добавлены параметры
root
иidentity
для конфигурации ZooKeeper. Это позволяет изолировать разных пользователей одного ZooKeeper кластера. - Добавлены агрегатные функции
groupBitAnd
,groupBitOr
,groupBitXor
(для совместимости доступны также под именамиBIT_AND
,BIT_OR
,BIT_XOR
). - Возможность загрузки внешних словарей из MySQL с указанием сокета на файловой системе.
- Возможность загрузки внешних словарей из MySQL через SSL соединение (параметры
ssl_cert
,ssl_key
,ssl_ca
). - Добавлена настройка
max_network_bandwidth_for_user
для ограничения общего потребления сети для всех запросов одного пользователя. - Поддержка
DROP TABLE
для временных таблиц. - Поддержка чтения значений типа
DateTime
в формате unix timestamp из форматовCSV
иJSONEachRow
. - Включено по-умолчанию отключение отстающих реплик при распределённых запросах (по-умолчанию порог равен 5 минутам).
- Используются FIFO блокировки при ALTER: выполнение ALTER не будет неограниченно блокироваться при непрерывно выполняющихся запросах.
- Возможность задать
umask
в конфигурационном файле. - Увеличена производительность запросов с
DISTINCT
.
Исправления ошибок:
- Более оптимальная процедура удаления старых нод в ZooKeeper. Ранее в случае очень частых вставок, старые ноды могли не успевать удаляться, что приводило, в том числе, к очень долгому завершению сервера.
- Исправлена рандомизация при выборе хостов для соединения с ZooKeeper.
- Исправлено отключение отстающей реплики при распределённых запросах, если реплика является localhost.
- Исправлена ошибка, в связи с которой кусок данных таблицы типа
ReplicatedMergeTree
мог становиться битым после выполненияALTER MODIFY
элементаNested
структуры. - Исправлена ошибка приводящая к возможному зависанию SELECT запросов.
- Доработки распределённых DDL запросов.
- Исправлен запрос
CREATE TABLE ... AS <materialized view>
. - Исправлен дедлок при запросе
ALTER ... CLEAR COLUMN IN PARTITION
дляBuffer
таблиц. - Исправлено использование неправильного значения по-умолчанию для
Enum
-ов (0 вместо минимального) при использовании форматовJSONEachRow
иTSKV
. - Исправлено появление zombie процессов при работе со словарём с источником
executable
. - Исправлен segfault при запросе HEAD.
Улучшения процесса разработки и сборки ClickHouse:
- Возможность сборки с помощью
pbuilder
. - Возможность сборки с использованием
libc++
вместоlibstdc++
под Linux. - Добавлены инструкции для использования статических анализаторов кода
Coverity
,clang-tidy
,cppcheck
.
На что обратить внимание при обновлении:
- Увеличено значение по-умолчанию для настройки MergeTree
max_bytes_to_merge_at_max_space_in_pool
(максимальный суммарный размер кусков в байтах для мержа) со 100 GiB до 150 GiB. Это может привести к запуску больших мержей после обновления сервера, что может вызвать повышенную нагрузку на дисковую подсистему. Если же на серверах, где это происходит, количество свободного места менее чем в два раза больше суммарного объёма выполняющихся мержей, то в связи с этим перестанут выполняться какие-либо другие мержи, включая мержи мелких кусков. Это приведёт к тому, что INSERT-ы будут отклоняться с сообщением "Merges are processing significantly slower than inserts". Для наблюдения, используйте запросSELECT * FROM system.merges
. Вы также можете смотреть на метрикуDiskSpaceReservedForMerge
в таблицеsystem.metrics
или в Graphite. Для исправления этой ситуации можно ничего не делать, так как она нормализуется сама после завершения больших мержей. Если же вас это не устраивает, вы можете вернуть настройкуmax_bytes_to_merge_at_max_space_in_pool
в старое значение, прописав в config.xml в секции<merge_tree>
<max_bytes_to_merge_at_max_space_in_pool>107374182400</max_bytes_to_merge_at_max_space_in_pool>
и перезапустить сервер.
Релиз ClickHouse 1.1.54284, 2017-08-29
- Релиз содержит изменения к предыдущему релизу 1.1.54282, которые исправляют утечку записей о кусках в ZooKeeper
Релиз ClickHouse 1.1.54282, 2017-08-23
Релиз содержит исправления к предыдущему релизу 1.1.54276:
- Исправлена ошибка
DB::Exception: Assertion violation: !_path.empty()
при вставке в Distributed таблицу. - Исправлен парсинг при вставке в формате RowBinary, если входные данные начинаются с ';'.
- Исправлена ошибка при рантайм-компиляции некоторых агрегатных функций (например,
groupArray()
).
Релиз ClickHouse 1.1.54276, 2017-08-16
Новые возможности:
- Добавлена опциональная секция WITH запроса SELECT. Пример запроса:
WITH 1+1 AS a SELECT a, a*a
- Добавлена возможность синхронной вставки в Distributed таблицу: выдается Ok только после того как все данные записались на все шарды. Активируется настройкой insert_distributed_sync=1
- Добавлен тип данных UUID для работы с 16-байтовыми идентификаторами
- Добавлены алиасы типов CHAR, FLOAT и т.д. для совместимости с Tableau
- Добавлены функции toYYYYMM, toYYYYMMDD, toYYYYMMDDhhmmss для перевода времени в числа
- Добавлена возможность использовать IP адреса (совместно с hostname) для идентификации сервера при работе с кластерными DDL запросами
- Добавлена поддержка неконстантных аргументов и отрицательных смещений в функции
substring(str, pos, len)
- Добавлен параметр max_size для агрегатной функции
groupArray(max_size)(column)
, и оптимизирована её производительность
Основные изменения:
- Улучшение безопасности: все файлы сервера создаются с правами 0640 (можно поменять, через параметр в конфиге).
- Улучшены сообщения об ошибках в случае синтаксически неверных запросов
- Значительно уменьшен расход оперативной памяти и улучшена производительность слияний больших MergeTree-кусков данных
- Значительно увеличена производительность слияний данных для движка ReplacingMergeTree
- Улучшена производительность асинхронных вставок из Distributed таблицы за счет объединения нескольких исходных вставок. Функциональность включается настройкой distributed_directory_monitor_batch_inserts=1.
Обратно несовместимые изменения:
- Изменился бинарный формат агрегатных состояний функции
groupArray(array_column)
для массивов
Полный список изменений:
- Добавлена настройка
output_format_json_quote_denormals
, включающая вывод nan и inf значений в формате JSON - Более оптимальное выделение потоков при чтении из Distributed таблиц
- Разрешено задавать настройки в режиме readonly, если их значение не изменяется
- Добавлена возможность считывать нецелые гранулы движка MergeTree для выполнения ограничений на размер блока, задаваемый настройкой preferred_block_size_bytes - для уменьшения потребления оперативной памяти и увеличения кэш-локальности при обработке запросов из таблиц со столбцами большого размера
- Эффективное использование индекса, содержащего выражения типа
toStartOfHour(x)
, для условий видаtoStartOfHour(x) op сonstexpr
- Добавлены новые настройки для MergeTree движков (секция merge_tree в config.xml):
- replicated_deduplication_window_seconds позволяет задать интервал дедупликации вставок в Replicated-таблицы в секундах
- cleanup_delay_period - периодичность запуска очистки неактуальных данных
- replicated_can_become_leader - запретить реплике становиться лидером (и назначать мержи)
- Ускорена очистка неактуальных данных из ZooKeeper
- Множественные улучшения и исправления работы кластерных DDL запросов. В частности, добавлена настройка distributed_ddl_task_timeout, ограничивающая время ожидания ответов серверов кластера. Если запрос не успел выполниться на всех нодах в установленное время, ответ будет содержать timeout ошибку и дальнейшее выполнение этого запроса будет происходить в асинхронном режиме
- Улучшено отображение стэктрейсов в логах сервера
- Добавлен метод сжатия none
- Возможность использования нескольких секций dictionaries_config в config.xml
- Возможность подключения к MySQL через сокет на файловой системе
- В таблицу system.parts добавлен столбец с информацией о размере marks в байтах
Исправления багов:
- Исправлена некорректная работа Distributed таблиц, использующих Merge таблицы, при SELECT с условием на поле _table
- Исправлен редкий race condition в ReplicatedMergeTree при проверке кусков данных
- Исправлено возможное зависание процедуры leader election при старте сервера
- Исправлено игнорирование настройки max_replica_delay_for_distributed_queries при использовании локальной реплики в качестве источника данных
- Исправлено некорректное поведение
ALTER TABLE CLEAR COLUMN IN PARTITION
при попытке очистить несуществующую колонку - Исправлено исключение в функции multiIf при использовании пустых массивов или строк
- Исправлено чрезмерное выделение памяти при десериализации формата Native
- Исправлено некорректное автообновление Trie словарей
- Исправлено исключение при выполнении запросов с GROUP BY из Merge-таблицы при использовании SAMPLE
- Исправлено падение GROUP BY при использовании настройки distributed_aggregation_memory_efficient=1
- Добавлена возможность указывать database.table в правой части IN и JOIN
- Исправлено использование слишком большого количества потоков при параллельной агрегации
- Исправлена работа функции if с аргументами FixedString
- Исправлена некорректная работа SELECT из Distributed-таблицы для шардов с весом 0
- Исправлено падение запроса
CREATE VIEW IF EXISTS
- Исправлено некорректное поведение при input_format_skip_unknown_fields=1 в случае отрицательных чисел
- Исправлен бесконечный цикл в функции
dictGetHierarchy()
в случае некоторых некорректных данных словаря - Исправлены ошибки типа
Syntax error: unexpected (...)
при выполнении распределенных запросов с подзапросами в секции IN или JOIN, в случае использования совместно с Merge таблицами - Исправлена неправильная интерпретация SELECT запроса из таблиц типа Dictionary
- Исправлена ошибка "Cannot mremap" при использовании множеств в секциях IN, JOIN, содержащих более 2 млрд. элементов
- Исправлен failover для словарей с источником MySQL
Улучшения процесса разработки и сборки ClickHouse:
- Добавлена возмозможность сборки в Arcadia
- Добавлена возможность сборки с помощью gcc 7
- Ускорена параллельная сборка с помощью ccache+distcc
Релиз ClickHouse 1.1.54245, 2017-07-04
Новые возможности:
- Распределённые DDL (например,
CREATE TABLE ON CLUSTER
) - Реплицируемый запрос
ALTER TABLE CLEAR COLUMN IN PARTITION
- Движок таблиц Dictionary (доступ к данным словаря в виде таблицы)
- Движок баз данных Dictionary (в такой базе автоматически доступны Dictionary-таблицы для всех подключённых внешних словарей)
- Возможность проверки необходимости обновления словаря путём отправки запроса в источник
- Qualified имена столбцов
- Квотирование идентификаторов двойными кавычками
- Сессии в HTTP интерфейсе
- Запрос OPTIMIZE для Replicated таблицы теперь можно выполнять не только на лидере
Обратно несовместимые изменения:
- Убрана команда SET GLOBAL
Мелкие изменения:
- Теперь после получения сигнала в лог печатается полный стектрейс
- Ослаблена проверка на количество повреждённых/лишних кусков при старте (было слишком много ложных срабатываний)
Исправления багов:
- Исправлено залипание плохого соединения при вставке в Distributed таблицу
- GLOBAL IN теперь работает при запросе из таблицы Merge, смотрящей в Distributed
- Теперь правильно определяется количество ядер на виртуалках Google Compute Engine
- Исправления в работе executable источника кэшируемых внешних словарей
- Исправлены сравнения строк, содержащих нулевые символы
- Исправлено сравнение полей первичного ключа типа Float32 с константами
- Раньше неправильная оценка размера поля могла приводить к слишком большим аллокациям
- Исправлено падение при запросе Nullable столбца, добавленного в таблицу ALTER-ом
- Исправлено падение при сортировке по Nullable столбцу, если количество строк меньше LIMIT
- Исправлен ORDER BY подзапроса, состоящего только из константных значений
- Раньше Replicated таблица могла остаться в невалидном состоянии после неудавшегося DROP TABLE
- Алиасы для скалярных подзапросов с пустым результатом теперь не теряются
- Теперь запрос, в котором использовалась компиляция, не завершается ошибкой, если .so файл повреждается