mirror of
https://github.com/ClickHouse/ClickHouse.git
synced 2024-11-23 16:12:01 +00:00
2.6 KiB
2.6 KiB
toc_priority |
---|
194 |
uniqHLL12
Вычисляет приблизительное число различных значений аргументов, используя алгоритм HyperLogLog.
uniqHLL12(x[, ...])
Аргументы
Функция принимает переменное число входных параметров. Параметры могут быть числовых типов, а также Tuple
, Array
, Date
, DateTime
, String
.
Возвращаемое значение
- Значение хэша с типом данных UInt64.
Детали реализации
Функция:
-
Вычисляет хэш для всех параметров агрегации, а затем использует его в вычислениях.
-
Использует алгоритм HyperLogLog для аппроксимации числа различных значений аргументов.
Используется 2^12 5-битовых ячеек. Размер состояния чуть больше 2.5 КБ. Результат не точный (ошибка до ~10%) для небольших множеств (<10K элементов). Однако для множеств большой кардинальности (10K - 100M) результат довольно точен (ошибка до ~1.6%). Начиная с 100M ошибка оценки будет только расти и для множеств огромной кардинальности (1B+ элементов) функция возвращает результат с очень большой неточностью.
-
Результат детерминирован (не зависит от порядка выполнения запроса).
Мы не рекомендуем использовать эту функцию. В большинстве случаев используйте функцию uniq или uniqCombined.