ClickHouse/docs/ru/sql-reference/aggregate-functions/reference/uniqhll12.md
Anna 77cdf8c840
DOCSUP-1916 split reference.md into separate files (#12963)
* Add files with russian desc.

* Fixed links.

* Fixed links.

* Fixed link

* Fixed links.

Co-authored-by: Anna Devyatova <annadevyatova@yandex-team.ru>
2020-07-29 09:49:57 +03:00

2.6 KiB
Raw Blame History

toc_priority
194

uniqHLL12

Вычисляет приблизительное число различных значений аргументов, используя алгоритм HyperLogLog.

uniqHLL12(x[, ...])

Параметры

Функция принимает переменное число входных параметров. Параметры могут быть числовых типов, а также Tuple, Array, Date, DateTime, String.

Возвращаемое значение

  • Значение хэша с типом данных UInt64.

Детали реализации

Функция:

  • Вычисляет хэш для всех параметров агрегации, а затем использует его в вычислениях.

  • Использует алгоритм HyperLogLog для аппроксимации числа различных значений аргументов.

    Используется 212 5-битовых ячеек. Размер состояния чуть больше 2.5 КБ. Результат не точный (ошибка до ~10%) для небольших множеств (<10K элементов). Однако для множеств большой кардинальности (10K - 100M) результат довольно точен (ошибка до ~1.6%). Начиная с 100M ошибка оценки будет только расти и для множеств огромной кардинальности (1B+ элементов) функция возвращает результат с очень большой неточностью.
    
  • Результат детерминирован (не зависит от порядка выполнения запроса).

Мы не рекомендуем использовать эту функцию. В большинстве случаев используйте функцию uniq или uniqCombined.