ClickHouse/docs/zh/sql-reference/aggregate-functions/reference/uniqhll12.md
2021-03-25 17:09:19 +08:00

1.7 KiB
Raw Blame History

toc_priority
194

uniqHLL12

计算不同参数值的近似数量,使用 HyperLogLog 算法。

语法

uniqHLL12(x[, ...])

参数

该函数采用可变数量的参数。 参数可以是 Tuple, Array, Date, DateTime, String,或数字类型。

返回值

返回值

  • 一个UInt64类型的数字。

实现细节

功能:

  • 计算聚合中所有参数的哈希值,然后在计算中使用它。

  • 使用 HyperLogLog 算法来近似不同参数值的数量。

    使用2^12个5比特单元。 状态的大小略大于2.5KB。 对于小数据集(<10K元素结果不是很准确误差高达10%)。 但是, 对于高基数数据集10K-100M结果相当准确最大误差约为1.6%。Starting from 100M, the estimation error increases, and the function will return very inaccurate results for data sets with extremely high cardinality (1B+ elements).
    
  • 提供确定结果(它不依赖于查询处理顺序)。

我们不建议使用此函数。 在大多数情况下, 使用 uniquniqCombined 函数。

参见