2021-02-02 12:00:41 +00:00
|
|
|
|
---
|
|
|
|
|
toc_priority: 192
|
|
|
|
|
---
|
|
|
|
|
|
|
|
|
|
# uniqCombined {#agg_function-uniqcombined}
|
|
|
|
|
|
2021-03-03 14:21:14 +00:00
|
|
|
|
计算不同参数值的近似数量。
|
2021-02-02 12:00:41 +00:00
|
|
|
|
|
2021-03-03 14:21:14 +00:00
|
|
|
|
**语法**
|
2021-02-02 12:00:41 +00:00
|
|
|
|
``` sql
|
|
|
|
|
uniqCombined(HLL_precision)(x[, ...])
|
|
|
|
|
```
|
2021-03-03 14:21:14 +00:00
|
|
|
|
该 `uniqCombined` 函数是计算不同值数量的不错选择。
|
2021-02-02 12:00:41 +00:00
|
|
|
|
|
2021-03-03 14:21:14 +00:00
|
|
|
|
**参数**
|
2021-02-02 12:00:41 +00:00
|
|
|
|
|
2021-03-03 14:21:14 +00:00
|
|
|
|
该函数采用可变数量的参数。 参数可以是 `Tuple`, `Array`, `Date`, `DateTime`, `String`,或数字类型。
|
2021-02-02 12:00:41 +00:00
|
|
|
|
|
2021-03-03 14:21:14 +00:00
|
|
|
|
`HLL_precision` 是以2为底的单元格数的对数 [HyperLogLog](https://en.wikipedia.org/wiki/HyperLogLog)。可选,您可以将该函数用作 `uniqCombined(x[, ...])`。 `HLL_precision` 的默认值是17,这是有效的96KiB的空间(2^17个单元,每个6比特)。
|
2021-02-02 12:00:41 +00:00
|
|
|
|
|
2021-03-03 14:21:14 +00:00
|
|
|
|
**返回值**
|
2021-02-02 12:00:41 +00:00
|
|
|
|
|
2021-03-03 14:21:14 +00:00
|
|
|
|
- 一个[UInt64](../../../sql-reference/data-types/int-uint.md)类型的数字。
|
2021-02-02 12:00:41 +00:00
|
|
|
|
|
2021-03-03 14:21:14 +00:00
|
|
|
|
**实现细节**
|
2021-02-02 12:00:41 +00:00
|
|
|
|
|
2021-03-03 14:21:14 +00:00
|
|
|
|
功能:
|
2021-02-02 12:00:41 +00:00
|
|
|
|
|
2021-03-03 14:21:14 +00:00
|
|
|
|
- 为聚合中的所有参数计算哈希(`String`类型用64位哈希,其他32位),然后在计算中使用它。
|
2021-02-02 12:00:41 +00:00
|
|
|
|
|
2021-03-03 14:21:14 +00:00
|
|
|
|
- 使用三种算法的组合:数组、哈希表和包含错误修正表的HyperLogLog。
|
2021-02-02 12:00:41 +00:00
|
|
|
|
|
|
|
|
|
|
2021-03-03 14:21:14 +00:00
|
|
|
|
少量的不同的值,使用数组。 值再多一些,使用哈希表。对于大量的数据来说,使用HyperLogLog,HyperLogLog占用一个固定的内存空间。
|
2021-02-02 12:00:41 +00:00
|
|
|
|
|
2021-03-03 14:21:14 +00:00
|
|
|
|
- 确定性地提供结果(它不依赖于查询处理顺序)。
|
2021-02-02 12:00:41 +00:00
|
|
|
|
|
2021-03-03 14:21:14 +00:00
|
|
|
|
!!! note "注"
|
|
|
|
|
由于它对非 `String` 类型使用32位哈希,对于基数显著大于`UINT_MAX` ,结果将有非常高的误差(误差将在几百亿不同值之后迅速提高), 因此这种情况,你应该使用 [uniqCombined64](../../../sql-reference/aggregate-functions/reference/uniqcombined64.md#agg_function-uniqcombined64)
|
2021-02-02 12:00:41 +00:00
|
|
|
|
|
2021-03-03 14:21:14 +00:00
|
|
|
|
相比于 [uniq](../../../sql-reference/aggregate-functions/reference/uniq.md#agg_function-uniq) 函数, 该 `uniqCombined`:
|
2021-02-02 12:00:41 +00:00
|
|
|
|
|
2021-03-03 14:21:14 +00:00
|
|
|
|
- 消耗内存要少几倍。
|
|
|
|
|
- 计算精度高出几倍。
|
|
|
|
|
- 通常具有略低的性能。 在某些情况下, `uniqCombined` 可以表现得比 `uniq` 好,例如,使用通过网络传输大量聚合状态的分布式查询。
|
2021-02-02 12:00:41 +00:00
|
|
|
|
|
2021-03-03 14:21:14 +00:00
|
|
|
|
**参见**
|
2021-02-02 12:00:41 +00:00
|
|
|
|
|
|
|
|
|
- [uniq](../../../sql-reference/aggregate-functions/reference/uniq.md#agg_function-uniq)
|
|
|
|
|
- [uniqCombined64](../../../sql-reference/aggregate-functions/reference/uniqcombined64.md#agg_function-uniqcombined64)
|
|
|
|
|
- [uniqHLL12](../../../sql-reference/aggregate-functions/reference/uniqhll12.md#agg_function-uniqhll12)
|
|
|
|
|
- [uniqExact](../../../sql-reference/aggregate-functions/reference/uniqexact.md#agg_function-uniqexact)
|