mirror of
https://github.com/ClickHouse/ClickHouse.git
synced 2024-11-10 09:32:06 +00:00
Drop note about "estimation error for large sets will be large"
Since error is not that large, especially for uniqCombined64(): rows error uniqCombined64()/rows - 1e7 0.00219 (1.0021969) - 1e8 0.00096 (0.99903523) - 2e8 0.50200 (1.005022735) - 1e9 0.99944 (0.999435738) - 1e10 0.01399 (0.9998568925) - 1e11 0.09800 (1.00097891658) - 1e12 0.29800 (0.997024870685) - 1e13 0.62200 (1.0062169910992) - 1e14 0.06200 (1.00062143604171)
This commit is contained in:
parent
9f0b3e5bbf
commit
c2fa7ffcd3
@ -558,7 +558,7 @@ Calculates the approximate number of different argument values.
|
||||
uniqCombined(HLL_precision)(x[, ...])
|
||||
```
|
||||
|
||||
The `uniqCombined` function is a good choice for calculating the number of different values, but keep in mind that the estimation error for large sets (200 million elements and more) will be larger than the theoretical value due to the poor hash function choice.
|
||||
The `uniqCombined` function is a good choice for calculating the number of different values.
|
||||
|
||||
**Parameters**
|
||||
|
||||
|
@ -568,7 +568,7 @@ uniq(x[, ...])
|
||||
uniqCombined(HLL_precision)(x[, ...])
|
||||
```
|
||||
|
||||
Функция `uniqCombined` — это хороший выбор для вычисления количества различных значений, однако стоит иметь в виду, что ошибка оценки для больших множеств (более 200 миллионов элементов) будет выше теоретического значения из-за плохого выбора хэш-функции.
|
||||
Функция `uniqCombined` — это хороший выбор для вычисления количества различных значений.
|
||||
|
||||
**Параметры**
|
||||
|
||||
|
Loading…
Reference in New Issue
Block a user