Drop note about "estimation error for large sets will be large"

Since error is not that large, especially for uniqCombined64():

rows     error     uniqCombined64()/rows
- 1e7    0.00219   (1.0021969)
- 1e8    0.00096   (0.99903523)
- 2e8    0.50200   (1.005022735)
- 1e9    0.99944   (0.999435738)
- 1e10   0.01399   (0.9998568925)
- 1e11   0.09800   (1.00097891658)
- 1e12   0.29800   (0.997024870685)
- 1e13   0.62200   (1.0062169910992)
- 1e14   0.06200   (1.00062143604171)
This commit is contained in:
Azat Khuzhin 2019-10-09 01:41:09 +03:00
parent 9f0b3e5bbf
commit c2fa7ffcd3
2 changed files with 2 additions and 2 deletions

View File

@ -558,7 +558,7 @@ Calculates the approximate number of different argument values.
uniqCombined(HLL_precision)(x[, ...])
```
The `uniqCombined` function is a good choice for calculating the number of different values, but keep in mind that the estimation error for large sets (200 million elements and more) will be larger than the theoretical value due to the poor hash function choice.
The `uniqCombined` function is a good choice for calculating the number of different values.
**Parameters**

View File

@ -568,7 +568,7 @@ uniq(x[, ...])
uniqCombined(HLL_precision)(x[, ...])
```
Функция `uniqCombined` — это хороший выбор для вычисления количества различных значений, однако стоит иметь в виду, что ошибка оценки для больших множеств (более 200 миллионов элементов) будет выше теоретического значения из-за плохого выбора хэш-функции.
Функция `uniqCombined` — это хороший выбор для вычисления количества различных значений.
**Параметры**