ClickHouse/docs/zh/sql-reference/aggregate-functions/reference/quantiletdigestweighted.md
2022-04-10 17:08:18 -06:00

2.5 KiB
Raw Blame History

sidebar_position
208

quantileTDigestWeighted

使用t-digest 算法计算数字序列近似分位数。该函数考虑了每个序列成员的权重。最大误差为1%。 内存消耗为 log(n),这里 n 是值的个数。

该函数的性能低于 quantilequantileTiming 的性能。 从状态大小和精度的比值来看,这个函数比 quantile 更优秀。

结果取决于运行查询的顺序,并且是不确定的。

当在一个查询中使用多个不同层次的 quantile* 时,内部状态不会被组合(即查询的工作效率低于组合情况)。在这种情况下,使用 quantiles 函数。

语法

quantileTDigestWeighted(level)(expr, weight)

别名: medianTDigestWeighted

参数

  • level — 分位数层次。可选参数。从0到1的一个float类型的常量。我们推荐 level 值的范围为 [0.01, 0.99] 。默认值0.5。 当 level=0.5 时,该函数计算 中位数
  • expr — 求值表达式,类型为数值类型data types, DateDateTime
  • weight — 权重序列。 权重是一个数据出现的数值。

返回值

  • 指定层次的分位数。

类型:

  • Float64 用于数字数据类型输入。
  • Date 如果输入值是 Date 类型。
  • DateTime 如果输入值是 DateTime 类型。

示例

查询:

SELECT quantileTDigestWeighted(number, 1) FROM numbers(10)

结果:

┌─quantileTDigestWeighted(number, 1)─┐
│                                4.5 │
└────────────────────────────────────┘

参见