8.3 KiB
machine_translated | machine_translated_rev | toc_priority | toc_title |
---|---|---|---|
true | e8cd92bba3 |
37 | Toplama fonksiyonu birleştiriciler |
Toplama Fonksiyonu Birleştiriciler
Bir toplama işlevinin adı, ona eklenmiş bir sonek olabilir. Bu, toplama işlevinin çalışma şeklini değiştirir.
-Eğer
The suffix -If can be appended to the name of any aggregate function. In this case, the aggregate function accepts an extra argument – a condition (Uint8 type). The aggregate function processes only the rows that trigger the condition. If the condition was not triggered even once, it returns a default value (usually zeros or empty strings).
Örnekler: sumIf(column, cond)
, countIf(cond)
, avgIf(x, cond)
, quantilesTimingIf(level1, level2)(x, cond)
, argMinIf(arg, val, cond)
ve böyle devam eder.
Koşullu toplama işlevleriyle, alt sorgular kullanmadan aynı anda birkaç koşul için toplamları hesaplayabilirsiniz ve JOIN
s. Örneğin, Üye olarak.Metrica, koşullu toplama işlevleri segment karşılaştırma işlevselliğini uygulamak için kullanılır.
-Dizi
- Array soneki herhangi bir toplama işlevine eklenebilir. Bu durumda, toplama işlevi, ‘Array(T)’ type (ar arraysra )ys) yerine ‘T’ bağımsız değişkenleri yazın. Toplama işlevi birden çok bağımsız değişken kabul ederse, bu eşit uzunlukta diziler olmalıdır. Dizileri işlerken, toplama işlevi tüm dizi öğelerinde orijinal toplama işlevi gibi çalışır.
Örnek 1: sumArray(arr)
- Tüm unsurları toplamları ‘arr’ diziler. Bu örnekte, daha basit yazılmış olabilir: sum(arraySum(arr))
.
Örnek 2: uniqArray(arr)
– Counts the number of unique elements in all ‘arr’ diziler. Bu daha kolay bir şekilde yapılabilir: uniq(arrayJoin(arr))
, ancak eklemek her zaman mümkün değildir ‘arrayJoin’ bir sorguya.
- Eğer ve-dizi kombine edilebilir. Ancak, ‘Array’ önce gel mustmeli, sonra ‘If’. Örnekler: uniqArrayIf(arr, cond)
, quantilesTimingArrayIf(level1, level2)(arr, cond)
. Nedeniyle bu sipariş için, ‘cond’ argüman bir dizi olmayacak.
-Devlet
Bu birleştiriciyi uygularsanız, toplama işlevi elde edilen değeri döndürmez (örneğin, uniq fonksiyonu), ancak top aggreglamanın bir ara durumu (for uniq
, bu benzersiz değerlerin sayısını hesaplamak için karma tablodur). Bu bir AggregateFunction(...)
bu, daha fazla işlem için kullanılabilir veya daha sonra toplanmayı bitirmek için bir tabloda saklanabilir.
Bu durumlarla çalışmak için şunları kullanın:
- AggregatingMergeTree masa motoru.
- finalizeAggregation işlev.
- runningAccumulate işlev.
- -Birleştirmek birleştirici.
- - MergeState birleştirici.
-Birleştirmek
Bu birleştiriciyi uygularsanız, toplama işlevi Ara toplama durumunu bağımsız değişken olarak alır, toplama işlemini tamamlamak için durumları birleştirir ve elde edilen değeri döndürür.
- MergeState
Ara toplama durumlarını-birleştirme Birleştiricisi ile aynı şekilde birleştirir. Bununla birlikte, elde edilen değeri döndürmez, ancak-State combinator'a benzer bir ara toplama durumu döndürür.
- ForEach
Tablolar için bir toplama işlevi, karşılık gelen dizi öğelerini toplayan ve bir dizi sonuç döndüren diziler için bir toplama işlevine dönüştürür. Mesela, sumForEach
diz theiler için [1, 2]
, [3, 4, 5]
ve[6, 7]
sonucu döndürür [10, 13, 5]
karşılık gelen dizi öğelerini bir araya getirdikten sonra.
- OrDefault
Toplamak için hiçbir şey yoksa, toplama işlevinin dönüş türünün Varsayılan değerini doldurur.
SELECT avg(number), avgOrDefault(number) FROM numbers(0)
┌─avg(number)─┬─avgOrDefault(number)─┐
│ nan │ 0 │
└─────────────┴──────────────────────┘
- OrNull
Doldurmalar null
toplamak için hiçbir şey varsa. Dönüş sütun null olur.
SELECT avg(number), avgOrNull(number) FROM numbers(0)
┌─avg(number)─┬─avgOrNull(number)─┐
│ nan │ ᴺᵁᴸᴸ │
└─────────────┴───────────────────┘
- OrDefault ve-OrNull diğer birleştiriciler ile kombine edilebilir. Toplama işlevi boş girişi kabul etmediğinde yararlıdır.
SELECT avgOrNullIf(x, x > 10)
FROM
(
SELECT toDecimal32(1.23, 2) AS x
)
┌─avgOrNullIf(x, greater(x, 10))─┐
│ ᴺᵁᴸᴸ │
└────────────────────────────────┘
- Resample
Verileri gruplara ayırmanızı sağlar ve ardından bu gruplardaki verileri ayrı ayrı toplar. Gruplar, değerleri bir sütundan aralıklara bölerek oluşturulur.
<aggFunction>Resample(start, end, step)(<aggFunction_params>, resampling_key)
Parametre
start
— Starting value of the whole required interval forresampling_key
değerler.stop
— Ending value of the whole required interval forresampling_key
değerler. Tüm Aralık içermezstop
değer[start, stop)
.step
— Step for separating the whole interval into subintervals. TheaggFunction
bu alt aralıkların her biri üzerinde bağımsız olarak yürütülür.resampling_key
— Column whose values are used for separating data into intervals.aggFunction_params
—aggFunction
parametre.
Döndürülen değerler
- Ar arrayray of
aggFunction
her subinterval için sonuçlar.
Örnek
Düşünün people
aşağıdaki verilerle tablo:
┌─name───┬─age─┬─wage─┐
│ John │ 16 │ 10 │
│ Alice │ 30 │ 15 │
│ Mary │ 35 │ 8 │
│ Evelyn │ 48 │ 11.5 │
│ David │ 62 │ 9.9 │
│ Brian │ 60 │ 16 │
└────────┴─────┴──────┘
Yaş aralığı içinde olan kişilerin isimlerini alalım [30,60)
ve [60,75)
. Yaş için tamsayı temsilini kullandığımızdan, yaşları [30, 59]
ve [60,74]
aralıklılar.
Bir dizideki isimleri toplamak için, groupArray toplama işlevi. Bir argüman alır. Bizim durumumuzda, bu name
sütun. Bu groupArrayResample
fonksiyon kullanmalıdır age
yaşlara göre isimleri toplamak için sütun. Gerekli aralıkları tanımlamak için 30, 75, 30
argü themanlar içine groupArrayResample
işlev.
SELECT groupArrayResample(30, 75, 30)(name, age) FROM people
┌─groupArrayResample(30, 75, 30)(name, age)─────┐
│ [['Alice','Mary','Evelyn'],['David','Brian']] │
└───────────────────────────────────────────────┘
Sonuçları düşünün.
Jonh
çok genç olduğu için numunenin dışında. Diğer insanlar belirtilen yaş aralıklarına göre dağıtılır.
Şimdi toplam insan sayısını ve ortalama ücretlerini belirtilen yaş aralıklarında sayalım.
SELECT
countResample(30, 75, 30)(name, age) AS amount,
avgResample(30, 75, 30)(wage, age) AS avg_wage
FROM people
┌─amount─┬─avg_wage──────────────────┐
│ [3,2] │ [11.5,12.949999809265137] │
└────────┴───────────────────────────┘