mirror of https://github.com/ClickHouse/ClickHouse.git synced 2024-12-19 12:52:37 +00:00

2020-04-15 16:56:49 +03:00

8.3 KiB

Raw Blame History

machine_translated	machine_translated_rev	toc_priority	toc_title
true	`e8cd92bba3`	37	Toplama fonksiyonu birleştiriciler

Toplama Fonksiyonu Birleştiriciler

Bir toplama işlevinin adı, ona eklenmiş bir sonek olabilir. Bu, toplama işlevinin çalışma şeklini değiştirir.

-Eğer

The suffix -If can be appended to the name of any aggregate function. In this case, the aggregate function accepts an extra argument – a condition (Uint8 type). The aggregate function processes only the rows that trigger the condition. If the condition was not triggered even once, it returns a default value (usually zeros or empty strings).

Örnekler: sumIf(column, cond), countIf(cond), avgIf(x, cond), quantilesTimingIf(level1, level2)(x, cond), argMinIf(arg, val, cond) ve böyle devam eder.

Koşullu toplama işlevleriyle, alt sorgular kullanmadan aynı anda birkaç koşul için toplamları hesaplayabilirsiniz ve JOINs. Örneğin, Üye olarak.Metrica, koşullu toplama işlevleri segment karşılaştırma işlevselliğini uygulamak için kullanılır.

-Dizi

- Array soneki herhangi bir toplama işlevine eklenebilir. Bu durumda, toplama işlevi, ‘Array(T)’ type (ar arraysra )ys) yerine ‘T’ bağımsız değişkenleri yazın. Toplama işlevi birden çok bağımsız değişken kabul ederse, bu eşit uzunlukta diziler olmalıdır. Dizileri işlerken, toplama işlevi tüm dizi öğelerinde orijinal toplama işlevi gibi çalışır.

Örnek 1: sumArray(arr) - Tüm unsurları toplamları ‘arr’ diziler. Bu örnekte, daha basit yazılmış olabilir: sum(arraySum(arr)).

Örnek 2: uniqArray(arr) – Counts the number of unique elements in all ‘arr’ diziler. Bu daha kolay bir şekilde yapılabilir: uniq(arrayJoin(arr)), ancak eklemek her zaman mümkün değildir ‘arrayJoin’ bir sorguya.

- Eğer ve-dizi kombine edilebilir. Ancak, ‘Array’ önce gel mustmeli, sonra ‘If’. Örnekler: uniqArrayIf(arr, cond), quantilesTimingArrayIf(level1, level2)(arr, cond). Nedeniyle bu sipariş için, ‘cond’ argüman bir dizi olmayacak.

-Devlet

Bu birleştiriciyi uygularsanız, toplama işlevi elde edilen değeri döndürmez (örneğin, uniq fonksiyonu), ancak top aggreglamanın bir ara durumu (for uniq, bu benzersiz değerlerin sayısını hesaplamak için karma tablodur). Bu bir AggregateFunction(...) bu, daha fazla işlem için kullanılabilir veya daha sonra toplanmayı bitirmek için bir tabloda saklanabilir.

Bu durumlarla çalışmak için şunları kullanın:

AggregatingMergeTree masa motoru.
finalizeAggregation işlev.
runningAccumulate işlev.
-Birleştirmek birleştirici.
- MergeState birleştirici.

-Birleştirmek

Bu birleştiriciyi uygularsanız, toplama işlevi Ara toplama durumunu bağımsız değişken olarak alır, toplama işlemini tamamlamak için durumları birleştirir ve elde edilen değeri döndürür.

- MergeState

Ara toplama durumlarını-birleştirme Birleştiricisi ile aynı şekilde birleştirir. Bununla birlikte, elde edilen değeri döndürmez, ancak-State combinator'a benzer bir ara toplama durumu döndürür.

- ForEach

Tablolar için bir toplama işlevi, karşılık gelen dizi öğelerini toplayan ve bir dizi sonuç döndüren diziler için bir toplama işlevine dönüştürür. Mesela, sumForEach diz theiler için [1, 2], [3, 4, 5]ve[6, 7]sonucu döndürür [10, 13, 5] karşılık gelen dizi öğelerini bir araya getirdikten sonra.

- OrDefault

Toplamak için hiçbir şey yoksa, toplama işlevinin dönüş türünün Varsayılan değerini doldurur.

SELECT avg(number), avgOrDefault(number) FROM numbers(0)

┌─avg(number)─┬─avgOrDefault(number)─┐
│         nan │                    0 │
└─────────────┴──────────────────────┘

- OrNull

Doldurmalar null toplamak için hiçbir şey varsa. Dönüş sütun null olur.

SELECT avg(number), avgOrNull(number) FROM numbers(0)

┌─avg(number)─┬─avgOrNull(number)─┐
│         nan │              ᴺᵁᴸᴸ │
└─────────────┴───────────────────┘

- OrDefault ve-OrNull diğer birleştiriciler ile kombine edilebilir. Toplama işlevi boş girişi kabul etmediğinde yararlıdır.

SELECT avgOrNullIf(x, x > 10)
FROM
(
    SELECT toDecimal32(1.23, 2) AS x
)

┌─avgOrNullIf(x, greater(x, 10))─┐
│                           ᴺᵁᴸᴸ │
└────────────────────────────────┘

- Resample

Verileri gruplara ayırmanızı sağlar ve ardından bu gruplardaki verileri ayrı ayrı toplar. Gruplar, değerleri bir sütundan aralıklara bölerek oluşturulur.

<aggFunction>Resample(start, end, step)(<aggFunction_params>, resampling_key)

Parametre

start — Starting value of the whole required interval for resampling_key değerler.
stop — Ending value of the whole required interval for resampling_key değerler. Tüm Aralık içermez stop değer [start, stop).
step — Step for separating the whole interval into subintervals. The aggFunction bu alt aralıkların her biri üzerinde bağımsız olarak yürütülür.
resampling_key — Column whose values are used for separating data into intervals.
aggFunction_params — aggFunction parametre.

Döndürülen değerler

Ar arrayray of aggFunction her subinterval için sonuçlar.

Örnek

Düşünün people aşağıdaki verilerle tablo:

┌─name───┬─age─┬─wage─┐
│ John   │  16 │   10 │
│ Alice  │  30 │   15 │
│ Mary   │  35 │    8 │
│ Evelyn │  48 │ 11.5 │
│ David  │  62 │  9.9 │
│ Brian  │  60 │   16 │
└────────┴─────┴──────┘

Yaş aralığı içinde olan kişilerin isimlerini alalım [30,60) ve [60,75). Yaş için tamsayı temsilini kullandığımızdan, yaşları [30, 59] ve [60,74] aralıklılar.

Bir dizideki isimleri toplamak için, groupArray toplama işlevi. Bir argüman alır. Bizim durumumuzda, bu name sütun. Bu groupArrayResample fonksiyon kullanmalıdır age yaşlara göre isimleri toplamak için sütun. Gerekli aralıkları tanımlamak için 30, 75, 30 argü themanlar içine groupArrayResample işlev.

SELECT groupArrayResample(30, 75, 30)(name, age) FROM people

┌─groupArrayResample(30, 75, 30)(name, age)─────┐
│ [['Alice','Mary','Evelyn'],['David','Brian']] │
└───────────────────────────────────────────────┘

Sonuçları düşünün.

Jonh çok genç olduğu için numunenin dışında. Diğer insanlar belirtilen yaş aralıklarına göre dağıtılır.

Şimdi toplam insan sayısını ve ortalama ücretlerini belirtilen yaş aralıklarında sayalım.

SELECT
    countResample(30, 75, 30)(name, age) AS amount,
    avgResample(30, 75, 30)(wage, age) AS avg_wage
FROM people

┌─amount─┬─avg_wage──────────────────┐
│ [3,2]  │ [11.5,12.949999809265137] │
└────────┴───────────────────────────┘

Orijinal makale

8.3 KiB Raw Blame History Unescape Escape