* split up select.md * array-join.md basic refactoring * distinct.md basic refactoring * format.md basic refactoring * from.md basic refactoring * group-by.md basic refactoring * having.md basic refactoring * additional index.md refactoring * into-outfile.md basic refactoring * join.md basic refactoring * limit.md basic refactoring * limit-by.md basic refactoring * order-by.md basic refactoring * prewhere.md basic refactoring * adjust operators/index.md links * adjust sample.md links * adjust more links * adjust operatots links * fix some links * adjust aggregate function article titles * basic refactor of remaining select clauses * absolute paths in make_links.sh * run make_links.sh * remove old select.md locations * translate docs/es * translate docs/fr * translate docs/fa * remove old operators.md location * change operators.md links * adjust links in docs/es * adjust links in docs/es * minor texts adjustments * wip * update machine translations to use new links * fix changelog * es build fixes * get rid of some select.md links * temporary adjust ru links * temporary adjust more ru links * improve curly brace handling * adjust ru as well * fa build fix * ru link fixes * zh link fixes * temporary disable part of anchor checks
6.0 KiB
machine_translated | machine_translated_rev | toc_priority | toc_title |
---|---|---|---|
true | 72537a2d52 |
34 | SummingMergeTree |
SummingMergeTree
Motor devralır MergeTree. Fark, veri parçalarını birleştirirken SummingMergeTree
tablolar ClickHouse tüm satırları aynı birincil anahtarla değiştirir (veya daha doğru olarak, aynı sıralama anahtarı) sayısal veri türüne sahip sütunlar için özetlenen değerleri içeren bir satır ile. Sıralama anahtarı, tek bir anahtar değeri çok sayıda satıra karşılık gelecek şekilde oluşturulursa, bu, depolama birimini önemli ölçüde azaltır ve veri seçimini hızlandırır.
Motoru birlikte kullanmanızı öneririz MergeTree
. Mağaza tam veri MergeTree
tablo ve kullanım SummingMergeTree
örneğin, rapor hazırlarken toplu veri depolamak için. Böyle bir yaklaşım, yanlış oluşturulmuş bir birincil anahtar nedeniyle değerli verileri kaybetmenizi önleyecektir.
Tablo oluşturma
CREATE TABLE [IF NOT EXISTS] [db.]table_name [ON CLUSTER cluster]
(
name1 [type1] [DEFAULT|MATERIALIZED|ALIAS expr1],
name2 [type2] [DEFAULT|MATERIALIZED|ALIAS expr2],
...
) ENGINE = SummingMergeTree([columns])
[PARTITION BY expr]
[ORDER BY expr]
[SAMPLE BY expr]
[SETTINGS name=value, ...]
İstek parametrelerinin açıklaması için bkz. istek açıklaması.
SummingMergeTree parametreleri
-
columns
- değerlerin özetleneceği sütunların adlarına sahip bir tuple. İsteğe bağlı parametre. Sütunlar sayısal tipte olmalı ve birincil anahtarda olmamalıdır.Eğer
columns
belirtilmemiş, ClickHouse birincil anahtarda olmayan bir sayısal veri türü ile tüm sütunlardaki değerleri özetler.
Sorgu yan tümceleri
Oluştururken bir SummingMergeTree
tablo aynı yanlar oluşturul ,urken olduğu gibi gerekli MergeTree
Tablo.
Bir tablo oluşturmak için kullanımdan kaldırılan yöntem
!!! attention "Dikkat" Bu yöntemi yeni projelerde kullanmayın ve mümkünse eski projeleri yukarıda açıklanan yönteme geçin.
CREATE TABLE [IF NOT EXISTS] [db.]table_name [ON CLUSTER cluster]
(
name1 [type1] [DEFAULT|MATERIALIZED|ALIAS expr1],
name2 [type2] [DEFAULT|MATERIALIZED|ALIAS expr2],
...
) ENGINE [=] SummingMergeTree(date-column [, sampling_expression], (primary, key), index_granularity, [columns])
Hariç tüm parametreler columns
içinde olduğu gibi aynı anlama sahip MergeTree
.
columns
— tuple with names of columns values of which will be summarized. Optional parameter. For a description, see the text above.
Kullanım Örneği
Aşağıdaki tabloyu düşünün:
CREATE TABLE summtt
(
key UInt32,
value UInt32
)
ENGINE = SummingMergeTree()
ORDER BY key
Veri Ekle:
INSERT INTO summtt Values(1,1),(1,2),(2,1)
ClickHouse tüm satırları tamamen toplayabilir (aşağıya bakın), bu yüzden bir toplama işlevi kullanıyoruz sum
ve GROUP BY
sorguda yan tümcesi.
SELECT key, sum(value) FROM summtt GROUP BY key
┌─key─┬─sum(value)─┐
│ 2 │ 1 │
│ 1 │ 3 │
└─────┴────────────┘
Veri İşleme
Veriler bir tabloya eklendiğinde, bunlar olduğu gibi kaydedilir. ClickHouse, verilerin eklenen bölümlerini periyodik olarak birleştirir ve bu, aynı birincil anahtara sahip satırların toplandığı ve sonuçta elde edilen her veri parçası için bir tane ile değiştirildiği zamandır.
ClickHouse can merge the data parts so that different resulting parts of data cat consist rows with the same primary key, i.e. the summation will be incomplete. Therefore (SELECT
) bir toplama fonksiyonu toplam() ve GROUP BY
yukarıdaki örnekte açıklandığı gibi yan tümcesi bir sorguda kullanılmalıdır.
Toplama için ortak kurallar
Sayısal veri türüne sahip sütunlardaki değerler özetlenir. Sütun kümesi parametre tarafından tanımlanır columns
.
Değerler toplamı için tüm sütunlarda 0 ise, satır silinir.
Sütun birincil anahtarda değilse ve özetlenmezse, mevcut olanlardan rasgele bir değer seçilir.
Değerler, birincil anahtardaki sütunlar için özetlenmez.
Aggregatefunction Sütunlarındaki toplama
Sütunlar için AggregateFunction türü ClickHouse olarak davranır AggregatingMergeTree işleve göre motor toplama.
İç İçe Yapılar
Tablo, özel bir şekilde işlenen iç içe geçmiş veri yapılarına sahip olabilir.
İç içe geçmiş bir tablonun adı ile bitiyorsa Map
ve aşağıdaki kriterleri karşılayan en az iki sütun içerir:
- ilk sütun sayısal
(*Int*, Date, DateTime)
veya bir dize(String, FixedString)
hadi diyelimkey
, - diğer sütunlar aritmetik
(*Int*, Float32/64)
hadi diyelim(values...)
,
sonra bu iç içe geçmiş tablo bir eşleme olarak yorumlanır key => (values...)
ve satırlarını birleştirirken, iki veri kümesinin öğeleri şu şekilde birleştirilir key
karşılık gelen bir toplamı ile (values...)
.
Örnekler:
[(1, 100)] + [(2, 150)] -> [(1, 100), (2, 150)]
[(1, 100)] + [(1, 150)] -> [(1, 250)]
[(1, 100)] + [(1, 150), (2, 150)] -> [(1, 250), (2, 150)]
[(1, 100), (2, 150)] + [(1, -100)] -> [(2, 150)]
Veri isterken, sumMap (anahtar, değer) toplama fonksiyonu Map
.
İç içe geçmiş veri yapısı için, sütunlarının toplamı için sütun kümesinde belirtmeniz gerekmez.