* Replace underscores with hyphens * remove temporary code * fix style check * fix collapse
6.0 KiB
machine_translated | machine_translated_rev | toc_priority | toc_title |
---|---|---|---|
true | e8cd92bba3 |
34 | SummingMergeTree |
SummingMergeTree
Motor devralır MergeTree. Fark, veri parçalarını birleştirirken SummingMergeTree
tablolar ClickHouse tüm satırları aynı birincil anahtarla değiştirir (veya daha doğru olarak, aynı sıralama anahtarı) sayısal veri türüne sahip sütunlar için özetlenen değerleri içeren bir satır ile. Sıralama anahtarı, tek bir anahtar değeri çok sayıda satıra karşılık gelecek şekilde oluşturulursa, bu, depolama birimini önemli ölçüde azaltır ve veri seçimini hızlandırır.
Motoru birlikte kullanmanızı öneririz MergeTree
. Mağaza tam veri MergeTree
tablo ve kullanım SummingMergeTree
örneğin, rapor hazırlarken toplu veri depolamak için. Böyle bir yaklaşım, yanlış oluşturulmuş bir birincil anahtar nedeniyle değerli verileri kaybetmenizi önleyecektir.
Tablo oluşturma
CREATE TABLE [IF NOT EXISTS] [db.]table_name [ON CLUSTER cluster]
(
name1 [type1] [DEFAULT|MATERIALIZED|ALIAS expr1],
name2 [type2] [DEFAULT|MATERIALIZED|ALIAS expr2],
...
) ENGINE = SummingMergeTree([columns])
[PARTITION BY expr]
[ORDER BY expr]
[SAMPLE BY expr]
[SETTINGS name=value, ...]
İstek parametrelerinin açıklaması için bkz. istek açıklaması.
SummingMergeTree parametreleri
-
columns
- değerlerin özetleneceği sütunların adlarına sahip bir tuple. İsteğe bağlı parametre. Sütunlar sayısal tipte olmalı ve birincil anahtarda olmamalıdır.Eğer
columns
belirtilmemiş, ClickHouse birincil anahtarda olmayan bir sayısal veri türü ile tüm sütunlardaki değerleri özetler.
Sorgu yan tümceleri
Oluştururken bir SummingMergeTree
tablo aynı yanlar oluşturul ,urken olduğu gibi gerekli MergeTree
Tablo.
Bir tablo oluşturmak için kullanımdan kaldırılan yöntem
!!! attention "Dikkat" Bu yöntemi yeni projelerde kullanmayın ve mümkünse eski projeleri yukarıda açıklanan yönteme geçin.
CREATE TABLE [IF NOT EXISTS] [db.]table_name [ON CLUSTER cluster]
(
name1 [type1] [DEFAULT|MATERIALIZED|ALIAS expr1],
name2 [type2] [DEFAULT|MATERIALIZED|ALIAS expr2],
...
) ENGINE [=] SummingMergeTree(date-column [, sampling_expression], (primary, key), index_granularity, [columns])
Hariç tüm parametreler columns
içinde olduğu gibi aynı anlama sahip MergeTree
.
columns
— tuple with names of columns values of which will be summarized. Optional parameter. For a description, see the text above.
Kullanım Örneği
Aşağıdaki tabloyu düşünün:
CREATE TABLE summtt
(
key UInt32,
value UInt32
)
ENGINE = SummingMergeTree()
ORDER BY key
Veri Ekle:
INSERT INTO summtt Values(1,1),(1,2),(2,1)
ClickHouse tüm satırları tamamen toplayabilir (aşağıya bakın), bu yüzden bir toplama işlevi kullanıyoruz sum
ve GROUP BY
sorguda yan tümcesi.
SELECT key, sum(value) FROM summtt GROUP BY key
┌─key─┬─sum(value)─┐
│ 2 │ 1 │
│ 1 │ 3 │
└─────┴────────────┘
Veri İşleme
Veriler bir tabloya eklendiğinde, bunlar olduğu gibi kaydedilir. ClickHouse, verilerin eklenen bölümlerini periyodik olarak birleştirir ve bu, aynı birincil anahtara sahip satırların toplandığı ve sonuçta elde edilen her veri parçası için bir tane ile değiştirildiği zamandır.
ClickHouse can merge the data parts so that different resulting parts of data cat consist rows with the same primary key, i.e. the summation will be incomplete. Therefore (SELECT
) bir toplama fonksiyonu toplam() ve GROUP BY
yukarıdaki örnekte açıklandığı gibi yan tümcesi bir sorguda kullanılmalıdır.
Toplama İçin Ortak Kurallar
Sayısal veri türüne sahip sütunlardaki değerler özetlenir. Sütun kümesi parametre tarafından tanımlanır columns
.
Değerler toplamı için tüm sütunlarda 0 ise, satır silinir.
Sütun birincil anahtarda değilse ve özetlenmezse, mevcut olanlardan rasgele bir değer seçilir.
Değerler, birincil anahtardaki sütunlar için özetlenmez.
Aggregatefunction Sütunlarındaki Toplama
Sütunlar için AggregateFunction türü ClickHouse olarak davranır AggregatingMergeTree işleve göre motor toplama.
İç İçe Yapılar
Tablo, özel bir şekilde işlenen iç içe geçmiş veri yapılarına sahip olabilir.
İç içe geçmiş bir tablonun adı ile bitiyorsa Map
ve aşağıdaki kriterleri karşılayan en az iki sütun içerir:
- ilk sütun sayısal
(*Int*, Date, DateTime)
veya bir dize(String, FixedString)
hadi diyelimkey
, - diğer sütunlar aritmetik
(*Int*, Float32/64)
hadi diyelim(values...)
,
sonra bu iç içe geçmiş tablo bir eşleme olarak yorumlanır key => (values...)
ve satırlarını birleştirirken, iki veri kümesinin öğeleri şu şekilde birleştirilir key
karşılık gelen bir toplamı ile (values...)
.
Örnekler:
[(1, 100)] + [(2, 150)] -> [(1, 100), (2, 150)]
[(1, 100)] + [(1, 150)] -> [(1, 250)]
[(1, 100)] + [(1, 150), (2, 150)] -> [(1, 250), (2, 150)]
[(1, 100), (2, 150)] + [(1, -100)] -> [(2, 150)]
Veri isterken, sumMap (anahtar, değer) toplama fonksiyonu Map
.
İç içe geçmiş veri yapısı için, sütunlarının toplamı için sütun kümesinde belirtmeniz gerekmez.