* split up select.md * array-join.md basic refactoring * distinct.md basic refactoring * format.md basic refactoring * from.md basic refactoring * group-by.md basic refactoring * having.md basic refactoring * additional index.md refactoring * into-outfile.md basic refactoring * join.md basic refactoring * limit.md basic refactoring * limit-by.md basic refactoring * order-by.md basic refactoring * prewhere.md basic refactoring * adjust operators/index.md links * adjust sample.md links * adjust more links * adjust operatots links * fix some links * adjust aggregate function article titles * basic refactor of remaining select clauses * absolute paths in make_links.sh * run make_links.sh * remove old select.md locations * translate docs/es * translate docs/fr * translate docs/fa * remove old operators.md location * change operators.md links * adjust links in docs/es * adjust links in docs/es * minor texts adjustments * wip * update machine translations to use new links * fix changelog * es build fixes * get rid of some select.md links * temporary adjust ru links * temporary adjust more ru links * improve curly brace handling * adjust ru as well * fa build fix * ru link fixes * zh link fixes * temporary disable part of anchor checks
12 KiB
machine_translated | machine_translated_rev | toc_priority | toc_title |
---|---|---|---|
true | 72537a2d52 |
37 | ترکیب کنندهها |
ترکیب کنندههای تابع جمع
نام یک تابع جمع می تواند یک پسوند اضافه شده است. این تغییر راه تابع کلی کار می کند.
- اگر
The suffix -If can be appended to the name of any aggregate function. In this case, the aggregate function accepts an extra argument – a condition (Uint8 type). The aggregate function processes only the rows that trigger the condition. If the condition was not triggered even once, it returns a default value (usually zeros or empty strings).
مثالها: sumIf(column, cond)
, countIf(cond)
, avgIf(x, cond)
, quantilesTimingIf(level1, level2)(x, cond)
, argMinIf(arg, val, cond)
و به همین ترتیب.
با توابع مجموع شرطی, شما می توانید مصالح برای چندین شرایط در یک بار محاسبه, بدون استفاده از کارخانه های فرعی و JOIN
برای مثال در یاندکس.متریکا, توابع مجموع مشروط استفاده می شود برای پیاده سازی قابلیت مقایسه بخش.
حداقل صفحه نمایش:
پسوند مجموعه را می توان به هر تابع جمع اضافه شده است. در این مورد, تابع کل استدلال از طول می کشد ‘Array(T)’ نوع (ارریس) به جای ‘T’ استدلال نوع. اگر تابع جمع استدلال های متعدد را می پذیرد, این باید مجموعه ای از طول های برابر شود. هنگامی که پردازش ارریس, تابع کل کار می کند مانند تابع کل اصلی در تمام عناصر مجموعه.
مثال 1: sumArray(arr)
- مجموع تمام عناصر از همه ‘arr’ اراریس در این مثال می توانست بیشتر به سادگی نوشته شده است: sum(arraySum(arr))
.
مثال 2: uniqArray(arr)
– Counts the number of unique elements in all ‘arr’ اراریس این می تواند انجام شود یک راه ساده تر: uniq(arrayJoin(arr))
اما همیشه امکان اضافه کردن وجود ندارد ‘arrayJoin’ به پرس و جو.
- اگر و مجموعه ای می تواند ترکیب شود. هرچند, ‘Array’ پس اول باید بیای ‘If’. مثالها: uniqArrayIf(arr, cond)
, quantilesTimingArrayIf(level1, level2)(arr, cond)
. با توجه به این سفارش ‘cond’ برهان صف نیست.
- وضعیت
اگر شما درخواست این ترکیب, تابع کل می کند مقدار حاصل بازگشت نیست (مانند تعدادی از ارزش های منحصر به فرد برای دانشگاه تابع) , اما یک دولت متوسط از تجمع (برای uniq
, این جدول هش برای محاسبه تعداد ارزش های منحصر به فرد است). این یک AggregateFunction(...)
که می تواند برای پردازش بیشتر استفاده می شود و یا ذخیره شده در یک جدول را به پایان برساند جمع بعد.
برای کار با این کشورها, استفاده:
- ریزدانه موتور جدول.
- پلاکتی تابع.
- خرابی اجرا تابع.
- - ادغام ترکیب کننده.
- اطلاعات دقیق ترکیب کننده.
- ادغام
اگر شما درخواست این ترکیب, تابع کل طول می کشد حالت تجمع متوسط به عنوان یک استدلال, ترکیبی از کشورهای به پایان تجمع, و ارزش حاصل می گرداند.
اطلاعات دقیق
ادغام کشورهای تجمع متوسط در همان راه به عنوان ترکیب-ادغام. با این حال, این مقدار حاصل بازگشت نیست, اما یک دولت تجمع متوسط, شبیه به ترکیب دولت.
- فورچ
تبدیل یک تابع جمع برای جداول به یک تابع کلی برای ارریس که جمع اقلام مجموعه مربوطه و مجموعه ای از نتایج را برمی گرداند. به عنوان مثال, sumForEach
برای ارریس [1, 2]
, [3, 4, 5]
و[6, 7]
نتیجه را برمی گرداند [10, 13, 5]
پس از اضافه کردن با هم موارد مجموعه مربوطه.
شناسه بسته:
تغییر رفتار یک تابع جمع.
اگر یک تابع جمع می کند ارزش های ورودی ندارد, با این ترکیب این مقدار پیش فرض برای نوع داده بازگشت خود را برمی گرداند. شامل توابع کل است که می تواند داده های ورودی خالی را.
-OrDefault
می توان با سایر ترکیب کننده ها استفاده کرد.
نحو
<aggFunction>OrDefault(x)
پارامترها
x
— Aggregate function parameters.
مقادیر بازگشتی
بازگرداندن مقدار پیش فرض از نوع بازگشت یک تابع جمع است اگر چیزی برای جمع وجود دارد.
نوع بستگی به عملکرد کلی مورد استفاده دارد.
مثال
پرسوجو:
SELECT avg(number), avgOrDefault(number) FROM numbers(0)
نتیجه:
┌─avg(number)─┬─avgOrDefault(number)─┐
│ nan │ 0 │
└─────────────┴──────────────────────┘
همچنین -OrDefault
می توان با یک ترکیب کننده دیگر استفاده کرد. این زمانی مفید است که تابع جمع می کند ورودی خالی را قبول نمی کند.
پرسوجو:
SELECT avgOrDefaultIf(x, x > 10)
FROM
(
SELECT toDecimal32(1.23, 2) AS x
)
نتیجه:
┌─avgOrDefaultIf(x, greater(x, 10))─┐
│ 0.00 │
└───────────────────────────────────┘
اطلاعات دقیق
تغییر رفتار یک تابع جمع.
این ترکیب تبدیل یک نتیجه از یک تابع جمع به Nullable نوع داده. اگر تابع جمع می کند ارزش برای محاسبه بازده ندارد NULL.
-OrNull
می توان با سایر ترکیب کننده ها استفاده کرد.
نحو
<aggFunction>OrNull(x)
پارامترها
x
— Aggregate function parameters.
مقادیر بازگشتی
- نتیجه عملکرد کل, تبدیل به
Nullable
نوع داده. NULL
, اگر چیزی برای جمع وجود دارد.
نوع: Nullable(aggregate function return type)
.
مثال
افزودن -orNull
به پایان تابع جمع.
پرسوجو:
SELECT sumOrNull(number), toTypeName(sumOrNull(number)) FROM numbers(10) WHERE number > 10
نتیجه:
┌─sumOrNull(number)─┬─toTypeName(sumOrNull(number))─┐
│ ᴺᵁᴸᴸ │ Nullable(UInt64) │
└───────────────────┴───────────────────────────────┘
همچنین -OrNull
می توان با یک ترکیب کننده دیگر استفاده کرد. این زمانی مفید است که تابع جمع می کند ورودی خالی را قبول نمی کند.
پرسوجو:
SELECT avgOrNullIf(x, x > 10)
FROM
(
SELECT toDecimal32(1.23, 2) AS x
)
نتیجه:
┌─avgOrNullIf(x, greater(x, 10))─┐
│ ᴺᵁᴸᴸ │
└────────────────────────────────┘
- نمونه
به شما امکان می دهد داده ها را به گروه تقسیم کنید و سپس به طور جداگانه داده ها را در این گروه ها جمع کنید. گروه ها با تقسیم مقادیر از یک ستون به فواصل ایجاد شده است.
<aggFunction>Resample(start, end, step)(<aggFunction_params>, resampling_key)
پارامترها
start
— Starting value of the whole required interval forresampling_key
ارزشهای خبری عبارتند از:stop
— Ending value of the whole required interval forresampling_key
ارزشهای خبری عبارتند از: کل فاصله شامل نمی شودstop
مقدار[start, stop)
.step
— Step for separating the whole interval into subintervals. TheaggFunction
بیش از هر یک از این زیرگروه اعدام به طور مستقل.resampling_key
— Column whose values are used for separating data into intervals.aggFunction_params
—aggFunction
پارامترها
مقادیر بازگشتی
- مجموعه ای از
aggFunction
نتایج برای هر زیر خدمات.
مثال
در نظر بگیرید که people
جدول با داده های زیر:
┌─name───┬─age─┬─wage─┐
│ John │ 16 │ 10 │
│ Alice │ 30 │ 15 │
│ Mary │ 35 │ 8 │
│ Evelyn │ 48 │ 11.5 │
│ David │ 62 │ 9.9 │
│ Brian │ 60 │ 16 │
└────────┴─────┴──────┘
بیایید نام افرادی که سن نهفته در فواصل [30,60)
و [60,75)
. پس ما با استفاده از نمایندگی عدد صحیح برای سن, ما سنین در [30, 59]
و [60,74]
فواصل زمانی.
به نام کلی در مجموعه, ما با استفاده از گرامری تابع جمع. طول می کشد تا یک استدلال. در مورد ما این است name
ستون. این groupArrayResample
تابع باید از age
ستون به نام دانه های سن. برای تعریف فواصل مورد نیاز ما 30, 75, 30
نشانوندها به groupArrayResample
تابع.
SELECT groupArrayResample(30, 75, 30)(name, age) FROM people
┌─groupArrayResample(30, 75, 30)(name, age)─────┐
│ [['Alice','Mary','Evelyn'],['David','Brian']] │
└───────────────────────────────────────────────┘
نتایج را در نظر بگیرید.
Jonh
خارج از نمونه است چرا که او بیش از حد جوان است. افراد دیگر با توجه به فواصل زمانی مشخص شده توزیع می شوند.
حالا اجازه دهید تعداد کل مردم و متوسط دستمزد خود را در فواصل سنی مشخص شده است.
SELECT
countResample(30, 75, 30)(name, age) AS amount,
avgResample(30, 75, 30)(wage, age) AS avg_wage
FROM people
┌─amount─┬─avg_wage──────────────────┐
│ [3,2] │ [11.5,12.949999809265137] │
└────────┴───────────────────────────┘