ClickHouse/docs/zh/sql-reference/statements/select/limit-by.md

2.3 KiB
Raw Blame History

toc_title
LIMIT BY

LIMIT BY子句

与查询 LIMIT n BY expressions 子句选择第一个 n 每个不同值的行 expressions. LIMIT BY 可以包含任意数量的 表达式.

ClickHouse支持以下语法变体:

  • LIMIT [offset_value, ]n BY expressions
  • LIMIT n OFFSET offset_value BY expressions

在进行查询处理时ClickHouse选择按排序键排序的数据。排序键设置显式地使用一个ORDER BY条款或隐式属性表的引擎(行顺序只是保证在使用ORDER BY,否则不会命令行块由于多线程)。然后ClickHouse应用LIMIT n BY 表达式,并为每个不同的表达式组合返回前n行。如果指定了OFFSET,那么对于每个属于不同表达式组合的数据块ClickHouse将跳过offset_value从块开始的行数,并最终返回最多n行的结果。如果offset_value大于数据块中的行数则ClickHouse从数据块中返回零行。

!!! note "注" LIMIT BY 是不相关的 LIMIT. 它们都可以在同一个查询中使用。

样例表:

CREATE TABLE limit_by(id Int, val Int) ENGINE = Memory;
INSERT INTO limit_by VALUES (1, 10), (1, 11), (1, 12), (2, 20), (2, 21);

查询:

SELECT * FROM limit_by ORDER BY id, val LIMIT 2 BY id
┌─id─┬─val─┐
│  1 │  10 │
│  1 │  11 │
│  2 │  20 │
│  2 │  21 │
└────┴─────┘
SELECT * FROM limit_by ORDER BY id, val LIMIT 1, 2 BY id
┌─id─┬─val─┐
│  1 │  11 │
│  1 │  12 │
│  2 │  21 │
└────┴─────┘

SELECT * FROM limit_by ORDER BY id, val LIMIT 2 OFFSET 1 BY id 查询返回相同的结果。

以下查询返回每个引用的前5个引用 domain, device_type 最多可与100行配对 (LIMIT n BY + LIMIT).

SELECT
    domainWithoutWWW(URL) AS domain,
    domainWithoutWWW(REFERRER_URL) AS referrer,
    device_type,
    count() cnt
FROM hits
GROUP BY domain, referrer, device_type
ORDER BY cnt DESC
LIMIT 5 BY domain, device_type
LIMIT 100