mirror of
https://github.com/ClickHouse/ClickHouse.git
synced 2024-11-20 14:42:02 +00:00
59 lines
2.2 KiB
Markdown
59 lines
2.2 KiB
Markdown
# ReplacingMergeTree
|
|
|
|
该引擎和[MergeTree](mergetree.md)的不同之处在于它会删除具有相同主键的重复项。
|
|
|
|
数据的去重只会在合并的过程中出现。合并会在未知的时间在后台进行,因此你无法预先作出计划。有一些数据可能仍未被处理。尽管你可以调用 `OPTIMIZE` 语句发起计划外的合并,但请不要指望使用它,因为 `OPTIMIZE` 语句会引发对大量数据的读和写。
|
|
|
|
因此,`ReplacingMergeTree` 适用于在后台清除重复的数据以节省空间,但是它不保证没有重复的数据出现。
|
|
|
|
## 建表
|
|
|
|
```sql
|
|
CREATE TABLE [IF NOT EXISTS] [db.]table_name [ON CLUSTER cluster]
|
|
(
|
|
name1 [type1] [DEFAULT|MATERIALIZED|ALIAS expr1],
|
|
name2 [type2] [DEFAULT|MATERIALIZED|ALIAS expr2],
|
|
...
|
|
) ENGINE = ReplacingMergeTree([ver])
|
|
[PARTITION BY expr]
|
|
[ORDER BY expr]
|
|
[SAMPLE BY expr]
|
|
[SETTINGS name=value, ...]
|
|
```
|
|
|
|
请求参数的描述,参考[请求参数](../../query_language/create.md)。
|
|
|
|
**ReplacingMergeTree Parameters**
|
|
|
|
- `ver` — 版本列。类型为 `UInt*`, `Date` 或 `DateTime`。可选参数。
|
|
|
|
合并的时候,`ReplacingMergeTree` 从所有具有相同主键的行中选择一行留下:
|
|
- 如果 `ver` 列未指定,选择最后一条。
|
|
- 如果 `ver` 列已指定,选择 `ver` 值最大的版本。
|
|
|
|
**子句**
|
|
|
|
创建 `ReplacingMergeTree` 表时,需要与创建 `MergeTree` 表时相同的[子句](mergetree.md)。
|
|
|
|
<details markdown="1"><summary>已弃用的建表方法</summary>
|
|
|
|
!!! attention "注意"
|
|
不要在新项目中使用该方法,可能的话,请将旧项目切换到上述方法。
|
|
|
|
```sql
|
|
CREATE TABLE [IF NOT EXISTS] [db.]table_name [ON CLUSTER cluster]
|
|
(
|
|
name1 [type1] [DEFAULT|MATERIALIZED|ALIAS expr1],
|
|
name2 [type2] [DEFAULT|MATERIALIZED|ALIAS expr2],
|
|
...
|
|
) ENGINE [=] ReplacingMergeTree(date-column [, sampling_expression], (primary, key), index_granularity, [ver])
|
|
```
|
|
|
|
除了 `ver` 的所有参数都与 `MergeTree` 中的含义相同。
|
|
|
|
|
|
- `ver` - 版本列。可选参数,有关说明,请参阅上文。
|
|
</details>
|
|
|
|
[来源文章](https://clickhouse.yandex/docs/en/operations/table_engines/replacingmergetree/) <!--hide-->
|