mirror of
https://github.com/ClickHouse/ClickHouse.git
synced 2024-11-14 19:45:11 +00:00
451 lines
34 KiB
Plaintext
451 lines
34 KiB
Plaintext
---
|
||
slug: /zh/getting-started/example-datasets/uk-price-paid
|
||
sidebar_label: 英国房地产支付价格
|
||
sidebar_position: 1
|
||
title: "英国房地产支付价格"
|
||
---
|
||
|
||
该数据集包含自 1995 年以来有关英格兰和威尔士房地产价格的数据。未压缩的大小约为 4 GiB,在 ClickHouse 中大约需要 278 MiB。
|
||
|
||
来源:https://www.gov.uk/government/statistical-data-sets/price-paid-data-downloads
|
||
字段说明:https://www.gov.uk/guidance/about-the-price-data
|
||
|
||
包含 HM Land Registry data © Crown copyright and database right 2021.。此数据集需在 Open Government License v3.0 的许可下使用。
|
||
|
||
## 创建表 {#create-table}
|
||
|
||
```sql
|
||
CREATE TABLE uk_price_paid
|
||
(
|
||
price UInt32,
|
||
date Date,
|
||
postcode1 LowCardinality(String),
|
||
postcode2 LowCardinality(String),
|
||
type Enum8('terraced' = 1, 'semi-detached' = 2, 'detached' = 3, 'flat' = 4, 'other' = 0),
|
||
is_new UInt8,
|
||
duration Enum8('freehold' = 1, 'leasehold' = 2, 'unknown' = 0),
|
||
addr1 String,
|
||
addr2 String,
|
||
street LowCardinality(String),
|
||
locality LowCardinality(String),
|
||
town LowCardinality(String),
|
||
district LowCardinality(String),
|
||
county LowCardinality(String)
|
||
)
|
||
ENGINE = MergeTree
|
||
ORDER BY (postcode1, postcode2, addr1, addr2);
|
||
```
|
||
|
||
## 预处理和插入数据 {#preprocess-import-data}
|
||
|
||
我们将使用 `url` 函数将数据流式传输到 ClickHouse。我们需要首先预处理一些传入的数据,其中包括:
|
||
|
||
- 将`postcode` 拆分为两个不同的列 - `postcode1` 和 `postcode2`,因为这更适合存储和查询
|
||
- 将`time` 字段转换为日期因为它只包含 00:00 时间
|
||
- 忽略 [UUid](/docs/zh/sql-reference/data-types/uuid.md) 字段,因为我们不需要它进行分析
|
||
- 使用 [transform](/docs/zh/sql-reference/functions/other-functions.md#transform) 函数将 `Enum` 字段 `type` 和 `duration` 转换为更易读的 `Enum` 字段
|
||
- 将 `is_new` 字段从单字符串(` Y`/`N`) 到 [UInt8](/docs/zh/sql-reference/data-types/int-uint.md#uint8-uint16-uint32-uint64-uint256-int8-int16-int32-int64 -int128-int256) 字段为 0 或 1
|
||
- 删除最后两列,因为它们都具有相同的值(即 0)
|
||
|
||
`url` 函数将来自网络服务器的数据流式传输到 ClickHouse 表中。以下命令将 500 万行插入到 `uk_price_paid` 表中:
|
||
|
||
```sql
|
||
INSERT INTO uk_price_paid
|
||
WITH
|
||
splitByChar(' ', postcode) AS p
|
||
SELECT
|
||
toUInt32(price_string) AS price,
|
||
parseDateTimeBestEffortUS(time) AS date,
|
||
p[1] AS postcode1,
|
||
p[2] AS postcode2,
|
||
transform(a, ['T', 'S', 'D', 'F', 'O'], ['terraced', 'semi-detached', 'detached', 'flat', 'other']) AS type,
|
||
b = 'Y' AS is_new,
|
||
transform(c, ['F', 'L', 'U'], ['freehold', 'leasehold', 'unknown']) AS duration,
|
||
addr1,
|
||
addr2,
|
||
street,
|
||
locality,
|
||
town,
|
||
district,
|
||
county
|
||
FROM url(
|
||
'http://prod.publicdata.landregistry.gov.uk.s3-website-eu-west-1.amazonaws.com/pp-complete.csv',
|
||
'CSV',
|
||
'uuid_string String,
|
||
price_string String,
|
||
time String,
|
||
postcode String,
|
||
a String,
|
||
b String,
|
||
c String,
|
||
addr1 String,
|
||
addr2 String,
|
||
street String,
|
||
locality String,
|
||
town String,
|
||
district String,
|
||
county String,
|
||
d String,
|
||
e String'
|
||
) SETTINGS max_http_get_redirects=10;
|
||
```
|
||
|
||
需要等待一两分钟以便数据插入,具体时间取决于网络速度。
|
||
|
||
## 验证数据 {#validate-data}
|
||
|
||
让我们通过查看插入了多少行来验证它是否有效:
|
||
|
||
```sql
|
||
SELECT count()
|
||
FROM uk_price_paid
|
||
```
|
||
|
||
在执行此查询时,数据集有 27,450,499 行。让我们看看 ClickHouse 中表的大小是多少:
|
||
|
||
```sql
|
||
SELECT formatReadableSize(total_bytes)
|
||
FROM system.tables
|
||
WHERE name = 'uk_price_paid'
|
||
```
|
||
|
||
请注意,表的大小仅为 221.43 MiB!
|
||
|
||
## 运行一些查询 {#run-queries}
|
||
|
||
让我们运行一些查询来分析数据:
|
||
|
||
### 查询 1. 每年平均价格 {#average-price}
|
||
|
||
```sql
|
||
SELECT
|
||
toYear(date) AS year,
|
||
round(avg(price)) AS price,
|
||
bar(price, 0, 1000000, 80
|
||
)
|
||
FROM uk_price_paid
|
||
GROUP BY year
|
||
ORDER BY year
|
||
```
|
||
|
||
结果如下所示:
|
||
|
||
```response
|
||
┌─year─┬──price─┬─bar(round(avg(price)), 0, 1000000, 80)─┐
|
||
│ 1995 │ 67934 │ █████▍ │
|
||
│ 1996 │ 71508 │ █████▋ │
|
||
│ 1997 │ 78536 │ ██████▎ │
|
||
│ 1998 │ 85441 │ ██████▋ │
|
||
│ 1999 │ 96038 │ ███████▋ │
|
||
│ 2000 │ 107487 │ ████████▌ │
|
||
│ 2001 │ 118888 │ █████████▌ │
|
||
│ 2002 │ 137948 │ ███████████ │
|
||
│ 2003 │ 155893 │ ████████████▍ │
|
||
│ 2004 │ 178888 │ ██████████████▎ │
|
||
│ 2005 │ 189359 │ ███████████████▏ │
|
||
│ 2006 │ 203532 │ ████████████████▎ │
|
||
│ 2007 │ 219375 │ █████████████████▌ │
|
||
│ 2008 │ 217056 │ █████████████████▎ │
|
||
│ 2009 │ 213419 │ █████████████████ │
|
||
│ 2010 │ 236110 │ ██████████████████▊ │
|
||
│ 2011 │ 232805 │ ██████████████████▌ │
|
||
│ 2012 │ 238381 │ ███████████████████ │
|
||
│ 2013 │ 256927 │ ████████████████████▌ │
|
||
│ 2014 │ 280008 │ ██████████████████████▍ │
|
||
│ 2015 │ 297263 │ ███████████████████████▋ │
|
||
│ 2016 │ 313518 │ █████████████████████████ │
|
||
│ 2017 │ 346371 │ ███████████████████████████▋ │
|
||
│ 2018 │ 350556 │ ████████████████████████████ │
|
||
│ 2019 │ 352184 │ ████████████████████████████▏ │
|
||
│ 2020 │ 375808 │ ██████████████████████████████ │
|
||
│ 2021 │ 381105 │ ██████████████████████████████▍ │
|
||
│ 2022 │ 362572 │ █████████████████████████████ │
|
||
└──────┴────────┴────────────────────────────────────────┘
|
||
```
|
||
|
||
### 查询 2. 伦敦每年的平均价格 {#average-price-london}
|
||
|
||
```sql
|
||
SELECT
|
||
toYear(date) AS year,
|
||
round(avg(price)) AS price,
|
||
bar(price, 0, 2000000, 100
|
||
)
|
||
FROM uk_price_paid
|
||
WHERE town = 'LONDON'
|
||
GROUP BY year
|
||
ORDER BY year
|
||
```
|
||
|
||
结果如下所示:
|
||
|
||
```response
|
||
┌─year─┬───price─┬─bar(round(avg(price)), 0, 2000000, 100)───────────────┐
|
||
│ 1995 │ 109110 │ █████▍ │
|
||
│ 1996 │ 118659 │ █████▊ │
|
||
│ 1997 │ 136526 │ ██████▋ │
|
||
│ 1998 │ 153002 │ ███████▋ │
|
||
│ 1999 │ 180633 │ █████████ │
|
||
│ 2000 │ 215849 │ ██████████▋ │
|
||
│ 2001 │ 232987 │ ███████████▋ │
|
||
│ 2002 │ 263668 │ █████████████▏ │
|
||
│ 2003 │ 278424 │ █████████████▊ │
|
||
│ 2004 │ 304664 │ ███████████████▏ │
|
||
│ 2005 │ 322887 │ ████████████████▏ │
|
||
│ 2006 │ 356195 │ █████████████████▋ │
|
||
│ 2007 │ 404062 │ ████████████████████▏ │
|
||
│ 2008 │ 420741 │ █████████████████████ │
|
||
│ 2009 │ 427754 │ █████████████████████▍ │
|
||
│ 2010 │ 480322 │ ████████████████████████ │
|
||
│ 2011 │ 496278 │ ████████████████████████▋ │
|
||
│ 2012 │ 519482 │ █████████████████████████▊ │
|
||
│ 2013 │ 616195 │ ██████████████████████████████▋ │
|
||
│ 2014 │ 724121 │ ████████████████████████████████████▏ │
|
||
│ 2015 │ 792101 │ ███████████████████████████████████████▌ │
|
||
│ 2016 │ 843589 │ ██████████████████████████████████████████▏ │
|
||
│ 2017 │ 983523 │ █████████████████████████████████████████████████▏ │
|
||
│ 2018 │ 1016753 │ ██████████████████████████████████████████████████▋ │
|
||
│ 2019 │ 1041673 │ ████████████████████████████████████████████████████ │
|
||
│ 2020 │ 1060027 │ █████████████████████████████████████████████████████ │
|
||
│ 2021 │ 958249 │ ███████████████████████████████████████████████▊ │
|
||
│ 2022 │ 902596 │ █████████████████████████████████████████████▏ │
|
||
└──────┴─────────┴───────────────────────────────────────────────────────┘
|
||
```
|
||
|
||
2020 年房价出事了!但这并不令人意外...
|
||
|
||
### 查询 3. 最昂贵的社区 {#most-expensive-neighborhoods}
|
||
|
||
```sql
|
||
SELECT
|
||
town,
|
||
district,
|
||
count() AS c,
|
||
round(avg(price)) AS price,
|
||
bar(price, 0, 5000000, 100)
|
||
FROM uk_price_paid
|
||
WHERE date >= '2020-01-01'
|
||
GROUP BY
|
||
town,
|
||
district
|
||
HAVING c >= 100
|
||
ORDER BY price DESC
|
||
LIMIT 100
|
||
```
|
||
|
||
结果如下所示:
|
||
|
||
```response
|
||
┌─town─────────────────┬─district───────────────┬─────c─┬───price─┬─bar(round(avg(price)), 0, 5000000, 100)─────────────────────────┐
|
||
│ LONDON │ CITY OF LONDON │ 578 │ 3149590 │ ██████████████████████████████████████████████████████████████▊ │
|
||
│ LONDON │ CITY OF WESTMINSTER │ 7083 │ 2903794 │ ██████████████████████████████████████████████████████████ │
|
||
│ LONDON │ KENSINGTON AND CHELSEA │ 4986 │ 2333782 │ ██████████████████████████████████████████████▋ │
|
||
│ LEATHERHEAD │ ELMBRIDGE │ 203 │ 2071595 │ █████████████████████████████████████████▍ │
|
||
│ VIRGINIA WATER │ RUNNYMEDE │ 308 │ 1939465 │ ██████████████████████████████████████▋ │
|
||
│ LONDON │ CAMDEN │ 5750 │ 1673687 │ █████████████████████████████████▍ │
|
||
│ WINDLESHAM │ SURREY HEATH │ 182 │ 1428358 │ ████████████████████████████▌ │
|
||
│ NORTHWOOD │ THREE RIVERS │ 112 │ 1404170 │ ████████████████████████████ │
|
||
│ BARNET │ ENFIELD │ 259 │ 1338299 │ ██████████████████████████▋ │
|
||
│ LONDON │ ISLINGTON │ 5504 │ 1275520 │ █████████████████████████▌ │
|
||
│ LONDON │ RICHMOND UPON THAMES │ 1345 │ 1261935 │ █████████████████████████▏ │
|
||
│ COBHAM │ ELMBRIDGE │ 727 │ 1251403 │ █████████████████████████ │
|
||
│ BEACONSFIELD │ BUCKINGHAMSHIRE │ 680 │ 1199970 │ ███████████████████████▊ │
|
||
│ LONDON │ TOWER HAMLETS │ 10012 │ 1157827 │ ███████████████████████▏ │
|
||
│ LONDON │ HOUNSLOW │ 1278 │ 1144389 │ ██████████████████████▊ │
|
||
│ BURFORD │ WEST OXFORDSHIRE │ 182 │ 1139393 │ ██████████████████████▋ │
|
||
│ RICHMOND │ RICHMOND UPON THAMES │ 1649 │ 1130076 │ ██████████████████████▌ │
|
||
│ KINGSTON UPON THAMES │ RICHMOND UPON THAMES │ 147 │ 1126111 │ ██████████████████████▌ │
|
||
│ ASCOT │ WINDSOR AND MAIDENHEAD │ 773 │ 1106109 │ ██████████████████████ │
|
||
│ LONDON │ HAMMERSMITH AND FULHAM │ 6162 │ 1056198 │ █████████████████████ │
|
||
│ RADLETT │ HERTSMERE │ 513 │ 1045758 │ ████████████████████▊ │
|
||
│ LEATHERHEAD │ GUILDFORD │ 354 │ 1045175 │ ████████████████████▊ │
|
||
│ WEYBRIDGE │ ELMBRIDGE │ 1275 │ 1036702 │ ████████████████████▋ │
|
||
│ FARNHAM │ EAST HAMPSHIRE │ 107 │ 1033682 │ ████████████████████▋ │
|
||
│ ESHER │ ELMBRIDGE │ 915 │ 1032753 │ ████████████████████▋ │
|
||
│ FARNHAM │ HART │ 102 │ 1002692 │ ████████████████████ │
|
||
│ GERRARDS CROSS │ BUCKINGHAMSHIRE │ 845 │ 983639 │ ███████████████████▋ │
|
||
│ CHALFONT ST GILES │ BUCKINGHAMSHIRE │ 286 │ 973993 │ ███████████████████▍ │
|
||
│ SALCOMBE │ SOUTH HAMS │ 215 │ 965724 │ ███████████████████▎ │
|
||
│ SURBITON │ ELMBRIDGE │ 181 │ 960346 │ ███████████████████▏ │
|
||
│ BROCKENHURST │ NEW FOREST │ 226 │ 951278 │ ███████████████████ │
|
||
│ SUTTON COLDFIELD │ LICHFIELD │ 110 │ 930757 │ ██████████████████▌ │
|
||
│ EAST MOLESEY │ ELMBRIDGE │ 372 │ 927026 │ ██████████████████▌ │
|
||
│ LLANGOLLEN │ WREXHAM │ 127 │ 925681 │ ██████████████████▌ │
|
||
│ OXFORD │ SOUTH OXFORDSHIRE │ 638 │ 923830 │ ██████████████████▍ │
|
||
│ LONDON │ MERTON │ 4383 │ 923194 │ ██████████████████▍ │
|
||
│ GUILDFORD │ WAVERLEY │ 261 │ 905733 │ ██████████████████ │
|
||
│ TEDDINGTON │ RICHMOND UPON THAMES │ 1147 │ 894856 │ █████████████████▊ │
|
||
│ HARPENDEN │ ST ALBANS │ 1271 │ 893079 │ █████████████████▋ │
|
||
│ HENLEY-ON-THAMES │ SOUTH OXFORDSHIRE │ 1042 │ 887557 │ █████████████████▋ │
|
||
│ POTTERS BAR │ WELWYN HATFIELD │ 314 │ 863037 │ █████████████████▎ │
|
||
│ LONDON │ WANDSWORTH │ 13210 │ 857318 │ █████████████████▏ │
|
||
│ BILLINGSHURST │ CHICHESTER │ 255 │ 856508 │ █████████████████▏ │
|
||
│ LONDON │ SOUTHWARK │ 7742 │ 843145 │ ████████████████▋ │
|
||
│ LONDON │ HACKNEY │ 6656 │ 839716 │ ████████████████▋ │
|
||
│ LUTTERWORTH │ HARBOROUGH │ 1096 │ 836546 │ ████████████████▋ │
|
||
│ KINGSTON UPON THAMES │ KINGSTON UPON THAMES │ 1846 │ 828990 │ ████████████████▌ │
|
||
│ LONDON │ EALING │ 5583 │ 820135 │ ████████████████▍ │
|
||
│ INGATESTONE │ CHELMSFORD │ 120 │ 815379 │ ████████████████▎ │
|
||
│ MARLOW │ BUCKINGHAMSHIRE │ 718 │ 809943 │ ████████████████▏ │
|
||
│ EAST GRINSTEAD │ TANDRIDGE │ 105 │ 809461 │ ████████████████▏ │
|
||
│ CHIGWELL │ EPPING FOREST │ 484 │ 809338 │ ████████████████▏ │
|
||
│ EGHAM │ RUNNYMEDE │ 989 │ 807858 │ ████████████████▏ │
|
||
│ HASLEMERE │ CHICHESTER │ 223 │ 804173 │ ████████████████ │
|
||
│ PETWORTH │ CHICHESTER │ 288 │ 803206 │ ████████████████ │
|
||
│ TWICKENHAM │ RICHMOND UPON THAMES │ 2194 │ 802616 │ ████████████████ │
|
||
│ WEMBLEY │ BRENT │ 1698 │ 801733 │ ████████████████ │
|
||
│ HINDHEAD │ WAVERLEY │ 233 │ 801482 │ ████████████████ │
|
||
│ LONDON │ BARNET │ 8083 │ 792066 │ ███████████████▋ │
|
||
│ WOKING │ GUILDFORD │ 343 │ 789360 │ ███████████████▋ │
|
||
│ STOCKBRIDGE │ TEST VALLEY │ 318 │ 777909 │ ███████████████▌ │
|
||
│ BERKHAMSTED │ DACORUM │ 1049 │ 776138 │ ███████████████▌ │
|
||
│ MAIDENHEAD │ BUCKINGHAMSHIRE │ 236 │ 775572 │ ███████████████▌ │
|
||
│ SOLIHULL │ STRATFORD-ON-AVON │ 142 │ 770727 │ ███████████████▍ │
|
||
│ GREAT MISSENDEN │ BUCKINGHAMSHIRE │ 431 │ 764493 │ ███████████████▎ │
|
||
│ TADWORTH │ REIGATE AND BANSTEAD │ 920 │ 757511 │ ███████████████▏ │
|
||
│ LONDON │ BRENT │ 4124 │ 757194 │ ███████████████▏ │
|
||
│ THAMES DITTON │ ELMBRIDGE │ 470 │ 750828 │ ███████████████ │
|
||
│ LONDON │ LAMBETH │ 10431 │ 750532 │ ███████████████ │
|
||
│ RICKMANSWORTH │ THREE RIVERS │ 1500 │ 747029 │ ██████████████▊ │
|
||
│ KINGS LANGLEY │ DACORUM │ 281 │ 746536 │ ██████████████▊ │
|
||
│ HARLOW │ EPPING FOREST │ 172 │ 739423 │ ██████████████▋ │
|
||
│ TONBRIDGE │ SEVENOAKS │ 103 │ 738740 │ ██████████████▋ │
|
||
│ BELVEDERE │ BEXLEY │ 686 │ 736385 │ ██████████████▋ │
|
||
│ CRANBROOK │ TUNBRIDGE WELLS │ 769 │ 734328 │ ██████████████▋ │
|
||
│ SOLIHULL │ WARWICK │ 116 │ 733286 │ ██████████████▋ │
|
||
│ ALDERLEY EDGE │ CHESHIRE EAST │ 357 │ 732882 │ ██████████████▋ │
|
||
│ WELWYN │ WELWYN HATFIELD │ 404 │ 730281 │ ██████████████▌ │
|
||
│ CHISLEHURST │ BROMLEY │ 870 │ 730279 │ ██████████████▌ │
|
||
│ LONDON │ HARINGEY │ 6488 │ 726715 │ ██████████████▌ │
|
||
│ AMERSHAM │ BUCKINGHAMSHIRE │ 965 │ 725426 │ ██████████████▌ │
|
||
│ SEVENOAKS │ SEVENOAKS │ 2183 │ 725102 │ ██████████████▌ │
|
||
│ BOURNE END │ BUCKINGHAMSHIRE │ 269 │ 724595 │ ██████████████▍ │
|
||
│ NORTHWOOD │ HILLINGDON │ 568 │ 722436 │ ██████████████▍ │
|
||
│ PURFLEET │ THURROCK │ 143 │ 722205 │ ██████████████▍ │
|
||
│ SLOUGH │ BUCKINGHAMSHIRE │ 832 │ 721529 │ ██████████████▍ │
|
||
│ INGATESTONE │ BRENTWOOD │ 301 │ 718292 │ ██████████████▎ │
|
||
│ EPSOM │ REIGATE AND BANSTEAD │ 315 │ 709264 │ ██████████████▏ │
|
||
│ ASHTEAD │ MOLE VALLEY │ 524 │ 708646 │ ██████████████▏ │
|
||
│ BETCHWORTH │ MOLE VALLEY │ 155 │ 708525 │ ██████████████▏ │
|
||
│ OXTED │ TANDRIDGE │ 645 │ 706946 │ ██████████████▏ │
|
||
│ READING │ SOUTH OXFORDSHIRE │ 593 │ 705466 │ ██████████████ │
|
||
│ FELTHAM │ HOUNSLOW │ 1536 │ 703815 │ ██████████████ │
|
||
│ TUNBRIDGE WELLS │ WEALDEN │ 207 │ 703296 │ ██████████████ │
|
||
│ LEWES │ WEALDEN │ 116 │ 701349 │ ██████████████ │
|
||
│ OXFORD │ OXFORD │ 3656 │ 700813 │ ██████████████ │
|
||
│ MAYFIELD │ WEALDEN │ 177 │ 698158 │ █████████████▊ │
|
||
│ PINNER │ HARROW │ 997 │ 697876 │ █████████████▊ │
|
||
│ LECHLADE │ COTSWOLD │ 155 │ 696262 │ █████████████▊ │
|
||
│ WALTON-ON-THAMES │ ELMBRIDGE │ 1850 │ 690102 │ █████████████▋ │
|
||
└──────────────────────┴────────────────────────┴───────┴─────────┴─────────────────────────────────────────────────────────────────┘
|
||
```
|
||
|
||
## 使用 Projection 加速查询 {#speedup-with-projections}
|
||
|
||
[Projections](/docs/zh/sql-reference/statements/alter/projection.mdx) 允许我们通过存储任意格式的预先聚合的数据来提高查询速度。在此示例中,我们创建了一个按年份、地区和城镇分组的房产的平均价格、总价格和数量的 Projection。在执行时,如果 ClickHouse 认为 Projection 可以提高查询的性能,它将使用 Projection(何时使用由 ClickHouse 决定)。
|
||
|
||
### 构建投影{#build-projection}
|
||
|
||
让我们通过维度 `toYear(date)`、`district` 和 `town` 创建一个聚合 Projection:
|
||
|
||
```sql
|
||
ALTER TABLE uk_price_paid
|
||
ADD PROJECTION projection_by_year_district_town
|
||
(
|
||
SELECT
|
||
toYear(date),
|
||
district,
|
||
town,
|
||
avg(price),
|
||
sum(price),
|
||
count()
|
||
GROUP BY
|
||
toYear(date),
|
||
district,
|
||
town
|
||
)
|
||
```
|
||
|
||
填充现有数据的 Projection。 (如果不进行 materialize 操作,则 ClickHouse 只会为新插入的数据创建 Projection):
|
||
|
||
```sql
|
||
ALTER TABLE uk_price_paid
|
||
MATERIALIZE PROJECTION projection_by_year_district_town
|
||
SETTINGS mutations_sync = 1
|
||
```
|
||
|
||
## Test Performance {#test-performance}
|
||
|
||
让我们再次运行相同的 3 个查询:
|
||
|
||
### 查询 1. 每年平均价格 {#average-price-projections}
|
||
|
||
```sql
|
||
SELECT
|
||
toYear(date) AS year,
|
||
round(avg(price)) AS price,
|
||
bar(price, 0, 1000000, 80)
|
||
FROM uk_price_paid
|
||
GROUP BY year
|
||
ORDER BY year ASC
|
||
```
|
||
|
||
结果是一样的,但是性能更好!
|
||
```response
|
||
No projection: 28 rows in set. Elapsed: 1.775 sec. Processed 27.45 million rows, 164.70 MB (15.47 million rows/s., 92.79 MB/s.)
|
||
With projection: 28 rows in set. Elapsed: 0.665 sec. Processed 87.51 thousand rows, 3.21 MB (131.51 thousand rows/s., 4.82 MB/s.)
|
||
```
|
||
|
||
|
||
### 查询 2. 伦敦每年的平均价格 {#average-price-london-projections}
|
||
|
||
```sql
|
||
SELECT
|
||
toYear(date) AS year,
|
||
round(avg(price)) AS price,
|
||
bar(price, 0, 2000000, 100)
|
||
FROM uk_price_paid
|
||
WHERE town = 'LONDON'
|
||
GROUP BY year
|
||
ORDER BY year ASC
|
||
```
|
||
|
||
Same result, but notice the improvement in query performance:
|
||
|
||
```response
|
||
No projection: 28 rows in set. Elapsed: 0.720 sec. Processed 27.45 million rows, 46.61 MB (38.13 million rows/s., 64.74 MB/s.)
|
||
With projection: 28 rows in set. Elapsed: 0.015 sec. Processed 87.51 thousand rows, 3.51 MB (5.74 million rows/s., 230.24 MB/s.)
|
||
```
|
||
|
||
### 查询 3. 最昂贵的社区 {#most-expensive-neighborhoods-projections}
|
||
|
||
注意:需要修改 (date >= '2020-01-01') 以使其与 Projection 定义的维度 (`toYear(date) >= 2020)` 匹配:
|
||
|
||
```sql
|
||
SELECT
|
||
town,
|
||
district,
|
||
count() AS c,
|
||
round(avg(price)) AS price,
|
||
bar(price, 0, 5000000, 100)
|
||
FROM uk_price_paid
|
||
WHERE toYear(date) >= 2020
|
||
GROUP BY
|
||
town,
|
||
district
|
||
HAVING c >= 100
|
||
ORDER BY price DESC
|
||
LIMIT 100
|
||
```
|
||
|
||
同样,结果是相同的,但请注意查询性能的改进:
|
||
|
||
```response
|
||
No projection: 100 rows in set. Elapsed: 0.928 sec. Processed 27.45 million rows, 103.80 MB (29.56 million rows/s., 111.80 MB/s.)
|
||
With projection: 100 rows in set. Elapsed: 0.336 sec. Processed 17.32 thousand rows, 1.23 MB (51.61 thousand rows/s., 3.65 MB/s.)
|
||
```
|
||
|
||
### 在 Playground 上测试{#playground}
|
||
|
||
也可以在 [Online Playground](https://play.clickhouse.com/play?user=play#U0VMRUNUIHRvd24sIGRpc3RyaWN0LCBjb3VudCgpIEFTIGMsIHJvdW5kKGF2ZyhwcmljZSkpIEFTIHByaWNlLCBiYXIocHJpY2UsIDAsIDUwMDAwMDAsIDEwMCkgRlJPTSB1a19wcmljZV9wYWlkIFdIRVJFIGRhdGUgPj0gJzIwMjAtMDEtMDEnIEdST1VQIEJZIHRvd24sIGRpc3RyaWN0IEhBVklORyBjID49IDEwMCBPUkRFUiBCWSBwcmljZSBERVNDIExJTUlUIDEwMA==) 上找到此数据集。
|