ClickHouse/docs/ja/sql-reference/statements/select/intersect.md
2024-11-18 11:58:58 +09:00

5.1 KiB
Raw Blame History

slug sidebar_label
/ja/sql-reference/statements/select/intersect INTERSECT

INTERSECT句

INTERSECT句は、最初のクエリと2番目のクエリの両方の結果からのみ行が返されます。クエリはカラムの数、順序、型が一致している必要があります。INTERSECTの結果には重複する行を含むことがあります。

複数のINTERSECT文は、括弧が指定されていない場合、左から右に実行されます。INTERSECT演算子は、UNIONおよびEXCEPT句よりも優先順位が高いです。

SELECT column1 [, column2 ]
FROM table1
[WHERE condition]

INTERSECT

SELECT column1 [, column2 ]
FROM table2
[WHERE condition]

条件は、要求に基づく任意の式にすることができます。

以下は、1から10までの数字と3から8までの数字をインターセクトする簡単な例です

SELECT number FROM numbers(1,10) INTERSECT SELECT number FROM numbers(3,8);

結果:

┌─number─┐
│      3 │
│      4 │
│      5 │
│      6 │
│      7 │
│      8 │
└────────┘

INTERSECTは、共通のカラムを持つ2つのテーブルがある場合に便利です。その結果が同じカラムを含む限り、2つのクエリの結果をインターセクトすることができます。例えば、数百万行の暗号通貨取引価格と取引量の履歴データがあるとします

CREATE TABLE crypto_prices
(
    trade_date Date,
    crypto_name String,
    volume Float32,
    price Float32,
    market_cap Float32,
    change_1_day Float32
)
ENGINE = MergeTree
PRIMARY KEY (crypto_name, trade_date);

INSERT INTO crypto_prices
   SELECT *
   FROM s3(
    'https://learn-clickhouse.s3.us-east-2.amazonaws.com/crypto_prices.csv',
    'CSVWithNames'
);

SELECT * FROM crypto_prices
WHERE crypto_name = 'Bitcoin'
ORDER BY trade_date DESC
LIMIT 10;
┌─trade_date─┬─crypto_name─┬──────volume─┬────price─┬───market_cap─┬──change_1_day─┐
│ 2020-11-02 │ Bitcoin     │ 30771456000 │ 13550.49 │ 251119860000 │  -0.013585099 │
│ 2020-11-01 │ Bitcoin     │ 24453857000 │ 13737.11 │ 254569760000 │ -0.0031840964 │
│ 2020-10-31 │ Bitcoin     │ 30306464000 │ 13780.99 │ 255372070000 │   0.017308505 │
│ 2020-10-30 │ Bitcoin     │ 30581486000 │ 13546.52 │ 251018150000 │   0.008084608 │
│ 2020-10-29 │ Bitcoin     │ 56499500000 │ 13437.88 │ 248995320000 │   0.012552661 │
│ 2020-10-28 │ Bitcoin     │ 35867320000 │ 13271.29 │ 245899820000 │   -0.02804481 │
│ 2020-10-27 │ Bitcoin     │ 33749879000 │ 13654.22 │ 252985950000 │    0.04427984 │
│ 2020-10-26 │ Bitcoin     │ 29461459000 │ 13075.25 │ 242251000000 │  0.0033826586 │
│ 2020-10-25 │ Bitcoin     │ 24406921000 │ 13031.17 │ 241425220000 │ -0.0058658565 │
│ 2020-10-24 │ Bitcoin     │ 24542319000 │ 13108.06 │ 242839880000 │   0.013650347 │
└────────────┴─────────────┴─────────────┴──────────┴──────────────┴───────────────┘

次に、所有する暗号通貨のリストとコインの数量を含むholdingsというテーブルがあると仮定します:

CREATE TABLE holdings
(
    crypto_name String,
    quantity UInt64
)
ENGINE = MergeTree
PRIMARY KEY (crypto_name);

INSERT INTO holdings VALUES
   ('Bitcoin', 1000),
   ('Bitcoin', 200),
   ('Ethereum', 250),
   ('Ethereum', 5000),
   ('DOGEFI', 10);
   ('Bitcoin Diamond', 5000);

INTERSECTを使って、**"所有するコインの中で価格が100ドルを超えた取引があったものはどれか"**と言った質問に答えることができます:

SELECT crypto_name FROM holdings
INTERSECT
SELECT crypto_name FROM crypto_prices
WHERE price > 100

結果:

┌─crypto_name─┐
│ Bitcoin     │
│ Bitcoin     │
│ Ethereum    │
│ Ethereum    │
└─────────────┘

これは、ビットコインとイーサリアムが一時期に100ドルを超えて取引されたことを意味し、DOGEFIとBitcoin Diamondは100ドルを超える取引が発生したことがないことを示していますこの例のデータに基づく

INTERSECT DISTINCT

前のクエリでは、100ドル以上で取引されたビットコインとイーサリアムの所有量が複数回出現しています。重複した行を削除するには知っていることをただ繰り返しているだけなのでINTERSECTDISTINCTを追加できます:

SELECT crypto_name FROM holdings
INTERSECT DISTINCT
SELECT crypto_name FROM crypto_prices
WHERE price > 100;

結果:

┌─crypto_name─┐
│ Bitcoin     │
│ Ethereum    │
└─────────────┘

関連項目