mirror of
https://github.com/ClickHouse/ClickHouse.git
synced 2024-12-19 12:52:37 +00:00
4.1 KiB
4.1 KiB
slug | sidebar_position | sidebar_label |
---|---|---|
/ja/sql-reference/table-functions/fileCluster | 61 | fileCluster |
fileCluster テーブル関数
クラスター内の複数のノードで、指定されたパスに一致するファイルを同時に処理できるようにします。イニシエーターはワーカーノードへの接続を確立し、ファイルパスのグロブを展開し、ファイル読み取りタスクをワーカーノードに委任します。各ワーカーノードは、次に処理するファイルをイニシエーターにクエリして要求し、すべてのタスクが完了するまで(すべてのファイルが読み取られるまで)このプロセスを繰り返します。
:::note
この関数が_正しく_動作するのは、最初に指定されたパスに一致するファイルのセットがすべてのノードで同一であり、異なるノード間でも内容が一致している場合に限ります。
これらのファイルがノード間で異なる場合、ワーカーノードがイニシエーターからタスクを要求する順序に依存するため、返される値は予測できません。
:::
構文
fileCluster(cluster_name, path[, format, structure, compression_method])
引数
cluster_name
— リモートおよびローカルサーバーへのアドレスと接続パラメータのセットを構築するために使用されるクラスターの名前。path
— user_files_path からファイルへの相対パス。ファイルへのパスはグロブをサポートしています。format
— ファイルのフォーマット。タイプ: String。structure
—'UserID UInt64, Name String'
形式のテーブル構造。カラム名とタイプを決定します。タイプ: String。compression_method
— 圧縮方式。サポートされる圧縮タイプはgz
、br
、xz
、zst
、lz4
、bz2
です。
返される値
指定されたフォーマットと構造を持ち、指定されたパスに一致するファイルからデータを持つテーブル。
例
my_cluster
という名前のクラスターと、以下の設定値 user_files_path
が与えられている場合:
$ grep user_files_path /etc/clickhouse-server/config.xml
<user_files_path>/var/lib/clickhouse/user_files/</user_files_path>
また、各クラスターノードの user_files_path
内に test1.csv
と test2.csv
があり、その内容が異なるノード間で同一である場合:
$ cat /var/lib/clickhouse/user_files/test1.csv
1,"file1"
11,"file11"
$ cat /var/lib/clickhouse/user_files/test2.csv
2,"file2"
22,"file22"
例えば、これらのファイルを各クラスターノードで次の2つのクエリを実行することで作成できます:
INSERT INTO TABLE FUNCTION file('file1.csv', 'CSV', 'i UInt32, s String') VALUES (1,'file1'), (11,'file11');
INSERT INTO TABLE FUNCTION file('file2.csv', 'CSV', 'i UInt32, s String') VALUES (2,'file2'), (22,'file22');
次に、fileCluster
テーブル関数を通じて test1.csv
と test2.csv
のデータ内容を読み取ります:
SELECT * FROM fileCluster('my_cluster', 'file{1,2}.csv', 'CSV', 'i UInt32, s String') ORDER BY i, s
┌──i─┬─s──────┐
│ 1 │ file1 │
│ 11 │ file11 │
└────┴────────┘
┌──i─┬─s──────┐
│ 2 │ file2 │
│ 22 │ file22 │
└────┴────────┘
パスにおけるグロブ
File テーブル関数でサポートされているすべてのパターンが、FileClusterでもサポートされています。
関連項目