ClickHouse/docs/tr/sql-reference/table-functions/hdfs.md
2020-10-13 20:23:29 +03:00

3.4 KiB
Raw Blame History

machine_translated machine_translated_rev toc_priority toc_title
true 72537a2d52 45 hdf'ler

hdf'ler

Hdfs'deki dosyalardan bir tablo oluşturur. Bu tablo işlevi benzer url ve Dosya biri.

hdfs(URI, format, structure)

Giriş parametreleri

  • URI — The relative URI to the file in HDFS. Path to file support following globs in readonly mode: *, ?, {abc,def} ve {N..M} nerede N, M — numbers, `'abc', 'def' — strings.
  • format — The biçimli dosya.
  • structure — Structure of the table. Format 'column1_name column1_type, column2_name column2_type, ...'.

Döndürülen değer

Belirtilen dosyada veri okumak veya yazmak için belirtilen yapıya sahip bir tablo.

Örnek

Tablo fromdan hdfs://hdfs1:9000/test ve ondan ilk iki satır seçimi:

SELECT *
FROM hdfs('hdfs://hdfs1:9000/test', 'TSV', 'column1 UInt32, column2 UInt32, column3 UInt32')
LIMIT 2
┌─column1─┬─column2─┬─column3─┐
│       1 │       2 │       3 │
│       3 │       2 │       1 │
└─────────┴─────────┴─────────┘

Yolda Globs

Birden çok yol bileşenleri globs olabilir. İşlenmek için dosya var olmalı ve tüm yol deseniyle eşleşmelidir (sadece sonek veya önek değil).

  • * — Substitutes any number of any characters except / boş dize dahil.
  • ? — Substitutes any single character.
  • {some_string,another_string,yet_another_one} — Substitutes any of strings 'some_string', 'another_string', 'yet_another_one'.
  • {N..M} — Substitutes any number in range from N to M including both borders.

İle yapılar {} benzer olan uzaktan masa fonksiyonu).

Örnek

  1. HDFS'DE aşağıdaki Urı'lere sahip birkaç dosyamız olduğunu varsayalım:
  • hdfs://hdfs1:9000/some_dir/some_file_1
  • hdfs://hdfs1:9000/some_dir/some_file_2
  • hdfs://hdfs1:9000/some_dir/some_file_3
  • hdfs://hdfs1:9000/another_dir/some_file_1
  • hdfs://hdfs1:9000/another_dir/some_file_2
  • hdfs://hdfs1:9000/another_dir/some_file_3
  1. Bu dosyalardaki satır miktarını sorgula:
SELECT count(*)
FROM hdfs('hdfs://hdfs1:9000/{some,another}_dir/some_file_{1..3}', 'TSV', 'name String, value UInt32')
  1. Bu iki dizinin tüm dosyalarındaki satır miktarını sorgula:
SELECT count(*)
FROM hdfs('hdfs://hdfs1:9000/{some,another}_dir/*', 'TSV', 'name String, value UInt32')

!!! warning "Uyarıcı" Dosya listenizde önde gelen sıfırlar içeren sayı aralıkları varsa, her basamak için parantez içeren yapıyı ayrı ayrı kullanın veya kullanın ?.

Örnek

Adlı dosy thealardan verileri sorgu thelamak file000, file001, … , file999:

SELECT count(*)
FROM hdfs('hdfs://hdfs1:9000/big_dir/file{0..9}{0..9}{0..9}', 'CSV', 'name String, value UInt32')

Sanal Sütunlar

  • _path — Path to the file.
  • _file — Name of the file.

Ayrıca Bakınız

Orijinal makale