ClickHouse/docs/ru/sql-reference/table-functions/s3.md

---
slug: /ru/sql-reference/table-functions/s3
sidebar_position: 45
sidebar_label: s3
---

# Табличная Функция S3 {#s3-table-function}

Предоставляет табличный интерфейс для выбора/вставки файлов в [Amazon S3](https://aws.amazon.com/s3/). Эта табличная функция похожа на [hdfs](../../sql-reference/table-functions/hdfs.md), но обеспечивает специфические для S3 возможности.

**Синтаксис**

``` sql
s3(path [,access_key_id, secret_access_key [,session_token]] [,format] [,structure] [,compression])
```

**Aргументы**

-   `path` — URL-адрес бакета с указанием пути к файлу. Поддерживает следующие подстановочные знаки в режиме "только чтение": `*, ?, {abc,def} и {N..M}` где `N, M` — числа, `'abc', 'def'` — строки. Подробнее смотри [здесь](../../engines/table-engines/integrations/s3.md#wildcards-in-path).
-   `format` — [формат](../../interfaces/formats.md#formats) файла.
-   `structure` — cтруктура таблицы. Формат `'column1_name column1_type, column2_name column2_type, ...'`.
-   `compression` — автоматически обнаруживает сжатие по расширению файла. Возможные значения: `none`, `gzip/gz`, `brotli/br`, `xz/LZMA`, `zstd/zst`. Необязательный параметр.

**Возвращаемые значения**

Таблица с указанной структурой для чтения или записи данных в указанный файл.

**Примеры**

Создание таблицы из файла S3 `https://storage.yandexcloud.net/my-test-bucket-768/data.csv` и выбор первых трех столбцов из нее:

Запрос:

``` sql
SELECT *
FROM s3('https://storage.yandexcloud.net/my-test-bucket-768/data.csv', 'CSV', 'column1 UInt32, column2 UInt32, column3 UInt32')
LIMIT 2;
```

Результат:

``` text
┌─column1─┬─column2─┬─column3─┐
│       1 │       2 │       3 │
│       3 │       2 │       1 │
└─────────┴─────────┴─────────┘
```

То же самое, но файл со сжатием `gzip`:

Запрос:

``` sql
SELECT *
FROM s3('https://storage.yandexcloud.net/my-test-bucket-768/data.csv.gz', 'CSV', 'column1 UInt32, column2 UInt32, column3 UInt32', 'gzip')
LIMIT 2;
```

Результат:

``` text
┌─column1─┬─column2─┬─column3─┐
│       1 │       2 │       3 │
│       3 │       2 │       1 │
└─────────┴─────────┴─────────┘
```

## Примеры использования {#usage-examples}

Предположим, у нас есть несколько файлов со следующими URI на S3:

-   'https://storage.yandexcloud.net/my-test-bucket-768/some_prefix/some_file_1.csv'
-   'https://storage.yandexcloud.net/my-test-bucket-768/some_prefix/some_file_2.csv'
-   'https://storage.yandexcloud.net/my-test-bucket-768/some_prefix/some_file_3.csv'
-   'https://storage.yandexcloud.net/my-test-bucket-768/some_prefix/some_file_4.csv'
-   'https://storage.yandexcloud.net/my-test-bucket-768/another_prefix/some_file_1.csv'
-   'https://storage.yandexcloud.net/my-test-bucket-768/another_prefix/some_file_2.csv'
-   'https://storage.yandexcloud.net/my-test-bucket-768/another_prefix/some_file_3.csv'
-   'https://storage.yandexcloud.net/my-test-bucket-768/another_prefix/some_file_4.csv'

Подсчитаем количество строк в файлах, заканчивающихся цифрами от 1 до 3:

``` sql
SELECT count(*)
FROM s3('https://storage.yandexcloud.net/my-test-bucket-768/{some,another}_prefix/some_file_{1..3}.csv', 'CSV', 'name String, value UInt32');
```

``` text
┌─count()─┐
│      18 │
└─────────┘
```

Подсчитаем общее количество строк во всех файлах этих двух каталогов:

``` sql
SELECT count(*)
FROM s3('https://storage.yandexcloud.net/my-test-bucket-768/{some,another}_prefix/*', 'CSV', 'name String, value UInt32');
```

``` text
┌─count()─┐
│      24 │
└─────────┘
```

:::danger Предупреждение
Если список файлов содержит диапазоны чисел с ведущими нулями, используйте конструкцию с фигурными скобками для каждой цифры отдельно или используйте `?`.
:::

Подсчитаем общее количество строк в файлах с именами `file-000.csv`, `file-001.csv`, ... , `file-999.csv`:

``` sql
SELECT count(*)
FROM s3('https://storage.yandexcloud.net/my-test-bucket-768/big_prefix/file-{000..999}.csv', 'CSV', 'name String, value UInt32');
```

``` text
┌─count()─┐
│      12 │
└─────────┘
```

Запишем данные в файл `test-data.csv.gz`:

``` sql
INSERT INTO FUNCTION s3('https://storage.yandexcloud.net/my-test-bucket-768/test-data.csv.gz', 'CSV', 'name String, value UInt32', 'gzip')
VALUES ('test-data', 1), ('test-data-2', 2);
```

Запишем данные из существующей таблицы в файл `test-data.csv.gz`:

``` sql
INSERT INTO FUNCTION s3('https://storage.yandexcloud.net/my-test-bucket-768/test-data.csv.gz', 'CSV', 'name String, value UInt32', 'gzip')
SELECT name, value FROM existing_table;
```

## Партиционирование при записи данных {#partitioned-write}

Если при добавлении данных в таблицу S3 указать выражение `PARTITION BY`, то для каждого значения ключа партиционирования создается отдельный файл. Это повышает эффективность операций чтения.

**Примеры**

1. При использовании ID партиции в имени ключа создаются отдельные файлы:

```sql
INSERT INTO TABLE FUNCTION
    s3('http://bucket.amazonaws.com/my_bucket/file_{_partition_id}.csv', 'CSV', 'a UInt32, b UInt32, c UInt32')
    PARTITION BY a VALUES ('x', 2, 3), ('x', 4, 5), ('y', 11, 12), ('y', 13, 14), ('z', 21, 22), ('z', 23, 24);
```
В результате данные будут записаны в три файла: `file_x.csv`, `file_y.csv` и `file_z.csv`.

2. При использовании ID партиции в названии бакета создаются файлы в разных бакетах:

```sql
INSERT INTO TABLE FUNCTION
    s3('http://bucket.amazonaws.com/my_bucket_{_partition_id}/file.csv', 'CSV', 'a UInt32, b UInt32, c UInt32')
    PARTITION BY a VALUES (1, 2, 3), (1, 4, 5), (10, 11, 12), (10, 13, 14), (20, 21, 22), (20, 23, 24);
```
В результате будут созданы три файла в разных бакетах: `my_bucket_1/file.csv`, `my_bucket_10/file.csv` и `my_bucket_20/file.csv`.

**Смотрите также**

-  [Движок таблиц S3](../../engines/table-engines/integrations/s3.md)
-												add files in ru docs

											
										
										
											2021-03-01 13:35:59 +00:00
+								---
-												add slugs to all docs

											
										
										
											2022-08-26 17:37:11 +00:00
+								slug: /ru/sql-reference/table-functions/s3
-												Removed /ja folder, cleaned up /ru markdown

											
										
										
											2022-04-09 13:29:05 +00:00
+								sidebar_position: 45
 								sidebar_label: s3
-												add files in ru docs

											
										
										
											2021-03-01 13:35:59 +00:00
+								---
-												Add ru translation

											
										
										
											2021-03-01 20:07:09 +00:00
+								# Табличная Функция S3 {#s3-table-function}
-												add files in ru docs

											
										
										
											2021-03-01 13:35:59 +00:00
-												Add ru translation

											
										
										
											2021-03-01 20:07:09 +00:00
+								Предоставляет табличный интерфейс для выбора/вставки файлов в [Amazon S3](https://aws.amazon.com/s3/). Эта табличная функция похожа на [hdfs](../../sql-reference/table-functions/hdfs.md), но обеспечивает специфические для S3 возможности.
-												casting to template

											
										
										
											2021-03-05 08:31:16 +00:00
+								**Синтаксис**
-												add files in ru docs

											
										
										
											2021-03-01 13:35:59 +00:00
 								``` sql
-												StorageS3 / TableFunctionS3: Allow passing session_token to AuthSettings

This can help users that want to pass temporary credentials that
issued by AWS in order to load data from S3 without changing
configuration or creating an IAM User.

Fixes #57848

											
										
										
											2023-12-14 08:05:01 +00:00
+								s3(path [,access_key_id, secret_access_key [,session_token]] [,format] [,structure] [,compression])
-												add files in ru docs

											
										
										
											2021-03-01 13:35:59 +00:00
+								```
-												casting to template

											
										
										
											2021-03-05 08:31:16 +00:00
+								**Aргументы**
-												Add ru translation

											
										
										
											2021-03-01 20:07:09 +00:00
-												Fixes after review

											
										
										
											2021-03-21 14:23:16 +00:00
+								-   `path` — URL-адрес бакета с указанием пути к файлу. Поддерживает следующие подстановочные знаки в режиме "только чтение": `*, ?, {abc,def} и {N..M}` где `N, M` — числа, `'abc', 'def'` — строки. Подробнее смотри [здесь](../../engines/table-engines/integrations/s3.md#wildcards-in-path).
-												Add ru translation

											
										
										
											2021-03-01 20:07:09 +00:00
+								-   `format` — [формат](../../interfaces/formats.md#formats) файла.
 								-   `structure` — cтруктура таблицы. Формат `'column1_name column1_type, column2_name column2_type, ...'`.
-												Remove trailing whitespaces from docs

											
										
										
											2021-07-29 15:20:55 +00:00
+								-   `compression` — автоматически обнаруживает сжатие по расширению файла. Возможные значения: `none`, `gzip/gz`, `brotli/br`, `xz/LZMA`, `zstd/zst`. Необязательный параметр.
-												add files in ru docs

											
										
										
											2021-03-01 13:35:59 +00:00
-												Add ru translation

											
										
										
											2021-03-01 20:07:09 +00:00
+								**Возвращаемые значения**
-												add files in ru docs

											
										
										
											2021-03-01 13:35:59 +00:00
-												Add ru translation

											
										
										
											2021-03-01 20:07:09 +00:00
+								Таблица с указанной структурой для чтения или записи данных в указанный файл.
-												add files in ru docs

											
										
										
											2021-03-01 13:35:59 +00:00
-												Add ru translation

											
										
										
											2021-03-01 20:07:09 +00:00
+								**Примеры**
-												add files in ru docs

											
										
										
											2021-03-01 13:35:59 +00:00
-												Add ru translation

											
										
										
											2021-03-01 20:07:09 +00:00
+								Создание таблицы из файла S3 `https://storage.yandexcloud.net/my-test-bucket-768/data.csv` и выбор первых трех столбцов из нее:
-												add files in ru docs

											
										
										
											2021-03-01 13:35:59 +00:00
-												Merge branch 'master' into annadevyatova-DOCSUP-5841-translate
											
										
										
											2021-03-21 14:00:19 +00:00
+								Запрос:
-												add files in ru docs

											
										
										
											2021-03-01 13:35:59 +00:00
 								``` sql
-												revert some changes

											
										
										
											2021-03-05 09:22:15 +00:00
+								SELECT *
 								FROM s3('https://storage.yandexcloud.net/my-test-bucket-768/data.csv', 'CSV', 'column1 UInt32, column2 UInt32, column3 UInt32')
 								LIMIT 2;
-												add files in ru docs

											
										
										
											2021-03-01 13:35:59 +00:00
+								```
-												Update docs/ru/sql-reference/table-functions/s3.md

Co-authored-by: olgarev <56617294+olgarev@users.noreply.github.com>
											
										
										
											2021-03-10 05:57:23 +00:00
+								Результат:
-												Add ru translation

											
										
										
											2021-03-01 20:07:09 +00:00
-												add files in ru docs

											
										
										
											2021-03-01 13:35:59 +00:00
+								``` text
-												revert some changes

											
										
										
											2021-03-05 09:22:15 +00:00
+								┌─column1─┬─column2─┬─column3─┐
 								│       1 │       2 │       3 │
 								│       3 │       2 │       1 │
 								└─────────┴─────────┴─────────┘
-												add files in ru docs

											
										
										
											2021-03-01 13:35:59 +00:00
+								```
-												Add ru translation

											
										
										
											2021-03-01 20:07:09 +00:00
+								То же самое, но файл со сжатием `gzip`:
 								Запрос:
-												add files in ru docs

											
										
										
											2021-03-01 13:35:59 +00:00
 								``` sql
-												Remove trailing whitespaces from docs

											
										
										
											2021-07-29 15:20:55 +00:00
+								SELECT *
 								FROM s3('https://storage.yandexcloud.net/my-test-bucket-768/data.csv.gz', 'CSV', 'column1 UInt32, column2 UInt32, column3 UInt32', 'gzip')
-												revert some changes

											
										
										
											2021-03-05 09:22:15 +00:00
+								LIMIT 2;
-												add files in ru docs

											
										
										
											2021-03-01 13:35:59 +00:00
+								```
-												Add ru translation

											
										
										
											2021-03-01 20:07:09 +00:00
+								Результат:
-												add files in ru docs

											
										
										
											2021-03-01 13:35:59 +00:00
+								``` text
-												revert some changes

											
										
										
											2021-03-05 09:22:15 +00:00
+								┌─column1─┬─column2─┬─column3─┐
 								│       1 │       2 │       3 │
 								│       3 │       2 │       1 │
 								└─────────┴─────────┴─────────┘
-												add files in ru docs

											
										
										
											2021-03-01 13:35:59 +00:00
+								```
-												Fix broken link

											
										
										
											2021-03-14 20:19:53 +00:00
-												Add ru translation

											
										
										
											2021-03-01 20:07:09 +00:00
+								## Примеры использования {#usage-examples}
-												add files in ru docs

											
										
										
											2021-03-01 13:35:59 +00:00
-												Add ru translation

											
										
										
											2021-03-01 20:07:09 +00:00
+								Предположим, у нас есть несколько файлов со следующими URI на S3:
-												add files in ru docs

											
										
										
											2021-03-01 13:35:59 +00:00
-												Minor fixed

											
										
										
											2021-03-05 09:10:35 +00:00
+								-   'https://storage.yandexcloud.net/my-test-bucket-768/some_prefix/some_file_1.csv'
 								-   'https://storage.yandexcloud.net/my-test-bucket-768/some_prefix/some_file_2.csv'
 								-   'https://storage.yandexcloud.net/my-test-bucket-768/some_prefix/some_file_3.csv'
 								-   'https://storage.yandexcloud.net/my-test-bucket-768/some_prefix/some_file_4.csv'
 								-   'https://storage.yandexcloud.net/my-test-bucket-768/another_prefix/some_file_1.csv'
 								-   'https://storage.yandexcloud.net/my-test-bucket-768/another_prefix/some_file_2.csv'
 								-   'https://storage.yandexcloud.net/my-test-bucket-768/another_prefix/some_file_3.csv'
 								-   'https://storage.yandexcloud.net/my-test-bucket-768/another_prefix/some_file_4.csv'
-												add files in ru docs

											
										
										
											2021-03-01 13:35:59 +00:00
-												Update docs/ru/sql-reference/table-functions/s3.md

Co-authored-by: olgarev <56617294+olgarev@users.noreply.github.com>
											
										
										
											2021-03-10 05:59:37 +00:00
+								Подсчитаем количество строк в файлах, заканчивающихся цифрами от 1 до 3:
-												add files in ru docs

											
										
										
											2021-03-01 13:35:59 +00:00
 								``` sql
-												revert some changes

											
										
										
											2021-03-05 09:22:15 +00:00
+								SELECT count(*)
 								FROM s3('https://storage.yandexcloud.net/my-test-bucket-768/{some,another}_prefix/some_file_{1..3}.csv', 'CSV', 'name String, value UInt32');
-												add files in ru docs

											
										
										
											2021-03-01 13:35:59 +00:00
+								```
 								``` text
-												revert some changes

											
										
										
											2021-03-05 09:22:15 +00:00
+								┌─count()─┐
 								│      18 │
 								└─────────┘
-												add files in ru docs

											
										
										
											2021-03-01 13:35:59 +00:00
+								```
-												Update docs/ru/sql-reference/table-functions/s3.md

Co-authored-by: olgarev <56617294+olgarev@users.noreply.github.com>
											
										
										
											2021-03-10 05:57:30 +00:00
+								Подсчитаем общее количество строк во всех файлах этих двух каталогов:
-												add files in ru docs

											
										
										
											2021-03-01 13:35:59 +00:00
 								``` sql
-												revert some changes

											
										
										
											2021-03-05 09:22:15 +00:00
+								SELECT count(*)
 								FROM s3('https://storage.yandexcloud.net/my-test-bucket-768/{some,another}_prefix/*', 'CSV', 'name String, value UInt32');
-												add files in ru docs

											
										
										
											2021-03-01 13:35:59 +00:00
+								```
 								``` text
-												revert some changes

											
										
										
											2021-03-05 09:22:15 +00:00
+								┌─count()─┐
 								│      24 │
 								└─────────┘
-												add files in ru docs

											
										
										
											2021-03-01 13:35:59 +00:00
+								```
-												Make docs better

											
										
										
											2023-09-05 12:43:53 +00:00
+								:::danger Предупреждение
 								Если список файлов содержит диапазоны чисел с ведущими нулями, используйте конструкцию с фигурными скобками для каждой цифры отдельно или используйте `?`.
 								:::
-												add files in ru docs

											
										
										
											2021-03-01 13:35:59 +00:00
-												Review changes and replace … with ...

											
										
										
											2024-05-23 11:54:45 +00:00
+								Подсчитаем общее количество строк в файлах с именами `file-000.csv`, `file-001.csv`, ... , `file-999.csv`:
-												add files in ru docs

											
										
										
											2021-03-01 13:35:59 +00:00
 								``` sql
-												revert some changes

											
										
										
											2021-03-05 09:22:15 +00:00
+								SELECT count(*)
 								FROM s3('https://storage.yandexcloud.net/my-test-bucket-768/big_prefix/file-{000..999}.csv', 'CSV', 'name String, value UInt32');
-												add files in ru docs

											
										
										
											2021-03-01 13:35:59 +00:00
+								```
 								``` text
-												revert some changes

											
										
										
											2021-03-05 09:22:15 +00:00
+								┌─count()─┐
 								│      12 │
 								└─────────┘
-												add files in ru docs

											
										
										
											2021-03-01 13:35:59 +00:00
+								```
-												Update docs/ru/sql-reference/table-functions/s3.md

Co-authored-by: olgarev <56617294+olgarev@users.noreply.github.com>
											
										
										
											2021-03-10 05:57:39 +00:00
+								Запишем данные в файл `test-data.csv.gz`:
-												add files in ru docs

											
										
										
											2021-03-01 13:35:59 +00:00
 								``` sql
-												Update s3.md

Missed keyword "FUNCTION"
											
										
										
											2021-06-11 04:41:47 +00:00
+								INSERT INTO FUNCTION s3('https://storage.yandexcloud.net/my-test-bucket-768/test-data.csv.gz', 'CSV', 'name String, value UInt32', 'gzip')
-												revert some changes

											
										
										
											2021-03-05 09:22:15 +00:00
+								VALUES ('test-data', 1), ('test-data-2', 2);
-												add files in ru docs

											
										
										
											2021-03-01 13:35:59 +00:00
+								```
-												Update docs/ru/sql-reference/table-functions/s3.md

Co-authored-by: olgarev <56617294+olgarev@users.noreply.github.com>
											
										
										
											2021-03-10 05:59:23 +00:00
+								Запишем данные из существующей таблицы в файл `test-data.csv.gz`:
-												add files in ru docs

											
										
										
											2021-03-01 13:35:59 +00:00
 								``` sql
-												Update s3.md

Missed keyword "FUNCTION"
											
										
										
											2021-06-11 04:41:47 +00:00
+								INSERT INTO FUNCTION s3('https://storage.yandexcloud.net/my-test-bucket-768/test-data.csv.gz', 'CSV', 'name String, value UInt32', 'gzip')
-												revert some changes

											
										
										
											2021-03-05 09:22:15 +00:00
+								SELECT name, value FROM existing_table;
-												add files in ru docs

											
										
										
											2021-03-01 13:35:59 +00:00
+								```
-												Translated and minor fixes

											
										
										
											2021-09-08 02:52:17 +00:00
+								## Партиционирование при записи данных {#partitioned-write}
-												Apply suggestions from code review
											
										
										
											2021-09-10 06:31:49 +00:00
+								Если при добавлении данных в таблицу S3 указать выражение `PARTITION BY`, то для каждого значения ключа партиционирования создается отдельный файл. Это повышает эффективность операций чтения.
-												Translated and minor fixes

											
										
										
											2021-09-08 02:52:17 +00:00
 								**Примеры**
-												Apply suggestions from code review
											
										
										
											2021-09-10 06:31:49 +00:00
+. При использовании ID партиции в имени ключа создаются отдельные файлы:
-												Translated and minor fixes

											
										
										
											2021-09-08 02:52:17 +00:00
 								```sql
 								INSERT INTO TABLE FUNCTION
 								    s3('http://bucket.amazonaws.com/my_bucket/file_{_partition_id}.csv', 'CSV', 'a UInt32, b UInt32, c UInt32')
-												Apply suggestions from code review
											
										
										
											2021-09-09 19:33:59 +00:00
+								    PARTITION BY a VALUES ('x', 2, 3), ('x', 4, 5), ('y', 11, 12), ('y', 13, 14), ('z', 21, 22), ('z', 23, 24);
-												Translated and minor fixes

											
										
										
											2021-09-08 02:52:17 +00:00
+								```
-												Apply suggestions from code review
											
										
										
											2021-09-09 19:33:59 +00:00
+								В результате данные будут записаны в три файла: `file_x.csv`, `file_y.csv` и `file_z.csv`.
-												Translated and minor fixes

											
										
										
											2021-09-08 02:52:17 +00:00
 . При использовании ID партиции в названии бакета создаются файлы в разных бакетах:
 								```sql
 								INSERT INTO TABLE FUNCTION
 								    s3('http://bucket.amazonaws.com/my_bucket_{_partition_id}/file.csv', 'CSV', 'a UInt32, b UInt32, c UInt32')
-												Apply suggestions from code review
											
										
										
											2021-09-09 19:33:59 +00:00
+								    PARTITION BY a VALUES (1, 2, 3), (1, 4, 5), (10, 11, 12), (10, 13, 14), (20, 21, 22), (20, 23, 24);
-												Translated and minor fixes

											
										
										
											2021-09-08 02:52:17 +00:00
+								```
 								В результате будут созданы три файла в разных бакетах: `my_bucket_1/file.csv`, `my_bucket_10/file.csv` и `my_bucket_20/file.csv`.
-												Update docs/ru/sql-reference/table-functions/s3.md

Co-authored-by: olgarev <56617294+olgarev@users.noreply.github.com>
											
										
										
											2021-03-10 05:57:47 +00:00
+								**Смотрите также**
-												add files in ru docs

											
										
										
											2021-03-01 13:35:59 +00:00
-												Add ru translation

											
										
										
											2021-03-01 20:07:09 +00:00
+								-  [Движок таблиц S3](../../engines/table-engines/integrations/s3.md)