2018-12-21 19:23:55 +00:00
|
|
|
|
# URL(URL, Format) {#table_engines-url}
|
2018-07-27 10:21:04 +00:00
|
|
|
|
|
|
|
|
|
Управляет данными на удаленном HTTP/HTTPS сервере. Данный движок похож
|
2018-12-18 11:32:08 +00:00
|
|
|
|
на движок [File](file.md).
|
2018-07-27 10:21:04 +00:00
|
|
|
|
|
|
|
|
|
## Использование движка в сервере ClickHouse
|
|
|
|
|
|
2018-07-27 11:18:54 +00:00
|
|
|
|
`Format` должен быть таким, который ClickHouse может использовать в запросах
|
2018-07-27 10:21:04 +00:00
|
|
|
|
`SELECT` и, если есть необходимость, `INSERT`. Полный список поддерживаемых форматов смотрите в
|
|
|
|
|
разделе [Форматы](../../interfaces/formats.md#formats).
|
|
|
|
|
|
|
|
|
|
`URL` должен соответствовать структуре Uniform Resource Locator. По указанному URL должен находится сервер
|
|
|
|
|
работающий по протоколу HTTP или HTTPS. При этом не должно требоваться никаких
|
|
|
|
|
дополнительных заголовков для получения ответа от сервера.
|
|
|
|
|
|
|
|
|
|
Запросы `INSERT` и `SELECT` транслируются в `POST` и `GET` запросы
|
|
|
|
|
соответственно. Для обработки `POST`-запросов удаленный сервер должен поддерживать
|
|
|
|
|
[Chunked transfer encoding](https://ru.wikipedia.org/wiki/Chunked_transfer_encoding).
|
|
|
|
|
|
|
|
|
|
**Пример:**
|
|
|
|
|
|
|
|
|
|
**1.** Создадим на сервере таблицу `url_engine_table`:
|
|
|
|
|
|
2018-10-16 10:47:17 +00:00
|
|
|
|
``` sql
|
2018-07-27 10:21:04 +00:00
|
|
|
|
CREATE TABLE url_engine_table (word String, value UInt64)
|
|
|
|
|
ENGINE=URL('http://127.0.0.1:12345/', CSV)
|
|
|
|
|
```
|
|
|
|
|
|
|
|
|
|
**2.** Создадим простейший http-сервер стандартными средствами языка python3 и
|
|
|
|
|
запустим его:
|
|
|
|
|
|
|
|
|
|
```python3
|
|
|
|
|
from http.server import BaseHTTPRequestHandler, HTTPServer
|
|
|
|
|
|
|
|
|
|
class CSVHTTPServer(BaseHTTPRequestHandler):
|
|
|
|
|
def do_GET(self):
|
|
|
|
|
self.send_response(200)
|
|
|
|
|
self.send_header('Content-type', 'text/csv')
|
|
|
|
|
self.end_headers()
|
|
|
|
|
|
|
|
|
|
self.wfile.write(bytes('Hello,1\nWorld,2\n', "utf-8"))
|
|
|
|
|
|
|
|
|
|
if __name__ == "__main__":
|
|
|
|
|
server_address = ('127.0.0.1', 12345)
|
|
|
|
|
HTTPServer(server_address, CSVHTTPServer).serve_forever()
|
|
|
|
|
```
|
|
|
|
|
|
|
|
|
|
```bash
|
|
|
|
|
python3 server.py
|
|
|
|
|
```
|
|
|
|
|
|
|
|
|
|
**3.** Запросим данные:
|
|
|
|
|
|
2018-10-16 10:47:17 +00:00
|
|
|
|
``` sql
|
2018-07-27 10:21:04 +00:00
|
|
|
|
SELECT * FROM url_engine_table
|
|
|
|
|
```
|
|
|
|
|
|
2018-10-16 10:47:17 +00:00
|
|
|
|
```
|
2018-07-27 10:21:04 +00:00
|
|
|
|
┌─word──┬─value─┐
|
|
|
|
|
│ Hello │ 1 │
|
|
|
|
|
│ World │ 2 │
|
|
|
|
|
└───────┴───────┘
|
|
|
|
|
```
|
|
|
|
|
|
|
|
|
|
## Особенности использования
|
|
|
|
|
|
|
|
|
|
- Поддерживается многопоточное чтение и запись.
|
|
|
|
|
- Не поддерживается:
|
|
|
|
|
- использование операций `ALTER` и `SELECT...SAMPLE`;
|
|
|
|
|
- индексы;
|
|
|
|
|
- репликация.
|
|
|
|
|
|
2018-10-16 10:47:17 +00:00
|
|
|
|
|
|
|
|
|
[Оригинальная статья](https://clickhouse.yandex/docs/ru/operations/table_engines/url/) <!--hide-->
|