2017-10-25 05:27:09 +00:00
2019-06-02 13:29:43 +00:00
# Источники внешних словарей {#dicts-external_dicts_dict_sources}
2017-10-25 05:27:09 +00:00
Внешний словарь можно подключить из множества источников.
Общий вид конфигурации:
```xml
2017-11-19 12:07:08 +00:00
< yandex >
2017-10-25 05:27:09 +00:00
< dictionary >
...
< source >
< source_type >
<!-- Source configuration -->
< / source_type >
< / source >
...
< / dictionary >
...
2017-11-19 12:07:08 +00:00
< / yandex >
2017-10-25 05:27:09 +00:00
```
Источник настраивается в разделе `source` .
Типы источников (`source_type`):
2019-06-02 13:29:43 +00:00
- [Локальный файл ](#dicts-external_dicts_dict_sources-local_file )
- [Исполняемый файл ](#dicts-external_dicts_dict_sources-executable )
- [HTTP(s) ](#dicts-external_dicts_dict_sources-http )
2017-10-25 05:27:09 +00:00
- СУБД:
2019-05-16 07:12:04 +00:00
- [ODBC ](#dicts-external_dicts_dict_sources-odbc )
2019-06-02 13:29:43 +00:00
- [MySQL ](#dicts-external_dicts_dict_sources-mysql )
- [ClickHouse ](#dicts-external_dicts_dict_sources-clickhouse )
- [MongoDB ](#dicts-external_dicts_dict_sources-mongodb )
- [Redis ](#dicts-external_dicts_dict_sources-redis )
2017-10-25 05:27:09 +00:00
2019-06-02 13:29:43 +00:00
## Локальный файл {#dicts-external_dicts_dict_sources-local_file}
2017-10-25 05:27:09 +00:00
Пример настройки:
```xml
< source >
< file >
< path > /opt/dictionaries/os.tsv< / path >
< format > TabSeparated< / format >
< / file >
< / source >
```
Поля настройки:
- `path` - Абсолютный путь к файлу.
2018-07-18 10:00:53 +00:00
- `format` - Формат файла. Поддерживаются все форматы, описанные в разделе "[Форматы](../../interfaces/formats.md#formats)".
2017-10-25 05:27:09 +00:00
2019-06-02 13:29:43 +00:00
## Исполняемый файл {#dicts-external_dicts_dict_sources-executable}
2017-10-25 05:27:09 +00:00
2018-12-12 17:28:00 +00:00
Работа с исполняемым файлом зависит от [размещения словаря в памяти ](external_dicts_dict_layout.md ). Если тип размещения словаря `cache` и `complex_key_cache` , то ClickHouse запрашивает необходимые ключи, отправляя запрос в `STDIN` исполняемого файла.
2017-10-25 05:27:09 +00:00
Пример настройки:
```xml
< source >
< executable >
< command > cat /opt/dictionaries/os.tsv< / command >
< format > TabSeparated< / format >
< / executable >
< / source >
```
Поля настройки:
- `command` - Абсолютный путь к исполняемому файлу или имя файла (если каталог программы прописан в `PATH` ).
2018-07-18 10:00:53 +00:00
- `format` - Формат файла. Поддерживаются все форматы, описанные в разделе "[Форматы](../../interfaces/formats.md#formats)".
2017-10-25 05:27:09 +00:00
2019-06-02 13:29:43 +00:00
## HTTP(s) {#dicts-external_dicts_dict_sources-http}
2017-10-25 05:27:09 +00:00
2018-12-12 17:28:00 +00:00
Работа с HTTP(s) сервером зависит от [размещения словаря в памяти ](external_dicts_dict_layout.md ). Если тип размещения словаря `cache` и `complex_key_cache` , то ClickHouse запрашивает необходимые ключи, отправляя запрос методом `POST` .
2017-10-25 05:27:09 +00:00
Пример настройки:
```xml
< source >
< http >
< url > http://[::1]/os.tsv< / url >
< format > TabSeparated< / format >
< / http >
< / source >
```
2018-12-12 17:28:00 +00:00
Чтобы ClickHouse смог обратиться к HTTPS-р е с у р с у , необходимо [настроить openSSL ](../../operations/server_settings/settings.md ) в конфигурации сервера.
2017-10-25 05:27:09 +00:00
Поля настройки:
- `url` - URL источника.
2018-07-18 10:00:53 +00:00
- `format` - Формат файла. Поддерживаются все форматы, описанные в разделе "[Форматы](../../interfaces/formats.md#formats)".
2017-10-25 05:27:09 +00:00
2019-05-16 07:12:04 +00:00
## ODBC {#dicts-external_dicts_dict_sources-odbc}
2017-10-25 05:27:09 +00:00
Этим способом можно подключить любую базу данных, имеющую ODBC драйвер.
Пример настройки:
```xml
< odbc >
< db > DatabaseName< / db >
2018-10-15 14:49:23 +00:00
< table > ShemaName.TableName< / table >
2017-10-25 05:27:09 +00:00
< connection_string > DSN=some_parameters< / connection_string >
< invalidate_query > SQL_QUERY< / invalidate_query >
< / odbc >
```
Поля настройки:
2018-10-15 14:49:23 +00:00
- `db` - имя базы данных. Н е указывать, если имя базы задано в параметрах. `<connection_string>` .
- `table` - имя таблицы и схемы, если она есть.
2017-10-25 05:27:09 +00:00
- `connection_string` - строка соединения.
2018-12-12 17:28:00 +00:00
- `invalidate_query` - запрос для проверки статуса словаря. Необязательный параметр. Читайте подробнее в разделе [Обновление словарей ](external_dicts_dict_lifetime.md ).
2017-10-25 05:27:09 +00:00
2018-10-15 14:49:23 +00:00
ClickHouse получает от ODBC-драйвера информацию о квотировании и квотирует настройки в запросах к драйверу, поэтому имя таблицы нужно указывать в соответствии с регистром имени таблицы в базе данных.
2019-06-13 03:14:04 +00:00
Если у вас есть проблемы с кодировками при использовании Oracle, ознакомьтесь с соответствущим разделом [FAQ ](../../faq/general.md#oracle-odbc-encodings ).
2018-10-08 10:20:34 +00:00
### Выявленная уязвимость в функционировании ODBC словарей
2018-10-05 15:19:08 +00:00
2018-10-08 10:20:34 +00:00
!!! attention
При соединении с базой данных через ODBC можно заменить параметр соединения `Servername` . В этом случае, значения `USERNAME` и `PASSWORD` из `odbc.ini` отправляются на удаленный сервер и могут быть скомпроментированы.
2018-10-05 15:19:08 +00:00
**Пример небезопасного использования**
Сконфигурируем unixODBC для работы с PostgreSQL. Содержимое `/etc/odbc.ini` :
2019-09-23 15:31:46 +00:00
```text
2018-10-05 15:19:08 +00:00
[gregtest]
Driver = /usr/lib/psqlodbca.so
Servername = localhost
PORT = 5432
DATABASE = test_db
#OPTION = 3
USERNAME = test
PASSWORD = test
```
Если выполнить запрос вида:
2019-09-23 15:31:46 +00:00
```sql
2018-10-05 15:19:08 +00:00
SELECT * FROM odbc('DSN=gregtest;Servername=some-server.com', 'test_db');
```
2018-10-08 10:20:34 +00:00
то ODBC драйвер отправит значения `USERNAME` и `PASSWORD` из `odbc.ini` на `some-server.com` .
2018-10-05 15:19:08 +00:00
2018-09-05 12:37:49 +00:00
### Пример подключения PostgreSQL
2017-10-25 05:27:09 +00:00
О С Ubuntu.
Установка unixODBC и ODBC-драйвера для PostgreSQL: :
2019-09-23 15:31:46 +00:00
```bash
$ sudo apt-get install -y unixodbc odbcinst odbc-postgresql
```
2018-01-19 14:36:40 +00:00
Настройка `/etc/odbc.ini` (или `~/.odbc.ini` ):
2017-10-25 05:27:09 +00:00
2019-09-23 15:31:46 +00:00
```text
2017-10-25 05:27:09 +00:00
[DEFAULT]
Driver = myconnection
[myconnection]
Description = PostgreSQL connection to my_db
Driver = PostgreSQL Unicode
Database = my_db
Servername = 127.0.0.1
UserName = username
Password = password
Port = 5432
Protocol = 9.3
ReadOnly = No
RowVersioning = No
ShowSystemTables = No
ConnSettings =
2018-01-19 14:36:40 +00:00
```
2017-10-25 05:27:09 +00:00
Конфигурация словаря в ClickHouse:
```xml
2018-07-30 14:03:29 +00:00
< yandex >
< dictionary >
< name > table_name< / name >
< source >
< odbc >
<!-- в connection_string можно указывать следующие параметры: -->
<!-- DSN=myconnection;UID=username;PWD=password;HOST=127.0.0.1;PORT=5432;DATABASE=my_db -->
< connection_string > DSN=myconnection< / connection_string >
< table > postgresql_table< / table >
< / odbc >
< / source >
< lifetime >
< min > 300< / min >
< max > 360< / max >
< / lifetime >
< layout >
< hashed / >
< / layout >
< structure >
< id >
< name > id< / name >
< / id >
< attribute >
< name > some_column< / name >
< type > UInt64< / type >
< null_value > 0< / null_value >
< / attribute >
< / structure >
< / dictionary >
< / yandex >
2017-10-25 05:27:09 +00:00
```
Может понадобиться в `odbc.ini` указать полный путь до библиотеки с драйвером `DRIVER=/usr/local/lib/psqlodbcw.so` .
### Пример подключения MS SQL Server
О С Ubuntu.
Установка драйвера: :
2019-09-23 15:31:46 +00:00
```bash
$ sudo apt-get install tdsodbc freetds-bin sqsh
2017-10-25 05:27:09 +00:00
```
Настройка драйвера: :
2019-09-23 15:31:46 +00:00
```bash
2018-10-05 15:19:08 +00:00
$ cat /etc/freetds/freetds.conf
2017-10-25 05:27:09 +00:00
...
[MSSQL]
host = 192.168.56.101
port = 1433
tds version = 7.0
client charset = UTF-8
2018-10-05 15:19:08 +00:00
$ cat /etc/odbcinst.ini
2017-10-25 05:27:09 +00:00
...
[FreeTDS]
Description = FreeTDS
Driver = /usr/lib/x86_64-linux-gnu/odbc/libtdsodbc.so
Setup = /usr/lib/x86_64-linux-gnu/odbc/libtdsS.so
FileUsage = 1
UsageCount = 5
2018-10-05 15:19:08 +00:00
$ cat ~/.odbc.ini
2017-10-25 05:27:09 +00:00
...
[MSSQL]
Description = FreeTDS
Driver = FreeTDS
Servername = MSSQL
Database = test
UID = test
PWD = test
Port = 1433
```
Настройка словаря в ClickHouse:
```xml
2017-11-19 12:07:08 +00:00
< yandex >
2017-10-25 05:27:09 +00:00
< dictionary >
< name > test< / name >
< source >
< odbc >
< table > dict< / table >
< connection_string > DSN=MSSQL;UID=test;PWD=test< / connection_string >
< / odbc >
< / source >
< lifetime >
< min > 300< / min >
< max > 360< / max >
< / lifetime >
< layout >
< flat / >
< / layout >
< structure >
< id >
< name > k< / name >
< / id >
< attribute >
< name > s< / name >
< type > String< / type >
< null_value > < / null_value >
< / attribute >
< / structure >
< / dictionary >
2017-11-19 12:07:08 +00:00
< / yandex >
2017-10-25 05:27:09 +00:00
```
2017-12-11 12:07:26 +00:00
## СУБД
2017-10-25 05:27:09 +00:00
2019-05-18 17:25:58 +00:00
### MySQL {#dicts-external_dicts_dict_sources-mysql}
2017-10-25 05:27:09 +00:00
Пример настройки:
```xml
< source >
< mysql >
< port > 3306< / port >
< user > clickhouse< / user >
< password > qwerty< / password >
< replica >
< host > example01-1< / host >
< priority > 1< / priority >
< / replica >
< replica >
< host > example01-2< / host >
< priority > 1< / priority >
< / replica >
< db > db_name< / db >
< table > table_name< / table >
< where > id=10< / where >
< invalidate_query > SQL_QUERY< / invalidate_query >
< / mysql >
< / source >
```
Поля настройки:
- `port` - порт сервера MySQL. Можно указать для всех реплик или для каждой в отдельности (внутри `<replica>` ).
- `user` - имя пользователя MySQL. Можно указать для всех реплик или для каждой в отдельности (внутри `<replica>` ).
- `password` - пароль пользователя MySQL. Можно указать для всех реплик или для каждой в отдельности (внутри `<replica>` ).
- `replica` - блок конфигурации реплики. Блоков может быть несколько.
- `replica/host` - хост MySQL.
\* `replica/priority` - приоритет реплики. При попытке соединения ClickHouse обходит реплики в соответствии с приоритетом. Чем меньше цифра, тем выше приоритет.
- `db` - имя базы данных.
- `table` - имя таблицы.
- `where` - условие выбора. Необязательный параметр.
2018-12-12 17:28:00 +00:00
- `invalidate_query` - запрос для проверки статуса словаря. Необязательный параметр. Читайте подробнее в разделе [Обновление словарей ](external_dicts_dict_lifetime.md ).
2017-10-25 05:27:09 +00:00
MySQL можно подключить на локальном хосте через сокеты, для этого необходимо задать `host` и `socket` .
Пример настройки:
```xml
< source >
< mysql >
< host > localhost< / host >
< socket > /path/to/socket/file.sock< / socket >
< user > clickhouse< / user >
< password > qwerty< / password >
< db > db_name< / db >
< table > table_name< / table >
< where > id=10< / where >
< invalidate_query > SQL_QUERY< / invalidate_query >
< / mysql >
< / source >
```
2019-06-02 13:29:43 +00:00
### ClickHouse {#dicts-external_dicts_dict_sources-clickhouse}
2017-10-25 05:27:09 +00:00
Пример настройки:
```xml
< source >
< clickhouse >
< host > example01-01-1< / host >
< port > 9000< / port >
< user > default< / user >
< password > < / password >
< db > default< / db >
< table > ids< / table >
< where > id=10< / where >
< / clickhouse >
< / source >
```
Поля настройки:
2018-12-12 17:28:00 +00:00
- `host` - хост ClickHouse. Если host локальный, то запрос выполняется без сетевого взаимодействия. Чтобы повысить отказоустойчивость решения, можно создать таблицу типа [Distributed ](../../operations/table_engines/distributed.md ) и прописать её в дальнейших настройках.
2017-10-25 05:27:09 +00:00
- `port` - порт сервера ClickHouse.
- `user` - имя пользователя ClickHouse.
- `password` - пароль пользователя ClickHouse.
- `db` - имя базы данных.
- `table` - имя таблицы.
- `where` - условие выбора. Может отсутствовать.
2018-12-12 17:28:00 +00:00
- `invalidate_query` - запрос для проверки статуса словаря. Необязательный параметр. Читайте подробнее в разделе [Обновление словарей ](external_dicts_dict_lifetime.md ).
2017-10-25 05:27:09 +00:00
2019-06-02 13:29:43 +00:00
### MongoDB {#dicts-external_dicts_dict_sources-mongodb}
2017-10-25 05:27:09 +00:00
Пример настройки:
```xml
< source >
< mongodb >
< host > localhost< / host >
< port > 27017< / port >
< user > < / user >
< password > < / password >
< db > test< / db >
< collection > dictionary_source< / collection >
< / mongodb >
< / source >
```
Поля настройки:
- `host` - хост MongoDB.
- `port` - порт сервера MongoDB.
- `user` - имя пользователя MongoDB.
- `password` - пароль пользователя MongoDB.
- `db` - имя базы данных.
- `collection` - имя коллекции.
2018-10-16 10:47:17 +00:00
2019-06-02 13:29:43 +00:00
### Redis {#dicts-external_dicts_dict_sources-redis}
Пример настройки:
```xml
< source >
< redis >
< host > localhost< / host >
< port > 6379< / port >
< storage_type > simple< / storage_type >
< db_index > 0< / db_index >
< / redis >
< / source >
```
Поля настройки:
- `host` – хост Redis.
- `port` – порт сервера Redis.
- `storage_type` – способ хранения ключей. Необходимо использовать `simple` для источников с одним столбцом ключей, `hash_map` -- для источников с двумя столбцами ключей. Источники с более, чем двумя столбцами ключей, не поддерживаются. Может отсутствовать, значение по умолчанию `simple` .
- `db_index` – номер базы данных. Может отсутствовать, значение по умолчанию 0.
2018-10-16 10:47:17 +00:00
[Оригинальная статья ](https://clickhouse.yandex/docs/ru/query_language/dicts/external_dicts_dict_sources/ ) <!--hide-->