2017-10-25 05:27:09 +00:00
< a name = "dicts-external_dicts_dict_sources" > < / a >
2017-12-11 12:07:26 +00:00
# Источники внешних словарей
2017-10-25 05:27:09 +00:00
Внешний словарь можно подключить из множества источников.
Общий вид конфигурации:
```xml
2017-11-19 12:07:08 +00:00
< yandex >
2017-10-25 05:27:09 +00:00
< dictionary >
...
< source >
< source_type >
<!-- Source configuration -->
< / source_type >
< / source >
...
< / dictionary >
...
2017-11-19 12:07:08 +00:00
< / yandex >
2017-10-25 05:27:09 +00:00
```
Источник настраивается в разделе `source` .
Типы источников (`source_type`):
- [Локальный файл ](#dicts-external_dicts_dict_sources-local_file )
- [Исполняемый файл ](#dicts-external_dicts_dict_sources-executable )
- [HTTP(s) ](#dicts-external_dicts_dict_sources-http )
- СУБД:
2018-11-13 17:52:15 +00:00
- [ODBC ](#dicts-external_dicts_dict_sources-odbc )
2017-10-25 05:27:09 +00:00
- [MySQL ](#dicts-external_dicts_dict_sources-mysql )
- [ClickHouse ](#dicts-external_dicts_dict_sources-clickhouse )
- [MongoDB ](#dicts-external_dicts_dict_sources-mongodb )
< a name = "dicts-external_dicts_dict_sources-local_file" > < / a >
2017-12-11 12:07:26 +00:00
## Локальный файл
2017-10-25 05:27:09 +00:00
Пример настройки:
```xml
< source >
< file >
< path > /opt/dictionaries/os.tsv< / path >
< format > TabSeparated< / format >
< / file >
< / source >
```
Поля настройки:
- `path` - Абсолютный путь к файлу.
2018-07-18 10:00:53 +00:00
- `format` - Формат файла. Поддерживаются все форматы, описанные в разделе "[Форматы](../../interfaces/formats.md#formats)".
2017-10-25 05:27:09 +00:00
< a name = "dicts-external_dicts_dict_sources-executable" > < / a >
2017-12-11 12:07:26 +00:00
## Исполняемый файл
2017-10-25 05:27:09 +00:00
2017-11-17 14:12:34 +00:00
Работа с исполняемым файлом зависит от [размещения словаря в памяти ](external_dicts_dict_layout.md#dicts-external_dicts_dict_layout ). Если тип размещения словаря `cache` и `complex_key_cache` , то ClickHouse запрашивает необходимые ключи, отправляя запрос в `STDIN` исполняемого файла.
2017-10-25 05:27:09 +00:00
Пример настройки:
```xml
< source >
< executable >
< command > cat /opt/dictionaries/os.tsv< / command >
< format > TabSeparated< / format >
< / executable >
< / source >
```
Поля настройки:
- `command` - Абсолютный путь к исполняемому файлу или имя файла (если каталог программы прописан в `PATH` ).
2018-07-18 10:00:53 +00:00
- `format` - Формат файла. Поддерживаются все форматы, описанные в разделе "[Форматы](../../interfaces/formats.md#formats)".
2017-10-25 05:27:09 +00:00
< a name = "dicts-external_dicts_dict_sources-http" > < / a >
2017-12-11 12:07:26 +00:00
## HTTP(s)
2017-10-25 05:27:09 +00:00
2017-11-17 14:12:34 +00:00
Работа с HTTP(s) сервером зависит от [размещения словаря в памяти ](external_dicts_dict_layout.md#dicts-external_dicts_dict_layout ). Если тип размещения словаря `cache` и `complex_key_cache` , то ClickHouse запрашивает необходимые ключи, отправляя запрос методом `POST` .
2017-10-25 05:27:09 +00:00
Пример настройки:
```xml
< source >
< http >
< url > http://[::1]/os.tsv< / url >
< format > TabSeparated< / format >
< / http >
< / source >
```
2018-07-18 10:00:53 +00:00
Чтобы ClickHouse смог обратиться к HTTPS-р е с у р с у , необходимо [настроить openSSL ](../../operations/server_settings/settings.md#server_settings-openSSL ) в конфигурации сервера.
2017-10-25 05:27:09 +00:00
Поля настройки:
- `url` - URL источника.
2018-07-18 10:00:53 +00:00
- `format` - Формат файла. Поддерживаются все форматы, описанные в разделе "[Форматы](../../interfaces/formats.md#formats)".
2017-10-25 05:27:09 +00:00
< a name = "dicts-external_dicts_dict_sources-odbc" > < / a >
2017-12-11 12:07:26 +00:00
## ODBC
2017-10-25 05:27:09 +00:00
Этим способом можно подключить любую базу данных, имеющую ODBC драйвер.
Пример настройки:
```xml
< odbc >
< db > DatabaseName< / db >
2018-10-15 14:49:23 +00:00
< table > ShemaName.TableName< / table >
2017-10-25 05:27:09 +00:00
< connection_string > DSN=some_parameters< / connection_string >
< invalidate_query > SQL_QUERY< / invalidate_query >
< / odbc >
```
Поля настройки:
2018-10-15 14:49:23 +00:00
- `db` - имя базы данных. Н е указывать, если имя базы задано в параметрах. `<connection_string>` .
- `table` - имя таблицы и схемы, если она есть.
2017-10-25 05:27:09 +00:00
- `connection_string` - строка соединения.
2017-11-17 14:12:34 +00:00
- `invalidate_query` - запрос для проверки статуса словаря. Необязательный параметр. Читайте подробнее в разделе [Обновление словарей ](external_dicts_dict_lifetime.md#dicts-external_dicts_dict_lifetime ).
2017-10-25 05:27:09 +00:00
2018-10-15 14:49:23 +00:00
ClickHouse получает от ODBC-драйвера информацию о квотировании и квотирует настройки в запросах к драйверу, поэтому имя таблицы нужно указывать в соответствии с регистром имени таблицы в базе данных.
2018-10-08 10:20:34 +00:00
### Выявленная уязвимость в функционировании ODBC словарей
2018-10-05 15:19:08 +00:00
2018-10-08 10:20:34 +00:00
!!! attention
При соединении с базой данных через ODBC можно заменить параметр соединения `Servername` . В этом случае, значения `USERNAME` и `PASSWORD` из `odbc.ini` отправляются на удаленный сервер и могут быть скомпроментированы.
2018-10-05 15:19:08 +00:00
**Пример небезопасного использования**
Сконфигурируем unixODBC для работы с PostgreSQL. Содержимое `/etc/odbc.ini` :
```
[gregtest]
Driver = /usr/lib/psqlodbca.so
Servername = localhost
PORT = 5432
DATABASE = test_db
#OPTION = 3
USERNAME = test
PASSWORD = test
```
Если выполнить запрос вида:
```
SELECT * FROM odbc('DSN=gregtest;Servername=some-server.com', 'test_db');
```
2018-10-08 10:20:34 +00:00
то ODBC драйвер отправит значения `USERNAME` и `PASSWORD` из `odbc.ini` на `some-server.com` .
2018-10-05 15:19:08 +00:00
2018-09-05 12:37:49 +00:00
### Пример подключения PostgreSQL
2017-10-25 05:27:09 +00:00
О С Ubuntu.
Установка unixODBC и ODBC-драйвера для PostgreSQL: :
sudo apt-get install -y unixodbc odbcinst odbc-postgresql
2018-01-19 14:36:40 +00:00
Настройка `/etc/odbc.ini` (или `~/.odbc.ini` ):
2017-10-25 05:27:09 +00:00
2018-01-19 14:36:40 +00:00
```
2017-10-25 05:27:09 +00:00
[DEFAULT]
Driver = myconnection
[myconnection]
Description = PostgreSQL connection to my_db
Driver = PostgreSQL Unicode
Database = my_db
Servername = 127.0.0.1
UserName = username
Password = password
Port = 5432
Protocol = 9.3
ReadOnly = No
RowVersioning = No
ShowSystemTables = No
ConnSettings =
2018-01-19 14:36:40 +00:00
```
2017-10-25 05:27:09 +00:00
Конфигурация словаря в ClickHouse:
```xml
2018-07-30 14:03:29 +00:00
< yandex >
< dictionary >
< name > table_name< / name >
< source >
< odbc >
<!-- в connection_string можно указывать следующие параметры: -->
<!-- DSN=myconnection;UID=username;PWD=password;HOST=127.0.0.1;PORT=5432;DATABASE=my_db -->
< connection_string > DSN=myconnection< / connection_string >
< table > postgresql_table< / table >
< / odbc >
< / source >
< lifetime >
< min > 300< / min >
< max > 360< / max >
< / lifetime >
< layout >
< hashed / >
< / layout >
< structure >
< id >
< name > id< / name >
< / id >
< attribute >
< name > some_column< / name >
< type > UInt64< / type >
< null_value > 0< / null_value >
< / attribute >
< / structure >
< / dictionary >
< / yandex >
2017-10-25 05:27:09 +00:00
```
Может понадобиться в `odbc.ini` указать полный путь до библиотеки с драйвером `DRIVER=/usr/local/lib/psqlodbcw.so` .
### Пример подключения MS SQL Server
О С Ubuntu.
Установка драйвера: :
```
sudo apt-get install tdsodbc freetds-bin sqsh
```
Настройка драйвера: :
```
2018-10-05 15:19:08 +00:00
$ cat /etc/freetds/freetds.conf
2017-10-25 05:27:09 +00:00
...
[MSSQL]
host = 192.168.56.101
port = 1433
tds version = 7.0
client charset = UTF-8
2018-10-05 15:19:08 +00:00
$ cat /etc/odbcinst.ini
2017-10-25 05:27:09 +00:00
...
[FreeTDS]
Description = FreeTDS
Driver = /usr/lib/x86_64-linux-gnu/odbc/libtdsodbc.so
Setup = /usr/lib/x86_64-linux-gnu/odbc/libtdsS.so
FileUsage = 1
UsageCount = 5
2018-10-05 15:19:08 +00:00
$ cat ~/.odbc.ini
2017-10-25 05:27:09 +00:00
...
[MSSQL]
Description = FreeTDS
Driver = FreeTDS
Servername = MSSQL
Database = test
UID = test
PWD = test
Port = 1433
```
Настройка словаря в ClickHouse:
```xml
2017-11-19 12:07:08 +00:00
< yandex >
2017-10-25 05:27:09 +00:00
< dictionary >
< name > test< / name >
< source >
< odbc >
< table > dict< / table >
< connection_string > DSN=MSSQL;UID=test;PWD=test< / connection_string >
< / odbc >
< / source >
< lifetime >
< min > 300< / min >
< max > 360< / max >
< / lifetime >
< layout >
< flat / >
< / layout >
< structure >
< id >
< name > k< / name >
< / id >
< attribute >
< name > s< / name >
< type > String< / type >
< null_value > < / null_value >
< / attribute >
< / structure >
< / dictionary >
2017-11-19 12:07:08 +00:00
< / yandex >
2017-10-25 05:27:09 +00:00
```
2017-12-11 12:07:26 +00:00
## СУБД
2017-10-25 05:27:09 +00:00
< a name = "dicts-external_dicts_dict_sources-mysql" > < / a >
### MySQL
Пример настройки:
```xml
< source >
< mysql >
< port > 3306< / port >
< user > clickhouse< / user >
< password > qwerty< / password >
< replica >
< host > example01-1< / host >
< priority > 1< / priority >
< / replica >
< replica >
< host > example01-2< / host >
< priority > 1< / priority >
< / replica >
< db > db_name< / db >
< table > table_name< / table >
< where > id=10< / where >
< invalidate_query > SQL_QUERY< / invalidate_query >
< / mysql >
< / source >
```
Поля настройки:
- `port` - порт сервера MySQL. Можно указать для всех реплик или для каждой в отдельности (внутри `<replica>` ).
- `user` - имя пользователя MySQL. Можно указать для всех реплик или для каждой в отдельности (внутри `<replica>` ).
- `password` - пароль пользователя MySQL. Можно указать для всех реплик или для каждой в отдельности (внутри `<replica>` ).
- `replica` - блок конфигурации реплики. Блоков может быть несколько.
- `replica/host` - хост MySQL.
\* `replica/priority` - приоритет реплики. При попытке соединения ClickHouse обходит реплики в соответствии с приоритетом. Чем меньше цифра, тем выше приоритет.
- `db` - имя базы данных.
- `table` - имя таблицы.
- `where` - условие выбора. Необязательный параметр.
2017-11-17 14:12:34 +00:00
- `invalidate_query` - запрос для проверки статуса словаря. Необязательный параметр. Читайте подробнее в разделе [Обновление словарей ](external_dicts_dict_lifetime.md#dicts-external_dicts_dict_lifetime ).
2017-10-25 05:27:09 +00:00
MySQL можно подключить на локальном хосте через сокеты, для этого необходимо задать `host` и `socket` .
Пример настройки:
```xml
< source >
< mysql >
< host > localhost< / host >
< socket > /path/to/socket/file.sock< / socket >
< user > clickhouse< / user >
< password > qwerty< / password >
< db > db_name< / db >
< table > table_name< / table >
< where > id=10< / where >
< invalidate_query > SQL_QUERY< / invalidate_query >
< / mysql >
< / source >
```
< a name = "dicts-external_dicts_dict_sources-clickhouse" > < / a >
### ClickHouse
Пример настройки:
```xml
< source >
< clickhouse >
< host > example01-01-1< / host >
< port > 9000< / port >
< user > default< / user >
< password > < / password >
< db > default< / db >
< table > ids< / table >
< where > id=10< / where >
< / clickhouse >
< / source >
```
Поля настройки:
2018-07-18 10:00:53 +00:00
- `host` - хост ClickHouse. Если host локальный, то запрос выполняется без сетевого взаимодействия. Чтобы повысить отказоустойчивость решения, можно создать таблицу типа [Distributed ](../../operations/table_engines/distributed.md#table_engines-distributed ) и прописать её в дальнейших настройках.
2017-10-25 05:27:09 +00:00
- `port` - порт сервера ClickHouse.
- `user` - имя пользователя ClickHouse.
- `password` - пароль пользователя ClickHouse.
- `db` - имя базы данных.
- `table` - имя таблицы.
- `where` - условие выбора. Может отсутствовать.
2018-09-13 15:18:54 +00:00
- `invalidate_query` - запрос для проверки статуса словаря. Необязательный параметр. Читайте подробнее в разделе [Обновление словарей ](external_dicts_dict_lifetime.md#dicts-external_dicts_dict_lifetime ).
2017-10-25 05:27:09 +00:00
< a name = "dicts-external_dicts_dict_sources-mongodb" > < / a >
### MongoDB
Пример настройки:
```xml
< source >
< mongodb >
< host > localhost< / host >
< port > 27017< / port >
< user > < / user >
< password > < / password >
< db > test< / db >
< collection > dictionary_source< / collection >
< / mongodb >
< / source >
```
Поля настройки:
- `host` - хост MongoDB.
- `port` - порт сервера MongoDB.
- `user` - имя пользователя MongoDB.
- `password` - пароль пользователя MongoDB.
- `db` - имя базы данных.
- `collection` - имя коллекции.
2018-10-16 10:47:17 +00:00
[Оригинальная статья ](https://clickhouse.yandex/docs/ru/query_language/dicts/external_dicts_dict_sources/ ) <!--hide-->