ClickHouse/docs/ru/sql-reference/dictionaries/external-dictionaries/external-dicts-dict-polygon.md

134 lines
7.0 KiB
Markdown
Raw Normal View History

2021-11-17 13:31:01 +00:00
---
sidebar_position: 46
sidebar_label: Cловари полигонов
2021-11-17 13:31:01 +00:00
---
# Cловари полигонов {#polygon-dictionaries}
2020-05-25 22:56:56 +00:00
Словари полигонов позволяют эффективно искать полигон, в который попадают данные точки, среди множества полигонов.
Для примера: определение района города по географическим координатам.
2020-05-20 23:52:18 +00:00
2021-11-17 13:31:01 +00:00
Пример конфигурации словаря полигонов:
``` xml
<dictionary>
<structure>
<key>
<name>key</name>
<type>Array(Array(Array(Array(Float64))))</type>
</key>
<attribute>
<name>name</name>
<type>String</type>
<null_value></null_value>
</attribute>
<attribute>
<name>value</name>
<type>UInt64</type>
<null_value>0</null_value>
</attribute>
</structure>
2020-05-20 23:52:18 +00:00
<layout>
2021-11-17 13:31:01 +00:00
<polygon>
<store_polygon_key_column>1</store_polygon_key_column>
</polygon>
2020-05-20 23:52:18 +00:00
</layout>
2021-11-20 11:28:25 +00:00
...
</dictionary>
```
Соответствущий [DDL-запрос](../../../sql-reference/statements/create/dictionary.md#create-dictionary-query):
``` sql
CREATE DICTIONARY polygon_dict_name (
key Array(Array(Array(Array(Float64)))),
name String,
value UInt64
)
PRIMARY KEY key
2021-11-17 13:31:01 +00:00
LAYOUT(POLYGON(STORE_POLYGON_KEY_COLUMN 1))
...
```
2020-05-25 22:56:56 +00:00
При конфигурации словаря полигонов ключ должен иметь один из двух типов:
2021-11-17 13:31:01 +00:00
2020-05-25 22:56:56 +00:00
- Простой полигон. Представляет из себя массив точек.
- Мультиполигон. Представляет из себя массив полигонов. Каждый полигон задается двумерным массивом точек — первый элемент этого массива задает внешнюю границу полигона,
последующие элементы могут задавать дырки, вырезаемые из него.
2020-05-25 22:56:56 +00:00
Точки могут задаваться массивом или кортежем из своих координат. В текущей реализации поддерживается только двумерные точки.
2020-05-25 22:56:56 +00:00
Пользователь может [загружать свои собственные данные](../../../sql-reference/dictionaries/external-dictionaries/external-dicts-dict-sources.md) во всех поддерживаемых ClickHouse форматах.
2020-07-29 01:32:23 +00:00
Доступно 3 типа [хранения данных в памяти](../../../sql-reference/dictionaries/external-dictionaries/external-dicts-dict-layout.md):
2021-11-17 13:31:01 +00:00
- `POLYGON_SIMPLE`. Это наивная реализация, в которой на каждый запрос делается линейный проход по всем полигонам, и для каждого проверяется принадлежность без использования дополнительных индексов.
2021-11-17 13:31:01 +00:00
- `POLYGON_INDEX_EACH`. Для каждого полигона строится отдельный индекс, который позволяет быстро проверять принадлежность в большинстве случаев (оптимизирован под географические регионы).
2020-05-26 20:12:09 +00:00
Также на рассматриваемую область накладывается сетка, которая значительно сужает количество рассматриваемых полигонов.
Сетка строится рекурсивным делением ячейки на 16 равных частей и конфигурируется двумя параметрами.
2021-11-17 13:31:01 +00:00
Деление прекращается при достижении глубины рекурсии `MAX_DEPTH` или в тот момент, когда ячейку пересекают не более `MIN_INTERSECTIONS` полигонов.
2020-05-26 20:12:09 +00:00
Для ответа на запрос находится соответствующая ячейка, и происходит поочередное обращение к индексу для сохранных в ней полигонов.
2021-11-17 13:31:01 +00:00
- `POLYGON_INDEX_CELL`. В этом размещении также строится сетка, описанная выше. Доступны такие же параметры. Для каждой ячейки-листа строится индекс на всех попадающих в неё кусках полигонов, который позволяет быстро отвечать на запрос.
2021-11-17 13:31:01 +00:00
- `POLYGON`. Синоним к `POLYGON_INDEX_CELL`.
2020-05-25 22:56:56 +00:00
Запросы к словарю осуществляются с помощью стандартных [функций](../../../sql-reference/functions/ext-dict-functions.md) для работы со внешними словарями.
Важным отличием является то, что здесь ключами будут являются точки, для которых хочется найти содержащий их полигон.
2021-11-17 13:31:01 +00:00
**Пример**
2020-05-25 22:56:56 +00:00
Пример работы со словарем, определенным выше:
``` sql
CREATE TABLE points (
x Float64,
y Float64
)
...
SELECT tuple(x, y) AS key, dictGet(dict_name, 'name', key), dictGet(dict_name, 'value', key) FROM points ORDER BY x, y;
```
2020-05-25 22:57:53 +00:00
В результате исполнения последней команды для каждой точки в таблице `points` будет найден полигон минимальной площади, содержащий данную точку, и выведены запрошенные аттрибуты.
2021-11-17 13:31:01 +00:00
**Пример**
Вы можете читать столбцы из полигональных словарей с помощью SELECT, для этого включите `store_polygon_key_column = 1` в конфигурации словаря или соответствующего DDL-запроса.
Запрос:
``` sql
CREATE TABLE polygons_test_table
(
key Array(Array(Array(Tuple(Float64, Float64)))),
name String
) ENGINE = TinyLog;
INSERT INTO polygons_test_table VALUES ([[[(3, 1), (0, 1), (0, -1), (3, -1)]]], 'Value');
CREATE DICTIONARY polygons_test_dictionary
(
key Array(Array(Array(Tuple(Float64, Float64)))),
name String
)
PRIMARY KEY key
SOURCE(CLICKHOUSE(TABLE 'polygons_test_table'))
LAYOUT(POLYGON(STORE_POLYGON_KEY_COLUMN 1))
LIFETIME(0);
SELECT * FROM polygons_test_dictionary;
```
Результат:
``` text
┌─key─────────────────────────────┬─name──┐
│ [[[(3,1),(0,1),(0,-1),(3,-1)]]] │ Value │
└─────────────────────────────────┴───────┘
```