ClickHouse/docs/zh/sql-reference/functions/ym-dict-functions.md

Ignoring revisions in .git-blame-ignore-revs. Click here to bypass and see the normal blame view.

144 lines
7.4 KiB
Markdown
Raw Normal View History

2022-08-26 19:07:59 +00:00
---
slug: /zh/sql-reference/functions/ym-dict-functions
---
# 使用 Yandex.Metrica 字典函数 {#functions-for-working-with-yandex-metrica-dictionaries}
为了使下面的功能正常工作,服务器配置必须指定获取所有 Yandex.Metrica 字典的路径和地址。Yandex.Metrica 字典在任何这些函数的第一次调用时加载。 如果无法加载引用列表,则会引发异常。
2019-05-05 17:38:05 +00:00
有关创建引用列表的信息,请参阅 «字典» 部分.
2019-05-05 17:38:05 +00:00
## 多个地理基 {#multiple-geobases}
2019-05-05 17:38:05 +00:00
ClickHouse支持同时使用多个备选地理基区域层次结构以支持某些地区所属国家的各种观点。
2019-05-05 17:38:05 +00:00
clickhouse-server config指定具有区域层次结构的文件::`<path_to_regions_hierarchy_file>/opt/geo/regions_hierarchy.txt</path_to_regions_hierarchy_file>`
2019-05-05 17:38:05 +00:00
2020-10-13 17:23:29 +00:00
除了这个文件它还搜索附近有_符号和任何后缀附加到名称文件扩展名之前的文件。
例如,它还会找到该文件 `/opt/geo/regions_hierarchy_ua.txt`,如果存在。
2019-05-05 17:38:05 +00:00
`ua` 被称为字典键。 对于没有后缀的字典,键是空字符串。
2019-05-05 17:38:05 +00:00
2020-10-13 17:23:29 +00:00
所有字典都在运行时重新加载每隔一定数量的秒重新加载一次如builtin_dictionaries_reload_interval config参数中定义或默认情况下每小时一次。 但是,可用字典列表在服务器启动时定义一次。
2019-05-05 17:38:05 +00:00
所有处理区域的函数都在末尾有一个可选参数—字典键。它被称为地基。
示例:
2019-05-05 17:38:05 +00:00
regionToCountry(RegionID) 使用默认路径: /opt/geo/regions_hierarchy.txt
regionToCountry(RegionID, '') 使用默认路径: /opt/geo/regions_hierarchy.txt
regionToCountry(RegionID, 'ua') 使用字典中的'ua' 键: /opt/geo/regions_hierarchy_ua.txt
2019-05-05 17:38:05 +00:00
### regionToCity(id[, geobase]) {#regiontocityid-geobase}
2019-05-05 17:38:05 +00:00
从 Yandex geobase 接收一个 UInt32 数字类型的区域ID 。如果该区域是一个城市或城市的一部分它将返回相应城市的区域ID。否则,返回0。
2019-05-05 17:38:05 +00:00
### regionToArea(id[, geobase]) {#regiontoareaid-geobase}
2019-05-05 17:38:05 +00:00
将区域转换为区域地理数据库中的类型5。 在所有其他方式,这个功能是一样的 regionToCity.
2019-05-05 17:38:05 +00:00
``` sql
SELECT DISTINCT regionToName(regionToArea(toUInt32(number), 'ua'))
FROM system.numbers
LIMIT 15
```
┌─regionToName(regionToArea(toUInt32(number), \'ua\'))─┐
│ │
│ Moscow and Moscow region │
│ St. Petersburg and Leningrad region │
│ Belgorod region │
│ Ivanovsk region │
│ Kaluga region │
│ Kostroma region │
│ Kursk region │
│ Lipetsk region │
│ Orlov region │
│ Ryazan region │
│ Smolensk region │
│ Tambov region │
│ Tver region │
│ Tula region │
└──────────────────────────────────────────────────────┘
### regionToDistrict(id\[,geobase\]) {#regiontodistrictid-geobase}
将区域转换为联邦区地理数据库中的类型4。 在所有其他方式,这个功能是一样的 regionToCity.
2019-05-05 17:38:05 +00:00
``` sql
SELECT DISTINCT regionToName(regionToDistrict(toUInt32(number), 'ua'))
FROM system.numbers
LIMIT 15
```
┌─regionToName(regionToDistrict(toUInt32(number), \'ua\'))─┐
│ │
│ Central federal district │
│ Northwest federal district │
│ South federal district │
│ North Caucases federal district │
│ Privolga federal district │
│ Ural federal district │
│ Siberian federal district │
│ Far East federal district │
│ Scotland │
│ Faroe Islands │
│ Flemish region │
│ Brussels capital region │
│ Wallonia │
│ Federation of Bosnia and Herzegovina │
└──────────────────────────────────────────────────────────┘
### regionToCountry(id[, geobase]) {#regiontocountryid-geobase}
将区域转换为国家。 在所有其他方式,这个功能是一样的 regionToCity.
示例: `regionToCountry(toUInt32(213)) = 225` 转换莫斯科213到俄罗斯225
2019-05-05 17:38:05 +00:00
### regionToContinent(id[, geobase]) {#regiontocontinentid-geobase}
2019-05-05 17:38:05 +00:00
将区域转换为大陆。 在所有其他方式,这个功能是一样的 regionToCity.
示例: `regionToContinent(toUInt32(213)) = 10001` 将莫斯科213转换为欧亚大陆10001
2019-05-05 17:38:05 +00:00
### regionToTopContinent (#regiontotopcontinent) {#regiontotopcontinent-regiontotopcontinent}
查找该区域层次结构中最高的大陆。
**语法**
``` sql
regionToTopContinent(id[, geobase])
```
**参数**
- `id` — Yandex geobase 的区域 ID. [UInt32](../../sql-reference/data-types/int-uint.md).
- `geobase` — 字典的建. 参阅 [Multiple Geobases](#multiple-geobases). [String](../../sql-reference/data-types/string.md). 可选.
**返回值**
- 顶级大陆的标识符(当您在区域层次结构中攀爬时,是后者)。
- 0如果没有。
类型: `UInt32`.
### regionToPopulation(id\[, geobase\]) {#regiontopopulationid-geobase}
2019-05-05 17:38:05 +00:00
获取区域的人口。
人口可以记录在文件与地球基。请参阅«外部词典»部分。
如果没有为该区域记录人口则返回0。
在Yandex地理数据库中可能会为子区域记录人口但不会为父区域记录人口。
2019-05-05 17:38:05 +00:00
### regionIn(lhs,rhs\[,地理数据库\]) {#regioninlhs-rhs-geobase}
2019-05-05 17:38:05 +00:00
检查是否 lhs 属于一个区域 rhs 区域。 如果属于UInt8则返回等于1的数字如果不属于则返回0。
这种关系是反射的——任何地区也属于自己。
2019-05-05 17:38:05 +00:00
### regionHierarchy(id\[, geobase\]) {#regionhierarchyid-geobase}
2019-05-05 17:38:05 +00:00
从 Yandex geobase 接收一个 UInt32 数字类型的区域ID。返回一个区域ID数组由传递的区域和链上的所有父节点组成。
示例: `regionHierarchy(toUInt32(213)) = [213,1,3,225,10001,10000]`.
2019-05-05 17:38:05 +00:00
### regionToName(id\[, lang\]) {#regiontonameid-lang}
2019-05-05 17:38:05 +00:00
从 Yandex geobase 接收一个 UInt32 数字类型的区域ID。带有语言名称的字符串可以作为第二个参数传递。支持的语言有:ru, en, ua, uk, by, kz, tr。如果省略第二个参数则使用' ru '语言。如果不支持该语言,则抛出异常。返回一个字符串-对应语言的区域名称。如果指定ID的区域不存在则返回一个空字符串。
2019-05-05 17:38:05 +00:00
`ua``uk` 都意味着乌克兰。