ClickHouse/docs/zh/sql-reference/functions/ym-dict-functions.md

121 lines
7.3 KiB
Markdown
Raw Normal View History

# 功能与Yandex的工作。梅特里卡词典 {#functions-for-working-with-yandex-metrica-dictionaries}
为了使下面的功能正常工作服务器配置必须指定获取所有Yandex的路径和地址。梅特里卡字典. 字典在任何这些函数的第一次调用时加载。 如果无法加载引用列表,则会引发异常。
2019-05-05 17:38:05 +00:00
For information about creating reference lists, see the section «Dictionaries».
2019-05-05 17:38:05 +00:00
## 多个地理基 {#multiple-geobases}
2019-05-05 17:38:05 +00:00
ClickHouse支持同时使用多个备选地理基区域层次结构以支持某些地区所属国家的各种观点。
2019-05-05 17:38:05 +00:00
clickhouse-server config指定具有区域层次结构的文件::`<path_to_regions_hierarchy_file>/opt/geo/regions_hierarchy.txt</path_to_regions_hierarchy_file>`
2019-05-05 17:38:05 +00:00
2020-10-13 17:23:29 +00:00
除了这个文件它还搜索附近有_符号和任何后缀附加到名称文件扩展名之前的文件。
例如,它还会找到该文件 `/opt/geo/regions_hierarchy_ua.txt`,如果存在。
2019-05-05 17:38:05 +00:00
`ua` 被称为字典键。 对于没有后缀的字典,键是空字符串。
2019-05-05 17:38:05 +00:00
2020-10-13 17:23:29 +00:00
所有字典都在运行时重新加载每隔一定数量的秒重新加载一次如builtin_dictionaries_reload_interval config参数中定义或默认情况下每小时一次。 但是,可用字典列表在服务器启动时定义一次。
2019-05-05 17:38:05 +00:00
All functions for working with regions have an optional argument at the end the dictionary key. It is referred to as the geobase.
示例:
2019-05-05 17:38:05 +00:00
regionToCountry(RegionID) Uses the default dictionary: /opt/geo/regions_hierarchy.txt
regionToCountry(RegionID, '') Uses the default dictionary: /opt/geo/regions_hierarchy.txt
regionToCountry(RegionID, 'ua') Uses the dictionary for the 'ua' key: /opt/geo/regions_hierarchy_ua.txt
2019-05-05 17:38:05 +00:00
### ツ环板(ョツ嘉ッツ偲青regionシツ氾カツ鉄ツ工ツ渉\]) {#regiontocityid-geobase}
2019-05-05 17:38:05 +00:00
Accepts a UInt32 number the region ID from the Yandex geobase. If this region is a city or part of a city, it returns the region ID for the appropriate city. Otherwise, returns 0.
### 虏茅驴麓卤戮碌禄路戮鲁拢\]) {#regiontoareaid-geobase}
2019-05-05 17:38:05 +00:00
将区域转换为区域地理数据库中的类型5。 在所有其他方式,这个功能是一样的 regionToCity.
2019-05-05 17:38:05 +00:00
``` sql
SELECT DISTINCT regionToName(regionToArea(toUInt32(number), 'ua'))
FROM system.numbers
LIMIT 15
```
┌─regionToName(regionToArea(toUInt32(number), \'ua\'))─┐
│ │
│ Moscow and Moscow region │
│ St. Petersburg and Leningrad region │
│ Belgorod region │
│ Ivanovsk region │
│ Kaluga region │
│ Kostroma region │
│ Kursk region │
│ Lipetsk region │
│ Orlov region │
│ Ryazan region │
│ Smolensk region │
│ Tambov region │
│ Tver region │
│ Tula region │
└──────────────────────────────────────────────────────┘
### regionToDistrict(id\[,geobase\]) {#regiontodistrictid-geobase}
将区域转换为联邦区地理数据库中的类型4。 在所有其他方式,这个功能是一样的 regionToCity.
2019-05-05 17:38:05 +00:00
``` sql
SELECT DISTINCT regionToName(regionToDistrict(toUInt32(number), 'ua'))
FROM system.numbers
LIMIT 15
```
┌─regionToName(regionToDistrict(toUInt32(number), \'ua\'))─┐
│ │
│ Central federal district │
│ Northwest federal district │
│ South federal district │
│ North Caucases federal district │
│ Privolga federal district │
│ Ural federal district │
│ Siberian federal district │
│ Far East federal district │
│ Scotland │
│ Faroe Islands │
│ Flemish region │
│ Brussels capital region │
│ Wallonia │
│ Federation of Bosnia and Herzegovina │
└──────────────────────────────────────────────────────────┘
### 虏茅驴麓卤戮碌禄路戮鲁拢(陆毛隆隆(803)888-8325\]) {#regiontocountryid-geobase}
将区域转换为国家。 在所有其他方式,这个功能是一样的 regionToCity.
示例: `regionToCountry(toUInt32(213)) = 225` 转换莫斯科213到俄罗斯225
2019-05-05 17:38:05 +00:00
### 掳胫((禄脢鹿脷露胫鲁隆鹿((酶-11-16""\[脪陆,ase\]) {#regiontocontinentid-geobase}
2019-05-05 17:38:05 +00:00
将区域转换为大陆。 在所有其他方式,这个功能是一样的 regionToCity.
示例: `regionToContinent(toUInt32(213)) = 10001` 将莫斯科213转换为欧亚大陆10001
2019-05-05 17:38:05 +00:00
### ツ环板(ョツ嘉ッツ偲青regionャツ静ャツ青サツ催ャツ渉\]) {#regiontopopulationid-geobase}
2019-05-05 17:38:05 +00:00
获取区域的人口。
The population can be recorded in files with the geobase. See the section «External dictionaries».
如果没有为该区域记录人口则返回0。
在Yandex地理数据库中可能会为子区域记录人口但不会为父区域记录人口。
2019-05-05 17:38:05 +00:00
### regionIn(lhs,rhs\[,地理数据库\]) {#regioninlhs-rhs-geobase}
2019-05-05 17:38:05 +00:00
检查是否 lhs 属于一个区域 rhs 区域。 如果属于UInt8则返回等于1的数字如果不属于则返回0。
2019-05-05 17:38:05 +00:00
The relationship is reflexive any region also belongs to itself.
### ツ暗ェツ氾环催ツ団ツ法ツ人\]) {#regionhierarchyid-geobase}
2019-05-05 17:38:05 +00:00
Accepts a UInt32 number the region ID from the Yandex geobase. Returns an array of region IDs consisting of the passed region and all parents along the chain.
示例: `regionHierarchy(toUInt32(213)) = [213,1,3,225,10001,10000]`.
2019-05-05 17:38:05 +00:00
### 地区名称(id\[,郎\]) {#regiontonameid-lang}
2019-05-05 17:38:05 +00:00
Accepts a UInt32 number the region ID from the Yandex geobase. A string with the name of the language can be passed as a second argument. Supported languages are: ru, en, ua, uk, by, kz, tr. If the second argument is omitted, the language ru is used. If the language is not supported, an exception is thrown. Returns a string the name of the region in the corresponding language. If the region with the specified ID doesnt exist, an empty string is returned.
2019-05-05 17:38:05 +00:00
`ua``uk` 都意味着乌克兰。
2019-05-05 17:38:05 +00:00
[原始文章](https://clickhouse.tech/docs/en/query_language/functions/ym_dict_functions/) <!--hide-->