mirror of
https://github.com/ClickHouse/ClickHouse.git
synced 2024-12-18 20:32:43 +00:00
0a4a5b36cc
* Additional .gitignore entries * Merge a bunch of small articles about system tables into single one * Merge a bunch of small articles about formats into single one * Adapt table with formats to English docs too * Add SPb meetup link to main page * Move Utilities out of top level of docs (the location is probably not yet final) + translate couple articles * Merge MacOS.md into build_osx.md * Move Data types higher in ToC * Publish changelog on website alongside documentation * Few fixes for en/table_engines/file.md * Use smaller header sizes in changelogs * Group up table engines inside ToC * Move table engines out of top level too * Specificy in ToC that query language is SQL based. Thats a bit excessive, but catches eye. * Move stuff that is part of query language into respective folder * Move table functions lower in ToC * Lost redirects.txt update * Do not rely on comments in yaml + fix few ru titles * Extract major parts of queries.md into separate articles * queries.md has been supposed to be removed * Fix weird translation * Fix a bunch of links * There is only table of contents left * "Query language" is actually part of SQL abbreviation * Change filename in README.md too * fix mistype
100 lines
5.9 KiB
Markdown
100 lines
5.9 KiB
Markdown
# Функции для работы с URL
|
||
|
||
Все функции работают не по RFC - то есть, максимально упрощены ради производительности.
|
||
|
||
## Функции, извлекающие часть URL-а.
|
||
|
||
Если в URL-е нет ничего похожего, то возвращается пустая строка.
|
||
|
||
### protocol
|
||
Возвращает протокол. Примеры: http, ftp, mailto, magnet...
|
||
|
||
### domain
|
||
Возвращает домен.
|
||
|
||
### domainWithoutWWW
|
||
Возвращает домен, удалив не более одного 'www.' с начала, если есть.
|
||
|
||
### topLevelDomain
|
||
Возвращает домен верхнего уровня. Пример: .ru.
|
||
|
||
### firstSignificantSubdomain
|
||
Возвращает "первый существенный поддомен". Это понятие является нестандартным и специфично для Яндекс.Метрики. Первый существенный поддомен - это домен второго уровня, если он не равен одному из com, net, org, co, или домен третьего уровня, иначе. Например, firstSignificantSubdomain('<https://news.yandex.ru/>') = 'yandex', firstSignificantSubdomain('<https://news.yandex.com.tr/>') = 'yandex'. Список "несущественных" доменов второго уровня и другие детали реализации могут изменяться в будущем.
|
||
|
||
### cutToFirstSignificantSubdomain
|
||
Возвращает часть домена, включающую поддомены верхнего уровня до "первого существенного поддомена" (см. выше).
|
||
|
||
Например, `cutToFirstSignificantSubdomain('https://news.yandex.com.tr/') = 'yandex.com.tr'`.
|
||
|
||
### path
|
||
Возвращает путь. Пример: `/top/news.html` Путь не включает в себя query string.
|
||
|
||
### pathFull
|
||
То же самое, но включая query string и fragment. Пример: /top/news.html?page=2\#comments
|
||
|
||
### queryString
|
||
Возвращает query-string. Пример: page=1&lr=213. query-string не включает в себя начальный знак вопроса, а также \# и всё, что после \#.
|
||
|
||
### fragment
|
||
Возвращает fragment identifier. fragment не включает в себя начальный символ решётки.
|
||
|
||
### queryStringAndFragment
|
||
Возвращает query string и fragment identifier. Пример: страница=1\#29390.
|
||
|
||
### extractURLParameter(URL, name)
|
||
Возвращает значение параметра name в URL, если такой есть; или пустую строку, иначе; если параметров с таким именем много - вернуть первый попавшийся. Функция работает при допущении, что имя параметра закодировано в URL в точности таким же образом, что и в переданном аргументе.
|
||
|
||
### extractURLParameters(URL)
|
||
Возвращает массив строк вида name=value, соответствующих параметрам URL. Значения никак не декодируются.
|
||
|
||
### extractURLParameterNames(URL)
|
||
Возвращает массив строк вида name, соответствующих именам параметров URL. Значения никак не декодируются.
|
||
|
||
### URLHierarchy(URL)
|
||
Возвращает массив, содержащий URL, обрезанный с конца по символам /, ? в пути и query-string. Подряд идущие символы-разделители считаются за один. Резка производится в позиции после всех подряд идущих символов-разделителей. Пример:
|
||
|
||
### URLPathHierarchy(URL)
|
||
То же самое, но без протокола и хоста в результате. Элемент / (корень) не включается. Пример:
|
||
Функция используется для реализации древовидных отчётов по URL в Яндекс.Метрике.
|
||
|
||
```text
|
||
URLPathHierarchy('https://example.com/browse/CONV-6788') =
|
||
[
|
||
'/browse/',
|
||
'/browse/CONV-6788'
|
||
]
|
||
```
|
||
|
||
### decodeURLComponent(URL)
|
||
Возвращает декодированный URL.
|
||
Пример:
|
||
|
||
```sql
|
||
SELECT decodeURLComponent('http://127.0.0.1:8123/?query=SELECT%201%3B') AS DecodedURL;
|
||
```
|
||
|
||
```text
|
||
┌─DecodedURL─────────────────────────────┐
|
||
│ http://127.0.0.1:8123/?query=SELECT 1; │
|
||
└────────────────────────────────────────┘
|
||
```
|
||
|
||
## Функции, удаляющие часть из URL-а
|
||
|
||
Если в URL-е нет ничего похожего, то URL остаётся без изменений.
|
||
|
||
### cutWWW
|
||
Удаляет не более одного 'www.' с начала домена URL-а, если есть.
|
||
|
||
### cutQueryString
|
||
Удаляет query string. Знак вопроса тоже удаляется.
|
||
|
||
### cutFragment
|
||
Удаляет fragment identifier. Символ решётки тоже удаляется.
|
||
|
||
### cutQueryStringAndFragment
|
||
Удаляет query string и fragment identifier. Знак вопроса и символ решётки тоже удаляются.
|
||
|
||
### cutURLParameter(URL, name)
|
||
Удаляет параметр URL с именем name, если такой есть. Функция работает при допущении, что имя параметра закодировано в URL в точности таким же образом, что и в переданном аргументе.
|