mirror of
https://github.com/ClickHouse/ClickHouse.git
synced 2024-10-01 22:20:50 +00:00
119 lines
6.1 KiB
ReStructuredText
119 lines
6.1 KiB
ReStructuredText
|
Функции для работы с URL
|
|||
|
------------------------
|
|||
|
|
|||
|
Все функции работают не по RFC - то есть, максимально упрощены ради производительности.
|
|||
|
|
|||
|
Функции, извлекающие часть URL-а.
|
|||
|
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
|
|||
|
Если в URL-е нет ничего похожего, то возвращается пустая строка.
|
|||
|
|
|||
|
protocol
|
|||
|
""""""""
|
|||
|
Возвращает протокол. Примеры: http, ftp, mailto, magnet...
|
|||
|
|
|||
|
domain
|
|||
|
"""""""
|
|||
|
Возвращает домен.
|
|||
|
|
|||
|
domainWithoutWWW
|
|||
|
""""""""""""
|
|||
|
Возвращает домен, удалив не более одного 'www.' с начала, если есть.
|
|||
|
|
|||
|
topLevelDomain
|
|||
|
"""""""""""
|
|||
|
Возвращает домен верхнего уровня. Пример: .ru.
|
|||
|
|
|||
|
firstSignificantSubdomain
|
|||
|
""""""""""""""
|
|||
|
Возвращает "первый существенный поддомен". Это понятие является нестандартным и специфично для Яндекс.Метрики. Первый существенный поддомен - это домен второго уровня, если он не равен одному из com, net, org, co, или домен третьего уровня, иначе. Например, firstSignificantSubdomain('https://news.yandex.ru/') = 'yandex', firstSignificantSubdomain('https://news.yandex.com.tr/') = 'yandex'. Список "несущественных" доменов второго уровня и другие детали реализации могут изменяться в будущем.
|
|||
|
|
|||
|
cutToFirstSignificantSubdomain
|
|||
|
""""""""""""""""
|
|||
|
Возвращает часть домена, включающую поддомены верхнего уровня до "первого существенного поддомена" (см. выше).
|
|||
|
|
|||
|
Например, ``cutToFirstSignificantSubdomain('https://news.yandex.com.tr/') = 'yandex.com.tr'``.
|
|||
|
|
|||
|
path
|
|||
|
""""
|
|||
|
Возвращает путь. Пример: ``/top/news.html`` Путь не включает в себя query string.
|
|||
|
|
|||
|
pathFull
|
|||
|
"""""""
|
|||
|
То же самое, но включая query string и fragment. Пример: /top/news.html?page=2#comments
|
|||
|
|
|||
|
queryString
|
|||
|
"""""""""
|
|||
|
Возвращает query-string. Пример: page=1&lr=213. query-string не включает в себя начальный знак вопроса, а также # и всё, что после #.
|
|||
|
|
|||
|
fragment
|
|||
|
""""""
|
|||
|
Возвращает fragment identifier. fragment не включает в себя начальный символ решётки.
|
|||
|
|
|||
|
queryStringAndFragment
|
|||
|
"""""""""
|
|||
|
Возвращает query string и fragment identifier. Пример: страница=1#29390.
|
|||
|
|
|||
|
extractURLParameter(URL, name)
|
|||
|
"""""""""
|
|||
|
Возвращает значение параметра name в URL, если такой есть; или пустую строку, иначе; если параметров с таким именем много - вернуть первый попавшийся. Функция работает при допущении, что имя параметра закодировано в URL в точности таким же образом, что и в переданном аргументе.
|
|||
|
|
|||
|
extractURLParameters(URL)
|
|||
|
""""""""""
|
|||
|
Возвращает массив строк вида name=value, соответствующих параметрам URL. Значения никак не декодируются.
|
|||
|
|
|||
|
extractURLParameterNames(URL)
|
|||
|
""""""""
|
|||
|
Возвращает массив строк вида name, соответствующих именам параметров URL. Значения никак не декодируются.
|
|||
|
|
|||
|
URLHierarchy(URL)
|
|||
|
"""""""""
|
|||
|
Возвращает массив, содержащий URL, обрезанный с конца по символам /, ? в пути и query-string. Подряд идущие символы-разделители считаются за один. Резка производится в позиции после всех подряд идущих символов-разделителей. Пример:
|
|||
|
|
|||
|
URLPathHierarchy(URL)
|
|||
|
""""""""
|
|||
|
То же самое, но без протокола и хоста в результате. Элемент / (корень) не включается. Пример:
|
|||
|
Функция используется для реализации древовидных отчётов по URL в Яндекс.Метрике.
|
|||
|
::
|
|||
|
URLPathHierarchy('https://example.com/browse/CONV-6788') =
|
|||
|
[
|
|||
|
'/browse/',
|
|||
|
'/browse/CONV-6788'
|
|||
|
]
|
|||
|
|
|||
|
decodeURLComponent(URL)
|
|||
|
"""""""""""
|
|||
|
Возвращает декодированный URL.
|
|||
|
Пример:
|
|||
|
|
|||
|
.. code-block:: sql
|
|||
|
|
|||
|
:) SELECT decodeURLComponent('http://127.0.0.1:8123/?query=SELECT%201%3B') AS DecodedURL;
|
|||
|
|
|||
|
┌─DecodedURL─────────────────────────────┐
|
|||
|
│ http://127.0.0.1:8123/?query=SELECT 1; │
|
|||
|
└────────────────────────────────────────┘
|
|||
|
|
|||
|
Функции, удаляющие часть из URL-а.
|
|||
|
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
|
|||
|
Если в URL-е нет ничего похожего, то URL остаётся без изменений.
|
|||
|
|
|||
|
cutWWW
|
|||
|
"""""
|
|||
|
Удаляет не более одного 'www.' с начала домена URL-а, если есть.
|
|||
|
|
|||
|
cutQueryString
|
|||
|
""""""
|
|||
|
Удаляет query string. Знак вопроса тоже удаляется.
|
|||
|
|
|||
|
cutFragment
|
|||
|
""""""""
|
|||
|
Удаляет fragment identifier. Символ решётки тоже удаляется.
|
|||
|
|
|||
|
cutQueryStringAndFragment
|
|||
|
""""""""""
|
|||
|
Удаляет query string и fragment identifier. Знак вопроса и символ решётки тоже удаляются.
|
|||
|
|
|||
|
cutURLParameter(URL, name)
|
|||
|
""""""""""
|
|||
|
Удаляет параметр URL с именем name, если такой есть. Функция работает при допущении, что имя параметра закодировано в URL в точности таким же образом, что и в переданном аргументе.
|