ClickHouse/docs/fr/query_language/functions/url_functions.md
2020-03-30 15:48:55 +03:00

7.4 KiB
Raw Blame History

machine_translated
true

Fonctions pour travailler avec des URL

Toutes ces fonctions ne suivent pas la RFC. Ils sont simplifiés au maximum pour améliorer les performances.

Fonctions qui extraient des parties d'une URL

Si la partie pertinente n'est pas présente dans une URL, une chaîne vide est renvoyée.

protocole

Extrait le protocole d'une URL.

Examples of typical returned values: http, https, ftp, mailto, tel, magnet…

domaine

Extrait le nom d'hôte d'une URL.

domain(url)

Paramètre

L'URL peut être spécifiée avec ou sans schéma. Exemple:

svn+ssh://some.svn-hosting.com:80/repo/trunk
some.svn-hosting.com:80/repo/trunk
https://yandex.com/time/

Pour ces exemples, le domain la fonction renvoie les résultats suivants:

some.svn-hosting.com
some.svn-hosting.com
yandex.com

Valeurs renvoyées

  • Nom d'hôte. Si ClickHouse peut analyser la chaîne d'entrée en tant QU'URL.
  • Chaîne vide. Si ClickHouse ne peut pas analyser la chaîne d'entrée en tant QU'URL.

Type: String.

Exemple

SELECT domain('svn+ssh://some.svn-hosting.com:80/repo/trunk')
┌─domain('svn+ssh://some.svn-hosting.com:80/repo/trunk')─┐
│ some.svn-hosting.com                                   │
└────────────────────────────────────────────────────────┘

domainWithoutWWW

Renvoie le domaine et ne supprime pas plus d'un www. dès le début de celui-ci, si présent.

topLevelDomain

Extrait le domaine de premier niveau d'une URL.

topLevelDomain(url)

Paramètre

L'URL peut être spécifiée avec ou sans schéma. Exemple:

svn+ssh://some.svn-hosting.com:80/repo/trunk
some.svn-hosting.com:80/repo/trunk
https://yandex.com/time/

Valeurs renvoyées

  • Nom de domaine. Si ClickHouse peut analyser la chaîne d'entrée en tant QU'URL.
  • Chaîne vide. Si ClickHouse ne peut pas analyser la chaîne d'entrée en tant QU'URL.

Type: String.

Exemple

SELECT topLevelDomain('svn+ssh://www.some.svn-hosting.com:80/repo/trunk')
┌─topLevelDomain('svn+ssh://www.some.svn-hosting.com:80/repo/trunk')─┐
│ com                                                                │
└────────────────────────────────────────────────────────────────────┘

firstSignificantSubdomain

Renvoie la “first significant subdomain”. C'est un concept non standard spécifique à Yandex.Metrica. Le premier sous-domaine significatif est un domaine de deuxième niveau s'il est com, net, org, ou co. Sinon, il est un domaine de troisième niveau. Exemple, firstSignificantSubdomain (https://news.yandex.ru/) = yandex, firstSignificantSubdomain (https://news.yandex.com.tr/) = yandex. La liste des “insignificant” les domaines de deuxième niveau et d'autres détails de mise en œuvre peuvent changer à l'avenir.

cutToFirstSignificantSubdomain

Renvoie la partie du domaine qui inclut les sous-domaines de premier niveau “first significant subdomain” (voir l'explication ci-dessus).

Exemple, cutToFirstSignificantSubdomain('https://news.yandex.com.tr/') = 'yandex.com.tr'.

chemin

Retourne le chemin d'accès. Exemple: /top/news.html Le chemin n'inclut pas la chaîne de requête.

pathFull

La même chose que ci-dessus, mais y compris la chaîne de requête et le fragment. Exemple: / top / nouvelles.le html?page = 2 # commentaires

queryString

Retourne la chaîne de requête. Exemple: page = 1 & lr=213. query-string n'inclut pas le point d'interrogation initial, ainsi que # et tout ce qui suit #.

fragment

Renvoie l'identificateur de fragment. fragment n'inclut pas le symbole de hachage initial.

queryStringAndFragment

Renvoie la chaîne de requête et l'Identificateur de fragment. Exemple: page = 1 # 29390.

extractURLParameter (URL, nom)

Renvoie la valeur de la name paramètre dans l'URL, le cas échéant. Sinon, une chaîne vide. S'il y a beaucoup de paramètres avec ce nom, il renvoie la première occurrence. Cette fonction fonctionne en supposant que le nom du paramètre est codé dans L'URL exactement de la même manière que dans l'argument passé.

extractURLParameters (URL)

Renvoie un tableau de chaînes name = value correspondant aux paramètres D'URL. Les valeurs ne sont en aucun cas décodées.

extractURLParameterNames (URL)

Retourne un tableau de chaînes de noms correspondant aux noms des paramètres d'URL. Les valeurs ne sont en aucun cas décodées.

URLHierarchy (URL)

Retourne un tableau contenant L'URL, tronquée à la fin par les symboles /,? dans le chemin et la chaîne de requête. Les caractères séparateurs consécutifs sont comptés comme un. La coupe est faite dans la position après tous les caractères de séparation consécutifs.

URLPathHierarchy (URL)

La même chose que ci-dessus, mais sans le protocole et l'hôte dans le résultat. Le / les élément (racine) n'est pas inclus. Exemple: la fonction est utilisée pour implémenter l'arborescence des rapports de L'URL dans Yandex. Métrique.

URLPathHierarchy('https://example.com/browse/CONV-6788') =
[
    '/browse/',
    '/browse/CONV-6788'
]

decodeURLComponent (URL)

Renvoie L'URL décodée. Exemple:

SELECT decodeURLComponent('http://127.0.0.1:8123/?query=SELECT%201%3B') AS DecodedURL;
┌─DecodedURL─────────────────────────────┐
│ http://127.0.0.1:8123/?query=SELECT 1; │
└────────────────────────────────────────┘

Fonctions qui suppriment une partie D'une URL.

Si L'URL n'a rien de similaire, L'URL reste inchangée.

cutWWW

Supprime pas plus d'une www. depuis le début du domaine de L'URL, s'il est présent.

cutQueryString

Supprime la chaîne de requête. Le point d'interrogation est également supprimé.

cutFragment

Supprime l'identificateur de fragment. Le signe est également supprimé.

couperystringandfragment

Supprime la chaîne de requête et l'Identificateur de fragment. Le point d'interrogation et le signe numérique sont également supprimés.

cutURLParameter (URL, nom)

Supprime le name Paramètre URL, si présent. Cette fonction fonctionne en supposant que le nom du paramètre est codé dans L'URL exactement de la même manière que dans l'argument passé.

Article Original