ClickHouse/docs/fr/sql-reference/functions/string-functions.md

490 lines
15 KiB
Markdown
Raw Normal View History

2020-03-30 12:48:55 +00:00
---
machine_translated: true
2020-04-04 09:15:31 +00:00
machine_translated_rev: f865c9653f9df092694258e0ccdd733c339112f5
toc_priority: 40
toc_title: "Travailler avec des cha\xEEnes"
2020-03-30 12:48:55 +00:00
---
# Fonctions Pour Travailler Avec Des chaînes {#functions-for-working-with-strings}
2020-03-30 12:48:55 +00:00
## vide {#empty}
Renvoie 1 pour une chaîne vide ou 0 pour une chaîne non vide.
Le type de résultat est UInt8.
Une chaîne est considérée comme non vide si elle contient au moins un octet, même sil sagit dun espace ou dun octet nul.
2020-03-30 12:48:55 +00:00
La fonction fonctionne également pour les tableaux.
## notEmpty {#notempty}
Renvoie 0 pour une chaîne vide ou 1 pour une chaîne non vide.
Le type de résultat est UInt8.
La fonction fonctionne également pour les tableaux.
## longueur {#length}
Renvoie la longueur dune chaîne en octets (pas en caractères, et pas en points de code).
2020-03-30 12:48:55 +00:00
Le type de résultat est UInt64.
La fonction fonctionne également pour les tableaux.
## lengthUTF8 {#lengthutf8}
Renvoie la longueur dune chaîne en points de code Unicode (pas en caractères), en supposant que la chaîne contient un ensemble doctets qui composent le texte codé en UTF-8. Si cette hypothèse nest pas remplie, elle renvoie un résultat (elle ne lance pas dexception).
2020-03-30 12:48:55 +00:00
Le type de résultat est UInt64.
## char\_length, CHAR\_LENGTH {#char-length}
Renvoie la longueur dune chaîne en points de code Unicode (pas en caractères), en supposant que la chaîne contient un ensemble doctets qui composent le texte codé en UTF-8. Si cette hypothèse nest pas remplie, elle renvoie un résultat (elle ne lance pas dexception).
2020-03-30 12:48:55 +00:00
Le type de résultat est UInt64.
## character\_length, CHARACTER\_LENGTH {#character-length}
Renvoie la longueur dune chaîne en points de code Unicode (pas en caractères), en supposant que la chaîne contient un ensemble doctets qui composent le texte codé en UTF-8. Si cette hypothèse nest pas remplie, elle renvoie un résultat (elle ne lance pas dexception).
2020-03-30 12:48:55 +00:00
Le type de résultat est UInt64.
## plus bas, lcase {#lower}
Convertit les symboles latins ASCII dans une chaîne en minuscules.
## supérieur, ucase {#upper}
Convertit les symboles latins ASCII dans une chaîne en majuscules.
## lowerUTF8 {#lowerutf8}
Convertit une chaîne en minuscules, en supposant que la chaîne de caractères contient un ensemble doctets qui composent un texte UTF-8.
2020-03-30 12:48:55 +00:00
Il ne détecte pas la langue. Donc, pour le turc, le résultat pourrait ne pas être exactement correct.
Si la longueur de la séquence doctets UTF-8 est différente pour les majuscules et les minuscules dun point de code, le résultat peut être incorrect pour ce point de code.
Si la chaîne contient un ensemble doctets qui Nest pas UTF-8, le comportement nest pas défini.
2020-03-30 12:48:55 +00:00
## upperUTF8 {#upperutf8}
Convertit une chaîne en majuscules, en supposant que la chaîne de caractères contient un ensemble doctets qui composent un texte UTF-8.
2020-03-30 12:48:55 +00:00
Il ne détecte pas la langue. Donc, pour le turc, le résultat pourrait ne pas être exactement correct.
Si la longueur de la séquence doctets UTF-8 est différente pour les majuscules et les minuscules dun point de code, le résultat peut être incorrect pour ce point de code.
Si la chaîne contient un ensemble doctets qui Nest pas UTF-8, le comportement nest pas défini.
2020-03-30 12:48:55 +00:00
## isValidUTF8 {#isvalidutf8}
Renvoie 1, si lensemble doctets est codé en UTF-8 valide, sinon 0.
2020-03-30 12:48:55 +00:00
## toValidUTF8 {#tovalidutf8}
Remplace les caractères UTF-8 non valides par `<60>` (U+FFFD) caractère. Tous les caractères non valides sexécutant dans une rangée sont réduits en un seul caractère de remplacement.
2020-03-30 12:48:55 +00:00
``` sql
toValidUTF8( input_string )
```
Paramètre:
- input\_string — Any set of bytes represented as the [Chaîne](../../sql-reference/data-types/string.md) type de données objet.
2020-03-30 12:48:55 +00:00
Valeur renvoyée: chaîne UTF-8 valide.
**Exemple**
``` sql
SELECT toValidUTF8('\x61\xF0\x80\x80\x80b')
```
``` text
┌─toValidUTF8('a<><61><EFBFBD><EFBFBD>b')─┐
│ a<>b │
└───────────────────────┘
```
## répéter {#repeat}
Répète une corde autant de fois que spécifié et concatène les valeurs répliquées comme une seule chaîne.
**Syntaxe**
``` sql
repeat(s, n)
```
**Paramètre**
- `s` — The string to repeat. [Chaîne](../../sql-reference/data-types/string.md).
- `n` — The number of times to repeat the string. [UInt](../../sql-reference/data-types/int-uint.md).
2020-03-30 12:48:55 +00:00
**Valeur renvoyée**
La chaîne unique, qui contient la chaîne `s` répéter `n` temps. Si `n` \< 1, la fonction renvoie une chaîne vide.
Type: `String`.
**Exemple**
Requête:
``` sql
SELECT repeat('abc', 10)
```
Résultat:
``` text
┌─repeat('abc', 10)──────────────┐
│ abcabcabcabcabcabcabcabcabcabc │
└────────────────────────────────┘
```
## inverser {#reverse}
Inverse la chaîne (comme une séquence doctets).
2020-03-30 12:48:55 +00:00
## reverseUTF8 {#reverseutf8}
Inverse une séquence de points de code Unicode, en supposant que la chaîne contient un ensemble doctets représentant un texte UTF-8. Sinon, il fait autre chose (il ne lance pas dexception).
2020-03-30 12:48:55 +00:00
## format(pattern, s0, s1, …) {#format}
Formatage du motif constant avec la chaîne listée dans les arguments. `pattern` est un modèle de format Python simplifié. Chaîne de Format contient “replacement fields” entouré par des accolades `{}`. Tout ce qui nest pas contenu dans les accolades est considéré comme du texte littéral, qui est copié inchangé dans la sortie. Si vous devez inclure un caractère dAccolade dans le texte littéral, il peut être échappé en doublant: `{{ '{{' }}` et `{{ '}}' }}`. Les noms de champs peuvent être des nombres (à partir de zéro) ou vides (ils sont alors traités comme des nombres de conséquence).
2020-03-30 12:48:55 +00:00
``` sql
SELECT format('{1} {0} {1}', 'World', 'Hello')
```
``` text
┌─format('{1} {0} {1}', 'World', 'Hello')─┐
│ Hello World Hello │
└─────────────────────────────────────────┘
```
``` sql
SELECT format('{} {}', 'Hello', 'World')
```
``` text
┌─format('{} {}', 'Hello', 'World')─┐
│ Hello World │
└───────────────────────────────────┘
```
## concat {#concat}
Concatène les chaînes répertoriées dans les arguments, sans séparateur.
**Syntaxe**
``` sql
concat(s1, s2, ...)
```
**Paramètre**
Valeurs de type String ou FixedString.
**Valeurs renvoyées**
Renvoie la chaîne qui résulte de la concaténation des arguments.
Si lune des valeurs dargument est `NULL`, `concat` retourner `NULL`.
2020-03-30 12:48:55 +00:00
**Exemple**
Requête:
``` sql
SELECT concat('Hello, ', 'World!')
```
Résultat:
``` text
┌─concat('Hello, ', 'World!')─┐
│ Hello, World! │
└─────────────────────────────┘
```
## concatAssumeInjective {#concatassumeinjective}
Même que [concat](#concat) la différence est que vous devez vous assurer que `concat(s1, s2, ...) → sn` est injectif, il sera utilisé pour loptimisation du groupe par.
2020-03-30 12:48:55 +00:00
La fonction est nommée “injective” si elle renvoie toujours un résultat différent pour différentes valeurs darguments. En dautres termes: des arguments différents ne donnent jamais un résultat identique.
2020-03-30 12:48:55 +00:00
**Syntaxe**
``` sql
concatAssumeInjective(s1, s2, ...)
```
**Paramètre**
Valeurs de type String ou FixedString.
**Valeurs renvoyées**
Renvoie la chaîne qui résulte de la concaténation des arguments.
Si lune des valeurs dargument est `NULL`, `concatAssumeInjective` retourner `NULL`.
2020-03-30 12:48:55 +00:00
**Exemple**
Table dentrée:
2020-03-30 12:48:55 +00:00
``` sql
CREATE TABLE key_val(`key1` String, `key2` String, `value` UInt32) ENGINE = TinyLog;
INSERT INTO key_val VALUES ('Hello, ','World',1), ('Hello, ','World',2), ('Hello, ','World!',3), ('Hello',', World!',2);
SELECT * from key_val;
```
``` text
┌─key1────┬─key2─────┬─value─┐
│ Hello, │ World │ 1 │
│ Hello, │ World │ 2 │
│ Hello, │ World! │ 3 │
│ Hello │ , World! │ 2 │
└─────────┴──────────┴───────┘
```
Requête:
``` sql
SELECT concat(key1, key2), sum(value) FROM key_val GROUP BY concatAssumeInjective(key1, key2)
```
Résultat:
``` text
┌─concat(key1, key2)─┬─sum(value)─┐
│ Hello, World! │ 3 │
│ Hello, World! │ 2 │
│ Hello, World │ 3 │
└────────────────────┴────────────┘
```
## substring(s, offset, longueur), mid(s, offset, longueur), substr(s, offset, longueur) {#substring}
Renvoie une sous-chaîne commençant par loctet du offset index length octets de long. Lindexation des caractères commence à partir dun (comme dans SQL standard). Le offset et length les arguments doivent être des constantes.
2020-03-30 12:48:55 +00:00
## substringUTF8(s, offset, longueur) {#substringutf8}
Le même que substring, mais pour les points de code Unicode. Fonctionne sous lhypothèse que la chaîne contient un ensemble doctets représentant un texte codé en UTF-8. Si cette hypothèse nest pas remplie, elle renvoie un résultat (elle ne lance pas dexception).
2020-03-30 12:48:55 +00:00
## appendTrailingCharIfAbsent (s, c) {#appendtrailingcharifabsent}
Si l s la chaîne nest pas vide et ne contient pas c personnage à la fin, il ajoute le c personnage à la fin.
2020-03-30 12:48:55 +00:00
## convertCharset(s, à partir de, à) {#convertcharset}
Retourne une chaîne de caractères s qui a été converti à partir de lencodage dans from pour lencodage dans to.
2020-03-30 12:48:55 +00:00
## base64Encode(s) {#base64encode}
Encodage s chaîne dans base64
## base64Decode(s) {#base64decode}
Décoder la chaîne codée en base64 s dans la chaîne dorigine. En cas déchec, une exception est levée.
2020-03-30 12:48:55 +00:00
## tryBase64Decode(s) {#trybase64decode}
Semblable à base64Decode, mais en cas derreur, une chaîne vide serait renvoyé.
2020-03-30 12:48:55 +00:00
## endsWith (s, suffixe) {#endswith}
Renvoie sil faut se terminer par le suffixe spécifié. Retourne 1 si la chaîne se termine par le suffixe spécifié, sinon elle renvoie 0.
2020-03-30 12:48:55 +00:00
## startsWith (STR, préfixe) {#startswith}
Retourne 1 si la chaîne commence par le préfixe spécifié, sinon elle renvoie 0.
``` sql
SELECT startsWith('Spider-Man', 'Spi');
```
**Valeurs renvoyées**
- 1, si la chaîne commence par le préfixe spécifié.
- 0, si la chaîne ne commence pas par le préfixe spécifié.
**Exemple**
Requête:
``` sql
SELECT startsWith('Hello, world!', 'He');
```
Résultat:
``` text
┌─startsWith('Hello, world!', 'He')─┐
│ 1 │
└───────────────────────────────────┘
```
## coupe {#trim}
Supprime tous les caractères spécifiés du début ou de la fin dune chaîne.
Par défaut supprime toutes les occurrences consécutives despaces communs (caractère ASCII 32) des deux extrémités dune chaîne.
2020-03-30 12:48:55 +00:00
**Syntaxe**
``` sql
trim([[LEADING|TRAILING|BOTH] trim_character FROM] input_string)
```
**Paramètre**
- `trim_character` — specified characters for trim. [Chaîne](../../sql-reference/data-types/string.md).
- `input_string` — string for trim. [Chaîne](../../sql-reference/data-types/string.md).
2020-03-30 12:48:55 +00:00
**Valeur renvoyée**
Une chaîne sans caractères de début et (ou) de fin spécifiés.
Type: `String`.
**Exemple**
Requête:
``` sql
SELECT trim(BOTH ' ()' FROM '( Hello, world! )')
```
Résultat:
``` text
┌─trim(BOTH ' ()' FROM '( Hello, world! )')─┐
│ Hello, world! │
└───────────────────────────────────────────────┘
```
## trimLeft {#trimleft}
Supprime toutes les occurrences consécutives despaces communs (caractère ASCII 32) depuis le début dune chaîne. Il ne supprime pas dautres types de caractères despaces (tabulation, espace sans pause, etc.).
2020-03-30 12:48:55 +00:00
**Syntaxe**
``` sql
trimLeft(input_string)
```
Alias: `ltrim(input_string)`.
**Paramètre**
- `input_string` — string to trim. [Chaîne](../../sql-reference/data-types/string.md).
2020-03-30 12:48:55 +00:00
**Valeur renvoyée**
Une chaîne sans ouvrir les espaces communs.
Type: `String`.
**Exemple**
Requête:
``` sql
SELECT trimLeft(' Hello, world! ')
```
Résultat:
``` text
┌─trimLeft(' Hello, world! ')─┐
│ Hello, world! │
└─────────────────────────────────────┘
```
## trimRight {#trimright}
Supprime toutes les occurrences consécutives despaces communs (caractère ASCII 32) de la fin dune chaîne. Il ne supprime pas dautres types de caractères despaces (tabulation, espace sans pause, etc.).
2020-03-30 12:48:55 +00:00
**Syntaxe**
``` sql
trimRight(input_string)
```
Alias: `rtrim(input_string)`.
**Paramètre**
- `input_string` — string to trim. [Chaîne](../../sql-reference/data-types/string.md).
2020-03-30 12:48:55 +00:00
**Valeur renvoyée**
Une chaîne sans espaces communs de fin.
Type: `String`.
**Exemple**
Requête:
``` sql
SELECT trimRight(' Hello, world! ')
```
Résultat:
``` text
┌─trimRight(' Hello, world! ')─┐
│ Hello, world! │
└──────────────────────────────────────┘
```
## trimBoth {#trimboth}
Supprime toutes les occurrences consécutives despaces communs (caractère ASCII 32) des deux extrémités dune chaîne. Il ne supprime pas dautres types de caractères despaces (tabulation, espace sans pause, etc.).
2020-03-30 12:48:55 +00:00
**Syntaxe**
``` sql
trimBoth(input_string)
```
Alias: `trim(input_string)`.
**Paramètre**
- `input_string` — string to trim. [Chaîne](../../sql-reference/data-types/string.md).
2020-03-30 12:48:55 +00:00
**Valeur renvoyée**
Une chaîne sans espaces communs de début et de fin.
Type: `String`.
**Exemple**
Requête:
``` sql
SELECT trimBoth(' Hello, world! ')
```
Résultat:
``` text
┌─trimBoth(' Hello, world! ')─┐
│ Hello, world! │
└─────────────────────────────────────┘
```
## CRC32 (s) {#crc32}
Renvoie la somme de contrôle CRC32 dune chaîne, en utilisant le polynôme CRC-32-IEEE 802.3 et la valeur initiale `0xffffffff` (zlib mise en œuvre).
2020-03-30 12:48:55 +00:00
Le type de résultat est UInt32.
## CRC32IEEE (s) {#crc32ieee}
Renvoie la somme de contrôle CRC32 dune chaîne, en utilisant le polynôme CRC-32-IEEE 802.3.
2020-03-30 12:48:55 +00:00
Le type de résultat est UInt32.
## CRC64 (s) {#crc64}
Renvoie la somme de contrôle CRC64 dune chaîne, en utilisant le polynôme CRC-64-ECMA.
2020-03-30 12:48:55 +00:00
Le type de résultat est UInt64.
[Article Original](https://clickhouse.tech/docs/en/query_language/functions/string_functions/) <!--hide-->