ClickHouse/docs/ru/sql-reference/functions/string-functions.md

---
slug: /ru/sql-reference/functions/string-functions
sidebar_position: 40
sidebar_label: "Функции для работы со строками"
---

# Функции для работы со строками {#funktsii-dlia-raboty-so-strokami}

## empty {#empty}

Проверяет, является ли входная строка пустой.

**Синтаксис**

``` sql
empty(x)
```

Строка считается непустой, если содержит хотя бы один байт, пусть даже это пробел или нулевой байт.

Функция также поддерживает работу с типами [Array](array-functions.md#function-empty) и [UUID](uuid-functions.md#empty).

**Параметры**

-   `x` — Входная строка. [String](../data-types/string.md).

**Возвращаемое значение**

-   Возвращает `1` для пустой строки и `0` — для непустой строки.

Тип: [UInt8](../data-types/int-uint.md).

**Пример**

Запрос:

```sql
SELECT empty('text');
```

Результат:

```text
┌─empty('text')─┐
│             0 │
└───────────────┘
```

## notEmpty {#notempty}

Проверяет, является ли входная строка непустой.

**Синтаксис**

``` sql
notEmpty(x)
```

Строка считается непустой, если содержит хотя бы один байт, пусть даже это пробел или нулевой байт.

Функция также поддерживает работу с типами [Array](array-functions.md#function-notempty) и [UUID](uuid-functions.md#notempty).

**Параметры**

-   `x` — Входная строка. [String](../data-types/string.md).

**Возвращаемое значение**

-   Возвращает `1` для непустой строки и `0` — для пустой строки.

Тип: [UInt8](../data-types/int-uint.md).

**Пример**

Запрос:

```sql
SELECT notEmpty('text');
```

Результат:

```text
┌─notEmpty('text')─┐
│                1 │
└──────────────────┘
```

## length {#length}

Возвращает длину строки в байтах (не символах, не кодовых точках).
Тип результата — UInt64.
Функция также работает для массивов.

## lengthUTF8 {#lengthutf8}

Возвращает длину строки в кодовых точках Unicode (не символах), при допущении, что строка содержит набор байтов, являющийся текстом в кодировке UTF-8. Если допущение не выполнено, то возвращает какой-нибудь результат (не кидает исключение).
Тип результата — UInt64.

## char_length, CHAR_LENGTH {#char-length}

Возвращает длину строки в кодовых точках Unicode (не символах), при допущении, что строка содержит набор байтов, являющийся текстом в кодировке UTF-8. Если допущение не выполнено, возвращает какой-нибудь результат (не кидает исключение).
Тип результата — UInt64.

## character_length, CHARACTER_LENGTH {#character-length}

Возвращает длину строки в кодовых точках Unicode (не символах), при допущении, что строка содержит набор байтов, являющийся текстом в кодировке UTF-8. Если допущение не выполнено, возвращает какой-нибудь результат (не кидает исключение).
Тип результата — UInt64.

## leftPad {#leftpad}

Дополняет текущую строку слева пробелами или указанной строкой (несколько раз, если необходимо), пока результирующая строка не достигнет заданной длины. Соответствует MySQL функции `LPAD`.

**Синтаксис**

``` sql
leftPad('string', 'length'[, 'pad_string'])
```

**Параметры**

-   `string` — входная строка, которую необходимо дополнить. [String](../data-types/string.md).
-   `length` — длина результирующей строки. [UInt](../data-types/int-uint.md). Если указанное значение меньше, чем длина входной строки, то входная строка возвращается как есть.
-   `pad_string` — строка, используемая для дополнения входной строки. [String](../data-types/string.md). Необязательный параметр. Если не указано, то входная строка дополняется пробелами.

**Возвращаемое значение**

-   Результирующая строка заданной длины.

Type: [String](../data-types/string.md).

**Пример**

Запрос:

``` sql
SELECT leftPad('abc', 7, '*'), leftPad('def', 7);
```

Результат:

``` text
┌─leftPad('abc', 7, '*')─┬─leftPad('def', 7)─┐
│ ****abc                │     def           │
└────────────────────────┴───────────────────┘
```

## leftPadUTF8 {#leftpadutf8}

Дополняет текущую строку слева пробелами или указанной строкой (несколько раз, если необходимо), пока результирующая строка не достигнет заданной длины. Соответствует MySQL функции `LPAD`. В отличие от функции [leftPad](#leftpad), измеряет длину строки не в байтах, а в кодовых точках Unicode.

**Синтаксис**

``` sql
leftPadUTF8('string','length'[, 'pad_string'])
```

**Параметры**

-   `string` — входная строка, которую необходимо дополнить. [String](../data-types/string.md).
-   `length` — длина результирующей строки. [UInt](../data-types/int-uint.md). Если указанное значение меньше, чем длина входной строки, то входная строка возвращается как есть.
-   `pad_string` — строка, используемая для дополнения входной строки. [String](../data-types/string.md). Необязательный параметр. Если не указано, то входная строка дополняется пробелами.

**Возвращаемое значение**

-   Результирующая строка заданной длины.

Type: [String](../data-types/string.md).

**Пример**

Запрос:

``` sql
SELECT leftPadUTF8('абвг', 7, '*'), leftPadUTF8('дежз', 7);
```

Результат:

``` text
┌─leftPadUTF8('абвг', 7, '*')─┬─leftPadUTF8('дежз', 7)─┐
│ ***абвг                     │    дежз                │
└─────────────────────────────┴────────────────────────┘
```

## rightPad {#rightpad}

Дополняет текущую строку справа пробелами или указанной строкой (несколько раз, если необходимо), пока результирующая строка не достигнет заданной длины. Соответствует MySQL функции `RPAD`.

**Синтаксис**

``` sql
rightPad('string', 'length'[, 'pad_string'])
```

**Параметры**

-   `string` — входная строка, которую необходимо дополнить. [String](../data-types/string.md).
-   `length` — длина результирующей строки. [UInt](../data-types/int-uint.md). Если указанное значение меньше, чем длина входной строки, то входная строка возвращается как есть.
-   `pad_string` — строка, используемая для дополнения входной строки. [String](../data-types/string.md). Необязательный параметр. Если не указано, то входная строка дополняется пробелами.

**Возвращаемое значение**

-   Результирующая строка заданной длины.

Type: [String](../data-types/string.md).

**Пример**

Запрос:

``` sql
SELECT rightPad('abc', 7, '*'), rightPad('abc', 7);
```

Результат:

``` text
┌─rightPad('abc', 7, '*')─┬─rightPad('abc', 7)─┐
│ abc****                 │ abc                │
└─────────────────────────┴────────────────────┘
```

## rightPadUTF8 {#rightpadutf8}

Дополняет текущую строку слева пробелами или указанной строкой (несколько раз, если необходимо), пока результирующая строка не достигнет заданной длины. Соответствует MySQL функции `RPAD`. В отличие от функции [rightPad](#rightpad), измеряет длину строки не в байтах, а в кодовых точках Unicode.

**Синтаксис**

``` sql
rightPadUTF8('string','length'[, 'pad_string'])
```

**Параметры**

-   `string` — входная строка, которую необходимо дополнить. [String](../data-types/string.md).
-   `length` — длина результирующей строки. [UInt](../data-types/int-uint.md). Если указанное значение меньше, чем длина входной строки, то входная строка возвращается как есть.
-   `pad_string` — строка, используемая для дополнения входной строки. [String](../data-types/string.md). Необязательный параметр. Если не указано, то входная строка дополняется пробелами.

**Возвращаемое значение**

-   Результирующая строка заданной длины.

Type: [String](../data-types/string.md).

**Пример**

Запрос:

``` sql
SELECT rightPadUTF8('абвг', 7, '*'), rightPadUTF8('абвг', 7);
```

Результат:

``` text
┌─rightPadUTF8('абвг', 7, '*')─┬─rightPadUTF8('абвг', 7)─┐
│ абвг***                      │ абвг                    │
└──────────────────────────────┴─────────────────────────┘
```

## lower, lcase {#lower}

Переводит ASCII-символы латиницы в строке в нижний регистр.

## upper, ucase {#upper}

Переводит ASCII-символы латиницы в строке в верхний регистр.

## lowerUTF8 {#lowerutf8}

Переводит строку в нижний регистр, при допущении, что строка содержит набор байтов, представляющий текст в кодировке UTF-8.
Не учитывает язык. То есть, для турецкого языка, результат может быть не совсем верным.
Если длина UTF-8 последовательности байтов различна для верхнего и нижнего регистра кодовой точки, то для этой кодовой точки результат работы может быть некорректным.
Если строка содержит набор байтов, не являющийся UTF-8, то поведение не определено.

## upperUTF8 {#upperutf8}

Переводит строку в верхний регистр, при допущении, что строка содержит набор байтов, представляющий текст в кодировке UTF-8.
Не учитывает язык. То есть, для турецкого языка, результат может быть не совсем верным.
Если длина UTF-8 последовательности байтов различна для верхнего и нижнего регистра кодовой точки, то для этой кодовой точки, результат работы может быть некорректным.
Если строка содержит набор байтов, не являющийся UTF-8, то поведение не определено.

## isValidUTF8 {#isvalidutf8}

Возвращает 1, если набор байтов является корректным в кодировке UTF-8, 0 иначе.

## toValidUTF8 {#tovalidutf8}

Заменяет некорректные символы UTF-8 на символ `<60>` (U+FFFD). Все идущие подряд некорректные символы схлопываются в один заменяющий символ.

``` sql
toValidUTF8(input_string)
```

**Аргументы**

-   `input_string` — произвольный набор байтов, представленный как объект типа [String](../../sql-reference/functions/string-functions.md).

Возвращаемое значение: Корректная строка UTF-8.

**Пример**

``` sql
SELECT toValidUTF8('\x61\xF0\x80\x80\x80b');
```

``` text
┌─toValidUTF8('a<><61><EFBFBD><EFBFBD>b')─┐
│ a<>b                   │
└───────────────────────┘
```

## repeat {#repeat}

Повторяет строку определенное количество раз и объединяет повторяемые значения в одну строку.

Синоним: `REPEAT`.

**Синтаксис**

``` sql
repeat(s, n)
```

**Аргументы**

-   `s` — строка для повторения. [String](../../sql-reference/functions/string-functions.md).
-   `n` — количество повторов. [UInt](../../sql-reference/functions/string-functions.md).

**Возвращаемое значение**

Строка, состоящая из повторений `n` раз исходной строки `s`. Если `n` \< 1, то функция вернет пустую строку.

Тип: `String`.

**Пример**

Запрос:

``` sql
SELECT repeat('abc', 10);
```

Результат:

``` text
┌─repeat('abc', 10)──────────────┐
│ abcabcabcabcabcabcabcabcabcabc │
└────────────────────────────────┘
```

## reverse {#reverse}

Разворачивает строку (как последовательность байтов).

## reverseUTF8 {#reverseutf8}

Разворачивает последовательность кодовых точек Unicode, при допущении, что строка содержит набор байтов, представляющий текст в кодировке UTF-8. Иначе — что-то делает (не кидает исключение).

## format(pattern, s0, s1, …) {#format}

Форматирует константный шаблон со строками, перечисленными в аргументах. `pattern` — упрощенная версия шаблона в языке Python. Шаблон содержит «заменяющие поля», которые окружены фигурными скобками `{}`. Всё, что не содержится в скобках, интерпретируется как обычный текст и просто копируется. Если нужно использовать символ фигурной скобки, можно экранировать двойной скобкой `{{ '{{' }}` или `{{ '}}' }}`. Имя полей могут быть числами (нумерация с нуля) или пустыми (тогда они интерпретируются как последовательные числа).

``` sql
SELECT format('{1} {0} {1}', 'World', 'Hello')
```

``` text
┌─format('{1} {0} {1}', 'World', 'Hello')─┐
│ Hello World Hello                       │
└─────────────────────────────────────────┘
```

``` sql
SELECT format('{} {}', 'Hello', 'World')
```

``` text
┌─format('{} {}', 'Hello', 'World')─┐
│ Hello World                       │
└───────────────────────────────────┘
```

## concat {#concat}

Склеивает строки, переданные в аргументы, в одну строку без разделителей.

**Cинтаксис**

``` sql
concat(s1, s2, ...)
```

**Аргументы**

Значения типа String или FixedString.

**Возвращаемое значение**

Возвращает строку, полученную в результате склейки аргументов.

Если любой из аргументов имеет значение `NULL`, `concat` возвращает значение `NULL`.

**Пример**

Запрос:

``` sql
SELECT concat('Hello, ', 'World!');
```

Результат:

``` text
┌─concat('Hello, ', 'World!')─┐
│ Hello, World!               │
└─────────────────────────────┘
```

## concatAssumeInjective {#concatassumeinjective}

Аналогична [concat](#concat). Разница заключается в том, что вам нужно убедиться, что `concat(s1, s2, ...) → sn` является инъективным, так как это предположение будет использоваться для оптимизации GROUP BY.

Функция называется «инъективной», если она возвращает разные значения для разных аргументов. Или, иными словами, функция никогда не выдаёт одно и то же значение, если аргументы разные.

**Синтаксис**

``` sql
concatAssumeInjective(s1, s2, ...)
```

**Аргументы**

Значения типа String или FixedString.

**Возвращаемые значения**

Возвращает строку, полученную в результате объединения аргументов.

Если любой из аргументов имеет значение `NULL`, `concatAssumeInjective` возвращает значение `NULL`.

**Пример**

Вводная таблица:

``` sql
CREATE TABLE key_val(`key1` String, `key2` String, `value` UInt32) ENGINE = TinyLog
INSERT INTO key_val VALUES ('Hello, ','World',1)('Hello, ','World',2)('Hello, ','World!',3)('Hello',', World!',2)
SELECT * from key_val
```

``` text
┌─key1────┬─key2─────┬─value─┐
│ Hello,  │ World    │     1 │
│ Hello,  │ World    │     2 │
│ Hello,  │ World!   │     3 │
│ Hello   │ , World! │     2 │
└─────────┴──────────┴───────┘
```

Запрос:

``` sql
SELECT concat(key1, key2), sum(value) FROM key_val GROUP BY (key1, key2);
```

Результат:

``` text
┌─concat(key1, key2)─┬─sum(value)─┐
│ Hello, World!      │          3 │
│ Hello, World!      │          2 │
│ Hello, World       │          3 │
└────────────────────┴────────────┘
```

## substring(s, offset, length), mid(s, offset, length), substr(s, offset, length) {#substring}

Возвращает подстроку, начиная с байта по индексу offset, длины length байт. Индексация символов — начиная с единицы (как в стандартном SQL). Аргументы offset и length должны быть константами.

## substringUTF8(s, offset, length) {#substringutf8}

Так же, как substring, но для кодовых точек Unicode. Работает при допущении, что строка содержит набор байтов, представляющий текст в кодировке UTF-8. Если допущение не выполнено, то возвращает какой-нибудь результат (не кидает исключение).

## appendTrailingCharIfAbsent(s, c) {#appendtrailingcharifabsent}

Если строка s непустая и не содержит символ c на конце, то добавляет символ c в конец.

## convertCharset(s, from, to) {#convertcharset}

Возвращает сконвертированную из кодировки from в кодировку to строку s.

## base58Encode(plaintext), base58Decode(encoded_text) {#base58}

Принимает на вход строку или колонку строк и кодирует/раскодирует их с помощью схемы кодирования [Base58](https://tools.ietf.org/id/draft-msporny-base58-01.html) с использованием стандартного алфавита Bitcoin.

**Синтаксис**

```sql
base58Encode(decoded)
base58Decode(encoded)
```

**Аргументы**

- `decoded` — Колонка или строка типа [String](../../sql-reference/data-types/string.md).
- `encoded` — Колонка или строка типа [String](../../sql-reference/data-types/string.md). Если входная строка не является корректным кодом для какой-либо другой строки, возникнет исключение.

**Возвращаемое значение**

-   Строка, содержащая раскодированный/закодированный первый аргумент.

Тип: [String](../../sql-reference/data-types/string.md).

**Пример:**

Запрос:

``` sql
SELECT base58Encode('Encoded');
SELECT base58Decode('3dc8KtHrwM');
```

Результат:
```text
┌─base58Encode('Encoded')─┐
│ 3dc8KtHrwM              │
└─────────────────────────┘
┌─base58Decode('3dc8KtHrwM')─┐
│ Encoded                    │
└────────────────────────────┘
```

## base64Encode(s) {#base64encode}

Производит кодирование строки s в base64-представление.

Синоним: `TO_BASE64`.

## base64Decode(s) {#base64decode}

Декодирует base64-представление s в исходную строку. При невозможности декодирования выбрасывает исключение

Синоним: `FROM_BASE64`.

## tryBase64Decode(s) {#trybase64decode}

Функционал аналогичен base64Decode, но при невозможности декодирования возвращает пустую строку.

## endsWith(s, suffix) {#endswith}

Возвращает 1, если строка завершается указанным суффиксом, и 0 в противном случае.

## startsWith(str, prefix) {#startswith}

Возвращает 1, если строка начинается указанным префиксом, в противном случае 0.

``` sql
SELECT startsWith('Spider-Man', 'Spi');
```

**Возвращаемые значения**

-   1, если строка начинается указанным префиксом.
-   0, если строка не начинается указанным префиксом.

**Пример**

Запрос:

``` sql
SELECT startsWith('Hello, world!', 'He');
```

Результат:

``` text
┌─startsWith('Hello, world!', 'He')─┐
│                                 1 │
└───────────────────────────────────┘
```

## trim {#trim}

Удаляет все указанные символы с начала или окончания строки.
По умолчанию удаляет все последовательные вхождения обычных пробелов (32 символ ASCII) с обоих концов строки.

**Синтаксис**

``` sql
trim([[LEADING|TRAILING|BOTH] trim_character FROM] input_string)
```

**Аргументы**

-   `trim_character` — один или несколько символов, подлежащие удалению. [String](../../sql-reference/functions/string-functions.md).
-   `input_string` — строка для обрезки. [String](../../sql-reference/functions/string-functions.md).

**Возвращаемое значение**

Исходную строку после обрезки с левого и (или) правого концов строки.

Тип: `String`.

**Пример**

Запрос:

``` sql
SELECT trim(BOTH ' ()' FROM '(   Hello, world!   )');
```

Результат:

``` text
┌─trim(BOTH ' ()' FROM '(   Hello, world!   )')─┐
│ Hello, world!                                 │
└───────────────────────────────────────────────┘
```

## trimLeft {#trimleft}

Удаляет все последовательные вхождения обычных пробелов (32 символ ASCII) с левого конца строки. Не удаляет другие виды пробелов (табуляция, пробел без разрыва и т. д.).

**Синтаксис**

``` sql
trimLeft(input_string)
```

Алиас: `ltrim(input_string)`.

**Аргументы**

-   `input_string` — строка для обрезки. [String](../../sql-reference/functions/string-functions.md).

**Возвращаемое значение**

Исходную строку без общих пробельных символов слева.

Тип: `String`.

**Пример**

Запрос:

``` sql
SELECT trimLeft('     Hello, world!     ');
```

Результат:

``` text
┌─trimLeft('     Hello, world!     ')─┐
│ Hello, world!                       │
└─────────────────────────────────────┘
```

## trimRight {#trimright}

Удаляет все последовательные вхождения обычных пробелов (32 символ ASCII) с правого конца строки. Не удаляет другие виды пробелов (табуляция, пробел без разрыва и т. д.).

**Синтаксис**

``` sql
trimRight(input_string)
```

Алиас: `rtrim(input_string)`.

**Аргументы**

-   `input_string` — строка для обрезки. [String](../../sql-reference/functions/string-functions.md).

**Возвращаемое значение**

Исходную строку без общих пробельных символов справа.

Тип: `String`.

**Пример**

Запрос:

``` sql
SELECT trimRight('     Hello, world!     ');
```

Результат:

``` text
┌─trimRight('     Hello, world!     ')─┐
│      Hello, world!                   │
└──────────────────────────────────────┘
```

## trimBoth {#trimboth}

Удаляет все последовательные вхождения обычных пробелов (32 символ ASCII) с обоих концов строки. Не удаляет другие виды пробелов (табуляция, пробел без разрыва и т. д.).

**Синтаксис**

``` sql
trimBoth(input_string)
```

Алиас: `trim(input_string)`.

**Аргументы**

-   `input_string` — строка для обрезки. [String](../../sql-reference/functions/string-functions.md).

**Возвращаемое значение**

Исходную строку без общих пробельных символов с обоих концов строки.

Тип: `String`.

**Пример**

Запрос:

``` sql
SELECT trimBoth('     Hello, world!     ');
```

Результат:

``` text
┌─trimBoth('     Hello, world!     ')─┐
│ Hello, world!                       │
└─────────────────────────────────────┘
```

## CRC32(s) {#crc32}

Возвращает чексумму CRC32 данной строки, используется CRC-32-IEEE 802.3 многочлен и начальным значением `0xffffffff` (т.к. используется реализация из zlib).

Тип результата — UInt32.

## CRC32IEEE(s) {#crc32ieee}

Возвращает чексумму CRC32 данной строки, используется CRC-32-IEEE 802.3 многочлен.

Тип результата — UInt32.

## CRC64(s) {#crc64}

Возвращает чексумму CRC64 данной строки, используется CRC-64-ECMA многочлен.

Тип результата — UInt64.

## normalizeQuery {#normalized-query}

Заменяет литералы, последовательности литералов и сложные псевдонимы заполнителями.

**Синтаксис**

``` sql
normalizeQuery(x)
```

**Аргументы**

-   `x` — последовательность символов. [String](../../sql-reference/data-types/string.md).

**Возвращаемое значение**

-   Последовательность символов с заполнителями.

Тип: [String](../../sql-reference/data-types/string.md).

**Пример**

Запрос:

``` sql
SELECT normalizeQuery('[1, 2, 3, x]') AS query;
```

Результат:

``` text
┌─query────┐
│ [?.., x] │
└──────────┘
```

## normalizedQueryHash {#normalized-query-hash}

Возвращает идентичные 64-битные хэш - суммы без значений литералов для аналогичных запросов. Это помогает анализировать журнал запросов.

**Синтаксис**

``` sql
normalizedQueryHash(x)
```

**Аргументы**

-   `x` — последовательность символов. [String](../../sql-reference/data-types/string.md).

**Возвращаемое значение**

-   Хэш-сумма.

Тип: [UInt64](../../sql-reference/data-types/int-uint.md#uint-ranges).

**Пример**

Запрос:

``` sql
SELECT normalizedQueryHash('SELECT 1 AS `xyz`') != normalizedQueryHash('SELECT 1 AS `abc`') AS res;
```

Результат:

``` text
┌─res─┐
│   1 │
└─────┘
```

## normalizeUTF8NFC {#normalizeutf8nfc}

Преобразует строку в нормализованную форму [NFC](https://ru.wikipedia.org/wiki/Юникод#Алгоритмы_нормализации), предполагая, что строка содержит набор байтов, составляющих текст в кодировке UTF-8.

**Синтаксис**

``` sql
normalizeUTF8NFC(words)
```

**Аргументы**

-   `words` — входная строка, которая содержит набор байтов, составляющих текст в кодировке UTF-8. [String](../../sql-reference/data-types/string.md).

**Возвращаемое значение**

-   Строка, преобразованная в нормализированную форму NFC.

Тип: [String](../../sql-reference/data-types/string.md).

**Пример**

Запрос:

``` sql
SELECT length('â'), normalizeUTF8NFC('â') AS nfc, length(nfc) AS nfc_len;
```

Результат:

``` text
┌─length('â')─┬─nfc─┬─nfc_len─┐
│           2 │ â   │       2 │
└─────────────┴─────┴─────────┘
```

## normalizeUTF8NFD {#normalizeutf8nfd}

Преобразует строку в нормализованную форму [NFD](https://ru.wikipedia.org/wiki/Юникод#Алгоритмы_нормализации), предполагая, что строка содержит набор байтов, составляющих текст в кодировке UTF-8.

**Синтаксис**

``` sql
normalizeUTF8NFD(words)
```

**Аргументы**

-   `words` — входная строка, которая содержит набор байтов, составляющих текст в кодировке UTF-8. [String](../../sql-reference/data-types/string.md).

**Возвращаемое значение**

-   Строка, преобразованная в нормализированную форму NFD.

Тип: [String](../../sql-reference/data-types/string.md).

**Пример**

Запрос:

``` sql
SELECT length('â'), normalizeUTF8NFD('â') AS nfd, length(nfd) AS nfd_len;
```

Результат:

``` text
┌─length('â')─┬─nfd─┬─nfd_len─┐
│           2 │ â   │       3 │
└─────────────┴─────┴─────────┘
```

## normalizeUTF8NFKC {#normalizeutf8nfkc}

Преобразует строку в нормализованную форму [NFKC](https://ru.wikipedia.org/wiki/Юникод#Алгоритмы_нормализации), предполагая, что строка содержит набор байтов, составляющих текст в кодировке UTF-8.

**Синтаксис**

``` sql
normalizeUTF8NFKC(words)
```

**Аргументы**

-   `words` — входная строка, которая содержит набор байтов, составляющих текст в кодировке UTF-8. [String](../../sql-reference/data-types/string.md).

**Возвращаемое значение**

-   Строка, преобразованная в нормализированную форму NFKC.

Тип: [String](../../sql-reference/data-types/string.md).

**Пример**

Запрос:

``` sql
SELECT length('â'), normalizeUTF8NFKC('â') AS nfkc, length(nfkc) AS nfkc_len;
```

Результат:

``` text
┌─length('â')─┬─nfkc─┬─nfkc_len─┐
│           2 │ â    │        2 │
└─────────────┴──────┴──────────┘
```

## normalizeUTF8NFKD {#normalizeutf8nfkd}

Преобразует строку в нормализованную форму [NFKD](https://ru.wikipedia.org/wiki/Юникод#Алгоритмы_нормализации), предполагая, что строка содержит набор байтов, составляющих текст в кодировке UTF-8.

**Синтаксис**

``` sql
normalizeUTF8NFKD(words)
```

**Аргументы**

-   `words` — входная строка, которая содержит набор байтов, составляющих текст в кодировке UTF-8. [String](../../sql-reference/data-types/string.md).

**Возвращаемое значение**

-   Строка, преобразованная в нормализированную форму NFKD.

Тип: [String](../../sql-reference/data-types/string.md).

**Пример**

Запрос:

``` sql
SELECT length('â'), normalizeUTF8NFKD('â') AS nfkd, length(nfkd) AS nfkd_len;
```

Результат:

``` text
┌─length('â')─┬─nfkd─┬─nfkd_len─┐
│           2 │ â    │        3 │
└─────────────┴──────┴──────────┘
```

## encodeXMLComponent {#encode-xml-component}

Экранирует символы для размещения строки в текстовом узле или атрибуте XML.

Экранируются символы, которые в формате XML являются зарезервированными (служебными): `<`, `&`, `>`, `"`, `'`.

**Синтаксис**

``` sql
encodeXMLComponent(x)
```

**Аргументы**

-   `x` — последовательность символов. [String](../../sql-reference/data-types/string.md).

**Возвращаемое значение**

-   Строка, в которой зарезервированные символы экранированы.

Тип: [String](../../sql-reference/data-types/string.md).

**Пример**

Запрос:

``` sql
SELECT encodeXMLComponent('Hello, "world"!');
SELECT encodeXMLComponent('<123>');
SELECT encodeXMLComponent('&clickhouse');
SELECT encodeXMLComponent('\'foo\'');
```

Результат:

``` text
Hello, &quot;world&quot;!
&lt;123&gt;
&amp;clickhouse
&apos;foo&apos;
```

## decodeXMLComponent {#decode-xml-component}

Заменяет символами предопределенные мнемоники XML: `&quot;` `&amp;` `&apos;` `&gt;` `&lt;`
Также эта функция заменяет числовые ссылки соответствующими символами юникод. Поддерживаются десятичная (например, `&#10003;`) и шестнадцатеричная (`&#x2713;`) формы.

**Синтаксис**

``` sql
decodeXMLComponent(x)
```

**Аргументы**

-   `x` — последовательность символов. [String](../../sql-reference/data-types/string.md).

**Возвращаемое значение**

-   Строка с произведенными заменами.

Тип: [String](../../sql-reference/data-types/string.md).

**Пример**

Запрос:

``` sql
SELECT decodeXMLComponent('&apos;foo&apos;');
SELECT decodeXMLComponent('&lt; &#x3A3; &gt;');
```

Результат:

``` text
'foo'
< Σ >
```

**Смотрите также**

-   [Мнемоники в HTML](https://ru.wikipedia.org/wiki/%D0%9C%D0%BD%D0%B5%D0%BC%D0%BE%D0%BD%D0%B8%D0%BA%D0%B8_%D0%B2_HTML)


## extractTextFromHTML {#extracttextfromhtml}

Функция для извлечения текста из HTML или XHTML.
Она не соответствует всем HTML, XML или XHTML стандартам на 100%, но ее реализация достаточно точная и быстрая. Правила обработки следующие:

1. Комментарии удаляются. Пример: `<!-- test -->`. Комментарий должен оканчиваться символами `-->`. Вложенные комментарии недопустимы.
Примечание: конструкции наподобие `<!-->` и `<!--->` не являются допустимыми комментариями в HTML, но они будут удалены согласно другим правилам.
2. Содержимое CDATA вставляется дословно. Примечание: формат CDATA специфичен для XML/XHTML. Но он обрабатывается всегда по принципу "наилучшего возможного результата".
3. Элементы `script` и `style` удаляются вместе со всем содержимым. Примечание: предполагается, что закрывающий тег не может появиться внутри содержимого. Например, в JS строковый литерал должен быть экранирован как `"<\/script>"`.
Примечание: комментарии и CDATA возможны внутри `script` или `style` - тогда закрывающие теги не ищутся внутри CDATA. Пример: `<script><![CDATA[</script>]]></script>`. Но они ищутся внутри комментариев. Иногда возникают сложные случаи: `<script>var x = "<!--"; </script> var y = "-->"; alert(x + y);</script>`
Примечание: `script` и `style` могут быть названиями пространств имен XML - тогда они не обрабатываются как обычные элементы `script` или `style`. Пример: `<script:a>Hello</script:a>`.
Примечание: пробелы возможны после имени закрывающего тега: `</script >`, но не перед ним: `< / script>`.
4. Другие теги или элементы, подобные тегам, удаляются, а их внутреннее содержимое остается. Пример: `<a>.</a>`
Примечание: ожидается, что такой HTML является недопустимым: `<a test=">"></a>`
Примечание: функция также удаляет подобные тегам элементы: `<>`, `<!>`, и т. д.
Примечание: если встречается тег без завершающего символа `>`, то удаляется этот тег и весь следующий за ним текст: `<hello `
5. Мнемоники HTML и XML не декодируются. Они должны быть обработаны отдельной функцией.
6. Пробелы в тексте удаляются и добавляются по следующим правилам:
- Пробелы в начале и в конце извлеченного текста удаляются.
- Несколько пробелов подряд заменяются одним пробелом.
- Если текст разделен другими удаляемыми элементами и в этом месте нет пробела, он добавляется.
- Это может привести к появлению неестественного написания, например: `Hello<b>world</b>`, `Hello<!-- -->world` — в HTML нет пробелов, но функция вставляет их. Также следует учитывать такие варианты написания: `Hello<p>world</p>`, `Hello<br>world`. Подобные результаты выполнения функции могут использоваться для анализа данных, например, для преобразования HTML-текста в набор используемых слов.
7. Также обратите внимание, что правильная обработка пробелов требует поддержки `<pre></pre>` и свойств CSS `display` и `white-space`.

**Синтаксис**

``` sql
extractTextFromHTML(x)
```

**Аргументы**

-   `x` — текст для обработки. [String](../../sql-reference/data-types/string.md).

**Возвращаемое значение**

-   Извлеченный текст.

Тип: [String](../../sql-reference/data-types/string.md).

**Пример**

Первый пример содержит несколько тегов и комментарий. На этом примере также видно, как обрабатываются пробелы.
Второй пример показывает обработку `CDATA` и тега `script`.
В третьем примере текст выделяется из полного HTML ответа, полученного с помощью функции [url](../../sql-reference/table-functions/url.md).

Запрос:

``` sql
SELECT extractTextFromHTML(' <p> A text <i>with</i><b>tags</b>. <!-- comments --> </p> ');
SELECT extractTextFromHTML('<![CDATA[The content within <b>CDATA</b>]]> <script>alert("Script");</script>');
SELECT extractTextFromHTML(html) FROM url('http://www.donothingfor2minutes.com/', RawBLOB, 'html String');
```

Результат:

``` text
A text with tags .
The content within <b>CDATA</b>
Do Nothing for 2 Minutes 2:00 &nbsp;
```

## initcap {#initcap}

Переводит первую букву каждого слова в строке в верхний регистр, а остальные — в нижний. Словами считаются последовательности алфавитно-цифровых символов, разделённые любыми другими символами.

## initcapUTF8 {#initcapUTF8}

Как [initcap](#initcap), предполагая, что строка содержит набор байтов, представляющий текст в кодировке UTF-8.
Не учитывает язык. То есть, для турецкого языка, результат может быть не совсем верным.
Если длина UTF-8 последовательности байтов различна для верхнего и нижнего регистра кодовой точки, то для этой кодовой точки результат работы может быть некорректным.
Если строка содержит набор байтов, не являющийся UTF-8, то поведение не определено.
-												DOCSUP-2806: Add meta header in RU (#15801)

* DOCSUP-2806: Add meta intro.

* DOCSUP-2806: Update meta intro.

* DOCSUP-2806: Fix meta.

* DOCSUP-2806: Add quotes for meta headers.

* DOCSUP-2806: Remove quotes from meta headers.

* DOCSUP-2806: Add meta headers.

* DOCSUP-2806: Fix quotes in meta headers.

* DOCSUP-2806: Update meta headers.

* DOCSUP-2806: Fix link to nowhere in EN.

* DOCSUP-2806: Fix link (settings to tune)

* DOCSUP-2806: Fix links.

* DOCSUP-2806:Fix links EN

* DOCSUP-2806: Fix build errors.

* DOCSUP-2806: Fix meta intro.

* DOCSUP-2806: Fix toc_priority in examples datasets TOC.

* DOCSUP-2806: Fix items order in toc.

* DOCSUP-2806: Fix order in toc.

* DOCSUP-2806: Fix toc order.

* DOCSUP-2806: Fix order in toc.

* DOCSUP-2806: Fix toc index in create

* DOCSUP-2806: Fix toc order in create.

Co-authored-by: romanzhukov <romanzhukov@yandex-team.ru>
Co-authored-by: alexey-milovidov <milovidov@yandex-team.ru>
											
										
										
											2020-10-26 10:29:30 +00:00
+								---
-												add slugs to all docs

											
										
										
											2022-08-26 17:37:11 +00:00
+								slug: /ru/sql-reference/functions/string-functions
-												Removed /ja folder, cleaned up /ru markdown

											
										
										
											2022-04-09 13:29:05 +00:00
+								sidebar_position: 40
 								sidebar_label: "Функции для работы со строками"
-												DOCSUP-2806: Add meta header in RU (#15801)

* DOCSUP-2806: Add meta intro.

* DOCSUP-2806: Update meta intro.

* DOCSUP-2806: Fix meta.

* DOCSUP-2806: Add quotes for meta headers.

* DOCSUP-2806: Remove quotes from meta headers.

* DOCSUP-2806: Add meta headers.

* DOCSUP-2806: Fix quotes in meta headers.

* DOCSUP-2806: Update meta headers.

* DOCSUP-2806: Fix link to nowhere in EN.

* DOCSUP-2806: Fix link (settings to tune)

* DOCSUP-2806: Fix links.

* DOCSUP-2806:Fix links EN

* DOCSUP-2806: Fix build errors.

* DOCSUP-2806: Fix meta intro.

* DOCSUP-2806: Fix toc_priority in examples datasets TOC.

* DOCSUP-2806: Fix items order in toc.

* DOCSUP-2806: Fix order in toc.

* DOCSUP-2806: Fix toc order.

* DOCSUP-2806: Fix order in toc.

* DOCSUP-2806: Fix toc index in create

* DOCSUP-2806: Fix toc order in create.

Co-authored-by: romanzhukov <romanzhukov@yandex-team.ru>
Co-authored-by: alexey-milovidov <milovidov@yandex-team.ru>
											
										
										
											2020-10-26 10:29:30 +00:00
+								---
-												WIP on docs translation/normalization tools (#9783)


											
										
										
											2020-03-20 18:20:59 +00:00
+								# Функции для работы со строками {#funktsii-dlia-raboty-so-strokami}
-												Added documentation in RST format. (ReadTheDocs ready)

											
										
										
											2017-03-12 17:58:51 +00:00
-												emironyuk-DOCSUP-782 (#90) (#9725)

* docs(string functions): synchronization of ru-en versions

* docs(string_functions): links fixed

* docs(string functions): mid(s, offset, length), substr(s, offset, length) added to substring(s, offset,length)

* docs(string function): fix count form for bytes

Co-authored-by: emironyuk <emironyuk@yandex-team.ru>

Co-authored-by: emironyuk <62014692+emironyuk@users.noreply.github.com>
Co-authored-by: emironyuk <emironyuk@yandex-team.ru>
Co-authored-by: Sergei Shtykov <bayonet@yandex-team.ru>
											
										
										
											2020-03-19 15:32:53 +00:00
+								## empty {#empty}
-												Update materialize-mysql.

											
										
										
											2021-08-03 14:28:05 +00:00
+								Проверяет, является ли входная строка пустой.
-												Add stings empty function.

											
										
										
											2021-08-03 13:07:46 +00:00
 								**Синтаксис**
 								``` sql
 								empty(x)
 								```
-												fix error in docs

											
										
										
											2022-08-30 11:40:26 +00:00
+								Строка считается непустой, если содержит хотя бы один байт, пусть даже это пробел или нулевой байт.
-												Add stings empty function.

											
										
										
											2021-08-03 13:07:46 +00:00
-												Add ru docs for uuid and array functions.

											
										
										
											2021-08-12 13:56:00 +00:00
+								Функция также поддерживает работу с типами [Array](array-functions.md#function-empty) и [UUID](uuid-functions.md#empty).
-												Add stings empty function.

											
										
										
											2021-08-03 13:07:46 +00:00
+								**Параметры**
-												Update docs/ru/sql-reference/functions/string-functions.md

Co-authored-by: olgarev <56617294+olgarev@users.noreply.github.com>
											
										
										
											2021-08-12 06:51:54 +00:00
+								-   `x` — Входная строка. [String](../data-types/string.md).
-												Add stings empty function.

											
										
										
											2021-08-03 13:07:46 +00:00
 								**Возвращаемое значение**
-												Add stings empty nonempty functions

											
										
										
											2021-08-06 09:04:55 +00:00
+								-   Возвращает `1` для пустой строки и `0` — для непустой строки.
-												Add stings empty function.

											
										
										
											2021-08-03 13:07:46 +00:00
 								Тип: [UInt8](../data-types/int-uint.md).
 								**Пример**
 								Запрос:
 								```sql
-												Update string-functions.md
											
										
										
											2021-10-15 09:02:57 +00:00
+								SELECT empty('text');
-												Add stings empty function.

											
										
										
											2021-08-03 13:07:46 +00:00
+								```
 								Результат:
 								```text
-												Update string-functions.md
											
										
										
											2021-10-15 09:02:57 +00:00
+								┌─empty('text')─┐
 								│             0 │
 								└───────────────┘
-												Add stings empty function.

											
										
										
											2021-08-03 13:07:46 +00:00
+								```
-												Added documentation in RST format. (ReadTheDocs ready)

											
										
										
											2017-03-12 17:58:51 +00:00
-												emironyuk-DOCSUP-782 (#90) (#9725)

* docs(string functions): synchronization of ru-en versions

* docs(string_functions): links fixed

* docs(string functions): mid(s, offset, length), substr(s, offset, length) added to substring(s, offset,length)

* docs(string function): fix count form for bytes

Co-authored-by: emironyuk <emironyuk@yandex-team.ru>

Co-authored-by: emironyuk <62014692+emironyuk@users.noreply.github.com>
Co-authored-by: emironyuk <emironyuk@yandex-team.ru>
Co-authored-by: Sergei Shtykov <bayonet@yandex-team.ru>
											
										
										
											2020-03-19 15:32:53 +00:00
+								## notEmpty {#notempty}
-												Add stings empty nonempty functions

											
										
										
											2021-08-06 09:04:55 +00:00
+								Проверяет, является ли входная строка непустой.
 								**Синтаксис**
 								``` sql
-												Update docs/ru/sql-reference/functions/string-functions.md

Co-authored-by: olgarev <56617294+olgarev@users.noreply.github.com>
											
										
										
											2021-08-12 06:51:47 +00:00
+								notEmpty(x)
-												Add stings empty nonempty functions

											
										
										
											2021-08-06 09:04:55 +00:00
+								```
-												fix error in docs

											
										
										
											2022-08-30 11:40:26 +00:00
+								Строка считается непустой, если содержит хотя бы один байт, пусть даже это пробел или нулевой байт.
-												Add stings empty nonempty functions

											
										
										
											2021-08-06 09:04:55 +00:00
-												Add ru docs for uuid and array functions.

											
										
										
											2021-08-12 13:56:00 +00:00
+								Функция также поддерживает работу с типами [Array](array-functions.md#function-notempty) и [UUID](uuid-functions.md#notempty).
-												Add stings empty nonempty functions

											
										
										
											2021-08-06 09:04:55 +00:00
+								**Параметры**
-												Update docs/ru/sql-reference/functions/string-functions.md

Co-authored-by: olgarev <56617294+olgarev@users.noreply.github.com>
											
										
										
											2021-08-12 06:51:39 +00:00
+								-   `x` — Входная строка. [String](../data-types/string.md).
-												Add stings empty nonempty functions

											
										
										
											2021-08-06 09:04:55 +00:00
 								**Возвращаемое значение**
 								-   Возвращает `1` для непустой строки и `0` — для пустой строки.
 								Тип: [UInt8](../data-types/int-uint.md).
 								**Пример**
 								Запрос:
 								```sql
-												Update docs/ru/sql-reference/functions/string-functions.md

Co-authored-by: olgarev <56617294+olgarev@users.noreply.github.com>
											
										
										
											2021-08-12 06:44:31 +00:00
+								SELECT notEmpty('text');
-												Add stings empty nonempty functions

											
										
										
											2021-08-06 09:04:55 +00:00
+								```
 								Результат:
 								```text
-												Update docs/ru/sql-reference/functions/string-functions.md

Co-authored-by: olgarev <56617294+olgarev@users.noreply.github.com>
											
										
										
											2021-08-12 06:44:15 +00:00
+								┌─notEmpty('text')─┐
 								│                1 │
 								└──────────────────┘
-												Add stings empty nonempty functions

											
										
										
											2021-08-06 09:04:55 +00:00
+								```
-												Added documentation in RST format. (ReadTheDocs ready)

											
										
										
											2017-03-12 17:58:51 +00:00
-												emironyuk-DOCSUP-782 (#90) (#9725)

* docs(string functions): synchronization of ru-en versions

* docs(string_functions): links fixed

* docs(string functions): mid(s, offset, length), substr(s, offset, length) added to substring(s, offset,length)

* docs(string function): fix count form for bytes

Co-authored-by: emironyuk <emironyuk@yandex-team.ru>

Co-authored-by: emironyuk <62014692+emironyuk@users.noreply.github.com>
Co-authored-by: emironyuk <emironyuk@yandex-team.ru>
Co-authored-by: Sergei Shtykov <bayonet@yandex-team.ru>
											
										
										
											2020-03-19 15:32:53 +00:00
+								## length {#length}
-												Added documentation in RST format. (ReadTheDocs ready)

											
										
										
											2017-03-12 17:58:51 +00:00
+								Возвращает длину строки в байтах (не символах, не кодовых точках).
-												emironyuk-DOCSUP-782 (#90) (#9725)

* docs(string functions): synchronization of ru-en versions

* docs(string_functions): links fixed

* docs(string functions): mid(s, offset, length), substr(s, offset, length) added to substring(s, offset,length)

* docs(string function): fix count form for bytes

Co-authored-by: emironyuk <emironyuk@yandex-team.ru>

Co-authored-by: emironyuk <62014692+emironyuk@users.noreply.github.com>
Co-authored-by: emironyuk <emironyuk@yandex-team.ru>
Co-authored-by: Sergei Shtykov <bayonet@yandex-team.ru>
											
										
										
											2020-03-19 15:32:53 +00:00
+								Тип результата — UInt64.
-												Added documentation in RST format. (ReadTheDocs ready)

											
										
										
											2017-03-12 17:58:51 +00:00
+								Функция также работает для массивов.
-												emironyuk-DOCSUP-782 (#90) (#9725)

* docs(string functions): synchronization of ru-en versions

* docs(string_functions): links fixed

* docs(string functions): mid(s, offset, length), substr(s, offset, length) added to substring(s, offset,length)

* docs(string function): fix count form for bytes

Co-authored-by: emironyuk <emironyuk@yandex-team.ru>

Co-authored-by: emironyuk <62014692+emironyuk@users.noreply.github.com>
Co-authored-by: emironyuk <emironyuk@yandex-team.ru>
Co-authored-by: Sergei Shtykov <bayonet@yandex-team.ru>
											
										
										
											2020-03-19 15:32:53 +00:00
+								## lengthUTF8 {#lengthutf8}
 								Возвращает длину строки в кодовых точках Unicode (не символах), при допущении, что строка содержит набор байтов, являющийся текстом в кодировке UTF-8. Если допущение не выполнено, то возвращает какой-нибудь результат (не кидает исключение).
 								Тип результата — UInt64.
-												Fix broken links in docs

											
										
										
											2020-10-13 17:23:29 +00:00
+								## char_length, CHAR_LENGTH {#char-length}
-												emironyuk-DOCSUP-782 (#90) (#9725)

* docs(string functions): synchronization of ru-en versions

* docs(string_functions): links fixed

* docs(string functions): mid(s, offset, length), substr(s, offset, length) added to substring(s, offset,length)

* docs(string function): fix count form for bytes

Co-authored-by: emironyuk <emironyuk@yandex-team.ru>

Co-authored-by: emironyuk <62014692+emironyuk@users.noreply.github.com>
Co-authored-by: emironyuk <emironyuk@yandex-team.ru>
Co-authored-by: Sergei Shtykov <bayonet@yandex-team.ru>
											
										
										
											2020-03-19 15:32:53 +00:00
 								Возвращает длину строки в кодовых точках Unicode (не символах), при допущении, что строка содержит набор байтов, являющийся текстом в кодировке UTF-8. Если допущение не выполнено, возвращает какой-нибудь результат (не кидает исключение).
 								Тип результата — UInt64.
-												Fix broken links in docs

											
										
										
											2020-10-13 17:23:29 +00:00
+								## character_length, CHARACTER_LENGTH {#character-length}
-												emironyuk-DOCSUP-782 (#90) (#9725)

* docs(string functions): synchronization of ru-en versions

* docs(string_functions): links fixed

* docs(string functions): mid(s, offset, length), substr(s, offset, length) added to substring(s, offset,length)

* docs(string function): fix count form for bytes

Co-authored-by: emironyuk <emironyuk@yandex-team.ru>

Co-authored-by: emironyuk <62014692+emironyuk@users.noreply.github.com>
Co-authored-by: emironyuk <emironyuk@yandex-team.ru>
Co-authored-by: Sergei Shtykov <bayonet@yandex-team.ru>
											
										
										
											2020-03-19 15:32:53 +00:00
 								Возвращает длину строки в кодовых точках Unicode (не символах), при допущении, что строка содержит набор байтов, являющийся текстом в кодировке UTF-8. Если допущение не выполнено, возвращает какой-нибудь результат (не кидает исключение).
 								Тип результата — UInt64.
-												Add Ru for pads functions.

											
										
										
											2021-08-09 14:29:26 +00:00
+								## leftPad {#leftpad}
-												Update docs/ru/sql-reference/functions/string-functions.md

Co-authored-by: olgarev <56617294+olgarev@users.noreply.github.com>
											
										
										
											2021-08-11 17:17:15 +00:00
+								Дополняет текущую строку слева пробелами или указанной строкой (несколько раз, если необходимо), пока результирующая строка не достигнет заданной длины. Соответствует MySQL функции `LPAD`.
-												Add Ru for pads functions.

											
										
										
											2021-08-09 14:29:26 +00:00
 								**Синтаксис**
 								``` sql
 								leftPad('string', 'length'[, 'pad_string'])
 								```
 								**Параметры**
-												Update docs/ru/sql-reference/functions/string-functions.md

Co-authored-by: olgarev <56617294+olgarev@users.noreply.github.com>
											
										
										
											2021-08-11 17:18:49 +00:00
+								-   `string` — входная строка, которую необходимо дополнить. [String](../data-types/string.md).
-												Add Ru for pads functions.

											
										
										
											2021-08-09 14:29:26 +00:00
+								-   `length` — длина результирующей строки. [UInt](../data-types/int-uint.md). Если указанное значение меньше, чем длина входной строки, то входная строка возвращается как есть.
-												Update docs/ru/sql-reference/functions/string-functions.md

Co-authored-by: olgarev <56617294+olgarev@users.noreply.github.com>
											
										
										
											2021-08-11 17:17:08 +00:00
+								-   `pad_string` — строка, используемая для дополнения входной строки. [String](../data-types/string.md). Необязательный параметр. Если не указано, то входная строка дополняется пробелами.
-												Add Ru for pads functions.

											
										
										
											2021-08-09 14:29:26 +00:00
 								**Возвращаемое значение**
 								-   Результирующая строка заданной длины.
 								Type: [String](../data-types/string.md).
 								**Пример**
 								Запрос:
 								``` sql
 								SELECT leftPad('abc', 7, '*'), leftPad('def', 7);
 								```
 								Результат:
 								``` text
 								┌─leftPad('abc', 7, '*')─┬─leftPad('def', 7)─┐
 								│ ****abc                │     def           │
 								└────────────────────────┴───────────────────┘
 								```
 								## leftPadUTF8 {#leftpadutf8}
-												Update docs/ru/sql-reference/functions/string-functions.md

Co-authored-by: olgarev <56617294+olgarev@users.noreply.github.com>
											
										
										
											2021-08-11 17:18:55 +00:00
+								Дополняет текущую строку слева пробелами или указанной строкой (несколько раз, если необходимо), пока результирующая строка не достигнет заданной длины. Соответствует MySQL функции `LPAD`. В отличие от функции [leftPad](#leftpad), измеряет длину строки не в байтах, а в кодовых точках Unicode.
-												Add Ru for pads functions.

											
										
										
											2021-08-09 14:29:26 +00:00
 								**Синтаксис**
 								``` sql
 								leftPadUTF8('string','length'[, 'pad_string'])
 								```
 								**Параметры**
-												Update docs/ru/sql-reference/functions/string-functions.md

Co-authored-by: olgarev <56617294+olgarev@users.noreply.github.com>
											
										
										
											2021-08-11 17:17:23 +00:00
+								-   `string` — входная строка, которую необходимо дополнить. [String](../data-types/string.md).
-												Add Ru for pads functions.

											
										
										
											2021-08-09 14:29:26 +00:00
+								-   `length` — длина результирующей строки. [UInt](../data-types/int-uint.md). Если указанное значение меньше, чем длина входной строки, то входная строка возвращается как есть.
-												Update docs/ru/sql-reference/functions/string-functions.md

Co-authored-by: olgarev <56617294+olgarev@users.noreply.github.com>
											
										
										
											2021-08-11 17:18:41 +00:00
+								-   `pad_string` — строка, используемая для дополнения входной строки. [String](../data-types/string.md). Необязательный параметр. Если не указано, то входная строка дополняется пробелами.
-												Add Ru for pads functions.

											
										
										
											2021-08-09 14:29:26 +00:00
 								**Возвращаемое значение**
 								-   Результирующая строка заданной длины.
 								Type: [String](../data-types/string.md).
 								**Пример**
 								Запрос:
 								``` sql
 								SELECT leftPadUTF8('абвг', 7, '*'), leftPadUTF8('дежз', 7);
 								```
 								Результат:
 								``` text
 								┌─leftPadUTF8('абвг', 7, '*')─┬─leftPadUTF8('дежз', 7)─┐
 								│ ***абвг                     │    дежз                │
 								└─────────────────────────────┴────────────────────────┘
 								```
 								## rightPad {#rightpad}
-												Update docs/ru/sql-reference/functions/string-functions.md

Co-authored-by: olgarev <56617294+olgarev@users.noreply.github.com>
											
										
										
											2021-08-11 17:17:31 +00:00
+								Дополняет текущую строку справа пробелами или указанной строкой (несколько раз, если необходимо), пока результирующая строка не достигнет заданной длины. Соответствует MySQL функции `RPAD`.
-												Add Ru for pads functions.

											
										
										
											2021-08-09 14:29:26 +00:00
 								**Синтаксис**
 								``` sql
 								rightPad('string', 'length'[, 'pad_string'])
 								```
 								**Параметры**
-												Update docs/ru/sql-reference/functions/string-functions.md

Co-authored-by: olgarev <56617294+olgarev@users.noreply.github.com>
											
										
										
											2021-08-11 17:18:33 +00:00
+								-   `string` — входная строка, которую необходимо дополнить. [String](../data-types/string.md).
-												Add Ru for pads functions.

											
										
										
											2021-08-09 14:29:26 +00:00
+								-   `length` — длина результирующей строки. [UInt](../data-types/int-uint.md). Если указанное значение меньше, чем длина входной строки, то входная строка возвращается как есть.
-												Update docs/ru/sql-reference/functions/string-functions.md

Co-authored-by: olgarev <56617294+olgarev@users.noreply.github.com>
											
										
										
											2021-08-11 17:17:38 +00:00
+								-   `pad_string` — строка, используемая для дополнения входной строки. [String](../data-types/string.md). Необязательный параметр. Если не указано, то входная строка дополняется пробелами.
-												Add Ru for pads functions.

											
										
										
											2021-08-09 14:29:26 +00:00
 								**Возвращаемое значение**
 								-   Результирующая строка заданной длины.
 								Type: [String](../data-types/string.md).
 								**Пример**
 								Запрос:
 								``` sql
 								SELECT rightPad('abc', 7, '*'), rightPad('abc', 7);
 								```
 								Результат:
 								``` text
 								┌─rightPad('abc', 7, '*')─┬─rightPad('abc', 7)─┐
 								│ abc****                 │ abc                │
 								└─────────────────────────┴────────────────────┘
 								```
 								## rightPadUTF8 {#rightpadutf8}
-												Update docs/ru/sql-reference/functions/string-functions.md

Co-authored-by: olgarev <56617294+olgarev@users.noreply.github.com>
											
										
										
											2021-08-11 17:18:08 +00:00
+								Дополняет текущую строку слева пробелами или указанной строкой (несколько раз, если необходимо), пока результирующая строка не достигнет заданной длины. Соответствует MySQL функции `RPAD`. В отличие от функции [rightPad](#rightpad), измеряет длину строки не в байтах, а в кодовых точках Unicode.
-												Add Ru for pads functions.

											
										
										
											2021-08-09 14:29:26 +00:00
 								**Синтаксис**
 								``` sql
 								rightPadUTF8('string','length'[, 'pad_string'])
 								```
 								**Параметры**
-												Update docs/ru/sql-reference/functions/string-functions.md

Co-authored-by: olgarev <56617294+olgarev@users.noreply.github.com>
											
										
										
											2021-08-11 17:17:44 +00:00
+								-   `string` — входная строка, которую необходимо дополнить. [String](../data-types/string.md).
-												Add Ru for pads functions.

											
										
										
											2021-08-09 14:29:26 +00:00
+								-   `length` — длина результирующей строки. [UInt](../data-types/int-uint.md). Если указанное значение меньше, чем длина входной строки, то входная строка возвращается как есть.
-												Update docs/ru/sql-reference/functions/string-functions.md

Co-authored-by: olgarev <56617294+olgarev@users.noreply.github.com>
											
										
										
											2021-08-11 17:17:51 +00:00
+								-   `pad_string` — строка, используемая для дополнения входной строки. [String](../data-types/string.md). Необязательный параметр. Если не указано, то входная строка дополняется пробелами.
-												Add Ru for pads functions.

											
										
										
											2021-08-09 14:29:26 +00:00
 								**Возвращаемое значение**
 								-   Результирующая строка заданной длины.
 								Type: [String](../data-types/string.md).
 								**Пример**
-												Update docs/ru/sql-reference/functions/string-functions.md

Co-authored-by: Alexey Boykov <33257111+mathalex@users.noreply.github.com>
											
										
										
											2021-08-12 16:09:17 +00:00
+								Запрос:
-												Add Ru for pads functions.

											
										
										
											2021-08-09 14:29:26 +00:00
 								``` sql
 								SELECT rightPadUTF8('абвг', 7, '*'), rightPadUTF8('абвг', 7);
 								```
 								Результат:
 								``` text
 								┌─rightPadUTF8('абвг', 7, '*')─┬─rightPadUTF8('абвг', 7)─┐
 								│ абвг***                      │ абвг                    │
 								└──────────────────────────────┴─────────────────────────┘
 								```
-												emironyuk-DOCSUP-782 (#90) (#9725)

* docs(string functions): synchronization of ru-en versions

* docs(string_functions): links fixed

* docs(string functions): mid(s, offset, length), substr(s, offset, length) added to substring(s, offset,length)

* docs(string function): fix count form for bytes

Co-authored-by: emironyuk <emironyuk@yandex-team.ru>

Co-authored-by: emironyuk <62014692+emironyuk@users.noreply.github.com>
Co-authored-by: emironyuk <emironyuk@yandex-team.ru>
Co-authored-by: Sergei Shtykov <bayonet@yandex-team.ru>
											
										
										
											2020-03-19 15:32:53 +00:00
+								## lower, lcase {#lower}
-												Added documentation in RST format. (ReadTheDocs ready)

											
										
										
											2017-03-12 17:58:51 +00:00
 								Переводит ASCII-символы латиницы в строке в нижний регистр.
-												emironyuk-DOCSUP-782 (#90) (#9725)

* docs(string functions): synchronization of ru-en versions

* docs(string_functions): links fixed

* docs(string functions): mid(s, offset, length), substr(s, offset, length) added to substring(s, offset,length)

* docs(string function): fix count form for bytes

Co-authored-by: emironyuk <emironyuk@yandex-team.ru>

Co-authored-by: emironyuk <62014692+emironyuk@users.noreply.github.com>
Co-authored-by: emironyuk <emironyuk@yandex-team.ru>
Co-authored-by: Sergei Shtykov <bayonet@yandex-team.ru>
											
										
										
											2020-03-19 15:32:53 +00:00
+								## upper, ucase {#upper}
-												Added documentation in RST format. (ReadTheDocs ready)

											
										
										
											2017-03-12 17:58:51 +00:00
+								Переводит ASCII-символы латиницы в строке в верхний регистр.
-												emironyuk-DOCSUP-782 (#90) (#9725)

* docs(string functions): synchronization of ru-en versions

* docs(string_functions): links fixed

* docs(string functions): mid(s, offset, length), substr(s, offset, length) added to substring(s, offset,length)

* docs(string function): fix count form for bytes

Co-authored-by: emironyuk <emironyuk@yandex-team.ru>

Co-authored-by: emironyuk <62014692+emironyuk@users.noreply.github.com>
Co-authored-by: emironyuk <emironyuk@yandex-team.ru>
Co-authored-by: Sergei Shtykov <bayonet@yandex-team.ru>
											
										
										
											2020-03-19 15:32:53 +00:00
+								## lowerUTF8 {#lowerutf8}
 								Переводит строку в нижний регистр, при допущении, что строка содержит набор байтов, представляющий текст в кодировке UTF-8.
-												Added documentation in RST format. (ReadTheDocs ready)

											
										
										
											2017-03-12 17:58:51 +00:00
+								Не учитывает язык. То есть, для турецкого языка, результат может быть не совсем верным.
-												emironyuk-DOCSUP-782 (#90) (#9725)

* docs(string functions): synchronization of ru-en versions

* docs(string_functions): links fixed

* docs(string functions): mid(s, offset, length), substr(s, offset, length) added to substring(s, offset,length)

* docs(string function): fix count form for bytes

Co-authored-by: emironyuk <emironyuk@yandex-team.ru>

Co-authored-by: emironyuk <62014692+emironyuk@users.noreply.github.com>
Co-authored-by: emironyuk <emironyuk@yandex-team.ru>
Co-authored-by: Sergei Shtykov <bayonet@yandex-team.ru>
											
										
										
											2020-03-19 15:32:53 +00:00
+								Если длина UTF-8 последовательности байтов различна для верхнего и нижнего регистра кодовой точки, то для этой кодовой точки результат работы может быть некорректным.
 								Если строка содержит набор байтов, не являющийся UTF-8, то поведение не определено.
-												Added documentation in RST format. (ReadTheDocs ready)

											
										
										
											2017-03-12 17:58:51 +00:00
-												emironyuk-DOCSUP-782 (#90) (#9725)

* docs(string functions): synchronization of ru-en versions

* docs(string_functions): links fixed

* docs(string functions): mid(s, offset, length), substr(s, offset, length) added to substring(s, offset,length)

* docs(string function): fix count form for bytes

Co-authored-by: emironyuk <emironyuk@yandex-team.ru>

Co-authored-by: emironyuk <62014692+emironyuk@users.noreply.github.com>
Co-authored-by: emironyuk <emironyuk@yandex-team.ru>
Co-authored-by: Sergei Shtykov <bayonet@yandex-team.ru>
											
										
										
											2020-03-19 15:32:53 +00:00
+								## upperUTF8 {#upperutf8}
 								Переводит строку в верхний регистр, при допущении, что строка содержит набор байтов, представляющий текст в кодировке UTF-8.
-												Added documentation in RST format. (ReadTheDocs ready)

											
										
										
											2017-03-12 17:58:51 +00:00
+								Не учитывает язык. То есть, для турецкого языка, результат может быть не совсем верным.
-												emironyuk-DOCSUP-782 (#90) (#9725)

* docs(string functions): synchronization of ru-en versions

* docs(string_functions): links fixed

* docs(string functions): mid(s, offset, length), substr(s, offset, length) added to substring(s, offset,length)

* docs(string function): fix count form for bytes

Co-authored-by: emironyuk <emironyuk@yandex-team.ru>

Co-authored-by: emironyuk <62014692+emironyuk@users.noreply.github.com>
Co-authored-by: emironyuk <emironyuk@yandex-team.ru>
Co-authored-by: Sergei Shtykov <bayonet@yandex-team.ru>
											
										
										
											2020-03-19 15:32:53 +00:00
+								Если длина UTF-8 последовательности байтов различна для верхнего и нижнего регистра кодовой точки, то для этой кодовой точки, результат работы может быть некорректным.
 								Если строка содержит набор байтов, не являющийся UTF-8, то поведение не определено.
 								## isValidUTF8 {#isvalidutf8}
-												Added documentation in RST format. (ReadTheDocs ready)

											
										
										
											2017-03-12 17:58:51 +00:00
-												emironyuk-DOCSUP-782 (#90) (#9725)

* docs(string functions): synchronization of ru-en versions

* docs(string_functions): links fixed

* docs(string functions): mid(s, offset, length), substr(s, offset, length) added to substring(s, offset,length)

* docs(string function): fix count form for bytes

Co-authored-by: emironyuk <emironyuk@yandex-team.ru>

Co-authored-by: emironyuk <62014692+emironyuk@users.noreply.github.com>
Co-authored-by: emironyuk <emironyuk@yandex-team.ru>
Co-authored-by: Sergei Shtykov <bayonet@yandex-team.ru>
											
										
										
											2020-03-19 15:32:53 +00:00
+								Возвращает 1, если набор байтов является корректным в кодировке UTF-8, 0 иначе.
-												isValidUTF8 function added

											
										
										
											2019-04-07 18:58:13 +00:00
-												emironyuk-DOCSUP-782 (#90) (#9725)

* docs(string functions): synchronization of ru-en versions

* docs(string_functions): links fixed

* docs(string functions): mid(s, offset, length), substr(s, offset, length) added to substring(s, offset,length)

* docs(string function): fix count form for bytes

Co-authored-by: emironyuk <emironyuk@yandex-team.ru>

Co-authored-by: emironyuk <62014692+emironyuk@users.noreply.github.com>
Co-authored-by: emironyuk <emironyuk@yandex-team.ru>
Co-authored-by: Sergei Shtykov <bayonet@yandex-team.ru>
											
										
										
											2020-03-19 15:32:53 +00:00
+								## toValidUTF8 {#tovalidutf8}
-												DOCAPI-6697: Edited the toValidUTF8 description.

											
										
										
											2019-05-20 14:41:10 +00:00
 								Заменяет некорректные символы UTF-8 на символ `<60>` (U+FFFD). Все идущие подряд некорректные символы схлопываются в один заменяющий символ.
-												WIP on docs translation/normalization tools (#9783)


											
										
										
											2020-03-20 18:20:59 +00:00
+								``` sql
-												Edit and translate to Russian

Поправил шаблоны в английской и русской версиях.

											
										
										
											2021-03-13 18:18:45 +00:00
+								toValidUTF8(input_string)
-												DOCAPI-6697: Edited the toValidUTF8 description.

											
										
										
											2019-05-20 14:41:10 +00:00
+								```
-												Edit and translate to Russian

Поправил шаблоны в английской и русской версиях.

											
										
										
											2021-03-13 18:18:45 +00:00
+								**Аргументы**
-												DOCAPI-6697: Edited the toValidUTF8 description.

											
										
										
											2019-05-20 14:41:10 +00:00
-												Edit and translate to Russian

Поправил шаблоны в английской и русской версиях.

											
										
										
											2021-03-13 18:18:45 +00:00
+								-   `input_string` — произвольный набор байтов, представленный как объект типа [String](../../sql-reference/functions/string-functions.md).
-												DOCAPI-6697: Edited the toValidUTF8 description.

											
										
										
											2019-05-20 14:41:10 +00:00
 								Возвращаемое значение: Корректная строка UTF-8.
-												emironyuk-DOCSUP-782 (#90) (#9725)

* docs(string functions): synchronization of ru-en versions

* docs(string_functions): links fixed

* docs(string functions): mid(s, offset, length), substr(s, offset, length) added to substring(s, offset,length)

* docs(string function): fix count form for bytes

Co-authored-by: emironyuk <emironyuk@yandex-team.ru>

Co-authored-by: emironyuk <62014692+emironyuk@users.noreply.github.com>
Co-authored-by: emironyuk <emironyuk@yandex-team.ru>
Co-authored-by: Sergei Shtykov <bayonet@yandex-team.ru>
											
										
										
											2020-03-19 15:32:53 +00:00
+								**Пример**
-												DOCAPI-6697: Edited the toValidUTF8 description.

											
										
										
											2019-05-20 14:41:10 +00:00
-												WIP on docs translation/normalization tools (#9783)


											
										
										
											2020-03-20 18:20:59 +00:00
+								``` sql
-												Edit and translate to Russian

Поправил шаблоны в английской и русской версиях.

											
										
										
											2021-03-13 18:18:45 +00:00
+								SELECT toValidUTF8('\x61\xF0\x80\x80\x80b');
-												DOCAPI-6697: Edited the toValidUTF8 description.

											
										
										
											2019-05-20 14:41:10 +00:00
+								```
-												WIP on docs translation/normalization tools (#9783)


											
										
										
											2020-03-20 18:20:59 +00:00
 								``` text
-												DOCAPI-6697: RU example fix.

											
										
										
											2019-05-23 12:42:12 +00:00
+								┌─toValidUTF8('a<><61><EFBFBD><EFBFBD>b')─┐
 								│ a<>b                   │
 								└───────────────────────┘
-												DOCAPI-6697: Edited the toValidUTF8 description.

											
										
										
											2019-05-20 14:41:10 +00:00
+								```
-												docs(repeat): Added repeat function description

											
										
										
											2019-10-24 14:59:00 +00:00
+								## repeat {#repeat}
 								Повторяет строку определенное количество раз и объединяет повторяемые значения в одну строку.
-												Added aliases for string function

											
										
										
											2021-02-16 11:31:24 +00:00
+								Синоним: `REPEAT`.
-												docs(repeat): Added repeat function description

											
										
										
											2019-10-24 14:59:00 +00:00
+								**Синтаксис**
-												WIP on docs translation/normalization tools (#9783)


											
										
										
											2020-03-20 18:20:59 +00:00
+								``` sql
-												docs(repeat): Added repeat function description

											
										
										
											2019-10-24 14:59:00 +00:00
+								repeat(s, n)
 								```
-												Edit and translate to Russian

Поправил шаблоны в английской и русской версиях.

											
										
										
											2021-03-13 18:18:45 +00:00
+								**Аргументы**
-												docs(repeat): Added repeat function description

											
										
										
											2019-10-24 14:59:00 +00:00
-												Edit and translate to Russian

Поправил шаблоны в английской и русской версиях.

											
										
										
											2021-03-13 18:18:45 +00:00
+								-   `s` — строка для повторения. [String](../../sql-reference/functions/string-functions.md).
 								-   `n` — количество повторов. [UInt](../../sql-reference/functions/string-functions.md).
-												docs(repeat): Added repeat function description

											
										
										
											2019-10-24 14:59:00 +00:00
 								**Возвращаемое значение**
-												WIP on docs translation/normalization tools (#9783)


											
										
										
											2020-03-20 18:20:59 +00:00
+								Строка, состоящая из повторений `n` раз исходной строки `s`. Если `n` \< 1, то функция вернет пустую строку.
-												docs(repeat): Added repeat function description

											
										
										
											2019-10-24 14:59:00 +00:00
 								Тип: `String`.
 								**Пример**
 								Запрос:
-												WIP on docs translation/normalization tools (#9783)


											
										
										
											2020-03-20 18:20:59 +00:00
+								``` sql
-												Edit and translate to Russian

Поправил шаблоны в английской и русской версиях.

											
										
										
											2021-03-13 18:18:45 +00:00
+								SELECT repeat('abc', 10);
-												docs(repeat): Added repeat function description

											
										
										
											2019-10-24 14:59:00 +00:00
+								```
-												Edit and translate to Russian

Поправил шаблоны в английской и русской версиях.

											
										
										
											2021-03-13 18:18:45 +00:00
+								Результат:
-												docs(repeat): Added repeat function description

											
										
										
											2019-10-24 14:59:00 +00:00
-												WIP on docs translation/normalization tools (#9783)


											
										
										
											2020-03-20 18:20:59 +00:00
+								``` text
-												docs(repeat): Added repeat function description

											
										
										
											2019-10-24 14:59:00 +00:00
+								┌─repeat('abc', 10)──────────────┐
 								│ abcabcabcabcabcabcabcabcabcabc │
 								└────────────────────────────────┘
 								```
-												DOCAPI-6697: Edited the toValidUTF8 description.

											
										
										
											2019-05-20 14:41:10 +00:00
-												emironyuk-DOCSUP-782 (#90) (#9725)

* docs(string functions): synchronization of ru-en versions

* docs(string_functions): links fixed

* docs(string functions): mid(s, offset, length), substr(s, offset, length) added to substring(s, offset,length)

* docs(string function): fix count form for bytes

Co-authored-by: emironyuk <emironyuk@yandex-team.ru>

Co-authored-by: emironyuk <62014692+emironyuk@users.noreply.github.com>
Co-authored-by: emironyuk <emironyuk@yandex-team.ru>
Co-authored-by: Sergei Shtykov <bayonet@yandex-team.ru>
											
										
										
											2020-03-19 15:32:53 +00:00
+								## reverse {#reverse}
-												Added documentation in RST format. (ReadTheDocs ready)

											
										
										
											2017-03-12 17:58:51 +00:00
-												emironyuk-DOCSUP-782 (#90) (#9725)

* docs(string functions): synchronization of ru-en versions

* docs(string_functions): links fixed

* docs(string functions): mid(s, offset, length), substr(s, offset, length) added to substring(s, offset,length)

* docs(string function): fix count form for bytes

Co-authored-by: emironyuk <emironyuk@yandex-team.ru>

Co-authored-by: emironyuk <62014692+emironyuk@users.noreply.github.com>
Co-authored-by: emironyuk <emironyuk@yandex-team.ru>
Co-authored-by: Sergei Shtykov <bayonet@yandex-team.ru>
											
										
										
											2020-03-19 15:32:53 +00:00
+								Разворачивает строку (как последовательность байтов).
-												Added documentation in RST format. (ReadTheDocs ready)

											
										
										
											2017-03-12 17:58:51 +00:00
-												emironyuk-DOCSUP-782 (#90) (#9725)

* docs(string functions): synchronization of ru-en versions

* docs(string_functions): links fixed

* docs(string functions): mid(s, offset, length), substr(s, offset, length) added to substring(s, offset,length)

* docs(string function): fix count form for bytes

Co-authored-by: emironyuk <emironyuk@yandex-team.ru>

Co-authored-by: emironyuk <62014692+emironyuk@users.noreply.github.com>
Co-authored-by: emironyuk <emironyuk@yandex-team.ru>
Co-authored-by: Sergei Shtykov <bayonet@yandex-team.ru>
											
										
										
											2020-03-19 15:32:53 +00:00
+								## reverseUTF8 {#reverseutf8}
-												format function added

											
										
										
											2019-05-18 11:30:36 +00:00
-												emironyuk-DOCSUP-782 (#90) (#9725)

* docs(string functions): synchronization of ru-en versions

* docs(string_functions): links fixed

* docs(string functions): mid(s, offset, length), substr(s, offset, length) added to substring(s, offset,length)

* docs(string function): fix count form for bytes

Co-authored-by: emironyuk <emironyuk@yandex-team.ru>

Co-authored-by: emironyuk <62014692+emironyuk@users.noreply.github.com>
Co-authored-by: emironyuk <emironyuk@yandex-team.ru>
Co-authored-by: Sergei Shtykov <bayonet@yandex-team.ru>
											
										
										
											2020-03-19 15:32:53 +00:00
+								Разворачивает последовательность кодовых точек Unicode, при допущении, что строка содержит набор байтов, представляющий текст в кодировке UTF-8. Иначе — что-то делает (не кидает исключение).
-												format function added

											
										
										
											2019-05-18 11:30:36 +00:00
-												WIP on docs translation/normalization tools (#9783)


											
										
										
											2020-03-20 18:20:59 +00:00
+								## format(pattern, s0, s1, …) {#format}
-												emironyuk-DOCSUP-782 (#90) (#9725)

* docs(string functions): synchronization of ru-en versions

* docs(string_functions): links fixed

* docs(string functions): mid(s, offset, length), substr(s, offset, length) added to substring(s, offset,length)

* docs(string function): fix count form for bytes

Co-authored-by: emironyuk <emironyuk@yandex-team.ru>

Co-authored-by: emironyuk <62014692+emironyuk@users.noreply.github.com>
Co-authored-by: emironyuk <emironyuk@yandex-team.ru>
Co-authored-by: Sergei Shtykov <bayonet@yandex-team.ru>
											
										
										
											2020-03-19 15:32:53 +00:00
-												WIP on docs translation/normalization tools (#9783)


											
										
										
											2020-03-20 18:20:59 +00:00
+								Форматирует константный шаблон со строками, перечисленными в аргументах. `pattern` — упрощенная версия шаблона в языке Python. Шаблон содержит «заменяющие поля», которые окружены фигурными скобками `{}`. Всё, что не содержится в скобках, интерпретируется как обычный текст и просто копируется. Если нужно использовать символ фигурной скобки, можно экранировать двойной скобкой `{{ '{{' }}` или `{{ '}}' }}`. Имя полей могут быть числами (нумерация с нуля) или пустыми (тогда они интерпретируются как последовательные числа).
-												format function added

											
										
										
											2019-05-18 11:30:36 +00:00
-												WIP on docs translation/normalization tools (#9783)


											
										
										
											2020-03-20 18:20:59 +00:00
+								``` sql
-												format function added

											
										
										
											2019-05-18 11:30:36 +00:00
+								SELECT format('{1} {0} {1}', 'World', 'Hello')
-												DOCAPI-8530: Code blocks markup fix (#7060)

* Typo fix.

* Links fix.

* Fixed links in docs.

* More fixes.

* docs/en: cleaning some files

* docs/en: cleaning data_types

* docs/en: cleaning database_engines

* docs/en: cleaning development

* docs/en: cleaning getting_started

* docs/en: cleaning interfaces

* docs/en: cleaning operations

* docs/en: cleaning query_lamguage

* docs/en: cleaning en

* docs/ru: cleaning data_types

* docs/ru: cleaning index

* docs/ru: cleaning database_engines

* docs/ru: cleaning development

* docs/ru: cleaning general

* docs/ru: cleaning getting_started

* docs/ru: cleaning interfaces

* docs/ru: cleaning operations

* docs/ru: cleaning query_language

* docs: cleaning interfaces/http

* Update docs/en/data_types/array.md

decorated ```

Co-Authored-By: BayoNet <da-daos@yandex.ru>

* Update docs/en/getting_started/example_datasets/nyc_taxi.md

fixed typo

Co-Authored-By: BayoNet <da-daos@yandex.ru>

* Update docs/en/getting_started/example_datasets/ontime.md

fixed typo

Co-Authored-By: BayoNet <da-daos@yandex.ru>

* Update docs/en/interfaces/formats.md

fixed error

Co-Authored-By: BayoNet <da-daos@yandex.ru>

* Update docs/en/operations/table_engines/custom_partitioning_key.md

Co-Authored-By: BayoNet <da-daos@yandex.ru>

* Update docs/en/operations/utils/clickhouse-local.md

Co-Authored-By: BayoNet <da-daos@yandex.ru>

* Update docs/en/query_language/dicts/external_dicts_dict_sources.md

Co-Authored-By: BayoNet <da-daos@yandex.ru>

* Update docs/en/operations/utils/clickhouse-local.md

Co-Authored-By: BayoNet <da-daos@yandex.ru>

* Update docs/en/query_language/functions/json_functions.md

Co-Authored-By: BayoNet <da-daos@yandex.ru>

* Update docs/en/query_language/functions/json_functions.md

Co-Authored-By: BayoNet <da-daos@yandex.ru>

* Update docs/en/query_language/functions/other_functions.md

Co-Authored-By: BayoNet <da-daos@yandex.ru>

* Update docs/en/query_language/functions/other_functions.md

Co-Authored-By: BayoNet <da-daos@yandex.ru>

* Update docs/en/query_language/functions/date_time_functions.md

Co-Authored-By: BayoNet <da-daos@yandex.ru>

* Update docs/en/operations/table_engines/jdbc.md

Co-Authored-By: BayoNet <da-daos@yandex.ru>

* docs: fixed error

* docs: fixed error

											
										
										
											2019-09-23 15:31:46 +00:00
+								```
-												WIP on docs translation/normalization tools (#9783)


											
										
										
											2020-03-20 18:20:59 +00:00
 								``` text
-												format function added

											
										
										
											2019-05-18 11:30:36 +00:00
+								┌─format('{1} {0} {1}', 'World', 'Hello')─┐
 								│ Hello World Hello                       │
 								└─────────────────────────────────────────┘
-												DOCAPI-8530: Code blocks markup fix (#7060)

* Typo fix.

* Links fix.

* Fixed links in docs.

* More fixes.

* docs/en: cleaning some files

* docs/en: cleaning data_types

* docs/en: cleaning database_engines

* docs/en: cleaning development

* docs/en: cleaning getting_started

* docs/en: cleaning interfaces

* docs/en: cleaning operations

* docs/en: cleaning query_lamguage

* docs/en: cleaning en

* docs/ru: cleaning data_types

* docs/ru: cleaning index

* docs/ru: cleaning database_engines

* docs/ru: cleaning development

* docs/ru: cleaning general

* docs/ru: cleaning getting_started

* docs/ru: cleaning interfaces

* docs/ru: cleaning operations

* docs/ru: cleaning query_language

* docs: cleaning interfaces/http

* Update docs/en/data_types/array.md

decorated ```

Co-Authored-By: BayoNet <da-daos@yandex.ru>

* Update docs/en/getting_started/example_datasets/nyc_taxi.md

fixed typo

Co-Authored-By: BayoNet <da-daos@yandex.ru>

* Update docs/en/getting_started/example_datasets/ontime.md

fixed typo

Co-Authored-By: BayoNet <da-daos@yandex.ru>

* Update docs/en/interfaces/formats.md

fixed error

Co-Authored-By: BayoNet <da-daos@yandex.ru>

* Update docs/en/operations/table_engines/custom_partitioning_key.md

Co-Authored-By: BayoNet <da-daos@yandex.ru>

* Update docs/en/operations/utils/clickhouse-local.md

Co-Authored-By: BayoNet <da-daos@yandex.ru>

* Update docs/en/query_language/dicts/external_dicts_dict_sources.md

Co-Authored-By: BayoNet <da-daos@yandex.ru>

* Update docs/en/operations/utils/clickhouse-local.md

Co-Authored-By: BayoNet <da-daos@yandex.ru>

* Update docs/en/query_language/functions/json_functions.md

Co-Authored-By: BayoNet <da-daos@yandex.ru>

* Update docs/en/query_language/functions/json_functions.md

Co-Authored-By: BayoNet <da-daos@yandex.ru>

* Update docs/en/query_language/functions/other_functions.md

Co-Authored-By: BayoNet <da-daos@yandex.ru>

* Update docs/en/query_language/functions/other_functions.md

Co-Authored-By: BayoNet <da-daos@yandex.ru>

* Update docs/en/query_language/functions/date_time_functions.md

Co-Authored-By: BayoNet <da-daos@yandex.ru>

* Update docs/en/operations/table_engines/jdbc.md

Co-Authored-By: BayoNet <da-daos@yandex.ru>

* docs: fixed error

* docs: fixed error

											
										
										
											2019-09-23 15:31:46 +00:00
+								```
-												WIP on docs translation/normalization tools (#9783)


											
										
										
											2020-03-20 18:20:59 +00:00
 								``` sql
-												format function added

											
										
										
											2019-05-18 11:30:36 +00:00
+								SELECT format('{} {}', 'Hello', 'World')
-												DOCAPI-8530: Code blocks markup fix (#7060)

* Typo fix.

* Links fix.

* Fixed links in docs.

* More fixes.

* docs/en: cleaning some files

* docs/en: cleaning data_types

* docs/en: cleaning database_engines

* docs/en: cleaning development

* docs/en: cleaning getting_started

* docs/en: cleaning interfaces

* docs/en: cleaning operations

* docs/en: cleaning query_lamguage

* docs/en: cleaning en

* docs/ru: cleaning data_types

* docs/ru: cleaning index

* docs/ru: cleaning database_engines

* docs/ru: cleaning development

* docs/ru: cleaning general

* docs/ru: cleaning getting_started

* docs/ru: cleaning interfaces

* docs/ru: cleaning operations

* docs/ru: cleaning query_language

* docs: cleaning interfaces/http

* Update docs/en/data_types/array.md

decorated ```

Co-Authored-By: BayoNet <da-daos@yandex.ru>

* Update docs/en/getting_started/example_datasets/nyc_taxi.md

fixed typo

Co-Authored-By: BayoNet <da-daos@yandex.ru>

* Update docs/en/getting_started/example_datasets/ontime.md

fixed typo

Co-Authored-By: BayoNet <da-daos@yandex.ru>

* Update docs/en/interfaces/formats.md

fixed error

Co-Authored-By: BayoNet <da-daos@yandex.ru>

* Update docs/en/operations/table_engines/custom_partitioning_key.md

Co-Authored-By: BayoNet <da-daos@yandex.ru>

* Update docs/en/operations/utils/clickhouse-local.md

Co-Authored-By: BayoNet <da-daos@yandex.ru>

* Update docs/en/query_language/dicts/external_dicts_dict_sources.md

Co-Authored-By: BayoNet <da-daos@yandex.ru>

* Update docs/en/operations/utils/clickhouse-local.md

Co-Authored-By: BayoNet <da-daos@yandex.ru>

* Update docs/en/query_language/functions/json_functions.md

Co-Authored-By: BayoNet <da-daos@yandex.ru>

* Update docs/en/query_language/functions/json_functions.md

Co-Authored-By: BayoNet <da-daos@yandex.ru>

* Update docs/en/query_language/functions/other_functions.md

Co-Authored-By: BayoNet <da-daos@yandex.ru>

* Update docs/en/query_language/functions/other_functions.md

Co-Authored-By: BayoNet <da-daos@yandex.ru>

* Update docs/en/query_language/functions/date_time_functions.md

Co-Authored-By: BayoNet <da-daos@yandex.ru>

* Update docs/en/operations/table_engines/jdbc.md

Co-Authored-By: BayoNet <da-daos@yandex.ru>

* docs: fixed error

* docs: fixed error

											
										
										
											2019-09-23 15:31:46 +00:00
+								```
-												WIP on docs translation/normalization tools (#9783)


											
										
										
											2020-03-20 18:20:59 +00:00
 								``` text
-												format function added

											
										
										
											2019-05-18 11:30:36 +00:00
+								┌─format('{} {}', 'Hello', 'World')─┐
 								│ Hello World                       │
 								└───────────────────────────────────┘
 								```
-												emironyuk-DOCSUP-782 (#90) (#9725)

* docs(string functions): synchronization of ru-en versions

* docs(string_functions): links fixed

* docs(string functions): mid(s, offset, length), substr(s, offset, length) added to substring(s, offset,length)

* docs(string function): fix count form for bytes

Co-authored-by: emironyuk <emironyuk@yandex-team.ru>

Co-authored-by: emironyuk <62014692+emironyuk@users.noreply.github.com>
Co-authored-by: emironyuk <emironyuk@yandex-team.ru>
Co-authored-by: Sergei Shtykov <bayonet@yandex-team.ru>
											
										
										
											2020-03-19 15:32:53 +00:00
+								## concat {#concat}
-												format function added

											
										
										
											2019-05-18 11:30:36 +00:00
-												emironyuk-DOCSUP-782 (#90) (#9725)

* docs(string functions): synchronization of ru-en versions

* docs(string_functions): links fixed

* docs(string functions): mid(s, offset, length), substr(s, offset, length) added to substring(s, offset,length)

* docs(string function): fix count form for bytes

Co-authored-by: emironyuk <emironyuk@yandex-team.ru>

Co-authored-by: emironyuk <62014692+emironyuk@users.noreply.github.com>
Co-authored-by: emironyuk <emironyuk@yandex-team.ru>
Co-authored-by: Sergei Shtykov <bayonet@yandex-team.ru>
											
										
										
											2020-03-19 15:32:53 +00:00
+								Склеивает строки, переданные в аргументы, в одну строку без разделителей.
-												Docs: added concat &  concatAssumeInjective

											
										
										
											2019-11-11 14:46:08 +00:00
-												WIP on docs translation/normalization tools (#9783)


											
										
										
											2020-03-20 18:20:59 +00:00
+								**Cинтаксис**
-												Docs: added concat &  concatAssumeInjective

											
										
										
											2019-11-11 14:46:08 +00:00
-												WIP on docs translation/normalization tools (#9783)


											
										
										
											2020-03-20 18:20:59 +00:00
+								``` sql
-												Docs: added concat &  concatAssumeInjective

											
										
										
											2019-11-11 14:46:08 +00:00
+								concat(s1, s2, ...)
 								```
-												Edit and translate to Russian

Поправил шаблоны в английской и русской версиях.

											
										
										
											2021-03-13 18:18:45 +00:00
+								**Аргументы**
-												Docs: added concat &  concatAssumeInjective

											
										
										
											2019-11-11 14:46:08 +00:00
-												Update string_functions.md
											
										
										
											2020-02-02 22:01:57 +00:00
+								Значения типа String или FixedString.
-												Docs: added concat &  concatAssumeInjective

											
										
										
											2019-11-11 14:46:08 +00:00
-												Update string_functions.md
											
										
										
											2020-02-02 22:01:57 +00:00
+								**Возвращаемое значение**
-												Docs: added concat &  concatAssumeInjective

											
										
										
											2019-11-11 14:46:08 +00:00
-												WIP on docs translation/normalization tools (#9783)


											
										
										
											2020-03-20 18:20:59 +00:00
+								Возвращает строку, полученную в результате склейки аргументов.
-												Docs: added concat &  concatAssumeInjective

											
										
										
											2019-11-11 14:46:08 +00:00
-												Fixes after review

											
										
										
											2019-12-26 12:51:48 +00:00
+								Если любой из аргументов имеет значение `NULL`, `concat` возвращает значение `NULL`.
-												Docs: added concat &  concatAssumeInjective

											
										
										
											2019-11-11 14:46:08 +00:00
 								**Пример**
 								Запрос:
-												WIP on docs translation/normalization tools (#9783)


											
										
										
											2020-03-20 18:20:59 +00:00
+								``` sql
-												Edit and translate to Russian

Поправил шаблоны в английской и русской версиях.

											
										
										
											2021-03-13 18:18:45 +00:00
+								SELECT concat('Hello, ', 'World!');
-												Docs: added concat &  concatAssumeInjective

											
										
										
											2019-11-11 14:46:08 +00:00
+								```
-												Edit and translate to Russian

Поправил шаблоны в английской и русской версиях.

											
										
										
											2021-03-13 18:18:45 +00:00
+								Результат:
-												Docs: added concat &  concatAssumeInjective

											
										
										
											2019-11-11 14:46:08 +00:00
-												WIP on docs translation/normalization tools (#9783)


											
										
										
											2020-03-20 18:20:59 +00:00
+								``` text
-												Fixes after review

											
										
										
											2019-12-26 12:51:48 +00:00
+								┌─concat('Hello, ', 'World!')─┐
 								│ Hello, World!               │
 								└─────────────────────────────┘
-												Docs: added concat &  concatAssumeInjective

											
										
										
											2019-11-11 14:46:08 +00:00
+								```
 								## concatAssumeInjective {#concatassumeinjective}
-												Update string_functions.md
											
										
										
											2020-02-02 22:01:57 +00:00
+								Аналогична [concat](#concat). Разница заключается в том, что вам нужно убедиться, что `concat(s1, s2, ...) → sn` является инъективным, так как это предположение будет использоваться для оптимизации GROUP BY.
-												WIP on docs translation/normalization tools (#9783)


											
										
										
											2020-03-20 18:20:59 +00:00
+								Функция называется «инъективной», если она возвращает разные значения для разных аргументов. Или, иными словами, функция никогда не выдаёт одно и то же значение, если аргументы разные.
-												Docs: added concat &  concatAssumeInjective

											
										
										
											2019-11-11 14:46:08 +00:00
-												WIP on docs translation/normalization tools (#9783)


											
										
										
											2020-03-20 18:20:59 +00:00
+								**Синтаксис**
-												Docs: added concat &  concatAssumeInjective

											
										
										
											2019-11-11 14:46:08 +00:00
-												WIP on docs translation/normalization tools (#9783)


											
										
										
											2020-03-20 18:20:59 +00:00
+								``` sql
-												Docs: added concat &  concatAssumeInjective

											
										
										
											2019-11-11 14:46:08 +00:00
+								concatAssumeInjective(s1, s2, ...)
 								```
-												Edit and translate to Russian

Поправил шаблоны в английской и русской версиях.

											
										
										
											2021-03-13 18:18:45 +00:00
+								**Аргументы**
-												Docs: added concat &  concatAssumeInjective

											
										
										
											2019-11-11 14:46:08 +00:00
-												Update string_functions.md
											
										
										
											2020-02-02 22:01:57 +00:00
+								Значения типа String или FixedString.
-												Docs: added concat &  concatAssumeInjective

											
										
										
											2019-11-11 14:46:08 +00:00
 								**Возвращаемые значения**
-												WIP on docs translation/normalization tools (#9783)


											
										
										
											2020-03-20 18:20:59 +00:00
+								Возвращает строку, полученную в результате объединения аргументов.
-												Docs: added concat &  concatAssumeInjective

											
										
										
											2019-11-11 14:46:08 +00:00
-												Fixes after review

											
										
										
											2019-12-26 12:51:48 +00:00
+								Если любой из аргументов имеет значение `NULL`, `concatAssumeInjective` возвращает значение `NULL`.
-												Docs: added concat &  concatAssumeInjective

											
										
										
											2019-11-11 14:46:08 +00:00
 								**Пример**
-												Fixes after review

											
										
										
											2019-12-26 12:51:48 +00:00
+								Вводная таблица:
-												WIP on docs translation/normalization tools (#9783)


											
										
										
											2020-03-20 18:20:59 +00:00
+								``` sql
-												Fixes after review

											
										
										
											2019-12-26 12:51:48 +00:00
+								CREATE TABLE key_val(`key1` String, `key2` String, `value` UInt32) ENGINE = TinyLog
 								INSERT INTO key_val VALUES ('Hello, ','World',1)('Hello, ','World',2)('Hello, ','World!',3)('Hello',', World!',2)
 								SELECT * from key_val
 								```
-												WIP on docs translation/normalization tools (#9783)


											
										
										
											2020-03-20 18:20:59 +00:00
+								``` text
-												Fixes after review

											
										
										
											2019-12-26 12:51:48 +00:00
+								┌─key1────┬─key2─────┬─value─┐
 								│ Hello,  │ World    │     1 │
 								│ Hello,  │ World    │     2 │
 								│ Hello,  │ World!   │     3 │
 								│ Hello   │ , World! │     2 │
 								└─────────┴──────────┴───────┘
 								```
-												Docs: added concat &  concatAssumeInjective

											
										
										
											2019-11-11 14:46:08 +00:00
 								Запрос:
-												WIP on docs translation/normalization tools (#9783)


											
										
										
											2020-03-20 18:20:59 +00:00
+								``` sql
-												Edit and translate to Russian

Поправил шаблоны в английской и русской версиях.

											
										
										
											2021-03-13 18:18:45 +00:00
+								SELECT concat(key1, key2), sum(value) FROM key_val GROUP BY (key1, key2);
-												Docs: added concat &  concatAssumeInjective

											
										
										
											2019-11-11 14:46:08 +00:00
+								```
-												Edit and translate to Russian

Поправил шаблоны в английской и русской версиях.

											
										
										
											2021-03-13 18:18:45 +00:00
+								Результат:
-												Docs: added concat &  concatAssumeInjective

											
										
										
											2019-11-11 14:46:08 +00:00
-												WIP on docs translation/normalization tools (#9783)


											
										
										
											2020-03-20 18:20:59 +00:00
+								``` text
-												Docs: added concat &  concatAssumeInjective

											
										
										
											2019-11-11 14:46:08 +00:00
+								┌─concat(key1, key2)─┬─sum(value)─┐
 								│ Hello, World!      │          3 │
 								│ Hello, World!      │          2 │
 								│ Hello, World       │          3 │
 								└────────────────────┴────────────┘
 								```
-												Added documentation in RST format. (ReadTheDocs ready)

											
										
										
											2017-03-12 17:58:51 +00:00
-												emironyuk-DOCSUP-782 (#90) (#9725)

* docs(string functions): synchronization of ru-en versions

* docs(string_functions): links fixed

* docs(string functions): mid(s, offset, length), substr(s, offset, length) added to substring(s, offset,length)

* docs(string function): fix count form for bytes

Co-authored-by: emironyuk <emironyuk@yandex-team.ru>

Co-authored-by: emironyuk <62014692+emironyuk@users.noreply.github.com>
Co-authored-by: emironyuk <emironyuk@yandex-team.ru>
Co-authored-by: Sergei Shtykov <bayonet@yandex-team.ru>
											
										
										
											2020-03-19 15:32:53 +00:00
+								## substring(s, offset, length), mid(s, offset, length), substr(s, offset, length) {#substring}
 								Возвращает подстроку, начиная с байта по индексу offset, длины length байт. Индексация символов — начиная с единицы (как в стандартном SQL). Аргументы offset и length должны быть константами.
 								## substringUTF8(s, offset, length) {#substringutf8}
-												Added documentation in RST format. (ReadTheDocs ready)

											
										
										
											2017-03-12 17:58:51 +00:00
-												emironyuk-DOCSUP-782 (#90) (#9725)

* docs(string functions): synchronization of ru-en versions

* docs(string_functions): links fixed

* docs(string functions): mid(s, offset, length), substr(s, offset, length) added to substring(s, offset,length)

* docs(string function): fix count form for bytes

Co-authored-by: emironyuk <emironyuk@yandex-team.ru>

Co-authored-by: emironyuk <62014692+emironyuk@users.noreply.github.com>
Co-authored-by: emironyuk <emironyuk@yandex-team.ru>
Co-authored-by: Sergei Shtykov <bayonet@yandex-team.ru>
											
										
										
											2020-03-19 15:32:53 +00:00
+								Так же, как substring, но для кодовых точек Unicode. Работает при допущении, что строка содержит набор байтов, представляющий текст в кодировке UTF-8. Если допущение не выполнено, то возвращает какой-нибудь результат (не кидает исключение).
 								## appendTrailingCharIfAbsent(s, c) {#appendtrailingcharifabsent}
-												Added documentation in RST format. (ReadTheDocs ready)

											
										
										
											2017-03-12 17:58:51 +00:00
 								Если строка s непустая и не содержит символ c на конце, то добавляет символ c в конец.
-												emironyuk-DOCSUP-782 (#90) (#9725)

* docs(string functions): synchronization of ru-en versions

* docs(string_functions): links fixed

* docs(string functions): mid(s, offset, length), substr(s, offset, length) added to substring(s, offset,length)

* docs(string function): fix count form for bytes

Co-authored-by: emironyuk <emironyuk@yandex-team.ru>

Co-authored-by: emironyuk <62014692+emironyuk@users.noreply.github.com>
Co-authored-by: emironyuk <emironyuk@yandex-team.ru>
Co-authored-by: Sergei Shtykov <bayonet@yandex-team.ru>
											
										
										
											2020-03-19 15:32:53 +00:00
+								## convertCharset(s, from, to) {#convertcharset}
-												Added documentation in RST format. (ReadTheDocs ready)

											
										
										
											2017-03-12 17:58:51 +00:00
+								Возвращает сконвертированную из кодировки from в кодировку to строку s.
-												Arch-based compilation

											
										
										
											2018-11-02 19:06:05 +00:00
-												fix error in docs

											
										
										
											2022-08-30 11:40:26 +00:00
+								## base58Encode(plaintext), base58Decode(encoded_text) {#base58}
-												updated docs

											
										
										
											2022-06-22 09:56:37 +00:00
-												added new DataType + fixes

											
										
										
											2022-07-16 16:58:47 +00:00
+								Принимает на вход строку или колонку строк и кодирует/раскодирует их с помощью схемы кодирования [Base58](https://tools.ietf.org/id/draft-msporny-base58-01.html) с использованием стандартного алфавита Bitcoin.
-												updated docs

											
										
										
											2022-06-22 09:56:37 +00:00
 								**Синтаксис**
 								```sql
-												fix error in docs

											
										
										
											2022-08-30 11:40:26 +00:00
+								base58Encode(decoded)
 								base58Decode(encoded)
-												updated docs

											
										
										
											2022-06-22 09:56:37 +00:00
+								```
 								**Аргументы**
 								- `decoded` — Колонка или строка типа [String](../../sql-reference/data-types/string.md).
-												fix error in docs

											
										
										
											2022-08-30 11:40:26 +00:00
+								- `encoded` — Колонка или строка типа [String](../../sql-reference/data-types/string.md). Если входная строка не является корректным кодом для какой-либо другой строки, возникнет исключение.
-												updated docs

											
										
										
											2022-06-22 09:56:37 +00:00
 								**Возвращаемое значение**
 								-   Строка, содержащая раскодированный/закодированный первый аргумент.
 								Тип: [String](../../sql-reference/data-types/string.md).
 								**Пример:**
 								Запрос:
 								``` sql
-												Apply suggestions from code review
											
										
										
											2022-08-30 11:49:21 +00:00
+								SELECT base58Encode('Encoded');
 								SELECT base58Decode('3dc8KtHrwM');
-												updated docs

											
										
										
											2022-06-22 09:56:37 +00:00
+								```
 								Результат:
 								```text
-												Apply suggestions from code review
											
										
										
											2022-08-30 11:49:21 +00:00
+								┌─base58Encode('Encoded')─┐
 								│ 3dc8KtHrwM              │
 								└─────────────────────────┘
 								┌─base58Decode('3dc8KtHrwM')─┐
 								│ Encoded                    │
 								└────────────────────────────┘
-												updated docs

											
										
										
											2022-06-22 09:56:37 +00:00
+								```
-												emironyuk-DOCSUP-782 (#90) (#9725)

* docs(string functions): synchronization of ru-en versions

* docs(string_functions): links fixed

* docs(string functions): mid(s, offset, length), substr(s, offset, length) added to substring(s, offset,length)

* docs(string function): fix count form for bytes

Co-authored-by: emironyuk <emironyuk@yandex-team.ru>

Co-authored-by: emironyuk <62014692+emironyuk@users.noreply.github.com>
Co-authored-by: emironyuk <emironyuk@yandex-team.ru>
Co-authored-by: Sergei Shtykov <bayonet@yandex-team.ru>
											
										
										
											2020-03-19 15:32:53 +00:00
+								## base64Encode(s) {#base64encode}
-												Arch-based compilation

											
										
										
											2018-11-02 19:06:05 +00:00
+								Производит кодирование строки s в base64-представление.
-												added aliases for string functions

											
										
										
											2021-02-16 11:13:01 +00:00
+								Синоним: `TO_BASE64`.
-												emironyuk-DOCSUP-782 (#90) (#9725)

* docs(string functions): synchronization of ru-en versions

* docs(string_functions): links fixed

* docs(string functions): mid(s, offset, length), substr(s, offset, length) added to substring(s, offset,length)

* docs(string function): fix count form for bytes

Co-authored-by: emironyuk <emironyuk@yandex-team.ru>

Co-authored-by: emironyuk <62014692+emironyuk@users.noreply.github.com>
Co-authored-by: emironyuk <emironyuk@yandex-team.ru>
Co-authored-by: Sergei Shtykov <bayonet@yandex-team.ru>
											
										
										
											2020-03-19 15:32:53 +00:00
+								## base64Decode(s) {#base64decode}
-												Arch-based compilation

											
										
										
											2018-11-02 19:06:05 +00:00
+								Декодирует base64-представление s в исходную строку. При невозможности декодирования выбрасывает исключение
-												added aliases for string functions

											
										
										
											2021-02-16 11:13:01 +00:00
+								Синоним: `FROM_BASE64`.
-												emironyuk-DOCSUP-782 (#90) (#9725)

* docs(string functions): synchronization of ru-en versions

* docs(string_functions): links fixed

* docs(string functions): mid(s, offset, length), substr(s, offset, length) added to substring(s, offset,length)

* docs(string function): fix count form for bytes

Co-authored-by: emironyuk <emironyuk@yandex-team.ru>

Co-authored-by: emironyuk <62014692+emironyuk@users.noreply.github.com>
Co-authored-by: emironyuk <emironyuk@yandex-team.ru>
Co-authored-by: Sergei Shtykov <bayonet@yandex-team.ru>
											
										
										
											2020-03-19 15:32:53 +00:00
+								## tryBase64Decode(s) {#trybase64decode}
-												Merge https://github.com/yandex/ClickHouse into base64_functions

											
										
										
											2018-11-14 09:32:42 +00:00
+								Функционал аналогичен base64Decode, но при невозможности декодирования возвращает пустую строку.
-												emironyuk-DOCSUP-782 (#90) (#9725)

* docs(string functions): synchronization of ru-en versions

* docs(string_functions): links fixed

* docs(string functions): mid(s, offset, length), substr(s, offset, length) added to substring(s, offset,length)

* docs(string function): fix count form for bytes

Co-authored-by: emironyuk <emironyuk@yandex-team.ru>

Co-authored-by: emironyuk <62014692+emironyuk@users.noreply.github.com>
Co-authored-by: emironyuk <emironyuk@yandex-team.ru>
Co-authored-by: Sergei Shtykov <bayonet@yandex-team.ru>
											
										
										
											2020-03-19 15:32:53 +00:00
+								## endsWith(s, suffix) {#endswith}
-												DOCAPI-7695: Functions support for indexes (#6784)


											
										
										
											2019-09-06 09:07:23 +00:00
 								Возвращает 1, если строка завершается указанным суффиксом, и 0 в противном случае.
-												emironyuk-DOCSUP-782 (#90) (#9725)

* docs(string functions): synchronization of ru-en versions

* docs(string_functions): links fixed

* docs(string functions): mid(s, offset, length), substr(s, offset, length) added to substring(s, offset,length)

* docs(string function): fix count form for bytes

Co-authored-by: emironyuk <emironyuk@yandex-team.ru>

Co-authored-by: emironyuk <62014692+emironyuk@users.noreply.github.com>
Co-authored-by: emironyuk <emironyuk@yandex-team.ru>
Co-authored-by: Sergei Shtykov <bayonet@yandex-team.ru>
											
										
										
											2020-03-19 15:32:53 +00:00
+								## startsWith(str, prefix) {#startswith}
-												DOCAPI-7695: Functions support for indexes (#6784)


											
										
										
											2019-09-06 09:07:23 +00:00
-												Fix startsWith function

											
										
										
											2019-09-26 11:39:06 +00:00
+								Возвращает 1, если строка начинается указанным префиксом, в противном случае 0.
-												WIP on docs translation/normalization tools (#9783)


											
										
										
											2020-03-20 18:20:59 +00:00
+								``` sql
-												Fixes after review

											
										
										
											2019-09-30 07:24:02 +00:00
+								SELECT startsWith('Spider-Man', 'Spi');
-												Fix startsWith function

											
										
										
											2019-09-26 11:39:06 +00:00
+								```
 								**Возвращаемые значения**
-												[experimental] add "es" docs language as machine translated draft (#9787)

* replace exit with assert in test_single_page

* improve save_raw_single_page docs option

* More grammar fixes

* "Built from" link in new tab

* fix mistype

* Example of include in docs

* add anchor to meeting form

* Draft of translation helper

* WIP on translation helper

* Replace some fa docs content with machine translation

* add normalize-en-markdown.sh

* normalize some en markdown

* normalize some en markdown

* admonition support

* normalize

* normalize

* normalize

* support wide tables

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* normalize

* lightly edited machine translation of introdpection.md

* lightly edited machhine translation of lazy.md

* WIP on translation utils

* Normalize ru docs

* Normalize other languages

* some fixes

* WIP on normalize/translate tools

* add requirements.txt

* [experimental] add es docs language as machine translated draft

* remove duplicate script

* Back to wider tab-stop (narrow renders not so well)
											
										
										
											2020-03-21 04:11:51 +00:00
+								-   1, если строка начинается указанным префиксом.
 								-   0, если строка не начинается указанным префиксом.
-												Fix startsWith function

											
										
										
											2019-09-26 11:39:06 +00:00
 								**Пример**
 								Запрос:
-												WIP on docs translation/normalization tools (#9783)


											
										
										
											2020-03-20 18:20:59 +00:00
+								``` sql
-												Fix startsWith function

											
										
										
											2019-09-26 11:39:06 +00:00
+								SELECT startsWith('Hello, world!', 'He');
 								```
-												Edit and translate to Russian

Поправил шаблоны в английской и русской версиях.

											
										
										
											2021-03-13 18:18:45 +00:00
+								Результат:
-												Fix startsWith function

											
										
										
											2019-09-26 11:39:06 +00:00
-												WIP on docs translation/normalization tools (#9783)


											
										
										
											2020-03-20 18:20:59 +00:00
+								``` text
-												Fix startsWith function

											
										
										
											2019-09-26 11:39:06 +00:00
+								┌─startsWith('Hello, world!', 'He')─┐
 								│                                 1 │
 								└───────────────────────────────────┘
 								```
-												DOCAPI-7695: Functions support for indexes (#6784)


											
										
										
											2019-09-06 09:07:23 +00:00
-												Documentation: trim() SQL Syntax (#8532)

* Update string_functions.md

Описание trim(TRIM([[LEADING|TRAILING|BOTH] trim_character FROM ] input_string))

* Update string_functions.md

* Update string_functions.md

Trim: alternative SQL syntax

* Update string_functions.md

* Update string_functions.md

* Update string_functions.md

* Update string_functions.md

* Update string_functions.md

* Update string_functions.md

* Update string_functions.md

* Update string_functions.md

* Update string_functions.md

* Update string_functions.md

* Update string_functions.md

											
										
										
											2020-01-05 22:50:16 +00:00
+								## trim {#trim}
 								Удаляет все указанные символы с начала или окончания строки.
 								По умолчанию удаляет все последовательные вхождения обычных пробелов (32 символ ASCII) с обоих концов строки.
 								**Синтаксис**
-												WIP on docs translation/normalization tools (#9783)


											
										
										
											2020-03-20 18:20:59 +00:00
+								``` sql
-												Documentation: trim() SQL Syntax (#8532)

* Update string_functions.md

Описание trim(TRIM([[LEADING|TRAILING|BOTH] trim_character FROM ] input_string))

* Update string_functions.md

* Update string_functions.md

Trim: alternative SQL syntax

* Update string_functions.md

* Update string_functions.md

* Update string_functions.md

* Update string_functions.md

* Update string_functions.md

* Update string_functions.md

* Update string_functions.md

* Update string_functions.md

* Update string_functions.md

* Update string_functions.md

* Update string_functions.md

											
										
										
											2020-01-05 22:50:16 +00:00
+								trim([[LEADING|TRAILING|BOTH] trim_character FROM] input_string)
 								```
-												Edit and translate to Russian

Поправил шаблоны в английской и русской версиях.

											
										
										
											2021-03-13 18:18:45 +00:00
+								**Аргументы**
-												Documentation: trim() SQL Syntax (#8532)

* Update string_functions.md

Описание trim(TRIM([[LEADING|TRAILING|BOTH] trim_character FROM ] input_string))

* Update string_functions.md

* Update string_functions.md

Trim: alternative SQL syntax

* Update string_functions.md

* Update string_functions.md

* Update string_functions.md

* Update string_functions.md

* Update string_functions.md

* Update string_functions.md

* Update string_functions.md

* Update string_functions.md

* Update string_functions.md

* Update string_functions.md

* Update string_functions.md

											
										
										
											2020-01-05 22:50:16 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								-   `trim_character` — один или несколько символов, подлежащие удалению. [String](../../sql-reference/functions/string-functions.md).
 								-   `input_string` — строка для обрезки. [String](../../sql-reference/functions/string-functions.md).
-												Documentation: trim() SQL Syntax (#8532)

* Update string_functions.md

Описание trim(TRIM([[LEADING|TRAILING|BOTH] trim_character FROM ] input_string))

* Update string_functions.md

* Update string_functions.md

Trim: alternative SQL syntax

* Update string_functions.md

* Update string_functions.md

* Update string_functions.md

* Update string_functions.md

* Update string_functions.md

* Update string_functions.md

* Update string_functions.md

* Update string_functions.md

* Update string_functions.md

* Update string_functions.md

* Update string_functions.md

											
										
										
											2020-01-05 22:50:16 +00:00
 								**Возвращаемое значение**
 								Исходную строку после обрезки с левого и (или) правого концов строки.
 								Тип: `String`.
 								**Пример**
 								Запрос:
-												WIP on docs translation/normalization tools (#9783)


											
										
										
											2020-03-20 18:20:59 +00:00
+								``` sql
-												Edit and translate to Russian

Поправил шаблоны в английской и русской версиях.

											
										
										
											2021-03-13 18:18:45 +00:00
+								SELECT trim(BOTH ' ()' FROM '(   Hello, world!   )');
-												Documentation: trim() SQL Syntax (#8532)

* Update string_functions.md

Описание trim(TRIM([[LEADING|TRAILING|BOTH] trim_character FROM ] input_string))

* Update string_functions.md

* Update string_functions.md

Trim: alternative SQL syntax

* Update string_functions.md

* Update string_functions.md

* Update string_functions.md

* Update string_functions.md

* Update string_functions.md

* Update string_functions.md

* Update string_functions.md

* Update string_functions.md

* Update string_functions.md

* Update string_functions.md

* Update string_functions.md

											
										
										
											2020-01-05 22:50:16 +00:00
+								```
-												Edit and translate to Russian

Поправил шаблоны в английской и русской версиях.

											
										
										
											2021-03-13 18:18:45 +00:00
+								Результат:
-												Documentation: trim() SQL Syntax (#8532)

* Update string_functions.md

Описание trim(TRIM([[LEADING|TRAILING|BOTH] trim_character FROM ] input_string))

* Update string_functions.md

* Update string_functions.md

Trim: alternative SQL syntax

* Update string_functions.md

* Update string_functions.md

* Update string_functions.md

* Update string_functions.md

* Update string_functions.md

* Update string_functions.md

* Update string_functions.md

* Update string_functions.md

* Update string_functions.md

* Update string_functions.md

* Update string_functions.md

											
										
										
											2020-01-05 22:50:16 +00:00
-												WIP on docs translation/normalization tools (#9783)


											
										
										
											2020-03-20 18:20:59 +00:00
+								``` text
-												Documentation: trim() SQL Syntax (#8532)

* Update string_functions.md

Описание trim(TRIM([[LEADING|TRAILING|BOTH] trim_character FROM ] input_string))

* Update string_functions.md

* Update string_functions.md

Trim: alternative SQL syntax

* Update string_functions.md

* Update string_functions.md

* Update string_functions.md

* Update string_functions.md

* Update string_functions.md

* Update string_functions.md

* Update string_functions.md

* Update string_functions.md

* Update string_functions.md

* Update string_functions.md

* Update string_functions.md

											
										
										
											2020-01-05 22:50:16 +00:00
+								┌─trim(BOTH ' ()' FROM '(   Hello, world!   )')─┐
 								│ Hello, world!                                 │
 								└───────────────────────────────────────────────┘
 								```
-												Docs: added docs for trimLeft, trimRight, trimBoth (#7924)


											
										
										
											2019-12-05 10:03:35 +00:00
+								## trimLeft {#trimleft}
 								Удаляет все последовательные вхождения обычных пробелов (32 символ ASCII) с левого конца строки. Не удаляет другие виды пробелов (табуляция, пробел без разрыва и т. д.).
-												WIP on docs translation/normalization tools (#9783)


											
										
										
											2020-03-20 18:20:59 +00:00
+								**Синтаксис**
-												Docs: added docs for trimLeft, trimRight, trimBoth (#7924)


											
										
										
											2019-12-05 10:03:35 +00:00
-												WIP on docs translation/normalization tools (#9783)


											
										
										
											2020-03-20 18:20:59 +00:00
+								``` sql
-												Documentation: trim() SQL Syntax (#8532)

* Update string_functions.md

Описание trim(TRIM([[LEADING|TRAILING|BOTH] trim_character FROM ] input_string))

* Update string_functions.md

* Update string_functions.md

Trim: alternative SQL syntax

* Update string_functions.md

* Update string_functions.md

* Update string_functions.md

* Update string_functions.md

* Update string_functions.md

* Update string_functions.md

* Update string_functions.md

* Update string_functions.md

* Update string_functions.md

* Update string_functions.md

* Update string_functions.md

											
										
										
											2020-01-05 22:50:16 +00:00
+								trimLeft(input_string)
-												Docs: added docs for trimLeft, trimRight, trimBoth (#7924)


											
										
										
											2019-12-05 10:03:35 +00:00
+								```
-												Documentation: trim() SQL Syntax (#8532)

* Update string_functions.md

Описание trim(TRIM([[LEADING|TRAILING|BOTH] trim_character FROM ] input_string))

* Update string_functions.md

* Update string_functions.md

Trim: alternative SQL syntax

* Update string_functions.md

* Update string_functions.md

* Update string_functions.md

* Update string_functions.md

* Update string_functions.md

* Update string_functions.md

* Update string_functions.md

* Update string_functions.md

* Update string_functions.md

* Update string_functions.md

* Update string_functions.md

											
										
										
											2020-01-05 22:50:16 +00:00
+								Алиас: `ltrim(input_string)`.
-												Docs: added docs for trimLeft, trimRight, trimBoth (#7924)


											
										
										
											2019-12-05 10:03:35 +00:00
-												Edit and translate to Russian

Поправил шаблоны в английской и русской версиях.

											
										
										
											2021-03-13 18:18:45 +00:00
+								**Аргументы**
-												Docs: added docs for trimLeft, trimRight, trimBoth (#7924)


											
										
										
											2019-12-05 10:03:35 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								-   `input_string` — строка для обрезки. [String](../../sql-reference/functions/string-functions.md).
-												Docs: added docs for trimLeft, trimRight, trimBoth (#7924)


											
										
										
											2019-12-05 10:03:35 +00:00
 								**Возвращаемое значение**
 								Исходную строку без общих пробельных символов слева.
 								Тип: `String`.
 								**Пример**
 								Запрос:
-												WIP on docs translation/normalization tools (#9783)


											
										
										
											2020-03-20 18:20:59 +00:00
+								``` sql
-												Edit and translate to Russian

Поправил шаблоны в английской и русской версиях.

											
										
										
											2021-03-13 18:18:45 +00:00
+								SELECT trimLeft('     Hello, world!     ');
-												Docs: added docs for trimLeft, trimRight, trimBoth (#7924)


											
										
										
											2019-12-05 10:03:35 +00:00
+								```
-												Edit and translate to Russian

Поправил шаблоны в английской и русской версиях.

											
										
										
											2021-03-13 18:18:45 +00:00
+								Результат:
-												Docs: added docs for trimLeft, trimRight, trimBoth (#7924)


											
										
										
											2019-12-05 10:03:35 +00:00
-												WIP on docs translation/normalization tools (#9783)


											
										
										
											2020-03-20 18:20:59 +00:00
+								``` text
-												Docs: added docs for trimLeft, trimRight, trimBoth (#7924)


											
										
										
											2019-12-05 10:03:35 +00:00
+								┌─trimLeft('     Hello, world!     ')─┐
 								│ Hello, world!                       │
 								└─────────────────────────────────────┘
 								```
-												WIP on docs translation/normalization tools (#9783)


											
										
										
											2020-03-20 18:20:59 +00:00
+								## trimRight {#trimright}
-												Docs: added docs for trimLeft, trimRight, trimBoth (#7924)


											
										
										
											2019-12-05 10:03:35 +00:00
 								Удаляет все последовательные вхождения обычных пробелов (32 символ ASCII) с правого конца строки. Не удаляет другие виды пробелов (табуляция, пробел без разрыва и т. д.).
-												WIP on docs translation/normalization tools (#9783)


											
										
										
											2020-03-20 18:20:59 +00:00
+								**Синтаксис**
-												Docs: added docs for trimLeft, trimRight, trimBoth (#7924)


											
										
										
											2019-12-05 10:03:35 +00:00
-												WIP on docs translation/normalization tools (#9783)


											
										
										
											2020-03-20 18:20:59 +00:00
+								``` sql
-												Documentation: trim() SQL Syntax (#8532)

* Update string_functions.md

Описание trim(TRIM([[LEADING|TRAILING|BOTH] trim_character FROM ] input_string))

* Update string_functions.md

* Update string_functions.md

Trim: alternative SQL syntax

* Update string_functions.md

* Update string_functions.md

* Update string_functions.md

* Update string_functions.md

* Update string_functions.md

* Update string_functions.md

* Update string_functions.md

* Update string_functions.md

* Update string_functions.md

* Update string_functions.md

* Update string_functions.md

											
										
										
											2020-01-05 22:50:16 +00:00
+								trimRight(input_string)
-												Docs: added docs for trimLeft, trimRight, trimBoth (#7924)


											
										
										
											2019-12-05 10:03:35 +00:00
+								```
-												Documentation: trim() SQL Syntax (#8532)

* Update string_functions.md

Описание trim(TRIM([[LEADING|TRAILING|BOTH] trim_character FROM ] input_string))

* Update string_functions.md

* Update string_functions.md

Trim: alternative SQL syntax

* Update string_functions.md

* Update string_functions.md

* Update string_functions.md

* Update string_functions.md

* Update string_functions.md

* Update string_functions.md

* Update string_functions.md

* Update string_functions.md

* Update string_functions.md

* Update string_functions.md

* Update string_functions.md

											
										
										
											2020-01-05 22:50:16 +00:00
+								Алиас: `rtrim(input_string)`.
-												Docs: added docs for trimLeft, trimRight, trimBoth (#7924)


											
										
										
											2019-12-05 10:03:35 +00:00
-												Edit and translate to Russian

Поправил шаблоны в английской и русской версиях.

											
										
										
											2021-03-13 18:18:45 +00:00
+								**Аргументы**
-												Docs: added docs for trimLeft, trimRight, trimBoth (#7924)


											
										
										
											2019-12-05 10:03:35 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								-   `input_string` — строка для обрезки. [String](../../sql-reference/functions/string-functions.md).
-												Docs: added docs for trimLeft, trimRight, trimBoth (#7924)


											
										
										
											2019-12-05 10:03:35 +00:00
 								**Возвращаемое значение**
 								Исходную строку без общих пробельных символов справа.
 								Тип: `String`.
 								**Пример**
 								Запрос:
-												WIP on docs translation/normalization tools (#9783)


											
										
										
											2020-03-20 18:20:59 +00:00
+								``` sql
-												Edit and translate to Russian

Поправил шаблоны в английской и русской версиях.

											
										
										
											2021-03-13 18:18:45 +00:00
+								SELECT trimRight('     Hello, world!     ');
-												Docs: added docs for trimLeft, trimRight, trimBoth (#7924)


											
										
										
											2019-12-05 10:03:35 +00:00
+								```
-												Edit and translate to Russian

Поправил шаблоны в английской и русской версиях.

											
										
										
											2021-03-13 18:18:45 +00:00
+								Результат:
-												Docs: added docs for trimLeft, trimRight, trimBoth (#7924)


											
										
										
											2019-12-05 10:03:35 +00:00
-												WIP on docs translation/normalization tools (#9783)


											
										
										
											2020-03-20 18:20:59 +00:00
+								``` text
-												Docs: added docs for trimLeft, trimRight, trimBoth (#7924)


											
										
										
											2019-12-05 10:03:35 +00:00
+								┌─trimRight('     Hello, world!     ')─┐
 								│      Hello, world!                   │
 								└──────────────────────────────────────┘
 								```
 								## trimBoth {#trimboth}
 								Удаляет все последовательные вхождения обычных пробелов (32 символ ASCII) с обоих концов строки. Не удаляет другие виды пробелов (табуляция, пробел без разрыва и т. д.).
-												WIP on docs translation/normalization tools (#9783)


											
										
										
											2020-03-20 18:20:59 +00:00
+								**Синтаксис**
-												Docs: added docs for trimLeft, trimRight, trimBoth (#7924)


											
										
										
											2019-12-05 10:03:35 +00:00
-												WIP on docs translation/normalization tools (#9783)


											
										
										
											2020-03-20 18:20:59 +00:00
+								``` sql
-												Documentation: trim() SQL Syntax (#8532)

* Update string_functions.md

Описание trim(TRIM([[LEADING|TRAILING|BOTH] trim_character FROM ] input_string))

* Update string_functions.md

* Update string_functions.md

Trim: alternative SQL syntax

* Update string_functions.md

* Update string_functions.md

* Update string_functions.md

* Update string_functions.md

* Update string_functions.md

* Update string_functions.md

* Update string_functions.md

* Update string_functions.md

* Update string_functions.md

* Update string_functions.md

* Update string_functions.md

											
										
										
											2020-01-05 22:50:16 +00:00
+								trimBoth(input_string)
-												Docs: added docs for trimLeft, trimRight, trimBoth (#7924)


											
										
										
											2019-12-05 10:03:35 +00:00
+								```
-												Documentation: trim() SQL Syntax (#8532)

* Update string_functions.md

Описание trim(TRIM([[LEADING|TRAILING|BOTH] trim_character FROM ] input_string))

* Update string_functions.md

* Update string_functions.md

Trim: alternative SQL syntax

* Update string_functions.md

* Update string_functions.md

* Update string_functions.md

* Update string_functions.md

* Update string_functions.md

* Update string_functions.md

* Update string_functions.md

* Update string_functions.md

* Update string_functions.md

* Update string_functions.md

* Update string_functions.md

											
										
										
											2020-01-05 22:50:16 +00:00
+								Алиас: `trim(input_string)`.
-												Docs: added docs for trimLeft, trimRight, trimBoth (#7924)


											
										
										
											2019-12-05 10:03:35 +00:00
-												Edit and translate to Russian

Поправил шаблоны в английской и русской версиях.

											
										
										
											2021-03-13 18:18:45 +00:00
+								**Аргументы**
-												Docs: added docs for trimLeft, trimRight, trimBoth (#7924)


											
										
										
											2019-12-05 10:03:35 +00:00
-												[docs] replace underscores with hyphens (#10606)

* Replace underscores with hyphens

* remove temporary code

* fix style check

* fix collapse
											
										
										
											2020-04-30 18:19:18 +00:00
+								-   `input_string` — строка для обрезки. [String](../../sql-reference/functions/string-functions.md).
-												Docs: added docs for trimLeft, trimRight, trimBoth (#7924)


											
										
										
											2019-12-05 10:03:35 +00:00
 								**Возвращаемое значение**
 								Исходную строку без общих пробельных символов с обоих концов строки.
 								Тип: `String`.
 								**Пример**
 								Запрос:
-												WIP on docs translation/normalization tools (#9783)


											
										
										
											2020-03-20 18:20:59 +00:00
+								``` sql
-												Edit and translate to Russian

Поправил шаблоны в английской и русской версиях.

											
										
										
											2021-03-13 18:18:45 +00:00
+								SELECT trimBoth('     Hello, world!     ');
-												Docs: added docs for trimLeft, trimRight, trimBoth (#7924)


											
										
										
											2019-12-05 10:03:35 +00:00
+								```
-												Edit and translate to Russian

Поправил шаблоны в английской и русской версиях.

											
										
										
											2021-03-13 18:18:45 +00:00
+								Результат:
-												Docs: added docs for trimLeft, trimRight, trimBoth (#7924)


											
										
										
											2019-12-05 10:03:35 +00:00
-												WIP on docs translation/normalization tools (#9783)


											
										
										
											2020-03-20 18:20:59 +00:00
+								``` text
-												Docs: added docs for trimLeft, trimRight, trimBoth (#7924)


											
										
										
											2019-12-05 10:03:35 +00:00
+								┌─trimBoth('     Hello, world!     ')─┐
 								│ Hello, world!                       │
 								└─────────────────────────────────────┘
 								```
-												emironyuk-DOCSUP-782 (#90) (#9725)

* docs(string functions): synchronization of ru-en versions

* docs(string_functions): links fixed

* docs(string functions): mid(s, offset, length), substr(s, offset, length) added to substring(s, offset,length)

* docs(string function): fix count form for bytes

Co-authored-by: emironyuk <emironyuk@yandex-team.ru>

Co-authored-by: emironyuk <62014692+emironyuk@users.noreply.github.com>
Co-authored-by: emironyuk <emironyuk@yandex-team.ru>
Co-authored-by: Sergei Shtykov <bayonet@yandex-team.ru>
											
										
										
											2020-03-19 15:32:53 +00:00
+								## CRC32(s) {#crc32}
-												Fix startsWith function

											
										
										
											2019-09-26 11:39:06 +00:00
-												Add CRC32IEEE()/CRC64() support

zlib's implementation uses CRC-32-IEEE 802.3 polynomial (0xedb88320) but
with starting value 0xffffffff, so introduce another crc32
implementation - CRC32IEEE that has starting value - 0

Also add CRC64 with ECMA polynomial.

v2: s/crc*_data./crc*_data./ to avoid conflicts with other crc32.h in contrib
v3: join with existing CRC32()

											
										
										
											2019-10-20 20:04:52 +00:00
+								Возвращает чексумму CRC32 данной строки, используется CRC-32-IEEE 802.3 многочлен и начальным значением `0xffffffff` (т.к. используется реализация из zlib).
-												emironyuk-DOCSUP-782 (#90) (#9725)

* docs(string functions): synchronization of ru-en versions

* docs(string_functions): links fixed

* docs(string functions): mid(s, offset, length), substr(s, offset, length) added to substring(s, offset,length)

* docs(string function): fix count form for bytes

Co-authored-by: emironyuk <emironyuk@yandex-team.ru>

Co-authored-by: emironyuk <62014692+emironyuk@users.noreply.github.com>
Co-authored-by: emironyuk <emironyuk@yandex-team.ru>
Co-authored-by: Sergei Shtykov <bayonet@yandex-team.ru>
											
										
										
											2020-03-19 15:32:53 +00:00
+								Тип результата — UInt32.
-												Add CRC32IEEE()/CRC64() support

zlib's implementation uses CRC-32-IEEE 802.3 polynomial (0xedb88320) but
with starting value 0xffffffff, so introduce another crc32
implementation - CRC32IEEE that has starting value - 0

Also add CRC64 with ECMA polynomial.

v2: s/crc*_data./crc*_data./ to avoid conflicts with other crc32.h in contrib
v3: join with existing CRC32()

											
										
										
											2019-10-20 20:04:52 +00:00
-												emironyuk-DOCSUP-782 (#90) (#9725)

* docs(string functions): synchronization of ru-en versions

* docs(string_functions): links fixed

* docs(string functions): mid(s, offset, length), substr(s, offset, length) added to substring(s, offset,length)

* docs(string function): fix count form for bytes

Co-authored-by: emironyuk <emironyuk@yandex-team.ru>

Co-authored-by: emironyuk <62014692+emironyuk@users.noreply.github.com>
Co-authored-by: emironyuk <emironyuk@yandex-team.ru>
Co-authored-by: Sergei Shtykov <bayonet@yandex-team.ru>
											
										
										
											2020-03-19 15:32:53 +00:00
+								## CRC32IEEE(s) {#crc32ieee}
-												Add CRC32IEEE()/CRC64() support

zlib's implementation uses CRC-32-IEEE 802.3 polynomial (0xedb88320) but
with starting value 0xffffffff, so introduce another crc32
implementation - CRC32IEEE that has starting value - 0

Also add CRC64 with ECMA polynomial.

v2: s/crc*_data./crc*_data./ to avoid conflicts with other crc32.h in contrib
v3: join with existing CRC32()

											
										
										
											2019-10-20 20:04:52 +00:00
 								Возвращает чексумму CRC32 данной строки, используется CRC-32-IEEE 802.3 многочлен.
-												emironyuk-DOCSUP-782 (#90) (#9725)

* docs(string functions): synchronization of ru-en versions

* docs(string_functions): links fixed

* docs(string functions): mid(s, offset, length), substr(s, offset, length) added to substring(s, offset,length)

* docs(string function): fix count form for bytes

Co-authored-by: emironyuk <emironyuk@yandex-team.ru>

Co-authored-by: emironyuk <62014692+emironyuk@users.noreply.github.com>
Co-authored-by: emironyuk <emironyuk@yandex-team.ru>
Co-authored-by: Sergei Shtykov <bayonet@yandex-team.ru>
											
										
										
											2020-03-19 15:32:53 +00:00
+								Тип результата — UInt32.
-												Support crc32 function

											
										
										
											2019-06-17 21:49:37 +00:00
-												emironyuk-DOCSUP-782 (#90) (#9725)

* docs(string functions): synchronization of ru-en versions

* docs(string_functions): links fixed

* docs(string functions): mid(s, offset, length), substr(s, offset, length) added to substring(s, offset,length)

* docs(string function): fix count form for bytes

Co-authored-by: emironyuk <emironyuk@yandex-team.ru>

Co-authored-by: emironyuk <62014692+emironyuk@users.noreply.github.com>
Co-authored-by: emironyuk <emironyuk@yandex-team.ru>
Co-authored-by: Sergei Shtykov <bayonet@yandex-team.ru>
											
										
										
											2020-03-19 15:32:53 +00:00
+								## CRC64(s) {#crc64}
-												Add CRC32IEEE()/CRC64() support

zlib's implementation uses CRC-32-IEEE 802.3 polynomial (0xedb88320) but
with starting value 0xffffffff, so introduce another crc32
implementation - CRC32IEEE that has starting value - 0

Also add CRC64 with ECMA polynomial.

v2: s/crc*_data./crc*_data./ to avoid conflicts with other crc32.h in contrib
v3: join with existing CRC32()

											
										
										
											2019-10-20 20:04:52 +00:00
 								Возвращает чексумму CRC64 данной строки, используется CRC-64-ECMA многочлен.
-												emironyuk-DOCSUP-782 (#90) (#9725)

* docs(string functions): synchronization of ru-en versions

* docs(string_functions): links fixed

* docs(string functions): mid(s, offset, length), substr(s, offset, length) added to substring(s, offset,length)

* docs(string function): fix count form for bytes

Co-authored-by: emironyuk <emironyuk@yandex-team.ru>

Co-authored-by: emironyuk <62014692+emironyuk@users.noreply.github.com>
Co-authored-by: emironyuk <emironyuk@yandex-team.ru>
Co-authored-by: Sergei Shtykov <bayonet@yandex-team.ru>
											
										
										
											2020-03-19 15:32:53 +00:00
+								Тип результата — UInt64.
-												Add CRC32IEEE()/CRC64() support

zlib's implementation uses CRC-32-IEEE 802.3 polynomial (0xedb88320) but
with starting value 0xffffffff, so introduce another crc32
implementation - CRC32IEEE that has starting value - 0

Also add CRC64 with ECMA polynomial.

v2: s/crc*_data./crc*_data./ to avoid conflicts with other crc32.h in contrib
v3: join with existing CRC32()

											
										
										
											2019-10-20 20:04:52 +00:00
-												Translate to Russian

											
										
										
											2020-09-28 20:58:08 +00:00
+								## normalizeQuery {#normalized-query}
 								Заменяет литералы, последовательности литералов и сложные псевдонимы заполнителями.
-												Edit and translate to Russian

Поправил шаблоны в английской и русской версиях.

											
										
										
											2021-03-13 18:18:45 +00:00
+								**Синтаксис**
-												Translate to Russian

											
										
										
											2020-09-28 20:58:08 +00:00
+								``` sql
 								normalizeQuery(x)
 								```
-												Remove trailing whitespaces from docs

											
										
										
											2021-07-29 15:20:55 +00:00
+								**Аргументы**
-												Translate to Russian

											
										
										
											2020-09-28 20:58:08 +00:00
-												Edit and translate to Russian

Поправил шаблоны в английской и русской версиях.

											
										
										
											2021-03-13 18:18:45 +00:00
+								-   `x` — последовательность символов. [String](../../sql-reference/data-types/string.md).
-												Translate to Russian

											
										
										
											2020-09-28 20:58:08 +00:00
 								**Возвращаемое значение**
 								-   Последовательность символов с заполнителями.
 								Тип: [String](../../sql-reference/data-types/string.md).
 								**Пример**
 								Запрос:
 								``` sql
 								SELECT normalizeQuery('[1, 2, 3, x]') AS query;
 								```
 								Результат:
 								``` text
 								┌─query────┐
 								│ [?.., x] │
 								└──────────┘
 								```
 								## normalizedQueryHash {#normalized-query-hash}
 								Возвращает идентичные 64-битные хэш - суммы без значений литералов для аналогичных запросов. Это помогает анализировать журнал запросов.
-												Remove trailing whitespaces from docs

											
										
										
											2021-07-29 15:20:55 +00:00
+								**Синтаксис**
-												Translate to Russian

											
										
										
											2020-09-28 20:58:08 +00:00
 								``` sql
 								normalizedQueryHash(x)
 								```
-												Remove trailing whitespaces from docs

											
										
										
											2021-07-29 15:20:55 +00:00
+								**Аргументы**
-												Translate to Russian

											
										
										
											2020-09-28 20:58:08 +00:00
-												Edit and translate to Russian

Поправил шаблоны в английской и русской версиях.

											
										
										
											2021-03-13 18:18:45 +00:00
+								-   `x` — последовательность символов. [String](../../sql-reference/data-types/string.md).
-												Translate to Russian

											
										
										
											2020-09-28 20:58:08 +00:00
 								**Возвращаемое значение**
 								-   Хэш-сумма.
 								Тип: [UInt64](../../sql-reference/data-types/int-uint.md#uint-ranges).
 								**Пример**
 								Запрос:
 								``` sql
 								SELECT normalizedQueryHash('SELECT 1 AS `xyz`') != normalizedQueryHash('SELECT 1 AS `abc`') AS res;
 								```
 								Результат:
 								``` text
 								┌─res─┐
 								│   1 │
 								└─────┘
 								```
-												Add ru translation for UTF normalized forms.
											
										
										
											2021-10-25 09:46:50 +00:00
+								## normalizeUTF8NFC {#normalizeutf8nfc}
 								Преобразует строку в нормализованную форму [NFC](https://ru.wikipedia.org/wiki/Юникод#Алгоритмы_нормализации), предполагая, что строка содержит набор байтов, составляющих текст в кодировке UTF-8.
 								**Синтаксис**
 								``` sql
-												Update docs/ru/sql-reference/functions/string-functions.md

Co-authored-by: gyuton <40863448+gyuton@users.noreply.github.com>
											
										
										
											2021-10-25 10:44:46 +00:00
+								normalizeUTF8NFC(words)
-												Add ru translation for UTF normalized forms.
											
										
										
											2021-10-25 09:46:50 +00:00
+								```
 								**Аргументы**
 								-   `words` — входная строка, которая содержит набор байтов, составляющих текст в кодировке UTF-8. [String](../../sql-reference/data-types/string.md).
 								**Возвращаемое значение**
 								-   Строка, преобразованная в нормализированную форму NFC.
 								Тип: [String](../../sql-reference/data-types/string.md).
 								**Пример**
 								Запрос:
 								``` sql
 								SELECT length('â'), normalizeUTF8NFC('â') AS nfc, length(nfc) AS nfc_len;
 								```
 								Результат:
 								``` text
 								┌─length('â')─┬─nfc─┬─nfc_len─┐
 								│           2 │ â   │       2 │
 								└─────────────┴─────┴─────────┘
 								```
 								## normalizeUTF8NFD {#normalizeutf8nfd}
 								Преобразует строку в нормализованную форму [NFD](https://ru.wikipedia.org/wiki/Юникод#Алгоритмы_нормализации), предполагая, что строка содержит набор байтов, составляющих текст в кодировке UTF-8.
 								**Синтаксис**
 								``` sql
 								normalizeUTF8NFD(words)
 								```
 								**Аргументы**
 								-   `words` — входная строка, которая содержит набор байтов, составляющих текст в кодировке UTF-8. [String](../../sql-reference/data-types/string.md).
 								**Возвращаемое значение**
 								-   Строка, преобразованная в нормализированную форму NFD.
 								Тип: [String](../../sql-reference/data-types/string.md).
 								**Пример**
 								Запрос:
 								``` sql
 								SELECT length('â'), normalizeUTF8NFD('â') AS nfd, length(nfd) AS nfd_len;
 								```
 								Результат:
 								``` text
 								┌─length('â')─┬─nfd─┬─nfd_len─┐
 								│           2 │ â   │       3 │
 								└─────────────┴─────┴─────────┘
 								```
 								## normalizeUTF8NFKC {#normalizeutf8nfkc}
 								Преобразует строку в нормализованную форму [NFKC](https://ru.wikipedia.org/wiki/Юникод#Алгоритмы_нормализации), предполагая, что строка содержит набор байтов, составляющих текст в кодировке UTF-8.
 								**Синтаксис**
 								``` sql
 								normalizeUTF8NFKC(words)
 								```
 								**Аргументы**
 								-   `words` — входная строка, которая содержит набор байтов, составляющих текст в кодировке UTF-8. [String](../../sql-reference/data-types/string.md).
 								**Возвращаемое значение**
 								-   Строка, преобразованная в нормализированную форму NFKC.
 								Тип: [String](../../sql-reference/data-types/string.md).
 								**Пример**
 								Запрос:
 								``` sql
 								SELECT length('â'), normalizeUTF8NFKC('â') AS nfkc, length(nfkc) AS nfkc_len;
 								```
 								Результат:
 								``` text
 								┌─length('â')─┬─nfkc─┬─nfkc_len─┐
 								│           2 │ â    │        2 │
 								└─────────────┴──────┴──────────┘
 								```
 								## normalizeUTF8NFKD {#normalizeutf8nfkd}
 								Преобразует строку в нормализованную форму [NFKD](https://ru.wikipedia.org/wiki/Юникод#Алгоритмы_нормализации), предполагая, что строка содержит набор байтов, составляющих текст в кодировке UTF-8.
 								**Синтаксис**
 								``` sql
 								normalizeUTF8NFKD(words)
 								```
 								**Аргументы**
 								-   `words` — входная строка, которая содержит набор байтов, составляющих текст в кодировке UTF-8. [String](../../sql-reference/data-types/string.md).
 								**Возвращаемое значение**
 								-   Строка, преобразованная в нормализированную форму NFKD.
 								Тип: [String](../../sql-reference/data-types/string.md).
 								**Пример**
 								Запрос:
 								``` sql
 								SELECT length('â'), normalizeUTF8NFKD('â') AS nfkd, length(nfkd) AS nfkd_len;
 								```
 								Результат:
 								``` text
 								┌─length('â')─┬─nfkd─┬─nfkd_len─┐
 								│           2 │ â    │        3 │
 								└─────────────┴──────┴──────────┘
 								```
-												Edit and translate to Russian

Внес поправки в английскую версию и выполнил перевод на русский язык.

											
										
										
											2021-01-18 15:24:17 +00:00
+								## encodeXMLComponent {#encode-xml-component}
-												Fix translation

Поправил перевод.

											
										
										
											2021-01-19 15:24:37 +00:00
+								Экранирует символы для размещения строки в текстовом узле или атрибуте XML.
-												Edit and translate to Russian

Внес поправки в английскую версию и выполнил перевод на русский язык.

											
										
										
											2021-01-18 15:24:17 +00:00
-												Fix translation

Поправил перевод.

											
										
										
											2021-01-19 15:24:37 +00:00
+								Экранируются символы, которые в формате XML являются зарезервированными (служебными): `<`, `&`, `>`, `"`, `'`.
-												Edit and translate to Russian

Внес поправки в английскую версию и выполнил перевод на русский язык.

											
										
										
											2021-01-18 15:24:17 +00:00
-												Remove trailing whitespaces from docs

											
										
										
											2021-07-29 15:20:55 +00:00
+								**Синтаксис**
-												Edit and translate to Russian

Внес поправки в английскую версию и выполнил перевод на русский язык.

											
										
										
											2021-01-18 15:24:17 +00:00
 								``` sql
 								encodeXMLComponent(x)
 								```
-												Remove trailing whitespaces from docs

											
										
										
											2021-07-29 15:20:55 +00:00
+								**Аргументы**
-												Edit and translate to Russian

Внес поправки в английскую версию и выполнил перевод на русский язык.

											
										
										
											2021-01-18 15:24:17 +00:00
 								-   `x` — последовательность символов. [String](../../sql-reference/data-types/string.md).
 								**Возвращаемое значение**
-												Fix translation

Поправил перевод.

											
										
										
											2021-01-19 15:24:37 +00:00
+								-   Строка, в которой зарезервированные символы экранированы.
-												Edit and translate to Russian

Внес поправки в английскую версию и выполнил перевод на русский язык.

											
										
										
											2021-01-18 15:24:17 +00:00
 								Тип: [String](../../sql-reference/data-types/string.md).
 								**Пример**
 								Запрос:
 								``` sql
 								SELECT encodeXMLComponent('Hello, "world"!');
 								SELECT encodeXMLComponent('<123>');
 								SELECT encodeXMLComponent('&clickhouse');
 								SELECT encodeXMLComponent('\'foo\'');
 								```
 								Результат:
 								``` text
 								Hello, &quot;world&quot;!
 								&lt;123&gt;
 								&amp;clickhouse
 								&apos;foo&apos;
 								```
-												ru translation

											
										
										
											2021-02-15 15:58:46 +00:00
+								## decodeXMLComponent {#decode-xml-component}
 								Заменяет символами предопределенные мнемоники XML: `&quot;` `&amp;` `&apos;` `&gt;` `&lt;`
-												Unnecessary new lines removed

											
										
										
											2021-02-15 18:25:32 +00:00
+								Также эта функция заменяет числовые ссылки соответствующими символами юникод. Поддерживаются десятичная (например, `&#10003;`) и шестнадцатеричная (`&#x2713;`) формы.
-												ru translation

											
										
										
											2021-02-15 15:58:46 +00:00
 								**Синтаксис**
 								``` sql
 								decodeXMLComponent(x)
 								```
-												Edit and translate to Russian

Поправил шаблоны в английской и русской версиях.

											
										
										
											2021-03-13 18:18:45 +00:00
+								**Аргументы**
-												ru translation

											
										
										
											2021-02-15 15:58:46 +00:00
 								-   `x` — последовательность символов. [String](../../sql-reference/data-types/string.md).
 								**Возвращаемое значение**
 								-   Строка с произведенными заменами.
 								Тип: [String](../../sql-reference/data-types/string.md).
 								**Пример**
 								Запрос:
 								``` sql
 								SELECT decodeXMLComponent('&apos;foo&apos;');
 								SELECT decodeXMLComponent('&lt; &#x3A3; &gt;');
 								```
 								Результат:
 								``` text
-												Remove trailing whitespaces from docs

											
										
										
											2021-07-29 15:20:55 +00:00
+								'foo'
-												ru translation

											
										
										
											2021-02-15 15:58:46 +00:00
+								< Σ >
 								```
 								**Смотрите также**
 								-   [Мнемоники в HTML](https://ru.wikipedia.org/wiki/%D0%9C%D0%BD%D0%B5%D0%BC%D0%BE%D0%BD%D0%B8%D0%BA%D0%B8_%D0%B2_HTML)
-												Russian translation. Format changed a bit in english.

											
										
										
											2021-04-05 20:19:18 +00:00
 								## extractTextFromHTML {#extracttextfromhtml}
-												ru description, en dot fix

											
										
										
											2021-04-07 19:23:53 +00:00
+								Функция для извлечения текста из HTML или XHTML.
-												russian description updated

											
										
										
											2021-04-08 20:01:19 +00:00
+								Она не соответствует всем HTML, XML или XHTML стандартам на 100%, но ее реализация достаточно точная и быстрая. Правила обработки следующие:
-												ru description, en dot fix

											
										
										
											2021-04-07 19:23:53 +00:00
-												russian description updated

											
										
										
											2021-04-08 20:01:19 +00:00
+. Комментарии удаляются. Пример: `<!-- test -->`. Комментарий должен оканчиваться символами `-->`. Вложенные комментарии недопустимы.
-												ru description, en dot fix

											
										
										
											2021-04-07 19:23:53 +00:00
+								Примечание: конструкции наподобие `<!-->` и `<!--->` не являются допустимыми комментариями в HTML, но они будут удалены согласно другим правилам.
-												russian description updated

											
										
										
											2021-04-08 20:01:19 +00:00
+. Содержимое CDATA вставляется дословно. Примечание: формат CDATA специфичен для XML/XHTML. Но он обрабатывается всегда по принципу "наилучшего возможного результата".
-												ru description, en dot fix

											
										
										
											2021-04-07 19:23:53 +00:00
+. Элементы `script` и `style` удаляются вместе со всем содержимым. Примечание: предполагается, что закрывающий тег не может появиться внутри содержимого. Например, в JS строковый литерал должен быть экранирован как `"<\/script>"`.
 								Примечание: комментарии и CDATA возможны внутри `script` или `style` - тогда закрывающие теги не ищутся внутри CDATA. Пример: `<script><![CDATA[</script>]]></script>`. Но они ищутся внутри комментариев. Иногда возникают сложные случаи: `<script>var x = "<!--"; </script> var y = "-->"; alert(x + y);</script>`
-												russian description updated

											
										
										
											2021-04-08 20:01:19 +00:00
+								Примечание: `script` и `style` могут быть названиями пространств имен XML - тогда они не обрабатываются как обычные элементы `script` или `style`. Пример: `<script:a>Hello</script:a>`.
-												ru description, en dot fix

											
										
										
											2021-04-07 19:23:53 +00:00
+								Примечание: пробелы возможны после имени закрывающего тега: `</script >`, но не перед ним: `< / script>`.
 . Другие теги или элементы, подобные тегам, удаляются, а их внутреннее содержимое остается. Пример: `<a>.</a>`
 								Примечание: ожидается, что такой HTML является недопустимым: `<a test=">"></a>`
 								Примечание: функция также удаляет подобные тегам элементы: `<>`, `<!>`, и т. д.
-												russian description updated

											
										
										
											2021-04-08 20:01:19 +00:00
+								Примечание: если встречается тег без завершающего символа `>`, то удаляется этот тег и весь следующий за ним текст: `<hello `
-												ru description, en dot fix

											
										
										
											2021-04-07 19:23:53 +00:00
+. Мнемоники HTML и XML не декодируются. Они должны быть обработаны отдельной функцией.
-												russian description updated

											
										
										
											2021-04-08 20:01:19 +00:00
+. Пробелы в тексте удаляются и добавляются по следующим правилам:
-												ru description, en dot fix

											
										
										
											2021-04-07 19:23:53 +00:00
+								- Пробелы в начале и в конце извлеченного текста удаляются.
-												russian description updated

											
										
										
											2021-04-08 20:01:19 +00:00
+								- Несколько пробелов подряд заменяются одним пробелом.
 								- Если текст разделен другими удаляемыми элементами и в этом месте нет пробела, он добавляется.
 								- Это может привести к появлению неестественного написания, например: `Hello<b>world</b>`, `Hello<!-- -->world` — в HTML нет пробелов, но функция вставляет их. Также следует учитывать такие варианты написания: `Hello<p>world</p>`, `Hello<br>world`. Подобные результаты выполнения функции могут использоваться для анализа данных, например, для преобразования HTML-текста в набор используемых слов.
-												ru description, en dot fix

											
										
										
											2021-04-07 19:23:53 +00:00
+. Также обратите внимание, что правильная обработка пробелов требует поддержки `<pre></pre>` и свойств CSS `display` и `white-space`.
-												Russian translation. Format changed a bit in english.

											
										
										
											2021-04-05 20:19:18 +00:00
 								**Синтаксис**
 								``` sql
 								extractTextFromHTML(x)
 								```
 								**Аргументы**
-												Remove trailing whitespaces from docs

											
										
										
											2021-07-29 15:20:55 +00:00
+								-   `x` — текст для обработки. [String](../../sql-reference/data-types/string.md).
-												Russian translation. Format changed a bit in english.

											
										
										
											2021-04-05 20:19:18 +00:00
 								**Возвращаемое значение**
-												Changed some words. Fixed typos

											
										
										
											2021-04-05 20:34:10 +00:00
+								-   Извлеченный текст.
-												Russian translation. Format changed a bit in english.

											
										
										
											2021-04-05 20:19:18 +00:00
 								Тип: [String](../../sql-reference/data-types/string.md).
 								**Пример**
-												Changed some words. Fixed typos

											
										
										
											2021-04-05 20:34:10 +00:00
+								Первый пример содержит несколько тегов и комментарий. На этом примере также видно, как обрабатываются пробелы.
-												Russian translation. Format changed a bit in english.

											
										
										
											2021-04-05 20:19:18 +00:00
+								Второй пример показывает обработку `CDATA` и тега `script`.
-												russian description updated

											
										
										
											2021-04-08 20:01:19 +00:00
+								В третьем примере текст выделяется из полного HTML ответа, полученного с помощью функции [url](../../sql-reference/table-functions/url.md).
-												Russian translation. Format changed a bit in english.

											
										
										
											2021-04-05 20:19:18 +00:00
 								Запрос:
 								``` sql
-												ru example fixed

											
										
										
											2021-04-05 20:58:07 +00:00
+								SELECT extractTextFromHTML(' <p> A text <i>with</i><b>tags</b>. <!-- comments --> </p> ');
-												Russian translation. Format changed a bit in english.

											
										
										
											2021-04-05 20:19:18 +00:00
+								SELECT extractTextFromHTML('<![CDATA[The content within <b>CDATA</b>]]> <script>alert("Script");</script>');
 								SELECT extractTextFromHTML(html) FROM url('http://www.donothingfor2minutes.com/', RawBLOB, 'html String');
 								```
 								Результат:
 								``` text
-												ru example fixed

											
										
										
											2021-04-05 20:58:07 +00:00
+								A text with tags .
-												Russian translation. Format changed a bit in english.

											
										
										
											2021-04-05 20:19:18 +00:00
+								The content within <b>CDATA</b>
 								Do Nothing for 2 Minutes 2:00 &nbsp;
 								```
-												Add initcap prototype / tests

											
										
										
											2023-06-30 13:11:06 +00:00
 								## initcap {#initcap}
-												Add initcapUtf8: impl + tests

											
										
										
											2023-07-03 11:37:55 +00:00
+								Переводит первую букву каждого слова в строке в верхний регистр, а остальные — в нижний. Словами считаются последовательности алфавитно-цифровых символов, разделённые любыми другими символами.
 								## initcapUTF8 {#initcapUTF8}
-												Fix ru docs

											
										
										
											2023-07-03 13:25:16 +00:00
+								Как [initcap](#initcap), предполагая, что строка содержит набор байтов, представляющий текст в кодировке UTF-8.
-												Add initcapUtf8: impl + tests

											
										
										
											2023-07-03 11:37:55 +00:00
+								Не учитывает язык. То есть, для турецкого языка, результат может быть не совсем верным.
 								Если длина UTF-8 последовательности байтов различна для верхнего и нижнего регистра кодовой точки, то для этой кодовой точки результат работы может быть некорректным.
-												Style fix

											
										
										
											2023-07-03 11:50:26 +00:00
+								Если строка содержит набор байтов, не являющийся UTF-8, то поведение не определено.