ClickHouse/docs/ru/sql-reference/functions/splitting-merging-functions.md

---
toc_priority: 47
toc_title: "Функции разбиения и слияния строк и массивов"
---

# Функции разбиения и слияния строк и массивов {#funktsii-razbieniia-i-sliianiia-strok-i-massivov}

## splitByChar(separator, s) {#splitbycharseparator-s}

Разбивает строку на подстроки, используя в качестве разделителя `separator`.
separator должен быть константной строкой из ровно одного символа.
Возвращается массив выделенных подстрок. Могут выделяться пустые подстроки, если разделитель идёт в начале или в конце строки, или если идёт более одного разделителя подряд.

**Синтаксис**

``` sql
splitByChar(separator, s)
```

**Аргументы**

-   `separator` — разделитель, состоящий из одного символа. [String](../../sql-reference/data-types/string.md).
-   `s` — разбиваемая строка. [String](../../sql-reference/data-types/string.md).

**Возвращаемые значения**

Возвращает массив подстрок. Пустая подстрока, может быть возвращена, когда:

-   Разделитель находится в начале или конце строки;
-   Задано несколько последовательных разделителей;
-   Исходная строка `s` пуста.

Тип: [Array](../../sql-reference/data-types/array.md)([String](../../sql-reference/data-types/string.md)).

**Пример**

``` sql
SELECT splitByChar(',', '1,2,3,abcde');
```

``` text
┌─splitByChar(',', '1,2,3,abcde')─┐
│ ['1','2','3','abcde']           │
└─────────────────────────────────┘
```

## splitByString(separator, s) {#splitbystringseparator-s}

Разбивает строку на подстроки, разделенные строкой. В качестве разделителя использует константную строку `separator`, которая может состоять из нескольких символов. Если строка `separator` пуста, то функция разделит строку `s` на массив из символов.

**Синтаксис**

``` sql
splitByString(separator, s)
```

**Аргументы**

-   `separator` — разделитель. [String](../../sql-reference/data-types/string.md).
-   `s` — разбиваемая строка. [String](../../sql-reference/data-types/string.md).

**Возвращаемые значения**

Возвращает массив подстрок. Пустая подстрока, может быть возвращена, когда:

-   Разделитель находится в начале или конце строки;
-   Задано несколько последовательных разделителей;
-   Исходная строка `s` пуста.

Тип: [Array](../../sql-reference/data-types/array.md)([String](../../sql-reference/data-types/string.md)).

**Примеры**

``` sql
SELECT splitByString(', ', '1, 2 3, 4,5, abcde');
```

``` text
┌─splitByString(', ', '1, 2 3, 4,5, abcde')─┐
│ ['1','2 3','4,5','abcde']                 │
└───────────────────────────────────────────┘
```

``` sql
SELECT splitByString('', 'abcde');
```

``` text
┌─splitByString('', 'abcde')─┐
│ ['a','b','c','d','e']      │
└────────────────────────────┘
```

## splitByRegexp(regexp, s) {#splitbyregexpseparator-s}

Разбивает строку на подстроки, разделенные регулярным выражением. В качестве разделителя используется строка регулярного выражения `regexp`. Если `regexp` пустая, функция разделит строку `s` на массив одиночных символов. Если для регулярного выражения совпадения не найдено, строка `s` не будет разбита.

**Синтаксис**

``` sql
splitByRegexp(regexp, s)
```

**Аргументы**

-   `regexp` — регулярное выражение. Константа. [String](../data-types/string.md) или [FixedString](../data-types/fixedstring.md).
-   `s` — разбиваемая строка. [String](../../sql-reference/data-types/string.md).

**Возвращаемые значения**

Возвращает массив выбранных подстрок. Пустая подстрока может быть возвращена, если:

-   Непустое совпадение с регулярным выражением происходит в начале или конце строки;
-   Имеется несколько последовательных совпадений c непустым регулярным выражением;
-   Исходная строка `s` пуста, а регулярное выражение не пустое.

Тип: [Array](../../sql-reference/data-types/array.md)([String](../../sql-reference/data-types/string.md)).

**Примеры**

Запрос:

``` sql
SELECT splitByRegexp('\\d+', 'a12bc23de345f');
```

Результат:

``` text
┌─splitByRegexp('\\d+', 'a12bc23de345f')─┐
│ ['a','bc','de','f']                    │
└────────────────────────────────────────┘
```

Запрос:

``` sql
SELECT splitByRegexp('', 'abcde');
```

Результат:

``` text
┌─splitByRegexp('', 'abcde')─┐
│ ['a','b','c','d','e']      │
└────────────────────────────┘
```

## splitByWhitespace(s) {#splitbywhitespaceseparator-s}

Разбивает строку на подстроки, используя в качестве разделителей пробельные символы.

**Синтаксис**

``` sql
splitByWhitespace(s)
```

**Аргументы**

-   `s` — разбиваемая строка. [String](../../sql-reference/data-types/string.md).

**Возвращаемые значения**

Возвращает массив подстрок.

Тип: [Array](../../sql-reference/data-types/array.md)([String](../../sql-reference/data-types/string.md)).

**Пример**

``` sql
SELECT splitByWhitespace('  1!  a,  b.  ');
```

``` text
┌─splitByWhitespace('  1!  a,  b.  ')─┐
│ ['1!','a,','b.']                    │
└─────────────────────────────────────┘
```

## splitByNonAlpha(s) {#splitbynonalphaseparator-s}

Разбивает строку на подстроки, используя в качестве разделителей пробельные символы и символы пунктуации.

**Синтаксис**

``` sql
splitByNonAlpha(s)
```

**Аргументы**

-   `s` — разбиваемая строка. [String](../../sql-reference/data-types/string.md).

**Возвращаемые значения**

Возвращает массив подстрок.

Тип: [Array](../../sql-reference/data-types/array.md)([String](../../sql-reference/data-types/string.md)).

**Пример**

``` sql
SELECT splitByNonAlpha('  1!  a,  b.  ');
```

``` text
┌─splitByNonAlpha('  1!  a,  b.  ')─┐
│ ['1','a','b']                     │
└───────────────────────────────────┘
```

## arrayStringConcat(arr\[, separator\]) {#arraystringconcatarr-separator}

Склеивает строковые представления элементов массива с разделителем `separator`.
`separator` - необязательный параметр, константная строка, по умолчанию равен пустой строке.
Возвращается строка.

## alphaTokens(s) {#alphatokenss}

Выделяет подстроки из подряд идущих байт из диапазонов a-z и A-Z.
Возвращается массив выделенных подстрок.

**Пример:**

``` sql
SELECT alphaTokens('abca1abc');
```

``` text
┌─alphaTokens('abca1abc')─┐
│ ['abca','abc']          │
└─────────────────────────┘
```

## ngrams {#ngrams}

Выделяет из UTF-8 строки отрезки (n-граммы) размером `ngramsize` символов.

**Синтаксис** 

``` sql
ngrams(string, ngramsize)
```

**Аргументы**

-   `string` — строка. [String](../../sql-reference/data-types/string.md) or [FixedString](../../sql-reference/data-types/fixedstring.md).
-   `ngramsize` — размер n-грамм. [UInt](../../sql-reference/data-types/int-uint.md).

**Возвращаемые значения**

-   Массив с n-граммами.

Тип: [Array](../../sql-reference/data-types/array.md)([String](../../sql-reference/data-types/string.md)).

**Пример**

Запрос:

``` sql
SELECT ngrams('ClickHouse', 3);
```

Результат:

``` text
┌─ngrams('ClickHouse', 3)───────────────────────────┐
│ ['Cli','lic','ick','ckH','kHo','Hou','ous','use'] │
└───────────────────────────────────────────────────┘
```

## tokens {#tokens}

Разбивает строку на  токены, используя в качестве разделителей не буквенно-цифровые символы ASCII.

**Аргументы**

-   `input_string` — набор байтов. [String](../../sql-reference/data-types/string.md).

**Возвращаемые значения**

Возвращает массив токенов.

Тип: [Array](../data-types/array.md).

**Пример**

Запрос:

``` sql
SELECT tokens('test1,;\\ test2,;\\ test3,;\\   test4') AS tokens;
```

Результат:

``` text
┌─tokens────────────────────────────┐
│ ['test1','test2','test3','test4'] │
└───────────────────────────────────┘
```
-												DOCSUP-2806: Add meta header in RU (#15801)

* DOCSUP-2806: Add meta intro.

* DOCSUP-2806: Update meta intro.

* DOCSUP-2806: Fix meta.

* DOCSUP-2806: Add quotes for meta headers.

* DOCSUP-2806: Remove quotes from meta headers.

* DOCSUP-2806: Add meta headers.

* DOCSUP-2806: Fix quotes in meta headers.

* DOCSUP-2806: Update meta headers.

* DOCSUP-2806: Fix link to nowhere in EN.

* DOCSUP-2806: Fix link (settings to tune)

* DOCSUP-2806: Fix links.

* DOCSUP-2806:Fix links EN

* DOCSUP-2806: Fix build errors.

* DOCSUP-2806: Fix meta intro.

* DOCSUP-2806: Fix toc_priority in examples datasets TOC.

* DOCSUP-2806: Fix items order in toc.

* DOCSUP-2806: Fix order in toc.

* DOCSUP-2806: Fix toc order.

* DOCSUP-2806: Fix order in toc.

* DOCSUP-2806: Fix toc index in create

* DOCSUP-2806: Fix toc order in create.

Co-authored-by: romanzhukov <romanzhukov@yandex-team.ru>
Co-authored-by: alexey-milovidov <milovidov@yandex-team.ru>
											
										
										
											2020-10-26 10:29:30 +00:00
+								---
 								toc_priority: 47
-												Экранированные кодовые позиции Unicode заменены на символы

											
										
										
											2021-03-08 14:54:44 +00:00
+								toc_title: "Функции разбиения и слияния строк и массивов"
-												DOCSUP-2806: Add meta header in RU (#15801)

* DOCSUP-2806: Add meta intro.

* DOCSUP-2806: Update meta intro.

* DOCSUP-2806: Fix meta.

* DOCSUP-2806: Add quotes for meta headers.

* DOCSUP-2806: Remove quotes from meta headers.

* DOCSUP-2806: Add meta headers.

* DOCSUP-2806: Fix quotes in meta headers.

* DOCSUP-2806: Update meta headers.

* DOCSUP-2806: Fix link to nowhere in EN.

* DOCSUP-2806: Fix link (settings to tune)

* DOCSUP-2806: Fix links.

* DOCSUP-2806:Fix links EN

* DOCSUP-2806: Fix build errors.

* DOCSUP-2806: Fix meta intro.

* DOCSUP-2806: Fix toc_priority in examples datasets TOC.

* DOCSUP-2806: Fix items order in toc.

* DOCSUP-2806: Fix order in toc.

* DOCSUP-2806: Fix toc order.

* DOCSUP-2806: Fix order in toc.

* DOCSUP-2806: Fix toc index in create

* DOCSUP-2806: Fix toc order in create.

Co-authored-by: romanzhukov <romanzhukov@yandex-team.ru>
Co-authored-by: alexey-milovidov <milovidov@yandex-team.ru>
											
										
										
											2020-10-26 10:29:30 +00:00
+								---
-												WIP on docs translation/normalization tools (#9783)


											
										
										
											2020-03-20 18:20:59 +00:00
+								# Функции разбиения и слияния строк и массивов {#funktsii-razbieniia-i-sliianiia-strok-i-massivov}
 								## splitByChar(separator, s) {#splitbycharseparator-s}
-												Added documentation in RST format. (ReadTheDocs ready)

											
										
										
											2017-03-12 17:58:51 +00:00
-												DOCSUP-1352: [CLICKHOUSEDOCS] Edit and translate to Russian (#13891)

* first commit

* second commit

* Third commit

* Fourth commit

* array-functions.md

* Sixth commit

* Seventh commit

* Eigth commit

* Ninth commit

* tenth commit

* eleventh commit

* twelfth commit
											
										
										
											2020-08-31 11:38:32 +00:00
+								Разбивает строку на подстроки, используя в качестве разделителя `separator`.
-												correction of error in md-file

											
										
										
											2021-10-24 11:06:46 +00:00
+								separator должен быть константной строкой из ровно одного символа.
-												Added documentation in RST format. (ReadTheDocs ready)

											
										
										
											2017-03-12 17:58:51 +00:00
+								Возвращается массив выделенных подстрок. Могут выделяться пустые подстроки, если разделитель идёт в начале или в конце строки, или если идёт более одного разделителя подряд.
-												DOCSUP-1352: [CLICKHOUSEDOCS] Edit and translate to Russian (#13891)

* first commit

* second commit

* Third commit

* Fourth commit

* array-functions.md

* Sixth commit

* Seventh commit

* Eigth commit

* Ninth commit

* tenth commit

* eleventh commit

* twelfth commit
											
										
										
											2020-08-31 11:38:32 +00:00
+								**Синтаксис**
-												WIP on docs translation/normalization tools (#9783)


											
										
										
											2020-03-20 18:20:59 +00:00
-												DOCSUP-1352: [CLICKHOUSEDOCS] Edit and translate to Russian (#13891)

* first commit

* second commit

* Third commit

* Fourth commit

* array-functions.md

* Sixth commit

* Seventh commit

* Eigth commit

* Ninth commit

* tenth commit

* eleventh commit

* twelfth commit
											
										
										
											2020-08-31 11:38:32 +00:00
+								``` sql
-												edited after review

											
										
										
											2021-05-25 13:03:35 +00:00
+								splitByChar(separator, s)
-												DOCSUP-1352: [CLICKHOUSEDOCS] Edit and translate to Russian (#13891)

* first commit

* second commit

* Third commit

* Fourth commit

* array-functions.md

* Sixth commit

* Seventh commit

* Eigth commit

* Ninth commit

* tenth commit

* eleventh commit

* twelfth commit
											
										
										
											2020-08-31 11:38:32 +00:00
+								```
-												Added documentation in RST format. (ReadTheDocs ready)

											
										
										
											2017-03-12 17:58:51 +00:00
-												Edit and translate to Russian

Поправил шаблоны в английской и русской версиях.

											
										
										
											2021-03-13 18:18:45 +00:00
+								**Аргументы**
-												WIP on docs translation/normalization tools (#9783)


											
										
										
											2020-03-20 18:20:59 +00:00
-												Edit and translate to Russian

Поправил шаблоны в английской и русской версиях.

											
										
										
											2021-03-13 18:18:45 +00:00
+								-   `separator` — разделитель, состоящий из одного символа. [String](../../sql-reference/data-types/string.md).
 								-   `s` — разбиваемая строка. [String](../../sql-reference/data-types/string.md).
-												Added documentation in RST format. (ReadTheDocs ready)

											
										
										
											2017-03-12 17:58:51 +00:00
-												DOCSUP-1352: [CLICKHOUSEDOCS] Edit and translate to Russian (#13891)

* first commit

* second commit

* Third commit

* Fourth commit

* array-functions.md

* Sixth commit

* Seventh commit

* Eigth commit

* Ninth commit

* tenth commit

* eleventh commit

* twelfth commit
											
										
										
											2020-08-31 11:38:32 +00:00
+								**Возвращаемые значения**
-												WIP on docs translation/normalization tools (#9783)


											
										
										
											2020-03-20 18:20:59 +00:00
-												DOCSUP-1352: [CLICKHOUSEDOCS] Edit and translate to Russian (#13891)

* first commit

* second commit

* Third commit

* Fourth commit

* array-functions.md

* Sixth commit

* Seventh commit

* Eigth commit

* Ninth commit

* tenth commit

* eleventh commit

* twelfth commit
											
										
										
											2020-08-31 11:38:32 +00:00
+								Возвращает массив подстрок. Пустая подстрока, может быть возвращена, когда:
-												Add examples for alphaTokens and argMin (#3189)


											
										
										
											2018-09-21 15:13:45 +00:00
-												DOCSUP-1352: [CLICKHOUSEDOCS] Edit and translate to Russian (#13891)

* first commit

* second commit

* Third commit

* Fourth commit

* array-functions.md

* Sixth commit

* Seventh commit

* Eigth commit

* Ninth commit

* tenth commit

* eleventh commit

* twelfth commit
											
										
										
											2020-08-31 11:38:32 +00:00
+								-   Разделитель находится в начале или конце строки;
 								-   Задано несколько последовательных разделителей;
 								-   Исходная строка `s` пуста.
-												edited after review

											
										
										
											2021-05-25 13:03:35 +00:00
+								Тип: [Array](../../sql-reference/data-types/array.md)([String](../../sql-reference/data-types/string.md)).
-												DOCSUP-1352: [CLICKHOUSEDOCS] Edit and translate to Russian (#13891)

* first commit

* second commit

* Third commit

* Fourth commit

* array-functions.md

* Sixth commit

* Seventh commit

* Eigth commit

* Ninth commit

* tenth commit

* eleventh commit

* twelfth commit
											
										
										
											2020-08-31 11:38:32 +00:00
 								**Пример**
-												Add examples for alphaTokens and argMin (#3189)


											
										
										
											2018-09-21 15:13:45 +00:00
-												WIP on docs translation/normalization tools (#9783)


											
										
										
											2020-03-20 18:20:59 +00:00
+								``` sql
-												edited after review

											
										
										
											2021-05-25 13:03:35 +00:00
+								SELECT splitByChar(',', '1,2,3,abcde');
-												DOCAPI-8530: Code blocks markup fix (#7060)

* Typo fix.

* Links fix.

* Fixed links in docs.

* More fixes.

* docs/en: cleaning some files

* docs/en: cleaning data_types

* docs/en: cleaning database_engines

* docs/en: cleaning development

* docs/en: cleaning getting_started

* docs/en: cleaning interfaces

* docs/en: cleaning operations

* docs/en: cleaning query_lamguage

* docs/en: cleaning en

* docs/ru: cleaning data_types

* docs/ru: cleaning index

* docs/ru: cleaning database_engines

* docs/ru: cleaning development

* docs/ru: cleaning general

* docs/ru: cleaning getting_started

* docs/ru: cleaning interfaces

* docs/ru: cleaning operations

* docs/ru: cleaning query_language

* docs: cleaning interfaces/http

* Update docs/en/data_types/array.md

decorated ```

Co-Authored-By: BayoNet <da-daos@yandex.ru>

* Update docs/en/getting_started/example_datasets/nyc_taxi.md

fixed typo

Co-Authored-By: BayoNet <da-daos@yandex.ru>

* Update docs/en/getting_started/example_datasets/ontime.md

fixed typo

Co-Authored-By: BayoNet <da-daos@yandex.ru>

* Update docs/en/interfaces/formats.md

fixed error

Co-Authored-By: BayoNet <da-daos@yandex.ru>

* Update docs/en/operations/table_engines/custom_partitioning_key.md

Co-Authored-By: BayoNet <da-daos@yandex.ru>

* Update docs/en/operations/utils/clickhouse-local.md

Co-Authored-By: BayoNet <da-daos@yandex.ru>

* Update docs/en/query_language/dicts/external_dicts_dict_sources.md

Co-Authored-By: BayoNet <da-daos@yandex.ru>

* Update docs/en/operations/utils/clickhouse-local.md

Co-Authored-By: BayoNet <da-daos@yandex.ru>

* Update docs/en/query_language/functions/json_functions.md

Co-Authored-By: BayoNet <da-daos@yandex.ru>

* Update docs/en/query_language/functions/json_functions.md

Co-Authored-By: BayoNet <da-daos@yandex.ru>

* Update docs/en/query_language/functions/other_functions.md

Co-Authored-By: BayoNet <da-daos@yandex.ru>

* Update docs/en/query_language/functions/other_functions.md

Co-Authored-By: BayoNet <da-daos@yandex.ru>

* Update docs/en/query_language/functions/date_time_functions.md

Co-Authored-By: BayoNet <da-daos@yandex.ru>

* Update docs/en/operations/table_engines/jdbc.md

Co-Authored-By: BayoNet <da-daos@yandex.ru>

* docs: fixed error

* docs: fixed error

											
										
										
											2019-09-23 15:31:46 +00:00
+								```
-												Add examples for alphaTokens and argMin (#3189)


											
										
										
											2018-09-21 15:13:45 +00:00
-												WIP on docs translation/normalization tools (#9783)


											
										
										
											2020-03-20 18:20:59 +00:00
+								``` text
-												DOCSUP-1352: [CLICKHOUSEDOCS] Edit and translate to Russian (#13891)

* first commit

* second commit

* Third commit

* Fourth commit

* array-functions.md

* Sixth commit

* Seventh commit

* Eigth commit

* Ninth commit

* tenth commit

* eleventh commit

* twelfth commit
											
										
										
											2020-08-31 11:38:32 +00:00
+								┌─splitByChar(',', '1,2,3,abcde')─┐
 								│ ['1','2','3','abcde']           │
 								└─────────────────────────────────┘
-												WIP on docs/website (#3383)

* CLICKHOUSE-4063: less manual html @ index.md

* CLICKHOUSE-4063: recommend markdown="1" in README.md

* CLICKHOUSE-4003: manually purge custom.css for now

* CLICKHOUSE-4064: expand <details> before any print (including to pdf)

* CLICKHOUSE-3927: rearrange interfaces/formats.md a bit

* CLICKHOUSE-3306: add few http headers

* Remove copy-paste introduced in #3392

* Hopefully better chinese fonts #3392

* get rid of tabs @ custom.css

* Apply comments and patch from #3384

* Add jdbc.md to ToC and some translation, though it still looks badly incomplete

* minor punctuation

* Add some backlinks to official website from mirrors that just blindly take markdown sources

* Do not make fonts extra light

* find . -name '*.md' -type f | xargs -I{} perl -pi -e 's//g' {}

* find . -name '*.md' -type f | xargs -I{} perl -pi -e 's/ sql/g' {}

* Remove outdated stuff from roadmap.md

* Not so light font on front page too

* Refactor Chinese formats.md to match recent changes in other languages

											
										
										
											2018-10-16 10:47:17 +00:00
+								```
-												WIP on docs translation/normalization tools (#9783)


											
										
										
											2020-03-20 18:20:59 +00:00
-												DOCSUP-1352: [CLICKHOUSEDOCS] Edit and translate to Russian (#13891)

* first commit

* second commit

* Third commit

* Fourth commit

* array-functions.md

* Sixth commit

* Seventh commit

* Eigth commit

* Ninth commit

* tenth commit

* eleventh commit

* twelfth commit
											
										
										
											2020-08-31 11:38:32 +00:00
+								## splitByString(separator, s) {#splitbystringseparator-s}
-												DOCSUP-1110: document the extractAllGroups function (#138)

* add EN description

* changes in EN version after review

* add RU version
											
										
										
											2020-07-19 09:33:50 +00:00
-												DOCSUP-1352: [CLICKHOUSEDOCS] Edit and translate to Russian (#13891)

* first commit

* second commit

* Third commit

* Fourth commit

* array-functions.md

* Sixth commit

* Seventh commit

* Eigth commit

* Ninth commit

* tenth commit

* eleventh commit

* twelfth commit
											
										
										
											2020-08-31 11:38:32 +00:00
+								Разбивает строку на подстроки, разделенные строкой. В качестве разделителя использует константную строку `separator`, которая может состоять из нескольких символов. Если строка `separator` пуста, то функция разделит строку `s` на массив из символов.
-												DOCSUP-1110: document the extractAllGroups function (#138)

* add EN description

* changes in EN version after review

* add RU version
											
										
										
											2020-07-19 09:33:50 +00:00
-												DOCSUP-1352: [CLICKHOUSEDOCS] Edit and translate to Russian (#13891)

* first commit

* second commit

* Third commit

* Fourth commit

* array-functions.md

* Sixth commit

* Seventh commit

* Eigth commit

* Ninth commit

* tenth commit

* eleventh commit

* twelfth commit
											
										
										
											2020-08-31 11:38:32 +00:00
+								**Синтаксис**
-												DOCSUP-1110: document the extractAllGroups function (#138)

* add EN description

* changes in EN version after review

* add RU version
											
										
										
											2020-07-19 09:33:50 +00:00
 								``` sql
-												DOCSUP-1352: [CLICKHOUSEDOCS] Edit and translate to Russian (#13891)

* first commit

* second commit

* Third commit

* Fourth commit

* array-functions.md

* Sixth commit

* Seventh commit

* Eigth commit

* Ninth commit

* tenth commit

* eleventh commit

* twelfth commit
											
										
										
											2020-08-31 11:38:32 +00:00
+								splitByString(separator, s)
-												DOCSUP-1110: document the extractAllGroups function (#138)

* add EN description

* changes in EN version after review

* add RU version
											
										
										
											2020-07-19 09:33:50 +00:00
+								```
-												Edit and translate to Russian

Поправил шаблоны в английской и русской версиях.

											
										
										
											2021-03-13 18:18:45 +00:00
+								**Аргументы**
-												DOCSUP-1110: document the extractAllGroups function (#138)

* add EN description

* changes in EN version after review

* add RU version
											
										
										
											2020-07-19 09:33:50 +00:00
-												Edit and translate to Russian

Поправил шаблоны в английской и русской версиях.

											
										
										
											2021-03-13 18:18:45 +00:00
+								-   `separator` — разделитель. [String](../../sql-reference/data-types/string.md).
 								-   `s` — разбиваемая строка. [String](../../sql-reference/data-types/string.md).
-												DOCSUP-1110: document the extractAllGroups function (#138)

* add EN description

* changes in EN version after review

* add RU version
											
										
										
											2020-07-19 09:33:50 +00:00
 								**Возвращаемые значения**
-												DOCSUP-1352: [CLICKHOUSEDOCS] Edit and translate to Russian (#13891)

* first commit

* second commit

* Third commit

* Fourth commit

* array-functions.md

* Sixth commit

* Seventh commit

* Eigth commit

* Ninth commit

* tenth commit

* eleventh commit

* twelfth commit
											
										
										
											2020-08-31 11:38:32 +00:00
+								Возвращает массив подстрок. Пустая подстрока, может быть возвращена, когда:
 								-   Разделитель находится в начале или конце строки;
 								-   Задано несколько последовательных разделителей;
 								-   Исходная строка `s` пуста.
-												DOCSUP-1110: document the extractAllGroups function (#138)

* add EN description

* changes in EN version after review

* add RU version
											
										
										
											2020-07-19 09:33:50 +00:00
-												edited after review

											
										
										
											2021-05-25 13:03:35 +00:00
+								Тип: [Array](../../sql-reference/data-types/array.md)([String](../../sql-reference/data-types/string.md)).
-												DOCSUP-1110: document the extractAllGroups function (#138)

* add EN description

* changes in EN version after review

* add RU version
											
										
										
											2020-07-19 09:33:50 +00:00
-												DOCSUP-1352: [CLICKHOUSEDOCS] Edit and translate to Russian (#13891)

* first commit

* second commit

* Third commit

* Fourth commit

* array-functions.md

* Sixth commit

* Seventh commit

* Eigth commit

* Ninth commit

* tenth commit

* eleventh commit

* twelfth commit
											
										
										
											2020-08-31 11:38:32 +00:00
+								**Примеры**
-												DOCSUP-1110: document the extractAllGroups function (#138)

* add EN description

* changes in EN version after review

* add RU version
											
										
										
											2020-07-19 09:33:50 +00:00
-												DOCSUP-1352: [CLICKHOUSEDOCS] Edit and translate to Russian (#13891)

* first commit

* second commit

* Third commit

* Fourth commit

* array-functions.md

* Sixth commit

* Seventh commit

* Eigth commit

* Ninth commit

* tenth commit

* eleventh commit

* twelfth commit
											
										
										
											2020-08-31 11:38:32 +00:00
+								``` sql
-												edited after review

											
										
										
											2021-05-25 13:03:35 +00:00
+								SELECT splitByString(', ', '1, 2 3, 4,5, abcde');
-												DOCSUP-1352: [CLICKHOUSEDOCS] Edit and translate to Russian (#13891)

* first commit

* second commit

* Third commit

* Fourth commit

* array-functions.md

* Sixth commit

* Seventh commit

* Eigth commit

* Ninth commit

* tenth commit

* eleventh commit

* twelfth commit
											
										
										
											2020-08-31 11:38:32 +00:00
+								```
-												DOCSUP-1110: document the extractAllGroups function (#138)

* add EN description

* changes in EN version after review

* add RU version
											
										
										
											2020-07-19 09:33:50 +00:00
-												DOCSUP-1352: [CLICKHOUSEDOCS] Edit and translate to Russian (#13891)

* first commit

* second commit

* Third commit

* Fourth commit

* array-functions.md

* Sixth commit

* Seventh commit

* Eigth commit

* Ninth commit

* tenth commit

* eleventh commit

* twelfth commit
											
										
										
											2020-08-31 11:38:32 +00:00
+								``` text
 								┌─splitByString(', ', '1, 2 3, 4,5, abcde')─┐
 								│ ['1','2 3','4,5','abcde']                 │
 								└───────────────────────────────────────────┘
 								```
-												DOCSUP-1110: document the extractAllGroups function (#138)

* add EN description

* changes in EN version after review

* add RU version
											
										
										
											2020-07-19 09:33:50 +00:00
 								``` sql
-												edited after review

											
										
										
											2021-05-25 13:03:35 +00:00
+								SELECT splitByString('', 'abcde');
-												DOCSUP-1110: document the extractAllGroups function (#138)

* add EN description

* changes in EN version after review

* add RU version
											
										
										
											2020-07-19 09:33:50 +00:00
+								```
-												DOCSUP-1352: [CLICKHOUSEDOCS] Edit and translate to Russian (#13891)

* first commit

* second commit

* Third commit

* Fourth commit

* array-functions.md

* Sixth commit

* Seventh commit

* Eigth commit

* Ninth commit

* tenth commit

* eleventh commit

* twelfth commit
											
										
										
											2020-08-31 11:38:32 +00:00
+								``` text
 								┌─splitByString('', 'abcde')─┐
 								│ ['a','b','c','d','e']      │
 								└────────────────────────────┘
 								```
-												edited EN, added RU

											
										
										
											2021-05-19 10:21:34 +00:00
+								## splitByRegexp(regexp, s) {#splitbyregexpseparator-s}
-												Update docs/ru/sql-reference/functions/splitting-merging-functions.md

Co-authored-by: olgarev <56617294+olgarev@users.noreply.github.com>
											
										
										
											2021-05-25 07:50:32 +00:00
+								Разбивает строку на подстроки, разделенные регулярным выражением. В качестве разделителя используется строка регулярного выражения `regexp`. Если `regexp` пустая, функция разделит строку `s` на массив одиночных символов. Если для регулярного выражения совпадения не найдено, строка `s` не будет разбита.
-												edited EN, added RU

											
										
										
											2021-05-19 10:21:34 +00:00
 								**Синтаксис**
 								``` sql
-												edited after review

											
										
										
											2021-05-25 13:03:35 +00:00
+								splitByRegexp(regexp, s)
-												edited EN, added RU

											
										
										
											2021-05-19 10:21:34 +00:00
+								```
 								**Аргументы**
 								-   `regexp` — регулярное выражение. Константа. [String](../data-types/string.md) или [FixedString](../data-types/fixedstring.md).
 								-   `s` — разбиваемая строка. [String](../../sql-reference/data-types/string.md).
 								**Возвращаемые значения**
 								Возвращает массив выбранных подстрок. Пустая подстрока может быть возвращена, если:
 								-   Непустое совпадение с регулярным выражением происходит в начале или конце строки;
-												edited RU

											
										
										
											2021-05-19 10:37:52 +00:00
+								-   Имеется несколько последовательных совпадений c непустым регулярным выражением;
-												edited EN, added RU

											
										
										
											2021-05-19 10:21:34 +00:00
+								-   Исходная строка `s` пуста, а регулярное выражение не пустое.
-												edited after review

											
										
										
											2021-05-25 13:03:35 +00:00
+								Тип: [Array](../../sql-reference/data-types/array.md)([String](../../sql-reference/data-types/string.md)).
-												edited EN, added RU

											
										
										
											2021-05-19 10:21:34 +00:00
 								**Примеры**
 								Запрос:
 								``` sql
-												edited after review

											
										
										
											2021-05-25 13:03:35 +00:00
+								SELECT splitByRegexp('\\d+', 'a12bc23de345f');
-												edited EN, added RU

											
										
										
											2021-05-19 10:21:34 +00:00
+								```
 								Результат:
 								``` text
 								┌─splitByRegexp('\\d+', 'a12bc23de345f')─┐
 								│ ['a','bc','de','f']                    │
 								└────────────────────────────────────────┘
 								```
 								Запрос:
 								``` sql
-												edited after review

											
										
										
											2021-05-25 13:03:35 +00:00
+								SELECT splitByRegexp('', 'abcde');
-												edited EN, added RU

											
										
										
											2021-05-19 10:21:34 +00:00
+								```
 								Результат:
 								``` text
 								┌─splitByRegexp('', 'abcde')─┐
 								│ ['a','b','c','d','e']      │
 								└────────────────────────────┘
 								```
-												DOCSUP-1352: [CLICKHOUSEDOCS] Edit and translate to Russian (#13891)

* first commit

* second commit

* Third commit

* Fourth commit

* array-functions.md

* Sixth commit

* Seventh commit

* Eigth commit

* Ninth commit

* tenth commit

* eleventh commit

* twelfth commit
											
										
										
											2020-08-31 11:38:32 +00:00
-												Added RU and EN documentation for SplitByWhitespace & SplitByNonAlpha functions

											
										
										
											2021-06-19 12:54:53 +00:00
+								## splitByWhitespace(s) {#splitbywhitespaceseparator-s}
 								Разбивает строку на подстроки, используя в качестве разделителей пробельные символы.
 								**Синтаксис**
 								``` sql
 								splitByWhitespace(s)
 								```
 								**Аргументы**
 								-   `s` — разбиваемая строка. [String](../../sql-reference/data-types/string.md).
 								**Возвращаемые значения**
 								Возвращает массив подстрок.
 								Тип: [Array](../../sql-reference/data-types/array.md)([String](../../sql-reference/data-types/string.md)).
 								**Пример**
 								``` sql
 								SELECT splitByWhitespace('  1!  a,  b.  ');
 								```
 								``` text
 								┌─splitByWhitespace('  1!  a,  b.  ')─┐
 								│ ['1!','a,','b.']                    │
 								└─────────────────────────────────────┘
 								```
 								## splitByNonAlpha(s) {#splitbynonalphaseparator-s}
 								Разбивает строку на подстроки, используя в качестве разделителей пробельные символы и символы пунктуации.
 								**Синтаксис**
 								``` sql
 								splitByNonAlpha(s)
 								```
 								**Аргументы**
 								-   `s` — разбиваемая строка. [String](../../sql-reference/data-types/string.md).
 								**Возвращаемые значения**
 								Возвращает массив подстрок.
 								Тип: [Array](../../sql-reference/data-types/array.md)([String](../../sql-reference/data-types/string.md)).
 								**Пример**
 								``` sql
 								SELECT splitByNonAlpha('  1!  a,  b.  ');
 								```
 								``` text
 								┌─splitByNonAlpha('  1!  a,  b.  ')─┐
 								│ ['1','a','b']                     │
 								└───────────────────────────────────┘
 								```
-												DOCSUP-1352: [CLICKHOUSEDOCS] Edit and translate to Russian (#13891)

* first commit

* second commit

* Third commit

* Fourth commit

* array-functions.md

* Sixth commit

* Seventh commit

* Eigth commit

* Ninth commit

* tenth commit

* eleventh commit

* twelfth commit
											
										
										
											2020-08-31 11:38:32 +00:00
+								## arrayStringConcat(arr\[, separator\]) {#arraystringconcatarr-separator}
-												update docs

											
										
										
											2021-10-28 21:40:42 +00:00
+								Склеивает строковые представления элементов массива с разделителем `separator`.
 								`separator` - необязательный параметр, константная строка, по умолчанию равен пустой строке.
-												DOCSUP-1352: [CLICKHOUSEDOCS] Edit and translate to Russian (#13891)

* first commit

* second commit

* Third commit

* Fourth commit

* array-functions.md

* Sixth commit

* Seventh commit

* Eigth commit

* Ninth commit

* tenth commit

* eleventh commit

* twelfth commit
											
										
										
											2020-08-31 11:38:32 +00:00
+								Возвращается строка.
 								## alphaTokens(s) {#alphatokenss}
 								Выделяет подстроки из подряд идущих байт из диапазонов a-z и A-Z.
 								Возвращается массив выделенных подстрок.
 								**Пример:**
 								``` sql
-												edited after review

											
										
										
											2021-05-25 13:03:35 +00:00
+								SELECT alphaTokens('abca1abc');
-												DOCSUP-1352: [CLICKHOUSEDOCS] Edit and translate to Russian (#13891)

* first commit

* second commit

* Third commit

* Fourth commit

* array-functions.md

* Sixth commit

* Seventh commit

* Eigth commit

* Ninth commit

* tenth commit

* eleventh commit

* twelfth commit
											
										
										
											2020-08-31 11:38:32 +00:00
+								```
-												DOCSUP-1110: document the extractAllGroups function (#138)

* add EN description

* changes in EN version after review

* add RU version
											
										
										
											2020-07-19 09:33:50 +00:00
 								``` text
-												DOCSUP-1352: [CLICKHOUSEDOCS] Edit and translate to Russian (#13891)

* first commit

* second commit

* Third commit

* Fourth commit

* array-functions.md

* Sixth commit

* Seventh commit

* Eigth commit

* Ninth commit

* tenth commit

* eleventh commit

* twelfth commit
											
										
										
											2020-08-31 11:38:32 +00:00
+								┌─alphaTokens('abca1abc')─┐
 								│ ['abca','abc']          │
 								└─────────────────────────┘
-												DOCSUP-1110: document the extractAllGroups function (#138)

* add EN description

* changes in EN version after review

* add RU version
											
										
										
											2020-07-19 09:33:50 +00:00
+								```
-												adding ngrams

											
										
										
											2021-10-25 21:15:25 +00:00
 								## ngrams {#ngrams}
 								Выделяет из UTF-8 строки отрезки (n-граммы) размером `ngramsize` символов.
 								**Синтаксис**
 								``` sql
 								ngrams(string, ngramsize)
 								```
 								**Аргументы**
 								-   `string` — строка. [String](../../sql-reference/data-types/string.md) or [FixedString](../../sql-reference/data-types/fixedstring.md).
 								-   `ngramsize` — размер n-грамм. [UInt](../../sql-reference/data-types/int-uint.md).
 								**Возвращаемые значения**
 								-   Массив с n-граммами.
-												Fixed function ngrams

											
										
										
											2021-11-24 13:18:38 +00:00
+								Тип: [Array](../../sql-reference/data-types/array.md)([String](../../sql-reference/data-types/string.md)).
-												adding ngrams

											
										
										
											2021-10-25 21:15:25 +00:00
 								**Пример**
 								Запрос:
 								``` sql
 								SELECT ngrams('ClickHouse', 3);
 								```
 								Результат:
 								``` text
 								┌─ngrams('ClickHouse', 3)───────────────────────────┐
 								│ ['Cli','lic','ick','ckH','kHo','Hou','ous','use'] │
 								└───────────────────────────────────────────────────┘
 								```
-												translate tokens to russian

											
										
										
											2021-10-25 21:24:38 +00:00
 								## tokens {#tokens}
 								Разбивает строку на  токены, используя в качестве разделителей не буквенно-цифровые символы ASCII.
 								**Аргументы**
 								-   `input_string` — набор байтов. [String](../../sql-reference/data-types/string.md).
 								**Возвращаемые значения**
 								Возвращает массив токенов.
 								Тип: [Array](../data-types/array.md).
 								**Пример**
-												Update docs/ru/sql-reference/functions/splitting-merging-functions.md

Co-authored-by: gyuton <40863448+gyuton@users.noreply.github.com>
											
										
										
											2021-10-26 17:47:32 +00:00
+								Запрос:
-												translate tokens to russian

											
										
										
											2021-10-25 21:24:38 +00:00
+								``` sql
 								SELECT tokens('test1,;\\ test2,;\\ test3,;\\   test4') AS tokens;
 								```
-												Update docs/ru/sql-reference/functions/splitting-merging-functions.md

Co-authored-by: gyuton <40863448+gyuton@users.noreply.github.com>
											
										
										
											2021-10-26 17:47:22 +00:00
+								Результат:
-												translate tokens to russian

											
										
										
											2021-10-25 21:24:38 +00:00
+								``` text
 								┌─tokens────────────────────────────┐
 								│ ['test1','test2','test3','test4'] │
 								└───────────────────────────────────┘
 								```