DOCAPI-6697: Edited the toValidUTF8 description.

This commit is contained in:
BayoNet 2019-05-20 17:41:10 +03:00
parent ec22af6da0
commit 8e3c5157cc
2 changed files with 49 additions and 2 deletions

View File

@ -62,7 +62,28 @@ Returns 1, if the set of bytes is valid UTF-8 encoded, otherwise 0.
## toValidUTF8 ## toValidUTF8
Returns string where all invalid UTF-8 characters are replaced by replacement character `<60>` (U+FFFD). If there are many invalid characters subsequently, it is collapsed to one replacement character. Replaces invalid UTF-8 characters by the `<60>` (U+FFFD) character. All running in a row invalid characters are collapsed into the one replacement character.
```
toValidUTF8( input_string )
```
Parameters:
- input_string — Any set of bytes represented as the [String](../../data_types/string.md) data type object.
Returned value: Valid UTF-8 string.
### Example
```sql
SELECT toValidUTF8('\x00\xF0\x80\x80\x80')
```
```text
┌─toValidUTF8('\0<><30><EFBFBD><EFBFBD>')─┐
<20>
└───────────────────────┘
```
## reverse ## reverse

View File

@ -42,7 +42,33 @@
Возвращает 1, если набор байт является корректным в кодировке UTF-8, 0 иначе. Возвращает 1, если набор байт является корректным в кодировке UTF-8, 0 иначе.
## toValidUTF8 ## toValidUTF8
Возвращает строку, где все некорректные UTF-8 символы заменены на заменяющий символ `<60>` (U+FFFD). Если много некорректных символов идут подряд, схлопывается до одного заменяющего символа.
Заменяет некорректные символы UTF-8 на символ `<60>` (U+FFFD). Все идущие подряд некорректные символы схлопываются в один заменяющий символ.
```
toValidUTF8( input_string )
```
Параметры:
- input_string — произвольный набор байтов, представленный как объект типа [String](../../data_types/string.md).
Возвращаемое значение: Корректная строка UTF-8.
### Пример
```sql
SELECT toValidUTF8('\x00\xF0\x80\x80\x80')
```
```text
┌─toValidUTF8('\0<><30><EFBFBD><EFBFBD>')─┐
<20>
└───────────────────────┘
```
## reverse ## reverse
Разворачивает строку (как последовательность байт). Разворачивает строку (как последовательность байт).