mirror of
https://github.com/ClickHouse/ClickHouse.git
synced 2024-11-26 09:32:01 +00:00
DOCAPI-6697: Edited the toValidUTF8 description.
This commit is contained in:
parent
ec22af6da0
commit
8e3c5157cc
@ -62,7 +62,28 @@ Returns 1, if the set of bytes is valid UTF-8 encoded, otherwise 0.
|
|||||||
|
|
||||||
## toValidUTF8
|
## toValidUTF8
|
||||||
|
|
||||||
Returns string where all invalid UTF-8 characters are replaced by replacement character `<60>` (U+FFFD). If there are many invalid characters subsequently, it is collapsed to one replacement character.
|
Replaces invalid UTF-8 characters by the `<60>` (U+FFFD) character. All running in a row invalid characters are collapsed into the one replacement character.
|
||||||
|
|
||||||
|
```
|
||||||
|
toValidUTF8( input_string )
|
||||||
|
```
|
||||||
|
|
||||||
|
Parameters:
|
||||||
|
|
||||||
|
- input_string — Any set of bytes represented as the [String](../../data_types/string.md) data type object.
|
||||||
|
|
||||||
|
Returned value: Valid UTF-8 string.
|
||||||
|
|
||||||
|
### Example
|
||||||
|
|
||||||
|
```sql
|
||||||
|
SELECT toValidUTF8('\x00\xF0\x80\x80\x80')
|
||||||
|
```
|
||||||
|
```text
|
||||||
|
┌─toValidUTF8('\0<><30><EFBFBD><EFBFBD>')─┐
|
||||||
|
│ <20> │
|
||||||
|
└───────────────────────┘
|
||||||
|
```
|
||||||
|
|
||||||
## reverse
|
## reverse
|
||||||
|
|
||||||
|
@ -42,7 +42,33 @@
|
|||||||
Возвращает 1, если набор байт является корректным в кодировке UTF-8, 0 иначе.
|
Возвращает 1, если набор байт является корректным в кодировке UTF-8, 0 иначе.
|
||||||
|
|
||||||
## toValidUTF8
|
## toValidUTF8
|
||||||
Возвращает строку, где все некорректные UTF-8 символы заменены на заменяющий символ `<60>` (U+FFFD). Если много некорректных символов идут подряд, схлопывается до одного заменяющего символа.
|
|
||||||
|
Заменяет некорректные символы UTF-8 на символ `<60>` (U+FFFD). Все идущие подряд некорректные символы схлопываются в один заменяющий символ.
|
||||||
|
|
||||||
|
|
||||||
|
```
|
||||||
|
toValidUTF8( input_string )
|
||||||
|
```
|
||||||
|
|
||||||
|
Параметры:
|
||||||
|
|
||||||
|
- input_string — произвольный набор байтов, представленный как объект типа [String](../../data_types/string.md).
|
||||||
|
|
||||||
|
Возвращаемое значение: Корректная строка UTF-8.
|
||||||
|
|
||||||
|
### Пример
|
||||||
|
|
||||||
|
```sql
|
||||||
|
SELECT toValidUTF8('\x00\xF0\x80\x80\x80')
|
||||||
|
```
|
||||||
|
```text
|
||||||
|
┌─toValidUTF8('\0<><30><EFBFBD><EFBFBD>')─┐
|
||||||
|
│ <20> │
|
||||||
|
└───────────────────────┘
|
||||||
|
```
|
||||||
|
|
||||||
|
|
||||||
|
|
||||||
|
|
||||||
## reverse
|
## reverse
|
||||||
Разворачивает строку (как последовательность байт).
|
Разворачивает строку (как последовательность байт).
|
||||||
|
Loading…
Reference in New Issue
Block a user