mirror of
https://github.com/ClickHouse/ClickHouse.git
synced 2024-11-22 15:42:02 +00:00
DOCAPI-6697: Edited the toValidUTF8 description.
This commit is contained in:
parent
ec22af6da0
commit
8e3c5157cc
@ -62,7 +62,28 @@ Returns 1, if the set of bytes is valid UTF-8 encoded, otherwise 0.
|
||||
|
||||
## toValidUTF8
|
||||
|
||||
Returns string where all invalid UTF-8 characters are replaced by replacement character `<60>` (U+FFFD). If there are many invalid characters subsequently, it is collapsed to one replacement character.
|
||||
Replaces invalid UTF-8 characters by the `<60>` (U+FFFD) character. All running in a row invalid characters are collapsed into the one replacement character.
|
||||
|
||||
```
|
||||
toValidUTF8( input_string )
|
||||
```
|
||||
|
||||
Parameters:
|
||||
|
||||
- input_string — Any set of bytes represented as the [String](../../data_types/string.md) data type object.
|
||||
|
||||
Returned value: Valid UTF-8 string.
|
||||
|
||||
### Example
|
||||
|
||||
```sql
|
||||
SELECT toValidUTF8('\x00\xF0\x80\x80\x80')
|
||||
```
|
||||
```text
|
||||
┌─toValidUTF8('\0<><30><EFBFBD><EFBFBD>')─┐
|
||||
│ <20> │
|
||||
└───────────────────────┘
|
||||
```
|
||||
|
||||
## reverse
|
||||
|
||||
|
@ -42,7 +42,33 @@
|
||||
Возвращает 1, если набор байт является корректным в кодировке UTF-8, 0 иначе.
|
||||
|
||||
## toValidUTF8
|
||||
Возвращает строку, где все некорректные UTF-8 символы заменены на заменяющий символ `<60>` (U+FFFD). Если много некорректных символов идут подряд, схлопывается до одного заменяющего символа.
|
||||
|
||||
Заменяет некорректные символы UTF-8 на символ `<60>` (U+FFFD). Все идущие подряд некорректные символы схлопываются в один заменяющий символ.
|
||||
|
||||
|
||||
```
|
||||
toValidUTF8( input_string )
|
||||
```
|
||||
|
||||
Параметры:
|
||||
|
||||
- input_string — произвольный набор байтов, представленный как объект типа [String](../../data_types/string.md).
|
||||
|
||||
Возвращаемое значение: Корректная строка UTF-8.
|
||||
|
||||
### Пример
|
||||
|
||||
```sql
|
||||
SELECT toValidUTF8('\x00\xF0\x80\x80\x80')
|
||||
```
|
||||
```text
|
||||
┌─toValidUTF8('\0<><30><EFBFBD><EFBFBD>')─┐
|
||||
│ <20> │
|
||||
└───────────────────────┘
|
||||
```
|
||||
|
||||
|
||||
|
||||
|
||||
## reverse
|
||||
Разворачивает строку (как последовательность байт).
|
||||
|
Loading…
Reference in New Issue
Block a user