ru example fixed

This commit is contained in:
Alexey 2021-04-05 20:58:07 +00:00
parent 5aeda14f10
commit e3610ac45d

View File

@ -652,7 +652,7 @@ SELECT decodeXMLComponent('< Σ >');
Функция извлекает текст из HTML или XHTML по следующим правилам: Функция извлекает текст из HTML или XHTML по следующим правилам:
1. Комментарии, начинающиеся с `<!--` и оканчивающиеся `-->`, удаляются. 1. Комментарии, начинающиеся с `<!--` и оканчивающиеся `-->`, удаляются.
1. Содержимое секции `CDATA` между `<![CDATA[` и `]]>` остается без изменений, и дальнейшая обработка не выполняется. Содержимое секции присоединяется к предыдущему блоку текста без пробела. 1. Содержимое секции `CDATA` между `<![CDATA[` и `]]>` остается без изменений, и его дальнейшая обработка не выполняется. Содержимое секции присоединяется к предыдущему блоку текста без пробела.
1. Текст, окруженный тегами `<script>` или `<style>`, убирается полностью. Если `script` или `style` использованы в качестве имен из пространства имен XML (например, `<script:a>`), то они обрабатываются как обычные теги. 1. Текст, окруженный тегами `<script>` или `<style>`, убирается полностью. Если `script` или `style` использованы в качестве имен из пространства имен XML (например, `<script:a>`), то они обрабатываются как обычные теги.
1. Каждый тег заменяется пробелом. Обратите внимание, что элементы наподобие `<>`, `<!>`, `<!-->` также заменяются. Тег без закрывающей скобки `>` удаляется до конца текста. 1. Каждый тег заменяется пробелом. Обратите внимание, что элементы наподобие `<>`, `<!>`, `<!-->` также заменяются. Тег без закрывающей скобки `>` удаляется до конца текста.
1. Любая последовательность пробельных символов (пробел, новая строка, возврат каретки, таб, вертикальный таб или перевод страницы) заменяется на один пробел. 1. Любая последовательность пробельных символов (пробел, новая строка, возврат каретки, таб, вертикальный таб или перевод страницы) заменяется на один пробел.
@ -688,7 +688,7 @@ extractTextFromHTML(x)
Запрос: Запрос:
``` sql ``` sql
SELECT extractTextFromHTML(' <p> Text <i>with</i><b>tags</b>. <!-- comments --> </p> '); SELECT extractTextFromHTML(' <p> A text <i>with</i><b>tags</b>. <!-- comments --> </p> ');
SELECT extractTextFromHTML('<![CDATA[The content within <b>CDATA</b>]]> <script>alert("Script");</script>'); SELECT extractTextFromHTML('<![CDATA[The content within <b>CDATA</b>]]> <script>alert("Script");</script>');
SELECT extractTextFromHTML(html) FROM url('http://www.donothingfor2minutes.com/', RawBLOB, 'html String'); SELECT extractTextFromHTML(html) FROM url('http://www.donothingfor2minutes.com/', RawBLOB, 'html String');
``` ```
@ -696,7 +696,7 @@ SELECT extractTextFromHTML(html) FROM url('http://www.donothingfor2minutes.com/'
Результат: Результат:
``` text ``` text
Text with tags . A text with tags .
The content within <b>CDATA</b> The content within <b>CDATA</b>
Do Nothing for 2 Minutes 2:00 &nbsp; Do Nothing for 2 Minutes 2:00 &nbsp;
``` ```