diff --git a/doc/reference/en/introduction/what_is_clickhouse.rst b/doc/reference/en/introduction/what_is_clickhouse.rst index 4fa6b14a679..8f7dc5641f5 100644 --- a/doc/reference/en/introduction/what_is_clickhouse.rst +++ b/doc/reference/en/introduction/what_is_clickhouse.rst @@ -52,7 +52,7 @@ It is easy to see that the OLAP scenario is very different from other popular sc Columnar-oriented databases are better suited to OLAP scenarios (at least 100 times better in processing speed for most queries), for the following reasons: 1. For I/O. ------------ + #. For an analytical query, only a small number of table columns need to be read. In a column-oriented database, you can read just the data you need. For example, if you need 5 columns out of 100, you can expect a 20-fold reduction in I/O. #. Since data is read in packets, it is easier to compress. Data in columns is also easier to compress. This further reduces the I/O volume. #. Due to the reduced I/O, more data fits in the system cache. @@ -105,7 +105,7 @@ Example: :) 2. For CPU. ------------ + Since executing a query requires processing a large number of rows, it helps to dispatch all operations for entire vectors instead of for separate rows, or to implement the query engine so that there is almost no dispatching cost. If you don't do this, with any half-decent disk subsystem, the query interpreter inevitably stalls the CPU. It makes sense to both store data in columns and process it, when possible, by columns. diff --git a/doc/reference/ru/introduction/what_is_clickhouse.rst b/doc/reference/ru/introduction/what_is_clickhouse.rst index 76c43220f3f..6e67342930a 100644 --- a/doc/reference/ru/introduction/what_is_clickhouse.rst +++ b/doc/reference/ru/introduction/what_is_clickhouse.rst @@ -55,7 +55,7 @@ ClickHouse - столбцовая СУБД для OLAP (Columnar DBMS). Столбцовые СУБД лучше (от 100 раз по скорости обработки большинства запросов) подходят для OLAP сценария работы по следующим причинам: 1. По I/O. ----------- + #. Для выполнения аналитического запроса, требуется прочитать небольшое количество столбцов таблицы. В столбцовой БД для этого можно читать только нужные данные. Например, если вам требуется только 5 столбцов из 100, то следует рассчитывать на 20-кратное уменьшение ввода-вывода. #. Так как данные читаются пачками, то их проще сжимать. Данные, лежащие по столбцам также лучше сжимаются. За счёт этого, дополнительно уменьшается объём ввода-вывода. #. За счёт уменьшения ввода-вывода, больше данных влезает в системный кэш. @@ -109,7 +109,7 @@ ClickHouse - столбцовая СУБД для OLAP (Columnar DBMS). :) 2. По CPU. ----------- + Так как для выполнения запроса надо обработать достаточно большое количество строк, становится актуальным диспетчеризовывать все операции не для отдельных строк, а для целых векторов, или реализовать движок выполнения запроса так, чтобы издержки на диспетчеризацию были примерно нулевыми. Если этого не делать, то при любой не слишком плохой дисковой подсистеме, интерпретатор запроса неизбежно упрётся в CPU. Имеет смысл не только хранить данные по столбцам, но и обрабатывать их, по возможности, тоже по столбцам.