2014-10-26 00:01:36 +00:00
|
|
|
|
#pragma once
|
|
|
|
|
|
|
|
|
|
#include <mutex>
|
|
|
|
|
#include <thread>
|
|
|
|
|
|
|
|
|
|
#include <DB/Core/NamesAndTypes.h>
|
|
|
|
|
#include <DB/Storages/IStorage.h>
|
|
|
|
|
#include <DB/DataStreams/IBlockOutputStream.h>
|
|
|
|
|
#include <DB/Interpreters/Context.h>
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
namespace DB
|
|
|
|
|
{
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
/** При вставке, буферизует данные в оперативке, пока не превышены некоторые пороги.
|
|
|
|
|
* Когда пороги превышены - сбрасывает данные в другую таблицу.
|
|
|
|
|
* При чтении, читает как из своих буферов, так и из подчинённой таблицы.
|
|
|
|
|
*
|
|
|
|
|
* Буфер представляет собой набор из num_shards блоков.
|
2014-10-27 04:18:13 +00:00
|
|
|
|
* При записи, выбирается номер блока по остатку от деления ThreadNumber на num_shards (или один из других),
|
2014-10-26 00:01:36 +00:00
|
|
|
|
* и в соответствующий блок добавляются строчки.
|
|
|
|
|
* При использовании блока, он блокируется некоторым mutex-ом. Если при записи, соответствующий блок уже занят
|
2014-10-27 04:18:13 +00:00
|
|
|
|
* - пробуем заблокировать следующий по кругу блок, и так не более num_shards раз (далее блокируемся).
|
2014-10-26 00:01:36 +00:00
|
|
|
|
* Пороги проверяются при вставке, а также, периодически, в фоновом потоке (чтобы реализовать пороги по времени).
|
|
|
|
|
* Пороги действуют независимо для каждого shard-а. Каждый shard может быть сброшен независимо от других.
|
|
|
|
|
* Если в таблицу вставляется блок, который сам по себе превышает max-пороги, то он записывается сразу в подчинённую таблицу без буферизации.
|
|
|
|
|
* Пороги могут быть превышены. Например, если max_rows = 1 000 000, в буфере уже было 500 000 строк,
|
|
|
|
|
* и добавляется кусок из 800 000 строк, то в буфере окажется 1 300 000 строк, и затем такой блок будет записан в подчинённую таблицу
|
|
|
|
|
*
|
|
|
|
|
* При уничтожении таблицы типа Buffer и при завершении работы, все данные сбрасываются.
|
|
|
|
|
* Данные в буфере не реплицируются, не логгируются на диск, не индексируются. При грубом перезапуске сервера, данные пропадают.
|
|
|
|
|
*/
|
|
|
|
|
class StorageBuffer : public IStorage
|
|
|
|
|
{
|
|
|
|
|
friend class BufferBlockInputStream;
|
|
|
|
|
friend class BufferBlockOutputStream;
|
|
|
|
|
|
|
|
|
|
public:
|
|
|
|
|
/// Пороги.
|
|
|
|
|
struct Thresholds
|
|
|
|
|
{
|
|
|
|
|
time_t time; /// Количество секунд от момента вставки первой строчки в блок.
|
|
|
|
|
size_t rows; /// Количество строк в блоке.
|
|
|
|
|
size_t bytes; /// Количество (несжатых) байт в блоке.
|
|
|
|
|
};
|
|
|
|
|
|
|
|
|
|
/** num_shards - уровень внутреннего параллелизма (количество независимых буферов)
|
|
|
|
|
* Буфер сбрасывается, если превышены все минимальные пороги или хотя бы один из максимальных.
|
|
|
|
|
*/
|
2015-06-09 19:43:06 +00:00
|
|
|
|
static StoragePtr create(const std::string & name_, NamesAndTypesListPtr columns_,
|
|
|
|
|
const NamesAndTypesList & materialized_columns_,
|
|
|
|
|
const NamesAndTypesList & alias_columns_,
|
|
|
|
|
const ColumnDefaults & column_defaults_,
|
|
|
|
|
Context & context_,
|
2014-10-26 00:01:36 +00:00
|
|
|
|
size_t num_shards_, const Thresholds & min_thresholds_, const Thresholds & max_thresholds_,
|
|
|
|
|
const String & destination_database_, const String & destination_table_);
|
|
|
|
|
|
|
|
|
|
std::string getName() const override { return "Buffer"; }
|
|
|
|
|
std::string getTableName() const override { return name; }
|
|
|
|
|
|
2014-11-12 10:37:47 +00:00
|
|
|
|
const NamesAndTypesList & getColumnsListImpl() const override { return *columns; }
|
2014-10-26 00:01:36 +00:00
|
|
|
|
|
|
|
|
|
BlockInputStreams read(
|
|
|
|
|
const Names & column_names,
|
|
|
|
|
ASTPtr query,
|
2014-12-17 11:53:17 +00:00
|
|
|
|
const Context & context,
|
2014-10-26 00:01:36 +00:00
|
|
|
|
const Settings & settings,
|
|
|
|
|
QueryProcessingStage::Enum & processed_stage,
|
|
|
|
|
size_t max_block_size = DEFAULT_BLOCK_SIZE,
|
|
|
|
|
unsigned threads = 1) override;
|
|
|
|
|
|
2015-09-10 20:43:42 +00:00
|
|
|
|
BlockOutputStreamPtr write(ASTPtr query, const Settings & settings) override;
|
2014-10-26 00:01:36 +00:00
|
|
|
|
|
|
|
|
|
/// Сбрасывает все буферы в подчинённую таблицу.
|
|
|
|
|
void shutdown() override;
|
2015-04-14 14:58:59 +00:00
|
|
|
|
bool optimize(const Settings & settings) override;
|
2014-10-26 00:01:36 +00:00
|
|
|
|
|
|
|
|
|
void rename(const String & new_path_to_db, const String & new_database_name, const String & new_table_name) override { name = new_table_name; }
|
|
|
|
|
|
|
|
|
|
bool supportsSampling() const override { return true; }
|
|
|
|
|
bool supportsPrewhere() const override { return true; }
|
2015-05-18 21:20:43 +00:00
|
|
|
|
bool supportsFinal() const override { return true; }
|
|
|
|
|
bool supportsIndexForIn() const override { return true; }
|
|
|
|
|
bool supportsParallelReplicas() const override { return true; }
|
2014-10-26 00:01:36 +00:00
|
|
|
|
|
2014-10-27 04:18:13 +00:00
|
|
|
|
/// Структура подчинённой таблицы не проверяется и не изменяется.
|
2016-01-21 16:30:05 +00:00
|
|
|
|
void alter(const AlterCommands & params, const String & database_name, const String & table_name, const Context & context) override;
|
2014-10-26 00:01:36 +00:00
|
|
|
|
|
|
|
|
|
private:
|
|
|
|
|
String name;
|
|
|
|
|
NamesAndTypesListPtr columns;
|
|
|
|
|
|
|
|
|
|
Context & context;
|
|
|
|
|
|
|
|
|
|
struct Buffer
|
|
|
|
|
{
|
|
|
|
|
time_t first_write_time = 0;
|
|
|
|
|
Block data;
|
|
|
|
|
std::mutex mutex;
|
|
|
|
|
};
|
|
|
|
|
|
|
|
|
|
/// Имеется num_shards независимых буферов.
|
|
|
|
|
const size_t num_shards;
|
|
|
|
|
std::vector<Buffer> buffers;
|
|
|
|
|
|
|
|
|
|
const Thresholds min_thresholds;
|
|
|
|
|
const Thresholds max_thresholds;
|
|
|
|
|
|
|
|
|
|
const String destination_database;
|
|
|
|
|
const String destination_table;
|
|
|
|
|
bool no_destination; /// Если задано - не записывать данные из буфера, а просто опустошать буфер.
|
|
|
|
|
|
|
|
|
|
Logger * log;
|
|
|
|
|
|
2014-12-15 04:00:47 +00:00
|
|
|
|
Poco::Event shutdown_event;
|
2014-10-26 00:01:36 +00:00
|
|
|
|
/// Выполняет сброс данных по таймауту.
|
|
|
|
|
std::thread flush_thread;
|
|
|
|
|
|
2015-06-09 19:43:06 +00:00
|
|
|
|
StorageBuffer(const std::string & name_, NamesAndTypesListPtr columns_,
|
|
|
|
|
const NamesAndTypesList & materialized_columns_,
|
|
|
|
|
const NamesAndTypesList & alias_columns_,
|
|
|
|
|
const ColumnDefaults & column_defaults_,
|
|
|
|
|
Context & context_,
|
2014-10-26 00:01:36 +00:00
|
|
|
|
size_t num_shards_, const Thresholds & min_thresholds_, const Thresholds & max_thresholds_,
|
|
|
|
|
const String & destination_database_, const String & destination_table_);
|
|
|
|
|
|
2014-12-03 13:28:17 +00:00
|
|
|
|
void flushAllBuffers(bool check_thresholds = true);
|
2014-10-26 00:01:36 +00:00
|
|
|
|
/// Сбросить буфер. Если выставлено check_thresholds - сбрасывает только если превышены пороги.
|
|
|
|
|
void flushBuffer(Buffer & buffer, bool check_thresholds);
|
2015-12-09 06:55:49 +00:00
|
|
|
|
bool checkThresholds(const Buffer & buffer, time_t current_time, size_t additional_rows = 0, size_t additional_bytes = 0) const;
|
|
|
|
|
bool checkThresholdsImpl(size_t rows, size_t bytes, time_t time_passed) const;
|
2014-10-26 00:01:36 +00:00
|
|
|
|
|
2014-10-27 04:18:13 +00:00
|
|
|
|
/// Аргумент table передаётся, так как иногда вычисляется заранее. Он должен соответствовать destination-у.
|
|
|
|
|
void writeBlockToDestination(const Block & block, StoragePtr table);
|
|
|
|
|
|
2014-10-26 00:01:36 +00:00
|
|
|
|
void flushThread();
|
|
|
|
|
};
|
|
|
|
|
|
|
|
|
|
}
|