2011-10-31 17:55:06 +00:00
|
|
|
|
#pragma once
|
2010-03-18 19:32:14 +00:00
|
|
|
|
|
2015-01-25 05:07:51 +00:00
|
|
|
|
#include <map>
|
2013-07-16 14:55:01 +00:00
|
|
|
|
|
2016-08-30 19:27:15 +00:00
|
|
|
|
#include <ext/shared_ptr_helper.hpp>
|
2016-08-26 21:25:05 +00:00
|
|
|
|
|
2010-03-18 19:32:14 +00:00
|
|
|
|
#include <Poco/File.h>
|
2012-11-30 04:28:13 +00:00
|
|
|
|
#include <Poco/RWLock.h>
|
2010-03-18 19:32:14 +00:00
|
|
|
|
|
|
|
|
|
#include <DB/Storages/IStorage.h>
|
2014-08-04 06:36:24 +00:00
|
|
|
|
#include <DB/Common/FileChecker.h>
|
2016-07-13 16:41:19 +00:00
|
|
|
|
#include <DB/Common/escapeForFileName.h>
|
2010-03-18 19:32:14 +00:00
|
|
|
|
|
|
|
|
|
|
|
|
|
|
namespace DB
|
|
|
|
|
{
|
|
|
|
|
|
2016-01-11 21:46:36 +00:00
|
|
|
|
namespace ErrorCodes
|
|
|
|
|
{
|
|
|
|
|
extern const int NO_SUCH_COLUMN_IN_TABLE;
|
|
|
|
|
}
|
|
|
|
|
|
|
|
|
|
|
2012-01-10 22:11:51 +00:00
|
|
|
|
/** Смещение до каждой некоторой пачки значений.
|
|
|
|
|
* Эти пачки имеют одинаковый размер в разных столбцах.
|
|
|
|
|
* Они нужны, чтобы можно было читать данные в несколько потоков.
|
|
|
|
|
*/
|
|
|
|
|
struct Mark
|
|
|
|
|
{
|
|
|
|
|
size_t rows; /// Сколько строк содержится в этой пачке и всех предыдущих.
|
|
|
|
|
size_t offset; /// Смещение до пачки в сжатом файле.
|
|
|
|
|
};
|
2014-01-17 15:19:20 +00:00
|
|
|
|
|
2016-05-28 10:35:44 +00:00
|
|
|
|
using Marks = std::vector<Mark>;
|
2012-01-10 22:11:51 +00:00
|
|
|
|
|
|
|
|
|
|
2010-03-18 19:32:14 +00:00
|
|
|
|
/** Реализует хранилище, подходящее для логов.
|
2012-01-09 19:20:48 +00:00
|
|
|
|
* Ключи не поддерживаются.
|
2010-03-18 19:32:14 +00:00
|
|
|
|
* Данные хранятся в сжатом виде.
|
|
|
|
|
*/
|
2016-08-30 19:27:15 +00:00
|
|
|
|
class StorageLog : private ext::shared_ptr_helper<StorageLog>, public IStorage
|
2010-03-18 19:32:14 +00:00
|
|
|
|
{
|
2016-08-30 19:27:15 +00:00
|
|
|
|
friend class ext::shared_ptr_helper<StorageLog>;
|
2010-03-18 19:32:14 +00:00
|
|
|
|
friend class LogBlockInputStream;
|
|
|
|
|
friend class LogBlockOutputStream;
|
|
|
|
|
|
|
|
|
|
public:
|
|
|
|
|
/** Подцепить таблицу с соответствующим именем, по соответствующему пути (с / на конце),
|
|
|
|
|
* (корректность имён и путей не проверяется)
|
|
|
|
|
* состоящую из указанных столбцов; создать файлы, если их нет.
|
|
|
|
|
*/
|
2014-09-30 03:08:47 +00:00
|
|
|
|
static StoragePtr create(
|
|
|
|
|
const std::string & path_,
|
|
|
|
|
const std::string & name_,
|
|
|
|
|
NamesAndTypesListPtr columns_,
|
2014-10-03 15:30:10 +00:00
|
|
|
|
const NamesAndTypesList & materialized_columns_,
|
2014-09-30 03:08:47 +00:00
|
|
|
|
const NamesAndTypesList & alias_columns_,
|
|
|
|
|
const ColumnDefaults & column_defaults_,
|
|
|
|
|
size_t max_compress_block_size_ = DEFAULT_MAX_COMPRESS_BLOCK_SIZE);
|
|
|
|
|
|
2014-10-03 17:55:36 +00:00
|
|
|
|
static StoragePtr create(
|
|
|
|
|
const std::string & path_,
|
|
|
|
|
const std::string & name_,
|
|
|
|
|
NamesAndTypesListPtr columns_,
|
|
|
|
|
size_t max_compress_block_size_ = DEFAULT_MAX_COMPRESS_BLOCK_SIZE);
|
2014-10-23 13:53:16 +00:00
|
|
|
|
|
2014-10-03 17:55:36 +00:00
|
|
|
|
std::string getName() const override { return "Log"; }
|
|
|
|
|
std::string getTableName() const override { return name; }
|
2011-08-15 02:24:44 +00:00
|
|
|
|
|
2014-10-10 15:45:43 +00:00
|
|
|
|
const NamesAndTypesList & getColumnsListImpl() const override { return *columns; }
|
2010-03-18 19:32:14 +00:00
|
|
|
|
|
2014-02-11 18:38:21 +00:00
|
|
|
|
virtual BlockInputStreams read(
|
2011-08-09 15:57:33 +00:00
|
|
|
|
const Names & column_names,
|
2011-08-15 01:12:57 +00:00
|
|
|
|
ASTPtr query,
|
2014-12-17 11:53:17 +00:00
|
|
|
|
const Context & context,
|
2013-02-01 19:02:04 +00:00
|
|
|
|
const Settings & settings,
|
2012-05-22 18:32:45 +00:00
|
|
|
|
QueryProcessingStage::Enum & processed_stage,
|
2012-01-09 19:20:48 +00:00
|
|
|
|
size_t max_block_size = DEFAULT_BLOCK_SIZE,
|
2014-10-03 17:55:36 +00:00
|
|
|
|
unsigned threads = 1) override;
|
2010-03-18 19:32:14 +00:00
|
|
|
|
|
2015-09-10 20:43:42 +00:00
|
|
|
|
BlockOutputStreamPtr write(ASTPtr query, const Settings & settings) override;
|
2010-03-18 19:32:14 +00:00
|
|
|
|
|
2014-10-03 17:55:36 +00:00
|
|
|
|
void rename(const String & new_path_to_db, const String & new_database_name, const String & new_table_name) override;
|
2011-11-05 23:31:19 +00:00
|
|
|
|
|
2014-08-04 06:36:24 +00:00
|
|
|
|
/// Данные столбца
|
|
|
|
|
struct ColumnData
|
|
|
|
|
{
|
|
|
|
|
/// Задает номер столбца в файле с засечками.
|
|
|
|
|
/// Не обязательно совпадает с номером столбца среди столбцов таблицы: здесь нумеруются также столбцы с длинами массивов.
|
|
|
|
|
size_t column_index;
|
|
|
|
|
|
|
|
|
|
Poco::File data_file;
|
|
|
|
|
Marks marks;
|
|
|
|
|
};
|
2016-05-28 10:35:44 +00:00
|
|
|
|
using Files_t = std::map<String, ColumnData>;
|
2014-08-04 06:36:24 +00:00
|
|
|
|
|
|
|
|
|
bool checkData() const override;
|
|
|
|
|
|
2013-02-07 13:03:19 +00:00
|
|
|
|
protected:
|
2012-06-18 06:19:13 +00:00
|
|
|
|
String path;
|
|
|
|
|
String name;
|
2011-11-01 17:12:11 +00:00
|
|
|
|
NamesAndTypesListPtr columns;
|
2010-03-18 19:32:14 +00:00
|
|
|
|
|
2013-02-07 13:03:19 +00:00
|
|
|
|
Poco::RWLock rwlock;
|
2014-01-17 15:19:20 +00:00
|
|
|
|
|
2014-01-27 13:52:01 +00:00
|
|
|
|
/// Название виртуального столбца, отвечающего за имя таблицы, из которой идет чтение. (Например "_table")
|
2014-01-17 15:19:20 +00:00
|
|
|
|
/// По умолчанию виртуальный столбец не поддерживается, но, например, он поддерживается в StorageChunks
|
|
|
|
|
String _table_column_name;
|
|
|
|
|
|
|
|
|
|
/// По номеру засечки получить имя таблицы, из которой идет чтение и номер последней засечки из этой таблицы.
|
|
|
|
|
/// По умолчанию виртуальный столбец не поддерживается, а значит при попытке его чтения нужно выбросить исключение.
|
|
|
|
|
virtual std::pair<String, size_t> getTableFromMark(size_t mark) const
|
|
|
|
|
{
|
|
|
|
|
throw Exception("There is no column " + _table_column_name + " in table " + getTableName(), ErrorCodes::NO_SUCH_COLUMN_IN_TABLE);
|
|
|
|
|
}
|
|
|
|
|
|
2014-09-30 03:08:47 +00:00
|
|
|
|
StorageLog(
|
|
|
|
|
const std::string & path_,
|
|
|
|
|
const std::string & name_,
|
|
|
|
|
NamesAndTypesListPtr columns_,
|
2014-10-03 15:30:10 +00:00
|
|
|
|
const NamesAndTypesList & materialized_columns_,
|
2014-09-30 03:08:47 +00:00
|
|
|
|
const NamesAndTypesList & alias_columns_,
|
|
|
|
|
const ColumnDefaults & column_defaults_,
|
|
|
|
|
size_t max_compress_block_size_);
|
|
|
|
|
|
2013-02-26 13:06:01 +00:00
|
|
|
|
/// Прочитать файлы с засечками, если они ещё не прочитаны.
|
|
|
|
|
/// Делается лениво, чтобы при большом количестве таблиц, сервер быстро стартовал.
|
2013-02-11 08:55:51 +00:00
|
|
|
|
/// Нельзя вызывать с залоченным на запись rwlock.
|
2013-02-07 13:03:19 +00:00
|
|
|
|
void loadMarks();
|
2014-09-30 03:08:47 +00:00
|
|
|
|
|
2013-02-07 13:03:19 +00:00
|
|
|
|
BlockInputStreams read(
|
|
|
|
|
size_t from_mark,
|
|
|
|
|
size_t to_mark,
|
2016-07-12 18:08:16 +00:00
|
|
|
|
size_t from_null_mark,
|
2013-02-07 13:03:19 +00:00
|
|
|
|
const Names & column_names,
|
|
|
|
|
ASTPtr query,
|
2014-12-17 11:53:17 +00:00
|
|
|
|
const Context & context,
|
2013-02-07 13:03:19 +00:00
|
|
|
|
const Settings & settings,
|
|
|
|
|
QueryProcessingStage::Enum & processed_stage,
|
|
|
|
|
size_t max_block_size = DEFAULT_BLOCK_SIZE,
|
|
|
|
|
unsigned threads = 1);
|
2014-09-30 03:08:47 +00:00
|
|
|
|
|
2013-02-07 13:03:19 +00:00
|
|
|
|
private:
|
2013-02-26 13:06:01 +00:00
|
|
|
|
Files_t files; /// name -> data
|
2014-08-04 06:36:24 +00:00
|
|
|
|
|
2013-02-26 13:06:01 +00:00
|
|
|
|
Names column_names; /// column_index -> name
|
2016-08-24 00:39:38 +00:00
|
|
|
|
Names null_map_filenames;
|
2014-09-30 03:08:47 +00:00
|
|
|
|
|
2013-02-26 13:06:01 +00:00
|
|
|
|
Poco::File marks_file;
|
2016-07-12 18:08:16 +00:00
|
|
|
|
Poco::File null_marks_file;
|
|
|
|
|
|
2016-08-10 19:12:29 +00:00
|
|
|
|
void loadMarksImpl(bool load_null_marks);
|
2014-09-30 03:08:47 +00:00
|
|
|
|
|
2013-02-26 13:06:01 +00:00
|
|
|
|
/// Порядок добавления файлов не должен меняться: он соответствует порядку столбцов в файле с засечками.
|
2012-08-29 20:07:24 +00:00
|
|
|
|
void addFile(const String & column_name, const IDataType & type, size_t level = 0);
|
|
|
|
|
|
2012-06-21 16:33:00 +00:00
|
|
|
|
bool loaded_marks;
|
2016-07-12 18:08:16 +00:00
|
|
|
|
bool has_nullable_columns = false;
|
2013-12-12 22:55:47 +00:00
|
|
|
|
|
2014-03-28 14:36:24 +00:00
|
|
|
|
size_t max_compress_block_size;
|
2016-08-10 19:12:29 +00:00
|
|
|
|
size_t file_count = 0;
|
|
|
|
|
size_t null_file_count = 0;
|
2014-03-28 14:36:24 +00:00
|
|
|
|
|
2014-08-04 11:17:05 +00:00
|
|
|
|
protected:
|
2015-08-16 07:01:41 +00:00
|
|
|
|
FileChecker file_checker;
|
2014-08-04 06:36:24 +00:00
|
|
|
|
|
2014-08-04 11:17:05 +00:00
|
|
|
|
private:
|
2013-12-12 22:55:47 +00:00
|
|
|
|
/** Для обычных столбцов, в засечках указано количество строчек в блоке.
|
|
|
|
|
* Для столбцов-массивов и вложенных структур, есть более одной группы засечек, соответствующих разным файлам:
|
|
|
|
|
* - для внутренностей (файла name.bin) - указано суммарное количество элементов массивов в блоке,
|
|
|
|
|
* - для размеров массивов (файла name.size0.bin) - указано количество строчек (самих целых массивов) в блоке.
|
|
|
|
|
*
|
|
|
|
|
* Вернуть первую попавшуюся группу засечек, в которых указано количество строчек, а не внутренностей массивов.
|
|
|
|
|
*/
|
|
|
|
|
const Marks & getMarksWithRealRowCount() const;
|
2016-07-13 16:41:19 +00:00
|
|
|
|
|
|
|
|
|
std::string getFullPath() const { return path + escapeForFileName(name) + '/';}
|
2010-03-18 19:32:14 +00:00
|
|
|
|
};
|
|
|
|
|
|
|
|
|
|
}
|