ClickHouse/dbms/include/DB/IO/CachedCompressedReadBuffer.h

59 lines
1.9 KiB
C++
Raw Normal View History

#pragma once
#include <memory>
2016-10-25 06:49:24 +00:00
#include <time.h>
#include <DB/IO/createReadBufferFromFileBase.h>
#include <DB/IO/CompressedReadBufferBase.h>
#include <DB/IO/UncompressedCache.h>
namespace DB
{
2016-01-12 02:42:18 +00:00
/** Буфер для чтения из сжатого файла с использованием кэша разжатых блоков.
* Кэш внешний - передаётся в качестве аргумента в конструктор.
* Позволяет увеличить производительность в случае, когда часто читаются одни и те же блоки.
* Недостатки:
* - в случае, если нужно читать много данных подряд, но из них только часть закэширована, приходится делать seek-и.
*/
class CachedCompressedReadBuffer : public CompressedReadBufferBase, public ReadBuffer
{
private:
const std::string path;
2013-11-26 11:55:11 +00:00
UncompressedCache * cache;
size_t buf_size;
2015-04-13 15:02:39 +00:00
size_t estimated_size;
size_t aio_threshold;
std::unique_ptr<ReadBufferFromFileBase> file_in;
size_t file_pos;
/// Кусок данных из кэша, или кусок считанных данных, который мы положим в кэш.
UncompressedCache::MappedPtr owned_cell;
2016-10-25 06:49:24 +00:00
void initInput();
bool nextImpl() override;
/// Передаётся в file_in.
ReadBufferFromFileBase::ProfileCallback profile_callback;
clockid_t clock_type;
public:
2015-07-08 17:59:44 +00:00
CachedCompressedReadBuffer(
const std::string & path_, UncompressedCache * cache_, size_t estimated_size_, size_t aio_threshold_,
2016-10-25 06:49:24 +00:00
size_t buf_size_ = DBMS_DEFAULT_BUFFER_SIZE);
2016-10-25 06:49:24 +00:00
void seek(size_t offset_in_compressed_file, size_t offset_in_decompressed_block);
void setProfileCallback(const ReadBufferFromFileBase::ProfileCallback & profile_callback_, clockid_t clock_type_ = CLOCK_MONOTONIC_COARSE)
{
profile_callback = profile_callback_;
clock_type = clock_type_;
}
};
}