2011-08-09 15:57:33 +00:00
|
|
|
|
#pragma once
|
2010-06-04 18:25:25 +00:00
|
|
|
|
|
|
|
|
|
#include <cstring>
|
2011-08-09 15:57:33 +00:00
|
|
|
|
#include <algorithm>
|
2010-06-04 18:25:25 +00:00
|
|
|
|
|
|
|
|
|
#include <DB/Core/Exception.h>
|
|
|
|
|
#include <DB/Core/ErrorCodes.h>
|
2011-06-27 18:22:14 +00:00
|
|
|
|
#include <DB/IO/BufferBase.h>
|
2010-06-04 18:25:25 +00:00
|
|
|
|
|
|
|
|
|
|
|
|
|
|
namespace DB
|
|
|
|
|
{
|
|
|
|
|
|
|
|
|
|
/** Простой абстрактный класс для буферизованного чтения данных (последовательности char) откуда-нибудь.
|
|
|
|
|
* В отличие от std::istream, предоставляет доступ к внутреннему буферу,
|
|
|
|
|
* а также позволяет вручную управлять позицией внутри буфера.
|
|
|
|
|
*
|
2011-10-17 08:28:39 +00:00
|
|
|
|
* Замечание! Используется char *, а не const char *
|
|
|
|
|
* (для того, чтобы можно было вынести общий код в BufferBase, а также для того, чтобы можно было заполнять буфер новыми данными).
|
2011-10-16 03:05:15 +00:00
|
|
|
|
* Это вызывает неудобства - например, при использовании ReadBuffer для чтения из куска памяти const char *,
|
|
|
|
|
* приходится использовать const_cast.
|
|
|
|
|
*
|
2011-06-24 21:08:26 +00:00
|
|
|
|
* Наследники должны реализовать метод nextImpl().
|
2010-06-04 18:25:25 +00:00
|
|
|
|
*/
|
2011-06-27 18:22:14 +00:00
|
|
|
|
class ReadBuffer : public BufferBase
|
2010-06-04 18:25:25 +00:00
|
|
|
|
{
|
|
|
|
|
public:
|
2012-02-09 23:49:04 +00:00
|
|
|
|
/** Создаёт буфер и устанавливает кусок доступных данных для чтения нулевого размера,
|
2011-10-16 03:05:15 +00:00
|
|
|
|
* чтобы при первой попытке чтения вызвалась функция next() для загрузки в буфер новой порции данных.
|
|
|
|
|
*/
|
2012-02-09 23:49:04 +00:00
|
|
|
|
ReadBuffer(Position ptr, size_t size) : BufferBase(ptr, size, 0) { working_buffer.resize(0); }
|
2011-10-16 03:05:15 +00:00
|
|
|
|
|
|
|
|
|
/** Используется, если буфер уже заполнен данными, которые можно читать.
|
|
|
|
|
* (в этом случае, передайте 0 в качестве offset)
|
|
|
|
|
*/
|
|
|
|
|
ReadBuffer(Position ptr, size_t size, size_t offset) : BufferBase(ptr, size, offset) {}
|
|
|
|
|
|
2012-02-09 23:49:04 +00:00
|
|
|
|
void set(Position ptr, size_t size) { BufferBase::set(ptr, size, 0); working_buffer.resize(0); }
|
2010-06-04 18:25:25 +00:00
|
|
|
|
|
|
|
|
|
/** прочитать следующие данные и заполнить ими буфер; переместить позицию в начало;
|
|
|
|
|
* вернуть false в случае конца, true иначе; кинуть исключение, если что-то не так
|
|
|
|
|
*/
|
2015-02-05 14:28:48 +00:00
|
|
|
|
bool next()
|
2011-06-24 21:08:26 +00:00
|
|
|
|
{
|
2011-06-27 18:22:14 +00:00
|
|
|
|
bytes += offset();
|
2011-06-24 21:08:26 +00:00
|
|
|
|
bool res = nextImpl();
|
2011-06-26 21:30:59 +00:00
|
|
|
|
if (!res)
|
2011-06-27 18:22:14 +00:00
|
|
|
|
working_buffer.resize(0);
|
2015-02-07 23:13:04 +00:00
|
|
|
|
|
2015-04-05 20:04:55 +00:00
|
|
|
|
pos = working_buffer.begin() + working_buffer_offset;
|
|
|
|
|
working_buffer_offset = 0;
|
2011-06-24 21:08:26 +00:00
|
|
|
|
return res;
|
|
|
|
|
}
|
2010-06-04 18:25:25 +00:00
|
|
|
|
|
2014-07-22 08:20:45 +00:00
|
|
|
|
|
|
|
|
|
inline void nextIfAtEnd()
|
|
|
|
|
{
|
2015-02-07 23:13:04 +00:00
|
|
|
|
if (!hasPendingData())
|
2014-07-22 08:20:45 +00:00
|
|
|
|
next();
|
|
|
|
|
}
|
|
|
|
|
|
2010-06-04 18:25:25 +00:00
|
|
|
|
virtual ~ReadBuffer() {}
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
/** В отличие от std::istream, возвращает true, если все данные были прочитаны
|
|
|
|
|
* (а не в случае, если была попытка чтения после конца).
|
|
|
|
|
* Если на данный момент позиция находится на конце буфера, то вызывает метод next().
|
|
|
|
|
* То есть, имеет побочный эффект - если буфер закончился, то обновляет его и переносит позицию в начало.
|
|
|
|
|
*
|
|
|
|
|
* При попытке чтения после конца, следует кидать исключение.
|
|
|
|
|
*/
|
2015-02-08 09:42:53 +00:00
|
|
|
|
bool eof()
|
2010-06-04 18:25:25 +00:00
|
|
|
|
{
|
2015-02-07 23:13:04 +00:00
|
|
|
|
return !hasPendingData() && !next();
|
2010-06-04 18:25:25 +00:00
|
|
|
|
}
|
|
|
|
|
|
|
|
|
|
void ignore()
|
|
|
|
|
{
|
|
|
|
|
if (!eof())
|
|
|
|
|
++pos;
|
|
|
|
|
else
|
|
|
|
|
throw Exception("Attempt to read after eof", ErrorCodes::ATTEMPT_TO_READ_AFTER_EOF);
|
|
|
|
|
}
|
|
|
|
|
|
2011-06-06 20:35:58 +00:00
|
|
|
|
void ignore(size_t n)
|
|
|
|
|
{
|
|
|
|
|
while (!eof() && n != 0)
|
|
|
|
|
{
|
|
|
|
|
size_t bytes_to_ignore = std::min(static_cast<size_t>(working_buffer.end() - pos), n);
|
|
|
|
|
pos += bytes_to_ignore;
|
|
|
|
|
n -= bytes_to_ignore;
|
|
|
|
|
}
|
|
|
|
|
|
|
|
|
|
if (n)
|
|
|
|
|
throw Exception("Attempt to read after eof", ErrorCodes::ATTEMPT_TO_READ_AFTER_EOF);
|
|
|
|
|
}
|
|
|
|
|
|
2014-07-22 08:20:45 +00:00
|
|
|
|
/// Можно было бы назвать этот метод ignore, а ignore назвать ignoreStrict.
|
|
|
|
|
size_t tryIgnore(size_t n)
|
|
|
|
|
{
|
|
|
|
|
size_t bytes_ignored = 0;
|
|
|
|
|
|
|
|
|
|
while (bytes_ignored < n && !eof())
|
|
|
|
|
{
|
|
|
|
|
size_t bytes_to_ignore = std::min(static_cast<size_t>(working_buffer.end() - pos), n - bytes_ignored);
|
|
|
|
|
pos += bytes_to_ignore;
|
|
|
|
|
bytes_ignored += bytes_to_ignore;
|
|
|
|
|
}
|
|
|
|
|
|
|
|
|
|
return bytes_ignored;
|
|
|
|
|
}
|
|
|
|
|
|
2010-06-04 18:25:25 +00:00
|
|
|
|
/** Читает столько, сколько есть, не больше n байт. */
|
|
|
|
|
size_t read(char * to, size_t n)
|
|
|
|
|
{
|
|
|
|
|
size_t bytes_copied = 0;
|
|
|
|
|
|
2012-03-25 07:52:31 +00:00
|
|
|
|
while (bytes_copied < n && !eof())
|
2010-06-04 18:25:25 +00:00
|
|
|
|
{
|
|
|
|
|
size_t bytes_to_copy = std::min(static_cast<size_t>(working_buffer.end() - pos), n - bytes_copied);
|
2015-04-03 11:51:41 +00:00
|
|
|
|
::memcpy(to + bytes_copied, pos, bytes_to_copy);
|
2010-06-04 18:25:25 +00:00
|
|
|
|
pos += bytes_to_copy;
|
2010-06-04 19:06:32 +00:00
|
|
|
|
bytes_copied += bytes_to_copy;
|
2010-06-04 18:25:25 +00:00
|
|
|
|
}
|
|
|
|
|
|
|
|
|
|
return bytes_copied;
|
|
|
|
|
}
|
|
|
|
|
|
|
|
|
|
/** Читает n байт, если есть меньше - кидает исключение. */
|
|
|
|
|
void readStrict(char * to, size_t n)
|
|
|
|
|
{
|
|
|
|
|
if (n != read(to, n))
|
|
|
|
|
throw Exception("Cannot read all data", ErrorCodes::CANNOT_READ_ALL_DATA);
|
|
|
|
|
}
|
|
|
|
|
|
2013-09-08 00:00:25 +00:00
|
|
|
|
/** Метод, который может быть более эффективно реализован в наследниках, в случае чтения достаточно больших блоков.
|
|
|
|
|
* Реализация может читать данные сразу в to, без лишнего копирования, если в to есть достаточно места для работы.
|
|
|
|
|
* Например, CompressedReadBuffer может разжимать данные сразу в to, если весь разжатый блок туда помещается.
|
|
|
|
|
* По-умолчанию - то же, что и read.
|
|
|
|
|
* Для маленьких чтений использовать не нужно.
|
|
|
|
|
*/
|
|
|
|
|
virtual size_t readBig(char * to, size_t n)
|
|
|
|
|
{
|
|
|
|
|
return read(to, n);
|
|
|
|
|
}
|
|
|
|
|
|
2015-04-06 15:10:09 +00:00
|
|
|
|
protected:
|
2015-04-15 08:45:22 +00:00
|
|
|
|
/// Количество игнорируемых байт с начальной позиции буфера working_buffer.
|
2015-04-06 15:10:09 +00:00
|
|
|
|
size_t working_buffer_offset = 0;
|
|
|
|
|
|
2011-05-13 19:40:56 +00:00
|
|
|
|
private:
|
2011-06-24 21:08:26 +00:00
|
|
|
|
/** Прочитать следующие данные и заполнить ими буфер.
|
|
|
|
|
* Вернуть false в случае конца, true иначе.
|
|
|
|
|
* Кинуть исключение, если что-то не так.
|
|
|
|
|
*/
|
|
|
|
|
virtual bool nextImpl() { return false; };
|
2010-06-04 18:25:25 +00:00
|
|
|
|
};
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
}
|