2016-02-07 08:42:21 +00:00
|
|
|
|
#pragma once
|
|
|
|
|
|
|
|
|
|
#include <DB/Core/Block.h>
|
|
|
|
|
#include <DB/DataStreams/IRowInputStream.h>
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
namespace DB
|
|
|
|
|
{
|
|
|
|
|
|
2016-02-16 16:39:39 +00:00
|
|
|
|
class ReadBuffer;
|
|
|
|
|
class WriteBuffer;
|
|
|
|
|
|
2016-02-07 08:42:21 +00:00
|
|
|
|
/** Поток для ввода данных в формате csv.
|
2016-02-07 10:43:02 +00:00
|
|
|
|
* Не соответствует https://tools.ietf.org/html/rfc4180 потому что пропускает пробелы и табы между значениями.
|
2016-02-07 08:42:21 +00:00
|
|
|
|
*/
|
|
|
|
|
class CSVRowInputStream : public IRowInputStream
|
|
|
|
|
{
|
|
|
|
|
public:
|
|
|
|
|
/** with_names - в первой строке заголовок с именами столбцов
|
|
|
|
|
* with_types - на следующей строке заголовок с именами типов
|
|
|
|
|
*/
|
|
|
|
|
CSVRowInputStream(ReadBuffer & istr_, const Block & sample_, const char delimiter_, bool with_names_ = false, bool with_types_ = false);
|
|
|
|
|
|
2016-02-16 16:39:39 +00:00
|
|
|
|
bool read(Block & block) override;
|
2016-02-07 08:42:21 +00:00
|
|
|
|
void readPrefix() override;
|
|
|
|
|
|
|
|
|
|
private:
|
|
|
|
|
ReadBuffer & istr;
|
|
|
|
|
const Block sample;
|
|
|
|
|
const char delimiter;
|
|
|
|
|
bool with_names;
|
|
|
|
|
bool with_types;
|
|
|
|
|
DataTypes data_types;
|
|
|
|
|
|
|
|
|
|
/// Для удобной диагностики в случае ошибки.
|
|
|
|
|
|
|
|
|
|
size_t row_num = 0;
|
|
|
|
|
|
|
|
|
|
/// Сколько байт было считано, не считая тех, что ещё в буфере.
|
|
|
|
|
size_t bytes_read_at_start_of_buffer_on_current_row = 0;
|
|
|
|
|
size_t bytes_read_at_start_of_buffer_on_prev_row = 0;
|
|
|
|
|
|
2016-02-16 16:39:39 +00:00
|
|
|
|
char * pos_of_current_row = nullptr;
|
|
|
|
|
char * pos_of_prev_row = nullptr;
|
2016-02-07 08:42:21 +00:00
|
|
|
|
|
|
|
|
|
/** В случае исключения при парсинге, вызывается эта функция.
|
|
|
|
|
* Она выполняет заново парсинг последних двух строк и выводит подробную информацию о том, что происходит.
|
|
|
|
|
*/
|
2016-02-16 16:39:39 +00:00
|
|
|
|
void printDiagnosticInfo(Block & block, WriteBuffer & out);
|
2016-02-07 08:42:21 +00:00
|
|
|
|
|
|
|
|
|
void updateDiagnosticInfo()
|
|
|
|
|
{
|
|
|
|
|
++row_num;
|
|
|
|
|
|
|
|
|
|
bytes_read_at_start_of_buffer_on_prev_row = bytes_read_at_start_of_buffer_on_current_row;
|
|
|
|
|
bytes_read_at_start_of_buffer_on_current_row = istr.count() - istr.offset();
|
|
|
|
|
|
|
|
|
|
pos_of_prev_row = pos_of_current_row;
|
|
|
|
|
pos_of_current_row = istr.position();
|
|
|
|
|
}
|
|
|
|
|
|
2016-02-16 16:39:39 +00:00
|
|
|
|
bool parseRowAndPrintDiagnosticInfo(Block & block,
|
|
|
|
|
WriteBuffer & out, size_t max_length_of_column_name, size_t max_length_of_data_type_name);
|
2016-02-07 08:42:21 +00:00
|
|
|
|
};
|
|
|
|
|
|
|
|
|
|
}
|