ClickHouse/dbms/src/Storages/MergeTree/MergedColumnOnlyOutputStream.cpp

#include <Storages/MergeTree/MergedColumnOnlyOutputStream.h>

namespace DB
{

MergedColumnOnlyOutputStream::MergedColumnOnlyOutputStream(
    const MergeTreeDataPartPtr & data_part_, const Block & header_, bool sync_,
    CompressionCodecPtr default_codec_, bool skip_offsets_,
    const std::vector<MergeTreeIndexPtr> & indices_to_recalc_,
    WrittenOffsetColumns & already_written_offset_columns_,
    const MergeTreeIndexGranularityInfo * index_granularity_info_)
    : IMergedBlockOutputStream(
        data_part_, default_codec_,
        {
            data_part_->storage.global_context.getSettings().min_compress_block_size,
            data_part_->storage.global_context.getSettings().max_compress_block_size,
            data_part_->storage.global_context.getSettings().min_bytes_to_use_direct_io,
        },
        false,
        indices_to_recalc_,
        index_granularity_info_ ? index_granularity_info_->is_adaptive : data_part_->storage.canUseAdaptiveGranularity()),
    header(header_), sync(sync_), skip_offsets(skip_offsets_),
    already_written_offset_columns(already_written_offset_columns_)
{
    std::cerr << "(MergedColumnOnlyOutputStream) storage: " << storage.getTableName() << "\n";
    std::cerr << "(MergedColumnOnlyOutputStream) can_use_adaptive_granularity: " << can_use_adaptive_granularity << "\n";
    std::cerr << "(MergedColumnOnlyOutputStream) index_granularity_info: " << !!index_granularity_info_ << "\n";
    if (index_granularity_info_)
        std::cerr << "(MergedColumnOnlyOutputStream) index_granularity_info->isAdaptive(): " << index_granularity_info_->is_adaptive << "\n";

    writer = data_part_->getWriter(header.getNamesAndTypesList(), default_codec_, writer_settings);

    std::cerr << "(MergedColumnOnlyOutputStream) writer: " << !!writer << "\n";
    initSkipIndices();
}

void MergedColumnOnlyOutputStream::write(const Block & block)
{
    std::set<String> skip_indexes_column_names_set;
    for (const auto & index : skip_indices)
        std::copy(index->columns.cbegin(), index->columns.cend(),
                  std::inserter(skip_indexes_column_names_set, skip_indexes_column_names_set.end()));
    Names skip_indexes_column_names(skip_indexes_column_names_set.begin(), skip_indexes_column_names_set.end());

    std::vector<ColumnWithTypeAndName> skip_indexes_columns(skip_indexes_column_names.size());
    std::map<String, size_t> skip_indexes_column_name_to_position;
    for (size_t i = 0, size = skip_indexes_column_names.size(); i < size; ++i)
    {
        const auto & name = skip_indexes_column_names[i];
        skip_indexes_column_name_to_position.emplace(name, i);
        skip_indexes_columns[i] = block.getByName(name);
    }

    size_t rows = block.rows();
    if (!rows)
        return;

    /// FIXME skip_offsets
    UNUSED(skip_offsets);
    UNUSED(already_written_offset_columns);

    auto [new_current_mark, new_index_offset] = writer->write(block, nullptr, current_mark, index_offset, index_granularity);

    /// Should be written before index offset update, because we calculate,
    /// indices of currently written granules
    calculateAndSerializeSkipIndices(skip_indexes_columns, rows);

    current_mark = new_current_mark;
    index_offset = new_index_offset;
}

void MergedColumnOnlyOutputStream::writeSuffix()
{
    throw Exception("Method writeSuffix is not supported by MergedColumnOnlyOutputStream", ErrorCodes::NOT_IMPLEMENTED);
}

MergeTreeData::DataPart::Checksums MergedColumnOnlyOutputStream::writeSuffixAndGetChecksums()
{
    /// Finish columns serialization.
    MergeTreeData::DataPart::Checksums checksums;
    bool write_final_mark = with_final_mark && (index_offset != 0 || current_mark != 0);
    writer->finalize(checksums, write_final_mark, sync);

    finishSkipIndicesSerialization(checksums);

    return checksums;
}

}
Add ability to write final mark for MergeTree engines family (#5624) Add the ability to write final mark to MergeTree engines family. 2019-06-18 12:54:27 +00:00			`#include <Storages/MergeTree/MergedColumnOnlyOutputStream.h>`

			`namespace DB`
			`{`

			`MergedColumnOnlyOutputStream::MergedColumnOnlyOutputStream(`
polymorphic parts (development) 2019-10-21 15:33:59 +00:00			`const MergeTreeDataPartPtr & data_part_, const Block & header_, bool sync_,`
Add ability to write final mark for MergeTree engines family (#5624) Add the ability to write final mark to MergeTree engines family. 2019-06-18 12:54:27 +00:00			`CompressionCodecPtr default_codec_, bool skip_offsets_,`
Merge remote-tracking branch 'upstream/master' into nikvas0/index_mutate 2019-08-10 20:07:50 +00:00			`const std::vector<MergeTreeIndexPtr> & indices_to_recalc_,`
adding -Wshadow for GCC 2019-08-03 11:02:40 +00:00			`WrittenOffsetColumns & already_written_offset_columns_,`
Fix bug with enable_mixed_granularity_parts and mutations 2019-08-19 10:37:04 +00:00			`const MergeTreeIndexGranularityInfo * index_granularity_info_)`
Add ability to write final mark for MergeTree engines family (#5624) Add the ability to write final mark to MergeTree engines family. 2019-06-18 12:54:27 +00:00			`: IMergedBlockOutputStream(`
polymorphic parts (development) 2019-10-21 15:33:59 +00:00			`data_part_, default_codec_,`
			`{`
			`data_part_->storage.global_context.getSettings().min_compress_block_size,`
			`data_part_->storage.global_context.getSettings().max_compress_block_size,`
			`data_part_->storage.global_context.getSettings().min_bytes_to_use_direct_io,`
			`},`
Add ability to write final mark for MergeTree engines family (#5624) Add the ability to write final mark to MergeTree engines family. 2019-06-18 12:54:27 +00:00			`false,`
Merge remote-tracking branch 'upstream/master' into nikvas0/index_mutate 2019-08-10 20:07:50 +00:00			`indices_to_recalc_,`
polymorphic parts (development) 2019-10-21 15:33:59 +00:00			`index_granularity_info_ ? index_granularity_info_->is_adaptive : data_part_->storage.canUseAdaptiveGranularity()),`
Merge remote-tracking branch 'upstream/master' into nikvas0/index_mutate 2019-08-10 20:07:50 +00:00			`header(header_), sync(sync_), skip_offsets(skip_offsets_),`
adding -Wshadow for GCC 2019-08-03 11:02:40 +00:00			`already_written_offset_columns(already_written_offset_columns_)`
Add ability to write final mark for MergeTree engines family (#5624) Add the ability to write final mark to MergeTree engines family. 2019-06-18 12:54:27 +00:00			`{`
polymorphic parts (development) 2019-10-28 11:00:29 +00:00			`std::cerr << "(MergedColumnOnlyOutputStream) storage: " << storage.getTableName() << "\n";`
			`std::cerr << "(MergedColumnOnlyOutputStream) can_use_adaptive_granularity: " << can_use_adaptive_granularity << "\n";`
			`std::cerr << "(MergedColumnOnlyOutputStream) index_granularity_info: " << !!index_granularity_info_ << "\n";`
			`if (index_granularity_info_)`
			`std::cerr << "(MergedColumnOnlyOutputStream) index_granularity_info->isAdaptive(): " << index_granularity_info_->is_adaptive << "\n";`

polymorphic parts (development) 2019-10-22 17:42:59 +00:00			`writer = data_part_->getWriter(header.getNamesAndTypesList(), default_codec_, writer_settings);`
polymorphic parts (development) 2019-10-31 14:44:17 +00:00
			`std::cerr << "(MergedColumnOnlyOutputStream) writer: " << !!writer << "\n";`
Move initialization of MergedColumnOnlyStream to constructor 2019-09-02 16:31:09 +00:00			`initSkipIndices();`
			`}`

			`void MergedColumnOnlyOutputStream::write(const Block & block)`
			`{`
Merge remote-tracking branch 'upstream/master' into nikvas0/index_mutate 2019-06-24 13:44:44 +00:00			`std::set<String> skip_indexes_column_names_set;`
			`for (const auto & index : skip_indices)`
			`std::copy(index->columns.cbegin(), index->columns.cend(),`
			`std::inserter(skip_indexes_column_names_set, skip_indexes_column_names_set.end()));`
			`Names skip_indexes_column_names(skip_indexes_column_names_set.begin(), skip_indexes_column_names_set.end());`

			`std::vector<ColumnWithTypeAndName> skip_indexes_columns(skip_indexes_column_names.size());`
			`std::map<String, size_t> skip_indexes_column_name_to_position;`
			`for (size_t i = 0, size = skip_indexes_column_names.size(); i < size; ++i)`
			`{`
			`const auto & name = skip_indexes_column_names[i];`
			`skip_indexes_column_name_to_position.emplace(name, i);`
			`skip_indexes_columns[i] = block.getByName(name);`
			`}`

			`size_t rows = block.rows();`
5337: clang compiler fix 2019-06-24 15:07:01 +00:00			`if (!rows)`
			`return;`
Merge remote-tracking branch 'upstream/master' into nikvas0/index_mutate 2019-06-24 13:44:44 +00:00
polymorphic parts (development) 2019-10-22 17:42:59 +00:00			`/// FIXME skip_offsets`
			`UNUSED(skip_offsets);`
			`UNUSED(already_written_offset_columns);`

polymorphic parts (development) 2019-10-31 14:44:17 +00:00			`auto [new_current_mark, new_index_offset] = writer->write(block, nullptr, current_mark, index_offset, index_granularity);`
Add ability to write final mark for MergeTree engines family (#5624) Add the ability to write final mark to MergeTree engines family. 2019-06-18 12:54:27 +00:00
Fix bad size of marks 2019-08-30 14:29:08 +00:00			`/// Should be written before index offset update, because we calculate,`
			`/// indices of currently written granules`
			`calculateAndSerializeSkipIndices(skip_indexes_columns, rows);`

Add ability to write final mark for MergeTree engines family (#5624) Add the ability to write final mark to MergeTree engines family. 2019-06-18 12:54:27 +00:00			`current_mark = new_current_mark;`
polymorphic parts (development) 2019-10-31 14:44:17 +00:00			`index_offset = new_index_offset;`
Add ability to write final mark for MergeTree engines family (#5624) Add the ability to write final mark to MergeTree engines family. 2019-06-18 12:54:27 +00:00			`}`

			`void MergedColumnOnlyOutputStream::writeSuffix()`
			`{`
			`throw Exception("Method writeSuffix is not supported by MergedColumnOnlyOutputStream", ErrorCodes::NOT_IMPLEMENTED);`
			`}`

			`MergeTreeData::DataPart::Checksums MergedColumnOnlyOutputStream::writeSuffixAndGetChecksums()`
			`{`
			`/// Finish columns serialization.`
			`MergeTreeData::DataPart::Checksums checksums;`
polymorphic parts (development) 2019-10-22 17:42:59 +00:00			`bool write_final_mark = with_final_mark && (index_offset != 0 \|\| current_mark != 0);`
			`writer->finalize(checksums, write_final_mark, sync);`
Merge remote-tracking branch 'upstream/master' into nikvas0/index_mutate 2019-06-24 13:44:44 +00:00
polymorphic parts (development) 2019-10-22 17:42:59 +00:00			`finishSkipIndicesSerialization(checksums);`
Add ability to write final mark for MergeTree engines family (#5624) Add the ability to write final mark to MergeTree engines family. 2019-06-18 12:54:27 +00:00
			`return checksums;`
			`}`

			`}`