ClickHouse/src/Processors/QueryPlan/FinishSortingStep.cpp

#include <Processors/QueryPlan/FinishSortingStep.h>
#include <Processors/Transforms/DistinctTransform.h>
#include <Processors/QueryPipeline.h>
#include <Processors/Merges/MergingSortedTransform.h>
#include <Processors/Transforms/PartialSortingTransform.h>
#include <Processors/Transforms/FinishSortingTransform.h>

namespace DB
{

static ITransformingStep::DataStreamTraits getTraits()
{
    return ITransformingStep::DataStreamTraits
    {
            .preserves_distinct_columns = true
    };
}

FinishSortingStep::FinishSortingStep(
    const DataStream & input_stream_,
    SortDescription prefix_description_,
    SortDescription result_description_,
    size_t max_block_size_,
    UInt64 limit_)
    : ITransformingStep(input_stream_, input_stream_.header, getTraits())
    , prefix_description(std::move(prefix_description_))
    , result_description(std::move(result_description_))
    , max_block_size(max_block_size_)
    , limit(limit_)
{
    /// Streams are merged together, only global distinct keys remain distinct.
    /// Note: we can not clear it if know that there will be only one stream in pipeline. Should we add info about it?
    output_stream->local_distinct_columns.clear();
}

void FinishSortingStep::transformPipeline(QueryPipeline & pipeline)
{
    bool need_finish_sorting = (prefix_description.size() < result_description.size());
    if (pipeline.getNumStreams() > 1)
    {
        UInt64 limit_for_merging = (need_finish_sorting ? 0 : limit);
        auto transform = std::make_shared<MergingSortedTransform>(
                pipeline.getHeader(),
                pipeline.getNumStreams(),
                prefix_description,
                max_block_size, limit_for_merging);

        pipeline.addPipe({ std::move(transform) });
    }

    pipeline.enableQuotaForCurrentStreams();

    if (need_finish_sorting)
    {
        pipeline.addSimpleTransform([&](const Block & header, QueryPipeline::StreamType stream_type) -> ProcessorPtr
        {
            if (stream_type != QueryPipeline::StreamType::Main)
                return nullptr;

            return std::make_shared<PartialSortingTransform>(header, result_description, limit);
        });

        /// NOTE limits are not applied to the size of temporary sets in FinishSortingTransform
        pipeline.addSimpleTransform([&](const Block & header) -> ProcessorPtr
        {
            return std::make_shared<FinishSortingTransform>(
                header, prefix_description, result_description, max_block_size, limit);
        });
    }
}

}
Add FinishSortingStep. 2020-06-17 19:57:13 +00:00			`#include <Processors/QueryPlan/FinishSortingStep.h>`
			`#include <Processors/Transforms/DistinctTransform.h>`
			`#include <Processors/QueryPipeline.h>`
			`#include <Processors/Merges/MergingSortedTransform.h>`
			`#include <Processors/Transforms/PartialSortingTransform.h>`
			`#include <Processors/Transforms/FinishSortingTransform.h>`

			`namespace DB`
			`{`

Add DISTINCT trait for QueryPlanStep. 2020-06-18 13:00:16 +00:00			`static ITransformingStep::DataStreamTraits getTraits()`
			`{`
Fix style. 2020-06-18 20:11:42 +00:00			`return ITransformingStep::DataStreamTraits`
			`{`
Add DISTINCT trait for QueryPlanStep. 2020-06-18 13:00:16 +00:00			`.preserves_distinct_columns = true`
			`};`
			`}`

Add FinishSortingStep. 2020-06-17 19:57:13 +00:00			`FinishSortingStep::FinishSortingStep(`
			`const DataStream & input_stream_,`
			`SortDescription prefix_description_,`
			`SortDescription result_description_,`
			`size_t max_block_size_,`
			`UInt64 limit_)`
Add DISTINCT trait for QueryPlanStep. 2020-06-18 13:00:16 +00:00			`: ITransformingStep(input_stream_, input_stream_.header, getTraits())`
Add FinishSortingStep. 2020-06-17 19:57:13 +00:00			`, prefix_description(std::move(prefix_description_))`
			`, result_description(std::move(result_description_))`
			`, max_block_size(max_block_size_)`
			`, limit(limit_)`
			`{`
Fix distinct for FinishSortingStep. 2020-06-20 07:50:45 +00:00			`/// Streams are merged together, only global distinct keys remain distinct.`
			`/// Note: we can not clear it if know that there will be only one stream in pipeline. Should we add info about it?`
			`output_stream->local_distinct_columns.clear();`
Add FinishSortingStep. 2020-06-17 19:57:13 +00:00			`}`

			`void FinishSortingStep::transformPipeline(QueryPipeline & pipeline)`
			`{`
			`bool need_finish_sorting = (prefix_description.size() < result_description.size());`
			`if (pipeline.getNumStreams() > 1)`
			`{`
			`UInt64 limit_for_merging = (need_finish_sorting ? 0 : limit);`
			`auto transform = std::make_shared<MergingSortedTransform>(`
			`pipeline.getHeader(),`
			`pipeline.getNumStreams(),`
			`prefix_description,`
			`max_block_size, limit_for_merging);`

			`pipeline.addPipe({ std::move(transform) });`
			`}`

			`pipeline.enableQuotaForCurrentStreams();`

			`if (need_finish_sorting)`
			`{`
			`pipeline.addSimpleTransform([&](const Block & header, QueryPipeline::StreamType stream_type) -> ProcessorPtr`
			`{`
			`if (stream_type != QueryPipeline::StreamType::Main)`
			`return nullptr;`

			`return std::make_shared<PartialSortingTransform>(header, result_description, limit);`
			`});`

			`/// NOTE limits are not applied to the size of temporary sets in FinishSortingTransform`
			`pipeline.addSimpleTransform([&](const Block & header) -> ProcessorPtr`
			`{`
			`return std::make_shared<FinishSortingTransform>(`
			`header, prefix_description, result_description, max_block_size, limit);`
			`});`
			`}`
			`}`

			`}`