mirror of
https://github.com/ClickHouse/ClickHouse.git
synced 2024-11-30 19:42:00 +00:00
59 lines
1.5 KiB
C++
59 lines
1.5 KiB
C++
#pragma once
|
|
|
|
#include <DB/DataStreams/IProfilingBlockInputStream.h>
|
|
#include <DB/Common/HashTable/HashSet.h>
|
|
#include <DB/Interpreters/AggregationCommon.h>
|
|
#include <DB/Interpreters/Limits.h>
|
|
|
|
|
|
namespace DB
|
|
{
|
|
|
|
/** Из потока блоков оставляет только уникальные строки.
|
|
* Для реализации SELECT DISTINCT ... .
|
|
* Если указан ненулевой limit - прекращает выдавать строки после того, как накопилось limit строк
|
|
* - для оптимизации SELECT DISTINCT ... LIMIT ... .
|
|
*/
|
|
class DistinctBlockInputStream : public IProfilingBlockInputStream
|
|
{
|
|
public:
|
|
/// Пустой columns_ значит все столбцы.
|
|
DistinctBlockInputStream(BlockInputStreamPtr input_, const Limits & limits, size_t limit_, Names columns_);
|
|
|
|
String getName() const override { return "Distinct"; }
|
|
|
|
String getID() const override
|
|
{
|
|
std::stringstream res;
|
|
res << "Distinct(" << children.back()->getID() << ")";
|
|
return res.str();
|
|
}
|
|
|
|
protected:
|
|
Block readImpl() override;
|
|
private:
|
|
|
|
bool checkLimits() const
|
|
{
|
|
if (max_rows && set.size() > max_rows)
|
|
return false;
|
|
if (max_bytes && set.getBufferSizeInBytes() > max_bytes)
|
|
return false;
|
|
return true;
|
|
}
|
|
|
|
Names columns_names;
|
|
|
|
size_t limit;
|
|
|
|
/// Ограничения на максимальный размер множества
|
|
size_t max_rows;
|
|
size_t max_bytes;
|
|
OverflowMode overflow_mode;
|
|
|
|
using SetHashed = HashSet<UInt128, UInt128TrivialHash>;
|
|
SetHashed set;
|
|
};
|
|
|
|
}
|