dbms: Server: queries with several replicas: development [#METR-14410]

2024-11-23 08:02:02 +00:00 · 2015-01-22 17:22:59 +03:00 · 2015-01-22 17:22:59 +03:00 · 83234d153c
commit 83234d153c
parent 4d62c9f7ff
1 changed files with 34 additions and 45 deletions
--- a/dbms/src/Storages/MergeTree/MergeTreeDataSelectExecutor.cpp
+++ b/dbms/src/Storages/MergeTree/MergeTreeDataSelectExecutor.cpp
@ -237,21 +237,13 @@ BlockInputStreams MergeTreeDataSelectExecutor::read(
 	RangesInDataParts parts_with_ranges;

 	/// Найдем, какой диапазон читать из каждого куска.
-	size_t sum_marks = 0;
-	size_t sum_ranges = 0;
 	for (auto & part : parts)
 	{
 		RangesInDataPart ranges(part, (*part_index)++);
 		ranges.ranges = markRangesFromPkRange(part->index, key_condition);

 		if (!ranges.ranges.empty())
-		{
 			parts_with_ranges.push_back(ranges);
-
-			sum_ranges += ranges.ranges.size();
-			for (const auto & range : ranges.ranges)
-				sum_marks += range.end - range.begin;
-		}
 	}

 	if (settings.parallel_replicas_count > 1)
@ -260,47 +252,44 @@ BlockInputStreams MergeTreeDataSelectExecutor::read(
 										 settings.parallel_replicas_count);
 		auto segments = splitter.perform();

-		if (settings.parallel_replica_offset < segments.size())
+		if (settings.parallel_replica_offset >= segments.size())
+			return BlockInputStreams();
+
+		if (segments.size() > 1)
 		{
-			if (segments.size() > 1)
+			/// Для каждого элемента массива segments, вычисляем его хэш
+			/// Сортируем массив segments по хэшу.
+			/// Выбираем k-й элемент массива segments, где k - наш номер реплики.
+
+			using Entry = std::pair<std::pair<UInt64, UInt64>, RangesInDataParts *>;
+			std::vector<Entry> hashed_segments;
+			hashed_segments.reserve(segments.size());
+
+			for (auto & segment : segments)
 			{
-				/// Для каждого элемента массива segments, вычисляем его хэш
-				/// Сортируем массив segments по хэшу.
-				/// Выбираем k-й элемент массива segments, где k - наш номер реплики.
-
-				using Entry = std::pair<std::pair<UInt64, UInt64>, RangesInDataParts *>;
-				std::vector<Entry> hashed_segments;
-				hashed_segments.reserve(segments.size());
-
-				for (auto & segment : segments)
-				{
-					Entry entry = std::make_pair(computeHash(segment), &segment);
-					hashed_segments.push_back(entry);
-				}
-
-				std::sort(hashed_segments.begin(), hashed_segments.end(), [&](const Entry & lhs, const Entry & rhs)
-				{
-					return lhs.first < rhs.first;
-				});
-
-				parts_with_ranges = std::move(*(hashed_segments[settings.parallel_replica_offset].second));
-
-				/// Пересчитываем количество засечек и диапазонов.
-				sum_marks = 0;
-				sum_ranges = 0;
-				for (const auto & part_with_ranges : parts_with_ranges)
-				{
-					sum_ranges += part_with_ranges.ranges.size();
-					for (const auto & range : part_with_ranges.ranges)
-						sum_marks += range.end - range.begin;
-				}
+				Entry entry = std::make_pair(computeHash(segment), &segment);
+				hashed_segments.push_back(entry);
 			}
+
+			std::sort(hashed_segments.begin(), hashed_segments.end(), [](const Entry & lhs, const Entry & rhs)
+			{
+				return lhs.first < rhs.first;
+			});
+
+			parts_with_ranges = std::move(*(hashed_segments[settings.parallel_replica_offset].second));
 		}
-		else
-		{
-			BlockInputStreams res;
-			return res;
-		}
+	}
+
+	/// Считаем количество засечек и диапазонов.
+	size_t sum_marks = 0;
+	size_t sum_ranges = 0;
+	sum_marks = 0;
+	sum_ranges = 0;
+	for (const auto & part_with_ranges : parts_with_ranges)
+	{
+		sum_ranges += part_with_ranges.ranges.size();
+		for (const auto & range : part_with_ranges.ranges)
+			sum_marks += range.end - range.begin;
 	}

 	LOG_DEBUG(log, "Selected " << parts.size() << " parts by date, " << parts_with_ranges.size() << " parts by key, "