#include #include #include namespace DB { StorageMerge::StorageMerge( const std::string & name_, NamesAndTypesListPtr columns_, const String & source_database_, const String & table_name_regexp_, const Context & context_) : name(name_), columns(columns_), source_database(source_database_), table_name_regexp(table_name_regexp_), context(context_) { _table_column_name = "_table" + VirtualColumnUtils::chooseSuffix(getColumnsList(), "_table"); } StoragePtr StorageMerge::create( const std::string & name_, NamesAndTypesListPtr columns_, const String & source_database_, const String & table_name_regexp_, const Context & context_) { return (new StorageMerge(name_, columns_, source_database_, table_name_regexp_, context_))->thisPtr(); } NameAndTypePair StorageMerge::getColumn(const String &column_name) const { if (column_name == _table_column_name) return NameAndTypePair(_table_column_name, new DataTypeString); return getRealColumn(column_name); } bool StorageMerge::hasColumn(const String &column_name) const { if (column_name == _table_column_name) return true; return hasRealColumn(column_name); } BlockInputStreams StorageMerge::read( const Names & column_names, ASTPtr query, const Settings & settings, QueryProcessingStage::Enum & processed_stage, size_t max_block_size, unsigned threads) { BlockInputStreams res; Names virt_column_names, real_column_names; for (const auto & it : column_names) if (it != _table_column_name) real_column_names.push_back(it); else virt_column_names.push_back(it); StorageVector selected_tables; /// Среди всех стадий, до которых обрабатывается запрос в таблицах-источниках, выберем минимальную. processed_stage = QueryProcessingStage::Complete; QueryProcessingStage::Enum tmp_processed_stage = QueryProcessingStage::Complete; /** Сначала составим список выбранных таблиц, чтобы узнать его размер. * Это нужно, чтобы правильно передать в каждую таблицу рекомендацию по количеству потоков. */ getSelectedTables(selected_tables); /// Если в запросе используется PREWHERE, надо убедиться, что все таблицы это поддерживают. if (typeid_cast(*query).prewhere_expression) for (const auto & table : selected_tables) if (!table->supportsPrewhere()) throw Exception("Storage " + table->getName() + " doesn't support PREWHERE.", ErrorCodes::ILLEGAL_PREWHERE); TableLocks table_locks; /// Нельзя, чтобы эти таблицы кто-нибудь удалил, пока мы их читаем. for (auto & table : selected_tables) table_locks.push_back(table->lockStructure(false)); Block virtual_columns_block = getBlockWithVirtualColumns(selected_tables); BlockInputStreamPtr virtual_columns; /// Если запрошен хотя бы один виртуальный столбец, пробуем индексировать if (!virt_column_names.empty()) virtual_columns = VirtualColumnUtils::getVirtualColumnsBlocks(query->clone(), virtual_columns_block, context); else /// Иначе, считаем допустимыми все возможные значения virtual_columns = new OneBlockInputStream(virtual_columns_block); std::multiset values = VirtualColumnUtils::extractSingleValueFromBlocks(virtual_columns, _table_column_name); bool all_inclusive = (values.size() == virtual_columns_block.rows()); for (size_t i = 0, size = selected_tables.size(); i < size; ++i) { StoragePtr table = selected_tables[i]; auto & table_lock = table_locks[i]; if (!all_inclusive && values.find(table->getTableName()) == values.end()) continue; /// Если в запросе только виртуальные столбцы, надо запросить хотя бы один любой другой. if (real_column_names.size() == 0) real_column_names.push_back(ExpressionActions::getSmallestColumn(table->getColumnsList())); /// Подменяем виртуальный столбец на его значение ASTPtr modified_query_ast = query->clone(); VirtualColumnUtils::rewriteEntityInAst(modified_query_ast, _table_column_name, table->getTableName()); BlockInputStreams source_streams = table->read( real_column_names, modified_query_ast, settings, tmp_processed_stage, max_block_size, size > threads ? 1 : (threads / size)); for (auto & stream : source_streams) stream->addTableLock(table_lock); for (auto & virtual_column : virt_column_names) { if (virtual_column == _table_column_name) { for (auto & stream : source_streams) stream = new AddingConstColumnBlockInputStream(stream, new DataTypeString, table->getTableName(), _table_column_name); } } res.insert(res.end(), source_streams.begin(), source_streams.end()); if (tmp_processed_stage < processed_stage) processed_stage = tmp_processed_stage; } /** Если истчоников слишком много, то склеим их в threads источников. */ if (res.size() > threads) res = narrowBlockInputStreams(res, threads); return res; } /// Построить блок состоящий только из возможных значений виртуальных столбцов Block StorageMerge::getBlockWithVirtualColumns(const std::vector & selected_tables) const { Block res; ColumnWithNameAndType _table(new ColumnString, new DataTypeString, _table_column_name); for (StorageVector::const_iterator it = selected_tables.begin(); it != selected_tables.end(); ++it) _table.column->insert((*it)->getTableName()); res.insert(_table); return res; } void StorageMerge::getSelectedTables(StorageVector & selected_tables) const { /// Список таблиц могут менять в другом потоке. Poco::ScopedLock lock(context.getMutex()); context.assertDatabaseExists(source_database); const Tables & tables = context.getDatabases().at(source_database); for (const auto & name_table_pair : tables) if (name_table_pair.second.get() != this && table_name_regexp.match(name_table_pair.first)) selected_tables.push_back(name_table_pair.second); } void StorageMerge::alter(const ASTAlterQuery::Parameters & params) { alterColumns(params, columns, context); } }