2011-08-09 15:57:33 +00:00
|
|
|
|
#pragma once
|
|
|
|
|
|
2016-05-28 15:42:22 +00:00
|
|
|
|
#include <memory>
|
2011-08-09 19:19:00 +00:00
|
|
|
|
|
2011-08-09 15:57:33 +00:00
|
|
|
|
#include <DB/Core/Names.h>
|
|
|
|
|
#include <DB/Core/Block.h>
|
|
|
|
|
#include <DB/Core/ColumnNumbers.h>
|
2015-07-17 01:27:35 +00:00
|
|
|
|
#include <DB/Core/ColumnsWithTypeAndName.h>
|
2011-08-09 15:57:33 +00:00
|
|
|
|
#include <DB/DataTypes/IDataType.h>
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
namespace DB
|
|
|
|
|
{
|
|
|
|
|
|
2016-01-11 21:46:36 +00:00
|
|
|
|
namespace ErrorCodes
|
|
|
|
|
{
|
|
|
|
|
extern const int ILLEGAL_TYPE_OF_ARGUMENT;
|
|
|
|
|
extern const int ILLEGAL_COLUMN;
|
|
|
|
|
extern const int NUMBER_OF_ARGUMENTS_DOESNT_MATCH;
|
2016-11-11 17:01:02 +00:00
|
|
|
|
extern const int FUNCTION_CANNOT_HAVE_PARAMETERS;
|
2016-01-12 02:21:15 +00:00
|
|
|
|
extern const int TOO_LESS_ARGUMENTS_FOR_FUNCTION;
|
2016-01-11 21:46:36 +00:00
|
|
|
|
}
|
|
|
|
|
|
2016-03-07 04:31:10 +00:00
|
|
|
|
struct ExpressionAction;
|
2015-05-04 17:52:19 +00:00
|
|
|
|
|
|
|
|
|
|
2011-08-09 15:57:33 +00:00
|
|
|
|
/** Интерфейс для обычных функций.
|
|
|
|
|
* Обычные функции - это функции, которые не меняют количество строк в таблице,
|
|
|
|
|
* и результат работы которых для каждой строчки не зависит от других строк.
|
|
|
|
|
*
|
2016-06-18 21:08:35 +00:00
|
|
|
|
* Функция может принимать произвольное количество аргументов; возвращает ровно одно значение.
|
|
|
|
|
* Тип результата зависит от типов и количества аргументов.
|
2011-08-09 15:57:33 +00:00
|
|
|
|
*
|
|
|
|
|
* Функция диспетчеризуется для целого блока. Это позволяет производить всевозможные проверки редко,
|
|
|
|
|
* и делать основную работу в виде эффективного цикла.
|
|
|
|
|
*
|
|
|
|
|
* Функция применяется к одному или нескольким столбцам блока, и записывает свой результат,
|
2016-06-18 21:08:35 +00:00
|
|
|
|
* добавляя новый столбец к блоку. Функция не модифицирует свои агрументы.
|
2011-08-09 15:57:33 +00:00
|
|
|
|
*/
|
|
|
|
|
class IFunction
|
|
|
|
|
{
|
|
|
|
|
public:
|
2013-06-04 14:59:05 +00:00
|
|
|
|
/** Наследник IFunction должен реализовать:
|
|
|
|
|
* - getName
|
|
|
|
|
* - либо getReturnType, либо getReturnTypeAndPrerequisites
|
|
|
|
|
* - одну из перегрузок execute.
|
|
|
|
|
*/
|
2014-06-12 19:23:06 +00:00
|
|
|
|
|
2011-08-09 15:57:33 +00:00
|
|
|
|
/// Получить основное имя функции.
|
2011-08-13 21:05:18 +00:00
|
|
|
|
virtual String getName() const = 0;
|
2011-08-09 15:57:33 +00:00
|
|
|
|
|
2016-12-29 19:38:10 +00:00
|
|
|
|
/// Override and return true if function could take different number of arguments.
|
|
|
|
|
virtual bool isVariadic() const { return false; }
|
|
|
|
|
|
|
|
|
|
/// For non-variadic functions, return number of arguments; otherwise return zero (that should be ignored).
|
|
|
|
|
virtual size_t getNumberOfArguments() const = 0;
|
|
|
|
|
|
|
|
|
|
/// Throw if number of arguments is incorrect. Default implementation will check only in non-variadic case.
|
|
|
|
|
/// It is called inside getReturnType.
|
|
|
|
|
virtual void checkNumberOfArguments(size_t number_of_arguments) const;
|
|
|
|
|
|
2017-01-04 03:37:59 +00:00
|
|
|
|
/** Should we evaluate this function while constant folding, if arguments are constants?
|
|
|
|
|
* Usually this is true. Notable counterexample is function 'sleep'.
|
|
|
|
|
* If we will call it during query analysis, we will sleep extra amount of time.
|
|
|
|
|
*/
|
|
|
|
|
virtual bool isSuitableForConstantFolding() const { return true; }
|
|
|
|
|
|
2017-01-05 16:34:05 +00:00
|
|
|
|
/** Function is called "injective" if it returns different result for different values of arguments.
|
|
|
|
|
* Example: hex, negate, tuple...
|
|
|
|
|
*
|
|
|
|
|
* Function could be injective with some arguments fixed to some constant values.
|
|
|
|
|
* Examples:
|
|
|
|
|
* plus(const, x);
|
|
|
|
|
* multiply(const, x) where x is an integer and constant is not divisable by two;
|
|
|
|
|
* concat(x, 'const');
|
|
|
|
|
* concat(x, 'const', y) where const contain at least one non-numeric character;
|
|
|
|
|
* concat with FixedString
|
|
|
|
|
* dictGet... functions takes name of dictionary as its argument,
|
|
|
|
|
* and some dictionaries could be explicitly defined as injective.
|
|
|
|
|
*
|
|
|
|
|
* It could be used, for example, to remove useless function applications from GROUP BY.
|
|
|
|
|
*
|
|
|
|
|
* Sometimes, function is not really injective, but considered as injective, for purpose of query optimization.
|
|
|
|
|
* For example, toString function is not injective for Float64 data type,
|
|
|
|
|
* as it returns 'nan' for many different representation of NaNs.
|
|
|
|
|
* But we assume, that it is injective. This could be documented as implementation-specific behaviour.
|
|
|
|
|
*
|
|
|
|
|
* sample_block should contain data types of arguments and values of constants, if relevant.
|
|
|
|
|
*/
|
|
|
|
|
virtual bool isInjective(const Block & sample_block) { return false; }
|
|
|
|
|
|
|
|
|
|
/** Function is called "deterministic", if it returns same result for same values of arguments.
|
|
|
|
|
* Most of functions are deterministic. Notable counterexample is rand().
|
|
|
|
|
* Sometimes, functions are "deterministic" in scope of single query
|
|
|
|
|
* (even for distributed query), but not deterministic it general.
|
|
|
|
|
* Example: now(). Another example: functions that work with periodically updated dictionaries.
|
|
|
|
|
*/
|
|
|
|
|
virtual bool isDeterministicInScopeOfQuery() { return true; }
|
|
|
|
|
|
2011-09-24 20:32:41 +00:00
|
|
|
|
/// Получить тип результата по типам аргументов. Если функция неприменима для данных аргументов - кинуть исключение.
|
2013-06-04 14:59:05 +00:00
|
|
|
|
/// Перегрузка для тех, кому не нужны prerequisites и значения константных аргументов. Снаружи не вызывается.
|
2016-07-06 09:47:55 +00:00
|
|
|
|
DataTypePtr getReturnType(const DataTypes & arguments) const;
|
|
|
|
|
|
|
|
|
|
virtual DataTypePtr getReturnTypeImpl(const DataTypes & arguments) const
|
2013-06-04 13:34:46 +00:00
|
|
|
|
{
|
|
|
|
|
throw Exception("getReturnType is not implemented for " + getName(), ErrorCodes::NOT_IMPLEMENTED);
|
|
|
|
|
}
|
2014-06-12 19:23:06 +00:00
|
|
|
|
|
2013-06-04 13:34:46 +00:00
|
|
|
|
/** Получить тип результата по типам аргументов и значениям константных аргументов.
|
|
|
|
|
* Если функция неприменима для данных аргументов - кинуть исключение.
|
|
|
|
|
* Еще можно вернуть описание дополнительных столбцов, которые требуются для выполнения функции.
|
2014-04-08 07:58:53 +00:00
|
|
|
|
* Для неконстантных столбцов arguments[i].column = nullptr.
|
2013-06-04 13:34:46 +00:00
|
|
|
|
* Осмысленные типы элементов в out_prerequisites: APPLY_FUNCTION, ADD_COLUMN.
|
|
|
|
|
*/
|
2016-07-06 09:47:55 +00:00
|
|
|
|
void getReturnTypeAndPrerequisites(
|
|
|
|
|
const ColumnsWithTypeAndName & arguments,
|
|
|
|
|
DataTypePtr & out_return_type,
|
|
|
|
|
std::vector<ExpressionAction> & out_prerequisites);
|
|
|
|
|
|
|
|
|
|
virtual void getReturnTypeAndPrerequisitesImpl(
|
2015-07-17 01:27:35 +00:00
|
|
|
|
const ColumnsWithTypeAndName & arguments,
|
2014-02-23 00:37:25 +00:00
|
|
|
|
DataTypePtr & out_return_type,
|
2015-05-04 17:52:19 +00:00
|
|
|
|
std::vector<ExpressionAction> & out_prerequisites)
|
2013-06-04 13:34:46 +00:00
|
|
|
|
{
|
|
|
|
|
DataTypes types(arguments.size());
|
|
|
|
|
for (size_t i = 0; i < arguments.size(); ++i)
|
|
|
|
|
types[i] = arguments[i].type;
|
2016-07-06 09:47:55 +00:00
|
|
|
|
out_return_type = getReturnTypeImpl(types);
|
2013-06-04 13:34:46 +00:00
|
|
|
|
}
|
2014-06-12 19:23:06 +00:00
|
|
|
|
|
2013-05-08 09:52:02 +00:00
|
|
|
|
/// Вызывается, если хоть один агрумент функции - лямбда-выражение.
|
2013-05-20 15:42:57 +00:00
|
|
|
|
/// Для аргументов-лямбда-выражений определяет типы аргументов этих выражений и кладет результат в arguments.
|
2016-07-06 09:47:55 +00:00
|
|
|
|
void getLambdaArgumentTypes(DataTypes & arguments) const;
|
|
|
|
|
|
|
|
|
|
virtual void getLambdaArgumentTypesImpl(DataTypes & arguments) const
|
2013-05-08 09:52:02 +00:00
|
|
|
|
{
|
|
|
|
|
throw Exception("Function " + getName() + " can't have lambda-expressions as arguments", ErrorCodes::ILLEGAL_TYPE_OF_ARGUMENT);
|
|
|
|
|
}
|
2014-06-12 19:23:06 +00:00
|
|
|
|
|
2013-03-26 19:30:23 +00:00
|
|
|
|
/// Выполнить функцию над блоком. Замечание: может вызываться одновременно из нескольких потоков, для одного объекта.
|
2013-06-04 14:59:05 +00:00
|
|
|
|
/// Перегрузка для тех, кому не нужны prerequisites. Снаружи не вызывается.
|
2016-07-06 09:47:55 +00:00
|
|
|
|
void execute(Block & block, const ColumnNumbers & arguments, size_t result);
|
2013-06-04 14:59:05 +00:00
|
|
|
|
|
|
|
|
|
/// Выполнить функцию над блоком. Замечание: может вызываться одновременно из нескольких потоков, для одного объекта.
|
|
|
|
|
/// prerequisites идут в том же порядке, что и out_prerequisites, полученные из getReturnTypeAndPrerequisites.
|
2016-07-06 09:47:55 +00:00
|
|
|
|
void execute(Block & block, const ColumnNumbers & arguments, const ColumnNumbers & prerequisites, size_t result);
|
|
|
|
|
|
|
|
|
|
virtual void executeImpl(Block & block, const ColumnNumbers & arguments, size_t result)
|
|
|
|
|
{
|
|
|
|
|
throw Exception("executeImpl is not implemented for " + getName(), ErrorCodes::NOT_IMPLEMENTED);
|
|
|
|
|
}
|
|
|
|
|
|
|
|
|
|
virtual void executeImpl(Block & block, const ColumnNumbers & arguments, const ColumnNumbers & prerequisites, size_t result)
|
2013-06-04 14:59:05 +00:00
|
|
|
|
{
|
2016-07-06 09:47:55 +00:00
|
|
|
|
executeImpl(block, arguments, result);
|
2013-06-04 14:59:05 +00:00
|
|
|
|
}
|
2014-02-23 00:37:25 +00:00
|
|
|
|
|
2016-08-10 19:12:29 +00:00
|
|
|
|
/// Returns true if the function implementation directly handles the arguments
|
|
|
|
|
/// that correspond to nullable columns and null columns.
|
2016-07-06 09:47:55 +00:00
|
|
|
|
virtual bool hasSpecialSupportForNulls() const { return false; }
|
|
|
|
|
|
2015-11-29 08:06:29 +00:00
|
|
|
|
/** Позволяет узнать, является ли функция монотонной в некотором диапазоне значений.
|
|
|
|
|
* Это используется для работы с индексом в сортированном куске данных.
|
|
|
|
|
* И позволяет использовать индекс не только, когда написано, например date >= const, но и, например, toMonth(date) >= 11.
|
|
|
|
|
* Всё это рассматривается только для функций одного аргумента.
|
|
|
|
|
*/
|
|
|
|
|
virtual bool hasInformationAboutMonotonicity() const { return false; }
|
|
|
|
|
|
|
|
|
|
/// Свойство монотонности на некотором диапазоне.
|
|
|
|
|
struct Monotonicity
|
|
|
|
|
{
|
|
|
|
|
bool is_monotonic = false; /// Является ли функция монотонной (неубывающей или невозрастающей).
|
|
|
|
|
bool is_positive = true; /// true, если функция неубывающая, false, если невозрастающая. Если is_monotonic = false, то не важно.
|
2015-11-29 11:58:44 +00:00
|
|
|
|
|
|
|
|
|
Monotonicity(bool is_monotonic_ = false, bool is_positive_ = true)
|
|
|
|
|
: is_monotonic(is_monotonic_), is_positive(is_positive_) {}
|
2015-11-29 08:06:29 +00:00
|
|
|
|
};
|
|
|
|
|
|
2015-11-29 11:58:44 +00:00
|
|
|
|
/** Получить информацию о монотонности на отрезке значений. Вызывайте только если hasInformationAboutMonotonicity.
|
|
|
|
|
* В качестве одного из аргументов может быть передан NULL. Это значит, что соответствующий диапазон неограничен слева или справа.
|
|
|
|
|
*/
|
|
|
|
|
virtual Monotonicity getMonotonicityForRange(const IDataType & type, const Field & left, const Field & right) const
|
2015-11-29 08:06:29 +00:00
|
|
|
|
{
|
|
|
|
|
throw Exception("Function " + getName() + " has no information about its monotonicity.", ErrorCodes::NOT_IMPLEMENTED);
|
|
|
|
|
}
|
|
|
|
|
|
2014-02-23 00:37:25 +00:00
|
|
|
|
virtual ~IFunction() {}
|
2016-08-05 11:31:55 +00:00
|
|
|
|
|
2016-08-10 19:12:29 +00:00
|
|
|
|
protected:
|
|
|
|
|
/// Returns the copy of a given block in which each column specified in
|
|
|
|
|
/// the "arguments" parameter is replaced with its respective nested
|
|
|
|
|
/// column if it is nullable.
|
2016-08-15 11:14:29 +00:00
|
|
|
|
static Block createBlockWithNestedColumns(const Block & block, ColumnNumbers args);
|
2016-10-21 13:14:41 +00:00
|
|
|
|
/// Similar function as above. Additionally transform the result type if needed.
|
|
|
|
|
static Block createBlockWithNestedColumns(const Block & block, ColumnNumbers args, size_t result);
|
2016-08-10 19:12:29 +00:00
|
|
|
|
|
2016-08-05 11:31:55 +00:00
|
|
|
|
private:
|
2016-08-15 11:14:29 +00:00
|
|
|
|
/// Strategy to apply when executing a function.
|
|
|
|
|
enum Strategy
|
|
|
|
|
{
|
|
|
|
|
/// Merely perform the function on its columns.
|
|
|
|
|
DIRECTLY_EXECUTE = 0,
|
|
|
|
|
/// If at least one argument is nullable, call the function implementation
|
|
|
|
|
/// with a block in which nullable columns that correspond to function arguments
|
|
|
|
|
/// have been replaced with their respective nested columns. Subsequently, the
|
|
|
|
|
/// result column is wrapped into a nullable column.
|
|
|
|
|
PROCESS_NULLABLE_COLUMNS,
|
|
|
|
|
/// If at least one argument is NULL, return NULL.
|
|
|
|
|
RETURN_NULL
|
|
|
|
|
};
|
|
|
|
|
|
|
|
|
|
private:
|
|
|
|
|
/// Choose the strategy for performing the function.
|
|
|
|
|
Strategy chooseStrategy(const Block & block, const ColumnNumbers & args);
|
|
|
|
|
|
|
|
|
|
/// If required by the specified strategy, process the given block, then
|
|
|
|
|
/// return the processed block. Otherwise return an empty block.
|
2016-10-21 13:14:41 +00:00
|
|
|
|
Block preProcessBlock(Strategy strategy, const Block & block, const ColumnNumbers & args,
|
|
|
|
|
size_t result);
|
2016-08-15 11:14:29 +00:00
|
|
|
|
|
|
|
|
|
/// If required by the specified strategy, post-process the result column.
|
|
|
|
|
void postProcessResult(Strategy strategy, Block & block, const Block & processed_block,
|
|
|
|
|
const ColumnNumbers & args, size_t result);
|
2011-08-09 15:57:33 +00:00
|
|
|
|
};
|
|
|
|
|
|
|
|
|
|
|
2016-05-28 15:42:22 +00:00
|
|
|
|
using FunctionPtr = std::shared_ptr<IFunction>;
|
2011-08-09 19:19:00 +00:00
|
|
|
|
|
|
|
|
|
|
2011-08-09 15:57:33 +00:00
|
|
|
|
}
|