diff --git a/dbms/include/DB/AggregateFunctions/AggregateFunctionAny.h b/dbms/include/DB/AggregateFunctions/AggregateFunctionAny.h
deleted file mode 100644
index 894ba99d39c..00000000000
--- a/dbms/include/DB/AggregateFunctions/AggregateFunctionAny.h
+++ /dev/null
@@ -1,97 +0,0 @@
-#pragma once
-
-#include <DB/IO/WriteHelpers.h>
-#include <DB/IO/ReadHelpers.h>
-
-#include <DB/AggregateFunctions/IUnaryAggregateFunction.h>
-
-
-namespace DB
-{
-
-
-struct AggregateFunctionAnyData
-{
-	Field value;
-};
-
-
-/// Берёт первое попавшееся значение
-class AggregateFunctionAny final : public IUnaryAggregateFunction<AggregateFunctionAnyData, AggregateFunctionAny>
-{
-private:
-	DataTypePtr type;
-	
-public:
-	String getName() const { return "any"; }
-
-	DataTypePtr getReturnType() const
-	{
-		return type;
-	}
-
-	void setArgument(const DataTypePtr & argument)
-	{
-		type = argument;
-	}
-
-
-	void addOne(AggregateDataPtr place, const IColumn & column, size_t row_num) const
-	{
-		Data & d = data(place);
-
-		if (!d.value.isNull())
-			return;
-		column.get(row_num, d.value);
-	}
-
-	void merge(AggregateDataPtr place, ConstAggregateDataPtr rhs) const
-	{
-		Data & d = data(place);
-
-		if (d.value.isNull())
-			d.value = data(rhs).value;
-	}
-
-	void serialize(ConstAggregateDataPtr place, WriteBuffer & buf) const
-	{
-		const Data & d = data(place);
-
-		if (unlikely(d.value.isNull()))
-		{
-			writeBinary(false, buf);
-		}
-		else
-		{
-			writeBinary(true, buf);
-			type->serializeBinary(data(place).value, buf);
-		}
-	}
-
-	void deserializeMerge(AggregateDataPtr place, ReadBuffer & buf) const
-	{
-		Data & d = data(place);
-
-		bool is_not_null = false;
-		readBinary(is_not_null, buf);
-
-		if (is_not_null)
-		{
-			Field tmp;
-			type->deserializeBinary(tmp, buf);
-
-			if (d.value.isNull())
-				d.value = tmp;
-		}
-	}
-
-	void insertResultInto(ConstAggregateDataPtr place, IColumn & to) const
-	{
-		if (unlikely(data(place).value.isNull()))
-			to.insertDefault();
-		else
-			to.insert(data(place).value);
-	}
-};
-
-}
diff --git a/dbms/include/DB/AggregateFunctions/AggregateFunctionAnyLast.h b/dbms/include/DB/AggregateFunctions/AggregateFunctionAnyLast.h
deleted file mode 100644
index a0fecbc08e9..00000000000
--- a/dbms/include/DB/AggregateFunctions/AggregateFunctionAnyLast.h
+++ /dev/null
@@ -1,83 +0,0 @@
-#pragma once
-
-#include <DB/IO/WriteHelpers.h>
-#include <DB/IO/ReadHelpers.h>
-
-#include <DB/AggregateFunctions/IUnaryAggregateFunction.h>
-
-
-namespace DB
-{
-
-
-struct AggregateFunctionAnyLastData
-{
-	Field value;
-};
-
-
-/// Берёт последнее попавшееся значение
-class AggregateFunctionAnyLast final : public IUnaryAggregateFunction<AggregateFunctionAnyLastData, AggregateFunctionAnyLast>
-{
-private:
-	DataTypePtr type;
-	
-public:
-	String getName() const { return "anyLast"; }
-
-	DataTypePtr getReturnType() const
-	{
-		return type;
-	}
-
-	void setArgument(const DataTypePtr & argument)
-	{
-		type = argument;
-	}
-
-
-	void addOne(AggregateDataPtr place, const IColumn & column, size_t row_num) const
-	{
-		column.get(row_num, data(place).value);
-	}
-
-	void merge(AggregateDataPtr place, ConstAggregateDataPtr rhs) const
-	{
-		if (!data(rhs).value.isNull())
-			data(place).value = data(rhs).value;
-	}
-
-	void serialize(ConstAggregateDataPtr place, WriteBuffer & buf) const
-	{
-		const Data & d = data(place);
-
-		if (unlikely(d.value.isNull()))
-		{
-			writeBinary(false, buf);
-		}
-		else
-		{
-			writeBinary(true, buf);
-			type->serializeBinary(data(place).value, buf);
-		}
-	}
-
-	void deserializeMerge(AggregateDataPtr place, ReadBuffer & buf) const
-	{
-		bool is_not_null = false;
-		readBinary(is_not_null, buf);
-
-		if (is_not_null)
-			type->deserializeBinary(data(place).value, buf);
-	}
-
-	void insertResultInto(ConstAggregateDataPtr place, IColumn & to) const
-	{
-		if (unlikely(data(place).value.isNull()))
-			to.insertDefault();
-		else
-			to.insert(data(place).value);
-	}
-};
-
-}
diff --git a/dbms/include/DB/AggregateFunctions/AggregateFunctionUniqUpTo.h b/dbms/include/DB/AggregateFunctions/AggregateFunctionUniqUpTo.h
index 9bff8d8207a..79d122255da 100644
--- a/dbms/include/DB/AggregateFunctions/AggregateFunctionUniqUpTo.h
+++ b/dbms/include/DB/AggregateFunctions/AggregateFunctionUniqUpTo.h
@@ -19,8 +19,15 @@ namespace DB
 template <typename T>
 struct __attribute__((__packed__)) AggregateFunctionUniqUpToData
 {
+	/** Если count == threshold + 1 - это значит, что "переполнилось" (значений больше threshold).
+	  * В этом случае (например, после вызова функции merge), массив data не обязательно содержит инициализированные значения
+	  * - пример: объединяем состояние, в котором мало значений, с другим состоянием, которое переполнилось;
+	  *   тогда выставляем count в threshold + 1, а значения из другого состояния не копируем.
+	  */
 	UInt8 count = 0;
-	T data[0];	/// Данные идут после конца структуры. При вставке, делается линейный поиск.
+
+	/// Данные идут после конца структуры. При вставке, делается линейный поиск.
+	T data[0];
 
 
 	size_t size() const
@@ -31,17 +38,20 @@ struct __attribute__((__packed__)) AggregateFunctionUniqUpToData
 	/// threshold - для скольки элементов есть место в data.
 	void insert(T x, UInt8 threshold)
 	{
+		/// Состояние уже переполнено - ничего делать не нужно.
 		if (count > threshold)
 			return;
 
-		size_t limit = std::min(count, threshold);
-		for (size_t i = 0; i < limit; ++i)
+		/// Линейный поиск совпадающего элемента.
+		for (size_t i = 0; i < count; ++i)
 			if (data[i] == x)
 				return;
 
+		/// Не нашли совпадающий элемент. Если есть место ещё для одного элемента - вставляем его.
 		if (count < threshold)
 			data[count] = x;
 
+		/// После увеличения count, состояние может оказаться переполненным.
 		++count;
 	}
 
@@ -52,19 +62,22 @@ struct __attribute__((__packed__)) AggregateFunctionUniqUpToData
 
 		if (rhs.count > threshold)
 		{
+			/// Если rhs переполнено, то выставляем у текущего состояния count тоже переполненным.
 			count = rhs.count;
 			return;
 		}
 
-		size_t limit = std::min(rhs.count, threshold);
-		for (size_t i = 0; i < limit; ++i)
+		for (size_t i = 0; i < rhs.count; ++i)
 			insert(rhs.data[i], threshold);
 	}
 
 	void write(WriteBuffer & wb, UInt8 threshold) const
 	{
-		size_t limit = std::min(count, threshold);
-		wb.write(reinterpret_cast<const char *>(this), sizeof(*this) + limit * sizeof(data[0]));
+		writeBinary(count, wb);
+
+		/// Пишем значения, только если состояние не переполнено. Иначе они не нужны, а важен только факт того, что состояние переполнено.
+		if (count <= threshold)
+			wb.write(reinterpret_cast<const char *>(this), count * sizeof(data[0]));
 	}
 
 	void readAndMerge(ReadBuffer & rb, UInt8 threshold)
@@ -72,11 +85,14 @@ struct __attribute__((__packed__)) AggregateFunctionUniqUpToData
 		UInt8 rhs_count;
 		readBinary(rhs_count, rb);
 
-		if (rhs_count > threshold + 1)
-			throw Poco::Exception("Cannot read AggregateFunctionUniqUpToData: too large count.");
+		if (rhs_count > threshold)
+		{
+			/// Если rhs переполнено, то выставляем у текущего состояния count тоже переполненным.
+			count = rhs_count;
+			return;
+		}
 
-		size_t limit = std::min(rhs_count, threshold);
-		for (size_t i = 0; i < limit; ++i)
+		for (size_t i = 0; i < rhs_count; ++i)
 		{
 			T x;
 			readBinary(x, rb);
@@ -135,11 +151,13 @@ public:
 		if (params.size() != 1)
 			throw Exception("Aggregate function " + getName() + " requires exactly one parameter.", ErrorCodes::NUMBER_OF_ARGUMENTS_DOESNT_MATCH);
 
-		threshold = apply_visitor(FieldVisitorConvertToNumber<UInt64>(), params[0]);
+		UInt64 threshold_param = apply_visitor(FieldVisitorConvertToNumber<UInt64>(), params[0]);
 
-		if (threshold > uniq_upto_max_threshold)
+		if (threshold_param > uniq_upto_max_threshold)
 			throw Exception("Too large parameter for aggregate function " + getName() + ". Maximum: " + toString(uniq_upto_max_threshold),
 				ErrorCodes::ARGUMENT_OUT_OF_BOUND);
+
+		threshold = threshold_param;
 	}
 
 	void addOne(AggregateDataPtr place, const IColumn & column, size_t row_num) const
diff --git a/dbms/include/DB/AggregateFunctions/AggregateFunctionsMinMax.h b/dbms/include/DB/AggregateFunctions/AggregateFunctionsMinMax.h
deleted file mode 100644
index c9e08b8580d..00000000000
--- a/dbms/include/DB/AggregateFunctions/AggregateFunctionsMinMax.h
+++ /dev/null
@@ -1,132 +0,0 @@
-#pragma once
-
-#include <DB/IO/WriteHelpers.h>
-#include <DB/IO/ReadHelpers.h>
-
-#include <DB/AggregateFunctions/IUnaryAggregateFunction.h>
-
-
-namespace DB
-{
-
-
-struct AggregateFunctionMinTraits
-{
-	static bool better(const Field & lhs, const Field & rhs) { return lhs < rhs; }
-	static String name() { return "min"; }
-};
-
-struct AggregateFunctionMaxTraits
-{
-	static bool better(const Field & lhs, const Field & rhs) { return lhs > rhs; }
-	static String name() { return "max"; }
-};
-
-
-struct AggregateFunctionsMinMaxData
-{
-	Field value;
-};
-
-
-/// Берёт минимальное (или максимальное) значение. Если таких много - то первое попавшееся из них.
-template <typename Traits>
-class AggregateFunctionsMinMax final : public IUnaryAggregateFunction<AggregateFunctionsMinMaxData, AggregateFunctionsMinMax<Traits> >
-{
-private:
-	typedef typename IAggregateFunctionHelper<AggregateFunctionsMinMaxData>::Data Data;
-	DataTypePtr type;
-	
-public:
-	String getName() const { return Traits::name(); }
-
-	DataTypePtr getReturnType() const
-	{
-		return type;
-	}
-
-	void setArgument(const DataTypePtr & argument)
-	{
-		type = argument;
-	}
-
-
-	void addOne(AggregateDataPtr place, const IColumn & column, size_t row_num) const
-	{
-		Field value;
-		column.get(row_num, value);
-		Data & d = this->data(place);
-
-		if (!d.value.isNull())
-		{
-			if (Traits::better(value, d.value))
-				d.value = value;
-		}
-		else
-			d.value = value;
-	}
-
-	void merge(AggregateDataPtr place, ConstAggregateDataPtr rhs) const
-	{
-		Data & d = this->data(place);
-		const Data & d_rhs = this->data(rhs);
-		
-		if (!d.value.isNull())
-		{
-			if (Traits::better(d_rhs.value, d.value))
-				d.value = d_rhs.value;
-		}
-		else
-			d.value = d_rhs.value;
-	}
-
-	void serialize(ConstAggregateDataPtr place, WriteBuffer & buf) const
-	{
-		const Data & d = this->data(place);
-
-		if (unlikely(d.value.isNull()))
-		{
-			writeBinary(false, buf);
-		}
-		else
-		{
-			writeBinary(true, buf);
-			type->serializeBinary(this->data(place).value, buf);
-		}
-	}
-
-	void deserializeMerge(AggregateDataPtr place, ReadBuffer & buf) const
-	{
-		Data & d = this->data(place);
-
-		bool is_not_null = false;
-		readBinary(is_not_null, buf);
-
-		if (is_not_null)
-		{
-			if (!d.value.isNull())
-			{
-				Field value_;
-				type->deserializeBinary(value_, buf);
-				if (Traits::better(value_, d.value))
-					d.value = value_;
-			}
-			else
-				type->deserializeBinary(d.value, buf);
-		}
-	}
-
-	void insertResultInto(ConstAggregateDataPtr place, IColumn & to) const
-	{
-		if (unlikely(this->data(place).value.isNull()))
-			to.insertDefault();
-		else
-			to.insert(this->data(place).value);
-	}
-};
-
-
-typedef AggregateFunctionsMinMax<AggregateFunctionMinTraits> AggregateFunctionMin;
-typedef AggregateFunctionsMinMax<AggregateFunctionMaxTraits> AggregateFunctionMax;
-
-}
diff --git a/dbms/include/DB/AggregateFunctions/AggregateFunctionsMinMaxAny.h b/dbms/include/DB/AggregateFunctions/AggregateFunctionsMinMaxAny.h
new file mode 100644
index 00000000000..6100ef47827
--- /dev/null
+++ b/dbms/include/DB/AggregateFunctions/AggregateFunctionsMinMaxAny.h
@@ -0,0 +1,480 @@
+#pragma once
+
+#include <DB/IO/WriteHelpers.h>
+#include <DB/IO/ReadHelpers.h>
+
+#include <DB/Columns/ColumnVector.h>
+#include <DB/Columns/ColumnString.h>
+
+#include <DB/AggregateFunctions/IUnaryAggregateFunction.h>
+
+
+namespace DB
+{
+
+/** Агрегатные функции, запоминающие одно какое-либо переданное значение.
+  * Например, min, max, any, anyLast.
+  */
+
+
+/// Для числовых значений.
+template <typename T>
+struct SingleValueDataFixed
+{
+	typedef SingleValueDataFixed<T> Self;
+
+	bool has_value = false;	/// Надо запомнить, было ли передано хотя бы одно значение. Это нужно для AggregateFunctionIf.
+	T value;
+
+
+	bool has() const
+	{
+		return has_value;
+	}
+
+	void insertResultInto(IColumn & to) const
+	{
+		if (has())
+			static_cast<ColumnVector<T> &>(to).getData().push_back(value);
+		else
+			static_cast<ColumnVector<T> &>(to).insertDefault();
+	}
+
+	void write(WriteBuffer & buf, const IDataType & data_type) const
+	{
+		writeBinary(has(), buf);
+		if (has())
+			writeBinary(value, buf);
+	}
+
+	void read(ReadBuffer & buf, const IDataType & data_type)
+	{
+		readBinary(has_value, buf);
+		if (has())
+			readBinary(value, buf);
+	}
+
+
+	void change(const IColumn & column, size_t row_num)
+	{
+		has_value = true;
+		value = static_cast<const ColumnVector<T> &>(column).getData()[row_num];
+	}
+
+	void change(const Self & to)
+	{
+		has_value = true;
+		value = to.value;
+	}
+
+	void changeFirstTime(const IColumn & column, size_t row_num)
+	{
+		if (!has())
+			change(column, row_num);
+	}
+
+	void changeFirstTime(const Self & to)
+	{
+		if (!has())
+			change(to);
+	}
+
+	void changeIfLess(const IColumn & column, size_t row_num)
+	{
+		if (!has() || static_cast<const ColumnVector<T> &>(column).getData()[row_num] < value)
+			change(column, row_num);
+	}
+
+	void changeIfLess(const Self & to)
+	{
+		if (!has() || to.value < value)
+			change(to);
+	}
+
+	void changeIfGreater(const IColumn & column, size_t row_num)
+	{
+		if (!has() || static_cast<const ColumnVector<T> &>(column).getData()[row_num] > value)
+			change(column, row_num);
+	}
+
+	void changeIfGreater(const Self & to)
+	{
+		if (!has() || to.value > value)
+			change(to);
+	}
+};
+
+
+/** Для строк. Короткие строки хранятся в самой структуре, а длинные выделяются отдельно.
+  * NOTE Могло бы подойти также для массивов чисел.
+  */
+struct __attribute__((__packed__)) SingleValueDataString
+{
+	typedef SingleValueDataString Self;
+
+	Int32 size = -1;	/// -1 обозначает, что значения нет.
+
+	static constexpr Int32 AUTOMATIC_STORAGE_SIZE = 64;
+	static constexpr Int32 MAX_SMALL_STRING_SIZE = AUTOMATIC_STORAGE_SIZE - sizeof(size);
+
+	union
+	{
+		char small_data[MAX_SMALL_STRING_SIZE];	/// Включая завершающий ноль.
+		char * large_data;
+	};
+
+	~SingleValueDataString()
+	{
+		if (size > MAX_SMALL_STRING_SIZE)
+			free(large_data);
+	}
+
+	bool has() const
+	{
+		return size >= 0;
+	}
+
+	const char * getData() const
+	{
+		return size <= MAX_SMALL_STRING_SIZE ? small_data : large_data;
+	}
+
+	StringRef getStringRef() const
+	{
+		return StringRef(getData(), size);
+	}
+
+	void insertResultInto(IColumn & to) const
+	{
+		if (has())
+			static_cast<ColumnString &>(to).insertDataWithTerminatingZero(getData(), size);
+		else
+			static_cast<ColumnString &>(to).insertDefault();
+	}
+
+	void write(WriteBuffer & buf, const IDataType & data_type) const
+	{
+		writeBinary(size, buf);
+		if (has())
+			buf.write(getData(), size);
+	}
+
+	void read(ReadBuffer & buf, const IDataType & data_type)
+	{
+		Int32 rhs_size;
+		readBinary(rhs_size, buf);
+
+		if (rhs_size >= 0)
+		{
+			if (rhs_size <= MAX_SMALL_STRING_SIZE)
+			{
+				if (size > MAX_SMALL_STRING_SIZE)
+					free(large_data);
+
+				size = rhs_size;
+
+				if (size > 0)
+					buf.read(small_data, size);
+			}
+			else
+			{
+				if (size < rhs_size)
+				{
+					if (size > MAX_SMALL_STRING_SIZE)
+						free(large_data);
+
+					large_data = reinterpret_cast<char *>(malloc(rhs_size));
+				}
+
+				size = rhs_size;
+				buf.read(large_data, size);
+			}
+		}
+		else
+		{
+			if (size > MAX_SMALL_STRING_SIZE)
+				free(large_data);
+			size = rhs_size;
+		}
+	}
+
+
+	void changeImpl(StringRef value)
+	{
+		Int32 value_size = value.size;
+
+		if (value_size <= MAX_SMALL_STRING_SIZE)
+		{
+			if (size > MAX_SMALL_STRING_SIZE)
+				free(large_data);
+
+			size = value_size;
+
+			if (size > 0)
+				memcpy(small_data, value.data, size);
+		}
+		else
+		{
+			if (size < value_size)
+			{
+				if (size > MAX_SMALL_STRING_SIZE)
+					free(large_data);
+
+				large_data = reinterpret_cast<char *>(malloc(value.size));
+			}
+
+			size = value_size;
+			memcpy(large_data, value.data, size);
+		}
+	}
+
+	void change(const IColumn & column, size_t row_num)
+	{
+		changeImpl(static_cast<const ColumnString &>(column).getDataAtWithTerminatingZero(row_num));
+	}
+
+	void change(const Self & to)
+	{
+		changeImpl(to.getStringRef());
+	}
+
+	void changeFirstTime(const IColumn & column, size_t row_num)
+	{
+		if (!has())
+			change(column, row_num);
+	}
+
+	void changeFirstTime(const Self & to)
+	{
+		if (!has())
+			change(to);
+	}
+
+	void changeIfLess(const IColumn & column, size_t row_num)
+	{
+		if (!has() || static_cast<const ColumnString &>(column).getDataAtWithTerminatingZero(row_num) < getStringRef())
+			change(column, row_num);
+	}
+
+	void changeIfLess(const Self & to)
+	{
+		if (!has() || to.getStringRef() < getStringRef())
+			change(to);
+	}
+
+	void changeIfGreater(const IColumn & column, size_t row_num)
+	{
+		if (!has() || static_cast<const ColumnString &>(column).getDataAtWithTerminatingZero(row_num) > getStringRef())
+			change(column, row_num);
+	}
+
+	void changeIfGreater(const Self & to)
+	{
+		if (!has() || to.getStringRef() > getStringRef())
+			change(to);
+	}
+};
+
+
+/// Для любых других типов значений.
+struct SingleValueDataGeneric
+{
+	typedef SingleValueDataGeneric Self;
+
+	Field value;
+
+	bool has() const
+	{
+		return !value.isNull();
+	}
+
+	void insertResultInto(IColumn & to) const
+	{
+		if (has())
+			to.insert(value);
+		else
+			to.insertDefault();
+	}
+
+	void write(WriteBuffer & buf, const IDataType & data_type) const
+	{
+		if (!value.isNull())
+		{
+			writeBinary(true, buf);
+			data_type.serializeBinary(value, buf);
+		}
+		else
+			writeBinary(false, buf);
+	}
+
+	void read(ReadBuffer & buf, const IDataType & data_type)
+	{
+		bool is_not_null;
+		readBinary(is_not_null, buf);
+
+		if (is_not_null)
+			data_type.deserializeBinary(value, buf);
+	}
+
+	void change(const IColumn & column, size_t row_num)
+	{
+		column.get(row_num, value);
+	}
+
+	void change(const Self & to)
+	{
+		value = to.value;
+	}
+
+	void changeFirstTime(const IColumn & column, size_t row_num)
+	{
+		if (!has())
+			change(column, row_num);
+	}
+
+	void changeFirstTime(const Self & to)
+	{
+		if (!has())
+			change(to);
+	}
+
+	void changeIfLess(const IColumn & column, size_t row_num)
+	{
+		if (!has())
+			change(column, row_num);
+		else
+		{
+			Field new_value;
+			column.get(row_num, new_value);
+			if (new_value < value)
+				value = new_value;
+		}
+	}
+
+	void changeIfLess(const Self & to)
+	{
+		if (!has() || to.value < value)
+			change(to);
+	}
+
+	void changeIfGreater(const IColumn & column, size_t row_num)
+	{
+		if (!has())
+			change(column, row_num);
+		else
+		{
+			Field new_value;
+			column.get(row_num, new_value);
+			if (new_value > value)
+				value = new_value;
+		}
+	}
+
+	void changeIfGreater(const Self & to)
+	{
+		if (!has() || to.value > value)
+			change(to);
+	}
+};
+
+
+/** То, чем отличаются друг от другая агрегатные функции min, max, any, anyLast
+  *  (условием, при котором сохранённое значение заменяется на новое,
+  *   а также, конечно, именем).
+  */
+
+template <typename Data>
+struct AggregateFunctionMinData : Data
+{
+	typedef AggregateFunctionMinData<Data> Self;
+
+	void changeIfBetter(const IColumn & column, size_t row_num) { this->changeIfLess(column, row_num); }
+	void changeIfBetter(const Self & to) 						{ this->changeIfLess(to); }
+
+	static const char * name() { return "min"; }
+};
+
+template <typename Data>
+struct AggregateFunctionMaxData : Data
+{
+	typedef AggregateFunctionMaxData<Data> Self;
+
+	void changeIfBetter(const IColumn & column, size_t row_num) { this->changeIfGreater(column, row_num); }
+	void changeIfBetter(const Self & to) 						{ this->changeIfGreater(to); }
+
+	static const char * name() { return "max"; }
+};
+
+template <typename Data>
+struct AggregateFunctionAnyData : Data
+{
+	typedef AggregateFunctionAnyData<Data> Self;
+
+	void changeIfBetter(const IColumn & column, size_t row_num) { this->changeFirstTime(column, row_num); }
+	void changeIfBetter(const Self & to) 						{ this->changeFirstTime(to); }
+
+	static const char * name() { return "any"; }
+};
+
+template <typename Data>
+struct AggregateFunctionAnyLastData : Data
+{
+	typedef AggregateFunctionAnyLastData<Data> Self;
+
+	void changeIfBetter(const IColumn & column, size_t row_num) { this->change(column, row_num); }
+	void changeIfBetter(const Self & to) 						{ this->change(to); }
+
+	static const char * name() { return "anyLast"; }
+};
+
+
+template <typename Data>
+class AggregateFunctionsSingleValue final : public IUnaryAggregateFunction<Data, AggregateFunctionsSingleValue<Data> >
+{
+private:
+	DataTypePtr type;
+
+public:
+	String getName() const { return Data::name(); }
+
+	DataTypePtr getReturnType() const
+	{
+		return type;
+	}
+
+	void setArgument(const DataTypePtr & argument)
+	{
+		type = argument;
+	}
+
+
+	void addOne(AggregateDataPtr place, const IColumn & column, size_t row_num) const
+	{
+		this->data(place).changeIfBetter(column, row_num);
+	}
+
+	void merge(AggregateDataPtr place, ConstAggregateDataPtr rhs) const
+	{
+		this->data(place).changeIfBetter(this->data(rhs));
+	}
+
+	void serialize(ConstAggregateDataPtr place, WriteBuffer & buf) const
+	{
+		this->data(place).write(buf, *type.get());
+	}
+
+	void deserializeMerge(AggregateDataPtr place, ReadBuffer & buf) const
+	{
+		Data rhs;	/// Для строчек не очень оптимально, так как может делаться одна лишняя аллокация.
+		rhs.read(buf, *type.get());
+
+		this->data(place).changeIfBetter(rhs);
+	}
+
+	void insertResultInto(ConstAggregateDataPtr place, IColumn & to) const
+	{
+		this->data(place).insertResultInto(to);
+	}
+};
+
+}
diff --git a/dbms/include/DB/Client/Connection.h b/dbms/include/DB/Client/Connection.h
index 4dbfbb17889..9f179382cc5 100644
--- a/dbms/include/DB/Client/Connection.h
+++ b/dbms/include/DB/Client/Connection.h
@@ -97,7 +97,8 @@ public:
 	void sendExternalTablesData(ExternalTablesData & data);
 
 	/// Отправить блок данных, который уже был заранее сериализован (и, если надо, сжат), который следует прочитать из input-а.
-	void sendPreparedData(ReadBuffer & input, const String & name = "");
+	/// можно передать размер сериализованного/сжатого блока.
+	void sendPreparedData(ReadBuffer & input, size_t size,  const String & name = "");
 
 	/// Проверить, есть ли данные, которые можно прочитать.
 	bool poll(size_t timeout_microseconds = 0);
diff --git a/dbms/include/DB/Columns/ColumnArray.h b/dbms/include/DB/Columns/ColumnArray.h
index 83a51066ee5..3950488d3a7 100644
--- a/dbms/include/DB/Columns/ColumnArray.h
+++ b/dbms/include/DB/Columns/ColumnArray.h
@@ -161,8 +161,7 @@ public:
 
 	void insertDefault()
 	{
-		data->insertDefault();
-		getOffsets().push_back(getOffsets().size() == 0 ? 1 : (getOffsets().back() + 1));
+		getOffsets().push_back(getOffsets().size() == 0 ? 0 : getOffsets().back());
 	}
 
 	ColumnPtr filter(const Filter & filt) const
@@ -387,6 +386,10 @@ private:
 			throw Exception("Size of offsets doesn't match size of column.", ErrorCodes::SIZES_OF_COLUMNS_DOESNT_MATCH);
 
 		ColumnPtr res = cloneEmpty();
+
+		if (0 == col_size)
+			return res;
+
 		ColumnArray & res_ = typeid_cast<ColumnArray &>(*res);
 
 		const typename ColumnVector<T>::Container_t & cur_data = typeid_cast<const ColumnVector<T> &>(*data).getData();
@@ -431,6 +434,10 @@ private:
 			throw Exception("Size of offsets doesn't match size of column.", ErrorCodes::SIZES_OF_COLUMNS_DOESNT_MATCH);
 
 		ColumnPtr res = cloneEmpty();
+
+		if (0 == col_size)
+			return res;
+
 		ColumnArray & res_ = typeid_cast<ColumnArray &>(*res);
 
 		const ColumnString & cur_string = typeid_cast<const ColumnString &>(*data);
diff --git a/dbms/include/DB/Columns/ColumnConst.h b/dbms/include/DB/Columns/ColumnConst.h
index d6b642839ec..a0031c7070e 100644
--- a/dbms/include/DB/Columns/ColumnConst.h
+++ b/dbms/include/DB/Columns/ColumnConst.h
@@ -32,11 +32,11 @@ class ColumnConst final : public IColumnConst
 public:
 	typedef T Type;
 	typedef typename NearestFieldType<T>::Type FieldType;
-	
+
 	/// Для ColumnConst<Array> data_type_ должен быть ненулевым.
 	/// Для ColumnConst<String> data_type_ должен быть ненулевым, если тип данных FixedString.
 	ColumnConst(size_t s_, const T & data_, DataTypePtr data_type_ = DataTypePtr()) : s(s_), data(data_), data_type(data_type_) {}
-	
+
 	std::string getName() const { return "ColumnConst<" + TypeName<T>::get() + ">"; }
 	bool isNumeric() const { return IsNumber<T>::value; }
 	bool isFixed() const { return IsNumber<T>::value; }
@@ -50,7 +50,7 @@ public:
 	{
 		return new ColumnConst<T>(length, data, data_type);
 	}
-	
+
 	void insert(const Field & x)
 	{
 		if (x.get<FieldType>() != FieldType(data))
@@ -71,20 +71,15 @@ public:
 				ErrorCodes::CANNOT_INSERT_ELEMENT_INTO_CONSTANT_COLUMN);
 		++s;
 	}
-	
+
 	void insertDefault() { ++s; }
 
 	ColumnPtr filter(const Filter & filt) const
 	{
 		if (s != filt.size())
 			throw Exception("Size of filter doesn't match size of column.", ErrorCodes::SIZES_OF_COLUMNS_DOESNT_MATCH);
-		
-		size_t new_size = 0;
-		for (Filter::const_iterator it = filt.begin(); it != filt.end(); ++it)
-			if (*it)
-				++new_size;
-			
-		return new ColumnConst<T>(new_size, data, data_type);
+
+		return new ColumnConst<T>(countBytesInFilter(filt), data, data_type);
 	}
 
 	ColumnPtr replicate(const Offsets_t & offsets) const
@@ -92,7 +87,8 @@ public:
 		if (s != offsets.size())
 			throw Exception("Size of offsets doesn't match size of column.", ErrorCodes::SIZES_OF_COLUMNS_DOESNT_MATCH);
 
-		return new ColumnConst<T>(offsets.back(), data, data_type);
+		size_t replicated_size = 0 == s ? 0 : offsets.back();
+		return new ColumnConst<T>(replicated_size, data, data_type);
 	}
 
 	size_t byteSize() const { return sizeof(data) + sizeof(s); }
diff --git a/dbms/include/DB/Columns/ColumnFixedString.h b/dbms/include/DB/Columns/ColumnFixedString.h
index c9a3ff45d94..c18af6e21da 100644
--- a/dbms/include/DB/Columns/ColumnFixedString.h
+++ b/dbms/include/DB/Columns/ColumnFixedString.h
@@ -48,12 +48,12 @@ public:
 	{
 		return true;
 	}
-	
+
 	size_t byteSize() const
 	{
 		return chars.size() + sizeof(n);
 	}
-	
+
 	Field operator[](size_t index) const
 	{
 		return String(reinterpret_cast<const char *>(&chars[n * index]), n);
@@ -75,7 +75,7 @@ public:
 
 		if (s.size() > n)
 			throw Exception("Too large string '" + s + "' for FixedString column", ErrorCodes::TOO_LARGE_STRING_SIZE);
-		
+
 		size_t old_size = chars.size();
 		chars.resize_fill(old_size + n);
 		memcpy(&chars[old_size], s.data(), s.size());
@@ -222,7 +222,10 @@ public:
 
 		ColumnFixedString * res_ = new ColumnFixedString(n);
 		ColumnPtr res = res_;
-		
+
+		if (0 == col_size)
+			return res;
+
 		Chars_t & res_chars = res_->chars;
 		res_chars.reserve(n * offsets.back());
 
diff --git a/dbms/include/DB/Columns/ColumnString.h b/dbms/include/DB/Columns/ColumnString.h
index 1d7253a1479..91689a384f4 100644
--- a/dbms/include/DB/Columns/ColumnString.h
+++ b/dbms/include/DB/Columns/ColumnString.h
@@ -31,8 +31,8 @@ private:
 
 	/// Размер, включая завершающий нулевой байт.
 	size_t __attribute__((__always_inline__)) sizeAt(size_t i) const	{ return i == 0 ? offsets[0] : (offsets[i] - offsets[i - 1]); }
-	
-public:	
+
+public:
 	/** Создать пустой столбец строк */
 	ColumnString() {}
 
@@ -78,7 +78,7 @@ public:
 		const String & s = DB::get<const String &>(x);
 		size_t old_size = chars.size();
 		size_t size_to_append = s.size() + 1;
-		
+
 		chars.resize(old_size + size_to_append);
 		memcpy(&chars[old_size], s.c_str(), size_to_append);
 		offsets.push_back((offsets.size() == 0 ? 0 : offsets.back()) + size_to_append);
@@ -90,7 +90,7 @@ public:
 		size_t old_size = chars.size();
 		size_t size_to_append = src.sizeAt(n);
 		size_t offset = src.offsetAt(n);
-		
+
 		chars.resize(old_size + size_to_append);
 		memcpy(&chars[old_size], &src.chars[offset], size_to_append);
 		offsets.push_back((offsets.size() == 0 ? 0 : offsets.back()) + size_to_append);
@@ -132,7 +132,7 @@ public:
 
 		res_->chars.resize(nested_length);
 		memcpy(&res_->chars[0], &chars[nested_offset], nested_length);
-		
+
 		Offsets_t & res_offsets = res_->offsets;
 
 		if (start == 0)
@@ -152,36 +152,105 @@ public:
 
 	ColumnPtr filter(const Filter & filt) const
 	{
-		size_t size = offsets.size();
+		const size_t size = offsets.size();
 		if (size != filt.size())
 			throw Exception("Size of filter doesn't match size of column.", ErrorCodes::SIZES_OF_COLUMNS_DOESNT_MATCH);
 
 		if (size == 0)
 			return new ColumnString;
 
-		ColumnString * res_ = new ColumnString;
-		ColumnPtr res = res_;
+		auto res = new ColumnString;
 
-		Chars_t & res_chars = res_->chars;
-		Offsets_t & res_offsets = res_->offsets;
+		Chars_t & res_chars = res->chars;
+		Offsets_t & res_offsets = res->offsets;
 		res_chars.reserve(chars.size());
 		res_offsets.reserve(size);
 
-		Offset_t current_new_offset = 0;
+		Offset_t current_offset = 0;
 
-		for (size_t i = 0; i < size; ++i)
+		auto filt_pos = &filt[0];
+		const auto filt_end = filt_pos + size;
+		const auto filt_end_aligned = filt_pos + size / 16 * 16;
+
+		auto offsets_pos = &offsets[0];
+		const auto offsets_begin = offsets_pos;
+
+		const auto zero16 = _mm_set1_epi8(0);
+
+		/// copy string ending at *end_offset_ptr
+		const auto copy_string = [&] (const Offset_t * offset_ptr) {
+			const auto offset = offset_ptr == offsets_begin ? 0 : offset_ptr[-1];
+			const auto size = *offset_ptr - offset;
+
+			current_offset += size;
+			res_offsets.push_back(current_offset);
+
+			const auto chars_size_old = res_chars.size();
+			res_chars.resize(chars_size_old + size);
+			memcpy(&res_chars[chars_size_old], &chars[offset], size);
+		};
+
+		while (filt_pos < filt_end_aligned)
 		{
-			if (!filt[i])
-				continue;
-			
-			size_t string_offset = i == 0 ? 0 : offsets[i - 1];
-			size_t string_size = offsets[i] - string_offset;
+			const auto mask = _mm_movemask_epi8(_mm_cmpgt_epi8(
+				_mm_loadu_si128(reinterpret_cast<const __m128i *>(filt_pos)),
+				zero16));
 
-			current_new_offset += string_size;
-			res_offsets.push_back(current_new_offset);
+			if (mask == 0)
+			{
+				/// 16 consecutive rows do not pass the filter
+			}
+			else if (mask == 0xffff)
+			{
+				/// 16 consecutive rows pass the filter
+				const auto first = offsets_pos == offsets_begin;
 
-			res_chars.resize(res_chars.size() + string_size);
-			memcpy(&res_chars[res_chars.size() - string_size], &chars[string_offset], string_size);
+				const auto chunk_offset = first ? 0 : offsets_pos[-1];
+				const auto chunk_size = offsets_pos[16 - 1] - chunk_offset;
+
+				const auto offsets_size_old = res_offsets.size();
+				res_offsets.resize(offsets_size_old + 16);
+				memcpy(&res_offsets[offsets_size_old], offsets_pos, 16 * sizeof(Offset_t));
+
+				if (!first)
+				{
+					/// difference between current and actual offset
+					const auto diff_offset = chunk_offset - current_offset;
+
+					if (diff_offset > 0)
+					{
+						const auto res_offsets_pos = &res_offsets[offsets_size_old];
+
+						/// adjust offsets
+						for (size_t i = 0; i < 16; ++i)
+							res_offsets_pos[i] -= diff_offset;
+					}
+				}
+				current_offset += chunk_size;
+
+				/// copy characters for 16 strings at once
+				const auto chars_size_old = res_chars.size();
+				res_chars.resize(chars_size_old + chunk_size);
+				memcpy(&res_chars[chars_size_old], &chars[chunk_offset], chunk_size);
+			}
+			else
+			{
+				for (size_t i = 0; i < 16; ++i)
+					if (filt_pos[i])
+						copy_string(offsets_pos + i);
+			}
+
+			filt_pos += 16;
+			offsets_pos += 16;
+		}
+
+		while (filt_pos < filt_end)
+		{
+			if (*filt_pos)
+				copy_string(offsets_pos);
+
+			++filt_pos;
+			++offsets_pos;
 		}
 
 		return res;
@@ -248,12 +317,12 @@ public:
 			reinterpret_cast<const char *>(&chars[offsetAt(n)]),
 			reinterpret_cast<const char *>(&rhs.chars[rhs.offsetAt(m)]));
 	}
-	
+
 	/// Версия compareAt для locale-sensitive сравнения строк
 	int compareAtWithCollation(size_t n, size_t m, const IColumn & rhs_, const Collator & collator) const
 	{
 		const ColumnString & rhs = static_cast<const ColumnString &>(rhs_);
-		
+
 		return collator.compare(
 			reinterpret_cast<const char *>(&chars[offsetAt(n)]), sizeAt(n),
 			reinterpret_cast<const char *>(&rhs.chars[rhs.offsetAt(m)]), rhs.sizeAt(m));
@@ -305,9 +374,9 @@ public:
 	{
 		const ColumnString & parent;
 		const Collator & collator;
-		
+
 		lessWithCollation(const ColumnString & parent_, const Collator & collator_) : parent(parent_), collator(collator_) {}
-		
+
 		bool operator()(size_t lhs, size_t rhs) const
 		{
 			int res = collator.compare(
@@ -354,6 +423,9 @@ public:
 		ColumnString * res_ = new ColumnString;
 		ColumnPtr res = res_;
 
+		if (0 == col_size)
+			return res;
+
 		Chars_t & res_chars = res_->chars;
 		Offsets_t & res_offsets = res_->offsets;
 		res_chars.reserve(chars.size() / col_size * replicate_offsets.back());
diff --git a/dbms/include/DB/Columns/ColumnVector.h b/dbms/include/DB/Columns/ColumnVector.h
index 1faa5eaf662..e6473d4a6a1 100644
--- a/dbms/include/DB/Columns/ColumnVector.h
+++ b/dbms/include/DB/Columns/ColumnVector.h
@@ -222,11 +222,51 @@ public:
 		typename Self::Container_t & res_data = res_->getData();
 		res_data.reserve(size);
 
-		for (size_t i = 0; i < size; ++i)
-			if (filt[i])
-				res_data.push_back(data[i]);
+		/** Чуть более оптимизированная версия.
+		  * Исходит из допущения, что часто куски последовательно идущих значений
+		  *  полностью проходят или полностью не проходят фильтр.
+		  * Поэтому, будем оптимистично проверять куски по 16 значений.
+		  */
+		const UInt8 * filt_pos = &filt[0];
+		const UInt8 * filt_end = filt_pos + size;
+		const UInt8 * filt_end_sse = filt_pos + size / 16 * 16;
+		const T * data_pos = &data[0];
 
-			return res;
+		const __m128i zero16 = _mm_set1_epi8(0);
+
+		while (filt_pos < filt_end_sse)
+		{
+			int mask = _mm_movemask_epi8(_mm_cmpgt_epi8(_mm_loadu_si128(reinterpret_cast<const __m128i *>(filt_pos)), zero16));
+
+			if (0 == mask)
+			{
+				/// Ничего не вставляем.
+			}
+			else if (0xFFFF == mask)
+			{
+				res_data.insert_assume_reserved(data_pos, data_pos + 16);
+			}
+			else
+			{
+				for (size_t i = 0; i < 16; ++i)
+					if (filt_pos[i])
+						res_data.push_back(data_pos[i]);
+			}
+
+			filt_pos += 16;
+			data_pos += 16;
+		}
+
+		while (filt_pos < filt_end)
+		{
+			if (*filt_pos)
+				res_data.push_back(*data_pos);
+
+			++filt_pos;
+			++data_pos;
+		}
+
+		return res;
 	}
 
 	ColumnPtr permute(const IColumn::Permutation & perm, size_t limit) const
@@ -256,6 +296,9 @@ public:
 		if (size != offsets.size())
 			throw Exception("Size of offsets doesn't match size of column.", ErrorCodes::SIZES_OF_COLUMNS_DOESNT_MATCH);
 
+		if (0 == size)
+			return new Self;
+
 		Self * res_ = new Self;
 		ColumnPtr res = res_;
 		typename Self::Container_t & res_data = res_->getData();
diff --git a/dbms/include/DB/Columns/IColumn.h b/dbms/include/DB/Columns/IColumn.h
index cab7bf1a645..8a448e4bb01 100644
--- a/dbms/include/DB/Columns/IColumn.h
+++ b/dbms/include/DB/Columns/IColumn.h
@@ -198,4 +198,8 @@ public:
 };
 
 
+/// Считает, сколько байт в filt больше нуля.
+size_t countBytesInFilter(const IColumn::Filter & filt);
+
+
 }
diff --git a/dbms/include/DB/Columns/IColumnDummy.h b/dbms/include/DB/Columns/IColumnDummy.h
index ffa6a8742c5..1ab49024fc8 100644
--- a/dbms/include/DB/Columns/IColumnDummy.h
+++ b/dbms/include/DB/Columns/IColumnDummy.h
@@ -6,7 +6,7 @@
 
 namespace DB
 {
-	
+
 /** Базовый класс для столбцов-констант, содержащих значение, не входящее в Field.
   * Не является полноценым столбцом и используется особым образом.
   */
@@ -14,16 +14,16 @@ class IColumnDummy : public IColumn
 {
 public:
 	IColumnDummy(size_t s_) : s(s_) {}
-	
+
 	virtual ColumnPtr cloneDummy(size_t s_) const = 0;
-	
+
 	ColumnPtr cloneResized(size_t s_) const { return cloneDummy(s_); }
 	bool isConst() const { return true; }
 	size_t size() const { return s; }
 	void insertDefault() { ++s; }
 	size_t byteSize() const { return 0; }
 	int compareAt(size_t n, size_t m, const IColumn & rhs_, int nan_direction_hint) const { return 0; }
-	
+
 	Field operator[](size_t n) const { throw Exception("Cannot get value from " + getName(), ErrorCodes::NOT_IMPLEMENTED); }
 	void get(size_t n, Field & res) const { throw Exception("Cannot get value from " + getName(), ErrorCodes::NOT_IMPLEMENTED); };
 	void insert(const Field & x) { throw Exception("Cannot insert element into " + getName(), ErrorCodes::NOT_IMPLEMENTED); }
@@ -39,42 +39,42 @@ public:
 	{
 		return cloneDummy(length);
 	}
-	
+
 	ColumnPtr filter(const Filter & filt) const
 	{
 		size_t new_size = 0;
 		for (Filter::const_iterator it = filt.begin(); it != filt.end(); ++it)
 			if (*it)
 				++new_size;
-			
+
 			return cloneDummy(new_size);
 	}
-	
+
 	ColumnPtr permute(const Permutation & perm, size_t limit) const
 	{
 		if (s != perm.size())
 			throw Exception("Size of permutation doesn't match size of column.", ErrorCodes::SIZES_OF_COLUMNS_DOESNT_MATCH);
-		
+
 		return cloneDummy(limit ? std::min(s, limit) : s);
 	}
-	
+
 	void getPermutation(bool reverse, size_t limit, Permutation & res) const
 	{
 		res.resize(s);
 		for (size_t i = 0; i < s; ++i)
 			res[i] = i;
 	}
-	
+
 	ColumnPtr replicate(const Offsets_t & offsets) const
 	{
 		if (s != offsets.size())
 			throw Exception("Size of offsets doesn't match size of column.", ErrorCodes::SIZES_OF_COLUMNS_DOESNT_MATCH);
-		
-		return cloneDummy(offsets.back());
+
+		return cloneDummy(s == 0 ? 0 : offsets.back());
 	}
-	
+
 private:
 	size_t s;
 };
-	
+
 }
diff --git a/dbms/include/DB/Common/FileChecker.h b/dbms/include/DB/Common/FileChecker.h
new file mode 100644
index 00000000000..8d9f1b1a741
--- /dev/null
+++ b/dbms/include/DB/Common/FileChecker.h
@@ -0,0 +1,95 @@
+#pragma once
+
+#include <Yandex/logger_useful.h>
+#include <DB/Columns/IColumn.h>
+#include <Poco/AutoPtr.h>
+#include <Poco/Util/XMLConfiguration.h>
+#include <string>
+#include <Poco/File.h>
+#include <DB/Common/escapeForFileName.h>
+#include <jsonxx.h>
+#include <fstream>
+
+namespace DB
+{
+
+/// хранит размеры всех столбцов, и может проверять не побились ли столбцы
+template <class Storage>
+class FileChecker
+{
+public:
+	FileChecker(const std::string &file_info_path_, Storage & storage_) :
+		files_info_path(file_info_path_), storage(storage_), log(&Logger::get("FileChecker"))
+	{
+		std::ifstream istr(files_info_path);
+		files_info.parse(istr);
+	}
+
+	void setPath(const std::string & file_info_path_)
+	{
+		files_info_path = file_info_path_;
+	}
+
+	using Files = std::vector<Poco::File>;
+
+	void update(const Poco::File & file)
+	{
+		updateTree(file);
+		saveTree();
+	}
+
+	void update(const Files::iterator & begin, const Files::iterator & end)
+	{
+		for (auto it = begin; it != end; ++it)
+			updateTree(*it);
+		saveTree();
+	}
+
+	/// Проверяем файлы, параметры которых указаны в sizes.json
+	bool check() const
+	{
+		bool correct = true;
+		for (auto & node : files_info.kv_map())
+		{
+			std::string filename = unescapeForFileName(node.first);
+			size_t expected_size = std::stoull(node.second->get<jsonxx::Object>().get<std::string>("size"));
+
+			Poco::File file(Poco::Path(files_info_path).parent().toString() + "/" + filename);
+			if (!file.exists())
+			{
+				LOG_ERROR(log, "File " << file.path() << " doesn't exists");
+				correct = false;
+				continue;
+			}
+
+			size_t real_size = file.getSize();
+			if (real_size != expected_size)
+			{
+				LOG_ERROR(log, "Size of " << file.path() << " is wrong. Size is " << real_size << " but should be " << expected_size);
+				correct = false;
+			}
+		}
+		return correct;
+	}
+
+private:
+	void updateTree(const Poco::File & file)
+	{
+		files_info.import(escapeForFileName(Poco::Path(file.path()).getFileName()),
+											jsonxx::Object("size", std::to_string(file.getSize())));
+	}
+
+	void saveTree()
+	{
+		std::ofstream file(files_info_path, std::ofstream::trunc);
+		file  << files_info.write(jsonxx::JSON);
+	}
+
+	std::string files_info_path;
+
+	jsonxx::Object files_info;
+
+	Storage & storage;
+	Logger * log;
+};
+}
diff --git a/dbms/include/DB/Common/Macros.h b/dbms/include/DB/Common/Macros.h
new file mode 100644
index 00000000000..2855eb6b750
--- /dev/null
+++ b/dbms/include/DB/Common/Macros.h
@@ -0,0 +1,27 @@
+#pragma once
+
+#include <DB/Core/Types.h>
+#include <Poco/Util/AbstractConfiguration.h>
+#include <map>
+
+namespace DB
+{
+
+/** Раскрывает в строке макросы из конфига.
+  */
+class Macros
+{
+public:
+	Macros();
+	Macros(const Poco::Util::AbstractConfiguration & config, const String & key);
+
+	/// Заменить в строке подстроки вида {macro_name} на значение для macro_name, полученное из конфига.
+	String expand(const String & s) const;
+
+private:
+	typedef std::map<String, String> MacroMap;
+
+	MacroMap macros;
+};
+
+}
diff --git a/dbms/include/DB/Common/PODArray.h b/dbms/include/DB/Common/PODArray.h
index 93fe1ad839f..37fabed0a0d 100644
--- a/dbms/include/DB/Common/PODArray.h
+++ b/dbms/include/DB/Common/PODArray.h
@@ -248,6 +248,12 @@ public:
 		if (required_capacity > capacity())
 			reserve(round_up_to_power_of_two(required_capacity));
 
+		insert_assume_reserved(from_begin, from_end);
+	}
+
+	template <typename It1, typename It2>
+	void insert_assume_reserved(It1 from_begin, It2 from_end)
+	{
 		size_t bytes_to_copy = byte_size(from_end - from_begin);
 		memcpy(c_end, reinterpret_cast<const void *>(&*from_begin), bytes_to_copy);
 		c_end += bytes_to_copy;
diff --git a/dbms/include/DB/Common/Volnitsky.h b/dbms/include/DB/Common/Volnitsky.h
index 77de66e0f39..c6b5fb8ac5c 100644
--- a/dbms/include/DB/Common/Volnitsky.h
+++ b/dbms/include/DB/Common/Volnitsky.h
@@ -21,7 +21,7 @@
   * - ищем её в хэш-таблице, если нашли - достаём смещение из хэш-таблицы и сравниваем строку побайтово;
   * - если сравнить не получилось - проверяем следующую ячейку хэш-таблицы из цепочки разрешения коллизий;
   * - если не нашли, пропускаем в haystack почти размер needle байт;
-  * 
+  *
   * Используется невыровненный доступ к памяти.
   */
 class Volnitsky
@@ -35,7 +35,7 @@ private:
 	const char * needle_end;
 	size_t step;				/// Насколько двигаемся, если n-грамма из haystack не нашлась в хэш-таблице.
 
-	static const size_t hash_size = 64 * 1024;	/// Обычно помещается в L1-кэш, хотя занимает его целиком.
+	static const size_t hash_size = 64 * 1024;	/// Помещается в L2-кэш.
 	offset_t hash[hash_size];	/// Хэш-таблица.
 
 	bool fallback;				/// Нужно ли использовать fallback алгоритм.
@@ -57,7 +57,7 @@ public:
 		}
 		else
 			fallback = false;
-		
+
 		memset(hash, 0, hash_size * sizeof(hash[0]));
 
 		for (int i = needle_size - sizeof(ngram_t); i >= 0; --i)
diff --git a/dbms/include/DB/Core/Defines.h b/dbms/include/DB/Core/Defines.h
index a253d6ea740..7599036d248 100644
--- a/dbms/include/DB/Core/Defines.h
+++ b/dbms/include/DB/Core/Defines.h
@@ -64,3 +64,5 @@
 #define DBMS_MIN_REVISION_WITH_TOTALS_EXTREMES					35265
 #define DBMS_MIN_REVISION_WITH_STRING_QUERY_ID					39002
 #define DBMS_MIN_REVISION_WITH_TEMPORARY_TABLES					50264
+
+#define DBMS_DISTRIBUTED_DIRECTORY_MONITOR_SLEEP_TIME_MS		100
diff --git a/dbms/include/DB/Core/ErrorCodes.h b/dbms/include/DB/Core/ErrorCodes.h
index 72b8f4cc309..ac69ce20aaa 100644
--- a/dbms/include/DB/Core/ErrorCodes.h
+++ b/dbms/include/DB/Core/ErrorCodes.h
@@ -255,6 +255,10 @@ namespace ErrorCodes
 		INVALID_NESTED_NAME,
 		CORRUPTED_DATA,
 		INCORRECT_MARK,
+		INVALID_PARTITION_NAME,
+		NOT_LEADER,
+		NOT_ENOUGH_BLOCK_NUMBERS,
+		NO_SUCH_REPLICA,
 
 		POCO_EXCEPTION = 1000,
 		STD_EXCEPTION,
diff --git a/dbms/include/DB/Core/Field.h b/dbms/include/DB/Core/Field.h
index 48558f9717e..7bf0fe6e288 100644
--- a/dbms/include/DB/Core/Field.h
+++ b/dbms/include/DB/Core/Field.h
@@ -582,11 +582,39 @@ private:
 		writeQuoted(x, wb);
 		return res;
 	}
+
+	/** В отличие от writeFloatText (и writeQuoted), если число после форматирования выглядит целым, всё равно добавляет десятичную точку.
+	  * - для того, чтобы это число могло обратно распарситься как Float64 парсером запроса (иначе распарсится как целое).
+	  *
+	  * При этом, не оставляет завершающие нули справа.
+	  *
+	  * NOTE: При таком roundtrip-е, точность может теряться.
+	  */
+	static inline String formatFloat(Float64 x)
+	{
+		char tmp[24];
+		int res = std::snprintf(tmp, 23, "%.*g", WRITE_HELPERS_DEFAULT_FLOAT_PRECISION, x);
+
+		if (res >= 23 || res <= 0)
+			throw Exception("Cannot print float or double number", ErrorCodes::CANNOT_PRINT_FLOAT_OR_DOUBLE_NUMBER);
+
+		size_t string_size = res;
+
+		tmp[23] = '\0';
+		if (string_size == strspn(tmp, "-0123456789"))
+		{
+			tmp[string_size] = '.';
+			++string_size;
+		}
+
+		return {tmp, string_size};
+	}
+
 public:
 	String operator() (const Null 		& x) const { return "NULL"; }
 	String operator() (const UInt64 	& x) const { return formatQuoted(x); }
 	String operator() (const Int64 		& x) const { return formatQuoted(x); }
-	String operator() (const Float64 	& x) const { return formatQuoted(x); }
+	String operator() (const Float64 	& x) const { return formatFloat(x); }
 	String operator() (const String 	& x) const { return formatQuoted(x); }
 
 	String operator() (const Array 		& x) const
@@ -689,7 +717,7 @@ namespace DB
 {
 	class ReadBuffer;
 	class WriteBuffer;
-	
+
 	/// Предполагается что у всех элементов массива одинаковый тип.
 	inline void readBinary(Array & x, ReadBuffer & buf)
 	{
@@ -745,7 +773,7 @@ namespace DB
 			};
 		}
 	}
-	
+
 	inline void readText(Array & x, ReadBuffer & buf) 			{ throw Exception("Cannot read Array.", ErrorCodes::NOT_IMPLEMENTED); }
 	inline void readQuoted(Array & x, ReadBuffer & buf) 		{ throw Exception("Cannot read Array.", ErrorCodes::NOT_IMPLEMENTED); }
 
@@ -758,7 +786,7 @@ namespace DB
 			type = x.front().getType();
 		DB::writeBinary(type, buf);
 		DB::writeBinary(size, buf);
-		
+
 		for (Array::const_iterator it = x.begin(); it != x.end(); ++it)
 		{
 			switch (type)
@@ -792,13 +820,13 @@ namespace DB
 			};
 		}
 	}
-	
+
 	inline void writeText(const Array & x, WriteBuffer & buf)
 	{
 		DB::String res = apply_visitor(DB::FieldVisitorToString(), DB::Field(x));
 		buf.write(res.data(), res.size());
 	}
-	
+
 	inline void writeQuoted(const Array & x, WriteBuffer & buf) { throw Exception("Cannot write Array quoted.", ErrorCodes::NOT_IMPLEMENTED); }
 }
 
diff --git a/dbms/include/DB/Core/StringRef.h b/dbms/include/DB/Core/StringRef.h
index 0f0e21eb481..76cfc676805 100644
--- a/dbms/include/DB/Core/StringRef.h
+++ b/dbms/include/DB/Core/StringRef.h
@@ -26,7 +26,7 @@ struct StringRef
 
 typedef std::vector<StringRef> StringRefs;
 
-inline bool operator==(StringRef lhs, StringRef rhs)
+inline bool operator== (StringRef lhs, StringRef rhs)
 {
 	/// Так почему-то быстрее, чем return lhs.size == rhs.size && 0 == memcmp(lhs.data, rhs.data, lhs.size);
 
@@ -40,18 +40,21 @@ inline bool operator==(StringRef lhs, StringRef rhs)
 	return true;
 }
 
-inline bool operator!=(StringRef lhs, StringRef rhs)
+inline bool operator!= (StringRef lhs, StringRef rhs)
 {
 	return !(lhs == rhs);
 }
 
-inline bool operator<(StringRef lhs, StringRef rhs)
+inline bool operator< (StringRef lhs, StringRef rhs)
 {
 	int cmp = memcmp(lhs.data, rhs.data, std::min(lhs.size, rhs.size));
-	if (cmp == 0)
-		return lhs.size < rhs.size;
-	else
-		return cmp < 0;
+	return cmp < 0 || (cmp == 0 && lhs.size < rhs.size);
+}
+
+inline bool operator> (StringRef lhs, StringRef rhs)
+{
+	int cmp = memcmp(lhs.data, rhs.data, std::min(lhs.size, rhs.size));
+	return cmp > 0 || (cmp == 0 && lhs.size > rhs.size);
 }
 
 
diff --git a/dbms/include/DB/DataStreams/AddingDefaultBlockOutputStream.h b/dbms/include/DB/DataStreams/AddingDefaultBlockOutputStream.h
index 643a99270c4..c3a49cece4c 100644
--- a/dbms/include/DB/DataStreams/AddingDefaultBlockOutputStream.h
+++ b/dbms/include/DB/DataStreams/AddingDefaultBlockOutputStream.h
@@ -33,6 +33,8 @@ public:
 		output->write(res);
 	}
 
+	void flush() { output->flush(); }
+
 private:
 	BlockOutputStreamPtr output;
 	NamesAndTypesListPtr required_columns;
diff --git a/dbms/include/DB/DataStreams/BinaryRowOutputStream.h b/dbms/include/DB/DataStreams/BinaryRowOutputStream.h
index df8ab4a4a99..09f4383437e 100644
--- a/dbms/include/DB/DataStreams/BinaryRowOutputStream.h
+++ b/dbms/include/DB/DataStreams/BinaryRowOutputStream.h
@@ -20,6 +20,8 @@ public:
 	void writeField(const Field & field);
 	void writeRowEndDelimiter();
 
+	void flush() { ostr.next(); }
+
 protected:
 	WriteBuffer & ostr;
 	const Block sample;
diff --git a/dbms/include/DB/DataStreams/BlockOutputStreamFromRowOutputStream.h b/dbms/include/DB/DataStreams/BlockOutputStreamFromRowOutputStream.h
index 70213b5d2d4..e6d15c7b323 100644
--- a/dbms/include/DB/DataStreams/BlockOutputStreamFromRowOutputStream.h
+++ b/dbms/include/DB/DataStreams/BlockOutputStreamFromRowOutputStream.h
@@ -17,6 +17,8 @@ public:
 	void write(const Block & block);
 	void writePrefix() { row_output->writePrefix(); }
 	void writeSuffix() { row_output->writeSuffix(); }
+
+	void flush() { row_output->flush(); }
 	
 	void setRowsBeforeLimit(size_t rows_before_limit);
 	void setTotals(const Block & totals);
diff --git a/dbms/include/DB/DataStreams/IBlockInputStream.h b/dbms/include/DB/DataStreams/IBlockInputStream.h
index 10887a4ee66..a63c3fee017 100644
--- a/dbms/include/DB/DataStreams/IBlockInputStream.h
+++ b/dbms/include/DB/DataStreams/IBlockInputStream.h
@@ -63,7 +63,6 @@ public:
 	BlockInputStreams & getChildren() { return children; }
 	
 	void dumpTree(std::ostream & ostr, size_t indent = 0, size_t multiplier = 1);
-	void dumpTreeWithProfile(std::ostream & ostr, size_t indent = 0);
 
 	/// Получить листовые источники (не считая этот).
 	BlockInputStreams getLeaves();
diff --git a/dbms/include/DB/DataStreams/IBlockOutputStream.h b/dbms/include/DB/DataStreams/IBlockOutputStream.h
index 72769711008..ad19e50d4ba 100644
--- a/dbms/include/DB/DataStreams/IBlockOutputStream.h
+++ b/dbms/include/DB/DataStreams/IBlockOutputStream.h
@@ -31,6 +31,10 @@ public:
 	  */
 	virtual void writePrefix() {}
 	virtual void writeSuffix() {}
+
+	/** Сбросить имеющиеся буферы для записи.
+	  */
+	virtual void flush() {}
 	
 	/** Методы для установки дополнительной информации для вывода в поддерживающих её форматах.
 	  */
diff --git a/dbms/include/DB/DataStreams/IProfilingBlockInputStream.h b/dbms/include/DB/DataStreams/IProfilingBlockInputStream.h
index 0e0d0248551..7487503452c 100644
--- a/dbms/include/DB/DataStreams/IProfilingBlockInputStream.h
+++ b/dbms/include/DB/DataStreams/IProfilingBlockInputStream.h
@@ -21,8 +21,7 @@ namespace DB
 struct BlockStreamProfileInfo
 {
 	bool started = false;
-	Stopwatch work_stopwatch;	/// Время вычислений (выполнения функции read())
-	Stopwatch total_stopwatch;	/// Время с учётом ожидания
+	Stopwatch total_stopwatch {CLOCK_MONOTONIC_COARSE};	/// Время с учётом ожидания
 	
 	String stream_name;			/// Короткое имя потока, для которого собирается информация
 
@@ -48,7 +47,6 @@ struct BlockStreamProfileInfo
 	bool hasAppliedLimit() const;
 
 	void update(Block & block);
-	void print(std::ostream & ostr) const;	
 	
 	/// Методы для бинарной [де]сериализации
 	void read(ReadBuffer & in);
diff --git a/dbms/include/DB/DataStreams/IRowOutputStream.h b/dbms/include/DB/DataStreams/IRowOutputStream.h
index d58fb50ae64..eec6c7a9201 100644
--- a/dbms/include/DB/DataStreams/IRowOutputStream.h
+++ b/dbms/include/DB/DataStreams/IRowOutputStream.h
@@ -32,6 +32,9 @@ public:
 	virtual void writePrefix() {};				/// разделитель перед началом результата
 	virtual void writeSuffix() {};				/// разделитель после конца результата
 
+	/** Сбросить имеющиеся буферы для записи. */
+	virtual void flush() {}
+
 	/** Методы для установки дополнительной информации для вывода в поддерживающих её форматах.
 	  */
 	virtual void setRowsBeforeLimit(size_t rows_before_limit) {}
diff --git a/dbms/include/DB/DataStreams/JSONRowOutputStream.h b/dbms/include/DB/DataStreams/JSONRowOutputStream.h
index 224dbbadf76..b96dde4c3ae 100644
--- a/dbms/include/DB/DataStreams/JSONRowOutputStream.h
+++ b/dbms/include/DB/DataStreams/JSONRowOutputStream.h
@@ -25,6 +25,8 @@ public:
 	void writeRowEndDelimiter();
 	void writePrefix();
 	void writeSuffix();
+
+	void flush() { ostr.next(); dst_ostr.next(); }
 	
 	void setRowsBeforeLimit(size_t rows_before_limit_)
 	{
@@ -41,7 +43,8 @@ protected:
 	virtual void writeTotals();
 	virtual void writeExtremes();
 	
-	WriteBufferValidUTF8 ostr;
+	WriteBuffer & dst_ostr;
+	WriteBufferValidUTF8 ostr;	/// Валидирует и пишет в dst_ostr.
 	size_t field_number;
 	size_t row_count;
 	bool applied_limit;
diff --git a/dbms/include/DB/DataStreams/NativeBlockOutputStream.h b/dbms/include/DB/DataStreams/NativeBlockOutputStream.h
index eb47f2d88a5..ae11058f664 100644
--- a/dbms/include/DB/DataStreams/NativeBlockOutputStream.h
+++ b/dbms/include/DB/DataStreams/NativeBlockOutputStream.h
@@ -15,6 +15,8 @@ public:
 	NativeBlockOutputStream(WriteBuffer & ostr_) : ostr(ostr_) {}
 	void write(const Block & block);
 
+	void flush() { ostr.next(); }
+
 private:
 	WriteBuffer & ostr;
 };
diff --git a/dbms/include/DB/DataStreams/PrettyBlockOutputStream.h b/dbms/include/DB/DataStreams/PrettyBlockOutputStream.h
index 65c8d03050f..eaa820dc170 100644
--- a/dbms/include/DB/DataStreams/PrettyBlockOutputStream.h
+++ b/dbms/include/DB/DataStreams/PrettyBlockOutputStream.h
@@ -18,6 +18,8 @@ public:
 	void write(const Block & block);
 	void writeSuffix();
 
+	void flush() { ostr.next(); }
+
 	void setTotals(const Block & totals_) { totals = totals_; }
 	void setExtremes(const Block & extremes_) { extremes = extremes_; }
 
diff --git a/dbms/include/DB/DataStreams/PushingToViewsBlockOutputStream.h b/dbms/include/DB/DataStreams/PushingToViewsBlockOutputStream.h
index c22a4c258f7..58e9264c91f 100644
--- a/dbms/include/DB/DataStreams/PushingToViewsBlockOutputStream.h
+++ b/dbms/include/DB/DataStreams/PushingToViewsBlockOutputStream.h
@@ -18,8 +18,8 @@ namespace DB
 class PushingToViewsBlockOutputStream : public IBlockOutputStream
 {
 public:
-	PushingToViewsBlockOutputStream(String database_, String table_, const Context &context_, ASTPtr query_ptr_)
-		:database(database_), table(table_), context(context_), query_ptr(query_ptr_)
+	PushingToViewsBlockOutputStream(String database_, String table_, const Context & context_, ASTPtr query_ptr_)
+		: database(database_), table(table_), context(context_), query_ptr(query_ptr_)
 	{
 		if (database.empty())
 			database = context.getCurrentDatabase();
diff --git a/dbms/include/DB/DataStreams/RemoteBlockOutputStream.h b/dbms/include/DB/DataStreams/RemoteBlockOutputStream.h
index 712852b4941..d4087429770 100644
--- a/dbms/include/DB/DataStreams/RemoteBlockOutputStream.h
+++ b/dbms/include/DB/DataStreams/RemoteBlockOutputStream.h
@@ -14,8 +14,8 @@ namespace DB
 class RemoteBlockOutputStream : public IBlockOutputStream
 {
 public:
-	RemoteBlockOutputStream(Connection & connection_, const String & query_)
-		: connection(connection_), query(query_)
+	RemoteBlockOutputStream(Connection & connection_, const String & query_, Settings * settings_ = nullptr)
+		: connection(connection_), query(query_), settings(settings_)
 	{
 	}
 
@@ -26,7 +26,7 @@ public:
 	  */
 	Block sendQueryAndGetSampleBlock()
 	{
-		connection.sendQuery(query);
+		connection.sendQuery(query, "", QueryProcessingStage::Complete, settings);
 		sent_query = true;
 
 		Connection::Packet packet = connection.receivePacket();
@@ -64,12 +64,12 @@ public:
 
 
 	/// Отправить блок данных, который уже был заранее сериализован (и, если надо, сжат), который следует прочитать из input-а.
-	void writePrepared(ReadBuffer & input)
+	void writePrepared(ReadBuffer & input, size_t size = 0)
 	{
 		if (!sent_query)
 			sendQueryAndGetSampleBlock();	/// Никак не можем использовать sample_block.
 
-		connection.sendPreparedData(input);
+		connection.sendPreparedData(input, size);
 	}
 
 
@@ -95,6 +95,7 @@ public:
 private:
 	Connection & connection;
 	String query;
+	Settings * settings;
 	Block sample_block;
 
 	bool sent_query = false;
diff --git a/dbms/include/DB/DataStreams/TabSeparatedBlockOutputStream.h b/dbms/include/DB/DataStreams/TabSeparatedBlockOutputStream.h
index 9bba296b7d5..05d801362f9 100644
--- a/dbms/include/DB/DataStreams/TabSeparatedBlockOutputStream.h
+++ b/dbms/include/DB/DataStreams/TabSeparatedBlockOutputStream.h
@@ -16,6 +16,8 @@ public:
 	TabSeparatedBlockOutputStream(WriteBuffer & ostr_) : ostr(ostr_) {}
 	void write(const Block & block);
 
+	void flush() { ostr.next(); }
+
 private:
 	WriteBuffer & ostr;
 };
diff --git a/dbms/include/DB/DataStreams/TabSeparatedRowOutputStream.h b/dbms/include/DB/DataStreams/TabSeparatedRowOutputStream.h
index 46056042d53..60681d56ed1 100644
--- a/dbms/include/DB/DataStreams/TabSeparatedRowOutputStream.h
+++ b/dbms/include/DB/DataStreams/TabSeparatedRowOutputStream.h
@@ -26,6 +26,8 @@ public:
 	void writePrefix();
 	void writeSuffix();
 
+	void flush() { ostr.next(); }
+
 	void setTotals(const Block & totals_) { totals = totals_; }
 	void setExtremes(const Block & extremes_) { extremes = extremes_; }
 
diff --git a/dbms/include/DB/DataStreams/ValuesRowOutputStream.h b/dbms/include/DB/DataStreams/ValuesRowOutputStream.h
index ba632b62fdb..4cfd5d74c92 100644
--- a/dbms/include/DB/DataStreams/ValuesRowOutputStream.h
+++ b/dbms/include/DB/DataStreams/ValuesRowOutputStream.h
@@ -26,6 +26,8 @@ public:
 	void writeRowEndDelimiter();
 	void writeRowBetweenDelimiter();
 
+	void flush() { ostr.next(); }
+
 private:
 	WriteBuffer & ostr;
 	const Block sample;
diff --git a/dbms/include/DB/DataStreams/VerticalRowOutputStream.h b/dbms/include/DB/DataStreams/VerticalRowOutputStream.h
index dbd9cbb5672..08a9c83145f 100644
--- a/dbms/include/DB/DataStreams/VerticalRowOutputStream.h
+++ b/dbms/include/DB/DataStreams/VerticalRowOutputStream.h
@@ -25,6 +25,8 @@ public:
 	void writeRowStartDelimiter();
 	void writeRowBetweenDelimiter();
 
+	void flush() { ostr.next(); }
+
 private:
 	WriteBuffer & ostr;
 	const Block sample;
diff --git a/dbms/include/DB/Functions/FunctionFactory.h b/dbms/include/DB/Functions/FunctionFactory.h
index c154fe17e6b..5900365995a 100644
--- a/dbms/include/DB/Functions/FunctionFactory.h
+++ b/dbms/include/DB/Functions/FunctionFactory.h
@@ -1,7 +1,6 @@
 #pragma once
 
 #include <Poco/SharedPtr.h>
-
 #include <DB/Functions/IFunction.h>
 
 
@@ -17,10 +16,19 @@ class Context;
   */
 class FunctionFactory
 {
+private:
+	typedef IFunction* (*Creator)(const Context & context);	/// Не std::function, так как меньше indirection и размер объекта.
+	std::unordered_map<String, Creator> functions;
+
 public:
-	FunctionPtr get(
-		const String & name,
-		const Context & context) const;
+	FunctionFactory();
+
+	FunctionPtr get(const String & name, const Context & context) const;
+
+	void registerFunction(const String & name, Creator creator)
+	{
+		functions[name] = creator;
+	}
 };
 
 }
diff --git a/dbms/include/DB/Functions/FunctionsArithmetic.h b/dbms/include/DB/Functions/FunctionsArithmetic.h
index 7996d8f5818..eed06e4135a 100644
--- a/dbms/include/DB/Functions/FunctionsArithmetic.h
+++ b/dbms/include/DB/Functions/FunctionsArithmetic.h
@@ -14,7 +14,7 @@ namespace DB
   */
 
 template<typename A, typename B, typename Op>
-struct BinaryOperationImpl
+struct BinaryOperationImplBase
 {
 	typedef typename Op::ResultType ResultType;
 
@@ -45,6 +45,11 @@ struct BinaryOperationImpl
 	}
 };
 
+template<typename A, typename B, typename Op>
+struct BinaryOperationImpl : BinaryOperationImplBase<A, B, Op>
+{
+};
+
 template<typename A, typename Op>
 struct UnaryOperationImpl
 {
@@ -221,7 +226,7 @@ struct NegateImpl
 
 	static inline ResultType apply(A a)
 	{
-		return -a;
+		return -static_cast<ResultType>(a);
 	}
 };
 
@@ -570,4 +575,140 @@ typedef FunctionBinaryArithmetic<BitShiftRightImpl,		NameBitShiftRight> 		Functi
 
 
 
+/// Оптимизации для целочисленного деления на константу.
+
+#define LIBDIVIDE_USE_SSE2 1
+#include <libdivide.h>
+
+
+template <typename A, typename B>
+struct DivideIntegralByConstantImpl
+	: BinaryOperationImplBase<A, B, DivideIntegralImpl<A, B>>
+{
+	typedef typename DivideIntegralImpl<A, B>::ResultType ResultType;
+
+	static void vector_constant(const PODArray<A> & a, B b, PODArray<ResultType> & c)
+	{
+		if (unlikely(b == 0))
+			throw Exception("Division by zero", ErrorCodes::ILLEGAL_DIVISION);
+
+#pragma GCC diagnostic push
+#pragma GCC diagnostic ignored "-Wsign-compare"
+
+		if (unlikely(std::is_signed<B>::value && b == -1))
+		{
+			size_t size = a.size();
+			for (size_t i = 0; i < size; ++i)
+				c[i] = -c[i];
+			return;
+		}
+
+#pragma GCC diagnostic pop
+
+		libdivide::divider<A> divider(b);
+
+		size_t size = a.size();
+		const A * a_pos = &a[0];
+		const A * a_end = a_pos + size;
+		ResultType * c_pos = &c[0];
+		static constexpr size_t values_per_sse_register = 16 / sizeof(A);
+		const A * a_end_sse = a_pos + size / values_per_sse_register * values_per_sse_register;
+
+		while (a_pos < a_end_sse)
+		{
+			_mm_storeu_si128(reinterpret_cast<__m128i *>(c_pos),
+				_mm_loadu_si128(reinterpret_cast<const __m128i *>(a_pos)) / divider);
+
+			a_pos += values_per_sse_register;
+			c_pos += values_per_sse_register;
+		}
+
+		while (a_pos < a_end)
+		{
+			*c_pos = *a_pos / divider;
+			++a_pos;
+			++c_pos;
+		}
+	}
+};
+
+template <typename A, typename B>
+struct ModuloByConstantImpl
+	: BinaryOperationImplBase<A, B, ModuloImpl<A, B>>
+{
+	typedef typename ModuloImpl<A, B>::ResultType ResultType;
+
+	static void vector_constant(const PODArray<A> & a, B b, PODArray<ResultType> & c)
+	{
+		if (unlikely(b == 0))
+			throw Exception("Division by zero", ErrorCodes::ILLEGAL_DIVISION);
+
+#pragma GCC diagnostic push
+#pragma GCC diagnostic ignored "-Wsign-compare"
+
+		if (unlikely((std::is_signed<B>::value && b == -1) || b == 1))
+		{
+			size_t size = a.size();
+			for (size_t i = 0; i < size; ++i)
+				c[i] = 0;
+			return;
+		}
+
+#pragma GCC diagnostic pop
+
+		libdivide::divider<A> divider(b);
+
+		/// Тут не удалось сделать так, чтобы SSE вариант из libdivide давал преимущество.
+		size_t size = a.size();
+		for (size_t i = 0; i < size; ++i)
+			c[i] = a[i] - (a[i] / divider) * b;	/// NOTE: возможно, не сохраняется семантика деления с остатком отрицательных чисел.
+	}
+};
+
+
+/** Прописаны специализации для деления чисел типа UInt64 и UInt32 на числа той же знаковости.
+  * Можно дополнить до всех возможных комбинаций, но потребуется больше кода.
+  */
+
+template <> struct BinaryOperationImpl<UInt64, UInt8, 	DivideIntegralImpl<UInt64, UInt8>> 	: DivideIntegralByConstantImpl<UInt64, UInt8> {};
+template <> struct BinaryOperationImpl<UInt64, UInt16,	DivideIntegralImpl<UInt64, UInt16>> : DivideIntegralByConstantImpl<UInt64, UInt16> {};
+template <> struct BinaryOperationImpl<UInt64, UInt32, 	DivideIntegralImpl<UInt64, UInt32>> : DivideIntegralByConstantImpl<UInt64, UInt32> {};
+template <> struct BinaryOperationImpl<UInt64, UInt64, 	DivideIntegralImpl<UInt64, UInt64>> : DivideIntegralByConstantImpl<UInt64, UInt64> {};
+
+template <> struct BinaryOperationImpl<UInt32, UInt8, 	DivideIntegralImpl<UInt32, UInt8>> 	: DivideIntegralByConstantImpl<UInt32, UInt8> {};
+template <> struct BinaryOperationImpl<UInt32, UInt16, 	DivideIntegralImpl<UInt32, UInt16>> : DivideIntegralByConstantImpl<UInt32, UInt16> {};
+template <> struct BinaryOperationImpl<UInt32, UInt32, 	DivideIntegralImpl<UInt32, UInt32>> : DivideIntegralByConstantImpl<UInt32, UInt32> {};
+template <> struct BinaryOperationImpl<UInt32, UInt64, 	DivideIntegralImpl<UInt32, UInt64>> : DivideIntegralByConstantImpl<UInt32, UInt64> {};
+
+template <> struct BinaryOperationImpl<Int64, Int8, 	DivideIntegralImpl<Int64, Int8>> 	: DivideIntegralByConstantImpl<Int64, Int8> {};
+template <> struct BinaryOperationImpl<Int64, Int16, 	DivideIntegralImpl<Int64, Int16>> 	: DivideIntegralByConstantImpl<Int64, Int16> {};
+template <> struct BinaryOperationImpl<Int64, Int32, 	DivideIntegralImpl<Int64, Int32>> 	: DivideIntegralByConstantImpl<Int64, Int32> {};
+template <> struct BinaryOperationImpl<Int64, Int64, 	DivideIntegralImpl<Int64, Int64>> 	: DivideIntegralByConstantImpl<Int64, Int64> {};
+
+template <> struct BinaryOperationImpl<Int32, Int8, 	DivideIntegralImpl<Int32, Int8>> 	: DivideIntegralByConstantImpl<Int32, Int8> {};
+template <> struct BinaryOperationImpl<Int32, Int16, 	DivideIntegralImpl<Int32, Int16>> 	: DivideIntegralByConstantImpl<Int32, Int16> {};
+template <> struct BinaryOperationImpl<Int32, Int32, 	DivideIntegralImpl<Int32, Int32>> 	: DivideIntegralByConstantImpl<Int32, Int32> {};
+template <> struct BinaryOperationImpl<Int32, Int64, 	DivideIntegralImpl<Int32, Int64>> 	: DivideIntegralByConstantImpl<Int32, Int64> {};
+
+
+template <> struct BinaryOperationImpl<UInt64, UInt8, 	ModuloImpl<UInt64, UInt8>> 	: ModuloByConstantImpl<UInt64, UInt8> {};
+template <> struct BinaryOperationImpl<UInt64, UInt16,	ModuloImpl<UInt64, UInt16>> : ModuloByConstantImpl<UInt64, UInt16> {};
+template <> struct BinaryOperationImpl<UInt64, UInt32, 	ModuloImpl<UInt64, UInt32>> : ModuloByConstantImpl<UInt64, UInt32> {};
+template <> struct BinaryOperationImpl<UInt64, UInt64, 	ModuloImpl<UInt64, UInt64>> : ModuloByConstantImpl<UInt64, UInt64> {};
+
+template <> struct BinaryOperationImpl<UInt32, UInt8, 	ModuloImpl<UInt32, UInt8>> 	: ModuloByConstantImpl<UInt32, UInt8> {};
+template <> struct BinaryOperationImpl<UInt32, UInt16, 	ModuloImpl<UInt32, UInt16>> : ModuloByConstantImpl<UInt32, UInt16> {};
+template <> struct BinaryOperationImpl<UInt32, UInt32, 	ModuloImpl<UInt32, UInt32>> : ModuloByConstantImpl<UInt32, UInt32> {};
+template <> struct BinaryOperationImpl<UInt32, UInt64, 	ModuloImpl<UInt32, UInt64>> : ModuloByConstantImpl<UInt32, UInt64> {};
+
+template <> struct BinaryOperationImpl<Int64, Int8, 	ModuloImpl<Int64, Int8>> 	: ModuloByConstantImpl<Int64, Int8> {};
+template <> struct BinaryOperationImpl<Int64, Int16, 	ModuloImpl<Int64, Int16>> 	: ModuloByConstantImpl<Int64, Int16> {};
+template <> struct BinaryOperationImpl<Int64, Int32, 	ModuloImpl<Int64, Int32>> 	: ModuloByConstantImpl<Int64, Int32> {};
+template <> struct BinaryOperationImpl<Int64, Int64, 	ModuloImpl<Int64, Int64>> 	: ModuloByConstantImpl<Int64, Int64> {};
+
+template <> struct BinaryOperationImpl<Int32, Int8, 	ModuloImpl<Int32, Int8>> 	: ModuloByConstantImpl<Int32, Int8> {};
+template <> struct BinaryOperationImpl<Int32, Int16, 	ModuloImpl<Int32, Int16>> 	: ModuloByConstantImpl<Int32, Int16> {};
+template <> struct BinaryOperationImpl<Int32, Int32, 	ModuloImpl<Int32, Int32>> 	: ModuloByConstantImpl<Int32, Int32> {};
+template <> struct BinaryOperationImpl<Int32, Int64, 	ModuloImpl<Int32, Int64>> 	: ModuloByConstantImpl<Int32, Int64> {};
+
 }
diff --git a/dbms/include/DB/Functions/FunctionsCoding.h b/dbms/include/DB/Functions/FunctionsCoding.h
index 05494c80bab..168f8a10a18 100644
--- a/dbms/include/DB/Functions/FunctionsCoding.h
+++ b/dbms/include/DB/Functions/FunctionsCoding.h
@@ -4,10 +4,12 @@
 #include <DB/DataTypes/DataTypesNumberFixed.h>
 #include <DB/DataTypes/DataTypeString.h>
 #include <DB/DataTypes/DataTypeFixedString.h>
+#include <DB/DataTypes/DataTypeArray.h>
 #include <DB/DataTypes/DataTypeDate.h>
 #include <DB/DataTypes/DataTypeDateTime.h>
 #include <DB/Columns/ColumnString.h>
 #include <DB/Columns/ColumnFixedString.h>
+#include <DB/Columns/ColumnArray.h>
 #include <DB/Columns/ColumnConst.h>
 #include <DB/Functions/IFunction.h>
 
@@ -375,7 +377,7 @@ public:
 				prev_offset = new_offset;
 			}
 
-			if (out_offsets.back() != out_vec.size())
+			if (!out_offsets.empty() && out_offsets.back() != out_vec.size())
 				throw Exception("Column size mismatch (internal logical error)", ErrorCodes::LOGICAL_ERROR);
 
 			return true;
@@ -436,7 +438,7 @@ public:
 				prev_offset = new_offset;
 			}
 
-			if (out_offsets.back() != out_vec.size())
+			if (!out_offsets.empty() && out_offsets.back() != out_vec.size())
 				throw Exception("Column size mismatch (internal logical error)", ErrorCodes::LOGICAL_ERROR);
 
 			return true;
@@ -742,7 +744,7 @@ public:
 			}
 			out_vec.resize(pos - begin);
 
-			if (out_offsets.back() != out_vec.size())
+			if (!out_offsets.empty() && out_offsets.back() != out_vec.size())
 				throw Exception("Column size mismatch (internal logical error)", ErrorCodes::LOGICAL_ERROR);
 
 			return true;
@@ -797,7 +799,7 @@ public:
 			}
 			out_vec.resize(pos - begin);
 
-			if (out_offsets.back() != out_vec.size())
+			if (!out_offsets.empty() && out_offsets.back() != out_vec.size())
 				throw Exception("Column size mismatch (internal logical error)", ErrorCodes::LOGICAL_ERROR);
 
 			return true;
diff --git a/dbms/include/DB/Functions/FunctionsComparison.h b/dbms/include/DB/Functions/FunctionsComparison.h
index 52fac72f64c..adeee4a6d17 100644
--- a/dbms/include/DB/Functions/FunctionsComparison.h
+++ b/dbms/include/DB/Functions/FunctionsComparison.h
@@ -34,37 +34,81 @@ namespace DB
 #pragma GCC diagnostic push
 #pragma GCC diagnostic ignored "-Wsign-compare"
 
-template<typename A, typename B>
-struct EqualsNumImpl
+template <typename A, typename B> struct EqualsOp 			{ static UInt8 apply(A a, B b) { return a == b; } };
+template <typename A, typename B> struct NotEqualsOp 		{ static UInt8 apply(A a, B b) { return a != b; } };
+template <typename A, typename B> struct LessOp 			{ static UInt8 apply(A a, B b) { return a < b; 	} };
+template <typename A, typename B> struct GreaterOp 			{ static UInt8 apply(A a, B b) { return a > b; 	} };
+template <typename A, typename B> struct LessOrEqualsOp 	{ static UInt8 apply(A a, B b) { return a <= b; } };
+template <typename A, typename B> struct GreaterOrEqualsOp 	{ static UInt8 apply(A a, B b) { return a >= b; } };
+
+#pragma GCC diagnostic pop
+
+
+
+template<typename A, typename B, typename Op>
+struct NumComparisonImpl
 {
 	static void vector_vector(const PODArray<A> & a, const PODArray<B> & b, PODArray<UInt8> & c)
 	{
+		/** GCC 4.8.2 векторизует цикл только если его записать в такой форме.
+		  * В данном случае, если сделать цикл по индексу массива (код будет выглядеть проще),
+		  *  цикл не будет векторизовываться.
+		  */
+
 		size_t size = a.size();
-		for (size_t i = 0; i < size; ++i)
-			c[i] = a[i] == b[i];
+		const A * a_pos = &a[0];
+		const B * b_pos = &b[0];
+		UInt8 * c_pos = &c[0];
+		const A * a_end = a_pos + size;
+
+		while (a_pos < a_end)
+		{
+			*c_pos = Op::apply(*a_pos, *b_pos);
+			++a_pos;
+			++b_pos;
+			++c_pos;
+		}
 	}
 
 	static void vector_constant(const PODArray<A> & a, B b, PODArray<UInt8> & c)
 	{
 		size_t size = a.size();
-		for (size_t i = 0; i < size; ++i)
-			c[i] = a[i] == b;
+		const A * a_pos = &a[0];
+		UInt8 * c_pos = &c[0];
+		const A * a_end = a_pos + size;
+
+		while (a_pos < a_end)
+		{
+			*c_pos = Op::apply(*a_pos, b);
+			++a_pos;
+			++c_pos;
+		}
 	}
 
 	static void constant_vector(A a, const PODArray<B> & b, PODArray<UInt8> & c)
 	{
 		size_t size = b.size();
-		for (size_t i = 0; i < size; ++i)
-			c[i] = a == b[i];
+		const B * b_pos = &b[0];
+		UInt8 * c_pos = &c[0];
+		const B * b_end = b_pos + size;
+
+		while (b_pos < b_end)
+		{
+			*c_pos = Op::apply(a, *b_pos);
+			++b_pos;
+			++c_pos;
+		}
 	}
 
 	static void constant_constant(A a, B b, UInt8 & c)
 	{
-		c = a == b;
+		c = Op::apply(a, b);
 	}
 };
 
-struct EqualsStringImpl
+
+template <typename Op>
+struct StringComparisonImpl
 {
 	static void string_vector_string_vector(
 		const ColumnString::Chars_t & a_data, const ColumnString::Offsets_t & a_offsets,
@@ -73,10 +117,18 @@ struct EqualsStringImpl
 	{
 		size_t size = a_offsets.size();
 		for (size_t i = 0; i < size; ++i)
-			c[i] = (i == 0)
-				? (a_offsets[0] == b_offsets[0] && !memcmp(&a_data[0], &b_data[0], a_offsets[0] - 1))
-				: (a_offsets[i] - a_offsets[i - 1] == b_offsets[i] - b_offsets[i - 1]
-					&& !memcmp(&a_data[a_offsets[i - 1]], &b_data[b_offsets[i - 1]], a_offsets[i] - a_offsets[i - 1] - 1));
+		{
+			if (i == 0)
+			{
+				/// Завершающий ноль в меньшей по длине строке входит в сравнение.
+				c[i] = Op::apply(memcmp(&a_data[0], &b_data[0], std::min(a_offsets[0], b_offsets[0])), 0);
+			}
+			else
+			{
+				c[i] = Op::apply(memcmp(&a_data[a_offsets[i - 1]], &b_data[b_offsets[i - 1]],
+					std::min(a_offsets[i] - a_offsets[i - 1], b_offsets[i] - b_offsets[i - 1])), 0);
+			}
+		}
 	}
 
 	static void string_vector_fixed_string_vector(
@@ -86,10 +138,19 @@ struct EqualsStringImpl
 	{
 		size_t size = a_offsets.size();
 		for (size_t i = 0; i < size; ++i)
-			c[i] = (i == 0)
-				? (a_offsets[0] == b_n + 1 && !memcmp(&a_data[0], &b_data[0], b_n))
-				: (a_offsets[i] - a_offsets[i - 1] == b_n + 1
-					&& !memcmp(&a_data[a_offsets[i - 1]], &b_data[b_n * i], b_n));
+		{
+			if (i == 0)
+			{
+				int res = memcmp(&a_data[0], &b_data[0], std::min(a_offsets[0] - 1, b_n));
+				c[i] = Op::apply(res, 0) || (res == 0 && Op::apply(a_offsets[0], b_n + 1));
+			}
+			else
+			{
+				int res = memcmp(&a_data[a_offsets[i - 1]], &b_data[i * b_n],
+					std::min(a_offsets[i] - a_offsets[i - 1] - 1, b_n));
+				c[i] = Op::apply(res, 0) || (res == 0 && Op::apply(a_offsets[i] - a_offsets[i - 1], b_n + 1));
+			}
+		}
 	}
 
 	static void string_vector_constant(
@@ -101,10 +162,17 @@ struct EqualsStringImpl
 		ColumnString::Offset_t b_n = b.size();
 		const UInt8 * b_data = reinterpret_cast<const UInt8 *>(b.data());
 		for (size_t i = 0; i < size; ++i)
-			c[i] = (i == 0)
-				? (a_offsets[0] == b_n + 1 && !memcmp(&a_data[0], b_data, b_n))
-				: (a_offsets[i] - a_offsets[i - 1] == b_n + 1
-					&& !memcmp(&a_data[a_offsets[i - 1]], b_data, b_n));
+		{
+			if (i == 0)
+			{
+				c[i] = Op::apply(memcmp(&a_data[0], b_data, std::min(a_offsets[0], b_n + 1)), 0);
+			}
+			else
+			{
+				c[i] = Op::apply(memcmp(&a_data[a_offsets[i - 1]], b_data,
+					std::min(a_offsets[i] - a_offsets[i - 1], b_n + 1)), 0);
+			}
+		}
 	}
 
 	static void fixed_string_vector_string_vector(
@@ -114,10 +182,19 @@ struct EqualsStringImpl
 	{
 		size_t size = b_offsets.size();
 		for (size_t i = 0; i < size; ++i)
-			c[i] = (i == 0)
-				? (b_offsets[0] == a_n + 1 && !memcmp(&b_data[0], &a_data[0], a_n))
-				: (b_offsets[i] - b_offsets[i - 1] == a_n + 1
-					&& !memcmp(&b_data[b_offsets[i - 1]], &a_data[a_n * i], a_n));
+		{
+			if (i == 0)
+			{
+				int res = memcmp(&a_data[0], &b_data[0], std::min(b_offsets[0] - 1, a_n));
+				c[i] = Op::apply(res, 0) || (res == 0 && Op::apply(a_n + 1, b_offsets[0]));
+			}
+			else
+			{
+				int res = memcmp(&a_data[i * a_n], &b_data[b_offsets[i - 1]],
+					std::min(b_offsets[i] - b_offsets[i - 1] - 1, a_n));
+				c[i] = Op::apply(res, 0) || (res == 0 && Op::apply(a_n + 1, b_offsets[i] - b_offsets[i - 1]));
+			}
+		}
 	}
 
 	static void fixed_string_vector_fixed_string_vector(
@@ -127,7 +204,10 @@ struct EqualsStringImpl
 	{
 		size_t size = a_data.size();
 		for (size_t i = 0, j = 0; i < size; i += a_n, ++j)
-			c[j] = a_n == b_n && !memcmp(&a_data[i], &b_data[i], a_n);
+		{
+			int res = memcmp(&a_data[i], &b_data[i], std::min(a_n, b_n));
+			c[j] = Op::apply(res, 0) || (res == 0 && Op::apply(a_n, b_n));
+		}
 	}
 
 	static void fixed_string_vector_constant(
@@ -139,7 +219,10 @@ struct EqualsStringImpl
 		const UInt8 * b_data = reinterpret_cast<const UInt8 *>(b.data());
 		ColumnString::Offset_t b_n = b.size();
 		for (size_t i = 0, j = 0; i < size; i += a_n, ++j)
-			c[j] = a_n == b_n && !memcmp(&a_data[i], b_data, a_n);
+		{
+			int res = memcmp(&a_data[i], b_data, std::min(a_n, b_n));
+			c[j] = Op::apply(res, 0) || (res == 0 && Op::apply(a_n, b_n));
+		}
 	}
 
 	static void constant_string_vector(
@@ -151,10 +234,17 @@ struct EqualsStringImpl
 		ColumnString::Offset_t a_n = a.size();
 		const UInt8 * a_data = reinterpret_cast<const UInt8 *>(a.data());
 		for (size_t i = 0; i < size; ++i)
-			c[i] = (i == 0)
-				? (b_offsets[0] == a_n + 1 && !memcmp(&b_data[0], a_data, a_n))
-				: (b_offsets[i] - b_offsets[i - 1] == a_n + 1
-					&& !memcmp(&b_data[b_offsets[i - 1]], a_data, a_n));
+		{
+			if (i == 0)
+			{
+				c[i] = Op::apply(memcmp(a_data, &b_data[0], std::min(b_offsets[0], a_n + 1)), 0);
+			}
+			else
+			{
+				c[i] = Op::apply(memcmp(a_data, &b_data[b_offsets[i - 1]],
+					std::min(b_offsets[i] - b_offsets[i - 1], a_n + 1)), 0);
+			}
+		}
 	}
 
 	static void constant_fixed_string_vector(
@@ -166,7 +256,10 @@ struct EqualsStringImpl
 		const UInt8 * a_data = reinterpret_cast<const UInt8 *>(a.data());
 		ColumnString::Offset_t a_n = a.size();
 		for (size_t i = 0, j = 0; i < size; i += b_n, ++j)
-			c[j] = a_n == b_n && !memcmp(&b_data[i], a_data, b_n);
+		{
+			int res = memcmp(a_data, &b_data[i], std::min(a_n, b_n));
+			c[j] = Op::apply(res, 0) || (res == 0 && Op::apply(b_n, a_n));
+		}
 	}
 
 	static void constant_constant(
@@ -174,41 +267,14 @@ struct EqualsStringImpl
 		const std::string & b,
 		UInt8 & c)
 	{
-		c = a == b;
+		c = Op::apply(memcmp(a.data(), b.data(), std::min(a.size(), b.size()) + 1), 0);
 	}
 };
 
-template<typename A, typename B>
-struct NotEqualsNumImpl
-{
-	static void vector_vector(const PODArray<A> & a, const PODArray<B> & b, PODArray<UInt8> & c)
-	{
-		size_t size = a.size();
-		for (size_t i = 0; i < size; ++i)
-			c[i] = a[i] != b[i];
-	}
 
-	static void vector_constant(const PODArray<A> & a, B b, PODArray<UInt8> & c)
-	{
-		size_t size = a.size();
-		for (size_t i = 0; i < size; ++i)
-			c[i] = a[i] != b;
-	}
-
-	static void constant_vector(A a, const PODArray<B> & b, PODArray<UInt8> & c)
-	{
-		size_t size = b.size();
-		for (size_t i = 0; i < size; ++i)
-			c[i] = a != b[i];
-	}
-
-	static void constant_constant(A a, B b, UInt8 & c)
-	{
-		c = a != b;
-	}
-};
-
-struct NotEqualsStringImpl
+/// Сравнения на равенство/неравенство реализованы несколько более эффективно.
+template <bool positive>
+struct StringEqualsImpl
 {
 	static void string_vector_string_vector(
 		const ColumnString::Chars_t & a_data, const ColumnString::Offsets_t & a_offsets,
@@ -217,7 +283,7 @@ struct NotEqualsStringImpl
 	{
 		size_t size = a_offsets.size();
 		for (size_t i = 0; i < size; ++i)
-			c[i] = !((i == 0)
+			c[i] = positive == ((i == 0)
 				? (a_offsets[0] == b_offsets[0] && !memcmp(&a_data[0], &b_data[0], a_offsets[0] - 1))
 				: (a_offsets[i] - a_offsets[i - 1] == b_offsets[i] - b_offsets[i - 1]
 					&& !memcmp(&a_data[a_offsets[i - 1]], &b_data[b_offsets[i - 1]], a_offsets[i] - a_offsets[i - 1] - 1)));
@@ -230,7 +296,7 @@ struct NotEqualsStringImpl
 	{
 		size_t size = a_offsets.size();
 		for (size_t i = 0; i < size; ++i)
-			c[i] = !((i == 0)
+			c[i] = positive == ((i == 0)
 				? (a_offsets[0] == b_n + 1 && !memcmp(&a_data[0], &b_data[0], b_n))
 				: (a_offsets[i] - a_offsets[i - 1] == b_n + 1
 					&& !memcmp(&a_data[a_offsets[i - 1]], &b_data[b_n * i], b_n)));
@@ -245,25 +311,12 @@ struct NotEqualsStringImpl
 		ColumnString::Offset_t b_n = b.size();
 		const UInt8 * b_data = reinterpret_cast<const UInt8 *>(b.data());
 		for (size_t i = 0; i < size; ++i)
-			c[i] = !((i == 0)
+			c[i] = positive == ((i == 0)
 				? (a_offsets[0] == b_n + 1 && !memcmp(&a_data[0], b_data, b_n))
 				: (a_offsets[i] - a_offsets[i - 1] == b_n + 1
 					&& !memcmp(&a_data[a_offsets[i - 1]], b_data, b_n)));
 	}
 
-	static void fixed_string_vector_string_vector(
-		const ColumnString::Chars_t & a_data, ColumnString::Offset_t a_n,
-		const ColumnString::Chars_t & b_data, const ColumnString::Offsets_t & b_offsets,
-		PODArray<UInt8> & c)
-	{
-		size_t size = b_offsets.size();
-		for (size_t i = 0; i < size; ++i)
-			c[i] = !((i == 0)
-				? (b_offsets[0] == a_n + 1 && !memcmp(&b_data[0], &a_data[0], a_n))
-				: (b_offsets[i] - b_offsets[i - 1] == a_n + 1
-					&& !memcmp(&b_data[b_offsets[i - 1]], &a_data[a_n * i], a_n)));
-	}
-
 	static void fixed_string_vector_fixed_string_vector(
 		const ColumnString::Chars_t & a_data, ColumnString::Offset_t a_n,
 		const ColumnString::Chars_t & b_data, ColumnString::Offset_t b_n,
@@ -271,7 +324,7 @@ struct NotEqualsStringImpl
 	{
 		size_t size = a_data.size();
 		for (size_t i = 0, j = 0; i < size; i += a_n, ++j)
-			c[j] = !(a_n == b_n && !memcmp(&a_data[i], &b_data[i], a_n));
+			c[j] = positive == (a_n == b_n && !memcmp(&a_data[i], &b_data[i], a_n));
 	}
 
 	static void fixed_string_vector_constant(
@@ -283,34 +336,7 @@ struct NotEqualsStringImpl
 		const UInt8 * b_data = reinterpret_cast<const UInt8 *>(b.data());
 		ColumnString::Offset_t b_n = b.size();
 		for (size_t i = 0, j = 0; i < size; i += a_n, ++j)
-			c[j] = !(a_n == b_n && !memcmp(&a_data[i], b_data, a_n));
-	}
-
-	static void constant_string_vector(
-		const std::string & a,
-		const ColumnString::Chars_t & b_data, const ColumnString::Offsets_t & b_offsets,
-		PODArray<UInt8> & c)
-	{
-		size_t size = b_offsets.size();
-		ColumnString::Offset_t a_n = a.size();
-		const UInt8 * a_data = reinterpret_cast<const UInt8 *>(a.data());
-		for (size_t i = 0; i < size; ++i)
-			c[i] = !((i == 0)
-				? (b_offsets[0] == a_n + 1 && !memcmp(&b_data[0], a_data, a_n))
-				: (b_offsets[i] - b_offsets[i - 1] == a_n + 1
-					&& !memcmp(&b_data[b_offsets[i - 1]], a_data, a_n)));
-	}
-
-	static void constant_fixed_string_vector(
-		const std::string & a,
-		const ColumnString::Chars_t & b_data, ColumnString::Offset_t b_n,
-		PODArray<UInt8> & c)
-	{
-		size_t size = b_data.size();
-		const UInt8 * a_data = reinterpret_cast<const UInt8 *>(a.data());
-		ColumnString::Offset_t a_n = a.size();
-		for (size_t i = 0, j = 0; i < size; i += b_n, ++j)
-			c[j] = !(a_n == b_n && !memcmp(&b_data[i], a_data, b_n));
+			c[j] = positive == (a_n == b_n && !memcmp(&a_data[i], b_data, a_n));
 	}
 
 	static void constant_constant(
@@ -318,108 +344,7 @@ struct NotEqualsStringImpl
 		const std::string & b,
 		UInt8 & c)
 	{
-		c = !(a == b);
-	}
-};
-
-template<typename A, typename B>
-struct LessNumImpl
-{
-	static void vector_vector(const PODArray<A> & a, const PODArray<B> & b, PODArray<UInt8> & c)
-	{
-		size_t size = a.size();
-		for (size_t i = 0; i < size; ++i)
-			c[i] = a[i] < b[i];
-	}
-
-	static void vector_constant(const PODArray<A> & a, B b, PODArray<UInt8> & c)
-	{
-		size_t size = a.size();
-		for (size_t i = 0; i < size; ++i)
-			c[i] = a[i] < b;
-	}
-
-	static void constant_vector(A a, const PODArray<B> & b, PODArray<UInt8> & c)
-	{
-		size_t size = b.size();
-		for (size_t i = 0; i < size; ++i)
-			c[i] = a < b[i];
-	}
-
-	static void constant_constant(A a, B b, UInt8 & c)
-	{
-		c = a < b;
-	}
-};
-
-struct LessStringImpl
-{
-	static void string_vector_string_vector(
-		const ColumnString::Chars_t & a_data, const ColumnString::Offsets_t & a_offsets,
-		const ColumnString::Chars_t & b_data, const ColumnString::Offsets_t & b_offsets,
-		PODArray<UInt8> & c)
-	{
-		size_t size = a_offsets.size();
-		for (size_t i = 0; i < size; ++i)
-		{
-			if (i == 0)
-			{
-				int res = memcmp(&a_data[0], &b_data[0], std::min(a_offsets[0], b_offsets[0]) - 1);
-				c[i] = res < 0 || (res == 0 && a_offsets[0] < b_offsets[0]);
-			}
-			else
-			{
-				int res = memcmp(&a_data[a_offsets[i - 1]], &b_data[b_offsets[i - 1]],
-					std::min(a_offsets[i] - a_offsets[i - 1], b_offsets[i] - b_offsets[i - 1]) - 1);
-				c[i] = res < 0 || (res == 0 && a_offsets[i] - a_offsets[i - 1] < b_offsets[i] - b_offsets[i - 1]);
-			}
-		}
-	}
-
-	static void string_vector_fixed_string_vector(
-		const ColumnString::Chars_t & a_data, const ColumnString::Offsets_t & a_offsets,
-		const ColumnString::Chars_t & b_data, ColumnString::Offset_t b_n,
-		PODArray<UInt8> & c)
-	{
-		size_t size = a_offsets.size();
-		for (size_t i = 0; i < size; ++i)
-		{
-			if (i == 0)
-			{
-				int res = memcmp(&a_data[0], &b_data[0], std::min(a_offsets[0] - 1, b_n));
-				c[i] = res < 0 || (res == 0 && a_offsets[0] < b_n + 1);
-			}
-			else
-			{
-				int res = memcmp(&a_data[a_offsets[i - 1]], &b_data[i * b_n],
-					std::min(a_offsets[i] - a_offsets[i - 1] - 1, b_n));
-				c[i] = res < 0 || (res == 0 && a_offsets[i] - a_offsets[i - 1] < b_n + 1);
-			}
-		}
-	}
-
-	static void string_vector_constant(
-		const ColumnString::Chars_t & a_data, const ColumnString::Offsets_t & a_offsets,
-		const std::string & b,
-		PODArray<UInt8> & c)
-	{
-		size_t size = a_offsets.size();
-		ColumnString::Offset_t b_n = b.size();
-		const UInt8 * b_data = reinterpret_cast<const UInt8 *>(b.data());
-		for (size_t i = 0; i < size; ++i)
-		{
-			if (i == 0)
-			{
-				int res = memcmp(&a_data[0], b_data, std::min(a_offsets[0] - 1, b_n));
-				c[i] = res < 0 || (res == 0 && a_offsets[0] < b_n + 1);
-			}
-			else
-			{
-				int res = memcmp(&a_data[a_offsets[i - 1]], b_data,
-					std::min(a_offsets[i] - a_offsets[i - 1] - 1, b_n));
-				c[i] = res < 0 || (res == 0 && a_offsets[i] - a_offsets[i - 1] < b_n + 1);
-			}
-		}
+		c = positive == (a == b);
 	}
 
 	static void fixed_string_vector_string_vector(
@@ -427,49 +352,7 @@ struct LessStringImpl
 		const ColumnString::Chars_t & b_data, const ColumnString::Offsets_t & b_offsets,
 		PODArray<UInt8> & c)
 	{
-		size_t size = b_offsets.size();
-		for (size_t i = 0; i < size; ++i)
-		{
-			if (i == 0)
-			{
-				int res = memcmp(&a_data[0], &b_data[0], std::min(b_offsets[0] - 1, a_n));
-				c[i] = res < 0 || (res == 0 && a_n + 1 < b_offsets[0]);
-			}
-			else
-			{
-				int res = memcmp(&a_data[i * a_n], &b_data[b_offsets[i - 1]],
-					std::min(b_offsets[i] - b_offsets[i - 1] - 1, a_n));
-				c[i] = res < 0 || (res == 0 && a_n + 1 < b_offsets[i] - b_offsets[i - 1]);
-			}
-		}
-	}
-
-	static void fixed_string_vector_fixed_string_vector(
-		const ColumnString::Chars_t & a_data, ColumnString::Offset_t a_n,
-		const ColumnString::Chars_t & b_data, ColumnString::Offset_t b_n,
-		PODArray<UInt8> & c)
-	{
-		size_t size = a_data.size();
-		for (size_t i = 0, j = 0; i < size; i += a_n, ++j)
-		{
-			int res = memcmp(&a_data[i], &b_data[i], std::min(a_n, b_n));
-			c[j] = res < 0 || (res == 0 && a_n < b_n);
-		}
-	}
-
-	static void fixed_string_vector_constant(
-		const ColumnString::Chars_t & a_data, ColumnString::Offset_t a_n,
-		const std::string & b,
-		PODArray<UInt8> & c)
-	{
-		size_t size = a_data.size();
-		const UInt8 * b_data = reinterpret_cast<const UInt8 *>(b.data());
-		ColumnString::Offset_t b_n = b.size();
-		for (size_t i = 0, j = 0; i < size; i += a_n, ++j)
-		{
-			int res = memcmp(&a_data[i], b_data, std::min(a_n, b_n));
-			c[j] = res < 0 || (res == 0 && a_n < b_n);
-		}
+		string_vector_fixed_string_vector(b_data, b_offsets, a_data, a_n, c);
 	}
 
 	static void constant_string_vector(
@@ -477,23 +360,7 @@ struct LessStringImpl
 		const ColumnString::Chars_t & b_data, const ColumnString::Offsets_t & b_offsets,
 		PODArray<UInt8> & c)
 	{
-		size_t size = b_offsets.size();
-		ColumnString::Offset_t a_n = a.size();
-		const UInt8 * a_data = reinterpret_cast<const UInt8 *>(a.data());
-		for (size_t i = 0; i < size; ++i)
-		{
-			if (i == 0)
-			{
-				int res = memcmp(a_data, &b_data[0], std::min(b_offsets[0] - 1, a_n));
-				c[i] = res < 0 || (res == 0 && a_n + 1 < b_offsets[0]);
-			}
-			else
-			{
-				int res = memcmp(a_data, &b_data[b_offsets[i - 1]],
-					std::min(b_offsets[i] - b_offsets[i - 1] - 1, a_n));
-				c[i] = res < 0 || (res == 0 && a_n + 1 < b_offsets[i] - b_offsets[i - 1]);
-			}
-		}
+		string_vector_constant(b_data, b_offsets, a, c);
 	}
 
 	static void constant_fixed_string_vector(
@@ -501,626 +368,20 @@ struct LessStringImpl
 		const ColumnString::Chars_t & b_data, ColumnString::Offset_t b_n,
 		PODArray<UInt8> & c)
 	{
-		size_t size = b_data.size();
-		const UInt8 * a_data = reinterpret_cast<const UInt8 *>(a.data());
-		ColumnString::Offset_t a_n = a.size();
-		for (size_t i = 0, j = 0; i < size; i += b_n, ++j)
-		{
-			int res = memcmp(a_data, &b_data[i], std::min(a_n, b_n));
-			c[j] = res < 0 || (res == 0 && b_n < a_n);
-		}
-	}
-
-	static void constant_constant(
-		const std::string & a,
-		const std::string & b,
-		UInt8 & c)
-	{
-		c = a < b;
-	}
-};
-
-template<typename A, typename B>
-struct GreaterNumImpl
-{
-	static void vector_vector(const PODArray<A> & a, const PODArray<B> & b, PODArray<UInt8> & c)
-	{
-		size_t size = a.size();
-		for (size_t i = 0; i < size; ++i)
-			c[i] = a[i] > b[i];
-	}
-
-	static void vector_constant(const PODArray<A> & a, B b, PODArray<UInt8> & c)
-	{
-		size_t size = a.size();
-		for (size_t i = 0; i < size; ++i)
-			c[i] = a[i] > b;
-	}
-
-	static void constant_vector(A a, const PODArray<B> & b, PODArray<UInt8> & c)
-	{
-		size_t size = b.size();
-		for (size_t i = 0; i < size; ++i)
-			c[i] = a > b[i];
-	}
-
-	static void constant_constant(A a, B b, UInt8 & c)
-	{
-		c = a > b;
-	}
-};
-
-struct GreaterStringImpl
-{
-	static void string_vector_string_vector(
-		const ColumnString::Chars_t & a_data, const ColumnString::Offsets_t & a_offsets,
-		const ColumnString::Chars_t & b_data, const ColumnString::Offsets_t & b_offsets,
-		PODArray<UInt8> & c)
-	{
-		size_t size = a_offsets.size();
-		for (size_t i = 0; i < size; ++i)
-		{
-			if (i == 0)
-			{
-				int res = memcmp(&a_data[0], &b_data[0], std::min(a_offsets[0], b_offsets[0]) - 1);
-				c[i] = res > 0 || (res == 0 && a_offsets[0] > b_offsets[0]);
-			}
-			else
-			{
-				int res = memcmp(&a_data[a_offsets[i - 1]], &b_data[b_offsets[i - 1]],
-					std::min(a_offsets[i] - a_offsets[i - 1], b_offsets[i] - b_offsets[i - 1]) - 1);
-				c[i] = res > 0 || (res == 0 && a_offsets[i] - a_offsets[i - 1] > b_offsets[i] - b_offsets[i - 1]);
-			}
-		}
-	}
-
-	static void string_vector_fixed_string_vector(
-		const ColumnString::Chars_t & a_data, const ColumnString::Offsets_t & a_offsets,
-		const ColumnString::Chars_t & b_data, ColumnString::Offset_t b_n,
-		PODArray<UInt8> & c)
-	{
-		size_t size = a_offsets.size();
-		for (size_t i = 0; i < size; ++i)
-		{
-			if (i == 0)
-			{
-				int res = memcmp(&a_data[0], &b_data[0], std::min(a_offsets[0] - 1, b_n));
-				c[i] = res > 0 || (res == 0 && a_offsets[0] > b_n + 1);
-			}
-			else
-			{
-				int res = memcmp(&a_data[a_offsets[i - 1]], &b_data[i * b_n],
-					std::min(a_offsets[i] - a_offsets[i - 1] - 1, b_n));
-				c[i] = res > 0 || (res == 0 && a_offsets[i] - a_offsets[i - 1] > b_n + 1);
-			}
-		}
-	}
-
-	static void string_vector_constant(
-		const ColumnString::Chars_t & a_data, const ColumnString::Offsets_t & a_offsets,
-		const std::string & b,
-		PODArray<UInt8> & c)
-	{
-		size_t size = a_offsets.size();
-		ColumnString::Offset_t b_n = b.size();
-		const UInt8 * b_data = reinterpret_cast<const UInt8 *>(b.data());
-		for (size_t i = 0; i < size; ++i)
-		{
-			if (i == 0)
-			{
-				int res = memcmp(&a_data[0], b_data, std::min(a_offsets[0] - 1, b_n));
-				c[i] = res > 0 || (res == 0 && a_offsets[0] > b_n + 1);
-			}
-			else
-			{
-				int res = memcmp(&a_data[a_offsets[i - 1]], b_data,
-					std::min(a_offsets[i] - a_offsets[i - 1] - 1, b_n));
-				c[i] = res > 0 || (res == 0 && a_offsets[i] - a_offsets[i - 1] > b_n + 1);
-			}
-		}
-	}
-
-	static void fixed_string_vector_string_vector(
-		const ColumnString::Chars_t & a_data, ColumnString::Offset_t a_n,
-		const ColumnString::Chars_t & b_data, const ColumnString::Offsets_t & b_offsets,
-		PODArray<UInt8> & c)
-	{
-		size_t size = b_offsets.size();
-		for (size_t i = 0; i < size; ++i)
-		{
-			if (i == 0)
-			{
-				int res = memcmp(&a_data[0], &b_data[0], std::min(b_offsets[0] - 1, a_n));
-				c[i] = res > 0 || (res == 0 && a_n + 1 > b_offsets[0]);
-			}
-			else
-			{
-				int res = memcmp(&a_data[i * a_n], &b_data[b_offsets[i - 1]],
-					std::min(b_offsets[i] - b_offsets[i - 1] - 1, a_n));
-				c[i] = res > 0 || (res == 0 && a_n + 1 > b_offsets[i] - b_offsets[i - 1]);
-			}
-		}
-	}
-
-	static void fixed_string_vector_fixed_string_vector(
-		const ColumnString::Chars_t & a_data, ColumnString::Offset_t a_n,
-		const ColumnString::Chars_t & b_data, ColumnString::Offset_t b_n,
-		PODArray<UInt8> & c)
-	{
-		size_t size = a_data.size();
-		for (size_t i = 0, j = 0; i < size; i += a_n, ++j)
-		{
-			int res = memcmp(&a_data[i], &b_data[i], std::min(a_n, b_n));
-			c[j] = res > 0 || (res == 0 && a_n > b_n);
-		}
-	}
-
-	static void fixed_string_vector_constant(
-		const ColumnString::Chars_t & a_data, ColumnString::Offset_t a_n,
-		const std::string & b,
-		PODArray<UInt8> & c)
-	{
-		size_t size = a_data.size();
-		const UInt8 * b_data = reinterpret_cast<const UInt8 *>(b.data());
-		ColumnString::Offset_t b_n = b.size();
-		for (size_t i = 0, j = 0; i < size; i += a_n, ++j)
-		{
-			int res = memcmp(&a_data[i], b_data, std::min(a_n, b_n));
-			c[j] = res > 0 || (res == 0 && a_n > b_n);
-		}
-	}
-
-	static void constant_string_vector(
-		const std::string & a,
-		const ColumnString::Chars_t & b_data, const ColumnString::Offsets_t & b_offsets,
-		PODArray<UInt8> & c)
-	{
-		size_t size = b_offsets.size();
-		ColumnString::Offset_t a_n = a.size();
-		const UInt8 * a_data = reinterpret_cast<const UInt8 *>(a.data());
-		for (size_t i = 0; i < size; ++i)
-		{
-			if (i == 0)
-			{
-				int res = memcmp(a_data, &b_data[0], std::min(b_offsets[0] - 1, a_n));
-				c[i] = res > 0 || (res == 0 && a_n + 1 > b_offsets[0]);
-			}
-			else
-			{
-				int res = memcmp(a_data, &b_data[b_offsets[i - 1]],
-					std::min(b_offsets[i] - b_offsets[i - 1] - 1, a_n));
-				c[i] = res > 0 || (res == 0 && a_n + 1 > b_offsets[i] - b_offsets[i - 1]);
-			}
-		}
-	}
-
-	static void constant_fixed_string_vector(
-		const std::string & a,
-		const ColumnString::Chars_t & b_data, ColumnString::Offset_t b_n,
-		PODArray<UInt8> & c)
-	{
-		size_t size = b_data.size();
-		const UInt8 * a_data = reinterpret_cast<const UInt8 *>(a.data());
-		ColumnString::Offset_t a_n = a.size();
-		for (size_t i = 0, j = 0; i < size; i += b_n, ++j)
-		{
-			int res = memcmp(a_data, &b_data[i], std::min(a_n, b_n));
-			c[j] = res > 0 || (res == 0 && b_n > a_n);
-		}
-	}
-
-	static void constant_constant(
-		const std::string & a,
-		const std::string & b,
-		UInt8 & c)
-	{
-		c = a > b;
-	}
-};
-
-template<typename A, typename B>
-struct LessOrEqualsNumImpl
-{
-	static void vector_vector(const PODArray<A> & a, const PODArray<B> & b, PODArray<UInt8> & c)
-	{
-		size_t size = a.size();
-		for (size_t i = 0; i < size; ++i)
-			c[i] = a[i] <= b[i];
-	}
-
-	static void vector_constant(const PODArray<A> & a, B b, PODArray<UInt8> & c)
-	{
-		size_t size = a.size();
-		for (size_t i = 0; i < size; ++i)
-			c[i] = a[i] <= b;
-	}
-
-	static void constant_vector(A a, const PODArray<B> & b, PODArray<UInt8> & c)
-	{
-		size_t size = b.size();
-		for (size_t i = 0; i < size; ++i)
-			c[i] = a <= b[i];
-	}
-
-	static void constant_constant(A a, B b, UInt8 & c)
-	{
-		c = a <= b;
-	}
-};
-
-struct LessOrEqualsStringImpl
-{
-	static void string_vector_string_vector(
-		const ColumnString::Chars_t & a_data, const ColumnString::Offsets_t & a_offsets,
-		const ColumnString::Chars_t & b_data, const ColumnString::Offsets_t & b_offsets,
-		PODArray<UInt8> & c)
-	{
-		size_t size = a_offsets.size();
-		for (size_t i = 0; i < size; ++i)
-		{
-			if (i == 0)
-			{
-				int res = memcmp(&a_data[0], &b_data[0], std::min(a_offsets[0], b_offsets[0]) - 1);
-				c[i] = !(res > 0 || (res == 0 && a_offsets[0] > b_offsets[0]));
-			}
-			else
-			{
-				int res = memcmp(&a_data[a_offsets[i - 1]], &b_data[b_offsets[i - 1]],
-					std::min(a_offsets[i] - a_offsets[i - 1], b_offsets[i] - b_offsets[i - 1]) - 1);
-				c[i] = !(res > 0 || (res == 0 && a_offsets[i] - a_offsets[i - 1] > b_offsets[i] - b_offsets[i - 1]));
-			}
-		}
-	}
-
-	static void string_vector_fixed_string_vector(
-		const ColumnString::Chars_t & a_data, const ColumnString::Offsets_t & a_offsets,
-		const ColumnString::Chars_t & b_data, ColumnString::Offset_t b_n,
-		PODArray<UInt8> & c)
-	{
-		size_t size = a_offsets.size();
-		for (size_t i = 0; i < size; ++i)
-		{
-			if (i == 0)
-			{
-				int res = memcmp(&a_data[0], &b_data[0], std::min(a_offsets[0] - 1, b_n));
-				c[i] = !(res > 0 || (res == 0 && a_offsets[0] > b_n + 1));
-			}
-			else
-			{
-				int res = memcmp(&a_data[a_offsets[i - 1]], &b_data[i * b_n],
-					std::min(a_offsets[i] - a_offsets[i - 1] - 1, b_n));
-				c[i] = !(res > 0 || (res == 0 && a_offsets[i] - a_offsets[i - 1] > b_n + 1));
-			}
-		}
-	}
-
-	static void string_vector_constant(
-		const ColumnString::Chars_t & a_data, const ColumnString::Offsets_t & a_offsets,
-		const std::string & b,
-		PODArray<UInt8> & c)
-	{
-		size_t size = a_offsets.size();
-		ColumnString::Offset_t b_n = b.size();
-		const UInt8 * b_data = reinterpret_cast<const UInt8 *>(b.data());
-		for (size_t i = 0; i < size; ++i)
-		{
-			if (i == 0)
-			{
-				int res = memcmp(&a_data[0], b_data, std::min(a_offsets[0] - 1, b_n));
-				c[i] = !(res > 0 || (res == 0 && a_offsets[0] > b_n + 1));
-			}
-			else
-			{
-				int res = memcmp(&a_data[a_offsets[i - 1]], b_data,
-					std::min(a_offsets[i] - a_offsets[i - 1] - 1, b_n));
-				c[i] = !(res > 0 || (res == 0 && a_offsets[i] - a_offsets[i - 1] > b_n + 1));
-			}
-		}
-	}
-
-	static void fixed_string_vector_string_vector(
-		const ColumnString::Chars_t & a_data, ColumnString::Offset_t a_n,
-		const ColumnString::Chars_t & b_data, const ColumnString::Offsets_t & b_offsets,
-		PODArray<UInt8> & c)
-	{
-		size_t size = b_offsets.size();
-		for (size_t i = 0; i < size; ++i)
-		{
-			if (i == 0)
-			{
-				int res = memcmp(&a_data[0], &b_data[0], std::min(b_offsets[0] - 1, a_n));
-				c[i] = !(res > 0 || (res == 0 && a_n + 1 > b_offsets[0]));
-			}
-			else
-			{
-				int res = memcmp(&a_data[i * a_n], &b_data[b_offsets[i - 1]],
-					std::min(b_offsets[i] - b_offsets[i - 1] - 1, a_n));
-				c[i] = !(res > 0 || (res == 0 && a_n + 1 > b_offsets[i] - b_offsets[i - 1]));
-			}
-		}
-	}
-
-	static void fixed_string_vector_fixed_string_vector(
-		const ColumnString::Chars_t & a_data, ColumnString::Offset_t a_n,
-		const ColumnString::Chars_t & b_data, ColumnString::Offset_t b_n,
-		PODArray<UInt8> & c)
-	{
-		size_t size = a_data.size();
-		for (size_t i = 0, j = 0; i < size; i += a_n, ++j)
-		{
-			int res = memcmp(&a_data[i], &b_data[i], std::min(a_n, b_n));
-			c[j] = !(res > 0 || (res == 0 && a_n > b_n));
-		}
-	}
-
-	static void fixed_string_vector_constant(
-		const ColumnString::Chars_t & a_data, ColumnString::Offset_t a_n,
-		const std::string & b,
-		PODArray<UInt8> & c)
-	{
-		size_t size = a_data.size();
-		const UInt8 * b_data = reinterpret_cast<const UInt8 *>(b.data());
-		ColumnString::Offset_t b_n = b.size();
-		for (size_t i = 0, j = 0; i < size; i += a_n, ++j)
-		{
-			int res = memcmp(&a_data[i], b_data, std::min(a_n, b_n));
-			c[j] = !(res > 0 || (res == 0 && a_n > b_n));
-		}
-	}
-
-	static void constant_string_vector(
-		const std::string & a,
-		const ColumnString::Chars_t & b_data, const ColumnString::Offsets_t & b_offsets,
-		PODArray<UInt8> & c)
-	{
-		size_t size = b_offsets.size();
-		ColumnString::Offset_t a_n = a.size();
-		const UInt8 * a_data = reinterpret_cast<const UInt8 *>(a.data());
-		for (size_t i = 0; i < size; ++i)
-		{
-			if (i == 0)
-			{
-				int res = memcmp(a_data, &b_data[0], std::min(b_offsets[0] - 1, a_n));
-				c[i] = !(res > 0 || (res == 0 && a_n + 1 > b_offsets[0]));
-			}
-			else
-			{
-				int res = memcmp(a_data, &b_data[b_offsets[i - 1]],
-					std::min(b_offsets[i] - b_offsets[i - 1] - 1, a_n));
-				c[i] = !(res > 0 || (res == 0 && a_n + 1 > b_offsets[i] - b_offsets[i - 1]));
-			}
-		}
-	}
-
-	static void constant_fixed_string_vector(
-		const std::string & a,
-		const ColumnString::Chars_t & b_data, ColumnString::Offset_t b_n,
-		PODArray<UInt8> & c)
-	{
-		size_t size = b_data.size();
-		const UInt8 * a_data = reinterpret_cast<const UInt8 *>(a.data());
-		ColumnString::Offset_t a_n = a.size();
-		for (size_t i = 0, j = 0; i < size; i += b_n, ++j)
-		{
-			int res = memcmp(a_data, &b_data[i], std::min(a_n, b_n));
-			c[j] = !(res > 0 || (res == 0 && b_n > a_n));
-		}
-	}
-
-	static void constant_constant(
-		const std::string & a,
-		const std::string & b,
-		UInt8 & c)
-	{
-		c = a <= b;
-	}
-};
-
-template<typename A, typename B>
-struct GreaterOrEqualsNumImpl
-{
-	static void vector_vector(const PODArray<A> & a, const PODArray<B> & b, PODArray<UInt8> & c)
-	{
-		size_t size = a.size();
-		for (size_t i = 0; i < size; ++i)
-			c[i] = a[i] >= b[i];
-	}
-
-	static void vector_constant(const PODArray<A> & a, B b, PODArray<UInt8> & c)
-	{
-		size_t size = a.size();
-		for (size_t i = 0; i < size; ++i)
-			c[i] = a[i] >= b;
-	}
-
-	static void constant_vector(A a, const PODArray<B> & b, PODArray<UInt8> & c)
-	{
-		size_t size = b.size();
-		for (size_t i = 0; i < size; ++i)
-			c[i] = a >= b[i];
-	}
-
-	static void constant_constant(A a, B b, UInt8 & c)
-	{
-		c = a >= b;
-	}
-};
-
-struct GreaterOrEqualsStringImpl
-{
-	static void string_vector_string_vector(
-		const ColumnString::Chars_t & a_data, const ColumnString::Offsets_t & a_offsets,
-		const ColumnString::Chars_t & b_data, const ColumnString::Offsets_t & b_offsets,
-		PODArray<UInt8> & c)
-	{
-		size_t size = a_offsets.size();
-		for (size_t i = 0; i < size; ++i)
-		{
-			if (i == 0)
-			{
-				int res = memcmp(&a_data[0], &b_data[0], std::min(a_offsets[0], b_offsets[0]) - 1);
-				c[i] = !(res < 0 || (res == 0 && a_offsets[0] < b_offsets[0]));
-			}
-			else
-			{
-				int res = memcmp(&a_data[a_offsets[i - 1]], &b_data[b_offsets[i - 1]],
-					std::min(a_offsets[i] - a_offsets[i - 1], b_offsets[i] - b_offsets[i - 1]) - 1);
-				c[i] = !(res < 0 || (res == 0 && a_offsets[i] - a_offsets[i - 1] < b_offsets[i] - b_offsets[i - 1]));
-			}
-		}
-	}
-
-	static void string_vector_fixed_string_vector(
-		const ColumnString::Chars_t & a_data, const ColumnString::Offsets_t & a_offsets,
-		const ColumnString::Chars_t & b_data, ColumnString::Offset_t b_n,
-		PODArray<UInt8> & c)
-	{
-		size_t size = a_offsets.size();
-		for (size_t i = 0; i < size; ++i)
-		{
-			if (i == 0)
-			{
-				int res = memcmp(&a_data[0], &b_data[0], std::min(a_offsets[0] - 1, b_n));
-				c[i] = !(res < 0 || (res == 0 && a_offsets[0] < b_n + 1));
-			}
-			else
-			{
-				int res = memcmp(&a_data[a_offsets[i - 1]], &b_data[i * b_n],
-					std::min(a_offsets[i] - a_offsets[i - 1] - 1, b_n));
-				c[i] = !(res < 0 || (res == 0 && a_offsets[i] - a_offsets[i - 1] < b_n + 1));
-			}
-		}
-	}
-
-	static void string_vector_constant(
-		const ColumnString::Chars_t & a_data, const ColumnString::Offsets_t & a_offsets,
-		const std::string & b,
-		PODArray<UInt8> & c)
-	{
-		size_t size = a_offsets.size();
-		ColumnString::Offset_t b_n = b.size();
-		const UInt8 * b_data = reinterpret_cast<const UInt8 *>(b.data());
-		for (size_t i = 0; i < size; ++i)
-		{
-			if (i == 0)
-			{
-				int res = memcmp(&a_data[0], b_data, std::min(a_offsets[0] - 1, b_n));
-				c[i] = !(res < 0 || (res == 0 && a_offsets[0] < b_n + 1));
-			}
-			else
-			{
-				int res = memcmp(&a_data[a_offsets[i - 1]], b_data,
-					std::min(a_offsets[i] - a_offsets[i - 1] - 1, b_n));
-				c[i] = !(res < 0 || (res == 0 && a_offsets[i] - a_offsets[i - 1] < b_n + 1));
-			}
-		}
-	}
-
-	static void fixed_string_vector_string_vector(
-		const ColumnString::Chars_t & a_data, ColumnString::Offset_t a_n,
-		const ColumnString::Chars_t & b_data, const ColumnString::Offsets_t & b_offsets,
-		PODArray<UInt8> & c)
-	{
-		size_t size = b_offsets.size();
-		for (size_t i = 0; i < size; ++i)
-		{
-			if (i == 0)
-			{
-				int res = memcmp(&a_data[0], &b_data[0], std::min(b_offsets[0] - 1, a_n));
-				c[i] = !(res < 0 || (res == 0 && a_n + 1 < b_offsets[0]));
-			}
-			else
-			{
-				int res = memcmp(&a_data[i * a_n], &b_data[b_offsets[i - 1]],
-					std::min(b_offsets[i] - b_offsets[i - 1] - 1, a_n));
-				c[i] = !(res < 0 || (res == 0 && a_n + 1 < b_offsets[i] - b_offsets[i - 1]));
-			}
-		}
-	}
-
-	static void fixed_string_vector_fixed_string_vector(
-		const ColumnString::Chars_t & a_data, ColumnString::Offset_t a_n,
-		const ColumnString::Chars_t & b_data, ColumnString::Offset_t b_n,
-		PODArray<UInt8> & c)
-	{
-		size_t size = a_data.size();
-		for (size_t i = 0, j = 0; i < size; i += a_n, ++j)
-		{
-			int res = memcmp(&a_data[i], &b_data[i], std::min(a_n, b_n));
-			c[j] = !(res < 0 || (res == 0 && a_n < b_n));
-		}
-	}
-
-	static void fixed_string_vector_constant(
-		const ColumnString::Chars_t & a_data, ColumnString::Offset_t a_n,
-		const std::string & b,
-		PODArray<UInt8> & c)
-	{
-		size_t size = a_data.size();
-		const UInt8 * b_data = reinterpret_cast<const UInt8 *>(b.data());
-		ColumnString::Offset_t b_n = b.size();
-		for (size_t i = 0, j = 0; i < size; i += a_n, ++j)
-		{
-			int res = memcmp(&a_data[i], b_data, std::min(a_n, b_n));
-			c[j] = !(res < 0 || (res == 0 && a_n < b_n));
-		}
-	}
-
-	static void constant_string_vector(
-		const std::string & a,
-		const ColumnString::Chars_t & b_data, const ColumnString::Offsets_t & b_offsets,
-		PODArray<UInt8> & c)
-	{
-		size_t size = b_offsets.size();
-		ColumnString::Offset_t a_n = a.size();
-		const UInt8 * a_data = reinterpret_cast<const UInt8 *>(a.data());
-		for (size_t i = 0; i < size; ++i)
-		{
-			if (i == 0)
-			{
-				int res = memcmp(a_data, &b_data[0], std::min(b_offsets[0] - 1, a_n));
-				c[i] = !(res < 0 || (res == 0 && a_n + 1 < b_offsets[0]));
-			}
-			else
-			{
-				int res = memcmp(a_data, &b_data[b_offsets[i - 1]],
-					std::min(b_offsets[i] - b_offsets[i - 1] - 1, a_n));
-				c[i] = !(res < 0 || (res == 0 && a_n + 1 < b_offsets[i] - b_offsets[i - 1]));
-			}
-		}
-	}
-
-	static void constant_fixed_string_vector(
-		const std::string & a,
-		const ColumnString::Chars_t & b_data, ColumnString::Offset_t b_n,
-		PODArray<UInt8> & c)
-	{
-		size_t size = b_data.size();
-		const UInt8 * a_data = reinterpret_cast<const UInt8 *>(a.data());
-		ColumnString::Offset_t a_n = a.size();
-		for (size_t i = 0, j = 0; i < size; i += b_n, ++j)
-		{
-			int res = memcmp(a_data, &b_data[i], std::min(a_n, b_n));
-			c[j] = !(res < 0 || (res == 0 && b_n < a_n));
-		}
-	}
-
-	static void constant_constant(
-		const std::string & a,
-		const std::string & b,
-		UInt8 & c)
-	{
-		c = a >= b;
+		fixed_string_vector_constant(b_data, b_n, a, c);
 	}
 };
 
 
-#pragma GCC diagnostic pop
+template <typename A, typename B>
+struct StringComparisonImpl<EqualsOp<A, B>> : StringEqualsImpl<true> {};
+
+template <typename A, typename B>
+struct StringComparisonImpl<NotEqualsOp<A, B>> : StringEqualsImpl<false> {};
 
 
 template <
-	template <typename, typename> class NumImpl,
-	typename StringImpl,
+	template <typename, typename> class Op,
 	typename Name>
 class FunctionComparison : public IFunction
 {
@@ -1136,7 +397,7 @@ private:
 
 			ColumnUInt8::Container_t & vec_res = col_res->getData();
 			vec_res.resize(col_left->getData().size());
-			NumImpl<T0, T1>::vector_vector(col_left->getData(), col_right->getData(), vec_res);
+			NumComparisonImpl<T0, T1, Op<T0, T1>>::vector_vector(col_left->getData(), col_right->getData(), vec_res);
 
 			return true;
 		}
@@ -1147,7 +408,7 @@ private:
 
 			ColumnUInt8::Container_t & vec_res = col_res->getData();
 			vec_res.resize(col_left->getData().size());
-			NumImpl<T0, T1>::vector_constant(col_left->getData(), col_right->getData(), vec_res);
+			NumComparisonImpl<T0, T1, Op<T0, T1>>::vector_constant(col_left->getData(), col_right->getData(), vec_res);
 
 			return true;
 		}
@@ -1165,14 +426,14 @@ private:
 
 			ColumnUInt8::Container_t & vec_res = col_res->getData();
 			vec_res.resize(col_left->size());
-			NumImpl<T0, T1>::constant_vector(col_left->getData(), col_right->getData(), vec_res);
+			NumComparisonImpl<T0, T1, Op<T0, T1>>::constant_vector(col_left->getData(), col_right->getData(), vec_res);
 
 			return true;
 		}
 		else if (ColumnConst<T1> * col_right = typeid_cast<ColumnConst<T1> *>(&*block.getByPosition(arguments[1]).column))
 		{
 			UInt8 res = 0;
-			NumImpl<T0, T1>::constant_constant(col_left->getData(), col_right->getData(), res);
+			NumComparisonImpl<T0, T1, Op<T0, T1>>::constant_constant(col_left->getData(), col_right->getData(), res);
 
 			ColumnConstUInt8 * col_res = new ColumnConstUInt8(col_left->size(), res);
 			block.getByPosition(result).column = col_res;
@@ -1238,6 +499,8 @@ private:
 		ColumnConstString * c0_const = typeid_cast<ColumnConstString *>(c0);
 		ColumnConstString * c1_const = typeid_cast<ColumnConstString *>(c1);
 
+		using StringImpl = StringComparisonImpl<Op<int, int>>;
+
 		if (c0_const && c1_const)
 		{
 			ColumnConstUInt8 * c_res = new ColumnConstUInt8(c0_const->size(), 0);
@@ -1359,11 +622,11 @@ struct NameGreater 			{ static const char * get() { return "greater"; } };
 struct NameLessOrEquals 	{ static const char * get() { return "lessOrEquals"; } };
 struct NameGreaterOrEquals 	{ static const char * get() { return "greaterOrEquals"; } };
 
-typedef FunctionComparison<EqualsNumImpl, 			EqualsStringImpl, 			NameEquals>				FunctionEquals;
-typedef FunctionComparison<NotEqualsNumImpl, 		NotEqualsStringImpl, 		NameNotEquals>			FunctionNotEquals;
-typedef FunctionComparison<LessNumImpl, 			LessStringImpl, 			NameLess>				FunctionLess;
-typedef FunctionComparison<GreaterNumImpl, 			GreaterStringImpl, 			NameGreater>			FunctionGreater;
-typedef FunctionComparison<LessOrEqualsNumImpl, 	LessOrEqualsStringImpl, 	NameLessOrEquals>		FunctionLessOrEquals;
-typedef FunctionComparison<GreaterOrEqualsNumImpl,	GreaterOrEqualsStringImpl, 	NameGreaterOrEquals>	FunctionGreaterOrEquals;
+typedef FunctionComparison<EqualsOp, 			NameEquals>				FunctionEquals;
+typedef FunctionComparison<NotEqualsOp, 		NameNotEquals>			FunctionNotEquals;
+typedef FunctionComparison<LessOp, 				NameLess>				FunctionLess;
+typedef FunctionComparison<GreaterOp, 			NameGreater>			FunctionGreater;
+typedef FunctionComparison<LessOrEqualsOp, 		NameLessOrEquals>		FunctionLessOrEquals;
+typedef FunctionComparison<GreaterOrEqualsOp,	NameGreaterOrEquals>	FunctionGreaterOrEquals;
 
 }
diff --git a/dbms/include/DB/Functions/FunctionsFormatting.h b/dbms/include/DB/Functions/FunctionsFormatting.h
index f636b4b1dc2..99f533ac9f9 100644
--- a/dbms/include/DB/Functions/FunctionsFormatting.h
+++ b/dbms/include/DB/Functions/FunctionsFormatting.h
@@ -1,6 +1,6 @@
 #include <DB/Functions/IFunction.h>
-#include "NumberTraits.h"
 #include <DB/Columns/ColumnString.h>
+#include <DB/DataTypes/DataTypeString.h>
 #include <DB/DataTypes/DataTypesNumberFixed.h>
 #include <DB/IO/WriteBufferFromVector.h>
 #include <DB/IO/WriteBufferFromString.h>
diff --git a/dbms/include/DB/Functions/FunctionsMiscellaneous.h b/dbms/include/DB/Functions/FunctionsMiscellaneous.h
index 29191faadc7..fb3042bc047 100644
--- a/dbms/include/DB/Functions/FunctionsMiscellaneous.h
+++ b/dbms/include/DB/Functions/FunctionsMiscellaneous.h
@@ -50,6 +50,8 @@ namespace DB
   *                     не предназначена для пользователя, а используется только как prerequisites для функций высшего порядка.
   *
   * sleep(n)		- спит n секунд каждый блок.
+  *
+  * bar(x, min, max, width) - рисует полосу из количества символов, пропорционального (x - min) и равного width при x == max.
   */
 
 
@@ -274,7 +276,7 @@ public:
 	{
 		const IColumn & argument = *block.getByPosition(arguments[0]).column;
 		if (!argument.isConst())
-			throw Exception("Argument for function 'materialize' must be constant.", ErrorCodes::ILLEGAL_COLUMN);
+			throw Exception("Argument for function " + getName() + " must be constant.", ErrorCodes::ILLEGAL_COLUMN);
 
 		block.getByPosition(result).column = dynamic_cast<const IColumnConst &>(argument).convertToFullColumn();
 	}
@@ -354,7 +356,7 @@ public:
 	DataTypePtr getReturnType(const DataTypes & arguments) const
 	{
 		if (arguments.size() < 2)
-			throw Exception("Function tuple requires at least two arguments.", ErrorCodes::NUMBER_OF_ARGUMENTS_DOESNT_MATCH);
+			throw Exception("Function " + getName() + " requires at least two arguments.", ErrorCodes::NUMBER_OF_ARGUMENTS_DOESNT_MATCH);
 
 		return new DataTypeTuple(arguments);
 	}
@@ -386,18 +388,18 @@ public:
 										ExpressionActions::Actions & out_prerequisites)
 	{
 		if (arguments.size() != 2)
-			throw Exception("Function tupleElement requires exactly two arguments: tuple and element index.",
+			throw Exception("Function " + getName() + " requires exactly two arguments: tuple and element index.",
 							ErrorCodes::NUMBER_OF_ARGUMENTS_DOESNT_MATCH);
 
 		const ColumnConstUInt8 * index_col = typeid_cast<const ColumnConstUInt8 *>(&*arguments[1].column);
 		if (!index_col)
-			throw Exception("Second argument to tupleElement must be a constant UInt8", ErrorCodes::ILLEGAL_TYPE_OF_ARGUMENT);
+			throw Exception("Second argument to " + getName() + " must be a constant UInt8", ErrorCodes::ILLEGAL_TYPE_OF_ARGUMENT);
 
 		size_t index = index_col->getData();
 
 		const DataTypeTuple * tuple = typeid_cast<const DataTypeTuple *>(&*arguments[0].type);
 		if (!tuple)
-			throw Exception("First argument for function tupleElement must be tuple.", ErrorCodes::ILLEGAL_TYPE_OF_ARGUMENT);
+			throw Exception("First argument for function " + getName() + " must be tuple.", ErrorCodes::ILLEGAL_TYPE_OF_ARGUMENT);
 
 		if (index == 0)
 			throw Exception("Indices in tuples are 1-based.", ErrorCodes::ILLEGAL_INDEX);
@@ -417,10 +419,10 @@ public:
 		const ColumnConstUInt8 * index_col = typeid_cast<const ColumnConstUInt8 *>(&*block.getByPosition(arguments[1]).column);
 
 		if (!tuple_col)
-			throw Exception("First argument for function tupleElement must be tuple.", ErrorCodes::ILLEGAL_COLUMN);
+			throw Exception("First argument for function " + getName() + " must be tuple.", ErrorCodes::ILLEGAL_COLUMN);
 
 		if (!index_col)
-			throw Exception("Second argument for function tupleElement must be UInt8 constant literal.", ErrorCodes::ILLEGAL_COLUMN);
+			throw Exception("Second argument for function " + getName() + " must be UInt8 constant literal.", ErrorCodes::ILLEGAL_COLUMN);
 
 		size_t index = index_col->getData();
 		if (index == 0)
@@ -472,11 +474,11 @@ public:
 	DataTypePtr getReturnType(const DataTypes & arguments) const
 	{
 		if (arguments.size() != 1)
-			throw Exception("Function arrayJoin requires exactly one argument.", ErrorCodes::NUMBER_OF_ARGUMENTS_DOESNT_MATCH);
+			throw Exception("Function " + getName() + " requires exactly one argument.", ErrorCodes::NUMBER_OF_ARGUMENTS_DOESNT_MATCH);
 
 		const DataTypeArray * arr = typeid_cast<const DataTypeArray *>(&*arguments[0]);
 		if (!arr)
-			throw Exception("Argument for function arrayJoin must be Array.", ErrorCodes::ILLEGAL_TYPE_OF_ARGUMENT);
+			throw Exception("Argument for function " + getName() + " must be Array.", ErrorCodes::ILLEGAL_TYPE_OF_ARGUMENT);
 
 		return arr->getNestedType()->clone();
 	}
@@ -484,7 +486,7 @@ public:
 	/// Выполнить функцию над блоком.
 	void execute(Block & block, const ColumnNumbers & arguments, size_t result)
 	{
-		throw Exception("Function arrayJoin must not be executed directly.", ErrorCodes::FUNCTION_IS_SPECIAL);
+		throw Exception("Function " + getName() + " must not be executed directly.", ErrorCodes::FUNCTION_IS_SPECIAL);
 	}
 };
 
@@ -539,4 +541,202 @@ class FunctionReplicate : public IFunction
 	}
 };
 
+
+class FunctionBar : public IFunction
+{
+public:
+	/// Получить имя функции.
+	String getName() const
+	{
+		return "bar";
+	}
+
+	/// Получить тип результата по типам аргументов. Если функция неприменима для данных аргументов - кинуть исключение.
+	DataTypePtr getReturnType(const DataTypes & arguments) const
+	{
+		if (arguments.size() != 3 && arguments.size() != 4)
+			throw Exception("Function " + getName() + " requires from 3 or 4 parameters: value, min_value, max_value, [max_width_of_bar = 80]. Passed "
+				+ toString(arguments.size()) + ".",
+				ErrorCodes::NUMBER_OF_ARGUMENTS_DOESNT_MATCH);
+
+		if (!arguments[0]->isNumeric() || !arguments[1]->isNumeric() || !arguments[2]->isNumeric()
+			|| (arguments.size() == 4 && !arguments[3]->isNumeric()))
+			throw Exception("All arguments for function " + getName() + " must be numeric.", ErrorCodes::ILLEGAL_TYPE_OF_ARGUMENT);
+
+		return new DataTypeString;
+	}
+
+	/// Выполнить функцию над блоком.
+	void execute(Block & block, const ColumnNumbers & arguments, size_t result)
+	{
+		Int64 min = extractConstant<Int64>(block, arguments, 1, "Second");	/// Уровень значения, при котором полоска имеет нулевую длину.
+		Int64 max = extractConstant<Int64>(block, arguments, 2, "Third");	/// Уровень значения, при котором полоска имеет максимальную длину.
+
+		/// Максимальная ширина полоски в символах, по-умолчанию.
+		Float64 max_width = arguments.size() == 4
+			? extractConstant<Float64>(block, arguments, 3, "Fourth")
+			: 80;
+
+		if (max_width < 1)
+			throw Exception("Max_width argument must be >= 1.", ErrorCodes::ARGUMENT_OUT_OF_BOUND);
+
+		if (max_width > 1000)
+			throw Exception("Too large max_width.", ErrorCodes::ARGUMENT_OUT_OF_BOUND);
+
+		const auto & src = *block.getByPosition(arguments[0]).column;
+
+		if (src.isConst())
+		{
+			auto res_column = new ColumnConstString(block.rowsInFirstColumn(), "");
+			block.getByPosition(result).column = res_column;
+
+			if (   executeConstNumber<UInt8>	(src, *res_column, min, max, max_width)
+				|| executeConstNumber<UInt16>	(src, *res_column, min, max, max_width)
+				|| executeConstNumber<UInt32>	(src, *res_column, min, max, max_width)
+				|| executeConstNumber<UInt64>	(src, *res_column, min, max, max_width)
+				|| executeConstNumber<Int8>		(src, *res_column, min, max, max_width)
+				|| executeConstNumber<Int16>	(src, *res_column, min, max, max_width)
+				|| executeConstNumber<Int32>	(src, *res_column, min, max, max_width)
+				|| executeConstNumber<Int64>	(src, *res_column, min, max, max_width)
+				|| executeConstNumber<Float32>	(src, *res_column, min, max, max_width)
+				|| executeConstNumber<Float64>	(src, *res_column, min, max, max_width))
+			{
+			}
+			else
+				throw Exception("Illegal column " + block.getByPosition(arguments[0]).column->getName()
+					+ " of argument of function " + getName(),
+					ErrorCodes::ILLEGAL_COLUMN);
+		}
+		else
+		{
+			auto res_column = new ColumnString;
+			block.getByPosition(result).column = res_column;
+
+			if (   executeNumber<UInt8>		(src, *res_column, min, max, max_width)
+				|| executeNumber<UInt16>	(src, *res_column, min, max, max_width)
+				|| executeNumber<UInt32>	(src, *res_column, min, max, max_width)
+				|| executeNumber<UInt64>	(src, *res_column, min, max, max_width)
+				|| executeNumber<Int8>		(src, *res_column, min, max, max_width)
+				|| executeNumber<Int16>		(src, *res_column, min, max, max_width)
+				|| executeNumber<Int32>		(src, *res_column, min, max, max_width)
+				|| executeNumber<Int64>		(src, *res_column, min, max, max_width)
+				|| executeNumber<Float32>	(src, *res_column, min, max, max_width)
+				|| executeNumber<Float64>	(src, *res_column, min, max, max_width))
+			{
+			}
+			else
+				throw Exception("Illegal column " + block.getByPosition(arguments[0]).column->getName()
+					+ " of argument of function " + getName(),
+					ErrorCodes::ILLEGAL_COLUMN);
+		}
+	}
+
+private:
+	template <typename T>
+	T extractConstant(Block & block, const ColumnNumbers & arguments, size_t argument_pos, const char * which_argument) const
+	{
+		const auto & column = *block.getByPosition(arguments[argument_pos]).column;
+
+		if (!column.isConst())
+			throw Exception(which_argument + String(" argument for function ") + getName() + " must be constant.", ErrorCodes::ILLEGAL_COLUMN);
+
+		return apply_visitor(FieldVisitorConvertToNumber<T>(), column[0]);
+	}
+
+	static constexpr size_t BAR_CHAR_SIZE = strlen("█");
+
+	template <typename T>
+	static Float64 barWidth(T x, Int64 min, Int64 max, Float64 max_width)
+	{
+		if (x <= min)
+			return 0;
+
+		if (x >= max)
+			return max_width;
+
+		return (x - min) * max_width / (max - min);
+	}
+
+	static size_t barWidthInBytes(Float64 width)
+	{
+		return ceil(width - 1.0 / 8) * BAR_CHAR_SIZE;
+	}
+
+	/// В dst должно быть место для barWidthInBytes(width) символов и завершающего нуля.
+	static void renderBar(Float64 width, char * dst)
+	{
+		size_t floor_width = floor(width);
+
+		for (size_t i = 0; i < floor_width; ++i)
+		{
+			memcpy(dst, "█", BAR_CHAR_SIZE);
+			dst += BAR_CHAR_SIZE;
+		}
+
+		size_t remainder = floor((width - floor_width) * 8);
+
+		if (remainder)
+		{
+			memcpy(dst, &"▏▎▍▌▋▋▊▉"[(remainder - 1) * BAR_CHAR_SIZE], BAR_CHAR_SIZE);
+			dst += BAR_CHAR_SIZE;
+		}
+
+		*dst = 0;
+	}
+
+	template <typename T>
+	static void fill(const PODArray<T> & src, ColumnString::Chars_t & dst_chars, ColumnString::Offsets_t & dst_offsets,
+		Int64 min, Int64 max, Float64 max_width)
+	{
+		size_t size = src.size();
+		size_t current_offset = 0;
+
+		dst_offsets.resize(size);
+		dst_chars.reserve(size * (barWidthInBytes(max_width) + 1));	/// строки 0-terminated.
+
+		for (size_t i = 0; i < size; ++i)
+		{
+			Float64 width = barWidth(src[i], min, max, max_width);
+			size_t next_size = current_offset + barWidthInBytes(width) + 1;
+			dst_chars.resize(next_size);
+			renderBar(width, reinterpret_cast<char *>(&dst_chars[current_offset]));
+			current_offset = next_size;
+			dst_offsets[i] = current_offset;
+		}
+	}
+
+	template <typename T>
+	static void fill(T src, String & dst_chars,
+		Int64 min, Int64 max, Float64 max_width)
+	{
+		Float64 width = barWidth(src, min, max, max_width);
+		dst_chars.resize(barWidthInBytes(width));
+		renderBar(width, &dst_chars[0]);
+	}
+
+	template <typename T>
+	static bool executeNumber(const IColumn & src, ColumnString & dst, Int64 min, Int64 max, Float64 max_width)
+	{
+		if (const ColumnVector<T> * col = typeid_cast<const ColumnVector<T> *>(&src))
+		{
+			fill(col->getData(), dst.getChars(), dst.getOffsets(), min, max, max_width);
+			return true;
+		}
+		else
+			return false;
+	}
+
+	template <typename T>
+	static bool executeConstNumber(const IColumn & src, ColumnConstString & dst, Int64 min, Int64 max, Float64 max_width)
+	{
+		if (const ColumnConst<T> * col = typeid_cast<const ColumnConst<T> *>(&src))
+		{
+			fill(col->getData(), dst.getData(), min, max, max_width);
+			return true;
+		}
+		else
+			return false;
+	}
+};
+
 }
diff --git a/dbms/include/DB/Functions/FunctionsRandom.h b/dbms/include/DB/Functions/FunctionsRandom.h
index d9ce0121664..48080058a24 100644
--- a/dbms/include/DB/Functions/FunctionsRandom.h
+++ b/dbms/include/DB/Functions/FunctionsRandom.h
@@ -4,6 +4,7 @@
 
 #include <DB/DataTypes/DataTypesNumberFixed.h>
 #include <DB/Functions/IFunction.h>
+#include <DB/Common/HashTable/Hash.h>
 #include <stats/IntHash.h>
 
 
@@ -13,14 +14,14 @@ namespace DB
 /** Функции генерации псевдослучайных чисел.
   * Функция может быть вызвана без аргументов или с одним аргументом.
   * Аргумент игнорируется и служит лишь для того, чтобы несколько вызовов одной функции считались разными и не склеивались.
-  * 
+  *
   * Пример:
   * SELECT rand(), rand() - выдаст два одинаковых столбца.
   * SELECT rand(1), rand(2) - выдаст два разных столбца.
   *
   * Некриптографические генераторы:
-  * 
-  * rand   - linear congruental generator 0 .. 2^31 - 1.
+  *
+  * rand   - linear congruental generator 0 .. 2^32 - 1.
   * rand64 - комбинирует несколько значений rand, чтобы получить значения из диапазона 0 .. 2^64 - 1.
   *
   * В качестве затравки используют время.
@@ -30,31 +31,74 @@ namespace DB
 
 namespace detail
 {
-	void seed(drand48_data & rand_state, intptr_t additional_seed)
+	struct LinearCongruentialGenerator
+	{
+		/// Константы из man lrand48_r.
+		static constexpr UInt64 a = 0x5DEECE66D;
+		static constexpr UInt64 c = 0xB;
+
+		/// А эта - из head -c8 /dev/urandom | xxd -p
+		UInt64 current = 0x09826f4a081cee35ULL;
+
+		LinearCongruentialGenerator() {}
+		LinearCongruentialGenerator(UInt64 value) : current(value) {}
+
+		void seed(UInt64 value)
+		{
+			current = value;
+		}
+
+		UInt32 next()
+		{
+			current = current * a + c;
+			return current >> 16;
+		}
+	};
+
+	void seed(LinearCongruentialGenerator & generator, intptr_t additional_seed)
 	{
 		struct timespec times;
 		if (clock_gettime(CLOCK_THREAD_CPUTIME_ID, &times))
 			throwFromErrno("Cannot clock_gettime.", ErrorCodes::CANNOT_CLOCK_GETTIME);
 
-		srand48_r(intHash32<0>(times.tv_nsec ^ intHash32<0>(additional_seed)), &rand_state);
+		generator.seed(intHash64(times.tv_nsec ^ intHash64(additional_seed)));
 	}
 }
 
 struct RandImpl
 {
 	typedef UInt32 ReturnType;
-	
+
 	static void execute(PODArray<ReturnType> & res)
 	{
-		drand48_data rand_state;
-		detail::seed(rand_state, reinterpret_cast<intptr_t>(&res[0]));
-		
+		detail::LinearCongruentialGenerator generator0;
+		detail::LinearCongruentialGenerator generator1;
+		detail::LinearCongruentialGenerator generator2;
+		detail::LinearCongruentialGenerator generator3;
+
+		detail::seed(generator0, 0xfb4121280b2ab902ULL + reinterpret_cast<intptr_t>(&res[0]));
+		detail::seed(generator1, 0x0121cf76df39c673ULL + reinterpret_cast<intptr_t>(&res[0]));
+		detail::seed(generator2, 0x17ae86e3a19a602fULL + reinterpret_cast<intptr_t>(&res[0]));
+		detail::seed(generator3, 0x8b6e16da7e06d622ULL + reinterpret_cast<intptr_t>(&res[0]));
+
 		size_t size = res.size();
-		for (size_t i = 0; i < size; ++i)
+		ReturnType * pos = &res[0];
+		ReturnType * end = pos + size;
+		ReturnType * end4 = pos + size / 4 * 4;
+
+		while (pos < end4)
 		{
-			long rand_res;
-			lrand48_r(&rand_state, &rand_res);
-			res[i] = rand_res;
+			pos[0] = generator0.next();
+			pos[1] = generator1.next();
+			pos[2] = generator2.next();
+			pos[3] = generator3.next();
+			pos += 4;
+		}
+
+		while (pos < end)
+		{
+			pos[0] = generator0.next();
+			++pos;
 		}
 	}
 };
@@ -65,21 +109,32 @@ struct Rand64Impl
 
 	static void execute(PODArray<ReturnType> & res)
 	{
-		drand48_data rand_state;
-		detail::seed(rand_state, reinterpret_cast<intptr_t>(&res[0]));
+		detail::LinearCongruentialGenerator generator0;
+		detail::LinearCongruentialGenerator generator1;
+		detail::LinearCongruentialGenerator generator2;
+		detail::LinearCongruentialGenerator generator3;
+
+		detail::seed(generator0, 0xfb4121280b2ab902ULL + reinterpret_cast<intptr_t>(&res[0]));
+		detail::seed(generator1, 0x0121cf76df39c673ULL + reinterpret_cast<intptr_t>(&res[0]));
+		detail::seed(generator2, 0x17ae86e3a19a602fULL + reinterpret_cast<intptr_t>(&res[0]));
+		detail::seed(generator3, 0x8b6e16da7e06d622ULL + reinterpret_cast<intptr_t>(&res[0]));
 
 		size_t size = res.size();
-		for (size_t i = 0; i < size; ++i)
+		ReturnType * pos = &res[0];
+		ReturnType * end = pos + size;
+		ReturnType * end2 = pos + size / 2 * 2;
+
+		while (pos < end2)
 		{
-			long rand_res1;
-			long rand_res2;
-			long rand_res3;
-			
-			lrand48_r(&rand_state, &rand_res1);
-			lrand48_r(&rand_state, &rand_res2);
-			lrand48_r(&rand_state, &rand_res3);
-			
-			res[i] = rand_res1 ^ (rand_res2 << 18) ^ (rand_res3 << 33);
+			pos[0] = (static_cast<UInt64>(generator0.next()) << 32) | generator1.next();
+			pos[1] = (static_cast<UInt64>(generator2.next()) << 32) | generator3.next();
+			pos += 2;
+		}
+
+		while (pos < end)
+		{
+			pos[0] = (static_cast<UInt64>(generator0.next()) << 32) | generator1.next();
+			++pos;
 		}
 	}
 };
@@ -90,7 +145,7 @@ class FunctionRandom : public IFunction
 {
 private:
 	typedef typename Impl::ReturnType ToType;
-	
+
 public:
 	/// Получить имя функции.
 	String getName() const
diff --git a/dbms/include/DB/Functions/FunctionsStringArray.h b/dbms/include/DB/Functions/FunctionsStringArray.h
index fce1de2b1e1..312671e08cf 100644
--- a/dbms/include/DB/Functions/FunctionsStringArray.h
+++ b/dbms/include/DB/Functions/FunctionsStringArray.h
@@ -1,8 +1,8 @@
 #pragma once
 
-#include <DB/DataTypes/DataTypeString.h>
 #include <DB/DataTypes/DataTypeArray.h>
 #include <DB/Columns/ColumnString.h>
+#include <DB/Columns/ColumnFixedString.h>
 #include <DB/Columns/ColumnConst.h>
 #include <DB/Columns/ColumnArray.h>
 #include <DB/Functions/IFunction.h>
diff --git a/dbms/include/DB/Functions/FunctionsStringSearch.h b/dbms/include/DB/Functions/FunctionsStringSearch.h
index ec872ef61fc..5a7e90b7498 100644
--- a/dbms/include/DB/Functions/FunctionsStringSearch.h
+++ b/dbms/include/DB/Functions/FunctionsStringSearch.h
@@ -7,7 +7,9 @@
 
 #include <DB/DataTypes/DataTypesNumberFixed.h>
 #include <DB/DataTypes/DataTypeString.h>
+#include <DB/DataTypes/DataTypeFixedString.h>
 #include <DB/Columns/ColumnString.h>
+#include <DB/Columns/ColumnFixedString.h>
 #include <DB/Columns/ColumnConst.h>
 #include <DB/Common/Volnitsky.h>
 #include <DB/Functions/IFunction.h>
diff --git a/dbms/include/DB/IO/WriteHelpers.h b/dbms/include/DB/IO/WriteHelpers.h
index 4b781f61253..42d2ad1ab96 100644
--- a/dbms/include/DB/IO/WriteHelpers.h
+++ b/dbms/include/DB/IO/WriteHelpers.h
@@ -149,7 +149,7 @@ inline void writeJSONString(const char * begin, const char * end, WriteBuffer &
 			case '\t':
 				writeChar('\\', buf);
 				writeChar('t', buf);
-				break; 
+				break;
 			case '\\':
 				writeChar('\\', buf);
 				writeChar('\\', buf);
@@ -167,10 +167,10 @@ inline void writeJSONString(const char * begin, const char * end, WriteBuffer &
 				{
 					char higher_half = (*it) >> 4;
 					char lower_half = (*it) & 0xF;
-					
+
 					writeCString("\\u00", buf);
 					writeChar('0' + higher_half, buf);
-					
+
 					if (0 <= lower_half && lower_half <= 9)
 						writeChar('0' + lower_half, buf);
 					else
@@ -282,7 +282,6 @@ inline void writeQuotedString(const String & s, WriteBuffer & buf)
 	writeAnyQuotedString<'\''>(s, buf);
 }
 
-/// Совместимо с JSON.
 inline void writeDoubleQuotedString(const String & s, WriteBuffer & buf)
 {
 	writeAnyQuotedString<'"'>(s, buf);
@@ -335,7 +334,7 @@ inline void writeDateText(DayNum_t date, WriteBuffer & buf)
 	s[6] += values.month % 10;
 	s[8] += values.day_of_month / 10;
 	s[9] += values.day_of_month % 10;
-	
+
 	buf.write(s, 10);
 }
 
diff --git a/dbms/include/DB/Interpreters/Aggregator.h b/dbms/include/DB/Interpreters/Aggregator.h
index 3afa1802b4d..1a2afa54eb6 100644
--- a/dbms/include/DB/Interpreters/Aggregator.h
+++ b/dbms/include/DB/Interpreters/Aggregator.h
@@ -91,7 +91,7 @@ struct AggregationMethodKey64
 
 	/** Разместить дополнительные данные, если это необходимо, в случае, когда в хэш-таблицу был вставлен новый ключ.
 	  */
-	void onNewKey(iterator & it, size_t keys_size, size_t i, StringRefs & keys, Arena & pool)
+	static void onNewKey(iterator & it, size_t keys_size, size_t i, StringRefs & keys, Arena & pool)
 	{
 	}
 
@@ -139,7 +139,7 @@ struct AggregationMethodString
 	static AggregateDataPtr & getAggregateData(Mapped & value) 				{ return value; }
 	static const AggregateDataPtr & getAggregateData(const Mapped & value) 	{ return value; }
 
-	void onNewKey(iterator & it, size_t keys_size, size_t i, StringRefs & keys, Arena & pool)
+	static void onNewKey(iterator & it, size_t keys_size, size_t i, StringRefs & keys, Arena & pool)
 	{
 		it->first.data = pool.insert(it->first.data, it->first.size);
 	}
@@ -186,7 +186,7 @@ struct AggregationMethodFixedString
 	static AggregateDataPtr & getAggregateData(Mapped & value) 				{ return value; }
 	static const AggregateDataPtr & getAggregateData(const Mapped & value) 	{ return value; }
 
-	void onNewKey(iterator & it, size_t keys_size, size_t i, StringRefs & keys, Arena & pool)
+	static void onNewKey(iterator & it, size_t keys_size, size_t i, StringRefs & keys, Arena & pool)
 	{
 		it->first.data = pool.insert(it->first.data, it->first.size);
 	}
@@ -226,7 +226,7 @@ struct AggregationMethodKeys128
 	static AggregateDataPtr & getAggregateData(Mapped & value) 				{ return value; }
 	static const AggregateDataPtr & getAggregateData(const Mapped & value) 	{ return value; }
 
-	void onNewKey(iterator & it, size_t keys_size, size_t i, StringRefs & keys, Arena & pool)
+	static void onNewKey(iterator & it, size_t keys_size, size_t i, StringRefs & keys, Arena & pool)
 	{
 	}
 
@@ -271,7 +271,7 @@ struct AggregationMethodHashed
 	static AggregateDataPtr & getAggregateData(Mapped & value) 				{ return value.second; }
 	static const AggregateDataPtr & getAggregateData(const Mapped & value) 	{ return value.second; }
 
-	void onNewKey(iterator & it, size_t keys_size, size_t i, StringRefs & keys, Arena & pool)
+	static void onNewKey(iterator & it, size_t keys_size, size_t i, StringRefs & keys, Arena & pool)
 	{
 		it->second.first = placeKeysInPool(i, keys_size, keys, pool);
 	}
@@ -308,7 +308,7 @@ struct AggregatedDataVariants : private boost::noncopyable
 
 	size_t keys_size;	/// Количество ключей NOTE нужно ли это поле?
 	Sizes key_sizes;	/// Размеры ключей, если ключи фиксированной длины
-	
+
 	/// Пулы для состояний агрегатных функций. Владение потом будет передано в ColumnAggregateFunction.
 	Arenas aggregates_pools;
 	Arena * aggregates_pool;	/// Пул, который сейчас используется для аллокации.
@@ -322,7 +322,7 @@ struct AggregatedDataVariants : private boost::noncopyable
 	std::unique_ptr<AggregationMethodFixedString> 	key_fixed_string;
 	std::unique_ptr<AggregationMethodKeys128> 		keys128;
 	std::unique_ptr<AggregationMethodHashed> 		hashed;
-	
+
 	enum Type
 	{
 		EMPTY 				= 0,
@@ -465,7 +465,7 @@ public:
 
 protected:
 	friend struct AggregatedDataVariants;
-	
+
 	ColumnNumbers keys;
 	Names key_names;
 	AggregateDescriptions aggregates;
diff --git a/dbms/include/DB/Interpreters/Cluster.h b/dbms/include/DB/Interpreters/Cluster.h
index 3a21dcc9bb0..9766cadbc0e 100644
--- a/dbms/include/DB/Interpreters/Cluster.h
+++ b/dbms/include/DB/Interpreters/Cluster.h
@@ -29,10 +29,19 @@ public:
 	/// Соединения с удалёнными серверами.
 	ConnectionPools pools;
 
+	struct ShardInfo
+	{
+		/// contains names of directories for asynchronous write to StorageDistributed
+		std::vector<std::string> dir_names;
+		int weight;
+		size_t num_local_nodes;
+	};
+	std::vector<ShardInfo> shard_info_vec;
+	std::vector<size_t> slot_to_shard;
+
 	/// используеться для выставления ограничения на размер таймаута
 	static Poco::Timespan saturate(const Poco::Timespan & v, const Poco::Timespan & limit);
 
-private:
 	struct Address
 	{
 		/** В конфиге адреса либо находятся в узлах <node>:
@@ -59,6 +68,7 @@ private:
 		Address(const String & host_port_, const String & user_, const String & password_);
 	};
 
+private:
 	static bool isLocal(const Address & address);
 
 	/// Массив шардов. Каждый шард - адреса одного сервера.
diff --git a/dbms/include/DB/Interpreters/Context.h b/dbms/include/DB/Interpreters/Context.h
index b837c7fc673..e1b51266252 100644
--- a/dbms/include/DB/Interpreters/Context.h
+++ b/dbms/include/DB/Interpreters/Context.h
@@ -9,6 +9,7 @@
 #include <Yandex/logger_useful.h>
 
 #include <DB/Core/NamesAndTypes.h>
+#include <DB/Common/Macros.h>
 #include <DB/IO/UncompressedCache.h>
 #include <DB/Storages/MarkCache.h>
 #include <DB/DataStreams/FormatFactory.h>
@@ -56,8 +57,8 @@ typedef std::vector<DatabaseAndTableName> Dependencies;
   */
 struct ContextShared
 {
-	Logger * log;											/// Логгер.
-	
+	Logger * log = &Logger::get("Context");					/// Логгер.
+
 	struct AfterDestroy
 	{
 		Logger * log;
@@ -69,7 +70,7 @@ struct ContextShared
 			LOG_INFO(log, "Uninitialized shared context.");
 #endif
 		}
-	} after_destroy;
+	} after_destroy {log};
 
 	mutable Poco::Mutex mutex;								/// Для доступа и модификации разделяемых объектов.
 
@@ -95,8 +96,8 @@ struct ContextShared
 	ViewDependencies view_dependencies;						/// Текущие зависимости
 	ConfigurationPtr users_config;							/// Конфиг с секциями users, profiles и quotas.
 	InterserverIOHandler interserver_io_handler;			/// Обработчик для межсерверной передачи данных.
-	String default_replica_name;							/// Имя реплики из конфига.
 	BackgroundProcessingPoolPtr background_pool;			/// Пул потоков для фоновой работы, выполняемой таблицами.
+	Macros macros;											/// Подстановки из конфига.
 
 	/// Кластеры для distributed таблиц
 	/// Создаются при создании Distributed таблиц, так как нужно дождаться пока будут выставлены Settings
@@ -105,8 +106,6 @@ struct ContextShared
 	bool shutdown_called = false;
 
 
-	ContextShared() : log(&Logger::get("Context")), after_destroy(log) {};
-
 	~ContextShared()
 	{
 #ifndef DBMS_CLIENT
@@ -227,7 +226,7 @@ public:
 
 	/// Возвращает отцепленную таблицу.
 	StoragePtr detachTable(const String & database_name, const String & table_name);
-	
+
 	void detachDatabase(const String & database_name);
 
 	String getCurrentDatabase() const;
@@ -238,9 +237,8 @@ public:
 	String getDefaultFormat() const;	/// Если default_format не задан - возвращается некоторый глобальный формат по-умолчанию.
 	void setDefaultFormat(const String & name);
 
-	/// Имя этой реплики из конфига.
-	String getDefaultReplicaName() const;
-	void setDefaultReplicaName(const String & name);
+	const Macros & getMacros() const;
+	void setMacros(Macros && macros);
 
 	Settings getSettings() const;
 	void setSettings(const Settings & settings_);
diff --git a/dbms/include/DB/Interpreters/InterpreterAlterQuery.h b/dbms/include/DB/Interpreters/InterpreterAlterQuery.h
index 8c2a635d535..e3f44a0efd8 100644
--- a/dbms/include/DB/Interpreters/InterpreterAlterQuery.h
+++ b/dbms/include/DB/Interpreters/InterpreterAlterQuery.h
@@ -22,11 +22,41 @@ public:
 	/** Изменяет список столбцов в метаданных таблицы на диске. Нужно вызывать под TableStructureLock соответствующей таблицы.
 	  */
 	static void updateMetadata(const String & database, const String & table, const NamesAndTypesList & columns, Context & context);
-
-	static AlterCommands parseAlter(const ASTAlterQuery::ParameterContainer & params, const DataTypeFactory & data_type_factory);
 private:
+	struct PartitionCommand
+	{
+		enum Type
+		{
+			DROP_PARTITION,
+			ATTACH_PARTITION,
+		};
+
+		Type type;
+
+		Field partition;
+		bool detach; /// true для DETACH PARTITION.
+
+		bool unreplicated;
+		bool part;
+
+		static PartitionCommand dropPartition(const Field & partition, bool detach)
+		{
+			return {DROP_PARTITION, partition, detach};
+		}
+
+		static PartitionCommand attachPartition(const Field & partition, bool unreplicated, bool part)
+		{
+			return {ATTACH_PARTITION, partition, false, unreplicated, part};
+		}
+	};
+
+	typedef std::vector<PartitionCommand> PartitionCommands;
+
 	ASTPtr query_ptr;
 	
 	Context context;
+
+	static void parseAlter(const ASTAlterQuery::ParameterContainer & params, const DataTypeFactory & data_type_factory,
+		AlterCommands & out_alter_commands, PartitionCommands & out_partition_commands);
 };
 }
diff --git a/dbms/include/DB/Interpreters/InterpreterCheckQuery.h b/dbms/include/DB/Interpreters/InterpreterCheckQuery.h
new file mode 100644
index 00000000000..48c6092352e
--- /dev/null
+++ b/dbms/include/DB/Interpreters/InterpreterCheckQuery.h
@@ -0,0 +1,22 @@
+#pragma once
+
+#include <DB/Interpreters/Context.h>
+#include <DB/Parsers/ASTIdentifier.h>
+
+namespace DB
+{
+
+class InterpreterCheckQuery
+{
+public:
+	InterpreterCheckQuery(ASTPtr query_ptr_, Context & context_);
+	BlockInputStreamPtr execute();
+	DB::Block getSampleBlock();
+
+private:
+	ASTPtr query_ptr;
+	Context context;
+	DB::Block result;
+};
+
+}
diff --git a/dbms/include/DB/Interpreters/Join.h b/dbms/include/DB/Interpreters/Join.h
index 71d24be652e..4a0f562c0e1 100644
--- a/dbms/include/DB/Interpreters/Join.h
+++ b/dbms/include/DB/Interpreters/Join.h
@@ -1,7 +1,5 @@
 #pragma once
 
-#include <statdaemons/Stopwatch.h>
-
 #include <Yandex/logger_useful.h>
 
 #include <DB/Parsers/ASTJoin.h>
diff --git a/dbms/include/DB/Interpreters/Set.h b/dbms/include/DB/Interpreters/Set.h
index ca7f9d6313f..1c8024f490f 100644
--- a/dbms/include/DB/Interpreters/Set.h
+++ b/dbms/include/DB/Interpreters/Set.h
@@ -2,8 +2,6 @@
 
 #include <set>
 
-#include <statdaemons/Stopwatch.h>
-
 #include <Yandex/logger_useful.h>
 
 #include <DB/Core/ColumnNumbers.h>
diff --git a/dbms/include/DB/Interpreters/Settings.h b/dbms/include/DB/Interpreters/Settings.h
index 2057cf720c9..9eb46a7b102 100644
--- a/dbms/include/DB/Interpreters/Settings.h
+++ b/dbms/include/DB/Interpreters/Settings.h
@@ -70,6 +70,9 @@ struct Settings
 	  * TODO: Сейчас применяется только при запуске сервера. Можно сделать изменяемым динамически. */ \
 	M(SettingUInt64, background_pool_size, DBMS_DEFAULT_BACKGROUND_POOL_SIZE) \
 	\
+	/** Sleep time for StorageDistributed DirectoryMonitors in case there is no work or exception has been thrown */ \
+	M(SettingMilliseconds, distributed_directory_monitor_sleep_time_ms, DBMS_DISTRIBUTED_DIRECTORY_MONITOR_SLEEP_TIME_MS) \
+	\
 	M(SettingLoadBalancing, load_balancing, LoadBalancing::RANDOM) \
 	\
 	M(SettingTotalsMode, totals_mode, TotalsMode::BEFORE_HAVING) \
diff --git a/dbms/include/DB/Parsers/ASTAlterQuery.h b/dbms/include/DB/Parsers/ASTAlterQuery.h
index 3454be99222..897db72a0b9 100644
--- a/dbms/include/DB/Parsers/ASTAlterQuery.h
+++ b/dbms/include/DB/Parsers/ASTAlterQuery.h
@@ -9,7 +9,8 @@ namespace DB
  *  ALTER TABLE [db.]name_type
  *  	ADD COLUMN col_name type [AFTER col_after],
  * 		DROP COLUMN col_drop,
- * 		MODIFY COLUMN col_name type
+ * 		MODIFY COLUMN col_name type,
+ * 		DROP PARTITION partition
  * 		...
  */
 
@@ -18,16 +19,18 @@ class ASTAlterQuery : public IAST
 public:
 	enum ParameterType
 	{
-		ADD,
-		DROP,
-		MODIFY,
+		ADD_COLUMN,
+		DROP_COLUMN,
+		MODIFY_COLUMN,
+		DROP_PARTITION,
+		ATTACH_PARTITION,
 		NO_TYPE
 	};
 
 	struct Parameters
 	{
 		Parameters() : type(NO_TYPE) {}
-		int type;
+		int type = NO_TYPE;
 
 		/** В запросе ADD COLUMN здесь хранится имя и тип добавляемого столбца
 		  *  В запросе DROP это поле не используется
@@ -40,12 +43,21 @@ public:
 		  */
 		ASTPtr column;
 
+		/** В запросе DROP PARTITION здесь хранится имя partition'а.
+		  */
+		ASTPtr partition;
+		bool detach = false; /// true для DETACH PARTITION.
+
+		bool part = false; /// true для ATTACH [UNREPLICATED] PART
+		bool unreplicated = false; /// true для ATTACH UNREPLICATED ...
+
 		/// deep copy
 		void clone(Parameters & p) const
 		{
-			p.type = type;
-			p.column = column->clone();
+			p = *this;
 			p.name_type = name_type->clone();
+			p.column = column->clone();
+			p.partition = partition->clone();
 		}
 	};
 	typedef std::vector<Parameters> ParameterContainer;
@@ -54,6 +66,18 @@ public:
 	String table;
 
 
+	void addParameters(const Parameters & params)
+	{
+		parameters.push_back(params);
+		if (params.name_type)
+			children.push_back(params.name_type);
+		if (params.column)
+			children.push_back(params.column);
+		if (params.partition)
+			children.push_back(params.partition);
+	}
+
+
 	ASTAlterQuery(StringRange range_ = StringRange()) : IAST(range_) {};
 
 	/** Получить текст, который идентифицирует этот элемент. */
diff --git a/dbms/include/DB/Parsers/ASTCheckQuery.h b/dbms/include/DB/Parsers/ASTCheckQuery.h
new file mode 100644
index 00000000000..252f077374d
--- /dev/null
+++ b/dbms/include/DB/Parsers/ASTCheckQuery.h
@@ -0,0 +1,25 @@
+#pragma once
+
+#include <DB/Parsers/IAST.h>
+
+namespace DB
+{
+
+struct ASTCheckQuery : public IAST
+{
+	ASTCheckQuery(StringRange range_ = StringRange()) : IAST(range_) {};
+	ASTCheckQuery(const ASTCheckQuery & ast) = default;
+
+	/** Получить текст, который идентифицирует этот элемент. */
+	String getID() const { return ("CheckQuery_" + database + "_" + table); };
+
+	ASTPtr clone() const
+	{
+		return new ASTCheckQuery(*this);
+	}
+
+	std::string database;
+	std::string table;
+};
+
+}
diff --git a/dbms/include/DB/Parsers/ParserAlterQuery.h b/dbms/include/DB/Parsers/ParserAlterQuery.h
index d027a976c87..d871a78ce55 100644
--- a/dbms/include/DB/Parsers/ParserAlterQuery.h
+++ b/dbms/include/DB/Parsers/ParserAlterQuery.h
@@ -10,6 +10,7 @@ namespace DB
   * 	[ADD COLUMN col_name type [AFTER col_after],]
   *		[DROP COLUMN col_drop, ...]
   * 	[MODIFY COLUMN col_modify type, ...]
+  * 	[DROP PARTITION partition, ...]
   */
 class ParserAlterQuery : public IParserBase
 {
diff --git a/dbms/include/DB/Parsers/ParserCheckQuery.h b/dbms/include/DB/Parsers/ParserCheckQuery.h
new file mode 100644
index 00000000000..42832ffc5ed
--- /dev/null
+++ b/dbms/include/DB/Parsers/ParserCheckQuery.h
@@ -0,0 +1,17 @@
+#pragma once
+
+#include <DB/Parsers/IParserBase.h>
+
+namespace DB
+{
+/** Запрос вида
+ * CHECK [TABLE] [database.]table
+ */
+class ParserCheckQuery : public IParserBase
+{
+protected:
+	const char * getName() const { return "ALTER query"; }
+	bool parseImpl(Pos & pos, Pos end, ASTPtr & node, Expected & expected);
+};
+
+}
diff --git a/dbms/include/DB/Parsers/formatAST.h b/dbms/include/DB/Parsers/formatAST.h
index 92efb23ffb7..a9be893e06c 100644
--- a/dbms/include/DB/Parsers/formatAST.h
+++ b/dbms/include/DB/Parsers/formatAST.h
@@ -24,6 +24,7 @@
 #include <DB/Parsers/ASTAlterQuery.h>
 #include <DB/Parsers/ASTShowProcesslistQuery.h>
 #include <DB/Parsers/ASTJoin.h>
+#include <DB/Parsers/ASTCheckQuery.h>
 //#include <DB/Parsers/ASTMultiQuery.h>
 
 
@@ -57,6 +58,7 @@ void formatAST(const ASTOrderByElement	& ast, std::ostream & s, size_t indent =
 void formatAST(const ASTSubquery		& ast, std::ostream & s, size_t indent = 0, bool hilite = true, bool one_line = false, bool need_parens = false);
 void formatAST(const ASTAlterQuery 		& ast, std::ostream & s, size_t indent = 0, bool hilite = true, bool one_line = false, bool need_parens = false);
 void formatAST(const ASTJoin 			& ast, std::ostream & s, size_t indent = 0, bool hilite = true, bool one_line = false, bool need_parens = false);
+void formatAST(const ASTCheckQuery 		& ast, std::ostream & s, size_t indent = 0, bool hilite = true, bool one_line = false, bool need_parens = false);
 //void formatAST(const ASTMultiQuery 		& ast, std::ostream & s, size_t indent = 0, bool hilite = true, bool one_line = false, bool need_parens = false);
 
 void formatAST(const ASTQueryWithTableAndOutput & ast, std::string name, std::ostream & s,
diff --git a/dbms/include/DB/Storages/AlterCommands.h b/dbms/include/DB/Storages/AlterCommands.h
index c2dc7485fa2..50650a1bc56 100644
--- a/dbms/include/DB/Storages/AlterCommands.h
+++ b/dbms/include/DB/Storages/AlterCommands.h
@@ -6,7 +6,7 @@
 namespace DB
 {
 
-/// Операция из запроса ALTER. Добавление столбцов типа Nested не развернуто в добавление отдельных столбцов.
+/// Операция из запроса ALTER (кроме DROP PARTITION). Добавление столбцов типа Nested не развернуто в добавление отдельных столбцов.
 struct AlterCommand
 {
 	enum Type
diff --git a/dbms/include/DB/Storages/Distributed/DirectoryMonitor.h b/dbms/include/DB/Storages/Distributed/DirectoryMonitor.h
new file mode 100644
index 00000000000..3438dfd9bb2
--- /dev/null
+++ b/dbms/include/DB/Storages/Distributed/DirectoryMonitor.h
@@ -0,0 +1,207 @@
+#pragma once
+
+#include <DB/DataStreams/RemoteBlockOutputStream.h>
+#include <DB/Common/escapeForFileName.h>
+#include <DB/Storages/StorageDistributed.h>
+#include <boost/algorithm/string/find_iterator.hpp>
+#include <boost/algorithm/string/finder.hpp>
+#include <thread>
+#include <mutex>
+
+namespace DB
+{
+
+namespace
+{
+	template <typename PoolFactory>
+	ConnectionPools createPoolsForAddresses(const std::string & name, PoolFactory && factory)
+	{
+		ConnectionPools pools;
+
+		for (auto it = boost::make_split_iterator(name, boost::first_finder(",")); it != decltype(it){}; ++it)
+		{
+			const auto address = boost::copy_range<std::string>(*it);
+
+			const auto user_pw_end = strchr(address.data(), '@');
+			const auto colon = strchr(address.data(), ':');
+			if (!user_pw_end || !colon)
+				throw Exception{
+					"Shard address '" + address + "' does not match to 'user[:password]@host:port' pattern",
+					ErrorCodes::INCORRECT_FILE_NAME
+				};
+
+			const auto has_pw = colon < user_pw_end;
+			const auto host_end = has_pw ? strchr(user_pw_end + 1, ':') : colon;
+			if (!host_end)
+				throw Exception{
+					"Shard address '" + address + "' does not contain port",
+					ErrorCodes::INCORRECT_FILE_NAME
+				};
+
+			const auto user = unescapeForFileName({address.data(), has_pw ? colon : user_pw_end});
+			const auto password = has_pw ? unescapeForFileName({colon + 1, user_pw_end}) : std::string{};
+			const auto host = unescapeForFileName({user_pw_end + 1, host_end});
+			const auto port = parse<UInt16>(host_end + 1);
+
+			pools.emplace_back(factory(host, port, user, password));
+		}
+
+		return pools;
+	}
+}
+
+/** Implementation for StorageDistributed::DirectoryMonitor nested class.
+ *  This type is not designed for standalone use. */
+class StorageDistributed::DirectoryMonitor
+{
+public:
+	DirectoryMonitor(StorageDistributed & storage, const std::string & name)
+		: storage(storage), pool{createPool(name)}, path{storage.path + name + '/'}
+		, sleep_time{storage.context.getSettingsRef().distributed_directory_monitor_sleep_time_ms.totalMilliseconds()}
+		, log{&Logger::get(getLoggerName())}
+	{
+	}
+
+	~DirectoryMonitor()
+	{
+		{
+			quit = true;
+			std::lock_guard<std::mutex> lock{mutex};
+		}
+		cond.notify_one();
+		thread.join();
+	}
+
+private:
+	void run()
+	{
+		std::unique_lock<std::mutex> lock{mutex};
+
+		const auto quit_requested = [this] { return quit; };
+
+		while (!quit_requested())
+		{
+			auto do_sleep = true;
+
+			try
+			{
+				do_sleep = !findFiles();
+			}
+			catch (...)
+			{
+				do_sleep = true;
+				tryLogCurrentException(getLoggerName().data());
+			}
+
+			if (do_sleep)
+				cond.wait_for(lock, sleep_time, quit_requested);
+		}
+	}
+
+	ConnectionPoolPtr createPool(const std::string & name)
+	{
+		const auto pool_factory = [this, &name] (const std::string & host, const UInt16 port,
+												 const std::string & user, const std::string & password) {
+			return new ConnectionPool{
+				1, host, port, "",
+				user, password, storage.context.getDataTypeFactory(),
+				storage.getName() + '_' + name};
+		};
+
+		auto pools = createPoolsForAddresses(name, pool_factory);
+
+		return pools.size() == 1 ? pools.front() : new ConnectionPoolWithFailover(pools, LoadBalancing::RANDOM);
+	}
+
+	bool findFiles()
+	{
+		std::map<UInt64, std::string> files;
+
+		Poco::DirectoryIterator end;
+		for (Poco::DirectoryIterator it{path}; it != end; ++it)
+		{
+			const auto & file_path_str = it->path();
+			Poco::Path file_path{file_path_str};
+
+			if (!it->isDirectory() && 0 == strncmp(file_path.getExtension().data(), "bin", strlen("bin")))
+				files[parse<UInt64>(file_path.getBaseName())] = file_path_str;
+		}
+
+		if (files.empty())
+			return false;
+
+		for (const auto & file : files)
+		{
+			if (quit)
+				return true;
+
+			processFile(file.second);
+		}
+
+		return true;
+	}
+
+	void processFile(const std::string & file_path)
+	{
+		LOG_TRACE(log, "Started processing `" << file_path << '`');
+		auto connection = pool->get();
+
+		try
+		{
+			ReadBufferFromFile in{file_path};
+
+			std::string insert_query;
+			readStringBinary(insert_query, in);
+
+			RemoteBlockOutputStream remote{*connection, insert_query};
+
+			remote.writePrefix();
+			remote.writePrepared(in);
+			remote.writeSuffix();
+		}
+		catch (const Exception & e)
+		{
+			const auto code = e.code();
+
+			/// mark file as broken if necessary
+			if (code == ErrorCodes::CHECKSUM_DOESNT_MATCH ||
+				code == ErrorCodes::TOO_LARGE_SIZE_COMPRESSED ||
+				code == ErrorCodes::CANNOT_READ_ALL_DATA)
+			{
+				const auto last_path_separator_pos = file_path.rfind('/');
+				const auto & path = file_path.substr(0, last_path_separator_pos + 1);
+				const auto & file_name = file_path.substr(last_path_separator_pos + 1);
+				const auto & broken_path = path + "broken/";
+				const auto & broken_file_path = broken_path + file_name;
+
+				Poco::File{broken_path}.createDirectory();
+				Poco::File{file_path}.renameTo(broken_file_path);
+
+				LOG_ERROR(log, "Renamed `" << file_path << "` to `" << broken_file_path << '`');
+			}
+
+			throw;
+		}
+
+		Poco::File{file_path}.remove();
+
+		LOG_TRACE(log, "Finished processing `" << file_path << '`');
+	}
+
+	std::string getLoggerName() const
+	{
+		return storage.name + '.' + storage.getName() + ".DirectoryMonitor";
+	}
+
+	StorageDistributed & storage;
+	ConnectionPoolPtr pool;
+	std::string path;
+	std::chrono::milliseconds sleep_time;
+	bool quit{false};
+	std::mutex mutex;
+	std::condition_variable cond;
+	Logger * log;
+	std::thread thread{&DirectoryMonitor::run, this};
+};
+
+}
diff --git a/dbms/include/DB/Storages/Distributed/DistributedBlockOutputStream.h b/dbms/include/DB/Storages/Distributed/DistributedBlockOutputStream.h
new file mode 100644
index 00000000000..1bddee6b5cc
--- /dev/null
+++ b/dbms/include/DB/Storages/Distributed/DistributedBlockOutputStream.h
@@ -0,0 +1,217 @@
+#pragma once
+
+#include <DB/Storages/StorageDistributed.h>
+#include <DB/Storages/Distributed/queryToString.h>
+
+#include <DB/IO/WriteBufferFromFile.h>
+#include <DB/IO/CompressedWriteBuffer.h>
+#include <DB/DataStreams/NativeBlockOutputStream.h>
+#include <DB/Interpreters/InterpreterInsertQuery.h>
+
+#include <statdaemons/Increment.h>
+#include <statdaemons/stdext.h>
+
+#include <iostream>
+#include <type_traits>
+
+namespace DB
+{
+
+/** Запись асинхронная - данные сначала записываются на локальную файловую систему, а потом отправляются на удалённые серверы.
+ *  Если Distributed таблица использует более одного шарда, то для того, чтобы поддерживалась запись,
+ *  при создании таблицы должен быть указан дополнительный параметр у ENGINE - ключ шардирования.
+ *  Ключ шардирования - произвольное выражение от столбцов. Например, rand() или UserID.
+ *  При записи блок данных разбивается по остатку от деления ключа шардирования на суммарный вес шардов,
+ *  и полученные блоки пишутся в сжатом Native формате в отдельные директории для отправки.
+ *  Для каждого адреса назначения (каждой директории с данными для отправки), в StorageDistributed создаётся отдельный поток,
+ *  который следит за директорией и отправляет данные. */
+class DistributedBlockOutputStream : public IBlockOutputStream
+{
+public:
+	DistributedBlockOutputStream(StorageDistributed & storage, const ASTPtr & query_ast)
+		: storage(storage), query_ast(query_ast)
+	{
+	}
+
+	void write(const Block & block) override
+	{
+		if (storage.getShardingKeyExpr() && storage.cluster.shard_info_vec.size() > 1)
+			return writeSplit(block);
+
+		writeImpl(block);
+	}
+
+private:
+	template <typename T>
+	static std::vector<IColumn::Filter> createFiltersImpl(const size_t num_rows, const IColumn * column, const Cluster & cluster)
+	{
+		const auto total_weight = cluster.slot_to_shard.size();
+		const auto num_shards = cluster.shard_info_vec.size();
+		std::vector<IColumn::Filter> filters(num_shards);
+
+		/** Деление отрицательного числа с остатком на положительное, в C++ даёт отрицательный остаток.
+		  * Для данной задачи это не подходит. Поэтому, будем обрабатывать знаковые типы как беззнаковые.
+		  * Это даёт уже что-то совсем не похожее на деление с остатком, но подходящее для данной задачи.
+		  */
+		using UnsignedT = typename std::make_unsigned<T>::type;
+
+		/// const columns contain only one value, therefore we do not need to read it at every iteration
+		if (column->isConst())
+		{
+			const auto data = typeid_cast<const ColumnConst<T> *>(column)->getData();
+			const auto shard_num = cluster.slot_to_shard[static_cast<UnsignedT>(data) % total_weight];
+
+			for (size_t i = 0; i < num_shards; ++i)
+				filters[i].assign(num_rows, static_cast<UInt8>(shard_num == i));
+		}
+		else
+		{
+			const auto & data = typeid_cast<const ColumnVector<T> *>(column)->getData();
+
+			for (size_t i = 0; i < num_shards; ++i)
+			{
+				filters[i].resize(num_rows);
+				for (size_t j = 0; j < num_rows; ++j)
+					filters[i][j] = cluster.slot_to_shard[static_cast<UnsignedT>(data[j]) % total_weight] == i;
+			}
+		}
+
+		return filters;
+	}
+
+	std::vector<IColumn::Filter> createFilters(Block block)
+	{
+		using create_filters_sig = std::vector<IColumn::Filter>(size_t, const IColumn *, const Cluster &);
+		/// hashmap of pointers to functions corresponding to each integral type
+		static std::unordered_map<std::string, create_filters_sig *> creators{
+			{ TypeName<UInt8>::get(), &createFiltersImpl<UInt8> },
+			{ TypeName<UInt16>::get(), &createFiltersImpl<UInt16> },
+			{ TypeName<UInt32>::get(), &createFiltersImpl<UInt32> },
+			{ TypeName<UInt64>::get(), &createFiltersImpl<UInt64> },
+			{ TypeName<Int8>::get(), &createFiltersImpl<Int8> },
+			{ TypeName<Int16>::get(), &createFiltersImpl<Int16> },
+			{ TypeName<Int32>::get(), &createFiltersImpl<Int32> },
+			{ TypeName<Int64>::get(), &createFiltersImpl<Int64> },
+		};
+
+		storage.getShardingKeyExpr()->execute(block);
+
+		const auto & key_column = block.getByName(storage.getShardingKeyColumnName());
+
+		/// check that key column has valid type
+		const auto it = creators.find(key_column.type->getName());
+
+		return it != std::end(creators)
+			? (*it->second)(block.rowsInFirstColumn(), key_column.column.get(), storage.cluster)
+			: throw Exception{
+				"Sharding key expression does not evaluate to an integer type",
+				ErrorCodes::TYPE_MISMATCH
+			};
+	}
+
+	void writeSplit(const Block & block)
+	{
+		const auto num_cols = block.columns();
+		/// cache column pointers for later reuse
+		std::vector<const IColumn*> columns(num_cols);
+		for (size_t i = 0; i < columns.size(); ++i)
+			columns[i] = block.getByPosition(i).column;
+
+		auto filters = createFilters(block);
+
+		const auto num_shards = storage.cluster.shard_info_vec.size();
+		for (size_t i = 0; i < num_shards; ++i)
+		{
+			auto target_block = block.cloneEmpty();
+
+			for (size_t col = 0; col < num_cols; ++col)
+				target_block.getByPosition(col).column = columns[col]->filter(filters[i]);
+
+			if (target_block.rowsInFirstColumn())
+				writeImpl(target_block, i);
+		}
+	}
+
+	void writeImpl(const Block & block, const size_t shard_id = 0)
+	{
+		const auto & shard_info = storage.cluster.shard_info_vec[shard_id];
+		if (shard_info.num_local_nodes)
+			writeToLocal(block, shard_info.num_local_nodes);
+
+		/// dir_names is empty if shard has only local addresses
+		if (!shard_info.dir_names.empty())
+			writeToShard(block, shard_info.dir_names);
+	}
+
+	void writeToLocal(const Block & block, const size_t repeats)
+	{
+		InterpreterInsertQuery interp{query_ast, storage.context};
+
+		auto block_io = interp.execute();
+		block_io.out->writePrefix();
+
+		for (size_t i = 0; i < repeats; ++i)
+			block_io.out->write(block);
+
+		block_io.out->writeSuffix();
+	}
+
+	void writeToShard(const Block & block, const std::vector<std::string> & dir_names)
+	{
+		/** tmp directory is used to ensure atomicity of transactions
+		 *  and keep monitor thread out from reading incomplete data
+		 */
+		std::string first_file_tmp_path{};
+
+		auto first = true;
+		const auto & query_string = queryToString(query_ast);
+
+		/// write first file, hardlink the others
+		for (const auto & dir_name : dir_names)
+		{
+			const auto & path = storage.getPath() + dir_name + '/';
+
+			/// ensure shard subdirectory creation and notify storage
+			if (Poco::File(path).createDirectory())
+				storage.requireDirectoryMonitor(dir_name);
+
+			const auto & file_name = toString(Increment{path + "increment.txt"}.get(true)) + ".bin";
+			const auto & block_file_path = path + file_name;
+
+			/** on first iteration write block to a temporary directory for subsequent hardlinking to ensure
+			 *  the inode is not freed until we're done */
+			if (first)
+			{
+				first = false;
+
+				const auto & tmp_path = path + "tmp/";
+				Poco::File(tmp_path).createDirectory();
+				const auto & block_file_tmp_path = tmp_path + file_name;
+
+				first_file_tmp_path = block_file_tmp_path;
+
+				WriteBufferFromFile out{block_file_tmp_path};
+				CompressedWriteBuffer compress{out};
+				NativeBlockOutputStream stream{compress};
+
+				writeStringBinary(query_string, out);
+
+				stream.writePrefix();
+				stream.write(block);
+				stream.writeSuffix();
+			}
+
+			if (link(first_file_tmp_path.data(), block_file_path.data()))
+				throwFromErrno("Could not link " + block_file_path + " to " + first_file_tmp_path);
+		}
+
+		/** remove the temporary file, enabling the OS to reclaim inode after all threads
+		 *  have removed their corresponding files */
+		Poco::File(first_file_tmp_path).remove();
+	}
+
+	StorageDistributed & storage;
+	ASTPtr query_ast;
+};
+
+}
diff --git a/dbms/include/DB/Storages/Distributed/queryToString.h b/dbms/include/DB/Storages/Distributed/queryToString.h
new file mode 100644
index 00000000000..9f1b243ed9f
--- /dev/null
+++ b/dbms/include/DB/Storages/Distributed/queryToString.h
@@ -0,0 +1,14 @@
+#pragma once
+
+#include <DB/Parsers/formatAST.h>
+
+namespace DB
+{
+	inline std::string queryToString(const ASTPtr & query)
+	{
+		std::ostringstream s;
+		formatAST(*query, s, 0, false, true);
+
+		return s.str();
+	}
+}
diff --git a/dbms/include/DB/Storages/IStorage.h b/dbms/include/DB/Storages/IStorage.h
index 97b07831a96..70ed1b158b4 100644
--- a/dbms/include/DB/Storages/IStorage.h
+++ b/dbms/include/DB/Storages/IStorage.h
@@ -205,6 +205,20 @@ public:
 		throw Exception("Method alter is not supported by storage " + getName(), ErrorCodes::NOT_IMPLEMENTED);
 	}
 
+	/** Выполнить запрос (DROP|DETACH) PARTITION.
+	  */
+	virtual void dropPartition(const Field & partition, bool detach)
+	{
+		throw Exception("Method dropPartition is not supported by storage " + getName(), ErrorCodes::NOT_IMPLEMENTED);
+	}
+
+	/** Выполнить запрос ATTACH [UNREPLICATED] (PART|PARTITION).
+	  */
+	virtual void attachPartition(const Field & partition, bool unreplicated, bool part)
+	{
+		throw Exception("Method attachPartition is not supported by storage " + getName(), ErrorCodes::NOT_IMPLEMENTED);
+	}
+
 	/** Выполнить какую-либо фоновую работу. Например, объединение кусков в таблице типа MergeTree.
 	  * Возвращает - была ли выполнена какая-либо работа.
 	  */
@@ -248,6 +262,9 @@ public:
 	/// Поддерживается ли индекс в секции IN
 	virtual bool supportsIndexForIn() const { return false; };
 
+	/// проверяет валидность данных
+	virtual bool checkData() const { throw DB::Exception("Check query is not supported for " + getName() + " storage"); }
+
 protected:
 	IStorage() : is_dropped(false) {}
 
diff --git a/dbms/include/DB/Storages/MergeTree/AbandonableLockInZooKeeper.h b/dbms/include/DB/Storages/MergeTree/AbandonableLockInZooKeeper.h
index 09e7a67c653..6f60cd37b94 100644
--- a/dbms/include/DB/Storages/MergeTree/AbandonableLockInZooKeeper.h
+++ b/dbms/include/DB/Storages/MergeTree/AbandonableLockInZooKeeper.h
@@ -13,7 +13,7 @@ namespace DB
   * При вызове деструктора или завершении сессии в ZooKeeper, переходит в состояние ABANDONED.
   *  (В том числе при падении программы)
   */
-class AbandonableLockInZooKeeper
+class AbandonableLockInZooKeeper : private boost::noncopyable
 {
 public:
 	enum State
@@ -34,6 +34,14 @@ public:
 		path = zookeeper.create(path_prefix, holder_path, zkutil::CreateMode::PersistentSequential);
 	}
 
+	AbandonableLockInZooKeeper(AbandonableLockInZooKeeper && rhs)
+		: zookeeper(rhs.zookeeper)
+	{
+		std::swap(path_prefix, rhs.path_prefix);
+		std::swap(path, rhs.path);
+		std::swap(holder_path, rhs.holder_path);
+	}
+
 	String getPath()
 	{
 		return path;
@@ -49,6 +57,7 @@ public:
 	{
 		zookeeper.remove(path);
 		zookeeper.remove(holder_path);
+		holder_path = "";
 	}
 
 	/// Добавляет в список действия, эквивалентные unlock().
@@ -60,6 +69,9 @@ public:
 
 	~AbandonableLockInZooKeeper()
 	{
+		if (holder_path.empty())
+			return;
+
 		try
 		{
 			zookeeper.tryRemove(holder_path);
diff --git a/dbms/include/DB/Storages/MergeTree/ActiveDataPartSet.h b/dbms/include/DB/Storages/MergeTree/ActiveDataPartSet.h
index 9543aa991e9..807087f7da9 100644
--- a/dbms/include/DB/Storages/MergeTree/ActiveDataPartSet.h
+++ b/dbms/include/DB/Storages/MergeTree/ActiveDataPartSet.h
@@ -63,12 +63,14 @@ public:
 	void add(const String & name);
 	String getContainingPart(const String & name) const;
 
-	Strings getParts() const;
+	Strings getParts() const; /// В порядке возрастания месяца и номера блока.
+
+	size_t size() const;
 
 	static String getPartName(DayNum_t left_date, DayNum_t right_date, UInt64 left_id, UInt64 right_id, UInt64 level);
 
 	/// Возвращает true если имя директории совпадает с форматом имени директории кусочков
-	static bool isPartDirectory(const String & dir_name, Poco::RegularExpression::MatchVec & matches);
+	static bool isPartDirectory(const String & dir_name, Poco::RegularExpression::MatchVec * out_matches = nullptr);
 
 	/// Кладет в DataPart данные из имени кусочка.
 	static void parsePartName(const String & file_name, Part & part, const Poco::RegularExpression::MatchVec * matches = nullptr);
diff --git a/dbms/include/DB/Storages/MergeTree/BackgroundProcessingPool.h b/dbms/include/DB/Storages/MergeTree/BackgroundProcessingPool.h
index de2b10cf11e..b846a1e037d 100644
--- a/dbms/include/DB/Storages/MergeTree/BackgroundProcessingPool.h
+++ b/dbms/include/DB/Storages/MergeTree/BackgroundProcessingPool.h
@@ -16,15 +16,21 @@
 namespace DB
 {
 
-/** В нескольких потоках в бесконечном цикле выполняет указанные функции.
+/** Используя фиксированное количество потоков, выполнять произвольное количество задач в бесконечном цикле.
+  * Предназначена для задач, выполняющих постоянную фоновую работу (например, слияния).
+  * Задача - функция, возвращающая bool - сделала ли она какую-либо работу.
+  * Если сделала - надо выполнить ещё раз. Если нет - надо подождать несколько секунд, или до события wake, и выполнить ещё раз.
+  *
+  * Также, задача во время выполнения может временно увеличить какой-либо счётчик, относящийся ко всем задачам
+  *  - например, число одновременно идующих слияний.
   */
 class BackgroundProcessingPool
 {
 public:
 	typedef std::map<String, int> Counters;
 
-	/** Используется изнутри таски. Позволяет инкрементировать какие-нибудь счетчики.
-	  * После завершения таски, все изменения откатятся.
+	/** Используется изнутри задачи. Позволяет инкрементировать какие-нибудь счетчики.
+	  * После завершения задачи, все изменения откатятся.
 	  * Например, чтобы можно было узнавать количество потоков, выполняющих большое слияние,
 	  *  можно в таске, выполняющей большое слияние, инкрементировать счетчик. Декрементировать обратно его не нужно.
 	  */
@@ -57,10 +63,14 @@ public:
 		/// Переставить таск в начало очереди и разбудить какой-нибудь поток.
 		void wake()
 		{
+			Poco::ScopedReadRWLock rlock(rwlock);
+			if (removed)
+				return;
+
 			std::unique_lock<std::mutex> lock(pool.mutex);
 			pool.tasks.splice(pool.tasks.begin(), pool.tasks, iterator);
 
-			/// Не очень надежно: если все потоки сейчас выполняют работу, этот вызов никого не разбудит,
+			/// Не очень надёжно: если все потоки сейчас выполняют работу, этот вызов никого не разбудит,
 			///  и все будут спать в конце итерации.
 			pool.wake_event.notify_one();
 		}
@@ -70,50 +80,32 @@ public:
 
 		BackgroundProcessingPool & pool;
 		Task function;
-		Poco::RWLock lock;
-		volatile bool removed;
+
+		/// При выполнении задачи, держится read lock. Переменная removed меняется под write lock-ом.
+		Poco::RWLock rwlock;
+		volatile bool removed = false;
+
 		std::list<std::shared_ptr<TaskInfo>>::iterator iterator;
 
-		TaskInfo(BackgroundProcessingPool & pool_, const Task & function_) : pool(pool_), function(function_), removed(false) {}
+		TaskInfo(BackgroundProcessingPool & pool_, const Task & function_) : pool(pool_), function(function_) {}
 	};
 
 	typedef std::shared_ptr<TaskInfo> TaskHandle;
 
 
-	BackgroundProcessingPool(int size_) : size(size_), sleep_seconds(10), shutdown(false) {}
-
-	void setNumberOfThreads(int size_)
+	BackgroundProcessingPool(int size_) : size(size_)
 	{
-		if (size_ <= 0)
-			throw Exception("Invalid number of threads: " + toString(size_), ErrorCodes::ARGUMENT_OUT_OF_BOUND);
-
-		std::unique_lock<std::mutex> tlock(threads_mutex);
-		std::unique_lock<std::mutex> lock(mutex);
-
-		if (size_ == size)
-			return;
-
-		if (threads.empty())
-		{
-			size = size_;
-			return;
-		}
-
-		throw Exception("setNumberOfThreads is not implemented for non-empty pool", ErrorCodes::NOT_IMPLEMENTED);
+		threads.resize(size);
+		for (auto & thread : threads)
+			 thread = std::thread([this] { threadFunction(); });
 	}
 
-	int getNumberOfThreads()
+
+	int getNumberOfThreads() const
 	{
-		std::unique_lock<std::mutex> lock(mutex);
 		return size;
 	}
 
-	void setSleepTime(double seconds)
-	{
-		std::unique_lock<std::mutex> lock(mutex);
-		sleep_seconds = seconds;
-	}
-
 	int getCounter(const String & name)
 	{
 		std::unique_lock<std::mutex> lock(mutex);
@@ -122,8 +114,6 @@ public:
 
 	TaskHandle addTask(const Task & task)
 	{
-		std::unique_lock<std::mutex> lock(threads_mutex);
-
 		TaskHandle res(new TaskInfo(*this, task));
 
 		{
@@ -132,44 +122,22 @@ public:
 			res->iterator = --tasks.end();
 		}
 
-		if (threads.empty())
-		{
-			shutdown = false;
-			counters.clear();
-			threads.resize(size);
-			for (std::thread & thread : threads)
-				 thread = std::thread(std::bind(&BackgroundProcessingPool::threadFunction, this));
-		}
+		wake_event.notify_all();
 
 		return res;
 	}
 
 	void removeTask(const TaskHandle & task)
 	{
-		std::unique_lock<std::mutex> tlock(threads_mutex);
-
-		/// Дождемся завершения всех выполнений этой задачи.
+		/// Дождёмся завершения всех выполнений этой задачи.
 		{
-			Poco::ScopedWriteRWLock wlock(task->lock);
+			Poco::ScopedWriteRWLock wlock(task->rwlock);
 			task->removed = true;
 		}
 
 		{
 			std::unique_lock<std::mutex> lock(mutex);
-			auto it = std::find(tasks.begin(), tasks.end(), task);
-			if (it == tasks.end())
-				throw Exception("Task not found", ErrorCodes::LOGICAL_ERROR);
-			tasks.erase(it);
-		}
-
-		if (tasks.empty())
-		{
-			shutdown = true;
-			wake_event.notify_all();
-			for (std::thread & thread : threads)
-				thread.join();
-			threads.clear();
-			counters.clear();
+			tasks.erase(task->iterator);
 		}
 	}
 
@@ -177,15 +145,10 @@ public:
 	{
 		try
 		{
-			std::unique_lock<std::mutex> lock(threads_mutex);
-			if (!threads.empty())
-			{
-				LOG_ERROR(&Logger::get("~BackgroundProcessingPool"), "Destroying non-empty BackgroundProcessingPool");
-				shutdown = true;
-				wake_event.notify_all();
-				for (std::thread & thread : threads)
-					thread.join();
-			}
+			shutdown = true;
+			wake_event.notify_all();
+			for (std::thread & thread : threads)
+				thread.join();
 		}
 		catch (...)
 		{
@@ -197,24 +160,25 @@ private:
 	typedef std::list<TaskHandle> Tasks;
 	typedef std::vector<std::thread> Threads;
 
-	std::mutex threads_mutex;
-	std::mutex mutex;
-	int size;
-	Tasks tasks; /// Таски в порядке, в котором мы планируем их выполнять.
-	Threads threads;
-	Counters counters;
-	double sleep_seconds;
+	const size_t size;
+	static constexpr double sleep_seconds = 10;
 
-	volatile bool shutdown;
+	Tasks tasks; 		/// Задачи в порядке, в котором мы планируем их выполнять.
+	Counters counters;
+	std::mutex mutex;	/// Для работы со списком tasks, а также с counters (когда threads не пустой).
+
+	Threads threads;
+
+	volatile bool shutdown = false;
 	std::condition_variable wake_event;
 
+
 	void threadFunction()
 	{
 		while (!shutdown)
 		{
 			Counters counters_diff;
 			bool need_sleep = false;
-			size_t tasks_count = 1;
 
 			try
 			{
@@ -236,11 +200,12 @@ private:
 
 				if (!task)
 				{
-					std::this_thread::sleep_for(std::chrono::duration<double>(sleep_seconds));
+					std::unique_lock<std::mutex> lock(mutex);
+					wake_event.wait_for(lock, std::chrono::duration<double>(sleep_seconds));
 					continue;
 				}
 
-				Poco::ScopedReadRWLock rlock(task->lock);
+				Poco::ScopedReadRWLock rlock(task->rwlock);
 				if (task->removed)
 					continue;
 
@@ -248,15 +213,11 @@ private:
 
 				if (task->function(context))
 				{
-					/// Если у таска получилось выполнить какую-то работу, запустим его снова без паузы.
-					std::unique_lock<std::mutex> lock(mutex);
+					/// Если у задачи получилось выполнить какую-то работу, запустим её снова без паузы.
+					need_sleep = false;
 
-					auto it = std::find(tasks.begin(), tasks.end(), task);
-					if (it != tasks.end())
-					{
-						need_sleep = false;
-						tasks.splice(tasks.begin(), tasks, it);
-					}
+					std::unique_lock<std::mutex> lock(mutex);
+					tasks.splice(tasks.begin(), tasks, task->iterator);
 				}
 			}
 			catch (...)
@@ -265,14 +226,12 @@ private:
 				tryLogCurrentException(__PRETTY_FUNCTION__);
 			}
 
-			/// Вычтем все счетчики обратно.
+			/// Вычтем все счётчики обратно.
 			if (!counters_diff.empty())
 			{
 				std::unique_lock<std::mutex> lock(mutex);
 				for (const auto & it : counters_diff)
-				{
 					counters[it.first] -= it.second;
-				}
 			}
 
 			if (shutdown)
@@ -281,7 +240,7 @@ private:
 			if (need_sleep)
 			{
 				std::unique_lock<std::mutex> lock(mutex);
-				wake_event.wait_for(lock, std::chrono::duration<double>(sleep_seconds / tasks_count));
+				wake_event.wait_for(lock, std::chrono::duration<double>(sleep_seconds));
 			}
 		}
 	}
diff --git a/dbms/include/DB/Storages/MergeTree/DiskSpaceMonitor.h b/dbms/include/DB/Storages/MergeTree/DiskSpaceMonitor.h
index 5c81a0d4dfd..04a28e996c1 100644
--- a/dbms/include/DB/Storages/MergeTree/DiskSpaceMonitor.h
+++ b/dbms/include/DB/Storages/MergeTree/DiskSpaceMonitor.h
@@ -26,27 +26,51 @@ public:
 		{
 			try
 			{
-				Poco::ScopedLock<Poco::FastMutex> lock(DiskSpaceMonitor::reserved_bytes_mutex);
+				Poco::ScopedLock<Poco::FastMutex> lock(DiskSpaceMonitor::mutex);
 				if (DiskSpaceMonitor::reserved_bytes < size)
 				{
 					DiskSpaceMonitor::reserved_bytes = 0;
-					LOG_ERROR(&Logger::get("DiskSpaceMonitor"), "Unbalanced reservations; it's a bug");
+					LOG_ERROR(&Logger::get("DiskSpaceMonitor"), "Unbalanced reservations size; it's a bug");
 				}
 				else
 				{
 					DiskSpaceMonitor::reserved_bytes -= size;
 				}
+
+				if (DiskSpaceMonitor::reservation_count == 0)
+				{
+					LOG_ERROR(&Logger::get("DiskSpaceMonitor"), "Unbalanced reservation count; it's a bug");
+				}
+				else
+				{
+					--DiskSpaceMonitor::reservation_count;
+				}
 			}
 			catch (...)
 			{
 				tryLogCurrentException("~DiskSpaceMonitor");
 			}
 		}
+
+		/// Изменить количество зарезервированного места. При увеличении не делается проверка, что места достаточно.
+		void update(size_t new_size)
+		{
+			Poco::ScopedLock<Poco::FastMutex> lock(DiskSpaceMonitor::mutex);
+			DiskSpaceMonitor::reserved_bytes -= size;
+			size = new_size;
+			DiskSpaceMonitor::reserved_bytes += size;
+		}
+
+		size_t getSize() const
+		{
+			return size;
+		}
 	private:
 		Reservation(size_t size_) : size(size_)
 		{
-			Poco::ScopedLock<Poco::FastMutex> lock(DiskSpaceMonitor::reserved_bytes_mutex);
+			Poco::ScopedLock<Poco::FastMutex> lock(DiskSpaceMonitor::mutex);
 			DiskSpaceMonitor::reserved_bytes += size;
+			++DiskSpaceMonitor::reservation_count;
 		}
 		size_t size;
 	};
@@ -65,7 +89,7 @@ public:
 		/// Зарезервируем дополнительно 30 МБ. Когда я тестировал, statvfs показывал на несколько мегабайт больше свободного места, чем df.
 		res -= std::min(res, 30 * (1ul << 20));
 
-		Poco::ScopedLock<Poco::FastMutex> lock(reserved_bytes_mutex);
+		Poco::ScopedLock<Poco::FastMutex> lock(mutex);
 
 		if (reserved_bytes > res)
 			res = 0;
@@ -75,6 +99,18 @@ public:
 		return res;
 	}
 
+	static size_t getReservedSpace()
+	{
+		Poco::ScopedLock<Poco::FastMutex> lock(mutex);
+		return reserved_bytes;
+	}
+
+	static size_t getReservationCount()
+	{
+		Poco::ScopedLock<Poco::FastMutex> lock(mutex);
+		return reservation_count;
+	}
+
 	/// Если места (приблизительно) недостаточно, бросает исключение.
 	static ReservationPtr reserve(const std::string & path, size_t size)
 	{
@@ -87,7 +123,8 @@ public:
 
 private:
 	static size_t reserved_bytes;
-	static Poco::FastMutex reserved_bytes_mutex;
+	static size_t reservation_count;
+	static Poco::FastMutex mutex;
 };
 
 }
diff --git a/dbms/include/DB/Storages/MergeTree/MergeTreeData.h b/dbms/include/DB/Storages/MergeTree/MergeTreeData.h
index 0aa257df3a5..114158f5c65 100644
--- a/dbms/include/DB/Storages/MergeTree/MergeTreeData.h
+++ b/dbms/include/DB/Storages/MergeTree/MergeTreeData.h
@@ -100,7 +100,7 @@ struct MergeTreeSettings
 	size_t max_rows_to_use_cache = 1024 * 1024;
 
 	/// Через сколько секунд удалять ненужные куски.
-	time_t old_parts_lifetime = 5 * 60;
+	time_t old_parts_lifetime = 8 * 60;
 
 	/// Если в таблице хотя бы столько активных кусков, искусственно замедлять вставки в таблицу.
 	size_t parts_to_delay_insert = 150;
@@ -110,11 +110,17 @@ struct MergeTreeSettings
 	double insert_delay_step = 1.1;
 
 	/// Для скольки последних блоков хранить хеши в ZooKeeper.
-	size_t replicated_deduplication_window = 1000;
+	size_t replicated_deduplication_window = 100;
 
 	/// Хранить примерно столько последних записей в логе в ZooKeeper, даже если они никому уже не нужны.
 	/// Не влияет на работу таблиц; используется только чтобы успеть посмотреть на лог в ZooKeeper глазами прежде, чем его очистят.
 	size_t replicated_logs_to_keep = 100;
+
+	/// Максимальное количество ошибок при загрузке кусков, при котором ReplicatedMergeTree соглашается запускаться.
+	size_t replicated_max_unexpected_parts = 3;
+	size_t replicated_max_unexpectedly_merged_parts = 2;
+	size_t replicated_max_missing_obsolete_parts = 5;
+	size_t replicated_max_missing_active_parts = 20;
 };
 
 class MergeTreeData : public ITableDeclaration
@@ -307,17 +313,22 @@ public:
 			Poco::File(to).remove(true);
 		}
 
-		/// Переименовывает кусок, дописав к имени префикс.
-		void renameAddPrefix(const String & prefix) const
+		void renameTo(const String & new_name) const
 		{
 			String from = storage.full_path + name + "/";
-			String to = storage.full_path + prefix + name + "/";
+			String to = storage.full_path + new_name + "/";
 
 			Poco::File f(from);
 			f.setLastModified(Poco::Timestamp::fromEpochTime(time(0)));
 			f.renameTo(to);
 		}
 
+		/// Переименовывает кусок, дописав к имени префикс.
+		void renameAddPrefix(const String & prefix) const
+		{
+			renameTo(prefix + name);
+		}
+
 		/// Загрузить индекс и вычислить размер. Если size=0, вычислить его тоже.
 		void loadIndex()
 		{
@@ -344,12 +355,12 @@ public:
 		}
 
 		/// Прочитать контрольные суммы, если есть.
-		void loadChecksums()
+		void loadChecksums(bool require)
 		{
 			String path = storage.full_path + name + "/checksums.txt";
 			if (!Poco::File(path).exists())
 			{
-				if (storage.require_part_metadata)
+				if (require)
 					throw Exception("No checksums.txt in part " + name, ErrorCodes::NO_FILE_IN_DATA_PART);
 
 				return;
@@ -359,16 +370,21 @@ public:
 				assertEOF(file);
 		}
 
-		void loadColumns()
+		void loadColumns(bool require)
 		{
 			String path = storage.full_path + name + "/columns.txt";
 			if (!Poco::File(path).exists())
 			{
-				if (storage.require_part_metadata)
+				if (require)
 					throw Exception("No columns.txt in part " + name, ErrorCodes::NO_FILE_IN_DATA_PART);
-				columns = *storage.columns;
 
 				/// Если нет файла со списком столбцов, запишем его.
+				for (const NameAndTypePair & column : *storage.columns)
+				{
+					if (Poco::File(storage.full_path + name + "/" + escapeForFileName(column.name) + ".bin").exists())
+						columns.push_back(column);
+				}
+
 				{
 					WriteBufferFromFile out(path + ".tmp", 4096);
 					columns.writeText(out);
@@ -382,7 +398,7 @@ public:
 			columns.readText(file, storage.context.getDataTypeFactory());
 		}
 
-		void checkNotBroken()
+		void checkNotBroken(bool require_part_metadata)
 		{
 			String path = storage.full_path + name;
 
@@ -391,7 +407,7 @@ public:
 				if (!checksums.files.count("primary.idx"))
 					throw Exception("No checksum for primary.idx", ErrorCodes::NO_FILE_IN_DATA_PART);
 
-				if (storage.require_part_metadata)
+				if (require_part_metadata)
 				{
 					for (const NameAndTypePair & it : columns)
 					{
@@ -560,6 +576,9 @@ public:
 					bool require_part_metadata_,
 					BrokenPartCallback broken_part_callback_ = &MergeTreeData::doNothing);
 
+	/// Загрузить множество кусков с данными с диска. Вызывается один раз - сразу после создания объекта.
+	void loadDataParts(bool skip_sanity_checks);
+
 	std::string getModePrefix() const;
 
 	bool supportsSampling() const { return !!sampling_expression; }
@@ -625,15 +644,23 @@ public:
 	  */
 	DataPartsVector renameTempPartAndReplace(MutableDataPartPtr part, Increment * increment = nullptr, Transaction * out_transaction = nullptr);
 
-	/** Убирает из рабочего набора куски remove и добавляет куски add.
+	/** Убирает из рабочего набора куски remove и добавляет куски add. add должны уже быть в all_data_parts.
 	  * Если clear_without_timeout, данные будут удалены при следующем clearOldParts, игнорируя old_parts_lifetime.
 	  */
 	void replaceParts(const DataPartsVector & remove, const DataPartsVector & add, bool clear_without_timeout);
 
-	/** Переименовывает кусок в prefix_кусок и убирает его из рабочего набора.
+	/** Добавляет новый кусок в список известных кусков и в рабочий набор.
+	  */
+	void attachPart(DataPartPtr part);
+
+	/** Переименовывает кусок в detached/prefix_кусок и забывает про него. Данные не будут удалены в clearOldParts.
 	  * Если restore_covered, добавляет в рабочий набор неактивные куски, слиянием которых получен удаляемый кусок.
 	  */
-	void renameAndDetachPart(DataPartPtr part, const String & prefix, bool restore_covered = false);
+	void renameAndDetachPart(DataPartPtr part, const String & prefix = "", bool restore_covered = false, bool move_to_detached = true);
+
+	/** Убирает кусок из списка кусков (включая all_data_parts), но не перемещщает директорию.
+	  */
+	void detachPartInPlace(DataPartPtr part);
 
 	/** Возвращает старые неактуальные куски, которые можно удалить. Одновременно удаляет их из списка кусков, но не с диска.
 	  */
@@ -685,6 +712,9 @@ public:
 	ExpressionActionsPtr getPrimaryExpression() const { return primary_expr; }
 	SortDescription getSortDescription() const { return sort_descr; }
 
+	/// Проверить, что кусок не сломан и посчитать для него чексуммы, если их нет.
+	MutableDataPartPtr loadPartAndFixMetadata(const String & relative_path);
+
 	const Context & context;
 	const String date_column_name;
 	const ASTPtr sampling_expression;
@@ -726,9 +756,6 @@ private:
 	DataParts all_data_parts;
 	Poco::FastMutex all_data_parts_mutex;
 
-	/// Загрузить множество кусков с данными с диска. Вызывается один раз - при создании объекта.
-	void loadDataParts();
-
 	/** Выражение, преобразующее типы столбцов.
 	  * Если преобразований типов нет, out_expression=nullptr.
 	  * out_rename_map отображает файлы-столбцы на выходе выражения в новые файлы таблицы.
diff --git a/dbms/include/DB/Storages/MergeTree/MergeTreeDataMerger.h b/dbms/include/DB/Storages/MergeTree/MergeTreeDataMerger.h
index 39a117d3f06..a0c06ce5dcd 100644
--- a/dbms/include/DB/Storages/MergeTree/MergeTreeDataMerger.h
+++ b/dbms/include/DB/Storages/MergeTree/MergeTreeDataMerger.h
@@ -1,6 +1,7 @@
 #pragma once
 
 #include <DB/Storages/MergeTree/MergeTreeData.h>
+#include <DB/Storages/MergeTree/DiskSpaceMonitor.h>
 
 namespace DB
 {
@@ -34,9 +35,13 @@ public:
 		bool only_small,
 		const AllowedMergingPredicate & can_merge);
 
-	/// Сливает куски.
+	/** Сливает куски.
+	  * Если reservation != nullptr, то и дело уменьшает размер зарезервированного места
+	  *  приблизительно пропорционально количеству уже выписанных данных.
+	  */
 	MergeTreeData::DataPartPtr mergeParts(
-		const MergeTreeData::DataPartsVector & parts, const String & merged_name, MergeTreeData::Transaction * out_transaction = nullptr);
+		const MergeTreeData::DataPartsVector & parts, const String & merged_name,
+		MergeTreeData::Transaction * out_transaction = nullptr, DiskSpaceMonitor::Reservation * disk_reservation = nullptr);
 
 	/// Примерное количество места на диске, нужное для мерджа. С запасом.
 	size_t estimateDiskSpaceForMerge(const MergeTreeData::DataPartsVector & parts);
diff --git a/dbms/include/DB/Storages/MergeTree/MergeTreePartChecker.h b/dbms/include/DB/Storages/MergeTree/MergeTreePartChecker.h
index 4490cd9ebdb..bf653f2a7bb 100644
--- a/dbms/include/DB/Storages/MergeTree/MergeTreePartChecker.h
+++ b/dbms/include/DB/Storages/MergeTree/MergeTreePartChecker.h
@@ -9,16 +9,27 @@ namespace DB
 class MergeTreePartChecker
 {
 public:
+	struct Settings
+	{
+		bool verbose = false; /// Пишет в stderr прогресс и ошибки, и не останавливается при первой ошибке.
+		bool require_checksums = false; /// Требует, чтобы был columns.txt.
+		bool require_column_files = false; /// Требует, чтобы для всех столбцов из columns.txt были файлы.
+		size_t index_granularity = 8192;
+
+		Settings & setVerbose(bool verbose_) { verbose = verbose_; return *this; }
+		Settings & setRequireChecksums(bool require_checksums_) { require_checksums = require_checksums_; return *this; }
+		Settings & setRequireColumnFiles(bool require_column_files_) { require_column_files = require_column_files_; return *this; }
+		Settings & setIndexGranularity(size_t index_granularity_) { index_granularity = index_granularity_; return *this; }
+	};
+
 	/** Полностью проверяет данные кусочка:
 	  *  - Вычисляет контрольные суммы и сравнивает с checksums.txt.
 	  *  - Для массивов и строк проверяет соответствие размеров и количества данных.
 	  *  - Проверяет правильность засечек.
 	  * Бросает исключение, если кусок испорчен или если проверить не получилось (TODO: можно попробовать разделить эти случаи).
-	  * Если strict, требует, чтобы для всех столбцов из columns.txt были файлы.
-	  * Если verbose, пишет в stderr прогресс и ошибки, и не останавливается при первой ошибке.
 	  */
-	static void checkDataPart(String path, size_t index_granularity, bool strict, const DataTypeFactory & data_type_factory,
-		bool verbose = false);
+	static void checkDataPart(String path, const Settings & settings, const DataTypeFactory & data_type_factory,
+							  MergeTreeData::DataPart::Checksums * out_checksums = nullptr);
 };
 
 }
diff --git a/dbms/include/DB/Storages/MergeTree/ReplicatedMergeTreeBlockOutputStream.h b/dbms/include/DB/Storages/MergeTree/ReplicatedMergeTreeBlockOutputStream.h
index d95de7fce4e..4b16aa00d56 100644
--- a/dbms/include/DB/Storages/MergeTree/ReplicatedMergeTreeBlockOutputStream.h
+++ b/dbms/include/DB/Storages/MergeTree/ReplicatedMergeTreeBlockOutputStream.h
@@ -28,30 +28,12 @@ public:
 			time_t min_date_time = DateLUT::instance().fromDayNum(DayNum_t(current_block.min_date));
 			String month_name = toString(Date2OrderedIdentifier(min_date_time) / 100);
 
-			String month_path = storage.zookeeper_path + "/block_numbers/" + month_name;
-			if (!storage.zookeeper->exists(month_path))
-			{
-				/// Создадим в block_numbers ноду для месяца и пропустим в ней 200 значений инкремента.
-				/// Нужно, чтобы в будущем при необходимости можно было добавить данные в начало.
-				zkutil::Ops ops;
-				auto acl = storage.zookeeper->getDefaultACL();
-				ops.push_back(new zkutil::Op::Create(month_path, "", acl, zkutil::CreateMode::Persistent));
-				for (size_t i = 0; i < 200; ++i)
-				{
-					ops.push_back(new zkutil::Op::Create(month_path + "/skip_increment", "", acl, zkutil::CreateMode::Persistent));
-					ops.push_back(new zkutil::Op::Remove(month_path + "/skip_increment", -1));
-				}
-				/// Игнорируем ошибки - не получиться могло только если кто-то еще выполнил эту строчку раньше нас.
-				storage.zookeeper->tryMulti(ops);
-			}
-
-			AbandonableLockInZooKeeper block_number_lock(
-				storage.zookeeper_path + "/block_numbers/" + month_name + "/block-",
-				storage.zookeeper_path + "/temp", *storage.zookeeper);
+			AbandonableLockInZooKeeper block_number_lock = storage.allocateBlockNumber(month_name);
 
 			UInt64 part_number = block_number_lock.getNumber();
 
 			MergeTreeData::MutableDataPartPtr part = storage.writer.writeTempPart(current_block, part_number);
+			String part_name = ActiveDataPartSet::getPartName(part->left_date, part->right_date, part->left, part->right, part->level);
 
 			/// Если в запросе не указан ID, возьмем в качестве ID хеш от данных. То есть, не вставляем одинаковые данные дважды.
 			/// NOTE: Если такая дедупликация не нужна, можно вместо этого оставлять block_id пустым.
@@ -61,13 +43,10 @@ public:
 
 			LOG_DEBUG(log, "Wrote block " << part_number << " with ID " << block_id << ", " << current_block.block.rows() << " rows");
 
-			MergeTreeData::Transaction transaction; /// Если не получится добавить кусок в ZK, снова уберем его из рабочего набора.
-			storage.data.renameTempPartAndAdd(part, nullptr, &transaction);
-
 			StorageReplicatedMergeTree::LogEntry log_entry;
 			log_entry.type = StorageReplicatedMergeTree::LogEntry::GET_PART;
 			log_entry.source_replica = storage.replica_name;
-			log_entry.new_part_name = part->name;
+			log_entry.new_part_name = part_name;
 
 			/// Одновременно добавим информацию о куске во все нужные места в ZooKeeper и снимем block_number_lock.
 			zkutil::Ops ops;
@@ -94,7 +73,7 @@ public:
 					storage.zookeeper->getDefaultACL(),
 					zkutil::CreateMode::Persistent));
 			}
-			storage.checkPartAndAddToZooKeeper(part, ops);
+			storage.checkPartAndAddToZooKeeper(part, ops, part_name);
 			ops.push_back(new zkutil::Op::Create(
 				storage.zookeeper_path + "/log/log-",
 				log_entry.toString(),
@@ -102,6 +81,9 @@ public:
 				zkutil::CreateMode::PersistentSequential));
 			block_number_lock.getUnlockOps(ops);
 
+			MergeTreeData::Transaction transaction; /// Если не получится добавить кусок в ZK, снова уберем его из рабочего набора.
+			storage.data.renameTempPartAndAdd(part, nullptr, &transaction);
+
 			try
 			{
 				auto code = storage.zookeeper->tryMulti(ops);
diff --git a/dbms/include/DB/Storages/StorageChunkRef.h b/dbms/include/DB/Storages/StorageChunkRef.h
index d6e63744828..4b54ea61ecb 100644
--- a/dbms/include/DB/Storages/StorageChunkRef.h
+++ b/dbms/include/DB/Storages/StorageChunkRef.h
@@ -36,6 +36,8 @@ public:
 	
 	String source_database_name;
 	String source_table_name;
+
+	bool checkData() const override;
 	
 private:
 	String name;
diff --git a/dbms/include/DB/Storages/StorageDistributed.h b/dbms/include/DB/Storages/StorageDistributed.h
index 14367169ebd..f1a543bcddd 100644
--- a/dbms/include/DB/Storages/StorageDistributed.h
+++ b/dbms/include/DB/Storages/StorageDistributed.h
@@ -18,6 +18,9 @@ namespace DB
   */
 class StorageDistributed : public IStorage
 {
+	friend class DistributedBlockOutputStream;
+	friend class DirectoryMonitor;
+
 public:
 	static StoragePtr create(
 		const std::string & name_,			/// Имя таблицы.
@@ -25,7 +28,9 @@ public:
 		const String & remote_database_,	/// БД на удалённых серверах.
 		const String & remote_table_,		/// Имя таблицы на удалённых серверах.
 		const String & cluster_name,
-		Context & context_);
+		Context & context_,
+		const ASTPtr & sharding_key_,
+		const String & data_path_);
 
 	static StoragePtr create(
 		const std::string & name_,			/// Имя таблицы.
@@ -57,12 +62,21 @@ public:
 		size_t max_block_size = DEFAULT_BLOCK_SIZE,
 		unsigned threads = 1);
 
+	BlockOutputStreamPtr write(ASTPtr query) override;
+
 	void drop() override {}
 	void rename(const String & new_path_to_db, const String & new_database_name, const String & new_table_name) { name = new_table_name; }
 	/// в подтаблицах добавлять и удалять столбы нужно вручную
 	/// структура подтаблиц не проверяется
 	void alter(const AlterCommands & params, const String & database_name, const String & table_name, Context & context);
 
+	void shutdown() override;
+
+	const ExpressionActionsPtr & getShardingKeyExpr() const { return sharding_key_expr; }
+	const String & getShardingKeyColumnName() const { return sharding_key_column_name; }
+	const String & getPath() const { return path; }
+
+
 private:
 	StorageDistributed(
 		const std::string & name_,
@@ -70,17 +84,24 @@ private:
 		const String & remote_database_,
 		const String & remote_table_,
 		Cluster & cluster_,
-		const Context & context_);
+		Context & context_,
+		const ASTPtr & sharding_key_ = nullptr,
+		const String & data_path_ = String{});
 
-	/// Создает копию запроса, меняет имена базы данных и таблицы.
-	ASTPtr rewriteQuery(ASTPtr query);
+
+	/// create directory monitor thread by subdirectory name
+	void createDirectoryMonitor(const std::string & name);
+	/// create directory monitors for each existing subdirectory
+	void createDirectoryMonitors();
+	/// ensure directory monitor creation
+	void requireDirectoryMonitor(const std::string & name);
 
 	String name;
 	NamesAndTypesListPtr columns;
 	String remote_database;
 	String remote_table;
 
-	const Context & context;
+	Context & context;
 
 	/// Временные таблицы, которые необходимо отправить на сервер. Переменная очищается после каждого вызова метода read
 	/// Для подготовки к отправке нужно использовтаь метод storeExternalTables
@@ -91,6 +112,14 @@ private:
 
 	/// Соединения с удалёнными серверами.
 	Cluster & cluster;
+
+	ExpressionActionsPtr sharding_key_expr;
+	String sharding_key_column_name;
+	bool write_enabled;
+	String path;
+
+	class DirectoryMonitor;
+	std::unordered_map<std::string, std::unique_ptr<DirectoryMonitor>> directory_monitors;
 };
 
 }
diff --git a/dbms/include/DB/Storages/StorageLog.h b/dbms/include/DB/Storages/StorageLog.h
index 25bc55155ac..2cae126ca02 100644
--- a/dbms/include/DB/Storages/StorageLog.h
+++ b/dbms/include/DB/Storages/StorageLog.h
@@ -13,6 +13,7 @@
 #include <DB/Storages/IStorage.h>
 #include <DB/DataStreams/IProfilingBlockInputStream.h>
 #include <DB/DataStreams/IBlockOutputStream.h>
+#include <DB/Common/FileChecker.h>
 
 
 namespace DB
@@ -80,6 +81,8 @@ class LogBlockOutputStream : public IBlockOutputStream
 {
 public:
 	LogBlockOutputStream(StorageLog & storage_);
+	~LogBlockOutputStream() { writeSuffix(); }
+
 	void write(const Block & block);
 	void writeSuffix();
 private:
@@ -156,6 +159,22 @@ public:
 
 	void rename(const String & new_path_to_db, const String & new_database_name, const String & new_table_name);
 
+	/// Данные столбца
+	struct ColumnData
+	{
+		/// Задает номер столбца в файле с засечками.
+		/// Не обязательно совпадает с номером столбца среди столбцов таблицы: здесь нумеруются также столбцы с длинами массивов.
+		size_t column_index;
+
+		Poco::File data_file;
+		Marks marks;
+	};
+	typedef std::map<String, ColumnData> Files_t;
+
+	Files_t & getFiles() { return files; }
+
+	bool checkData() const override;
+
 protected:
 	String path;
 	String name;
@@ -195,18 +214,8 @@ protected:
 		unsigned threads = 1);
 	
 private:
-	/// Данные столбца
-	struct ColumnData
-	{
-		/// Задает номер столбца в файле с засечками.
-		/// Не обязательно совпадает с номером столбца среди столбцов таблицы: здесь нумеруются также столбцы с длинами массивов.
-		size_t column_index;
-		
-		Poco::File data_file;
-		Marks marks;
-	};
-	typedef std::map<String, ColumnData> Files_t;
 	Files_t files; /// name -> data
+
 	Names column_names; /// column_index -> name
 	
 	Poco::File marks_file;
@@ -218,6 +227,10 @@ private:
 
 	size_t max_compress_block_size;
 
+protected:
+	FileChecker<StorageLog> file_checker;
+
+private:
 	/** Для обычных столбцов, в засечках указано количество строчек в блоке.
 	  * Для столбцов-массивов и вложенных структур, есть более одной группы засечек, соответствующих разным файлам:
 	  *  - для внутренностей (файла name.bin) - указано суммарное количество элементов массивов в блоке,
diff --git a/dbms/include/DB/Storages/StorageMaterializedView.h b/dbms/include/DB/Storages/StorageMaterializedView.h
index bbe2807270f..4cea9d804e0 100644
--- a/dbms/include/DB/Storages/StorageMaterializedView.h
+++ b/dbms/include/DB/Storages/StorageMaterializedView.h
@@ -15,6 +15,9 @@ public:
 	std::string getName() const { return "MaterializedView"; }
 	std::string getInnerTableName() const { return  ".inner." + table_name; }
 
+	NameAndTypePair getColumn(const String &column_name) const;
+	bool hasColumn(const String &column_name) const;
+
 	BlockOutputStreamPtr write(ASTPtr query);
 	void drop() override;
 	bool optimize();
diff --git a/dbms/include/DB/Storages/StorageReplicatedMergeTree.h b/dbms/include/DB/Storages/StorageReplicatedMergeTree.h
index 9acc7d1cf35..bd8fd81a525 100644
--- a/dbms/include/DB/Storages/StorageReplicatedMergeTree.h
+++ b/dbms/include/DB/Storages/StorageReplicatedMergeTree.h
@@ -6,6 +6,7 @@
 #include <DB/Storages/MergeTree/MergeTreeDataWriter.h>
 #include <DB/Storages/MergeTree/MergeTreeDataSelectExecutor.h>
 #include <DB/Storages/MergeTree/ReplicatedMergeTreePartsExchange.h>
+#include "MergeTree/AbandonableLockInZooKeeper.h"
 #include <DB/DataTypes/DataTypesNumberFixed.h>
 #include <zkutil/ZooKeeper.h>
 #include <zkutil/LeaderElection.h>
@@ -77,6 +78,9 @@ public:
 
 	void alter(const AlterCommands & params, const String & database_name, const String & table_name, Context & context) override;
 
+	void dropPartition(const Field & partition, bool detach) override;
+	void attachPartition(const Field & partition, bool unreplicated, bool part) override;
+
 	/** Удаляет реплику из ZooKeeper. Если других реплик нет, удаляет всю таблицу из ZooKeeper.
 	  */
 	void drop() override;
@@ -111,7 +115,7 @@ private:
 		{
 			try
 			{
-				Poco::ScopedLock<Poco::FastMutex> lock(storage.queue_mutex);
+				std::unique_lock<std::mutex> lock(storage.queue_mutex);
 				if (!storage.future_parts.erase(part))
 					throw Exception("Untagging already untagged future part " + part + ". This is a bug.", ErrorCodes::LOGICAL_ERROR);
 			}
@@ -126,30 +130,48 @@ private:
 
 	struct LogEntry
 	{
+		typedef Poco::SharedPtr<LogEntry> Ptr;
+
 		enum Type
 		{
-			GET_PART,
-			MERGE_PARTS,
+			GET_PART,    /// Получить кусок с другой реплики.
+			MERGE_PARTS, /// Слить куски.
+			DROP_RANGE,  /// Удалить куски в указанном месяце в указанном диапазоне номеров.
+			ATTACH_PART, /// Перенести кусок из директории detached или unreplicated.
 		};
 
 		String znode_name;
 
 		Type type;
 		String source_replica; /// Пустая строка значит, что эта запись была добавлена сразу в очередь, а не скопирована из лога.
+
+		/// Имя куска, получающегося в результате.
+		/// Для DROP_RANGE имя несуществующего куска. Нужно удалить все куски, покрытые им.
 		String new_part_name;
+
 		Strings parts_to_merge;
 
+		/// Для DROP_RANGE, true значит, что куски нужно не удалить, а перенести в директорию detached.
+		bool detach = false;
+
+		/// Для ATTACH_PART имя куска в директории detached или unreplicated.
+		String source_part_name;
+		/// Нужно переносить из директории unreplicated, а не detached.
+		bool attach_unreplicated;
+
 		FuturePartTaggerPtr future_part_tagger;
+		bool currently_executing = false; /// Доступ под queue_mutex.
+		std::condition_variable execution_complete; /// Пробуждается когда currently_executing становится false.
 
 		void addResultToVirtualParts(StorageReplicatedMergeTree & storage)
 		{
-			if (type == MERGE_PARTS || type == GET_PART)
+			if (type == MERGE_PARTS || type == GET_PART || type == DROP_RANGE || type == ATTACH_PART)
 				storage.virtual_parts.add(new_part_name);
 		}
 
 		void tagPartAsFuture(StorageReplicatedMergeTree & storage)
 		{
-			if (type == MERGE_PARTS || type == GET_PART)
+			if (type == MERGE_PARTS || type == GET_PART || type == ATTACH_PART)
 				future_part_tagger = new FuturePartTagger(new_part_name, storage);
 		}
 
@@ -166,17 +188,19 @@ private:
 			return s;
 		}
 
-		static LogEntry parse(const String & s)
+		static Ptr parse(const String & s)
 		{
 			ReadBufferFromString in(s);
-			LogEntry res;
-			res.readText(in);
+			Ptr res = new LogEntry;
+			res->readText(in);
 			assertEOF(in);
 			return res;
 		}
 	};
 
-	typedef std::list<LogEntry> LogEntries;
+	typedef LogEntry::Ptr LogEntryPtr;
+
+	typedef std::list<LogEntryPtr> LogEntries;
 
 	typedef std::set<String> StringSet;
 	typedef std::list<String> StringList;
@@ -194,7 +218,7 @@ private:
 	  * В ZK записи в хронологическом порядке. Здесь - не обязательно.
 	  */
 	LogEntries queue;
-	Poco::FastMutex queue_mutex;
+	std::mutex queue_mutex;
 
 	/** Куски, которые появятся в результате действий, выполняемых прямо сейчас фоновыми потоками (этих действий нет в очереди).
 	  * Использовать под залоченным queue_mutex.
@@ -248,6 +272,7 @@ private:
 	std::unique_ptr<MergeTreeData> unreplicated_data;
 	std::unique_ptr<MergeTreeDataSelectExecutor> unreplicated_reader;
 	std::unique_ptr<MergeTreeDataMerger> unreplicated_merger;
+	Poco::FastMutex unreplicated_mutex; /// Для мерджей и удаления нереплицируемых кусков.
 
 	/// Потоки:
 
@@ -261,12 +286,14 @@ private:
 	/// Поток, выбирающий куски для слияния.
 	std::thread merge_selecting_thread;
 	Poco::Event merge_selecting_event;
+	std::mutex merge_selecting_mutex; /// Берется на каждую итерацию выбора кусков для слияния.
 
 	/// Поток, удаляющий старые куски, записи в логе и блоки.
 	std::thread cleanup_thread;
 
 	/// Поток, обрабатывающий переподключение к ZooKeeper при истечении сессии (очень маловероятное событие).
 	std::thread restarting_thread;
+	Poco::Event restarting_event;
 
 	/// Поток, следящий за изменениями списка столбцов в ZooKeeper и обновляющий куски в соответствии с этими изменениями.
 	std::thread alter_thread;
@@ -285,7 +312,6 @@ private:
 	Poco::Event shutdown_event;
 	/// Нужно ли завершить restarting_thread.
 	volatile bool permanent_shutdown_called = false;
-	Poco::Event permanent_shutdown_event;
 
 	StorageReplicatedMergeTree(
 		const String & zookeeper_path_,
@@ -306,7 +332,7 @@ private:
 
 	/** Создает минимальный набор нод в ZooKeeper.
 	  */
-	void createTable();
+	void createTableIfNotExists();
 
 	/** Создает реплику в ZooKeeper и добавляет в очередь все, что нужно, чтобы догнать остальные реплики.
 	  */
@@ -319,7 +345,7 @@ private:
 	/** Проверить, что список столбцов и настройки таблицы совпадают с указанными в ZK (/metadata).
 	  * Если нет - бросить исключение.
 	  */
-	void checkTableStructure(bool skip_sanity_checks);
+	void checkTableStructure(bool skip_sanity_checks, bool allow_alter);
 
 	/** Проверить, что множество кусков соответствует тому, что в ZK (/replicas/me/parts/).
 	  * Если каких-то кусков, описанных в ZK нет локально, бросить исключение.
@@ -332,11 +358,11 @@ private:
 	void initVirtualParts();
 
 	/// Запустить или остановить фоновые потоки. Используется для частичной переинициализации при пересоздании сессии в ZooKeeper.
-	void startup();
+	bool tryStartup(); /// Возвращает false, если недоступен ZooKeeper.
 	void partialShutdown();
 
 	/// Запретить запись в таблицу и завершить все фоновые потоки.
-	void goReadOnly();
+	void goReadOnlyPermanently();
 
 
 	/** Проверить, что чексумма куска совпадает с чексуммой того же куска на какой-нибудь другой реплике.
@@ -345,7 +371,7 @@ private:
 	  * Кладет в ops действия, добавляющие данные о куске в ZooKeeper.
 	  * Вызывать под TableStructureLock.
 	  */
-	void checkPartAndAddToZooKeeper(MergeTreeData::DataPartPtr part, zkutil::Ops & ops);
+	void checkPartAndAddToZooKeeper(MergeTreeData::DataPartPtr part, zkutil::Ops & ops, String name_override = "");
 
 	/// Убирает кусок из ZooKeeper и добавляет в очередь задание скачать его. Предполагается это делать с битыми кусками.
 	void removePartAndEnqueueFetch(const String & part_name);
@@ -379,6 +405,9 @@ private:
 	  */
 	bool executeLogEntry(const LogEntry & entry, BackgroundProcessingPool::Context & pool_context);
 
+	void executeDropRange(const LogEntry & entry);
+	bool executeAttachPart(const LogEntry & entry); /// Возвращает false, если куска нет, и его нужно забрать с другой реплики.
+
 	/** Обновляет очередь.
 	  */
 	void queueUpdatingThread();
@@ -423,6 +452,15 @@ private:
 	/** Скачать указанный кусок с указанной реплики.
 	  */
 	void fetchPart(const String & part_name, const String & replica_name);
+
+	///
+
+	AbandonableLockInZooKeeper allocateBlockNumber(const String & month_name);
+
+	/** Дождаться, пока все реплики, включая эту, выполнят указанное действие из лога.
+	  * Если одновременно с этим добавляются реплики, может не дождаться добавленную реплику.
+	  */
+	void waitForAllReplicasToProcessLogEntry(const LogEntry & entry);
 };
 
 }
diff --git a/dbms/include/DB/Storages/StorageSystemNumbers.h b/dbms/include/DB/Storages/StorageSystemNumbers.h
index 8acedef4872..b6eb8d9d665 100644
--- a/dbms/include/DB/Storages/StorageSystemNumbers.h
+++ b/dbms/include/DB/Storages/StorageSystemNumbers.h
@@ -3,7 +3,6 @@
 #include <Poco/SharedPtr.h>
 
 #include <DB/Storages/IStorage.h>
-#include <DB/DataStreams/IProfilingBlockInputStream.h>
 
 
 namespace DB
@@ -12,20 +11,6 @@ namespace DB
 using Poco::SharedPtr;
 
 
-class NumbersBlockInputStream : public IProfilingBlockInputStream
-{
-public:
-	NumbersBlockInputStream(size_t block_size_);
-	String getName() const { return "NumbersBlockInputStream"; }
-	String getID() const { return "Numbers"; }
-protected:
-	Block readImpl();
-private:
-	size_t block_size;
-	UInt64 next;
-};
-
-
 /** Реализует хранилище для системной таблицы Numbers.
   * Таблица содержит единственный столбец number UInt64.
   * Из этой таблицы можно прочитать все натуральные числа, начиная с 0 (до 2^64 - 1, а потом заново).
@@ -33,7 +18,7 @@ private:
 class StorageSystemNumbers : public IStorage
 {
 public:
-	static StoragePtr create(const std::string & name_);
+	static StoragePtr create(const std::string & name_, bool multithreaded_ = false);
 	
 	std::string getName() const { return "SystemNumbers"; }
 	std::string getTableName() const { return name; }
@@ -51,8 +36,9 @@ public:
 private:
 	const std::string name;
 	NamesAndTypesList columns;
+	bool multithreaded;
 	
-	StorageSystemNumbers(const std::string & name_);
+	StorageSystemNumbers(const std::string & name_, bool multithreaded_);
 };
 
 }
diff --git a/dbms/include/DB/Storages/StorageTinyLog.h b/dbms/include/DB/Storages/StorageTinyLog.h
index 0f00aac036d..d91cc88d9a3 100644
--- a/dbms/include/DB/Storages/StorageTinyLog.h
+++ b/dbms/include/DB/Storages/StorageTinyLog.h
@@ -12,6 +12,8 @@
 #include <DB/Storages/IStorage.h>
 #include <DB/DataStreams/IProfilingBlockInputStream.h>
 #include <DB/DataStreams/IBlockOutputStream.h>
+#include <DB/Common/FileChecker.h>
+#include <Poco/Util/XMLConfiguration.h>
 
 
 namespace DB
@@ -55,11 +57,13 @@ private:
 	void readData(const String & name, const IDataType & type, IColumn & column, size_t limit, size_t level = 0, bool read_offsets = true);
 };
 
-
 class TinyLogBlockOutputStream : public IBlockOutputStream
 {
 public:
 	TinyLogBlockOutputStream(StorageTinyLog & storage_);
+
+	~TinyLogBlockOutputStream();
+
 	void write(const Block & block);
 	void writeSuffix();
 private:
@@ -129,12 +133,7 @@ public:
 	
 	void rename(const String & new_path_to_db, const String & new_database_name, const String & new_table_name);
 
-private:
-	String path;
-	String name;
-	NamesAndTypesListPtr columns;
-
-	size_t max_compress_block_size;
+	bool checkData() const override;
 
 	/// Данные столбца
 	struct ColumnData
@@ -142,8 +141,22 @@ private:
 		Poco::File data_file;
 	};
 	typedef std::map<String, ColumnData> Files_t;
+
+	Files_t & getFiles();
+
+private:
+	String path;
+	String name;
+	NamesAndTypesListPtr columns;
+
+	size_t max_compress_block_size;
+
 	Files_t files;
 
+	FileChecker<StorageTinyLog> file_checker;
+
+	Logger * log;
+
 	StorageTinyLog(const std::string & path_, const std::string & name_, NamesAndTypesListPtr columns_, bool attach, size_t max_compress_block_size_);
 	
 	void addFile(const String & column_name, const IDataType & type, size_t level = 0);
diff --git a/dbms/src/AggregateFunctions/AggregateFunctionFactory.cpp b/dbms/src/AggregateFunctions/AggregateFunctionFactory.cpp
index e93f9fb9304..2229437e4a7 100644
--- a/dbms/src/AggregateFunctions/AggregateFunctionFactory.cpp
+++ b/dbms/src/AggregateFunctions/AggregateFunctionFactory.cpp
@@ -1,9 +1,7 @@
 #include <DB/AggregateFunctions/AggregateFunctionCount.h>
 #include <DB/AggregateFunctions/AggregateFunctionSum.h>
 #include <DB/AggregateFunctions/AggregateFunctionAvg.h>
-#include <DB/AggregateFunctions/AggregateFunctionAny.h>
-#include <DB/AggregateFunctions/AggregateFunctionAnyLast.h>
-#include <DB/AggregateFunctions/AggregateFunctionsMinMax.h>
+#include <DB/AggregateFunctions/AggregateFunctionsMinMaxAny.h>
 #include <DB/AggregateFunctions/AggregateFunctionsArgMinMax.h>
 #include <DB/AggregateFunctions/AggregateFunctionUniq.h>
 #include <DB/AggregateFunctions/AggregateFunctionUniqUpTo.h>
@@ -69,6 +67,7 @@ static IAggregateFunction * createWithNumericType(const IDataType & argument_typ
 		return nullptr;
 }
 
+
 template<template <typename, typename> class AggregateFunctionTemplate, template <typename> class Data>
 static IAggregateFunction * createWithNumericType(const IDataType & argument_type)
 {
@@ -87,18 +86,48 @@ static IAggregateFunction * createWithNumericType(const IDataType & argument_typ
 }
 
 
+/// min, max, any, anyLast
+template<template <typename> class AggregateFunctionTemplate, template <typename> class Data>
+static IAggregateFunction * createAggregateFunctionSingleValue(const String & name, const DataTypes & argument_types)
+{
+	if (argument_types.size() != 1)
+		throw Exception("Incorrect number of arguments for aggregate function " + name, ErrorCodes::NUMBER_OF_ARGUMENTS_DOESNT_MATCH);
+
+	const IDataType & argument_type = *argument_types[0];
+
+	     if (typeid_cast<const DataTypeUInt8 	*>(&argument_type))	return new AggregateFunctionTemplate<Data<SingleValueDataFixed<UInt8>>>;
+	else if (typeid_cast<const DataTypeUInt16 	*>(&argument_type))	return new AggregateFunctionTemplate<Data<SingleValueDataFixed<UInt16>>>;
+	else if (typeid_cast<const DataTypeUInt32 	*>(&argument_type))	return new AggregateFunctionTemplate<Data<SingleValueDataFixed<UInt32>>>;
+	else if (typeid_cast<const DataTypeUInt64 	*>(&argument_type))	return new AggregateFunctionTemplate<Data<SingleValueDataFixed<UInt64>>>;
+	else if (typeid_cast<const DataTypeInt8 	*>(&argument_type))	return new AggregateFunctionTemplate<Data<SingleValueDataFixed<Int8>>>;
+	else if (typeid_cast<const DataTypeInt16 	*>(&argument_type))	return new AggregateFunctionTemplate<Data<SingleValueDataFixed<Int16>>>;
+	else if (typeid_cast<const DataTypeInt32 	*>(&argument_type))	return new AggregateFunctionTemplate<Data<SingleValueDataFixed<Int32>>>;
+	else if (typeid_cast<const DataTypeInt64 	*>(&argument_type))	return new AggregateFunctionTemplate<Data<SingleValueDataFixed<Int64>>>;
+	else if (typeid_cast<const DataTypeFloat32 *>(&argument_type))	return new AggregateFunctionTemplate<Data<SingleValueDataFixed<Float32>>>;
+	else if (typeid_cast<const DataTypeFloat64 *>(&argument_type))	return new AggregateFunctionTemplate<Data<SingleValueDataFixed<Float64>>>;
+	else if (typeid_cast<const DataTypeDate 	*>(&argument_type))
+		return new AggregateFunctionTemplate<Data<SingleValueDataFixed<DataTypeDate::FieldType>>>;
+	else if (typeid_cast<const DataTypeDateTime*>(&argument_type))
+		return new AggregateFunctionTemplate<Data<SingleValueDataFixed<DataTypeDateTime::FieldType>>>;
+	else if (typeid_cast<const DataTypeString*>(&argument_type))
+		return new AggregateFunctionTemplate<Data<SingleValueDataString>>;
+	else
+		return new AggregateFunctionTemplate<Data<SingleValueDataGeneric>>;
+}
+
+
 AggregateFunctionPtr AggregateFunctionFactory::get(const String & name, const DataTypes & argument_types, int recursion_level) const
 {
 	if (name == "count")
 		return new AggregateFunctionCount;
 	else if (name == "any")
-		return new AggregateFunctionAny;
+		return createAggregateFunctionSingleValue<AggregateFunctionsSingleValue, AggregateFunctionAnyData>(name, argument_types);
 	else if (name == "anyLast")
-		return new AggregateFunctionAnyLast;
+		return createAggregateFunctionSingleValue<AggregateFunctionsSingleValue, AggregateFunctionAnyLastData>(name, argument_types);
 	else if (name == "min")
-		return new AggregateFunctionMin;
+		return createAggregateFunctionSingleValue<AggregateFunctionsSingleValue, AggregateFunctionMinData>(name, argument_types);
 	else if (name == "max")
-		return new AggregateFunctionMax;
+		return createAggregateFunctionSingleValue<AggregateFunctionsSingleValue, AggregateFunctionMaxData>(name, argument_types);
 	else if (name == "argMin")
 		return new AggregateFunctionArgMin;
 	else if (name == "argMax")
diff --git a/dbms/src/Client/Client.cpp b/dbms/src/Client/Client.cpp
index d44786ab023..70ccdd02f7f 100644
--- a/dbms/src/Client/Client.cpp
+++ b/dbms/src/Client/Client.cpp
@@ -49,6 +49,16 @@
 
 #include <DB/Common/ExternalTable.h>
 
+
+/// http://en.wikipedia.org/wiki/ANSI_escape_code
+#define SAVE_CURSOR_POSITION "\033[s"
+#define RESTORE_CURSOR_POSITION "\033[u"
+#define CLEAR_TO_END_OF_LINE "\033[K"
+/// Эти коды, возможно, поддерживаются не везде.
+#define DISABLE_LINE_WRAPPING "\033[?7l"
+#define ENABLE_LINE_WRAPPING "\033[?7h"
+
+
 /** Клиент командной строки СУБД ClickHouse.
   */
 
@@ -61,11 +71,7 @@ using Poco::SharedPtr;
 class Client : public Poco::Util::Application
 {
 public:
-	Client() : is_interactive(true), stdin_is_not_tty(false),
-		format_max_block_size(0), std_in(STDIN_FILENO), std_out(STDOUT_FILENO), processed_rows(0),
-		rows_read_on_server(0), bytes_read_on_server(0), written_progress_chars(0), written_first_block(false)
-	{
-	}
+	Client() {}
 
 private:
 	typedef std::unordered_set<String> StringSet;
@@ -77,24 +83,24 @@ private:
 		"q", "й", "\\q", "\\Q", "\\й", "\\Й", ":q", "Жй"
 	};
 
-	bool is_interactive;				/// Использовать readline интерфейс или batch режим.
-	bool stdin_is_not_tty;				/// stdin - не терминал.
+	bool is_interactive = true;			/// Использовать readline интерфейс или batch режим.
+	bool stdin_is_not_tty = false;		/// stdin - не терминал.
 
 	SharedPtr<Connection> connection;	/// Соединение с БД.
 	String query;						/// Текущий запрос.
 
 	String format;						/// Формат вывода результата в консоль.
-	size_t format_max_block_size;		/// Максимальный размер блока при выводе в консоль.
+	size_t format_max_block_size = 0;	/// Максимальный размер блока при выводе в консоль.
 	String insert_format;				/// Формат данных для INSERT-а при чтении их из stdin в batch режиме
-	size_t insert_format_max_block_size; /// Максимальный размер блока при чтении данных INSERT-а.
+	size_t insert_format_max_block_size = 0; /// Максимальный размер блока при чтении данных INSERT-а.
 
 	Context context;
 
 	/// Чтение из stdin для batch режима
-	ReadBufferFromFileDescriptor std_in;
+	ReadBufferFromFileDescriptor std_in {STDIN_FILENO};
 
 	/// Вывод в консоль
-	WriteBufferFromFileDescriptor std_out;
+	WriteBufferFromFileDescriptor std_out {STDOUT_FILENO};
 	BlockOutputStreamPtr block_std_out;
 
 	String home_path;
@@ -105,7 +111,7 @@ private:
 	String history_file;
 
 	/// Строк прочитано или записано.
-	size_t processed_rows;
+	size_t processed_rows = 0;
 
 	/// Распарсенный запрос. Оттуда берутся некоторые настройки (формат).
 	ASTPtr parsed_query;
@@ -115,10 +121,10 @@ private:
 
 	Stopwatch watch;
 
-	size_t rows_read_on_server;
-	size_t bytes_read_on_server;
-	size_t written_progress_chars;
-	bool written_first_block;
+	size_t rows_read_on_server = 0;
+	size_t bytes_read_on_server = 0;
+	size_t written_progress_chars = 0;
+	bool written_first_block = false;
 
 	/// Информация о внешних таблицах
 	std::list<ExternalTable> external_tables;
@@ -441,7 +447,7 @@ private:
 		if (exit_strings.end() != exit_strings.find(line))
 			return false;
 
-		block_std_out = nullptr;
+		resetOutput();
 
 		watch.restart();
 
@@ -642,6 +648,14 @@ private:
 	}
 
 
+	/** Сбросить все данные, что ещё остались в буферах. */
+	void resetOutput()
+	{
+		block_std_out = nullptr;
+		std_out.next();
+	}
+
+
 	/** Получает и обрабатывает пакеты из сервера.
 	  * Также следит, не требуется ли прервать выполнение запроса.
 	  */
@@ -747,12 +761,7 @@ private:
 	void onData(Block & block)
 	{
 		if (written_progress_chars)
-		{
-			for (size_t i = 0; i < written_progress_chars; ++i)
-				std::cerr << "\b \b";
-
-			written_progress_chars = 0;
-		}
+			clearProgress();
 
 		if (!block)
 			return;
@@ -780,7 +789,8 @@ private:
 			written_first_block = true;
 		}
 
-		std_out.next();
+		/// Полученный блок данных сразу выводится клиенту.
+		block_std_out->flush();
 	}
 
 
@@ -804,8 +814,18 @@ private:
 	}
 
 
+	void clearProgress()
+	{
+		std::cerr << RESTORE_CURSOR_POSITION CLEAR_TO_END_OF_LINE;
+		written_progress_chars = 0;
+	}
+
+
 	void writeProgress()
 	{
+		if (!is_interactive)
+			return;
+
 		static size_t increment = 0;
 		static const char * indicators[8] =
 		{
@@ -816,30 +836,30 @@ private:
 			"\033[1;34m←\033[0m",
 			"\033[1;35m↖\033[0m",
 			"\033[1;36m↑\033[0m",
-			"\033[1;37m↗\033[0m",
+			"\033[1m↗\033[0m",
 		};
 
-		if (is_interactive)
-		{
-			std::cerr << std::string(written_progress_chars, '\b');
+		if (written_progress_chars)
+			clearProgress();
+		else
+			std::cerr << SAVE_CURSOR_POSITION;
 
-			std::stringstream message;
-			message << indicators[increment % 8]
-				<< std::fixed << std::setprecision(3)
-				<< " Progress: " << rows_read_on_server << " rows, " << bytes_read_on_server / 1000000.0 << " MB";
+		std::stringstream message;
+		message << indicators[increment % 8]
+			<< std::fixed << std::setprecision(3)
+			<< " Progress: " << rows_read_on_server << " rows, " << bytes_read_on_server / 1000000.0 << " MB";
 
-			size_t elapsed_ns = watch.elapsed();
-			if (elapsed_ns)
-				message << " ("
-					<< rows_read_on_server * 1000000000.0 / elapsed_ns << " rows/s., "
-					<< bytes_read_on_server * 1000.0 / elapsed_ns << " MB/s.) ";
-			else
-				message << ". ";
+		size_t elapsed_ns = watch.elapsed();
+		if (elapsed_ns)
+			message << " ("
+				<< rows_read_on_server * 1000000000.0 / elapsed_ns << " rows/s., "
+				<< bytes_read_on_server * 1000.0 / elapsed_ns << " MB/s.) ";
+		else
+			message << ". ";
 
-			written_progress_chars = message.str().size() - 13;
-			std::cerr << message.rdbuf();
-			++increment;
-		}
+		written_progress_chars = message.str().size() - 13;
+		std::cerr << DISABLE_LINE_WRAPPING << message.rdbuf() << ENABLE_LINE_WRAPPING;
+		++increment;
 	}
 
 
@@ -859,6 +879,8 @@ private:
 
 	void onException(const Exception & e)
 	{
+		resetOutput();
+
 		std::cerr << "Received exception from server:" << std::endl
 			<< "Code: " << e.code() << ". " << e.displayText();
 	}
@@ -876,7 +898,7 @@ private:
 		if (block_std_out)
 			block_std_out->writeSuffix();
 
-		std_out.next();
+		resetOutput();
 
 		if (is_interactive && !written_first_block)
 			std::cout << "Ok." << std::endl;
diff --git a/dbms/src/Client/Connection.cpp b/dbms/src/Client/Connection.cpp
index cb2c43762d8..b019927e42d 100644
--- a/dbms/src/Client/Connection.cpp
+++ b/dbms/src/Client/Connection.cpp
@@ -284,14 +284,17 @@ void Connection::sendData(const Block & block, const String & name)
 }
 
 
-void Connection::sendPreparedData(ReadBuffer & input, const String & name)
+void Connection::sendPreparedData(ReadBuffer & input, size_t size, const String & name)
 {
 	writeVarUInt(Protocol::Client::Data, *out);
 
 	if (server_revision >= DBMS_MIN_REVISION_WITH_TEMPORARY_TABLES)
 		writeStringBinary(name, *out);
 
-	copyData(input, *out);
+	if (0 == size)
+		copyData(input, *out);
+	else
+		copyData(input, *out, size);
 	out->next();
 }
 
diff --git a/dbms/src/Columns/IColumn.cpp b/dbms/src/Columns/IColumn.cpp
new file mode 100644
index 00000000000..c7a5322f0f4
--- /dev/null
+++ b/dbms/src/Columns/IColumn.cpp
@@ -0,0 +1,45 @@
+#include <emmintrin.h>
+
+#include <DB/Columns/IColumn.h>
+
+
+namespace DB
+{
+
+size_t countBytesInFilter(const IColumn::Filter & filt)
+{
+	size_t count = 0;
+
+	/** NOTE: По идее, filt должен содержать только нолики и единички.
+	  * Но, на всякий случай, здесь используется условие > 0 (на знаковые байты).
+	  * Лучше было бы использовать != 0, то это не позволяет SSE2.
+	  */
+
+	const __m128i zero16 = _mm_set1_epi8(0);
+
+	const Int8 * pos = reinterpret_cast<const Int8 *>(&filt[0]);
+	const Int8 * end = pos + filt.size();
+	const Int8 * end64 = pos + filt.size() / 64 * 64;
+
+	for (; pos < end64; pos += 64)
+		count += __builtin_popcountll(
+			static_cast<UInt64>(_mm_movemask_epi8(_mm_cmpgt_epi8(
+				_mm_loadu_si128(reinterpret_cast<const __m128i *>(pos)),
+				zero16)))
+			| (static_cast<UInt64>(_mm_movemask_epi8(_mm_cmpgt_epi8(
+				_mm_loadu_si128(reinterpret_cast<const __m128i *>(pos + 16)),
+				zero16))) << 16)
+			| (static_cast<UInt64>(_mm_movemask_epi8(_mm_cmpgt_epi8(
+				_mm_loadu_si128(reinterpret_cast<const __m128i *>(pos + 32)),
+				zero16))) << 32)
+			| (static_cast<UInt64>(_mm_movemask_epi8(_mm_cmpgt_epi8(
+				_mm_loadu_si128(reinterpret_cast<const __m128i *>(pos + 48)),
+				zero16))) << 48));
+
+	for (; pos < end; ++pos)
+		count += *pos > 0;
+
+	return count;
+}
+
+}
diff --git a/dbms/src/Common/Macros.cpp b/dbms/src/Common/Macros.cpp
new file mode 100644
index 00000000000..49b76ebb11d
--- /dev/null
+++ b/dbms/src/Common/Macros.cpp
@@ -0,0 +1,60 @@
+#include <DB/Common/Macros.h>
+#include <DB/Core/Exception.h>
+#include <DB/Core/ErrorCodes.h>
+
+namespace DB
+{
+
+Macros::Macros() {}
+
+Macros::Macros(const Poco::Util::AbstractConfiguration & config, const String & root_key)
+{
+	Poco::Util::AbstractConfiguration::Keys keys;
+	config.keys(root_key, keys);
+	for (const String & key : keys)
+	{
+		macros[key] = config.getString(root_key + "." + key);
+	}
+}
+
+String Macros::expand(const String & s) const
+{
+	if (s.find('{') == String::npos)
+		return s;
+
+	String res;
+	size_t pos = 0;
+	while (true)
+	{
+		size_t begin = s.find('{', pos);
+
+		if (begin == String::npos)
+		{
+			res.append(s, pos, String::npos);
+			break;
+		}
+		else
+		{
+			res.append(s, pos, begin - pos);
+		}
+
+		++begin;
+		size_t end = s.find('}', begin);
+		if (end == String::npos)
+			throw Exception("Unbalanced { and } in string with macros: \"" + s + "\"", ErrorCodes::SYNTAX_ERROR);
+
+		String macro_name = s.substr(begin, end - begin);
+
+		auto it = macros.find(macro_name);
+		if (it == macros.end())
+			throw Exception("No macro " + macro_name + " in config", ErrorCodes::SYNTAX_ERROR);
+
+		res += it->second;
+
+		pos = end + 1;
+	}
+
+	return res;
+}
+
+}
diff --git a/dbms/src/Common/VirtualColumnUtils.cpp b/dbms/src/Common/VirtualColumnUtils.cpp
index 1f09475a46e..1d5bf3998ee 100644
--- a/dbms/src/Common/VirtualColumnUtils.cpp
+++ b/dbms/src/Common/VirtualColumnUtils.cpp
@@ -108,18 +108,15 @@ static bool isValidFunction(ASTPtr expression, const NameSet & columns)
 /// Извлечь все подфункции главной конъюнкции, но зависящие только от заданных столбцов
 static void extractFunctions(ASTPtr expression, const NameSet & columns, std::vector<ASTPtr> & result)
 {
-	if (const ASTFunction * function = typeid_cast<const ASTFunction *>(&* expression))
+	const ASTFunction * function = typeid_cast<const ASTFunction *>(&* expression);
+	if (function && function->name == "and")
 	{
-		if (function->name == "and")
-		{
-			for (size_t i = 0; i < function->arguments->children.size(); ++i)
-				extractFunctions(function->arguments->children[i], columns, result);
-		}
-		else
-		{
-			if (isValidFunction(expression, columns))
-				result.push_back(expression->clone());
-		}
+		for (size_t i = 0; i < function->arguments->children.size(); ++i)
+			extractFunctions(function->arguments->children[i], columns, result);
+	}
+	else if (isValidFunction(expression, columns))
+	{
+		result.push_back(expression->clone());
 	}
 }
 
diff --git a/dbms/src/DataStreams/CreatingSetsBlockInputStream.cpp b/dbms/src/DataStreams/CreatingSetsBlockInputStream.cpp
index e75064cb792..32cd63c27c3 100644
--- a/dbms/src/DataStreams/CreatingSetsBlockInputStream.cpp
+++ b/dbms/src/DataStreams/CreatingSetsBlockInputStream.cpp
@@ -111,6 +111,8 @@ void CreatingSetsBlockInputStream::create(SubqueryForSet & subquery)
 	size_t rows = 0;
 	size_t bytes = 0;
 
+	watch.stop();
+
 	subquery.source->getLeafRowsBytes(rows, bytes);
 
 	size_t head_rows = 0;
diff --git a/dbms/src/DataStreams/FilterBlockInputStream.cpp b/dbms/src/DataStreams/FilterBlockInputStream.cpp
index fef2e4566e6..75de7654b96 100644
--- a/dbms/src/DataStreams/FilterBlockInputStream.cpp
+++ b/dbms/src/DataStreams/FilterBlockInputStream.cpp
@@ -41,7 +41,7 @@ Block FilterBlockInputStream::readImpl()
 		/** Если фильтр - константа (например, написано WHERE 1),
 		  *  то либо вернём пустой блок, либо вернём блок без изменений.
 		  */
-		ColumnConstUInt8 * column_const = typeid_cast<ColumnConstUInt8 *>(&*column);
+		const ColumnConstUInt8 * column_const = typeid_cast<const ColumnConstUInt8 *>(&*column);
 		if (column_const)
 		{
 			if (!column_const->getData())
@@ -50,52 +50,73 @@ Block FilterBlockInputStream::readImpl()
 			return res;
 		}
 
-		ColumnUInt8 * column_vec = typeid_cast<ColumnUInt8 *>(&*column);
+		const ColumnUInt8 * column_vec = typeid_cast<const ColumnUInt8 *>(&*column);
 		if (!column_vec)
 			throw Exception("Illegal type " + column->getName() + " of column for filter. Must be ColumnUInt8 or ColumnConstUInt8.", ErrorCodes::ILLEGAL_TYPE_OF_COLUMN_FOR_FILTER);
 
-		IColumn::Filter & filter = column_vec->getData();
+		const IColumn::Filter & filter = column_vec->getData();
 
-		/// Если кроме столбца с фильтром ничего нет.
-		if (columns == 1)
-		{
-			/// То посчитаем в нём количество единичек.
-			size_t filtered_rows = 0;
-			for (size_t i = 0, size = filter.size(); i < size; ++i)
-				if (filter[i])
-					++filtered_rows;
-
-			/// Если текущий блок полностью отфильтровался - перейдём к следующему.
-			if (filtered_rows == 0)
-				continue;
-
-			/// Заменяем этот столбец на столбец с константой 1, нужного размера.
-			res.getByPosition(filter_column).column = new ColumnConstUInt8(filtered_rows, 1);
-
-			return res;
-		}
-
-		/// Общий случай - фильтруем остальные столбцы.
+		/** Выясним, сколько строк будет в результате.
+		  * Для этого отфильтруем первый попавшийся неконстантный столбец
+		  *  или же посчитаем количество выставленных байт в фильтре.
+		  */
+		size_t first_non_constant_column = 0;
 		for (size_t i = 0; i < columns; ++i)
 		{
-			if (i != static_cast<size_t>(filter_column))
+			if (!res.getByPosition(i).column->isConst())
 			{
-				ColumnWithNameAndType & current_column = res.getByPosition(i);
-				current_column.column = current_column.column->filter(filter);
-				if (current_column.column->empty())
+				first_non_constant_column = i;
+
+				if (first_non_constant_column != static_cast<size_t>(filter_column))
 					break;
 			}
 		}
 
-		/// Любой столбец - не являющийся фильтром.
-		IColumn & any_not_filter_column = *res.getByPosition(filter_column == 0 ? 1 : 0).column;
+		size_t filtered_rows = 0;
+		if (first_non_constant_column != static_cast<size_t>(filter_column))
+		{
+			ColumnWithNameAndType & current_column = res.getByPosition(first_non_constant_column);
+			current_column.column = current_column.column->filter(filter);
+			filtered_rows = current_column.column->size();
+		}
+		else
+		{
+			filtered_rows = countBytesInFilter(filter);
+		}
 
 		/// Если текущий блок полностью отфильтровался - перейдём к следующему.
-		if (any_not_filter_column.empty())
+		if (filtered_rows == 0)
 			continue;
 
-		/// Сам столбец с фильтром заменяем на столбец с константой 1, так как после фильтрации в нём ничего другого не останется.
-		res.getByPosition(filter_column).column = new ColumnConstUInt8(any_not_filter_column.size(), 1);
+		/// Если через фильтр проходят все строчки.
+		if (filtered_rows == filter.size())
+		{
+			/// Заменим столбец с фильтром на константу.
+			res.getByPosition(filter_column).column = new ColumnConstUInt8(filtered_rows, 1);
+			/// Остальные столбцы трогать не нужно.
+			return res;
+		}
+
+		/// Фильтруем остальные столбцы.
+		for (size_t i = 0; i < columns; ++i)
+		{
+			ColumnWithNameAndType & current_column = res.getByPosition(i);
+
+			if (i == static_cast<size_t>(filter_column))
+			{
+				/// Сам столбец с фильтром заменяем на столбец с константой 1, так как после фильтрации в нём ничего другого не останется.
+				current_column.column = new ColumnConstUInt8(filtered_rows, 1);
+				continue;
+			}
+
+			if (i == first_non_constant_column)
+				continue;
+
+			if (current_column.column->isConst())
+				current_column.column = current_column.column->cut(0, filtered_rows);
+			else
+				current_column.column = current_column.column->filter(filter);
+		}
 
 		return res;
 	}
diff --git a/dbms/src/DataStreams/IBlockInputStream.cpp b/dbms/src/DataStreams/IBlockInputStream.cpp
index 85d6a7db329..cdf602920de 100644
--- a/dbms/src/DataStreams/IBlockInputStream.cpp
+++ b/dbms/src/DataStreams/IBlockInputStream.cpp
@@ -91,31 +91,6 @@ void IBlockInputStream::dumpTree(std::ostream & ostr, size_t indent, size_t mult
 }
 
 
-void IBlockInputStream::dumpTreeWithProfile(std::ostream & ostr, size_t indent)
-{
-	ostr << indent + 1 << ". " << getShortName() << "." << std::endl;
-
-	/// Для красоты
-	size_t width = log10(indent + 1) + 4 + getShortName().size();
-	for (size_t i = 0; i < width; ++i)
-		ostr << "─";
-	ostr << std::endl;
-
-	/// Информация профайлинга, если есть
-	if (IProfilingBlockInputStream * profiling = dynamic_cast<IProfilingBlockInputStream *>(this))
-	{
-		if (profiling->getInfo().blocks != 0)
-		{
-			profiling->getInfo().print(ostr);
-			ostr << std::endl;
-		}
-	}
-	
-	for (BlockInputStreams::iterator it = children.begin(); it != children.end(); ++it)
-		(*it)->dumpTreeWithProfile(ostr, indent + 1);
-}
-
-
 String IBlockInputStream::getShortName() const
 {
 	String res = getName();
diff --git a/dbms/src/DataStreams/IProfilingBlockInputStream.cpp b/dbms/src/DataStreams/IProfilingBlockInputStream.cpp
index fd7d71e17ea..79cdd4ae9a3 100644
--- a/dbms/src/DataStreams/IProfilingBlockInputStream.cpp
+++ b/dbms/src/DataStreams/IProfilingBlockInputStream.cpp
@@ -18,7 +18,7 @@ void BlockStreamProfileInfo::read(ReadBuffer & in)
 	readVarUInt(bytes, in);
 	readBinary(applied_limit, in);
 	readVarUInt(rows_before_limit, in);
-	readBinary(calculated_rows_before_limit, in);	
+	readBinary(calculated_rows_before_limit, in);
 }
 
 
@@ -46,13 +46,13 @@ bool BlockStreamProfileInfo::hasAppliedLimit() const
 	if (!calculated_rows_before_limit)
 		calculateRowsBeforeLimit();
 	return applied_limit;
-}	
+}
 
 
 void BlockStreamProfileInfo::update(Block & block)
 {
 	++blocks;
-	rows += block.rows();
+	rows += block.rowsInFirstColumn();
 	bytes += block.bytes();
 
 	if (column_names.empty())
@@ -76,7 +76,7 @@ void BlockStreamProfileInfo::collectInfosForStreamsWithName(const String & name,
 void BlockStreamProfileInfo::calculateRowsBeforeLimit() const
 {
 	calculated_rows_before_limit = true;
-	
+
 	/// есть ли Limit?
 	BlockStreamProfileInfos limits;
 	collectInfosForStreamsWithName("Limit", limits);
@@ -99,63 +99,6 @@ void BlockStreamProfileInfo::calculateRowsBeforeLimit() const
 }
 
 
-void BlockStreamProfileInfo::print(std::ostream & ostr) const
-{
-	UInt64 elapsed 			= work_stopwatch.elapsed();
-	UInt64 nested_elapsed	= 0;
-	double elapsed_seconds	= work_stopwatch.elapsedSeconds();
-	double nested_elapsed_seconds = 0;
-	
-	UInt64 nested_rows 		= 0;
-	UInt64 nested_blocks 	= 0;
-	UInt64 nested_bytes 	= 0;
-	
-	if (!nested_infos.empty())
-	{
-		for (BlockStreamProfileInfos::const_iterator it = nested_infos.begin(); it != nested_infos.end(); ++it)
-		{
-			if ((*it)->work_stopwatch.elapsed() > nested_elapsed)
-			{
-				nested_elapsed = (*it)->work_stopwatch.elapsed();
-				nested_elapsed_seconds = (*it)->work_stopwatch.elapsedSeconds();
-			}
-			
-			nested_rows 	+= (*it)->rows;
-			nested_blocks	+= (*it)->blocks;
-			nested_bytes 	+= (*it)->bytes;
-		}
-	}
-	
-	ostr 	<< std::fixed << std::setprecision(2)
-			<< "Columns: " << column_names << std::endl
-			<< "Elapsed:        " << elapsed_seconds << " sec. "
-			<< "(" << elapsed * 100.0 / total_stopwatch.elapsed() << "%), " << std::endl;
-
-	if (!nested_infos.empty())
-	{
-		double self_percents = (elapsed - nested_elapsed) * 100.0 / total_stopwatch.elapsed();
-		
-		ostr<< "Elapsed (self): " << (elapsed_seconds - nested_elapsed_seconds) << " sec. "
-			<< "(" << (self_percents >= 50 ? "\033[1;31m" : (self_percents >= 10 ? "\033[1;33m" : ""))	/// Раскраска больших значений
-				<< self_percents << "%"
-				<< (self_percents >= 10 ? "\033[0m" : "") << "), " << std::endl
-			<< "Rows (in):      " << nested_rows << ", per second: " << nested_rows / elapsed_seconds << ", " << std::endl
-			<< "Blocks (in):    " << nested_blocks << ", per second: " << nested_blocks / elapsed_seconds << ", " << std::endl
-			<< "                " << nested_bytes / 1000000.0 << " MB (memory), "
-				<< nested_bytes * 1000 / elapsed << " MB/s (memory), " << std::endl;
-
-		if (self_percents > 0.1)
-			ostr << "Rows per second (in, self): " << (nested_rows / (elapsed_seconds - nested_elapsed_seconds))
-				<< ", " << (elapsed - nested_elapsed) / nested_rows << " ns/row, " << std::endl;
-	}
-		
-	ostr 	<< "Rows (out):     " << rows << ", per second: " << rows / elapsed_seconds << ", " << std::endl
-			<< "Blocks (out):   " << blocks << ", per second: " << blocks / elapsed_seconds << ", " << std::endl
-			<< "                " << bytes / 1000000.0 << " MB (memory), " << bytes * 1000 / elapsed << " MB/s (memory), " << std::endl
-			<< "Average block size (out): " << rows / blocks << "." << std::endl;
-}
-
-
 Block IProfilingBlockInputStream::read()
 {
 	if (!info.started)
@@ -166,7 +109,7 @@ Block IProfilingBlockInputStream::read()
 		for (BlockInputStreams::const_iterator it = children.begin(); it != children.end(); ++it)
 			if (const IProfilingBlockInputStream * child = dynamic_cast<const IProfilingBlockInputStream *>(&**it))
 				info.nested_infos.push_back(&child->info);
-		
+
 		info.started = true;
 	}
 
@@ -175,9 +118,7 @@ Block IProfilingBlockInputStream::read()
 	if (is_cancelled)
 		return res;
 
-	info.work_stopwatch.start();
 	res = readImpl();
-	info.work_stopwatch.stop();
 
 /*	if (res)
 	{
@@ -194,7 +135,7 @@ Block IProfilingBlockInputStream::read()
 				std::cerr << ", ";
 			std::cerr << res.getByPosition(i).name << " (" << res.getByPosition(i).column->size() << ")";
 		}
-		
+
 		std::cerr << std::endl;
 	}*/
 
@@ -225,7 +166,7 @@ Block IProfilingBlockInputStream::read()
 		cancel();
 	}
 
-	progress(res.rows(), res.bytes());
+	progress(res.rowsInFirstColumn(), res.bytes());
 
 	return res;
 }
@@ -269,7 +210,7 @@ void IProfilingBlockInputStream::updateExtremes(Block & block)
 		for (size_t i = 0; i < columns; ++i)
 		{
 			ColumnPtr & column = extremes.getByPosition(i).column;
-			
+
 			Field min_value = (*column)[0];
 			Field max_value = (*column)[1];
 
@@ -330,9 +271,6 @@ bool IProfilingBlockInputStream::checkLimits()
 
 void IProfilingBlockInputStream::checkQuota(Block & block)
 {
-	time_t current_time = time(0);
-	double total_elapsed = info.total_stopwatch.elapsedSeconds();
-
 	switch (limits.mode)
 	{
 		case LIMITS_TOTAL:
@@ -340,15 +278,20 @@ void IProfilingBlockInputStream::checkQuota(Block & block)
 			break;
 
 		case LIMITS_CURRENT:
-			quota->checkAndAddResultRowsBytes(current_time, block.rows(), block.bytes());
+		{
+			time_t current_time = time(0);
+			double total_elapsed = info.total_stopwatch.elapsedSeconds();
+
+			quota->checkAndAddResultRowsBytes(current_time, block.rowsInFirstColumn(), block.bytes());
 			quota->checkAndAddExecutionTime(current_time, Poco::Timespan((total_elapsed - prev_elapsed) * 1000000.0));
+
+			prev_elapsed = total_elapsed;
 			break;
+		}
 
 		default:
 			throw Exception("Logical error: unknown limits mode.", ErrorCodes::LOGICAL_ERROR);
 	}
-
-	prev_elapsed = total_elapsed;
 }
 
 
@@ -366,10 +309,9 @@ void IProfilingBlockInputStream::progressImpl(size_t rows, size_t bytes)
 				cancel();
 
 			/// Общее количество данных, обработанных во всех листовых источниках, возможно, на удалённых серверах.
-			
+
 			size_t total_rows = process_list_elem->rows_processed;
 			size_t total_bytes = process_list_elem->bytes_processed;
-			double total_elapsed = info.total_stopwatch.elapsedSeconds();
 
 			/** Проверяем ограничения на объём данных для чтения, скорость выполнения запроса, квоту на объём данных для чтения.
 			  * NOTE: Может быть, имеет смысл сделать, чтобы они проверялись прямо в ProcessList?
@@ -389,13 +331,17 @@ void IProfilingBlockInputStream::progressImpl(size_t rows, size_t bytes)
 					throw Exception("Logical error: unknown overflow mode", ErrorCodes::LOGICAL_ERROR);
 			}
 
-			if (limits.min_execution_speed
-				&& total_elapsed > limits.timeout_before_checking_execution_speed.totalMicroseconds() / 1000000.0
-				&& total_rows / total_elapsed < limits.min_execution_speed)
+			if (limits.min_execution_speed)
 			{
-				throw Exception("Query is executing too slow: " + toString(total_rows / total_elapsed)
-					+ " rows/sec., minimum: " + toString(limits.min_execution_speed),
-					ErrorCodes::TOO_SLOW);
+				double total_elapsed = info.total_stopwatch.elapsedSeconds();
+
+				if (total_elapsed > limits.timeout_before_checking_execution_speed.totalMicroseconds() / 1000000.0
+					&& total_rows / total_elapsed < limits.min_execution_speed)
+				{
+					throw Exception("Query is executing too slow: " + toString(total_rows / total_elapsed)
+						+ " rows/sec., minimum: " + toString(limits.min_execution_speed),
+						ErrorCodes::TOO_SLOW);
+				}
 			}
 
 			if (quota != nullptr && limits.mode == LIMITS_TOTAL)
@@ -405,7 +351,7 @@ void IProfilingBlockInputStream::progressImpl(size_t rows, size_t bytes)
 		}
 	}
 }
-	
+
 
 const BlockStreamProfileInfo & IProfilingBlockInputStream::getInfo() const
 {
@@ -427,7 +373,7 @@ void IProfilingBlockInputStream::cancel()
 void IProfilingBlockInputStream::setProgressCallback(ProgressCallback callback)
 {
 	progress_callback = callback;
-	
+
 	for (BlockInputStreams::iterator it = children.begin(); it != children.end(); ++it)
 		if (IProfilingBlockInputStream * child = dynamic_cast<IProfilingBlockInputStream *>(&**it))
 			child->setProgressCallback(callback);
diff --git a/dbms/src/DataStreams/JSONRowOutputStream.cpp b/dbms/src/DataStreams/JSONRowOutputStream.cpp
index 6794ebb52d6..5cdb6f82c8d 100644
--- a/dbms/src/DataStreams/JSONRowOutputStream.cpp
+++ b/dbms/src/DataStreams/JSONRowOutputStream.cpp
@@ -10,7 +10,7 @@ using Poco::SharedPtr;
 
 
 JSONRowOutputStream::JSONRowOutputStream(WriteBuffer & ostr_, const Block & sample_)
-	: ostr(ostr_), field_number(0), row_count(0), applied_limit(false), rows_before_limit(0)
+	: dst_ostr(ostr_), ostr(dst_ostr), field_number(0), row_count(0), applied_limit(false), rows_before_limit(0)
 {
 	NamesAndTypesList columns(sample_.getColumnsList());
 	fields.assign(columns.begin(), columns.end());
@@ -44,8 +44,6 @@ void JSONRowOutputStream::writePrefix()
 	writeChar('\n', ostr);
 	writeCString("\t\"data\":\n", ostr);
 	writeCString("\t[\n", ostr);
-
-	ostr.next();
 }
 
 
diff --git a/dbms/src/DataStreams/MergeSortingBlockInputStream.cpp b/dbms/src/DataStreams/MergeSortingBlockInputStream.cpp
index 14d153d656b..6c25b33f83d 100644
--- a/dbms/src/DataStreams/MergeSortingBlockInputStream.cpp
+++ b/dbms/src/DataStreams/MergeSortingBlockInputStream.cpp
@@ -18,7 +18,7 @@ Block MergeSortingBlockInputStream::readImpl()
 
 	if (has_been_read)
 		return Block();
-	
+
 	has_been_read = true;
 
 	Blocks blocks;
@@ -38,15 +38,15 @@ Block MergeSortingBlockInputStream::merge(Blocks & blocks)
 
 	if (blocks.size() == 1)
 		return blocks[0];
-	
+
 	Stopwatch watch;
 
 	LOG_DEBUG(log, "Merge sorting");
-	
+
 	CursorImpls cursors(blocks.size());
 
 	bool has_collation = false;
-	
+
 	size_t i = 0;
 	for (Blocks::const_iterator it = blocks.begin(); it != blocks.end(); ++it, ++i)
 	{
@@ -56,20 +56,22 @@ Block MergeSortingBlockInputStream::merge(Blocks & blocks)
 		cursors[i] = SortCursorImpl(*it, description);
 		has_collation |= cursors[i].has_collation;
 	}
-	
+
 	Block merged;
-	
+
 	if (has_collation)
 		merged = mergeImpl<SortCursorWithCollation>(blocks, cursors);
 	else
 		merged = mergeImpl<SortCursor>(blocks, cursors);
-	
+
+	watch.stop();
+
 	LOG_DEBUG(log, std::fixed << std::setprecision(2)
 		<< "Merge sorted " << blocks.size() << " blocks, " << merged.rows() << " rows"
 		<< " in " << watch.elapsedSeconds() << " sec., "
 		<< merged.rows() / watch.elapsedSeconds() << " rows/sec., "
 		<< merged.bytes() / 1000000.0 / watch.elapsedSeconds() << " MiB/sec.");
-	
+
 	return merged;
 }
 
@@ -78,13 +80,13 @@ Block MergeSortingBlockInputStream::mergeImpl(Blocks & blocks, CursorImpls & cur
 {
 	Block merged = blocks[0].cloneEmpty();
 	size_t num_columns = blocks[0].columns();
-	
+
 	typedef std::priority_queue<TSortCursor> Queue;
 	Queue queue;
-	
+
 	for (size_t i = 0; i < cursors.size(); ++i)
 		queue.push(TSortCursor(&cursors[i]));
-	
+
 	ColumnPlainPtrs merged_columns;
 	for (size_t i = 0; i < num_columns; ++i)	/// TODO: reserve
 		merged_columns.push_back(&*merged.getByPosition(i).column);
diff --git a/dbms/src/DataStreams/MergingSortedBlockInputStream.cpp b/dbms/src/DataStreams/MergingSortedBlockInputStream.cpp
index 32fe4e4c162..064bbf1bb78 100644
--- a/dbms/src/DataStreams/MergingSortedBlockInputStream.cpp
+++ b/dbms/src/DataStreams/MergingSortedBlockInputStream.cpp
@@ -184,7 +184,7 @@ void MergingSortedBlockInputStream::fetchNextBlock(const TSortCursor & current,
 void MergingSortedBlockInputStream::readSuffixImpl()
 {
 	const BlockStreamProfileInfo & profile_info = getInfo();
-	double seconds = profile_info.work_stopwatch.elapsedSeconds();
+	double seconds = profile_info.total_stopwatch.elapsedSeconds();
 	LOG_DEBUG(log, std::fixed << std::setprecision(2)
 		<< "Merge sorted " << profile_info.blocks << " blocks, " << profile_info.rows << " rows"
 		<< " in " << seconds << " sec., "
diff --git a/dbms/src/DataStreams/PrettyBlockOutputStream.cpp b/dbms/src/DataStreams/PrettyBlockOutputStream.cpp
index 01f4f86ce72..bbcbac06065 100644
--- a/dbms/src/DataStreams/PrettyBlockOutputStream.cpp
+++ b/dbms/src/DataStreams/PrettyBlockOutputStream.cpp
@@ -140,7 +140,7 @@ void PrettyBlockOutputStream::write(const Block & block_)
 		const ColumnWithNameAndType & col = block.getByPosition(i);
 
 		if (!no_escapes)
-			writeCString("\033[1;37m", ostr);
+			writeCString("\033[1m", ostr);
 
 		if (col.type->isNumeric())
 		{
diff --git a/dbms/src/DataStreams/PrettyCompactBlockOutputStream.cpp b/dbms/src/DataStreams/PrettyCompactBlockOutputStream.cpp
index 4ac18c596e8..530a1ef12f2 100644
--- a/dbms/src/DataStreams/PrettyCompactBlockOutputStream.cpp
+++ b/dbms/src/DataStreams/PrettyCompactBlockOutputStream.cpp
@@ -29,7 +29,7 @@ void PrettyCompactBlockOutputStream::writeHeader(
 				writeCString("─", ostr);
 
 			if (!no_escapes)
-				writeCString("\033[1;37m", ostr);
+				writeCString("\033[1m", ostr);
 			writeEscapedString(col.name, ostr);
 			if (!no_escapes)
 				writeCString("\033[0m", ostr);
@@ -37,7 +37,7 @@ void PrettyCompactBlockOutputStream::writeHeader(
 		else
 		{
 			if (!no_escapes)
-				writeCString("\033[1;37m", ostr);
+				writeCString("\033[1m", ostr);
 			writeEscapedString(col.name, ostr);
 			if (!no_escapes)
 				writeCString("\033[0m", ostr);
@@ -75,7 +75,7 @@ void PrettyCompactBlockOutputStream::writeRow(
 	const Widths_t & name_widths)
 {
 	size_t columns = max_widths.size();
-	
+
 	writeCString("│ ", ostr);
 
 	for (size_t j = 0; j < columns; ++j)
@@ -90,7 +90,7 @@ void PrettyCompactBlockOutputStream::writeRow(
 			size_t width = get<UInt64>((*block.getByPosition(columns + j).column)[row_id]);
 			for (size_t k = 0; k < max_widths[j] - width; ++k)
 				writeChar(' ', ostr);
-				
+
 			col.type->serializeTextEscaped((*col.column)[row_id], ostr);
 		}
 		else
@@ -113,16 +113,16 @@ void PrettyCompactBlockOutputStream::write(const Block & block_)
 		total_rows += block_.rows();
 		return;
 	}
-	
+
 	/// Будем вставлять сюда столбцы с вычисленными значениями видимых длин.
 	Block block = block_;
-	
+
 	size_t rows = block.rows();
 
 	Widths_t max_widths;
 	Widths_t name_widths;
 	calculateWidths(block, max_widths, name_widths);
-	
+
 	writeHeader(block, max_widths, name_widths);
 
 	for (size_t i = 0; i < rows && total_rows + i < max_rows; ++i)
diff --git a/dbms/src/DataStreams/PrettySpaceBlockOutputStream.cpp b/dbms/src/DataStreams/PrettySpaceBlockOutputStream.cpp
index a26b0e95e39..8c92367eebd 100644
--- a/dbms/src/DataStreams/PrettySpaceBlockOutputStream.cpp
+++ b/dbms/src/DataStreams/PrettySpaceBlockOutputStream.cpp
@@ -17,10 +17,10 @@ void PrettySpaceBlockOutputStream::write(const Block & block_)
 		total_rows += block_.rows();
 		return;
 	}
-	
+
 	/// Будем вставлять суда столбцы с вычисленными значениями видимых длин.
 	Block block = block_;
-	
+
 	size_t rows = block.rows();
 	size_t columns = block.columns();
 
@@ -48,7 +48,7 @@ void PrettySpaceBlockOutputStream::write(const Block & block_)
 				writeChar(' ', ostr);
 
 			if (!no_escapes)
-				writeCString("\033[1;37m", ostr);
+				writeCString("\033[1m", ostr);
 			writeEscapedString(col.name, ostr);
 			if (!no_escapes)
 				writeCString("\033[0m", ostr);
@@ -56,7 +56,7 @@ void PrettySpaceBlockOutputStream::write(const Block & block_)
 		else
 		{
 			if (!no_escapes)
-				writeCString("\033[1;37m", ostr);
+				writeCString("\033[1m", ostr);
 			writeEscapedString(col.name, ostr);
 			if (!no_escapes)
 				writeCString("\033[0m", ostr);
@@ -81,7 +81,7 @@ void PrettySpaceBlockOutputStream::write(const Block & block_)
 				size_t width = get<UInt64>((*block.getByPosition(columns + j).column)[i]);
 				for (ssize_t k = 0; k < std::max(0L, static_cast<ssize_t>(max_widths[j] - width)); ++k)
 					writeChar(' ', ostr);
-					
+
 				col.type->serializeTextEscaped((*col.column)[i], ostr);
 			}
 			else
diff --git a/dbms/src/Functions/FunctionFactory.cpp b/dbms/src/Functions/FunctionFactory.cpp
index 98529dc17e7..a164117505a 100644
--- a/dbms/src/Functions/FunctionFactory.cpp
+++ b/dbms/src/Functions/FunctionFactory.cpp
@@ -1,247 +1,69 @@
-#include <DB/Functions/FunctionsArithmetic.h>
-#include <DB/Functions/FunctionsComparison.h>
-#include <DB/Functions/FunctionsLogical.h>
-#include <DB/Functions/FunctionsString.h>
-#include <DB/Functions/FunctionsConversion.h>
-#include <DB/Functions/FunctionsDateTime.h>
-#include <DB/Functions/FunctionsStringSearch.h>
-#include <DB/Functions/FunctionsHashing.h>
-#include <DB/Functions/FunctionsRandom.h>
-#include <DB/Functions/FunctionsURL.h>
-#include <DB/Functions/FunctionsArray.h>
-#include <DB/Functions/FunctionsStringArray.h>
-#include <DB/Functions/FunctionsConditional.h>
-#include <DB/Functions/FunctionsDictionaries.h>
-#include <DB/Functions/FunctionsMiscellaneous.h>
-#include <DB/Functions/FunctionsRound.h>
-#include <DB/Functions/FunctionsReinterpret.h>
-#include <DB/Functions/FunctionsFormatting.h>
-#include <DB/Functions/FunctionsCoding.h>
-#include <DB/Functions/FunctionsHigherOrder.h>
-#include <DB/Functions/FunctionsVisitParam.h>
-
 #include <DB/Functions/FunctionFactory.h>
 
 
 namespace DB
 {
 
+/** Эти функции определены в отдельных translation unit-ах.
+  * Это сделано для того, чтобы уменьшить потребление оперативки при сборке, и ускорить параллельную сборку.
+  */
+void registerFunctionsArithmetic(FunctionFactory &);
+void registerFunctionsArray(FunctionFactory &);
+void registerFunctionsCoding(FunctionFactory &);
+void registerFunctionsComparison(FunctionFactory &);
+void registerFunctionsConditional(FunctionFactory &);
+void registerFunctionsConversion(FunctionFactory &);
+void registerFunctionsDateTime(FunctionFactory &);
+void registerFunctionsDictionaries(FunctionFactory &);
+void registerFunctionsFormatting(FunctionFactory &);
+void registerFunctionsHashing(FunctionFactory &);
+void registerFunctionsHigherOrder(FunctionFactory &);
+void registerFunctionsLogical(FunctionFactory &);
+void registerFunctionsMiscellaneous(FunctionFactory &);
+void registerFunctionsRandom(FunctionFactory &);
+void registerFunctionsReinterpret(FunctionFactory &);
+void registerFunctionsRound(FunctionFactory &);
+void registerFunctionsString(FunctionFactory &);
+void registerFunctionsStringArray(FunctionFactory &);
+void registerFunctionsStringSearch(FunctionFactory &);
+void registerFunctionsURL(FunctionFactory &);
+void registerFunctionsVisitParam(FunctionFactory &);
+
+
+FunctionFactory::FunctionFactory()
+{
+	registerFunctionsArithmetic(*this);
+	registerFunctionsArray(*this);
+	registerFunctionsCoding(*this);
+	registerFunctionsComparison(*this);
+	registerFunctionsConditional(*this);
+	registerFunctionsConversion(*this);
+	registerFunctionsDateTime(*this);
+	registerFunctionsDictionaries(*this);
+	registerFunctionsFormatting(*this);
+	registerFunctionsHashing(*this);
+	registerFunctionsHigherOrder(*this);
+	registerFunctionsLogical(*this);
+	registerFunctionsMiscellaneous(*this);
+	registerFunctionsRandom(*this);
+	registerFunctionsReinterpret(*this);
+	registerFunctionsRound(*this);
+	registerFunctionsString(*this);
+	registerFunctionsStringArray(*this);
+	registerFunctionsStringSearch(*this);
+	registerFunctionsURL(*this);
+	registerFunctionsVisitParam(*this);
+}
+
+
 
 FunctionPtr FunctionFactory::get(
 	const String & name,
 	const Context & context) const
 {
-	/// Немного неоптимально.
-
-		 if (name == "plus")						return new FunctionPlus;
-	else if (name == "minus")						return new FunctionMinus;
-	else if (name == "multiply")					return new FunctionMultiply;
-	else if (name == "divide")						return new FunctionDivideFloating;
-	else if (name == "intDiv")						return new FunctionDivideIntegral;
-	else if (name == "modulo")						return new FunctionModulo;
-	else if (name == "negate")						return new FunctionNegate;
-	else if (name == "bitAnd")						return new FunctionBitAnd;
-	else if (name == "bitOr")						return new FunctionBitOr;
-	else if (name == "bitXor")						return new FunctionBitXor;
-	else if (name == "bitNot")						return new FunctionBitNot;
-	else if (name == "bitShiftLeft")				return new FunctionBitShiftLeft;
-	else if (name == "bitShiftRight")				return new FunctionBitShiftRight;
-
-	else if (name == "equals")						return new FunctionEquals;
-	else if (name == "notEquals")					return new FunctionNotEquals;
-	else if (name == "less")						return new FunctionLess;
-	else if (name == "greater")						return new FunctionGreater;
-	else if (name == "lessOrEquals")				return new FunctionLessOrEquals;
-	else if (name == "greaterOrEquals")			return new FunctionGreaterOrEquals;
-
-	else if (name == "and")							return new FunctionAnd;
-	else if (name == "or")							return new FunctionOr;
-	else if (name == "xor")							return new FunctionXor;
-	else if (name == "not")							return new FunctionNot;
-
-	else if (name == "roundToExp2")				return new FunctionRoundToExp2;
-	else if (name == "roundDuration")				return new FunctionRoundDuration;
-	else if (name == "roundAge")					return new FunctionRoundAge;
-
-	else if (name == "empty")						return new FunctionEmpty;
-	else if (name == "notEmpty")					return new FunctionNotEmpty;
-	else if (name == "length")						return new FunctionLength;
-	else if (name == "lengthUTF8")					return new FunctionLengthUTF8;
-	else if (name == "lower")						return new FunctionLower;
-	else if (name == "upper")						return new FunctionUpper;
-	else if (name == "lowerUTF8")					return new FunctionLowerUTF8;
-	else if (name == "upperUTF8")					return new FunctionUpperUTF8;
-	else if (name == "reverse")						return new FunctionReverse;
-	else if (name == "reverseUTF8")				return new FunctionReverseUTF8;
-	else if (name == "concat")						return new FunctionConcat;
-	else if (name == "substring")					return new FunctionSubstring;
-	else if (name == "replaceOne")					return new FunctionReplaceOne;
-	else if (name == "replaceAll")					return new FunctionReplaceAll;
-	else if (name == "replaceRegexpOne")			return new FunctionReplaceRegexpOne;
-	else if (name == "replaceRegexpAll")			return new FunctionReplaceRegexpAll;
-	else if (name == "substringUTF8")				return new FunctionSubstringUTF8;
-
-	else if (name == "toUInt8")						return new FunctionToUInt8;
-	else if (name == "toUInt16")					return new FunctionToUInt16;
-	else if (name == "toUInt32")					return new FunctionToUInt32;
-	else if (name == "toUInt64")					return new FunctionToUInt64;
-	else if (name == "toInt8")						return new FunctionToInt8;
-	else if (name == "toInt16")						return new FunctionToInt16;
-	else if (name == "toInt32")						return new FunctionToInt32;
-	else if (name == "toInt64")						return new FunctionToInt64;
-	else if (name == "toFloat32")					return new FunctionToFloat32;
-	else if (name == "toFloat64")					return new FunctionToFloat64;
-	else if (name == "toDate")						return new FunctionToDate;
-	else if (name == "toDateTime")					return new FunctionToDateTime;
-	else if (name == "toString")					return new FunctionToString;
-	else if (name == "toFixedString")				return new FunctionToFixedString;
-	else if (name == "toStringCutToZero")			return new FunctionToStringCutToZero;
-
-	else if (name == "reinterpretAsUInt8")			return new FunctionReinterpretAsUInt8;
-	else if (name == "reinterpretAsUInt16")		return new FunctionReinterpretAsUInt16;
-	else if (name == "reinterpretAsUInt32")		return new FunctionReinterpretAsUInt32;
-	else if (name == "reinterpretAsUInt64")		return new FunctionReinterpretAsUInt64;
-	else if (name == "reinterpretAsInt8")			return new FunctionReinterpretAsInt8;
-	else if (name == "reinterpretAsInt16")			return new FunctionReinterpretAsInt16;
-	else if (name == "reinterpretAsInt32")			return new FunctionReinterpretAsInt32;
-	else if (name == "reinterpretAsInt64")			return new FunctionReinterpretAsInt64;
-	else if (name == "reinterpretAsFloat32")		return new FunctionReinterpretAsFloat32;
-	else if (name == "reinterpretAsFloat64")		return new FunctionReinterpretAsFloat64;
-	else if (name == "reinterpretAsDate")			return new FunctionReinterpretAsDate;
-	else if (name == "reinterpretAsDateTime")		return new FunctionReinterpretAsDateTime;
-	else if (name == "reinterpretAsString")		return new FunctionReinterpretAsString;
-
-	else if (name == "toYear")						return new FunctionToYear;
-	else if (name == "toMonth")						return new FunctionToMonth;
-	else if (name == "toDayOfMonth")				return new FunctionToDayOfMonth;
-	else if (name == "toDayOfWeek")				return new FunctionToDayOfWeek;
-	else if (name == "toHour")						return new FunctionToHour;
-	else if (name == "toMinute")					return new FunctionToMinute;
-	else if (name == "toSecond")					return new FunctionToSecond;
-	else if (name == "toMonday")					return new FunctionToMonday;
-	else if (name == "toStartOfMonth")				return new FunctionToStartOfMonth;
-	else if (name == "toStartOfQuarter")			return new FunctionToStartOfQuarter;
-	else if (name == "toStartOfYear")				return new FunctionToStartOfYear;
-	else if (name == "toStartOfMinute")			return new FunctionToStartOfMinute;
-	else if (name == "toStartOfHour")				return new FunctionToStartOfHour;
-	else if (name == "toRelativeYearNum")			return new FunctionToRelativeYearNum;
-	else if (name == "toRelativeMonthNum")			return new FunctionToRelativeMonthNum;
-	else if (name == "toRelativeWeekNum")			return new FunctionToRelativeWeekNum;
-	else if (name == "toRelativeDayNum")			return new FunctionToRelativeDayNum;
-	else if (name == "toRelativeHourNum")			return new FunctionToRelativeHourNum;
-	else if (name == "toRelativeMinuteNum")			return new FunctionToRelativeMinuteNum;
-	else if (name == "toRelativeSecondNum")			return new FunctionToRelativeSecondNum;
-	else if (name == "toTime")						return new FunctionToTime;
-	else if (name == "now")							return new FunctionNow;
-	else if (name == "timeSlot")					return new FunctionTimeSlot;
-	else if (name == "timeSlots")					return new FunctionTimeSlots;
-
-	else if (name == "position")					return new FunctionPosition;
-	else if (name == "positionUTF8")				return new FunctionPositionUTF8;
-	else if (name == "match")						return new FunctionMatch;
-	else if (name == "like")						return new FunctionLike;
-	else if (name == "notLike")						return new FunctionNotLike;
-	else if (name == "extract")						return new FunctionExtract;
-	else if (name == "extractAll")					return new FunctionExtractAll;
-
-	else if (name == "halfMD5")						return new FunctionHalfMD5;
-	else if (name == "sipHash64")					return new FunctionSipHash64;
-	else if (name == "cityHash64")					return new FunctionCityHash64;
-	else if (name == "intHash32")					return new FunctionIntHash32;
-	else if (name == "intHash64")					return new FunctionIntHash64;
-
-	else if (name == "IPv4NumToString")			return new FunctionIPv4NumToString;
-	else if (name == "IPv4StringToNum")			return new FunctionIPv4StringToNum;
-	else if (name == "hex")							return new FunctionHex;
-	else if (name == "unhex")						return new FunctionUnhex;
-	else if (name == "bitmaskToList")				return new FunctionBitmaskToList;
-	else if (name == "bitmaskToArray")				return new FunctionBitmaskToArray;
-
-	else if (name == "rand")						return new FunctionRand;
-	else if (name == "rand64")						return new FunctionRand64;
-
-	else if (name == "protocol")					return new FunctionProtocol;
-	else if (name == "domain")						return new FunctionDomain;
-	else if (name == "domainWithoutWWW")			return new FunctionDomainWithoutWWW;
-	else if (name == "topLevelDomain")				return new FunctionTopLevelDomain;
-	else if (name == "path")						return new FunctionPath;
-	else if (name == "queryString")				return new FunctionQueryString;
-	else if (name == "fragment")					return new FunctionFragment;
-	else if (name == "queryStringAndFragment")		return new FunctionQueryStringAndFragment;
-	else if (name == "extractURLParameter")		return new FunctionExtractURLParameter;
-	else if (name == "extractURLParameters")		return new FunctionExtractURLParameters;
-	else if (name == "extractURLParameterNames")		return new FunctionExtractURLParameterNames;
-	else if (name == "URLHierarchy")				return new FunctionURLHierarchy;
-	else if (name == "URLPathHierarchy")				return new FunctionURLPathHierarchy;
-	else if (name == "cutWWW")						return new FunctionCutWWW;
-	else if (name == "cutQueryString")				return new FunctionCutQueryString;
-	else if (name == "cutFragment")				return new FunctionCutFragment;
-	else if (name == "cutQueryStringAndFragment")	return new FunctionCutQueryStringAndFragment;
-	else if (name == "cutURLParameter")			return new FunctionCutURLParameter;
-
-	else if (name == "hostName")					return new FunctionHostName;
-	else if (name == "visibleWidth")				return new FunctionVisibleWidth;
-	else if (name == "toTypeName")					return new FunctionToTypeName;
-	else if (name == "blockSize")					return new FunctionBlockSize;
-	else if (name == "sleep")						return new FunctionSleep;
-	else if (name == "materialize")				return new FunctionMaterialize;
-	else if (name == "ignore")						return new FunctionIgnore;
-	else if (name == "arrayJoin")					return new FunctionArrayJoin;
-
-	else if (name == "tuple")						return new FunctionTuple;
-	else if (name == "tupleElement")				return new FunctionTupleElement;
-	else if (name == "in")							return new FunctionIn(false, false);
-	else if (name == "notIn")						return new FunctionIn(true, false);
-	else if (name == "globalIn")					return new FunctionIn(false, true);
-	else if (name == "globalNotIn")					return new FunctionIn(true, true);
-
-	else if (name == "array")						return new FunctionArray;
-	else if (name == "arrayElement")				return new FunctionArrayElement;
-	else if (name == "has")							return new FunctionHas;
-	else if (name == "indexOf")						return new FunctionIndexOf;
-	else if (name == "countEqual")					return new FunctionCountEqual;
-	else if (name == "arrayEnumerate")				return new FunctionArrayEnumerate;
-	else if (name == "arrayEnumerateUniq")			return new FunctionArrayEnumerateUniq;
-
-	else if (name == "arrayMap")					return new FunctionArrayMap;
-	else if (name == "arrayFilter")				return new FunctionArrayFilter;
-	else if (name == "arrayCount")					return new FunctionArrayCount;
-	else if (name == "arrayExists")				return new FunctionArrayExists;
-	else if (name == "arrayAll")					return new FunctionArrayAll;
-	else if (name == "arraySum")					return new FunctionArraySum;
-
-	else if (name == "alphaTokens")				return new FunctionAlphaTokens;
-	else if (name == "splitByChar")				return new FunctionSplitByChar;
-	else if (name == "splitByString")				return new FunctionSplitByString;
-
-	else if (name == "if")							return new FunctionIf;
-
-	else if (name == "regionToCity")				return new FunctionRegionToCity(context.getDictionaries().getRegionsHierarchies());
-	else if (name == "regionToArea")				return new FunctionRegionToArea(context.getDictionaries().getRegionsHierarchies());
-	else if (name == "regionToCountry")			return new FunctionRegionToCountry(context.getDictionaries().getRegionsHierarchies());
-	else if (name == "regionToContinent")			return new FunctionRegionToContinent(context.getDictionaries().getRegionsHierarchies());
-	else if (name == "OSToRoot")					return new FunctionOSToRoot(context.getDictionaries().getTechDataHierarchy());
-	else if (name == "SEToRoot")					return new FunctionSEToRoot(context.getDictionaries().getTechDataHierarchy());
-	else if (name == "categoryToRoot")				return new FunctionCategoryToRoot(context.getDictionaries().getCategoriesHierarchy());
-	else if (name == "categoryToSecondLevel")		return new FunctionCategoryToSecondLevel(context.getDictionaries().getCategoriesHierarchy());
-	else if (name == "regionIn")					return new FunctionRegionIn(context.getDictionaries().getRegionsHierarchies());
-	else if (name == "OSIn")						return new FunctionOSIn(context.getDictionaries().getTechDataHierarchy());
-	else if (name == "SEIn")						return new FunctionSEIn(context.getDictionaries().getTechDataHierarchy());
-	else if (name == "categoryIn")					return new FunctionCategoryIn(context.getDictionaries().getCategoriesHierarchy());
-	else if (name == "regionHierarchy")			return new FunctionRegionHierarchy(context.getDictionaries().getRegionsHierarchies());
-	else if (name == "OSHierarchy")				return new FunctionOSHierarchy(context.getDictionaries().getTechDataHierarchy());
-	else if (name == "SEHierarchy")				return new FunctionSEHierarchy(context.getDictionaries().getTechDataHierarchy());
-	else if (name == "categoryHierarchy")			return new FunctionCategoryHierarchy(context.getDictionaries().getCategoriesHierarchy());
-	else if (name == "regionToName")				return new FunctionRegionToName(context.getDictionaries().getRegionsNames());
-
-	else if (name == "visitParamHas")				return new FunctionVisitParamHas;
-	else if (name == "visitParamExtractUInt")		return new FunctionVisitParamExtractUInt;
-	else if (name == "visitParamExtractInt")		return new FunctionVisitParamExtractInt;
-	else if (name == "visitParamExtractFloat")		return new FunctionVisitParamExtractFloat;
-	else if (name == "visitParamExtractBool")		return new FunctionVisitParamExtractBool;
-	else if (name == "visitParamExtractRaw")		return new FunctionVisitParamExtractRaw;
-	else if (name == "visitParamExtractString")	return new FunctionVisitParamExtractString;
-
+	auto it = functions.find(name);
+	if (functions.end() != it)
+		return it->second(context);
 	else
 		throw Exception("Unknown function " + name, ErrorCodes::UNKNOWN_FUNCTION);
 }
diff --git a/dbms/src/Functions/FunctionsArithmetic.cpp b/dbms/src/Functions/FunctionsArithmetic.cpp
new file mode 100644
index 00000000000..1bc0e9cf2d8
--- /dev/null
+++ b/dbms/src/Functions/FunctionsArithmetic.cpp
@@ -0,0 +1,28 @@
+#include <DB/Functions/FunctionFactory.h>
+#include <DB/Functions/FunctionsArithmetic.h>
+
+namespace DB
+{
+
+void registerFunctionsArithmetic(FunctionFactory & factory)
+{
+	#define F [](const Context & context) -> IFunction*
+
+	factory.registerFunction("plus", 			F { return new FunctionPlus; });
+	factory.registerFunction("minus", 			F { return new FunctionMinus; });
+	factory.registerFunction("multiply", 		F { return new FunctionMultiply; });
+	factory.registerFunction("divide", 			F { return new FunctionDivideFloating; });
+	factory.registerFunction("intDiv", 			F { return new FunctionDivideIntegral; });
+	factory.registerFunction("modulo", 			F { return new FunctionModulo; });
+	factory.registerFunction("negate", 			F { return new FunctionNegate; });
+	factory.registerFunction("bitAnd", 			F { return new FunctionBitAnd; });
+	factory.registerFunction("bitOr", 			F { return new FunctionBitOr; });
+	factory.registerFunction("bitXor", 			F { return new FunctionBitXor; });
+	factory.registerFunction("bitNot", 			F { return new FunctionBitNot; });
+	factory.registerFunction("bitShiftLeft", 	F { return new FunctionBitShiftLeft; });
+	factory.registerFunction("bitShiftRight", 	F { return new FunctionBitShiftRight; });
+
+	#undef F
+}
+
+}
diff --git a/dbms/src/Functions/FunctionsArray.cpp b/dbms/src/Functions/FunctionsArray.cpp
new file mode 100644
index 00000000000..d9bb716e59d
--- /dev/null
+++ b/dbms/src/Functions/FunctionsArray.cpp
@@ -0,0 +1,22 @@
+#include <DB/Functions/FunctionFactory.h>
+#include <DB/Functions/FunctionsArray.h>
+
+namespace DB
+{
+
+void registerFunctionsArray(FunctionFactory & factory)
+{
+	#define F [](const Context & context) -> IFunction*
+
+	factory.registerFunction("array", 				F { return new FunctionArray; });
+	factory.registerFunction("arrayElement", 		F { return new FunctionArrayElement; });
+	factory.registerFunction("has", 				F { return new FunctionHas; });
+	factory.registerFunction("indexOf", 			F { return new FunctionIndexOf; });
+	factory.registerFunction("countEqual", 			F { return new FunctionCountEqual; });
+	factory.registerFunction("arrayEnumerate", 		F { return new FunctionArrayEnumerate; });
+	factory.registerFunction("arrayEnumerateUniq", 	F { return new FunctionArrayEnumerateUniq; });
+
+	#undef F
+}
+
+}
diff --git a/dbms/src/Functions/FunctionsCoding.cpp b/dbms/src/Functions/FunctionsCoding.cpp
new file mode 100644
index 00000000000..8d9bcaa0a5a
--- /dev/null
+++ b/dbms/src/Functions/FunctionsCoding.cpp
@@ -0,0 +1,21 @@
+#include <DB/Functions/FunctionFactory.h>
+#include <DB/Functions/FunctionsCoding.h>
+
+namespace DB
+{
+
+void registerFunctionsCoding(FunctionFactory & factory)
+{
+	#define F [](const Context & context) -> IFunction*
+
+	factory.registerFunction("toStringCutToZero", 	F { return new FunctionToStringCutToZero; });
+	factory.registerFunction("IPv4NumToString", 	F { return new FunctionIPv4NumToString; });
+	factory.registerFunction("IPv4StringToNum", 	F { return new FunctionIPv4StringToNum; });
+	factory.registerFunction("hex", 				F { return new FunctionHex; });
+	factory.registerFunction("unhex", 				F { return new FunctionUnhex; });
+	factory.registerFunction("bitmaskToArray",		F { return new FunctionBitmaskToArray; });
+
+	#undef F
+}
+
+}
diff --git a/dbms/src/Functions/FunctionsComparison.cpp b/dbms/src/Functions/FunctionsComparison.cpp
new file mode 100644
index 00000000000..dd56cc668c0
--- /dev/null
+++ b/dbms/src/Functions/FunctionsComparison.cpp
@@ -0,0 +1,21 @@
+#include <DB/Functions/FunctionFactory.h>
+#include <DB/Functions/FunctionsComparison.h>
+
+namespace DB
+{
+
+void registerFunctionsComparison(FunctionFactory & factory)
+{
+	#define F [](const Context & context) -> IFunction*
+
+	factory.registerFunction("equals", 			F { return new FunctionEquals; });
+	factory.registerFunction("notEquals", 		F { return new FunctionNotEquals; });
+	factory.registerFunction("less", 			F { return new FunctionLess; });
+	factory.registerFunction("greater", 		F { return new FunctionGreater; });
+	factory.registerFunction("lessOrEquals", 	F { return new FunctionLessOrEquals; });
+	factory.registerFunction("greaterOrEquals", F { return new FunctionGreaterOrEquals; });
+
+	#undef F
+}
+
+}
diff --git a/dbms/src/Functions/FunctionsConditional.cpp b/dbms/src/Functions/FunctionsConditional.cpp
new file mode 100644
index 00000000000..ac05d84029a
--- /dev/null
+++ b/dbms/src/Functions/FunctionsConditional.cpp
@@ -0,0 +1,16 @@
+#include <DB/Functions/FunctionFactory.h>
+#include <DB/Functions/FunctionsConditional.h>
+
+namespace DB
+{
+
+void registerFunctionsConditional(FunctionFactory & factory)
+{
+	#define F [](const Context & context) -> IFunction*
+
+	factory.registerFunction("if", F { return new FunctionIf; });
+
+	#undef F
+}
+
+}
diff --git a/dbms/src/Functions/FunctionsConversion.cpp b/dbms/src/Functions/FunctionsConversion.cpp
new file mode 100644
index 00000000000..aa01773b1fc
--- /dev/null
+++ b/dbms/src/Functions/FunctionsConversion.cpp
@@ -0,0 +1,29 @@
+#include <DB/Functions/FunctionFactory.h>
+#include <DB/Functions/FunctionsConversion.h>
+
+namespace DB
+{
+
+void registerFunctionsConversion(FunctionFactory & factory)
+{
+	#define F [](const Context & context) -> IFunction*
+
+	factory.registerFunction("toUInt8", 		F { return new FunctionToUInt8; });
+	factory.registerFunction("toUInt16", 		F { return new FunctionToUInt16; });
+	factory.registerFunction("toUInt32", 		F { return new FunctionToUInt32; });
+	factory.registerFunction("toUInt64", 		F { return new FunctionToUInt64; });
+	factory.registerFunction("toInt8", 			F { return new FunctionToInt8; });
+	factory.registerFunction("toInt16", 		F { return new FunctionToInt16; });
+	factory.registerFunction("toInt32", 		F { return new FunctionToInt32; });
+	factory.registerFunction("toInt64", 		F { return new FunctionToInt64; });
+	factory.registerFunction("toFloat32", 		F { return new FunctionToFloat32; });
+	factory.registerFunction("toFloat64", 		F { return new FunctionToFloat64; });
+	factory.registerFunction("toDate", 			F { return new FunctionToDate; });
+	factory.registerFunction("toDateTime", 		F { return new FunctionToDateTime; });
+	factory.registerFunction("toString", 		F { return new FunctionToString; });
+	factory.registerFunction("toFixedString", 	F { return new FunctionToFixedString; });
+
+	#undef F
+}
+
+}
diff --git a/dbms/src/Functions/FunctionsDateTime.cpp b/dbms/src/Functions/FunctionsDateTime.cpp
new file mode 100644
index 00000000000..b521d1400db
--- /dev/null
+++ b/dbms/src/Functions/FunctionsDateTime.cpp
@@ -0,0 +1,39 @@
+#include <DB/Functions/FunctionFactory.h>
+#include <DB/Functions/FunctionsDateTime.h>
+
+namespace DB
+{
+
+void registerFunctionsDateTime(FunctionFactory & factory)
+{
+	#define F [](const Context & context) -> IFunction*
+
+	factory.registerFunction("toYear", 				F { return new FunctionToYear; });
+	factory.registerFunction("toMonth",				F { return new FunctionToMonth; });
+	factory.registerFunction("toDayOfMonth", 		F { return new FunctionToDayOfMonth; });
+	factory.registerFunction("toDayOfWeek", 		F { return new FunctionToDayOfWeek; });
+	factory.registerFunction("toHour", 				F { return new FunctionToHour; });
+	factory.registerFunction("toMinute", 			F { return new FunctionToMinute; });
+	factory.registerFunction("toSecond", 			F { return new FunctionToSecond; });
+	factory.registerFunction("toMonday", 			F { return new FunctionToMonday; });
+	factory.registerFunction("toStartOfMonth", 		F { return new FunctionToStartOfMonth; });
+	factory.registerFunction("toStartOfQuarter", 	F { return new FunctionToStartOfQuarter; });
+	factory.registerFunction("toStartOfYear", 		F { return new FunctionToStartOfYear; });
+	factory.registerFunction("toStartOfMinute", 	F { return new FunctionToStartOfMinute; });
+	factory.registerFunction("toStartOfHour", 		F { return new FunctionToStartOfHour; });
+	factory.registerFunction("toRelativeYearNum", 	F { return new FunctionToRelativeYearNum; });
+	factory.registerFunction("toRelativeMonthNum", 	F { return new FunctionToRelativeMonthNum; });
+	factory.registerFunction("toRelativeWeekNum", 	F { return new FunctionToRelativeWeekNum; });
+	factory.registerFunction("toRelativeDayNum", 	F { return new FunctionToRelativeDayNum; });
+	factory.registerFunction("toRelativeHourNum", 	F { return new FunctionToRelativeHourNum; });
+	factory.registerFunction("toRelativeMinuteNum", F { return new FunctionToRelativeMinuteNum; });
+	factory.registerFunction("toRelativeSecondNum", F { return new FunctionToRelativeSecondNum; });
+	factory.registerFunction("toTime", 				F { return new FunctionToTime; });
+	factory.registerFunction("now", 				F { return new FunctionNow; });
+	factory.registerFunction("timeSlot", 			F { return new FunctionTimeSlot; });
+	factory.registerFunction("timeSlots", 			F { return new FunctionTimeSlots; });
+
+	#undef F
+}
+
+}
diff --git a/dbms/src/Functions/FunctionsDictionaries.cpp b/dbms/src/Functions/FunctionsDictionaries.cpp
new file mode 100644
index 00000000000..02c3c845fbf
--- /dev/null
+++ b/dbms/src/Functions/FunctionsDictionaries.cpp
@@ -0,0 +1,49 @@
+#include <DB/Functions/FunctionFactory.h>
+#include <DB/Functions/FunctionsDictionaries.h>
+
+namespace DB
+{
+
+void registerFunctionsDictionaries(FunctionFactory & factory)
+{
+	#define F [](const Context & context) -> IFunction*
+
+	factory.registerFunction("regionToCity",
+		F { return new FunctionRegionToCity(context.getDictionaries().getRegionsHierarchies()); });
+	factory.registerFunction("regionToArea",
+		F { return new FunctionRegionToArea(context.getDictionaries().getRegionsHierarchies()); });
+	factory.registerFunction("regionToCountry",
+		F { return new FunctionRegionToCountry(context.getDictionaries().getRegionsHierarchies()); });
+	factory.registerFunction("regionToContinent",
+		F { return new FunctionRegionToContinent(context.getDictionaries().getRegionsHierarchies()); });
+	factory.registerFunction("OSToRoot",
+		F { return new FunctionOSToRoot(context.getDictionaries().getTechDataHierarchy()); });
+	factory.registerFunction("SEToRoot",
+		F { return new FunctionSEToRoot(context.getDictionaries().getTechDataHierarchy()); });
+	factory.registerFunction("categoryToRoot",
+		F { return new FunctionCategoryToRoot(context.getDictionaries().getCategoriesHierarchy()); });
+	factory.registerFunction("categoryToSecondLevel",
+		F { return new FunctionCategoryToSecondLevel(context.getDictionaries().getCategoriesHierarchy()); });
+	factory.registerFunction("regionIn",
+		F { return new FunctionRegionIn(context.getDictionaries().getRegionsHierarchies()); });
+	factory.registerFunction("OSIn",
+		F { return new FunctionOSIn(context.getDictionaries().getTechDataHierarchy()); });
+	factory.registerFunction("SEIn",
+		F { return new FunctionSEIn(context.getDictionaries().getTechDataHierarchy()); });
+	factory.registerFunction("categoryIn",
+		F { return new FunctionCategoryIn(context.getDictionaries().getCategoriesHierarchy()); });
+	factory.registerFunction("regionHierarchy",
+		F { return new FunctionRegionHierarchy(context.getDictionaries().getRegionsHierarchies()); });
+	factory.registerFunction("OSHierarchy",
+		F { return new FunctionOSHierarchy(context.getDictionaries().getTechDataHierarchy()); });
+	factory.registerFunction("SEHierarchy",
+		F { return new FunctionSEHierarchy(context.getDictionaries().getTechDataHierarchy()); });
+	factory.registerFunction("categoryHierarchy",
+		F { return new FunctionCategoryHierarchy(context.getDictionaries().getCategoriesHierarchy()); });
+	factory.registerFunction("regionToName",
+		F { return new FunctionRegionToName(context.getDictionaries().getRegionsNames()); });
+
+	#undef F
+}
+
+}
diff --git a/dbms/src/Functions/FunctionsFormatting.cpp b/dbms/src/Functions/FunctionsFormatting.cpp
new file mode 100644
index 00000000000..e31ca22ca6c
--- /dev/null
+++ b/dbms/src/Functions/FunctionsFormatting.cpp
@@ -0,0 +1,16 @@
+#include <DB/Functions/FunctionFactory.h>
+#include <DB/Functions/FunctionsFormatting.h>
+
+namespace DB
+{
+
+void registerFunctionsFormatting(FunctionFactory & factory)
+{
+	#define F [](const Context & context) -> IFunction*
+
+	factory.registerFunction("bitmaskToList", 	F { return new FunctionBitmaskToList; });
+
+	#undef F
+}
+
+}
diff --git a/dbms/src/Functions/FunctionsHashing.cpp b/dbms/src/Functions/FunctionsHashing.cpp
new file mode 100644
index 00000000000..e2aa12dabf3
--- /dev/null
+++ b/dbms/src/Functions/FunctionsHashing.cpp
@@ -0,0 +1,21 @@
+#include <DB/Functions/FunctionFactory.h>
+#include <DB/Functions/FunctionsHashing.h>
+
+
+namespace DB
+{
+
+void registerFunctionsHashing(FunctionFactory & factory)
+{
+	#define F [](const Context & context) -> IFunction*
+
+	factory.registerFunction("halfMD5", 	F { return new FunctionHalfMD5; });
+	factory.registerFunction("sipHash64", 	F { return new FunctionSipHash64; });
+	factory.registerFunction("cityHash64", 	F { return new FunctionCityHash64; });
+	factory.registerFunction("intHash32", 	F { return new FunctionIntHash32; });
+	factory.registerFunction("intHash64", 	F { return new FunctionIntHash64; });
+
+	#undef F
+}
+
+}
diff --git a/dbms/src/Functions/FunctionsHigherOrder.cpp b/dbms/src/Functions/FunctionsHigherOrder.cpp
new file mode 100644
index 00000000000..90434a870ef
--- /dev/null
+++ b/dbms/src/Functions/FunctionsHigherOrder.cpp
@@ -0,0 +1,21 @@
+#include <DB/Functions/FunctionFactory.h>
+#include <DB/Functions/FunctionsHigherOrder.h>
+
+namespace DB
+{
+
+void registerFunctionsHigherOrder(FunctionFactory & factory)
+{
+	#define F [](const Context & context) -> IFunction*
+
+	factory.registerFunction("arrayMap", 		F { return new FunctionArrayMap; });
+	factory.registerFunction("arrayFilter", 	F { return new FunctionArrayFilter; });
+	factory.registerFunction("arrayCount", 		F { return new FunctionArrayCount; });
+	factory.registerFunction("arrayExists", 	F { return new FunctionArrayExists; });
+	factory.registerFunction("arrayAll", 		F { return new FunctionArrayAll; });
+	factory.registerFunction("arraySum", 		F { return new FunctionArraySum; });
+
+	#undef F
+}
+
+}
diff --git a/dbms/src/Functions/FunctionsLogical.cpp b/dbms/src/Functions/FunctionsLogical.cpp
new file mode 100644
index 00000000000..faf18dafcd1
--- /dev/null
+++ b/dbms/src/Functions/FunctionsLogical.cpp
@@ -0,0 +1,19 @@
+#include <DB/Functions/FunctionFactory.h>
+#include <DB/Functions/FunctionsLogical.h>
+
+namespace DB
+{
+
+void registerFunctionsLogical(FunctionFactory & factory)
+{
+	#define F [](const Context & context) -> IFunction*
+
+	factory.registerFunction("and", F { return new FunctionAnd; });
+	factory.registerFunction("or", 	F { return new FunctionOr; });
+	factory.registerFunction("xor", F { return new FunctionXor; });
+	factory.registerFunction("not", F { return new FunctionNot; });
+
+	#undef F
+}
+
+}
diff --git a/dbms/src/Functions/FunctionsMiscellaneous.cpp b/dbms/src/Functions/FunctionsMiscellaneous.cpp
index db77bed353e..609c399fab8 100644
--- a/dbms/src/Functions/FunctionsMiscellaneous.cpp
+++ b/dbms/src/Functions/FunctionsMiscellaneous.cpp
@@ -1,5 +1,6 @@
 #include <math.h>
 
+#include <DB/Functions/FunctionFactory.h>
 #include <DB/Functions/FunctionsArithmetic.h>
 #include <DB/Functions/FunctionsMiscellaneous.h>
 
@@ -226,7 +227,7 @@ void FunctionVisibleWidth::execute(Block & block, const ColumnNumbers & argument
 	}
 	else if (const ColumnTuple * col = typeid_cast<const ColumnTuple *>(&*column))
 	{
-		/// Посчитаем видимую ширину для каждого вложенного столбца по-отдельности, и просуммируем.
+		/// Посчитаем видимую ширину для каждого вложенного столбца по отдельности, и просуммируем.
 		Block nested_block = col->getData();
 		size_t columns = nested_block.columns();
 
@@ -297,3 +298,33 @@ void FunctionVisibleWidth::execute(Block & block, const ColumnNumbers & argument
 }
 
 }
+
+
+namespace DB
+{
+
+void registerFunctionsMiscellaneous(FunctionFactory & factory)
+{
+	#define F [](const Context & context) -> IFunction*
+
+	factory.registerFunction("hostName", 		F { return new FunctionHostName; });
+	factory.registerFunction("visibleWidth", 	F { return new FunctionVisibleWidth; });
+	factory.registerFunction("toTypeName", 		F { return new FunctionToTypeName; });
+	factory.registerFunction("blockSize", 		F { return new FunctionBlockSize; });
+	factory.registerFunction("sleep", 			F { return new FunctionSleep; });
+	factory.registerFunction("materialize", 	F { return new FunctionMaterialize; });
+	factory.registerFunction("ignore", 			F { return new FunctionIgnore; });
+	factory.registerFunction("arrayJoin", 		F { return new FunctionArrayJoin; });
+	factory.registerFunction("bar", 			F { return new FunctionBar; });
+
+	factory.registerFunction("tuple", 			F { return new FunctionTuple; });
+	factory.registerFunction("tupleElement", 	F { return new FunctionTupleElement; });
+	factory.registerFunction("in", 				F { return new FunctionIn(false, false); });
+	factory.registerFunction("notIn", 			F { return new FunctionIn(true, false); });
+	factory.registerFunction("globalIn", 		F { return new FunctionIn(false, true); });
+	factory.registerFunction("globalNotIn", 	F { return new FunctionIn(true, true); });
+
+	#undef F
+}
+
+}
diff --git a/dbms/src/Functions/FunctionsRandom.cpp b/dbms/src/Functions/FunctionsRandom.cpp
new file mode 100644
index 00000000000..9bd473003b8
--- /dev/null
+++ b/dbms/src/Functions/FunctionsRandom.cpp
@@ -0,0 +1,17 @@
+#include <DB/Functions/FunctionFactory.h>
+#include <DB/Functions/FunctionsRandom.h>
+
+namespace DB
+{
+
+void registerFunctionsRandom(FunctionFactory & factory)
+{
+	#define F [](const Context & context) -> IFunction*
+
+	factory.registerFunction("rand", 	F { return new FunctionRand; });
+	factory.registerFunction("rand64", 	F { return new FunctionRand64; });
+
+	#undef F
+}
+
+}
diff --git a/dbms/src/Functions/FunctionsReinterpret.cpp b/dbms/src/Functions/FunctionsReinterpret.cpp
new file mode 100644
index 00000000000..36866c57a3b
--- /dev/null
+++ b/dbms/src/Functions/FunctionsReinterpret.cpp
@@ -0,0 +1,28 @@
+#include <DB/Functions/FunctionFactory.h>
+#include <DB/Functions/FunctionsReinterpret.h>
+
+namespace DB
+{
+
+void registerFunctionsReinterpret(FunctionFactory & factory)
+{
+	#define F [](const Context & context) -> IFunction*
+
+	factory.registerFunction("reinterpretAsUInt8",		F { return new FunctionReinterpretAsUInt8; });
+	factory.registerFunction("reinterpretAsUInt16", 	F { return new FunctionReinterpretAsUInt16; });
+	factory.registerFunction("reinterpretAsUInt32", 	F { return new FunctionReinterpretAsUInt32; });
+	factory.registerFunction("reinterpretAsUInt64", 	F { return new FunctionReinterpretAsUInt64; });
+	factory.registerFunction("reinterpretAsInt8", 		F { return new FunctionReinterpretAsInt8; });
+	factory.registerFunction("reinterpretAsInt16", 		F { return new FunctionReinterpretAsInt16; });
+	factory.registerFunction("reinterpretAsInt32", 		F { return new FunctionReinterpretAsInt32; });
+	factory.registerFunction("reinterpretAsInt64", 		F { return new FunctionReinterpretAsInt64; });
+	factory.registerFunction("reinterpretAsFloat32", 	F { return new FunctionReinterpretAsFloat32; });
+	factory.registerFunction("reinterpretAsFloat64", 	F { return new FunctionReinterpretAsFloat64; });
+	factory.registerFunction("reinterpretAsDate", 		F { return new FunctionReinterpretAsDate; });
+	factory.registerFunction("reinterpretAsDateTime", 	F { return new FunctionReinterpretAsDateTime; });
+	factory.registerFunction("reinterpretAsString", 	F { return new FunctionReinterpretAsString; });
+
+	#undef F
+}
+
+}
diff --git a/dbms/src/Functions/FunctionsRound.cpp b/dbms/src/Functions/FunctionsRound.cpp
new file mode 100644
index 00000000000..06062b42fea
--- /dev/null
+++ b/dbms/src/Functions/FunctionsRound.cpp
@@ -0,0 +1,18 @@
+#include <DB/Functions/FunctionFactory.h>
+#include <DB/Functions/FunctionsRound.h>
+
+namespace DB
+{
+
+void registerFunctionsRound(FunctionFactory & factory)
+{
+	#define F [](const Context & context) -> IFunction*
+
+	factory.registerFunction("roundToExp2", 	F { return new FunctionRoundToExp2; });
+	factory.registerFunction("roundDuration", 	F { return new FunctionRoundDuration; });
+	factory.registerFunction("roundAge", 		F { return new FunctionRoundAge; });
+
+	#undef F
+}
+
+}
diff --git a/dbms/src/Functions/FunctionsString.cpp b/dbms/src/Functions/FunctionsString.cpp
new file mode 100644
index 00000000000..ac0c8273fee
--- /dev/null
+++ b/dbms/src/Functions/FunctionsString.cpp
@@ -0,0 +1,28 @@
+#include <DB/Functions/FunctionFactory.h>
+#include <DB/Functions/FunctionsString.h>
+
+namespace DB
+{
+
+void registerFunctionsString(FunctionFactory & factory)
+{
+	#define F [](const Context & context) -> IFunction*
+
+	factory.registerFunction("empty", 			F { return new FunctionEmpty; });
+	factory.registerFunction("notEmpty", 		F { return new FunctionNotEmpty; });
+	factory.registerFunction("length", 			F { return new FunctionLength; });
+	factory.registerFunction("lengthUTF8", 		F { return new FunctionLengthUTF8; });
+	factory.registerFunction("lower", 			F { return new FunctionLower; });
+	factory.registerFunction("upper", 			F { return new FunctionUpper; });
+	factory.registerFunction("lowerUTF8", 		F { return new FunctionLowerUTF8; });
+	factory.registerFunction("upperUTF8", 		F { return new FunctionUpperUTF8; });
+	factory.registerFunction("reverse", 		F { return new FunctionReverse; });
+	factory.registerFunction("reverseUTF8", 	F { return new FunctionReverseUTF8; });
+	factory.registerFunction("concat", 			F { return new FunctionConcat; });
+	factory.registerFunction("substring", 		F { return new FunctionSubstring; });
+	factory.registerFunction("substringUTF8", 	F { return new FunctionSubstringUTF8; });
+
+	#undef F
+}
+
+}
diff --git a/dbms/src/Functions/FunctionsStringArray.cpp b/dbms/src/Functions/FunctionsStringArray.cpp
new file mode 100644
index 00000000000..56edd6573b3
--- /dev/null
+++ b/dbms/src/Functions/FunctionsStringArray.cpp
@@ -0,0 +1,19 @@
+#include <DB/Functions/FunctionFactory.h>
+#include <DB/Functions/FunctionsStringArray.h>
+
+namespace DB
+{
+
+void registerFunctionsStringArray(FunctionFactory & factory)
+{
+	#define F [](const Context & context) -> IFunction*
+
+	factory.registerFunction("extractAll", 		F { return new FunctionExtractAll; });
+	factory.registerFunction("alphaTokens", 	F { return new FunctionAlphaTokens; });
+	factory.registerFunction("splitByChar", 	F { return new FunctionSplitByChar; });
+	factory.registerFunction("splitByString", 	F { return new FunctionSplitByString; });
+
+	#undef F
+}
+
+}
diff --git a/dbms/src/Functions/FunctionsStringSearch.cpp b/dbms/src/Functions/FunctionsStringSearch.cpp
new file mode 100644
index 00000000000..a5b7d5f0194
--- /dev/null
+++ b/dbms/src/Functions/FunctionsStringSearch.cpp
@@ -0,0 +1,25 @@
+#include <DB/Functions/FunctionFactory.h>
+#include <DB/Functions/FunctionsStringSearch.h>
+
+namespace DB
+{
+
+void registerFunctionsStringSearch(FunctionFactory & factory)
+{
+	#define F [](const Context & context) -> IFunction*
+
+	factory.registerFunction("replaceOne", 			F { return new FunctionReplaceOne; });
+	factory.registerFunction("replaceAll", 			F { return new FunctionReplaceAll; });
+	factory.registerFunction("replaceRegexpOne", 	F { return new FunctionReplaceRegexpOne; });
+	factory.registerFunction("replaceRegexpAll", 	F { return new FunctionReplaceRegexpAll; });
+	factory.registerFunction("position", 			F { return new FunctionPosition; });
+	factory.registerFunction("positionUTF8", 		F { return new FunctionPositionUTF8; });
+	factory.registerFunction("match", 				F { return new FunctionMatch; });
+	factory.registerFunction("like", 				F { return new FunctionLike; });
+	factory.registerFunction("notLike", 			F { return new FunctionNotLike; });
+	factory.registerFunction("extract", 			F { return new FunctionExtract; });
+
+	#undef F
+}
+
+}
diff --git a/dbms/src/Functions/FunctionsURL.cpp b/dbms/src/Functions/FunctionsURL.cpp
new file mode 100644
index 00000000000..4fcaaa2ee27
--- /dev/null
+++ b/dbms/src/Functions/FunctionsURL.cpp
@@ -0,0 +1,33 @@
+#include <DB/Functions/FunctionFactory.h>
+#include <DB/Functions/FunctionsURL.h>
+
+namespace DB
+{
+
+void registerFunctionsURL(FunctionFactory & factory)
+{
+	#define F [](const Context & context) -> IFunction*
+
+	factory.registerFunction("protocol", 					F { return new FunctionProtocol; });
+	factory.registerFunction("domain", 						F { return new FunctionDomain; });
+	factory.registerFunction("domainWithoutWWW", 			F { return new FunctionDomainWithoutWWW; });
+	factory.registerFunction("topLevelDomain", 				F { return new FunctionTopLevelDomain; });
+	factory.registerFunction("path", 						F { return new FunctionPath; });
+	factory.registerFunction("queryString", 				F { return new FunctionQueryString; });
+	factory.registerFunction("fragment", 					F { return new FunctionFragment; });
+	factory.registerFunction("queryStringAndFragment", 		F { return new FunctionQueryStringAndFragment; });
+	factory.registerFunction("extractURLParameter", 		F { return new FunctionExtractURLParameter; });
+	factory.registerFunction("extractURLParameters", 		F { return new FunctionExtractURLParameters; });
+	factory.registerFunction("extractURLParameterNames", 	F { return new FunctionExtractURLParameterNames; });
+	factory.registerFunction("URLHierarchy", 				F { return new FunctionURLHierarchy; });
+	factory.registerFunction("URLPathHierarchy", 			F { return new FunctionURLPathHierarchy; });
+	factory.registerFunction("cutWWW", 						F { return new FunctionCutWWW; });
+	factory.registerFunction("cutQueryString", 				F { return new FunctionCutQueryString; });
+	factory.registerFunction("cutFragment", 				F { return new FunctionCutFragment; });
+	factory.registerFunction("cutQueryStringAndFragment", 	F { return new FunctionCutQueryStringAndFragment; });
+	factory.registerFunction("cutURLParameter", 			F { return new FunctionCutURLParameter; });
+
+	#undef F
+}
+
+}
diff --git a/dbms/src/Functions/FunctionsVisitParam.cpp b/dbms/src/Functions/FunctionsVisitParam.cpp
new file mode 100644
index 00000000000..d2d7c281204
--- /dev/null
+++ b/dbms/src/Functions/FunctionsVisitParam.cpp
@@ -0,0 +1,22 @@
+#include <DB/Functions/FunctionFactory.h>
+#include <DB/Functions/FunctionsVisitParam.h>
+
+namespace DB
+{
+
+void registerFunctionsVisitParam(FunctionFactory & factory)
+{
+	#define F [](const Context & context) -> IFunction*
+
+	factory.registerFunction("visitParamHas", 				F { return new FunctionVisitParamHas; });
+	factory.registerFunction("visitParamExtractUInt", 		F { return new FunctionVisitParamExtractUInt; });
+	factory.registerFunction("visitParamExtractInt", 		F { return new FunctionVisitParamExtractInt; });
+	factory.registerFunction("visitParamExtractFloat", 		F { return new FunctionVisitParamExtractFloat; });
+	factory.registerFunction("visitParamExtractBool", 		F { return new FunctionVisitParamExtractBool; });
+	factory.registerFunction("visitParamExtractRaw", 		F { return new FunctionVisitParamExtractRaw; });
+	factory.registerFunction("visitParamExtractString", 	F { return new FunctionVisitParamExtractString; });
+
+	#undef F
+}
+
+}
diff --git a/dbms/src/Interpreters/Aggregator.cpp b/dbms/src/Interpreters/Aggregator.cpp
index 416e59d2562..43e56a77f2a 100644
--- a/dbms/src/Interpreters/Aggregator.cpp
+++ b/dbms/src/Interpreters/Aggregator.cpp
@@ -206,7 +206,7 @@ void Aggregator::executeImpl(
 		if (overflow && !overflow_row)
 			continue;
 
-		/// Если вставили новый ключ - инициализируем состояния агрегатных функций, и возможно, что-нибудь связанное с ключём.
+		/// Если вставили новый ключ - инициализируем состояния агрегатных функций, и возможно, что-нибудь связанное с ключом.
 		if (inserted)
 		{
 			method.onNewKey(it, keys_size, i, keys, *aggregates_pool);
diff --git a/dbms/src/Interpreters/Cluster.cpp b/dbms/src/Interpreters/Cluster.cpp
index 334cb07c19c..7c7e04ae7f3 100644
--- a/dbms/src/Interpreters/Cluster.cpp
+++ b/dbms/src/Interpreters/Cluster.cpp
@@ -1,4 +1,5 @@
 #include <DB/Interpreters/Cluster.h>
+#include <DB/Common/escapeForFileName.h>
 #include <Poco/Util/AbstractConfiguration.h>
 #include <Poco/Util/Application.h>
 #include <Poco/Net/NetworkInterface.h>
@@ -7,17 +8,20 @@
 namespace DB
 {
 
+
 Cluster::Address::Address(const String & config_prefix)
 {
-	Poco::Util::AbstractConfiguration & config = Poco::Util::Application::instance().config();
-	host_port = Poco::Net::SocketAddress(config.getString(config_prefix + ".host"),
-		config.getInt(config_prefix + ".port"));
+	auto & config = Poco::Util::Application::instance().config();
+
+	host_port = Poco::Net::SocketAddress(
+		config.getString(config_prefix + ".host"),
+		config.getInt(config_prefix + ".port")
+	);
 
 	user = config.getString(config_prefix + ".user", "default");
 	password = config.getString(config_prefix + ".password", "");
 }
 
-
 Cluster::Address::Address(const String & host_port_, const String & user_, const String & password_)
 	: user(user_), password(password_)
 {
@@ -30,6 +34,18 @@ Cluster::Address::Address(const String & host_port_, const String & user_, const
 		host_port = Poco::Net::SocketAddress(host_port_, default_port);
 }
 
+namespace
+{
+	inline std::string addressToDirName(const Cluster::Address & address)
+	{
+		return
+			escapeForFileName(address.user) +
+			(address.password.empty() ? "" : (':' + escapeForFileName(address.password))) + '@' +
+			escapeForFileName(address.host_port.host().toString()) + ':' +
+			std::to_string(address.host_port.port());
+	}
+}
+
 
 Clusters::Clusters(const Settings & settings, const DataTypeFactory & data_type_factory, const String & config_name)
 {
@@ -51,29 +67,83 @@ Cluster::Cluster(const Settings & settings, const DataTypeFactory & data_type_fa
 	Poco::Util::AbstractConfiguration::Keys config_keys;
 	config.keys(cluster_name, config_keys);
 
-	String config_prefix = cluster_name + ".";
+	const auto & config_prefix = cluster_name + ".";
 
-	for (Poco::Util::AbstractConfiguration::Keys::const_iterator it = config_keys.begin(); it != config_keys.end(); ++it)
+	for (auto it = config_keys.begin(); it != config_keys.end(); ++it)
 	{
 		if (0 == strncmp(it->c_str(), "node", strlen("node")))
 		{
-			addresses.push_back(Address(config_prefix + *it));
+			const auto & prefix = config_prefix + *it;
+			const auto weight = config.getInt(prefix + ".weight", 1);
+			if (weight == 0)
+				continue;
+
+			addresses.emplace_back(prefix);
+
+			slot_to_shard.insert(std::end(slot_to_shard), weight, shard_info_vec.size());
+			if (const auto is_local = isLocal(addresses.back()))
+				shard_info_vec.push_back({{}, weight, is_local });
+			else
+				shard_info_vec.push_back({{addressToDirName(addresses.back())}, weight, is_local});
 		}
 		else if (0 == strncmp(it->c_str(), "shard", strlen("shard")))
 		{
 			Poco::Util::AbstractConfiguration::Keys replica_keys;
 			config.keys(config_prefix + *it, replica_keys);
 
-			addresses_with_failover.push_back(Addresses());
+			addresses_with_failover.emplace_back();
 			Addresses & replica_addresses = addresses_with_failover.back();
 
-			for (Poco::Util::AbstractConfiguration::Keys::const_iterator jt = replica_keys.begin(); jt != replica_keys.end(); ++jt)
+			const auto & partial_prefix = config_prefix + *it + ".";
+			const auto weight = config.getInt(partial_prefix + ".weight", 1);
+			if (weight == 0)
+				continue;
+
+			const auto internal_replication = config.getBool(partial_prefix + ".internal_replication", false);
+
+			/** in case of internal_replication we will be appending names to
+			 *  the first element of vector; otherwise we will just .emplace_back
+			 */
+			std::vector<std::string> dir_names{};
+			size_t num_local_nodes = 0;
+
+			auto first = true;
+			for (auto jt = replica_keys.begin(); jt != replica_keys.end(); ++jt)
 			{
+				if (0 == strncmp(jt->data(), "weight", strlen("weight")) ||
+					0 == strncmp(jt->data(), "internal_replication", strlen("internal_replication")))
+					continue;
+
 				if (0 == strncmp(jt->c_str(), "replica", strlen("replica")))
-					replica_addresses.push_back(Address(config_prefix + *it + "." + *jt));
+				{
+					replica_addresses.emplace_back(partial_prefix + *jt);
+
+					if (isLocal(replica_addresses.back()))
+					{
+						++num_local_nodes;
+					}
+					else
+					{
+						if (internal_replication)
+						{
+							auto dir_name = addressToDirName(replica_addresses.back());
+							if (first)
+								dir_names.emplace_back(std::move(dir_name));
+							else
+								dir_names.front() += "," + dir_name;
+						}
+						else
+							dir_names.emplace_back(addressToDirName(replica_addresses.back()));
+
+						if (first) first = false;
+					}
+				}
 				else
 					throw Exception("Unknown element in config: " + *jt, ErrorCodes::UNKNOWN_ELEMENT_IN_CONFIG);
 			}
+
+			slot_to_shard.insert(std::end(slot_to_shard), weight, shard_info_vec.size());
+			shard_info_vec.push_back({std::move(dir_names), weight, num_local_nodes});
 		}
 		else
 			throw Exception("Unknown element in config: " + *it, ErrorCodes::UNKNOWN_ELEMENT_IN_CONFIG);
@@ -99,7 +169,7 @@ Cluster::Cluster(const Settings & settings, const DataTypeFactory & data_type_fa
 					}
 					else
 					{
-						replicas.push_back(new ConnectionPool(
+						replicas.emplace_back(new ConnectionPool(
 							settings.distributed_connections_pool_size,
 							jt->host_port.host().toString(), jt->host_port.port(), "", jt->user, jt->password, data_type_factory, "server", Protocol::Compression::Enable,
 							saturate(settings.connect_timeout_with_failover_ms, settings.limits.max_execution_time),
@@ -111,7 +181,7 @@ Cluster::Cluster(const Settings & settings, const DataTypeFactory & data_type_fa
 				if (has_local_replics)
 					++local_nodes_num;
 				else
-					pools.push_back(new ConnectionPoolWithFailover(replicas, settings.load_balancing, settings.connections_with_failover_max_tries));
+					pools.emplace_back(new ConnectionPoolWithFailover(replicas, settings.load_balancing, settings.connections_with_failover_max_tries));
 			}
 		}
 		else if (addresses.size())
@@ -124,7 +194,7 @@ Cluster::Cluster(const Settings & settings, const DataTypeFactory & data_type_fa
 				}
 				else
 				{
-					pools.push_back(new ConnectionPool(
+					pools.emplace_back(new ConnectionPool(
 						settings.distributed_connections_pool_size,
 						it->host_port.host().toString(), it->host_port.port(), "", it->user, it->password, data_type_factory, "server", Protocol::Compression::Enable,
 						saturate(settings.connect_timeout, settings.limits.max_execution_time),
@@ -145,8 +215,8 @@ Cluster::Cluster(const Settings & settings, const DataTypeFactory & data_type_fa
 	{
 		Addresses current;
 		for (size_t j = 0; j < names[i].size(); ++j)
-			current.push_back(Address(names[i][j], username, password));
-		addresses_with_failover.push_back(current);
+			current.emplace_back(names[i][j], username, password);
+		addresses_with_failover.emplace_back(current);
 	}
 
 	for (AddressesWithFailover::const_iterator it = addresses_with_failover.begin(); it != addresses_with_failover.end(); ++it)
@@ -156,14 +226,14 @@ Cluster::Cluster(const Settings & settings, const DataTypeFactory & data_type_fa
 
 		for (Addresses::const_iterator jt = it->begin(); jt != it->end(); ++jt)
 		{
-			replicas.push_back(new ConnectionPool(
+			replicas.emplace_back(new ConnectionPool(
 				settings.distributed_connections_pool_size,
 				jt->host_port.host().toString(), jt->host_port.port(), "", jt->user, jt->password, data_type_factory, "server", Protocol::Compression::Enable,
 				saturate(settings.connect_timeout_with_failover_ms, settings.limits.max_execution_time),
 				saturate(settings.receive_timeout, settings.limits.max_execution_time),
 				saturate(settings.send_timeout, settings.limits.max_execution_time)));
 		}
-		pools.push_back(new ConnectionPoolWithFailover(replicas, settings.load_balancing, settings.connections_with_failover_max_tries));
+		pools.emplace_back(new ConnectionPoolWithFailover(replicas, settings.load_balancing, settings.connections_with_failover_max_tries));
 	}
 }
 
@@ -183,8 +253,8 @@ bool Cluster::isLocal(const Address & address)
 	/// - её порт совпадает с портом, который слушает сервер;
 	/// - её хост резолвится в набор адресов, один из которых совпадает с одним из адресов сетевых интерфейсов сервера
 	/// то нужно всегда ходить на этот шард без межпроцессного взаимодействия
-	UInt16 clickhouse_port = Poco::Util::Application::instance().config().getInt("tcp_port", 0);
-	static Poco::Net::NetworkInterface::NetworkInterfaceList interfaces = Poco::Net::NetworkInterface::list();
+	const UInt16 clickhouse_port = Poco::Util::Application::instance().config().getInt("tcp_port", 0);
+	static auto interfaces = Poco::Net::NetworkInterface::list();
 
 	if (clickhouse_port == address.host_port.port() &&
 		interfaces.end() != std::find_if(interfaces.begin(), interfaces.end(),
diff --git a/dbms/src/Interpreters/Context.cpp b/dbms/src/Interpreters/Context.cpp
index e35f923b089..68fde92f8ab 100644
--- a/dbms/src/Interpreters/Context.cpp
+++ b/dbms/src/Interpreters/Context.cpp
@@ -10,6 +10,7 @@
 #include <DB/Interpreters/Context.h>
 #include <DB/Client/ConnectionPoolWithFailover.h>
 
+
 namespace DB
 {
 
@@ -448,15 +449,15 @@ void Context::setDefaultFormat(const String & name)
 	default_format = name;
 }
 
-String Context::getDefaultReplicaName() const
+const Macros& Context::getMacros() const
 {
-	return shared->default_replica_name;
+	return shared->macros;
 }
 
-void Context::setDefaultReplicaName(const String & name)
+void Context::setMacros(Macros && macros)
 {
 	/// Полагаемся, что это присваивание происходит один раз при старте сервера. Если это не так, нужно использовать мьютекс.
-	shared->default_replica_name = name;
+	shared->macros = macros;
 }
 
 
diff --git a/dbms/src/Interpreters/ExpressionActions.cpp b/dbms/src/Interpreters/ExpressionActions.cpp
index ad09f269290..e218c7dff30 100644
--- a/dbms/src/Interpreters/ExpressionActions.cpp
+++ b/dbms/src/Interpreters/ExpressionActions.cpp
@@ -85,86 +85,124 @@ void ExpressionAction::prepare(Block & sample_block)
 {
 //	std::cerr << "preparing: " << toString() << std::endl;
 
-	if (type == APPLY_FUNCTION)
+	switch (type)
 	{
-		if (sample_block.has(result_name))
-			throw Exception("Column '" + result_name + "' already exists", ErrorCodes::DUPLICATE_COLUMN);
-
-		bool all_const = true;
-
-		ColumnNumbers arguments(argument_names.size());
-		for (size_t i = 0; i < argument_names.size(); ++i)
+		case APPLY_FUNCTION:
 		{
-			arguments[i] = sample_block.getPositionByName(argument_names[i]);
-			ColumnPtr col = sample_block.getByPosition(arguments[i]).column;
-			if (!col || !col->isConst())
-				all_const = false;
-		}
+			if (sample_block.has(result_name))
+				throw Exception("Column '" + result_name + "' already exists", ErrorCodes::DUPLICATE_COLUMN);
 
-		ColumnNumbers prerequisites(prerequisite_names.size());
-		for (size_t i = 0; i < prerequisite_names.size(); ++i)
-		{
-			prerequisites[i] = sample_block.getPositionByName(prerequisite_names[i]);
-			ColumnPtr col = sample_block.getByPosition(prerequisites[i]).column;
-			if (!col || !col->isConst())
-				all_const = false;
-		}
+			bool all_const = true;
 
-		ColumnPtr new_column;
-
-		/// Если все аргументы и требуемые столбцы - константы, выполним функцию.
-		if (all_const)
-		{
-			ColumnWithNameAndType new_column;
-			new_column.name = result_name;
-			new_column.type = result_type;
-			sample_block.insert(new_column);
-
-			size_t result_position = sample_block.getPositionByName(result_name);
-			function->execute(sample_block, arguments, prerequisites, result_position);
-
-			/// Если получилась не константа, на всякий случай будем считать результат неизвестным.
-			ColumnWithNameAndType & col = sample_block.getByPosition(result_position);
-			if (!col.column->isConst())
+			ColumnNumbers arguments(argument_names.size());
+			for (size_t i = 0; i < argument_names.size(); ++i)
 			{
-				col.column = nullptr;
+				arguments[i] = sample_block.getPositionByName(argument_names[i]);
+				ColumnPtr col = sample_block.getByPosition(arguments[i]).column;
+				if (!col || !col->isConst())
+					all_const = false;
 			}
-		}
-		else
-		{
-			sample_block.insert(ColumnWithNameAndType(nullptr, result_type, result_name));
-		}
-	}
-	else if (type == ARRAY_JOIN)
-	{
-		for (NameSet::iterator it = array_joined_columns.begin(); it != array_joined_columns.end(); ++it)
-		{
-			ColumnWithNameAndType & current = sample_block.getByName(*it);
-			const DataTypeArray * array_type = typeid_cast<const DataTypeArray *>(&*current.type);
-			if (!array_type)
-				throw Exception("ARRAY JOIN requires array argument", ErrorCodes::TYPE_MISMATCH);
-			current.type = array_type->getNestedType();
-			current.column = nullptr;
-		}
-	}
-	else if (type == JOIN)
-	{
-		for (const auto & col : columns_added_by_join)
-			sample_block.insert(ColumnWithNameAndType(col.type->createColumn(), col.type, col.name));
-	}
-	else if (type == ADD_COLUMN)
-	{
-		if (sample_block.has(result_name))
-			throw Exception("Column '" + result_name + "' already exists", ErrorCodes::DUPLICATE_COLUMN);
 
-		sample_block.insert(ColumnWithNameAndType(added_column, result_type, result_name));
-	}
-	else
-	{
-		if (type == COPY_COLUMN)
+			ColumnNumbers prerequisites(prerequisite_names.size());
+			for (size_t i = 0; i < prerequisite_names.size(); ++i)
+			{
+				prerequisites[i] = sample_block.getPositionByName(prerequisite_names[i]);
+				ColumnPtr col = sample_block.getByPosition(prerequisites[i]).column;
+				if (!col || !col->isConst())
+					all_const = false;
+			}
+
+			ColumnPtr new_column;
+
+			/// Если все аргументы и требуемые столбцы - константы, выполним функцию.
+			if (all_const)
+			{
+				ColumnWithNameAndType new_column;
+				new_column.name = result_name;
+				new_column.type = result_type;
+				sample_block.insert(new_column);
+
+				size_t result_position = sample_block.getPositionByName(result_name);
+				function->execute(sample_block, arguments, prerequisites, result_position);
+
+				/// Если получилась не константа, на всякий случай будем считать результат неизвестным.
+				ColumnWithNameAndType & col = sample_block.getByPosition(result_position);
+				if (!col.column->isConst())
+					col.column = nullptr;
+			}
+			else
+			{
+				sample_block.insert(ColumnWithNameAndType(nullptr, result_type, result_name));
+			}
+
+			break;
+		}
+
+		case ARRAY_JOIN:
+		{
+			for (NameSet::iterator it = array_joined_columns.begin(); it != array_joined_columns.end(); ++it)
+			{
+				ColumnWithNameAndType & current = sample_block.getByName(*it);
+				const DataTypeArray * array_type = typeid_cast<const DataTypeArray *>(&*current.type);
+				if (!array_type)
+					throw Exception("ARRAY JOIN requires array argument", ErrorCodes::TYPE_MISMATCH);
+				current.type = array_type->getNestedType();
+				current.column = nullptr;
+			}
+
+			break;
+		}
+
+		case JOIN:
+		{
+			for (const auto & col : columns_added_by_join)
+				sample_block.insert(ColumnWithNameAndType(col.type->createColumn(), col.type, col.name));
+
+			break;
+		}
+
+		case PROJECT:
+		{
+			Block new_block;
+
+			for (size_t i = 0; i < projection.size(); ++i)
+			{
+				const std::string & name = projection[i].first;
+				const std::string & alias = projection[i].second;
+				ColumnWithNameAndType column = sample_block.getByName(name);
+				if (alias != "")
+					column.name = alias;
+				new_block.insert(column);
+			}
+
+			sample_block.swap(new_block);
+			break;
+		}
+
+		case REMOVE_COLUMN:
+		{
+			sample_block.erase(source_name);
+			break;
+		}
+
+		case ADD_COLUMN:
+		{
+			if (sample_block.has(result_name))
+				throw Exception("Column '" + result_name + "' already exists", ErrorCodes::DUPLICATE_COLUMN);
+
+			sample_block.insert(ColumnWithNameAndType(added_column, result_type, result_name));
+			break;
+		}
+
+		case COPY_COLUMN:
+		{
 			result_type = sample_block.getByName(source_name).type;
+			sample_block.insert(ColumnWithNameAndType(sample_block.getByName(source_name).column, result_type, result_name));
+			break;
+		}
 
-		execute(sample_block);
+		default:
+			throw Exception("Unknown action type", ErrorCodes::UNKNOWN_ACTION);
 	}
 }
 
@@ -366,24 +404,27 @@ void ExpressionActions::checkLimits(Block & block) const
 	const Limits & limits = settings.limits;
 	if (limits.max_temporary_columns && block.columns() > limits.max_temporary_columns)
 		throw Exception("Too many temporary columns: " + block.dumpNames()
-		+ ". Maximum: " + toString(limits.max_temporary_columns),
-						ErrorCodes::TOO_MUCH_TEMPORARY_COLUMNS);
+			+ ". Maximum: " + toString(limits.max_temporary_columns),
+			ErrorCodes::TOO_MUCH_TEMPORARY_COLUMNS);
 
-	size_t non_const_columns = 0;
-	for (size_t i = 0, size = block.columns(); i < size; ++i)
-		if (block.getByPosition(i).column && !block.getByPosition(i).column->isConst())
-			++non_const_columns;
-
-	if (limits.max_temporary_non_const_columns && non_const_columns > limits.max_temporary_non_const_columns)
+	if (limits.max_temporary_non_const_columns)
 	{
-		std::stringstream list_of_non_const_columns;
+		size_t non_const_columns = 0;
 		for (size_t i = 0, size = block.columns(); i < size; ++i)
-			if (!block.getByPosition(i).column->isConst())
-				list_of_non_const_columns << (i == 0 ? "" : ", ") << block.getByPosition(i).name;
+			if (block.getByPosition(i).column && !block.getByPosition(i).column->isConst())
+				++non_const_columns;
 
-			throw Exception("Too many temporary non-const columns: " + list_of_non_const_columns.str()
-			+ ". Maximum: " + toString(limits.max_temporary_non_const_columns),
-							ErrorCodes::TOO_MUCH_TEMPORARY_NON_CONST_COLUMNS);
+		if (non_const_columns > limits.max_temporary_non_const_columns)
+		{
+			std::stringstream list_of_non_const_columns;
+			for (size_t i = 0, size = block.columns(); i < size; ++i)
+				if (!block.getByPosition(i).column->isConst())
+					list_of_non_const_columns << (i == 0 ? "" : ", ") << block.getByPosition(i).name;
+
+				throw Exception("Too many temporary non-const columns: " + list_of_non_const_columns.str()
+					+ ". Maximum: " + toString(limits.max_temporary_non_const_columns),
+					ErrorCodes::TOO_MUCH_TEMPORARY_NON_CONST_COLUMNS);
+		}
 	}
 }
 
@@ -600,7 +641,6 @@ void ExpressionActions::finalize(const Names & output_columns)
 				}
 
 				unmodified_columns.erase(out);
-
 				needed_columns.erase(out);
 			}
 
@@ -639,6 +679,7 @@ void ExpressionActions::finalize(const Names & output_columns)
 	checkLimits(sample_block);
 }
 
+
 std::string ExpressionActions::getID() const
 {
 	std::stringstream ss;
diff --git a/dbms/src/Interpreters/ExpressionAnalyzer.cpp b/dbms/src/Interpreters/ExpressionAnalyzer.cpp
index 9aad597d3b0..264d76c8f00 100644
--- a/dbms/src/Interpreters/ExpressionAnalyzer.cpp
+++ b/dbms/src/Interpreters/ExpressionAnalyzer.cpp
@@ -40,7 +40,8 @@ namespace DB
 /** Calls to these functions in the GROUP BY statement would be
   * replaced by their immediate argument.
   */
-const std::unordered_set<String> injectiveFunctionNames{
+const std::unordered_set<String> injective_function_names
+{
 	"negate",
 	"bitNot",
 	"reverse",
@@ -68,7 +69,7 @@ void ExpressionAnalyzer::init()
 	/// Common subexpression elimination. Rewrite rules.
 	normalizeTree();
 
-	/// GROUP BY injective function elimination
+	/// GROUP BY injective function elimination.
 	optimizeGroupBy();
 
 	/// array_join_alias_to_name, array_join_result_to_source.
@@ -455,7 +456,8 @@ void ExpressionAnalyzer::optimizeGroupBy()
 	auto & group_exprs = select_query->group_expression_list->children;
 
 	/// removes expression at index idx by making it last one and calling .pop_back()
-	const auto remove_expr_at_index = [&group_exprs] (const size_t idx) {
+	const auto remove_expr_at_index = [&group_exprs] (const size_t idx)
+	{
 		if (idx < group_exprs.size() - 1)
 			group_exprs[idx] = std::move(group_exprs.back());
 
@@ -463,13 +465,16 @@ void ExpressionAnalyzer::optimizeGroupBy()
 	};
 
 	/// iterate over each GROUP BY expression, eliminate injective function calls and literals
-	for (size_t i = 0; i < group_exprs.size(); ++i)
+	for (size_t i = 0; i < group_exprs.size();)
 	{
 		if (const auto function = typeid_cast<ASTFunction*>(group_exprs[i].get()))
 		{
 			/// assert function is injective
-			if (!injectiveFunctionNames.count(function->name))
+			if (!injective_function_names.count(function->name))
+			{
+				++i;
 				continue;
+			}
 
 			/// copy shared pointer to args in order to ensure lifetime
 			auto args_ast = function->arguments;
@@ -478,7 +483,6 @@ void ExpressionAnalyzer::optimizeGroupBy()
 			  * next iteration does not skip not yet processed data
 			  */
 			remove_expr_at_index(i);
-			i -= 1;
 
 			/// copy non-literal arguments
 			std::remove_copy_if(
@@ -489,7 +493,11 @@ void ExpressionAnalyzer::optimizeGroupBy()
 		else if (is_literal(group_exprs[i]))
 		{
 			remove_expr_at_index(i);
-			i -= 1;
+		}
+		else
+		{
+			/// if neither a function nor literal - advance to next expression
+			++i;
 		}
 	}
 
@@ -1022,7 +1030,6 @@ void ExpressionAnalyzer::getActionsImpl(ASTPtr ast, bool no_subqueries, bool onl
 						ColumnWithNameAndType fake_column;
 						fake_column.name = node->getColumnName();
 						fake_column.type = new DataTypeUInt8;
-						fake_column.column = new ColumnConstUInt8(1, 0);
 						actions_stack.addAction(ExpressionAction::addColumn(fake_column));
 						getActionsImpl(node->arguments->children.at(0), no_subqueries, only_consts, actions_stack);
 					}
diff --git a/dbms/src/Interpreters/InterpreterAlterQuery.cpp b/dbms/src/Interpreters/InterpreterAlterQuery.cpp
index ce5b8ba3294..4135b01bb6e 100644
--- a/dbms/src/Interpreters/InterpreterAlterQuery.cpp
+++ b/dbms/src/Interpreters/InterpreterAlterQuery.cpp
@@ -33,24 +33,35 @@ void InterpreterAlterQuery::execute()
 	ASTAlterQuery & alter = typeid_cast<ASTAlterQuery &>(*query_ptr);
 	String & table_name = alter.table;
 	String database_name = alter.database.empty() ? context.getCurrentDatabase() : alter.database;
-	AlterCommands commands = parseAlter(alter.parameters, context.getDataTypeFactory());
+	AlterCommands alter_commands;
+	PartitionCommands partition_commands;
+	parseAlter(alter.parameters, context.getDataTypeFactory(), alter_commands, partition_commands);
 
 	StoragePtr table = context.getTable(database_name, table_name);
-	table->alter(commands, database_name, table_name, context);
+
+	for (const PartitionCommand & command : partition_commands)
+	{
+		if (command.type == PartitionCommand::DROP_PARTITION)
+			table->dropPartition(command.partition, command.detach);
+		else if (command.type == PartitionCommand::ATTACH_PARTITION)
+			table->attachPartition(command.partition, command.unreplicated, command.part);
+		else
+			throw Exception("Bad PartitionCommand::Type: " + toString(command.type), ErrorCodes::ARGUMENT_OUT_OF_BOUND);
+	}
+
+	if (!alter_commands.empty())
+		table->alter(alter_commands, database_name, table_name, context);
 }
 
-AlterCommands InterpreterAlterQuery::parseAlter(
-	const ASTAlterQuery::ParameterContainer & params_container, const DataTypeFactory & data_type_factory)
+void InterpreterAlterQuery::parseAlter(
+	const ASTAlterQuery::ParameterContainer & params_container, const DataTypeFactory & data_type_factory,
+	AlterCommands & out_alter_commands, PartitionCommands & out_partition_commands)
 {
-	AlterCommands res;
-
 	for (const auto & params : params_container)
 	{
-		res.push_back(AlterCommand());
-		AlterCommand & command = res.back();
-
-		if (params.type == ASTAlterQuery::ADD)
+		if (params.type == ASTAlterQuery::ADD_COLUMN)
 		{
+			AlterCommand command;
 			command.type = AlterCommand::ADD;
 
 			const ASTNameTypePair & ast_name_type = typeid_cast<const ASTNameTypePair &>(*params.name_type);
@@ -62,14 +73,20 @@ AlterCommands InterpreterAlterQuery::parseAlter(
 
 			if (params.column)
 				command.after_column = typeid_cast<const ASTIdentifier &>(*params.column).name;
+
+			out_alter_commands.push_back(command);
 		}
-		else if (params.type == ASTAlterQuery::DROP)
+		else if (params.type == ASTAlterQuery::DROP_COLUMN)
 		{
+			AlterCommand command;
 			command.type = AlterCommand::DROP;
 			command.column_name = typeid_cast<const ASTIdentifier &>(*(params.column)).name;
+
+			out_alter_commands.push_back(command);
 		}
-		else if (params.type == ASTAlterQuery::MODIFY)
+		else if (params.type == ASTAlterQuery::MODIFY_COLUMN)
 		{
+			AlterCommand command;
 			command.type = AlterCommand::MODIFY;
 
 			const ASTNameTypePair & ast_name_type = typeid_cast<const ASTNameTypePair &>(*params.name_type);
@@ -78,12 +95,22 @@ AlterCommands InterpreterAlterQuery::parseAlter(
 
 			command.column_name = ast_name_type.name;
 			command.data_type = data_type_factory.get(type_string);
+
+			out_alter_commands.push_back(command);
+		}
+		else if (params.type == ASTAlterQuery::DROP_PARTITION)
+		{
+			const Field & partition = dynamic_cast<const ASTLiteral &>(*params.partition).value;
+			out_partition_commands.push_back(PartitionCommand::dropPartition(partition, params.detach));
+		}
+		else if (params.type == ASTAlterQuery::ATTACH_PARTITION)
+		{
+			const Field & partition = dynamic_cast<const ASTLiteral &>(*params.partition).value;
+			out_partition_commands.push_back(PartitionCommand::attachPartition(partition, params.unreplicated, params.part));
 		}
 		else
 			throw Exception("Wrong parameter type in ALTER query", ErrorCodes::LOGICAL_ERROR);
 	}
-
-	return res;
 }
 
 void InterpreterAlterQuery::updateMetadata(
diff --git a/dbms/src/Interpreters/InterpreterCheckQuery.cpp b/dbms/src/Interpreters/InterpreterCheckQuery.cpp
new file mode 100644
index 00000000000..8bbe323c835
--- /dev/null
+++ b/dbms/src/Interpreters/InterpreterCheckQuery.cpp
@@ -0,0 +1,34 @@
+#include <DB/Interpreters/InterpreterCheckQuery.h>
+#include <DB/Parsers/ASTCheckQuery.h>
+#include <DB/DataStreams/OneBlockInputStream.h>
+#include <DB/Columns/ColumnsNumber.h>
+#include <DB/DataTypes/DataTypesNumberFixed.h>
+
+using namespace DB;
+
+InterpreterCheckQuery::InterpreterCheckQuery(DB::ASTPtr query_ptr_, DB::Context& context_) : query_ptr(query_ptr_), context(context_)
+{
+}
+
+BlockInputStreamPtr InterpreterCheckQuery::execute()
+{
+	/// @TODO
+	ASTCheckQuery & alter = typeid_cast<ASTCheckQuery &>(*query_ptr);
+	String & table_name = alter.table;
+	String database_name = alter.database.empty() ? context.getCurrentDatabase() : alter.database;
+
+	StoragePtr table = context.getTable(database_name, table_name);
+
+	result = getSampleBlock();
+	result.getByPosition(0).column->insert(Field(UInt64(table->checkData())));
+
+	return BlockInputStreamPtr(new OneBlockInputStream(result));
+}
+
+Block InterpreterCheckQuery::getSampleBlock()
+{
+	DB::Block b;
+	ColumnPtr column(new ColumnUInt8);
+	b.insert(ColumnWithNameAndType(column, new DataTypeUInt8, "result"));
+	return b;
+}
diff --git a/dbms/src/Interpreters/InterpreterQuery.cpp b/dbms/src/Interpreters/InterpreterQuery.cpp
index 8e746e5de99..b952bf7e7e3 100644
--- a/dbms/src/Interpreters/InterpreterQuery.cpp
+++ b/dbms/src/Interpreters/InterpreterQuery.cpp
@@ -9,6 +9,7 @@
 #include <DB/Parsers/ASTOptimizeQuery.h>
 #include <DB/Parsers/ASTAlterQuery.h>
 #include <DB/Parsers/TablePropertiesQueriesASTs.h>
+#include <DB/Parsers/ASTCheckQuery.h>
 
 #include <DB/Interpreters/InterpreterSelectQuery.h>
 #include <DB/Interpreters/InterpreterInsertQuery.h>
@@ -25,6 +26,7 @@
 #include <DB/Interpreters/InterpreterQuery.h>
 #include <DB/Interpreters/InterpreterAlterQuery.h>
 #include <DB/Interpreters/InterpreterShowProcesslistQuery.h>
+#include <DB/Interpreters/InterpreterCheckQuery.h>
 
 
 namespace DB
@@ -116,6 +118,11 @@ void InterpreterQuery::execute(WriteBuffer & ostr, ReadBuffer * remaining_data_i
 		InterpreterAlterQuery interpreter(query_ptr, context);
 		interpreter.execute();
 	}
+	else if (typeid_cast<ASTCheckQuery *>(&*query_ptr))
+	{
+		InterpreterCheckQuery interpreter(query_ptr, context);
+		query_plan = interpreter.execute();
+	}
 	else
 		throw Exception("Unknown type of query: " + query_ptr->getID(), ErrorCodes::UNKNOWN_TYPE_OF_QUERY);
 }
@@ -203,6 +210,12 @@ BlockIO InterpreterQuery::execute()
 		InterpreterAlterQuery interpreter(query_ptr, context);
 		interpreter.execute();
 	}
+	else if (typeid_cast<ASTCheckQuery *>(&*query_ptr))
+	{
+		InterpreterCheckQuery interpreter(query_ptr, context);
+		res.in = interpreter.execute();
+		res.in_sample = interpreter.getSampleBlock();
+	}
 	else
 		throw Exception("Unknown type of query: " + query_ptr->getID(), ErrorCodes::UNKNOWN_TYPE_OF_QUERY);
 
diff --git a/dbms/src/Interpreters/InterpreterSelectQuery.cpp b/dbms/src/Interpreters/InterpreterSelectQuery.cpp
index c63ca92f7ae..997e11c8f05 100644
--- a/dbms/src/Interpreters/InterpreterSelectQuery.cpp
+++ b/dbms/src/Interpreters/InterpreterSelectQuery.cpp
@@ -238,50 +238,52 @@ BlockInputStreamPtr InterpreterSelectQuery::execute()
 		  *  выбрасывать ненужные столбцы с учетом всего запроса. В ненужных частях запроса не будем выполнять подзапросы.
 		  */
 
-		ExpressionActionsChain chain;
-
-		need_aggregate = query_analyzer->hasAggregation();
-
-		query_analyzer->appendArrayJoin(chain, !first_stage);
-		query_analyzer->appendJoin(chain, !first_stage);
-
-		if (query_analyzer->appendWhere(chain, !first_stage))
 		{
-			has_where = true;
-			before_where = chain.getLastActions();
+			ExpressionActionsChain chain;
+
+			need_aggregate = query_analyzer->hasAggregation();
+
+			query_analyzer->appendArrayJoin(chain, !first_stage);
+			query_analyzer->appendJoin(chain, !first_stage);
+
+			if (query_analyzer->appendWhere(chain, !first_stage))
+			{
+				has_where = true;
+				before_where = chain.getLastActions();
+				chain.addStep();
+			}
+
+			if (need_aggregate)
+			{
+				query_analyzer->appendGroupBy(chain, !first_stage);
+				query_analyzer->appendAggregateFunctionsArguments(chain, !first_stage);
+				before_aggregation = chain.getLastActions();
+
+				chain.finalize();
+				chain.clear();
+
+				if (query_analyzer->appendHaving(chain, !second_stage))
+				{
+					has_having = true;
+					before_having = chain.getLastActions();
+					chain.addStep();
+				}
+			}
+
+			/// Если есть агрегация, выполняем выражения в SELECT и ORDER BY на инициировавшем сервере, иначе - на серверах-источниках.
+			query_analyzer->appendSelect(chain, need_aggregate ? !second_stage : !first_stage);
+			selected_columns = chain.getLastStep().required_output;
+			has_order_by = query_analyzer->appendOrderBy(chain, need_aggregate ? !second_stage : !first_stage);
+			before_order_and_select = chain.getLastActions();
 			chain.addStep();
-		}
 
-		if (need_aggregate)
-		{
-			query_analyzer->appendGroupBy(chain, !first_stage);
-			query_analyzer->appendAggregateFunctionsArguments(chain, !first_stage);
-			before_aggregation = chain.getLastActions();
+			query_analyzer->appendProjectResult(chain, !second_stage);
+			final_projection = chain.getLastActions();
 
 			chain.finalize();
 			chain.clear();
-
-			if (query_analyzer->appendHaving(chain, !second_stage))
-			{
-				has_having = true;
-				before_having = chain.getLastActions();
-				chain.addStep();
-			}
 		}
 
-		/// Если есть агрегация, выполняем выражения в SELECT и ORDER BY на инициировавшем сервере, иначе - на серверах-источниках.
-		query_analyzer->appendSelect(chain, need_aggregate ? !second_stage : !first_stage);
-		selected_columns = chain.getLastStep().required_output;
-		has_order_by = query_analyzer->appendOrderBy(chain, need_aggregate ? !second_stage : !first_stage);
-		before_order_and_select = chain.getLastActions();
-		chain.addStep();
-
-		query_analyzer->appendProjectResult(chain, !second_stage);
-		final_projection = chain.getLastActions();
-
-		chain.finalize();
-		chain.clear();
-
 		/// Перед выполнением HAVING уберем из блока лишние столбцы (в основном, ключи агрегации).
 		if (has_having)
 			before_having->prependProjectInput();
diff --git a/dbms/src/Interpreters/SplittingAggregator.cpp b/dbms/src/Interpreters/SplittingAggregator.cpp
index d8c41a0317b..b4603c13d31 100644
--- a/dbms/src/Interpreters/SplittingAggregator.cpp
+++ b/dbms/src/Interpreters/SplittingAggregator.cpp
@@ -1,7 +1,5 @@
 #include <iomanip>
 
-#include <statdaemons/Stopwatch.h>
-
 #include <DB/Columns/ColumnString.h>
 #include <DB/Columns/ColumnFixedString.h>
 
@@ -14,8 +12,6 @@ namespace DB
 
 void SplittingAggregator::execute(BlockInputStreamPtr stream, ManyAggregatedDataVariants & results)
 {
-	//Stopwatch watch;
-
 	/// Читаем все данные
 	while (Block block = stream->read())
 	{
@@ -90,10 +86,6 @@ void SplittingAggregator::execute(BlockInputStreamPtr stream, ManyAggregatedData
 
 		/// Параллельно вычисляем хэши и ключи.
 
-	//	LOG_TRACE(log, "Calculating keys and hashes.");
-
-	//	watch.start();
-
 		for (size_t thread_no = 0; thread_no < threads; ++thread_no)
 			pool.schedule(boost::bind(&SplittingAggregator::calculateHashesThread, this,
 				boost::ref(block),
@@ -106,13 +98,8 @@ void SplittingAggregator::execute(BlockInputStreamPtr stream, ManyAggregatedData
 
 		rethrowFirstException(exceptions);
 
-	//	LOG_TRACE(log, "Calculated keys and hashes in " << std::fixed << std::setprecision(2) << watch.elapsedSeconds() << " sec.");
-	//	watch.restart();
-
 		/// Параллельно агрегируем в независимые хэш-таблицы
 
-	//	LOG_TRACE(log, "Parallel aggregating.");
-
 		for (size_t thread_no = 0; thread_no < threads; ++thread_no)
 			pool.schedule(boost::bind(&SplittingAggregator::aggregateThread, this,
 				boost::ref(block),
@@ -125,8 +112,6 @@ void SplittingAggregator::execute(BlockInputStreamPtr stream, ManyAggregatedData
 
 		rethrowFirstException(exceptions);
 
-	//	LOG_TRACE(log, "Parallel aggregated in " << std::fixed << std::setprecision(2) << watch.elapsedSeconds() << " sec.");
-
 		/// Проверка ограничений
 
 		if (max_rows_to_group_by && size_of_all_results > max_rows_to_group_by && group_by_overflow_mode == OverflowMode::BREAK)
diff --git a/dbms/src/Parsers/ParserAlterQuery.cpp b/dbms/src/Parsers/ParserAlterQuery.cpp
index 4fce37d466d..b07554add15 100644
--- a/dbms/src/Parsers/ParserAlterQuery.cpp
+++ b/dbms/src/Parsers/ParserAlterQuery.cpp
@@ -23,11 +23,17 @@ bool ParserAlterQuery::parseImpl(Pos & pos, Pos end, ASTPtr & node, Expected & e
 	ParserString s_modify("MODIFY", true, true);
 
 	ParserString s_drop("DROP", true, true);
+	ParserString s_detach("DETACH", true, true);
+	ParserString s_attach("ATTACH", true, true);
+	ParserString s_unreplicated("UNREPLICATED", true, true);
+	ParserString s_part("PART", true, true);
+	ParserString s_partition("PARTITION", true, true);
 	ParserString s_comma(",");
 
 	ParserIdentifier table_parser;
 	ParserCompoundIdentifier parser_name;
 	ParserCompoundNameTypePair parser_name_type;
+	ParserLiteral parser_literal;
 
 	ASTPtr table;
 	ASTPtr database;
@@ -75,7 +81,8 @@ bool ParserAlterQuery::parseImpl(Pos & pos, Pos end, ASTPtr & node, Expected & e
 		if (s_add.ignore(pos, end, expected))
 		{
 			ws.ignore(pos, end);
-			s_column.ignore(pos, end, expected);
+			if (!s_column.ignore(pos, end, expected))
+				return false;
 			ws.ignore(pos, end);
 
 			parser_name_type.parse(pos, end, params.name_type, expected);
@@ -89,29 +96,84 @@ bool ParserAlterQuery::parseImpl(Pos & pos, Pos end, ASTPtr & node, Expected & e
 					return false;
 			}
 
-			params.type = ASTAlterQuery::ADD;
+			params.type = ASTAlterQuery::ADD_COLUMN;
 		}
 		else if (s_drop.ignore(pos, end, expected))
 		{
 			ws.ignore(pos, end);
-			s_column.ignore(pos, end, expected);
+
+			if (s_partition.ignore(pos, end, expected))
+			{
+				ws.ignore(pos, end);
+
+				if (!parser_literal.parse(pos, end, params.partition, expected))
+					return false;
+
+				params.type = ASTAlterQuery::DROP_PARTITION;
+			}
+			else if (s_column.ignore(pos, end, expected))
+			{
+				ws.ignore(pos, end);
+
+				if (!parser_name.parse(pos, end, params.column, expected))
+					return false;
+
+				params.type = ASTAlterQuery::DROP_COLUMN;
+				params.detach = false;
+			}
+			else
+				return false;
+		}
+		else if (s_detach.ignore(pos, end, expected))
+		{
 			ws.ignore(pos, end);
 
-			parser_name.parse(pos, end, params.column, expected);
+			if (!s_partition.ignore(pos, end, expected))
+				return false;
 
-			params.type = ASTAlterQuery::DROP;
+			ws.ignore(pos, end);
+
+			if (!parser_literal.parse(pos, end, params.partition, expected))
+				return false;
+
+			params.type = ASTAlterQuery::DROP_PARTITION;
+			params.detach = true;
+		}
+		else if (s_attach.ignore(pos, end, expected))
+		{
+			ws.ignore(pos, end);
+
+			if (s_unreplicated.ignore(pos, end, expected))
+			{
+				params.unreplicated = true;
+				ws.ignore(pos, end);
+			}
+
+			if (s_part.ignore(pos, end, expected))
+				params.part = true;
+			else if (!s_partition.ignore(pos, end, expected))
+				return false;
+
+			ws.ignore(pos, end);
+
+			if (!parser_literal.parse(pos, end, params.partition, expected))
+				return false;
+
+			params.type = ASTAlterQuery::ATTACH_PARTITION;
 		}
 		else if (s_modify.ignore(pos, end, expected))
 		{
 			ws.ignore(pos, end);
-			s_column.ignore(pos, end, expected);
+			if (!s_column.ignore(pos, end, expected))
+				return false;
 			ws.ignore(pos, end);
 
-			parser_name_type.parse(pos, end, params.name_type, expected);
+			if (!parser_name_type.parse(pos, end, params.name_type, expected))
+				return false;
 
 			ws.ignore(pos, end);
 
-			params.type = ASTAlterQuery::MODIFY;
+			params.type = ASTAlterQuery::MODIFY_COLUMN;
 		}
 		else
 			return false;
@@ -124,7 +186,7 @@ bool ParserAlterQuery::parseImpl(Pos & pos, Pos end, ASTPtr & node, Expected & e
 			parsing_finished = true;
 		}
 
-		query->parameters.push_back(params);
+		query->addParameters(params);
 	}
 	while (!parsing_finished);
 
diff --git a/dbms/src/Parsers/ParserCheckQuery.cpp b/dbms/src/Parsers/ParserCheckQuery.cpp
new file mode 100644
index 00000000000..f16165be5c8
--- /dev/null
+++ b/dbms/src/Parsers/ParserCheckQuery.cpp
@@ -0,0 +1,51 @@
+#include <DB/Parsers/ParserCheckQuery.h>
+#include <DB/Parsers/CommonParsers.h>
+#include <DB/Parsers/ASTIdentifier.h>
+#include <DB/Parsers/ExpressionElementParsers.h>
+#include <DB/Parsers/ASTCheckQuery.h>
+
+using namespace DB;
+
+bool ParserCheckQuery::parseImpl(IParser::Pos& pos, IParser::Pos end, ASTPtr& node, Expected& expected)
+{
+	ParserWhiteSpaceOrComments ws;
+	ParserString s_check("CHECK", true, true);
+	ParserString s_table("TABLE", true, true);
+	ParserString s_dot(".");
+
+	ParserIdentifier table_parser;
+
+	ASTPtr table;
+	ASTPtr database;
+
+	Poco::SharedPtr<ASTCheckQuery> query = new ASTCheckQuery(StringRange(pos, end));
+
+	ws.ignore(pos, end);
+
+	if (!s_check.ignore(pos, end, expected))
+		return false;
+
+	ws.ignore(pos, end);
+	s_table.ignore(pos, end, expected);
+
+	ws.ignore(pos, end);
+	if (!table_parser.parse(pos, end, database, expected))
+		return false;
+
+	if (s_dot.ignore(pos, end))
+	{
+		if (!table_parser.parse(pos, end, table, expected))
+			return false;
+
+		query->database = typeid_cast<ASTIdentifier &>(*database).name;
+		query->table = typeid_cast<ASTIdentifier &>(*table).name;
+	}
+	else
+	{
+		table = database;
+		query->table = typeid_cast<ASTIdentifier &>(*table).name;
+	}
+
+	node = query;
+	return true;
+}
diff --git a/dbms/src/Parsers/ParserQuery.cpp b/dbms/src/Parsers/ParserQuery.cpp
index 31d26ac78ac..8a619efece9 100644
--- a/dbms/src/Parsers/ParserQuery.cpp
+++ b/dbms/src/Parsers/ParserQuery.cpp
@@ -12,6 +12,7 @@
 #include <DB/Parsers/ParserTablePropertiesQuery.h>
 #include <DB/Parsers/ParserAlterQuery.h>
 #include <DB/Parsers/ParserShowProcesslistQuery.h>
+#include <DB/Parsers/ParserCheckQuery.h>
 //#include <DB/Parsers/ParserMultiQuery.h>
 
 
@@ -33,6 +34,7 @@ bool ParserQuery::parseImpl(Pos & pos, Pos end, ASTPtr & node, Expected & expect
 	ParserOptimizeQuery optimize_p;
 	ParserTablePropertiesQuery table_p;
 	ParserShowProcesslistQuery show_processlist_p;
+	ParserCheckQuery check_p;
 //	ParserMultiQuery multi_p;
 
 	bool res = show_tables_p.parse(pos, end, node, expected)
@@ -47,10 +49,11 @@ bool ParserQuery::parseImpl(Pos & pos, Pos end, ASTPtr & node, Expected & expect
 		|| optimize_p.parse(pos, end, node, expected)
 		|| table_p.parse(pos, end, node, expected)
 		|| show_processlist_p.parse(pos, end, node, expected)
+		|| check_p.parse(pos, end, node, expected);
 	/*	|| multi_p.parse(pos, end, node, expected)*/;
 
 	if (!res)
-		expected = "One of: SHOW TABLES, SHOW DATABASES, SHOW CREATE TABLE, SELECT, INSERT, CREATE, ATTACH, RENAME, DROP, DETACH, USE, SET, OPTIMIZE, EXISTS, DESCRIBE, DESC, ALTER, SHOW PROCESSLIST, opening curly brace";
+		expected = "One of: SHOW TABLES, SHOW DATABASES, SHOW CREATE TABLE, SELECT, INSERT, CREATE, ATTACH, RENAME, DROP, DETACH, USE, SET, OPTIMIZE, EXISTS, DESCRIBE, DESC, ALTER, SHOW PROCESSLIST, CHECK, opening curly brace";
 
 	return res;
 }
diff --git a/dbms/src/Parsers/formatAST.cpp b/dbms/src/Parsers/formatAST.cpp
index 31c8a903eb5..7b696b49510 100644
--- a/dbms/src/Parsers/formatAST.cpp
+++ b/dbms/src/Parsers/formatAST.cpp
@@ -19,7 +19,7 @@ namespace DB
 {
 
 
-static const char * hilite_keyword = "\033[1;37m";
+static const char * hilite_keyword = "\033[1m";
 static const char * hilite_identifier = "\033[0;36m";
 static const char * hilite_function = "\033[0;33m";
 static const char * hilite_operator = "\033[1;33m";
@@ -70,6 +70,7 @@ void formatAST(const IAST & ast, std::ostream & s, size_t indent, bool hilite, b
 	DISPATCH(AlterQuery)
 	DISPATCH(ShowProcesslistQuery)
 	DISPATCH(Join)
+	DISPATCH(CheckQuery)
 //	DISPATCH(MultiQuery)
 	else
 		throw Exception("Unknown element in AST: " + ast.getID()
@@ -720,7 +721,7 @@ void formatAST(const ASTAlterQuery 			& ast, std::ostream & s, size_t indent, bo
 	{
 		const ASTAlterQuery::Parameters &p = ast.parameters[i];
 
-		if (p.type == ASTAlterQuery::ADD)
+		if (p.type == ASTAlterQuery::ADD_COLUMN)
 		{
 			s << (hilite ? hilite_keyword : "") << indent_str << "ADD COLUMN " << (hilite ? hilite_none : "");
 			formatAST(*p.name_type, s, indent, hilite, true);
@@ -732,16 +733,28 @@ void formatAST(const ASTAlterQuery 			& ast, std::ostream & s, size_t indent, bo
 				formatAST(*p.column, s, indent, hilite, one_line);
 			}
 		}
-		else if (p.type == ASTAlterQuery::DROP)
+		else if (p.type == ASTAlterQuery::DROP_COLUMN)
 		{
 			s << (hilite ? hilite_keyword : "") << indent_str << "DROP COLUMN " << (hilite ? hilite_none : "");
 			formatAST(*p.column, s, indent, hilite, true);
 		}
-		else if (p.type == ASTAlterQuery::MODIFY)
+		else if (p.type == ASTAlterQuery::MODIFY_COLUMN)
 		{
 			s << (hilite ? hilite_keyword : "") << indent_str << "MODIFY COLUMN " << (hilite ? hilite_none : "");
 			formatAST(*p.name_type, s, indent, hilite, true);
 		}
+		else if (p.type == ASTAlterQuery::DROP_PARTITION)
+		{
+			s << (hilite ? hilite_keyword : "") << indent_str << (p.detach ? "DETACH" : "DROP") << " PARTITION "
+				<< (hilite ? hilite_none : "");
+			formatAST(*p.partition, s, indent, hilite, true);
+		}
+		else if (p.type == ASTAlterQuery::ATTACH_PARTITION)
+		{
+			s << (hilite ? hilite_keyword : "") << indent_str << "ATTACH " << (p.unreplicated ? "UNREPLICATED" : "")
+				<< (p.part ? " PART " : " PARTITION ") << (hilite ? hilite_none : "");
+			formatAST(*p.partition, s, indent, hilite, true);
+		}
 		else
 			throw Exception("Unexpected type of ALTER", ErrorCodes::UNEXPECTED_AST_STRUCTURE);
 
@@ -768,6 +781,27 @@ void formatAST(const ASTJoin & ast, std::ostream & s, size_t indent, bool hilite
 	formatAST(*ast.using_expr_list, s, indent, hilite, one_line, need_parens);
 }
 
+void formatAST(const ASTCheckQuery & ast, std::ostream & s, size_t indent, bool hilite, bool one_line, bool need_parens)
+{
+	std::string nl_or_nothing = one_line ? "" : "\n";
+
+	std::string indent_str = one_line ? "" : std::string(4 * indent, ' ');
+	std::string nl_or_ws = one_line ? " " : "\n";
+
+	s << (hilite ? hilite_keyword : "") << indent_str << "CHECK TABLE " << (hilite ? hilite_none : "");
+
+	if (!ast.table.empty())
+	{
+		if (!ast.database.empty())
+		{
+			s << (hilite ? hilite_keyword : "") << indent_str << ast.database << (hilite ? hilite_none : "");
+			s << ".";
+		}
+		s << (hilite ? hilite_keyword : "") << indent_str << ast.table << (hilite ? hilite_none : "");
+	}
+	s << nl_or_ws;
+}
+
 /*
 void formatAST(const ASTMultiQuery & ast, std::ostream & s, size_t indent, bool hilite, bool one_line, bool need_parens)
 {
diff --git a/dbms/src/Server/HTTPHandler.cpp b/dbms/src/Server/HTTPHandler.cpp
index 9f4f3690bb4..96434d0777e 100644
--- a/dbms/src/Server/HTTPHandler.cpp
+++ b/dbms/src/Server/HTTPHandler.cpp
@@ -11,7 +11,6 @@
 #include <DB/IO/ConcatReadBuffer.h>
 #include <DB/IO/CompressedReadBuffer.h>
 #include <DB/IO/CompressedWriteBuffer.h>
-#include <DB/IO/WriteBufferFromHTTPServerResponse.h>
 #include <DB/IO/WriteBufferFromString.h>
 #include <DB/IO/WriteHelpers.h>
 
@@ -28,7 +27,7 @@
 namespace DB
 {
 
-void HTTPHandler::processQuery(Poco::Net::HTTPServerRequest & request, Poco::Net::HTTPServerResponse & response)
+void HTTPHandler::processQuery(Poco::Net::HTTPServerRequest & request, Poco::Net::HTTPServerResponse & response, Output & used_output)
 {
 	LOG_TRACE(log, "Request URI: " << request.getURI());
 
@@ -47,13 +46,12 @@ void HTTPHandler::processQuery(Poco::Net::HTTPServerRequest & request, Poco::Net
 		query_param += '\n';
 
 	/// Если указано compress, то будем сжимать результат.
-	SharedPtr<WriteBufferFromHTTPServerResponse> out = new WriteBufferFromHTTPServerResponse(response);
-	SharedPtr<WriteBuffer> out_maybe_compressed;
+	used_output.out = new WriteBufferFromHTTPServerResponse(response);
 
 	if (parse<bool>(params.get("compress", "0")))
-		out_maybe_compressed = new CompressedWriteBuffer(*out);
+		used_output.out_maybe_compressed = new CompressedWriteBuffer(*used_output.out);
 	else
-		out_maybe_compressed = out;
+		used_output.out_maybe_compressed = used_output.out;
 
 	/// Имя пользователя и пароль могут быть заданы как в параметрах URL, так и с помощью HTTP Basic authentification (и то, и другое не секъюрно).
 	std::string user = params.get("user", "default");
@@ -138,7 +136,7 @@ void HTTPHandler::processQuery(Poco::Net::HTTPServerRequest & request, Poco::Net
 		context.getSettingsRef().limits.readonly = true;
 
 	Stopwatch watch;
-	executeQuery(*in, *out_maybe_compressed, context, query_plan);
+	executeQuery(*in, *used_output.out_maybe_compressed, context, query_plan);
 	watch.stop();
 
 	if (query_plan)
@@ -167,11 +165,13 @@ void HTTPHandler::processQuery(Poco::Net::HTTPServerRequest & request, Poco::Net
 		LOG_INFO(log, "Quota:\n" << quota.toString());
 
 	/// Если не было эксепшена и данные ещё не отправлены - отправляются HTTP заголовки с кодом 200.
-	out->finalize();
+	used_output.out->finalize();
 }
 
 
-void HTTPHandler::trySendExceptionToClient(std::stringstream & s, Poco::Net::HTTPServerRequest & request, Poco::Net::HTTPServerResponse & response)
+void HTTPHandler::trySendExceptionToClient(std::stringstream & s,
+	Poco::Net::HTTPServerRequest & request, Poco::Net::HTTPServerResponse & response,
+	Output & used_output)
 {
 	try
 	{
@@ -186,8 +186,32 @@ void HTTPHandler::trySendExceptionToClient(std::stringstream & s, Poco::Net::HTT
 		}
 
 		response.setStatusAndReason(Poco::Net::HTTPResponse::HTTP_INTERNAL_SERVER_ERROR);
-		if (!response.sent())
+
+		if (!response.sent() && !used_output.out_maybe_compressed)
+		{
+			/// Ещё ничего не отправляли, и даже не знаем, нужно ли сжимать ответ.
 			response.send() << s.str() << std::endl;
+		}
+		else if (used_output.out_maybe_compressed)
+		{
+			/** Отправим в использованный (возможно сжатый) поток сообщение об ошибке.
+			  * Сообщение об ошибке может идти невпопад - после каких-то данных.
+			  * Также стоит иметь ввиду, что мы могли уже отправить код 200.
+			  */
+
+			/** Если данные есть в буфере, но их ещё не отправили, то и не будем отправлять */
+			if (used_output.out->count() - used_output.out->offset() == 0)
+			{
+				used_output.out_maybe_compressed->position() = used_output.out_maybe_compressed->buffer().begin();
+				used_output.out->position() = used_output.out->buffer().begin();
+			}
+
+			std::string exception_message = s.str();
+			writeString(exception_message, *used_output.out_maybe_compressed);
+			writeChar('\n', *used_output.out_maybe_compressed);
+			used_output.out_maybe_compressed->next();
+			used_output.out->finalize();
+		}
 	}
 	catch (...)
 	{
@@ -198,6 +222,8 @@ void HTTPHandler::trySendExceptionToClient(std::stringstream & s, Poco::Net::HTT
 
 void HTTPHandler::handleRequest(Poco::Net::HTTPServerRequest & request, Poco::Net::HTTPServerResponse & response)
 {
+	Output used_output;
+
 	try
 	{
 		bool is_browser = false;
@@ -215,7 +241,7 @@ void HTTPHandler::handleRequest(Poco::Net::HTTPServerRequest & request, Poco::Ne
 		if (request.getVersion() == Poco::Net::HTTPServerRequest::HTTP_1_1)
 			response.setChunkedTransferEncoding(true);
 
-		processQuery(request, response);
+		processQuery(request, response, used_output);
 		LOG_INFO(log, "Done processing query");
 	}
 	catch (Exception & e)
@@ -224,26 +250,26 @@ void HTTPHandler::handleRequest(Poco::Net::HTTPServerRequest & request, Poco::Ne
 		s << "Code: " << e.code()
 			<< ", e.displayText() = " << e.displayText() << ", e.what() = " << e.what();
 		LOG_ERROR(log, s.str());
-		trySendExceptionToClient(s, request, response);
+		trySendExceptionToClient(s, request, response, used_output);
 	}
 	catch (Poco::Exception & e)
 	{
 		std::stringstream s;
 		s << "Code: " << ErrorCodes::POCO_EXCEPTION << ", e.code() = " << e.code()
 			<< ", e.displayText() = " << e.displayText() << ", e.what() = " << e.what();
-		trySendExceptionToClient(s, request, response);
+		trySendExceptionToClient(s, request, response, used_output);
 	}
 	catch (std::exception & e)
 	{
 		std::stringstream s;
 		s << "Code: " << ErrorCodes::STD_EXCEPTION << ". " << e.what();
-		trySendExceptionToClient(s, request, response);
+		trySendExceptionToClient(s, request, response, used_output);
 	}
 	catch (...)
 	{
 		std::stringstream s;
 		s << "Code: " << ErrorCodes::UNKNOWN_EXCEPTION << ". Unknown exception.";
-		trySendExceptionToClient(s, request, response);
+		trySendExceptionToClient(s, request, response, used_output);
 	}
 }
 
diff --git a/dbms/src/Server/HTTPHandler.h b/dbms/src/Server/HTTPHandler.h
index 03c917e57c3..7357c7f5831 100644
--- a/dbms/src/Server/HTTPHandler.h
+++ b/dbms/src/Server/HTTPHandler.h
@@ -1,5 +1,6 @@
 #pragma once
 
+#include <DB/IO/WriteBufferFromHTTPServerResponse.h>
 #include "Server.h"
 
 
@@ -16,15 +17,26 @@ public:
 	{
 	}
 
+	struct Output
+	{
+		SharedPtr<WriteBufferFromHTTPServerResponse> out;
+		/// Используется для выдачи ответа. Равен либо out, либо CompressedWriteBuffer(*out), в зависимости от настроек.
+		SharedPtr<WriteBuffer> out_maybe_compressed;
+	};
+
 	void handleRequest(Poco::Net::HTTPServerRequest & request, Poco::Net::HTTPServerResponse & response);
-	void trySendExceptionToClient(std::stringstream & s, Poco::Net::HTTPServerRequest & request, Poco::Net::HTTPServerResponse & response);
+
+	void trySendExceptionToClient(std::stringstream & s,
+		Poco::Net::HTTPServerRequest & request, Poco::Net::HTTPServerResponse & response,
+		Output & used_output);
 
 private:
 	Server & server;
 
 	Logger * log;
 
- 	void processQuery(Poco::Net::HTTPServerRequest & request, Poco::Net::HTTPServerResponse & response);
+	/// Функция также инициализирует used_output.
+	void processQuery(Poco::Net::HTTPServerRequest & request, Poco::Net::HTTPServerResponse & response, Output & used_output);
 };
 
 }
diff --git a/dbms/src/Server/OLAPQueryParser.cpp b/dbms/src/Server/OLAPQueryParser.cpp
index 30f6491d6ba..e21facfe2fa 100644
--- a/dbms/src/Server/OLAPQueryParser.cpp
+++ b/dbms/src/Server/OLAPQueryParser.cpp
@@ -166,7 +166,7 @@ QueryParseResult QueryParser::parse(std::istream & s)
 			else if (settings_child_nodes->item(i)->nodeName() == "max_threads_per_counter")
 			{
 				/** Выставить локальное ограничение на максимальное количество обрабатываемых запросов
-					* Оно может быть больше, чем ограничение по-умолчанию.
+					* Оно может быть больше, чем ограничение по умолчанию.
 					*/
 				result.max_threads_per_counter = DB::parse<unsigned>(settings_child_nodes->item(i)->innerText());
 			}
diff --git a/dbms/src/Server/Server.cpp b/dbms/src/Server/Server.cpp
index 7263154c7bf..e416963b9f4 100644
--- a/dbms/src/Server/Server.cpp
+++ b/dbms/src/Server/Server.cpp
@@ -370,8 +370,8 @@ int Server::main(const std::vector<std::string> & args)
 		global_context->setInterserverIOHost(this_host, port);
 	}
 
-	if (config().has("replica_name"))
-		global_context->setDefaultReplicaName(config().getString("replica_name"));
+	if (config().has("macros"))
+		global_context->setMacros(Macros(config(), "macros"));
 
 	std::string users_config_path = config().getString("users_config", config().getString("config-file", "config.xml"));
 	auto users_config_reloader = stdext::make_unique<UsersConfigReloader>(users_config_path, global_context.get());
@@ -402,6 +402,7 @@ int Server::main(const std::vector<std::string> & args)
 
 	global_context->addTable("system", "one",		StorageSystemOne::create("one"));
 	global_context->addTable("system", "numbers", 	StorageSystemNumbers::create("numbers"));
+	global_context->addTable("system", "numbers_mt", StorageSystemNumbers::create("numbers_mt", true));
 	global_context->addTable("system", "tables", 	StorageSystemTables::create("tables", *global_context));
 	global_context->addTable("system", "parts", 	StorageSystemParts::create("parts", *global_context));
 	global_context->addTable("system", "databases", StorageSystemDatabases::create("databases", *global_context));
diff --git a/dbms/src/Server/TCPHandler.cpp b/dbms/src/Server/TCPHandler.cpp
index 596a69d8e38..d5d21939198 100644
--- a/dbms/src/Server/TCPHandler.cpp
+++ b/dbms/src/Server/TCPHandler.cpp
@@ -42,7 +42,7 @@ void TCPHandler::runImpl()
 	socket().setReceiveTimeout(global_settings.receive_timeout);
 	socket().setSendTimeout(global_settings.send_timeout);
 	socket().setNoDelay(true);
-	
+
 	in = new ReadBufferFromPocoSocket(socket());
 	out = new WriteBufferFromPocoSocket(socket());
 
@@ -68,7 +68,7 @@ void TCPHandler::runImpl()
 		throw;
 	}
 
-	/// При соединении может быть указана БД по-умолчанию.
+	/// При соединении может быть указана БД по умолчанию.
 	if (!default_database.empty())
 	{
 		if (!connection_context.isDatabaseExist(default_database))
@@ -82,7 +82,7 @@ void TCPHandler::runImpl()
 
 		connection_context.setCurrentDatabase(default_database);
 	}
-	
+
 	sendHello();
 
 	connection_context.setProgressCallback([this] (const size_t rows, const size_t bytes) {
@@ -98,7 +98,7 @@ void TCPHandler::runImpl()
 		/// Если требуется завершить работу, или клиент отсоединился.
 		if (Daemon::instance().isCancelled() || in->eof())
 			break;
-		
+
 		Stopwatch watch;
 		state.reset();
 
@@ -106,7 +106,7 @@ void TCPHandler::runImpl()
 		  * Клиент сможет его принять, если оно не произошло во время отправки другого пакета и клиент ещё не разорвал соединение.
 		  */
 		SharedPtr<Exception> exception;
-		
+
 		try
 		{
 			/// Восстанавливаем контекст запроса.
@@ -271,7 +271,7 @@ void TCPHandler::processOrdinaryQuery()
 		while (true)
 		{
 			Block block;
-			
+
 			while (true)
 			{
 				if (isQueryCancelled())
@@ -288,7 +288,7 @@ void TCPHandler::processOrdinaryQuery()
 						after_send_progress.restart();
 						sendProgress();
 					}
-				
+
 					if (async_in.poll(query_context.getSettingsRef().interactive_delay / 1000))
 					{
 						/// Есть следующий блок результата.
@@ -308,8 +308,8 @@ void TCPHandler::processOrdinaryQuery()
 				sendProfileInfo();
 				sendProgress();
 			}
-			
-			sendData(block);			
+
+			sendData(block);
 			if (!block)
 				break;
 		}
diff --git a/dbms/src/Storages/MergeTree/ActiveDataPartSet.cpp b/dbms/src/Storages/MergeTree/ActiveDataPartSet.cpp
index 8f6bd3f8eef..b8dbc8f4165 100644
--- a/dbms/src/Storages/MergeTree/ActiveDataPartSet.cpp
+++ b/dbms/src/Storages/MergeTree/ActiveDataPartSet.cpp
@@ -82,6 +82,12 @@ Strings ActiveDataPartSet::getParts() const
 	return res;
 }
 
+size_t ActiveDataPartSet::size() const
+{
+	Poco::ScopedLock<Poco::Mutex> lock(mutex);
+	return parts.size();
+}
+
 
 
 String ActiveDataPartSet::getPartName(DayNum_t left_date, DayNum_t right_date, UInt64 left_id, UInt64 right_id, UInt64 level)
@@ -110,10 +116,14 @@ String ActiveDataPartSet::getPartName(DayNum_t left_date, DayNum_t right_date, U
 	return res;
 }
 
-bool ActiveDataPartSet::isPartDirectory(const String & dir_name, Poco::RegularExpression::MatchVec & matches)
+bool ActiveDataPartSet::isPartDirectory(const String & dir_name, Poco::RegularExpression::MatchVec * out_matches)
 {
+	Poco::RegularExpression::MatchVec matches;
 	static Poco::RegularExpression file_name_regexp("^(\\d{8})_(\\d{8})_(\\d+)_(\\d+)_(\\d+)");
-	return (file_name_regexp.match(dir_name, 0, matches) && 6 == matches.size());
+	bool res = (file_name_regexp.match(dir_name, 0, matches) && 6 == matches.size());
+	if (out_matches)
+		*out_matches = matches;
+	return res;
 }
 
 void ActiveDataPartSet::parsePartName(const String & file_name, Part & part, const Poco::RegularExpression::MatchVec * matches_p)
@@ -121,7 +131,7 @@ void ActiveDataPartSet::parsePartName(const String & file_name, Part & part, con
 	Poco::RegularExpression::MatchVec match_vec;
 	if (!matches_p)
 	{
-		if (!isPartDirectory(file_name, match_vec))
+		if (!isPartDirectory(file_name, &match_vec))
 			throw Exception("Unexpected part name: " + file_name, ErrorCodes::BAD_DATA_PART_NAME);
 		matches_p = &match_vec;
 	}
diff --git a/dbms/src/Storages/MergeTree/DiskSpaceMonitor.cpp b/dbms/src/Storages/MergeTree/DiskSpaceMonitor.cpp
index 2175fa5c8fe..8aa67f741ef 100644
--- a/dbms/src/Storages/MergeTree/DiskSpaceMonitor.cpp
+++ b/dbms/src/Storages/MergeTree/DiskSpaceMonitor.cpp
@@ -4,6 +4,7 @@ namespace DB
 {
 
 size_t DiskSpaceMonitor::reserved_bytes;
-Poco::FastMutex DiskSpaceMonitor::reserved_bytes_mutex;
+size_t DiskSpaceMonitor::reservation_count;
+Poco::FastMutex DiskSpaceMonitor::mutex;
 
 }
diff --git a/dbms/src/Storages/MergeTree/MergeTreeData.cpp b/dbms/src/Storages/MergeTree/MergeTreeData.cpp
index e44a196bf94..3abf3cc735b 100644
--- a/dbms/src/Storages/MergeTree/MergeTreeData.cpp
+++ b/dbms/src/Storages/MergeTree/MergeTreeData.cpp
@@ -5,6 +5,7 @@
 #include <DB/Storages/MergeTree/MergeTreeReader.h>
 #include <DB/Storages/MergeTree/MergeTreeBlockInputStream.h>
 #include <DB/Storages/MergeTree/MergedBlockOutputStream.h>
+#include <DB/Storages/MergeTree/MergeTreePartChecker.h>
 #include <DB/Parsers/ASTIdentifier.h>
 #include <DB/Parsers/ASTNameTypePair.h>
 #include <DB/DataStreams/ExpressionBlockInputStream.h>
@@ -41,6 +42,7 @@ MergeTreeData::MergeTreeData(
 {
 	/// создаём директорию, если её нет
 	Poco::File(full_path).createDirectories();
+	Poco::File(full_path + "detached").createDirectory();
 
 	/// инициализируем описание сортировки
 	sort_descr.reserve(primary_expr_ast->children.size());
@@ -54,8 +56,6 @@ MergeTreeData::MergeTreeData(
 
 	ExpressionActionsPtr projected_expr = ExpressionAnalyzer(primary_expr_ast, context, *columns).getActions(true);
 	primary_key_sample = projected_expr->getSampleBlock();
-
-	loadDataParts();
 }
 
 UInt64 MergeTreeData::getMaxDataPartIndex()
@@ -83,7 +83,7 @@ std::string MergeTreeData::getModePrefix() const
 }
 
 
-void MergeTreeData::loadDataParts()
+void MergeTreeData::loadDataParts(bool skip_sanity_checks)
 {
 	LOG_DEBUG(log, "Loading data parts");
 
@@ -104,6 +104,7 @@ void MergeTreeData::loadDataParts()
 		if (0 == file_name.compare(0, strlen("tmp_"), "tmp_"))
 			continue;
 
+		/// TODO: Это можно удалить, если нигде больше не осталось директорий old_* (их давно никто не пишет).
 		if (0 == file_name.compare(0, strlen("old_"), "old_"))
 		{
 			String new_file_name = file_name.substr(strlen("old_"));
@@ -118,11 +119,13 @@ void MergeTreeData::loadDataParts()
 	}
 
 	DataPartsVector broken_parts_to_remove;
+	DataPartsVector broken_parts_to_detach;
+	size_t suspicious_broken_parts = 0;
 
 	Poco::RegularExpression::MatchVec matches;
 	for (const String & file_name : part_file_names)
 	{
-		if (!ActiveDataPartSet::isPartDirectory(file_name, matches))
+		if (!ActiveDataPartSet::isPartDirectory(file_name, &matches))
 			continue;
 
 		MutableDataPartPtr part = std::make_shared<DataPart>(*this);
@@ -133,10 +136,10 @@ void MergeTreeData::loadDataParts()
 
 		try
 		{
-			part->loadColumns();
-			part->loadChecksums();
+			part->loadColumns(require_part_metadata);
+			part->loadChecksums(require_part_metadata);
 			part->loadIndex();
-			part->checkNotBroken();
+			part->checkNotBroken(require_part_metadata);
 		}
 		catch (...)
 		{
@@ -150,7 +153,7 @@ void MergeTreeData::loadDataParts()
 			if (part->level == 0)
 			{
 				/// Восстановить куски нулевого уровня невозможно.
-				LOG_ERROR(log, "Removing broken part " << full_path + file_name << " because is't impossible to repair.");
+				LOG_ERROR(log, "Removing broken part " << full_path + file_name << " because it's impossible to repair.");
 				broken_parts_to_remove.push_back(part);
 			}
 			else
@@ -160,12 +163,13 @@ void MergeTreeData::loadDataParts()
 				int contained_parts = 0;
 
 				LOG_ERROR(log, "Part " << full_path + file_name << " is broken. Looking for parts to replace it.");
+				++suspicious_broken_parts;
 
 				for (const String & contained_name : part_file_names)
 				{
 					if (contained_name == file_name)
 						continue;
-					if (!ActiveDataPartSet::isPartDirectory(contained_name, matches))
+					if (!ActiveDataPartSet::isPartDirectory(contained_name, &matches))
 						continue;
 					DataPart contained_part(*this);
 					ActiveDataPartSet::parsePartName(contained_name, contained_part, &matches);
@@ -183,8 +187,9 @@ void MergeTreeData::loadDataParts()
 				}
 				else
 				{
-					LOG_ERROR(log, "Not removing broken part " << full_path + file_name
+					LOG_ERROR(log, "Detaching broken part " << full_path + file_name
 						<< " because it covers less than 2 parts. You need to resolve this manually");
+					broken_parts_to_detach.push_back(part);
 				}
 			}
 
@@ -196,12 +201,14 @@ void MergeTreeData::loadDataParts()
 		data_parts.insert(part);
 	}
 
-	if (broken_parts_to_remove.size() > 2)
-		throw Exception("Suspiciously many (" + toString(broken_parts_to_remove.size()) + ") broken parts to remove.",
+	if (suspicious_broken_parts > 5 && !skip_sanity_checks)
+		throw Exception("Suspiciously many (" + toString(suspicious_broken_parts) + ") broken parts to remove.",
 			ErrorCodes::TOO_MANY_UNEXPECTED_DATA_PARTS);
 
 	for (const auto & part : broken_parts_to_remove)
 		part->remove();
+	for (const auto & part : broken_parts_to_detach)
+		part->renameAddPrefix("detached/");
 
 	all_data_parts = data_parts;
 
@@ -705,8 +712,6 @@ MergeTreeData::DataPartsVector MergeTreeData::renameTempPartAndReplace(
 
 void MergeTreeData::replaceParts(const DataPartsVector & remove, const DataPartsVector & add, bool clear_without_timeout)
 {
-	LOG_TRACE(log, "Removing " << remove.size() << " parts and adding " << add.size() << " parts.");
-
 	Poco::ScopedLock<Poco::FastMutex> lock(data_parts_mutex);
 
 	for (const DataPartPtr & part : remove)
@@ -720,7 +725,17 @@ void MergeTreeData::replaceParts(const DataPartsVector & remove, const DataParts
 	}
 }
 
-void MergeTreeData::renameAndDetachPart(DataPartPtr part, const String & prefix, bool restore_covered)
+void MergeTreeData::attachPart(DataPartPtr part)
+{
+	Poco::ScopedLock<Poco::FastMutex> lock(data_parts_mutex);
+	Poco::ScopedLock<Poco::FastMutex> lock_all(all_data_parts_mutex);
+
+	if (!all_data_parts.insert(part).second)
+		throw Exception("Part " + part->name + " is already attached", ErrorCodes::DUPLICATE_DATA_PART);
+	data_parts.insert(part);
+}
+
+void MergeTreeData::renameAndDetachPart(DataPartPtr part, const String & prefix, bool restore_covered, bool move_to_detached)
 {
 	LOG_INFO(log, "Renaming " << part->name << " to " << prefix << part->name << " and detaching it.");
 
@@ -731,7 +746,8 @@ void MergeTreeData::renameAndDetachPart(DataPartPtr part, const String & prefix,
 		throw Exception("No such data part", ErrorCodes::NO_SUCH_DATA_PART);
 
 	data_parts.erase(part);
-	part->renameAddPrefix(prefix);
+	if (move_to_detached || !prefix.empty())
+		part->renameAddPrefix((move_to_detached ? "detached/" : "") + prefix);
 
 	if (restore_covered)
 	{
@@ -783,6 +799,11 @@ void MergeTreeData::renameAndDetachPart(DataPartPtr part, const String & prefix,
 	}
 }
 
+void MergeTreeData::detachPartInPlace(DataPartPtr part)
+{
+	renameAndDetachPart(part, "", false, false);
+}
+
 MergeTreeData::DataParts MergeTreeData::getDataParts()
 {
 	Poco::ScopedLock<Poco::FastMutex> lock(data_parts_mutex);
@@ -879,6 +900,41 @@ MergeTreeData::DataPartPtr MergeTreeData::getPartIfExists(const String & part_na
 	return nullptr;
 }
 
+MergeTreeData::MutableDataPartPtr MergeTreeData::loadPartAndFixMetadata(const String & relative_path)
+{
+	MutableDataPartPtr part = std::make_shared<DataPart>(*this);
+	part->name = relative_path;
+
+	/// Раньше список столбцов записывался неправильно. Удалим его и создадим заново.
+	if (Poco::File(full_path + relative_path + "/columns.txt").exists())
+		Poco::File(full_path + relative_path + "/columns.txt").remove();
+
+	part->loadColumns(false);
+	part->loadChecksums(false);
+	part->loadIndex();
+	part->checkNotBroken(false);
+
+	part->modification_time = Poco::File(full_path + relative_path).getLastModified().epochTime();
+
+	/// Если нет файла с чексуммами, посчитаем чексуммы и запишем. Заодно проверим данные.
+	if (part->checksums.empty())
+	{
+		MergeTreePartChecker::Settings settings;
+		settings.setIndexGranularity(index_granularity);
+		settings.setRequireColumnFiles(true);
+		MergeTreePartChecker::checkDataPart(full_path + relative_path, settings, context.getDataTypeFactory(), &part->checksums);
+
+		{
+			WriteBufferFromFile out(full_path + relative_path + "/checksums.txt.tmp", 4096);
+			part->checksums.writeText(out);
+		}
+
+		Poco::File(full_path + relative_path + "/checksums.txt.tmp").renameTo(full_path + relative_path + "/checksums.txt");
+	}
+
+	return part;
+}
+
 
 void MergeTreeData::DataPart::Checksums::Checksum::checkEqual(const Checksum & rhs, bool have_uncompressed, const String & name) const
 {
diff --git a/dbms/src/Storages/MergeTree/MergeTreeDataMerger.cpp b/dbms/src/Storages/MergeTree/MergeTreeDataMerger.cpp
index a5122ecb4d5..4d453dd1dbd 100644
--- a/dbms/src/Storages/MergeTree/MergeTreeDataMerger.cpp
+++ b/dbms/src/Storages/MergeTree/MergeTreeDataMerger.cpp
@@ -1,6 +1,7 @@
 #include <DB/Storages/MergeTree/MergeTreeDataMerger.h>
 #include <DB/Storages/MergeTree/MergeTreeBlockInputStream.h>
 #include <DB/Storages/MergeTree/MergedBlockOutputStream.h>
+#include <DB/Storages/MergeTree/DiskSpaceMonitor.h>
 #include <DB/DataStreams/ExpressionBlockInputStream.h>
 #include <DB/DataStreams/MergingSortedBlockInputStream.h>
 #include <DB/DataStreams/CollapsingSortedBlockInputStream.h>
@@ -37,7 +38,7 @@ static const double DISK_USAGE_COEFFICIENT_TO_RESERVE = 1.4;
 /// 5) С ростом логарифма суммарного размера кусочков в мердже увеличиваем требование сбалансированности
 
 bool MergeTreeDataMerger::selectPartsToMerge(MergeTreeData::DataPartsVector & parts, String & merged_name, size_t available_disk_space,
-	bool merge_anything_for_old_months, bool aggressive, bool only_small, const AllowedMergingPredicate & can_merge)
+	bool merge_anything_for_old_months, bool aggressive, bool only_small, const AllowedMergingPredicate & can_merge_callback)
 {
 	MergeTreeData::DataParts data_parts = data.getDataParts();
 
@@ -66,6 +67,19 @@ bool MergeTreeDataMerger::selectPartsToMerge(MergeTreeData::DataPartsVector & pa
 	if (only_small)
 		cur_max_bytes_to_merge_parts = data.settings.max_bytes_to_merge_parts_small;
 
+	/// Мемоизация для функции can_merge_callback. Результат вызова can_merge_callback для этого куска и предыдущего в data_parts.
+	std::map<MergeTreeData::DataPartPtr, bool> can_merge_with_previous;
+	auto can_merge = [&can_merge_with_previous, &can_merge_callback]
+		(const MergeTreeData::DataPartPtr & first, const MergeTreeData::DataPartPtr & second) -> bool
+	{
+		auto it = can_merge_with_previous.find(second);
+		if (it != can_merge_with_previous.end())
+			return it->second;
+		bool res = can_merge_callback(first, second);
+		can_merge_with_previous[second] = res;
+		return res;
+	};
+
 	/// Найдем суммарный размер еще не пройденных кусков (то есть всех).
 	size_t size_in_bytes_of_remaining_parts = 0;
 	for (const auto & part : data_parts)
@@ -187,7 +201,9 @@ bool MergeTreeDataMerger::selectPartsToMerge(MergeTreeData::DataPartsVector & pa
 					{
 						disk_space_warning_time = now;
 						LOG_WARNING(log, "Won't merge parts from " << first_part->name << " to " << last_part->name
-							<< " because not enough free space: " << available_disk_space << " free and unreserved, "
+							<< " because not enough free space: " << available_disk_space << " free and unreserved "
+							<< "(" << DiskSpaceMonitor::getReservedSpace() << " reserved in "
+							<< DiskSpaceMonitor::getReservationCount() << " chunks), "
 							<< cur_sum << " required now (+" << static_cast<int>((DISK_USAGE_COEFFICIENT_TO_SELECT - 1.0) * 100)
 							<< "% on overhead); suppressing similar warnings for the next hour");
 					}
@@ -247,7 +263,8 @@ bool MergeTreeDataMerger::selectPartsToMerge(MergeTreeData::DataPartsVector & pa
 
 /// parts должны быть отсортированы.
 MergeTreeData::DataPartPtr MergeTreeDataMerger::mergeParts(
-	const MergeTreeData::DataPartsVector & parts, const String & merged_name, MergeTreeData::Transaction * out_transaction)
+	const MergeTreeData::DataPartsVector & parts, const String & merged_name,
+	MergeTreeData::Transaction * out_transaction, DiskSpaceMonitor::Reservation * disk_reservation)
 {
 	LOG_DEBUG(log, "Merging " << parts.size() << " parts: from " << parts.front()->name << " to " << parts.back()->name << " into " << merged_name);
 
@@ -277,12 +294,15 @@ MergeTreeData::DataPartPtr MergeTreeDataMerger::mergeParts(
 	  */
 	BlockInputStreams src_streams;
 
+	size_t sum_rows_approx = 0;
+
 	for (size_t i = 0; i < parts.size(); ++i)
 	{
 		MarkRanges ranges(1, MarkRange(0, parts[i]->size));
 		src_streams.push_back(new ExpressionBlockInputStream(new MergeTreeBlockInputStream(
 			data.getFullPath() + parts[i]->name + '/', DEFAULT_MERGE_BLOCK_SIZE, union_column_names, data,
 			parts[i], ranges, false, nullptr, ""), data.getPrimaryExpression()));
+		sum_rows_approx += parts[i]->size * data.index_granularity;
 	}
 
 	/// Порядок потоков важен: при совпадении ключа элементы идут в порядке номера потока-источника.
@@ -319,10 +339,19 @@ MergeTreeData::DataPartPtr MergeTreeDataMerger::mergeParts(
 	merged_stream->readPrefix();
 	to->writePrefix();
 
+	size_t rows_written = 0;
+	size_t initial_reservation = disk_reservation ? disk_reservation->getSize() : 0;
+
 	Block block;
 	while (!canceled && (block = merged_stream->read()))
+	{
+		rows_written += block.rows();
 		to->write(block);
 
+		if (disk_reservation)
+			disk_reservation->update(static_cast<size_t>((1 - std::min(1., 1. * rows_written / sum_rows_approx)) * initial_reservation));
+	}
+
 	if (canceled)
 		throw Exception("Canceled merging parts", ErrorCodes::ABORTED);
 
diff --git a/dbms/src/Storages/MergeTree/MergeTreePartChecker.cpp b/dbms/src/Storages/MergeTree/MergeTreePartChecker.cpp
index b7055da37f4..ef1b36776fd 100644
--- a/dbms/src/Storages/MergeTree/MergeTreePartChecker.cpp
+++ b/dbms/src/Storages/MergeTree/MergeTreePartChecker.cpp
@@ -4,6 +4,7 @@
 #include <DB/DataTypes/DataTypeDateTime.h>
 #include <DB/DataTypes/DataTypesNumberFixed.h>
 #include <DB/DataTypes/DataTypeFixedString.h>
+#include <DB/DataTypes/DataTypeAggregateFunction.h>
 #include <DB/IO/CompressedReadBuffer.h>
 #include <DB/IO/HashingReadBuffer.h>
 #include <DB/Columns/ColumnsNumber.h>
@@ -14,6 +15,8 @@ namespace DB
 
 struct Stream
 {
+	static const size_t UNKNOWN = std::numeric_limits<size_t>::max();
+
 	DataTypePtr type;
 	String path;
 	String name;
@@ -35,6 +38,12 @@ struct Stream
 		return mrk_hashing_buf.eof();
 	}
 
+	void ignore()
+	{
+		uncompressed_hashing_buf.ignore(std::numeric_limits<size_t>::max());
+		mrk_hashing_buf.ignore(std::numeric_limits<size_t>::max());
+	}
+
 	size_t read(size_t rows)
 	{
 		if (dynamic_cast<const DataTypeString *>(&*type))
@@ -97,33 +106,43 @@ struct Stream
 		return size / sizeof(UInt64);
 	}
 
-	void assertMark(bool strict)
+	void assertMark()
 	{
 		MarkInCompressedFile mrk_mark;
 		readIntBinary(mrk_mark.offset_in_compressed_file, mrk_hashing_buf);
 		readIntBinary(mrk_mark.offset_in_decompressed_block, mrk_hashing_buf);
 
+		bool has_alternative_mark = false;
+		MarkInCompressedFile alternative_data_mark;
 		MarkInCompressedFile data_mark;
 
+		/// Если засечка должна быть ровно на границе блоков, нам подходит и засечка, указывающая на конец предыдущего блока,
+		///  и на начало следующего.
 		if (uncompressed_hashing_buf.position() == uncompressed_hashing_buf.buffer().end())
 		{
-			/// Если засечка должна быть ровно на границе блоков, нам подходит и засечка, указывающая на конец предыдущего блока,
-			///  и на начало следующего.
-			data_mark.offset_in_compressed_file = compressed_hashing_buf.count() - uncompressing_buf.getSizeCompressed();
-			data_mark.offset_in_decompressed_block = uncompressed_hashing_buf.offset();
+			/// Получим засечку, указывающую на конец предыдущего блока.
+			has_alternative_mark = true;
+			alternative_data_mark.offset_in_compressed_file = compressed_hashing_buf.count() - uncompressing_buf.getSizeCompressed();
+			alternative_data_mark.offset_in_decompressed_block = uncompressed_hashing_buf.offset();
 
-			if (mrk_mark == data_mark)
+			if (mrk_mark == alternative_data_mark)
 				return;
 
 			uncompressed_hashing_buf.next();
+
+			/// В конце файла compressed_hashing_buf.count() указывает на конец файла даже до вызова next(),
+			///  и только что выполненная проверка работает неправильно. Для простоты не будем проверять последнюю засечку.
+			if (uncompressed_hashing_buf.eof())
+				return;
 		}
 
 		data_mark.offset_in_compressed_file = compressed_hashing_buf.count() - uncompressing_buf.getSizeCompressed();
 		data_mark.offset_in_decompressed_block = uncompressed_hashing_buf.offset();
 
 		if (mrk_mark != data_mark)
-			throw Exception("Incorrect mark: " + data_mark.toString() + " in data, " + mrk_mark.toString() + " in .mrk file",
-							ErrorCodes::INCORRECT_MARK);
+			throw Exception("Incorrect mark: " + data_mark.toString() +
+				(has_alternative_mark ? " or " + alternative_data_mark.toString() : "") + " in data, " +
+				mrk_mark.toString() + " in .mrk file", ErrorCodes::INCORRECT_MARK);
 	}
 
 	void assertEnd(MergeTreeData::DataPart::Checksums & checksums)
@@ -142,7 +161,7 @@ struct Stream
 };
 
 /// Возвращает количество строк. Добавляет в checksums чексуммы всех файлов столбца.
-static size_t checkColumn(const String & path, const String & name, DataTypePtr type, size_t index_granularity, bool strict,
+static size_t checkColumn(const String & path, const String & name, DataTypePtr type, const MergeTreePartChecker::Settings & settings,
 						  MergeTreeData::DataPart::Checksums & checksums)
 {
 	size_t rows = 0;
@@ -161,10 +180,10 @@ static size_t checkColumn(const String & path, const String & name, DataTypePtr
 				if (sizes_stream.marksEOF())
 					break;
 
-				sizes_stream.assertMark(strict);
-				data_stream.assertMark(strict);
+				sizes_stream.assertMark();
+				data_stream.assertMark();
 
-				size_t cur_rows = sizes_stream.readUInt64(index_granularity, sizes);
+				size_t cur_rows = sizes_stream.readUInt64(settings.index_granularity, sizes);
 
 				size_t sum = 0;
 				for (size_t i = 0; i < cur_rows; ++i)
@@ -178,7 +197,7 @@ static size_t checkColumn(const String & path, const String & name, DataTypePtr
 				data_stream.read(sum);
 
 				rows += cur_rows;
-				if (cur_rows < index_granularity)
+				if (cur_rows < settings.index_granularity)
 					break;
 			}
 
@@ -187,6 +206,12 @@ static size_t checkColumn(const String & path, const String & name, DataTypePtr
 
 			return rows;
 		}
+		else if (dynamic_cast<const DataTypeAggregateFunction *>(&*type))
+		{
+			Stream data_stream(path, escapeForFileName(name), type);
+			data_stream.ignore();
+			return Stream::UNKNOWN;
+		}
 		else
 		{
 			Stream data_stream(path, escapeForFileName(name), type);
@@ -197,12 +222,15 @@ static size_t checkColumn(const String & path, const String & name, DataTypePtr
 				if (data_stream.marksEOF())
 					break;
 
-				data_stream.assertMark(strict);
+				data_stream.assertMark();
 
-				size_t cur_rows = data_stream.read(index_granularity);
+				size_t cur_rows = data_stream.read(settings.index_granularity);
 
-				rows += cur_rows;
-				if (cur_rows < index_granularity)
+				if (cur_rows == Stream::UNKNOWN)
+					rows = Stream::UNKNOWN;
+				else
+					rows += cur_rows;
+				if (cur_rows < settings.index_granularity)
 					break;
 			}
 
@@ -218,8 +246,8 @@ static size_t checkColumn(const String & path, const String & name, DataTypePtr
 	}
 }
 
-void MergeTreePartChecker::checkDataPart(String path, size_t index_granularity, bool strict, const DataTypeFactory & data_type_factory,
-	bool verbose)
+void MergeTreePartChecker::checkDataPart(String path, const Settings & settings, const DataTypeFactory & data_type_factory,
+										 MergeTreeData::DataPart::Checksums * out_checksums)
 {
 	if (!path.empty() && *path.rbegin() != '/')
 		path += "/";
@@ -233,7 +261,7 @@ void MergeTreePartChecker::checkDataPart(String path, size_t index_granularity,
 		assertEOF(buf);
 	}
 
-	if (strict || Poco::File(path + "checksums.txt").exists())
+	if (settings.require_checksums || Poco::File(path + "checksums.txt").exists())
 	{
 		ReadBufferFromFile buf(path + "checksums.txt");
 		checksums_txt.readText(buf);
@@ -250,13 +278,13 @@ void MergeTreePartChecker::checkDataPart(String path, size_t index_granularity,
 		checksums_data.files["primary.idx"] = MergeTreeData::DataPart::Checksums::Checksum(primary_idx_size, hashing_buf.getHash());
 	}
 
-	bool first = true;
-	size_t rows = 0;
+	String any_column_name;
+	size_t rows = Stream::UNKNOWN;
 	ExceptionPtr first_exception;
 
 	for (const NameAndTypePair & column : columns)
 	{
-		if (verbose)
+		if (settings.verbose)
 		{
 			std::cerr << column.name << ":";
 			std::cerr.flush();
@@ -265,30 +293,33 @@ void MergeTreePartChecker::checkDataPart(String path, size_t index_granularity,
 		bool ok = false;
 		try
 		{
-			if (!strict && !Poco::File(path + escapeForFileName(column.name) + ".bin").exists())
+			if (!settings.require_column_files && !Poco::File(path + escapeForFileName(column.name) + ".bin").exists())
 			{
-				if (verbose)
+				if (settings.verbose)
 					std::cerr << " no files" << std::endl;
 				continue;
 			}
 
-			size_t cur_rows = checkColumn(path, column.name, column.type, index_granularity, strict, checksums_data);
-			if (first)
+			size_t cur_rows = checkColumn(path, column.name, column.type, settings, checksums_data);
+			if (cur_rows != Stream::UNKNOWN)
 			{
-				rows = cur_rows;
-				first = false;
-			}
-			else if (rows != cur_rows)
-			{
-				throw Exception("Different number of rows in columns " + columns.begin()->name + " and " + column.name,
-								ErrorCodes::SIZES_OF_COLUMNS_DOESNT_MATCH);
+				if (rows == Stream::UNKNOWN)
+				{
+					rows = cur_rows;
+					any_column_name = column.name;
+				}
+				else if (rows != cur_rows)
+				{
+					throw Exception("Different number of rows in columns " + any_column_name + " and " + column.name,
+									ErrorCodes::SIZES_OF_COLUMNS_DOESNT_MATCH);
+				}
 			}
 
 			ok = true;
 		}
 		catch (...)
 		{
-			if (!verbose)
+			if (!settings.verbose)
 				throw;
 			ExceptionPtr e = cloneCurrentException();
 			if (!first_exception)
@@ -301,18 +332,18 @@ void MergeTreePartChecker::checkDataPart(String path, size_t index_granularity,
 			 std::cerr << std::endl;
 		}
 
-		if (verbose && ok)
+		if (settings.verbose && ok)
 			std::cerr << " ok" << std::endl;
 	}
 
-	if (first)
+	if (rows == Stream::UNKNOWN)
 		throw Exception("No columns", ErrorCodes::EMPTY_LIST_OF_COLUMNS_PASSED);
 
-	if (primary_idx_size % ((rows - 1) / index_granularity + 1))
+	if (primary_idx_size % ((rows - 1) / settings.index_granularity + 1))
 		throw Exception("primary.idx size (" + toString(primary_idx_size) + ") not divisible by number of marks ("
-			+ toString(rows) + "/" + toString(index_granularity) + " rounded up)", ErrorCodes::CORRUPTED_DATA);
+			+ toString(rows) + "/" + toString(settings.index_granularity) + " rounded up)", ErrorCodes::CORRUPTED_DATA);
 
-	if (strict || !checksums_txt.files.empty())
+	if (settings.require_checksums || !checksums_txt.files.empty())
 		checksums_txt.checkEqual(checksums_data, true);
 
 	if (first_exception)
diff --git a/dbms/src/Storages/MergeTree/ReplicatedMergeTreePartsExchange.cpp b/dbms/src/Storages/MergeTree/ReplicatedMergeTreePartsExchange.cpp
index da860c75357..8386a3640f4 100644
--- a/dbms/src/Storages/MergeTree/ReplicatedMergeTreePartsExchange.cpp
+++ b/dbms/src/Storages/MergeTree/ReplicatedMergeTreePartsExchange.cpp
@@ -73,8 +73,15 @@ MergeTreeData::MutableDataPartPtr ReplicatedMergeTreePartsFetcher::fetchPart(
 	ReadBufferFromHTTP in(host, port, params);
 
 	String part_path = data.getFullPath() + "tmp_" + part_name + "/";
-	if (!Poco::File(part_path).createDirectory())
-		throw Exception("Directory " + part_path + " already exists");
+	Poco::File part_file(part_path);
+
+	if (part_file.exists())
+	{
+		LOG_ERROR(log, "Directory " + part_path + " already exists. Removing.");
+		part_file.remove(true);
+	}
+
+	part_file.createDirectory();
 
 	MergeTreeData::MutableDataPartPtr new_data_part = std::make_shared<MergeTreeData::DataPart>(data);
 	new_data_part->name = "tmp_" + part_name;
@@ -110,8 +117,8 @@ MergeTreeData::MutableDataPartPtr ReplicatedMergeTreePartsFetcher::fetchPart(
 
 	ActiveDataPartSet::parsePartName(part_name, *new_data_part);
 	new_data_part->modification_time = time(0);
-	new_data_part->loadColumns();
-	new_data_part->loadChecksums();
+	new_data_part->loadColumns(true);
+	new_data_part->loadChecksums(true);
 	new_data_part->loadIndex();
 
 	new_data_part->checksums.checkEqual(checksums, false);
diff --git a/dbms/src/Storages/StorageChunkRef.cpp b/dbms/src/Storages/StorageChunkRef.cpp
index 61ba562376c..f84ff574773 100644
--- a/dbms/src/Storages/StorageChunkRef.cpp
+++ b/dbms/src/Storages/StorageChunkRef.cpp
@@ -82,4 +82,10 @@ const StorageChunks & StorageChunkRef::getSource() const
 	return *chunks;
 }
 
+bool StorageChunkRef::checkData() const
+{
+	return getSource().checkData();
+}
+
+
 }
diff --git a/dbms/src/Storages/StorageChunks.cpp b/dbms/src/Storages/StorageChunks.cpp
index 5da1dcb9e72..f8bc1b8ad1e 100644
--- a/dbms/src/Storages/StorageChunks.cpp
+++ b/dbms/src/Storages/StorageChunks.cpp
@@ -218,6 +218,7 @@ void StorageChunks::appendChunkToIndex(const std::string & chunk_name, size_t ma
 	writeStringBinary(chunk_name, index);
 	writeIntBinary<UInt64>(mark, index);
 	index.next();
+	file_checker.update(Poco::File(index_path));
 }
 
 void StorageChunks::dropThis()
diff --git a/dbms/src/Storages/StorageDistributed.cpp b/dbms/src/Storages/StorageDistributed.cpp
index cd9b908bea0..5d7074c7512 100644
--- a/dbms/src/Storages/StorageDistributed.cpp
+++ b/dbms/src/Storages/StorageDistributed.cpp
@@ -1,34 +1,73 @@
-#include <DB/Parsers/formatAST.h>
-
 #include <DB/DataStreams/RemoteBlockInputStream.h>
 #include <DB/DataStreams/RemoveColumnsBlockInputStream.h>
 
 #include <DB/Storages/StorageDistributed.h>
 #include <DB/Storages/VirtualColumnFactory.h>
-
-#include <Poco/Net/NetworkInterface.h>
-#include <DB/Client/ConnectionPool.h>
+#include <DB/Storages/Distributed/DistributedBlockOutputStream.h>
+#include <DB/Storages/Distributed/DirectoryMonitor.h>
+#include <DB/Storages/Distributed/queryToString.h>
+#include <DB/Common/escapeForFileName.h>
 
 #include <DB/Interpreters/InterpreterSelectQuery.h>
 #include <DB/Interpreters/InterpreterAlterQuery.h>
-#include <boost/bind.hpp>
+
 #include <DB/Core/Field.h>
 
+#include <statdaemons/stdext.h>
+
 namespace DB
 {
 
+namespace
+{
+	/// select query has database and table names as AST pointers
+	/// Создает копию запроса, меняет имена базы данных и таблицы.
+	inline ASTPtr rewriteSelectQuery(const ASTPtr & query, const std::string & database, const std::string & table)
+	{
+		auto modified_query_ast = query->clone();
+
+		auto & actual_query = typeid_cast<ASTSelectQuery &>(*modified_query_ast);
+		actual_query.database = new ASTIdentifier{{}, database, ASTIdentifier::Database};
+		actual_query.table = new ASTIdentifier{{}, table, ASTIdentifier::Table};
+
+		return modified_query_ast;
+	}
+
+	/// insert query has database and table names as bare strings
+	/// Создает копию запроса, меняет имена базы данных и таблицы.
+	inline ASTPtr rewriteInsertQuery(const ASTPtr & query, const std::string & database, const std::string & table)
+	{
+		auto modified_query_ast = query->clone();
+
+		auto & actual_query = typeid_cast<ASTInsertQuery &>(*modified_query_ast);
+		actual_query.database = database;
+		actual_query.table = table;
+		/// make sure query is not INSERT SELECT
+		actual_query.select = nullptr;
+
+		return modified_query_ast;
+	}
+}
+
+
 StorageDistributed::StorageDistributed(
 	const std::string & name_,
 	NamesAndTypesListPtr columns_,
 	const String & remote_database_,
 	const String & remote_table_,
 	Cluster & cluster_,
-	const Context & context_)
+	Context & context_,
+	const ASTPtr & sharding_key_,
+	const String & data_path_)
 	: name(name_), columns(columns_),
 	remote_database(remote_database_), remote_table(remote_table_),
-	context(context_),
-	cluster(cluster_)
+	context(context_), cluster(cluster_),
+	sharding_key_expr(sharding_key_ ? ExpressionAnalyzer(sharding_key_, context, *columns).getActions(false) : nullptr),
+	sharding_key_column_name(sharding_key_ ? sharding_key_->getColumnName() : String{}),
+	write_enabled(cluster.getLocalNodesNum() + cluster.pools.size() < 2 || sharding_key_),
+	path(data_path_ + escapeForFileName(name) + '/')
 {
+	createDirectoryMonitors();
 }
 
 StoragePtr StorageDistributed::create(
@@ -37,10 +76,17 @@ StoragePtr StorageDistributed::create(
 	const String & remote_database_,
 	const String & remote_table_,
 	const String & cluster_name,
-	Context & context_)
+	Context & context_,
+	const ASTPtr & sharding_key_,
+	const String & data_path_)
 {
 	context_.initClusters();
-	return (new StorageDistributed(name_, columns_, remote_database_, remote_table_, context_.getCluster(cluster_name), context_))->thisPtr();
+
+	return (new StorageDistributed{
+		name_, columns_, remote_database_, remote_table_,
+		context_.getCluster(cluster_name), context_,
+		sharding_key_, data_path_
+	})->thisPtr();
 }
 
 
@@ -52,7 +98,9 @@ StoragePtr StorageDistributed::create(
 	SharedPtr<Cluster> & owned_cluster_,
 	Context & context_)
 {
-	auto res = new StorageDistributed(name_, columns_, remote_database_, remote_table_, *owned_cluster_, context_);
+	auto res = new StorageDistributed{
+		name_, columns_, remote_database_,
+		remote_table_, *owned_cluster_, context_};
 
 	/// Захватываем владение объектом-кластером.
 	res->owned_cluster = owned_cluster_;
@@ -60,27 +108,6 @@ StoragePtr StorageDistributed::create(
 	return res->thisPtr();
 }
 
-ASTPtr StorageDistributed::rewriteQuery(ASTPtr query)
-{
-	/// Создаем копию запроса.
-	ASTPtr modified_query_ast = query->clone();
-
-	/// Меняем имена таблицы и базы данных
-	ASTSelectQuery & select = typeid_cast<ASTSelectQuery &>(*modified_query_ast);
-	select.database = new ASTIdentifier(StringRange(), remote_database, ASTIdentifier::Database);
-	select.table 	= new ASTIdentifier(StringRange(), remote_table, 	ASTIdentifier::Table);
-
-	return modified_query_ast;
-}
-
-static String selectToString(ASTPtr query)
-{
-	ASTSelectQuery & select = typeid_cast<ASTSelectQuery &>(*query);
-	std::stringstream s;
-	formatAST(select, s, 0, false, true);
-	return s.str();
-}
-
 BlockInputStreams StorageDistributed::read(
 	const Names & column_names,
 	ASTPtr query,
@@ -99,20 +126,15 @@ BlockInputStreams StorageDistributed::read(
 		: QueryProcessingStage::WithMergeableState;
 
 	BlockInputStreams res;
-	ASTPtr modified_query_ast = rewriteQuery(query);
+	const auto & modified_query_ast = rewriteSelectQuery(
+		query, remote_database, remote_table);
+	const auto & modified_query = queryToString(modified_query_ast);
 
 	/// Цикл по шардам.
 	for (auto & conn_pool : cluster.pools)
-	{
-		String modified_query = selectToString(modified_query_ast);
-
-		res.push_back(new RemoteBlockInputStream(
-			conn_pool,
-			modified_query,
-			&new_settings,
-			external_tables,
-			processed_stage));
-	}
+		res.emplace_back(new RemoteBlockInputStream{
+			conn_pool, modified_query, &new_settings,
+			external_tables, processed_stage});
 
 	/// Добавляем запросы к локальному ClickHouse.
 	if (cluster.getLocalNodesNum() > 0)
@@ -123,10 +145,10 @@ BlockInputStreams StorageDistributed::read(
 			if (!new_context.tryGetExternalTable(it.first))
 				new_context.addExternalTable(it.first, it.second);
 
-		for(size_t i = 0; i < cluster.getLocalNodesNum(); ++i)
+		for (size_t i = 0; i < cluster.getLocalNodesNum(); ++i)
 		{
 			InterpreterSelectQuery interpreter(modified_query_ast, new_context, processed_stage);
-				res.push_back(interpreter.execute());
+			res.push_back(interpreter.execute());
 		}
 	}
 
@@ -134,6 +156,21 @@ BlockInputStreams StorageDistributed::read(
 	return res;
 }
 
+BlockOutputStreamPtr StorageDistributed::write(ASTPtr query)
+{
+	if (!write_enabled)
+		throw Exception{
+			"Method write is not supported by storage " + getName() +
+			" with more than one shard and no sharding key provided",
+			ErrorCodes::STORAGE_REQUIRES_PARAMETER
+		};
+
+	return new DistributedBlockOutputStream{
+		*this,
+		rewriteInsertQuery(query, remote_database, remote_table)
+	};
+}
+
 void StorageDistributed::alter(const AlterCommands & params, const String & database_name, const String & table_name, Context & context)
 {
 	auto lock = lockStructureForAlter();
@@ -141,11 +178,15 @@ void StorageDistributed::alter(const AlterCommands & params, const String & data
 	InterpreterAlterQuery::updateMetadata(database_name, table_name, *columns, context);
 }
 
+void StorageDistributed::shutdown()
+{
+	directory_monitors.clear();
+}
+
 NameAndTypePair StorageDistributed::getColumn(const String & column_name) const
 {
-	auto type = VirtualColumnFactory::tryGetType(column_name);
-	if (type)
-		return NameAndTypePair(column_name, type);
+	if (const auto & type = VirtualColumnFactory::tryGetType(column_name))
+		return { column_name, type };
 
 	return getRealColumn(column_name);
 }
@@ -155,4 +196,25 @@ bool StorageDistributed::hasColumn(const String & column_name) const
 	return VirtualColumnFactory::hasColumn(column_name) || hasRealColumn(column_name);
 }
 
+void StorageDistributed::createDirectoryMonitor(const std::string & name)
+{
+	directory_monitors.emplace(name, stdext::make_unique<DirectoryMonitor>(*this, name));
+}
+
+void StorageDistributed::createDirectoryMonitors()
+{
+	Poco::File{path}.createDirectory();
+
+	Poco::DirectoryIterator end;
+	for (Poco::DirectoryIterator it{path}; it != end; ++it)
+		if (it->isDirectory())
+			createDirectoryMonitor(it.name());
+}
+
+void StorageDistributed::requireDirectoryMonitor(const std::string & name)
+{
+	if (!directory_monitors.count(name))
+		createDirectoryMonitor(name);
+}
+
 }
diff --git a/dbms/src/Storages/StorageFactory.cpp b/dbms/src/Storages/StorageFactory.cpp
index 7d8a1507e7b..3a2289e375f 100644
--- a/dbms/src/Storages/StorageFactory.cpp
+++ b/dbms/src/Storages/StorageFactory.cpp
@@ -176,20 +176,24 @@ StoragePtr StorageFactory::get(
 
 		ASTs & args = typeid_cast<ASTExpressionList &>(*args_func.at(0)).children;
 
-		if (args.size() != 3)
-			throw Exception("Storage Distributed requires 3 parameters"
-				" - name of configuration section with list of remote servers, name of remote database, name of remote table.",
+		if (args.size() != 3 && args.size() != 4)
+			throw Exception("Storage Distributed requires 3 or 4 parameters"
+				" - name of configuration section with list of remote servers, name of remote database, name of remote table,"
+				" sharding key expression (optional).",
 				ErrorCodes::NUMBER_OF_ARGUMENTS_DOESNT_MATCH);
 
 		String cluster_name 	= typeid_cast<ASTIdentifier &>(*args[0]).name;
 		String remote_database 	= typeid_cast<ASTIdentifier &>(*args[1]).name;
 		String remote_table 	= typeid_cast<ASTIdentifier &>(*args[2]).name;
 
-		return StorageDistributed::create(table_name, columns, remote_database, remote_table, cluster_name, context);
+		const auto & sharding_key = args.size() == 4 ? args[3] : nullptr;
+
+		return StorageDistributed::create(
+			table_name, columns, remote_database, remote_table, cluster_name, context, sharding_key, data_path);
 	}
 	else if (endsWith(name, "MergeTree"))
 	{
-		/** Движки [Replicated][Summing|Collapsing]MergeTree  (6 комбинаций)
+		/** Движки [Replicated][Summing|Collapsing|Aggregating|]MergeTree  (8 комбинаций)
 		  * В качестве аргумента для движка должно быть указано:
 		  *  - (для Replicated) Путь к таблице в ZooKeeper
 		  *  - (для Replicated) Имя реплики в ZooKeeper
@@ -264,11 +268,7 @@ StoragePtr StorageFactory::get(
 				throw Exception("Replica name must be a string literal", ErrorCodes::BAD_ARGUMENTS);
 
 			if (replica_name.empty())
-			{
-				replica_name = context.getDefaultReplicaName();
-				if (replica_name.empty())
-					throw Exception("No replica name in config", ErrorCodes::NO_REPLICA_NAME_GIVEN);
-			}
+				throw Exception("No replica name in config", ErrorCodes::NO_REPLICA_NAME_GIVEN);
 
 			args.erase(args.begin(), args.begin() + 2);
 		}
@@ -311,22 +311,6 @@ StoragePtr StorageFactory::get(
 				columns, context, primary_expr_list, date_column_name,
 				sampling_expression, index_granularity, mode, sign_column_name);
 	}
-	else if (name == "SystemNumbers")
-	{
-		if (columns->size() != 1 || columns->begin()->name != "number" || columns->begin()->type->getName() != "UInt64")
-			throw Exception("Storage SystemNumbers only allows one column with name 'number' and type 'UInt64'",
-				ErrorCodes::ILLEGAL_COLUMN);
-
-		return StorageSystemNumbers::create(table_name);
-	}
-	else if (name == "SystemOne")
-	{
-		if (columns->size() != 1 || columns->begin()->name != "dummy" || columns->begin()->type->getName() != "UInt8")
-			throw Exception("Storage SystemOne only allows one column with name 'dummy' and type 'UInt8'",
-				ErrorCodes::ILLEGAL_COLUMN);
-
-		return StorageSystemOne::create(table_name);
-	}
 	else
 		throw Exception("Unknown storage " + name, ErrorCodes::UNKNOWN_STORAGE);
 }
diff --git a/dbms/src/Storages/StorageLog.cpp b/dbms/src/Storages/StorageLog.cpp
index 79386b4b3e1..6a7cccc7de7 100644
--- a/dbms/src/Storages/StorageLog.cpp
+++ b/dbms/src/Storages/StorageLog.cpp
@@ -281,6 +281,13 @@ void LogBlockOutputStream::writeSuffix()
 	for (FileStreams::iterator it = streams.begin(); it != streams.end(); ++it)
 		it->second->finalize();
 
+	std::vector<Poco::File> column_files;
+	for (auto & pair : streams)
+		column_files.push_back(storage.files[pair.first].data_file);
+	column_files.push_back(storage.marks_file);
+
+	storage.file_checker.update(column_files.begin(), column_files.end());
+
 	streams.clear();
 }
 
@@ -403,7 +410,8 @@ void LogBlockOutputStream::writeMarks(MarksForColumns marks)
 
 
 StorageLog::StorageLog(const std::string & path_, const std::string & name_, NamesAndTypesListPtr columns_, size_t max_compress_block_size_)
-	: path(path_), name(name_), columns(columns_), loaded_marks(false), max_compress_block_size(max_compress_block_size_)
+	: path(path_), name(name_), columns(columns_), loaded_marks(false), max_compress_block_size(max_compress_block_size_),
+	file_checker(path + escapeForFileName(name) + '/' + "sizes.json", *this)
 {
 	if (columns->empty())
 		throw Exception("Empty list of columns passed to StorageLog constructor", ErrorCodes::EMPTY_LIST_OF_COLUMNS_PASSED);
@@ -532,6 +540,7 @@ void StorageLog::rename(const String & new_path_to_db, const String & new_databa
 
 	path = new_path_to_db;
 	name = new_table_name;
+	file_checker.setPath(path + escapeForFileName(name) + '/' + "sizes.json");
 
 	for (Files_t::iterator it = files.begin(); it != files.end(); ++it)
 	{
@@ -667,5 +676,11 @@ BlockOutputStreamPtr StorageLog::write(
 	return new LogBlockOutputStream(*this);
 }
 
+bool StorageLog::checkData() const
+{
+	Poco::ScopedReadRWLock lock(const_cast<Poco::RWLock &>(rwlock));
+
+	return file_checker.check();
+}
 
 }
diff --git a/dbms/src/Storages/StorageMaterializedView.cpp b/dbms/src/Storages/StorageMaterializedView.cpp
index e288db8d048..74666d65e23 100644
--- a/dbms/src/Storages/StorageMaterializedView.cpp
+++ b/dbms/src/Storages/StorageMaterializedView.cpp
@@ -5,6 +5,7 @@
 #include <DB/Interpreters/InterpreterDropQuery.h>
 
 #include <DB/Storages/StorageMaterializedView.h>
+#include <DB/Storages/VirtualColumnFactory.h>
 
 
 namespace DB
@@ -61,6 +62,20 @@ StorageMaterializedView::StorageMaterializedView(const String & table_name_, con
 	}
 }
 
+NameAndTypePair StorageMaterializedView::getColumn(const String & column_name) const
+{
+	auto type = VirtualColumnFactory::tryGetType(column_name);
+	if (type)
+		return NameAndTypePair(column_name, type);
+
+	return getRealColumn(column_name);
+}
+
+bool StorageMaterializedView::hasColumn(const String & column_name) const
+{
+	return VirtualColumnFactory::hasColumn(column_name) || hasRealColumn(column_name);
+}
+
 BlockInputStreams StorageMaterializedView::read(
 	const Names & column_names,
 	ASTPtr query,
diff --git a/dbms/src/Storages/StorageMergeTree.cpp b/dbms/src/Storages/StorageMergeTree.cpp
index 162688ceae3..3e159b128b4 100644
--- a/dbms/src/Storages/StorageMergeTree.cpp
+++ b/dbms/src/Storages/StorageMergeTree.cpp
@@ -27,6 +27,7 @@ StorageMergeTree::StorageMergeTree(const String & path_, const String & database
 {
 	increment.fixIfBroken(data.getMaxDataPartIndex());
 
+	data.loadDataParts(false);
 	data.clearOldParts();
 }
 
@@ -180,7 +181,7 @@ bool StorageMergeTree::merge(bool aggressive, BackgroundProcessingPool::Context
 		}
 	}
 
-	merger.mergeParts(merging_tagger->parts, merged_name);
+	merger.mergeParts(merging_tagger->parts, merged_name, nullptr, &*merging_tagger->reserved_space);
 
 	return true;
 }
diff --git a/dbms/src/Storages/StorageReplicatedMergeTree.cpp b/dbms/src/Storages/StorageReplicatedMergeTree.cpp
index 8243124c007..ec9d0410297 100644
--- a/dbms/src/Storages/StorageReplicatedMergeTree.cpp
+++ b/dbms/src/Storages/StorageReplicatedMergeTree.cpp
@@ -17,6 +17,8 @@ const auto ERROR_SLEEP_MS = 1000;
 const auto MERGE_SELECTING_SLEEP_MS = 5 * 1000;
 const auto CLEANUP_SLEEP_MS = 30 * 1000;
 
+const auto RESERVED_BLOCK_NUMBERS = 200;
+
 /// Преобразовать число в строку формате суффиксов автоинкрементных нод в ZooKeeper.
 static String padIndex(UInt64 index)
 {
@@ -43,49 +45,52 @@ StorageReplicatedMergeTree::StorageReplicatedMergeTree(
 	const MergeTreeSettings & settings_)
 	:
 	context(context_), zookeeper(context.getZooKeeper()), database_name(database_name_),
-	table_name(name_), full_path(path_ + escapeForFileName(table_name) + '/'), zookeeper_path(zookeeper_path_),
-	replica_name(replica_name_),
+	table_name(name_), full_path(path_ + escapeForFileName(table_name) + '/'),
+	zookeeper_path(context.getMacros().expand(zookeeper_path_)),
+	replica_name(context.getMacros().expand(replica_name_)),
 	data(	full_path, columns_, context_, primary_expr_ast_, date_column_name_, sampling_expression_,
 			index_granularity_, mode_, sign_column_, settings_, database_name_ + "." + table_name, true,
 			std::bind(&StorageReplicatedMergeTree::enqueuePartForCheck, this, std::placeholders::_1)),
 	reader(data), writer(data), merger(data), fetcher(data),
 	log(&Logger::get(database_name_ + "." + table_name + " (StorageReplicatedMergeTree)")),
-	shutdown_event(false), permanent_shutdown_event(false)
+	shutdown_event(false)
 {
+	if (!zookeeper_path.empty() && *zookeeper_path.rbegin() == '/')
+		zookeeper_path.erase(zookeeper_path.end() - 1);
+	replica_path = zookeeper_path + "/replicas/" + replica_name;
+
+	bool skip_sanity_checks = false;
+
+	if (zookeeper && zookeeper->exists(replica_path + "/flags/force_restore_data"))
+	{
+		skip_sanity_checks = true;
+		zookeeper->remove(replica_path + "/flags/force_restore_data");
+
+		LOG_WARNING(log, "Skipping the limits on severity of changes to data parts and columns (flag "
+			<< replica_path << "/flags/force_restore_data).");
+	}
+
+	data.loadDataParts(skip_sanity_checks);
+
 	if (!zookeeper)
 	{
 		if (!attach)
 			throw Exception("Can't create replicated table without ZooKeeper", ErrorCodes::NO_ZOOKEEPER);
 
-		goReadOnly();
+		goReadOnlyPermanently();
 		return;
 	}
 
-	if (!zookeeper_path.empty() && *zookeeper_path.rbegin() == '/')
-		zookeeper_path.erase(zookeeper_path.end() - 1);
-	replica_path = zookeeper_path + "/replicas/" + replica_name;
-
 	if (!attach)
 	{
-		if (!zookeeper->exists(zookeeper_path))
-			createTable();
+		createTableIfNotExists();
 
-		checkTableStructure(false);
+		checkTableStructure(false, false);
 		createReplica();
 	}
 	else
 	{
-		bool skip_sanity_checks = false;
-		if (zookeeper->exists(replica_path + "/flags/force_restore_data"))
-		{
-			skip_sanity_checks = true;
-			zookeeper->remove(replica_path + "/flags/force_restore_data");
-
-			LOG_WARNING(log, "Skipping the limits on severity of changes to data parts and columns (flag "
-				<< replica_path << "/flags/force_restore_data).");
-		}
-
-		checkTableStructure(skip_sanity_checks);
+		checkTableStructure(skip_sanity_checks, true);
 		checkParts(skip_sanity_checks);
 	}
 
@@ -96,9 +101,13 @@ StorageReplicatedMergeTree::StorageReplicatedMergeTree(
 	if (Poco::File(unreplicated_path).exists())
 	{
 		LOG_INFO(log, "Have unreplicated data");
+
 		unreplicated_data.reset(new MergeTreeData(unreplicated_path, columns_, context_, primary_expr_ast_,
 			date_column_name_, sampling_expression_, index_granularity_, mode_, sign_column_, settings_,
 			database_name_ + "." + table_name + "[unreplicated]", false));
+
+		unreplicated_data->loadDataParts(skip_sanity_checks);
+
 		unreplicated_reader.reset(new MergeTreeDataSelectExecutor(*unreplicated_data));
 		unreplicated_merger.reset(new MergeTreeDataMerger(*unreplicated_data));
 	}
@@ -149,11 +158,14 @@ static String formattedAST(const ASTPtr & ast)
 	return ss.str();
 }
 
-void StorageReplicatedMergeTree::createTable()
+void StorageReplicatedMergeTree::createTableIfNotExists()
 {
+	if (zookeeper->exists(zookeeper_path))
+		return;
+
 	LOG_DEBUG(log, "Creating table " << zookeeper_path);
 
-	zookeeper->create(zookeeper_path, "", zkutil::CreateMode::Persistent);
+	zookeeper->createAncestors(zookeeper_path);
 
 	/// Запишем метаданные таблицы, чтобы реплики могли сверять с ними параметры таблицы.
 	std::stringstream metadata;
@@ -165,24 +177,37 @@ void StorageReplicatedMergeTree::createTable()
 	metadata << "sign column: " << data.sign_column << std::endl;
 	metadata << "primary key: " << formattedAST(data.primary_expr_ast) << std::endl;
 
-	zookeeper->create(zookeeper_path + "/metadata", metadata.str(), zkutil::CreateMode::Persistent);
-	zookeeper->create(zookeeper_path + "/columns", data.getColumnsList().toString(), zkutil::CreateMode::Persistent);
+	zkutil::Ops ops;
+	ops.push_back(new zkutil::Op::Create(zookeeper_path, "",
+										 zookeeper->getDefaultACL(), zkutil::CreateMode::Persistent));
+	ops.push_back(new zkutil::Op::Create(zookeeper_path + "/metadata", metadata.str(),
+										 zookeeper->getDefaultACL(), zkutil::CreateMode::Persistent));
+	ops.push_back(new zkutil::Op::Create(zookeeper_path + "/columns", data.getColumnsList().toString(),
+										 zookeeper->getDefaultACL(), zkutil::CreateMode::Persistent));
+	ops.push_back(new zkutil::Op::Create(zookeeper_path + "/log", "",
+										 zookeeper->getDefaultACL(), zkutil::CreateMode::Persistent));
+	ops.push_back(new zkutil::Op::Create(zookeeper_path + "/blocks", "",
+										 zookeeper->getDefaultACL(), zkutil::CreateMode::Persistent));
+	ops.push_back(new zkutil::Op::Create(zookeeper_path + "/block_numbers", "",
+										 zookeeper->getDefaultACL(), zkutil::CreateMode::Persistent));
+	ops.push_back(new zkutil::Op::Create(zookeeper_path + "/nonincrement_block_numbers", "",
+										 zookeeper->getDefaultACL(), zkutil::CreateMode::Persistent));
+	ops.push_back(new zkutil::Op::Create(zookeeper_path + "/leader_election", "",
+										 zookeeper->getDefaultACL(), zkutil::CreateMode::Persistent));
+	ops.push_back(new zkutil::Op::Create(zookeeper_path + "/temp", "",
+										 zookeeper->getDefaultACL(), zkutil::CreateMode::Persistent));
+	ops.push_back(new zkutil::Op::Create(zookeeper_path + "/replicas", "",
+										 zookeeper->getDefaultACL(), zkutil::CreateMode::Persistent));
 
-	zookeeper->create(zookeeper_path + "/log", "", zkutil::CreateMode::Persistent);
-	zookeeper->create(zookeeper_path + "/blocks", "", zkutil::CreateMode::Persistent);
-	zookeeper->create(zookeeper_path + "/block_numbers", "", zkutil::CreateMode::Persistent);
-	zookeeper->create(zookeeper_path + "/nonincrement_block_numbers", "", zkutil::CreateMode::Persistent);
-	zookeeper->create(zookeeper_path + "/leader_election", "", zkutil::CreateMode::Persistent);
-	zookeeper->create(zookeeper_path + "/temp", "", zkutil::CreateMode::Persistent);
-	zookeeper->create(zookeeper_path + "/flags", "", zkutil::CreateMode::Persistent);
-	/// Создадим replicas в последнюю очередь, чтобы нельзя было добавить реплику, пока все остальные ноды не созданы.
-	zookeeper->create(zookeeper_path + "/replicas", "", zkutil::CreateMode::Persistent);
+	auto code = zookeeper->tryMulti(ops);
+	if (code != ZOK && code != ZNODEEXISTS)
+		throw zkutil::KeeperException(code);
 }
 
 /** Проверить, что список столбцов и настройки таблицы совпадают с указанными в ZK (/metadata).
 	* Если нет - бросить исключение.
 	*/
-void StorageReplicatedMergeTree::checkTableStructure(bool skip_sanity_checks)
+void StorageReplicatedMergeTree::checkTableStructure(bool skip_sanity_checks, bool allow_alter)
 {
 	String metadata_str = zookeeper->get(zookeeper_path + "/metadata");
 	ReadBufferFromString buf(metadata_str);
@@ -209,7 +234,7 @@ void StorageReplicatedMergeTree::checkTableStructure(bool skip_sanity_checks)
 	columns_version = stat.version;
 	if (columns != data.getColumnsList())
 	{
-		if (data.getColumnsList().sizeOfDifference(columns) <= 2 || skip_sanity_checks)
+		if (allow_alter && (data.getColumnsList().sizeOfDifference(columns) <= 2 || skip_sanity_checks))
 		{
 			LOG_WARNING(log, "Table structure in ZooKeeper is a little different from local table structure. Assuming ALTER.");
 
@@ -219,7 +244,7 @@ void StorageReplicatedMergeTree::checkTableStructure(bool skip_sanity_checks)
 		}
 		else
 		{
-			throw Exception("Table structure in ZooKeeper is very different from local table structure.",
+			throw Exception("Table structure in ZooKeeper is too different from local table structure.",
 							ErrorCodes::INCOMPATIBLE_COLUMNS);
 		}
 	}
@@ -229,80 +254,120 @@ void StorageReplicatedMergeTree::createReplica()
 {
 	LOG_DEBUG(log, "Creating replica " << replica_path);
 
-	/** Запомним список других реплик.
-	  * NOTE: Здесь есть race condition. Если почти одновременно добавить нескольких реплик, сразу же начиная в них писать,
-	  *       небольшая часть данных может не реплицироваться.
-	  */
-	Strings replicas = zookeeper->getChildren(zookeeper_path + "/replicas");
-
-	/// Создадим пустую реплику.
-	zookeeper->create(replica_path, "", zkutil::CreateMode::Persistent);
-	zookeeper->create(replica_path + "/columns", data.getColumnsList().toString(), zkutil::CreateMode::Persistent);
-	zookeeper->create(replica_path + "/host", "", zkutil::CreateMode::Persistent);
-	zookeeper->create(replica_path + "/log_pointer", "", zkutil::CreateMode::Persistent);
-	zookeeper->create(replica_path + "/queue", "", zkutil::CreateMode::Persistent);
-	zookeeper->create(replica_path + "/parts", "", zkutil::CreateMode::Persistent);
+	/// Создадим пустую реплику. Ноду columns создадим в конце - будем использовать ее в качестве признака, что создание реплики завершено.
+	zkutil::Ops ops;
+	ops.push_back(new zkutil::Op::Create(replica_path, "", zookeeper->getDefaultACL(), zkutil::CreateMode::Persistent));
+	ops.push_back(new zkutil::Op::Create(replica_path + "/host", "", zookeeper->getDefaultACL(), zkutil::CreateMode::Persistent));
+	ops.push_back(new zkutil::Op::Create(replica_path + "/log_pointer", "", zookeeper->getDefaultACL(), zkutil::CreateMode::Persistent));
+	ops.push_back(new zkutil::Op::Create(replica_path + "/queue", "", zookeeper->getDefaultACL(), zkutil::CreateMode::Persistent));
+	ops.push_back(new zkutil::Op::Create(replica_path + "/parts", "", zookeeper->getDefaultACL(), zkutil::CreateMode::Persistent));
+	ops.push_back(new zkutil::Op::Create(replica_path + "/flags", "", zookeeper->getDefaultACL(), zkutil::CreateMode::Persistent));
+	zookeeper->multi(ops);
 
 	/** Нужно изменить данные ноды /replicas на что угодно, чтобы поток, удаляющий старые записи в логе,
 	  *  споткнулся об это изменение и не удалил записи, которые мы еще не прочитали.
 	  */
 	zookeeper->set(zookeeper_path + "/replicas", "last added replica: " + replica_name);
 
-	if (replicas.empty())
+	Strings replicas = zookeeper->getChildren(zookeeper_path + "/replicas");
+
+	/** "Эталонная" реплика, у которой мы возьмем информацию о множестве кусков, очередь и указатель на лог.
+	  * Возьмем случайную из реплик, созданных раньше этой.
+	  */
+	String source_replica;
+
+	Stat stat;
+	zookeeper->exists(replica_path, &stat);
+	auto my_create_time = stat.czxid;
+
+	std::random_shuffle(replicas.begin(), replicas.end());
+	for (const String & replica : replicas)
 	{
-		LOG_DEBUG(log, "No other replicas");
-		return;
+		if (!zookeeper->exists(zookeeper_path + "/replicas/" + replica, &stat))
+			throw Exception("Replica " + zookeeper_path + "/replicas/" + replica + " was removed from right under our feet.",
+							ErrorCodes::NO_SUCH_REPLICA);
+		if (stat.czxid < my_create_time)
+		{
+			source_replica = replica;
+			break;
+		}
 	}
 
-	/// "Эталонная" реплика, у которой мы возьмем информацию о множестве кусков, очередь и указатель на лог.
-	String source_replica = replicas[rand() % replicas.size()];
-
-	LOG_INFO(log, "Will mimic " << source_replica);
-
-	String source_path = zookeeper_path + "/replicas/" + source_replica;
-
-	/// Порядок следующих трех действий важен. Записи в логе могут продублироваться, но не могут потеряться.
-
-	/// Скопируем у эталонной реплики ссылку на лог.
-	zookeeper->set(replica_path + "/log_pointer", zookeeper->get(source_path + "/log_pointer"));
-
-	/// Запомним очередь эталонной реплики.
-	Strings source_queue_names = zookeeper->getChildren(source_path + "/queue");
-	std::sort(source_queue_names.begin(), source_queue_names.end());
-	Strings source_queue;
-	for (const String & entry_name : source_queue_names)
+	if (source_replica.empty())
 	{
-		String entry;
-		if (!zookeeper->tryGet(source_path + "/queue/" + entry_name, entry))
-			continue;
-		source_queue.push_back(entry);
+		LOG_INFO(log, "This is the first replica");
+	}
+	else
+	{
+		LOG_INFO(log, "Will mimic " << source_replica);
+
+		String source_path = zookeeper_path + "/replicas/" + source_replica;
+
+		/** Если эталонная реплика еще не до конца создана, подождем.
+		  * NOTE: Если при ее создании что-то пошло не так, можем провисеть тут вечно.
+		  *       Можно создавать на время создания эфемерную ноду, чтобы быть уверенным, что реплика создается, а не заброшена.
+		  *       То же можно делать и для таблицы. Можно автоматически удалять ноду реплики/таблицы,
+		  *        если видно, что она создана не до конца, а создающий ее умер.
+		  */
+		while (!zookeeper->exists(source_path + "/columns"))
+		{
+			LOG_INFO(log, "Waiting for replica " << source_path << " to be fully created");
+
+			zkutil::EventPtr event = new Poco::Event;
+			if (zookeeper->exists(source_path + "/columns", nullptr, event))
+			{
+				LOG_WARNING(log, "Oops, a watch has leaked");
+				break;
+			}
+
+			event->wait();
+		}
+
+		/// Порядок следующих трех действий важен. Записи в логе могут продублироваться, но не могут потеряться.
+
+		/// Скопируем у эталонной реплики ссылку на лог.
+		zookeeper->set(replica_path + "/log_pointer", zookeeper->get(source_path + "/log_pointer"));
+
+		/// Запомним очередь эталонной реплики.
+		Strings source_queue_names = zookeeper->getChildren(source_path + "/queue");
+		std::sort(source_queue_names.begin(), source_queue_names.end());
+		Strings source_queue;
+		for (const String & entry_name : source_queue_names)
+		{
+			String entry;
+			if (!zookeeper->tryGet(source_path + "/queue/" + entry_name, entry))
+				continue;
+			source_queue.push_back(entry);
+		}
+
+		/// Добавим в очередь задания на получение всех активных кусков, которые есть у эталонной реплики.
+		Strings parts = zookeeper->getChildren(source_path + "/parts");
+		ActiveDataPartSet active_parts_set;
+		for (const String & part : parts)
+		{
+			active_parts_set.add(part);
+		}
+		Strings active_parts = active_parts_set.getParts();
+		for (const String & name : active_parts)
+		{
+			LogEntry log_entry;
+			log_entry.type = LogEntry::GET_PART;
+			log_entry.source_replica = "";
+			log_entry.new_part_name = name;
+
+			zookeeper->create(replica_path + "/queue/queue-", log_entry.toString(), zkutil::CreateMode::PersistentSequential);
+		}
+		LOG_DEBUG(log, "Queued " << active_parts.size() << " parts to be fetched");
+
+		/// Добавим в очередь содержимое очереди эталонной реплики.
+		for (const String & entry : source_queue)
+		{
+			zookeeper->create(replica_path + "/queue/queue-", entry, zkutil::CreateMode::PersistentSequential);
+		}
+		LOG_DEBUG(log, "Copied " << source_queue.size() << " queue entries");
 	}
 
-	/// Добавим в очередь задания на получение всех активных кусков, которые есть у эталонной реплики.
-	Strings parts = zookeeper->getChildren(source_path + "/parts");
-	ActiveDataPartSet active_parts_set;
-	for (const String & part : parts)
-	{
-		active_parts_set.add(part);
-	}
-	Strings active_parts = active_parts_set.getParts();
-	for (const String & name : active_parts)
-	{
-		LogEntry log_entry;
-		log_entry.type = LogEntry::GET_PART;
-		log_entry.source_replica = "";
-		log_entry.new_part_name = name;
-
-		zookeeper->create(replica_path + "/queue/queue-", log_entry.toString(), zkutil::CreateMode::PersistentSequential);
-	}
-	LOG_DEBUG(log, "Queued " << active_parts.size() << " parts to be fetched");
-
-	/// Добавим в очередь содержимое очереди эталонной реплики.
-	for (const String & entry : source_queue)
-	{
-		zookeeper->create(replica_path + "/queue/queue-", entry, zkutil::CreateMode::PersistentSequential);
-	}
-	LOG_DEBUG(log, "Copied " << source_queue.size() << " queue entries");
+	zookeeper->create(replica_path + "/columns", data.getColumnsList().toString(), zkutil::CreateMode::Persistent);
 }
 
 void StorageReplicatedMergeTree::activateReplica()
@@ -386,6 +451,7 @@ void StorageReplicatedMergeTree::checkParts(bool skip_sanity_checks)
 		}
 		else
 		{
+			LOG_ERROR(log, "Fetching missing part " << missing_name);
 			parts_to_fetch.push_back(missing_name);
 		}
 	}
@@ -399,10 +465,10 @@ void StorageReplicatedMergeTree::checkParts(bool skip_sanity_checks)
 					 + toString(expected_parts.size()) + " missing obsolete parts, "
 					 + toString(parts_to_fetch.size()) + " missing parts";
 	bool insane =
-		parts_to_add.size() > 2 ||
-		unexpected_parts.size() > 2 ||
-		expected_parts.size() > 20 ||
-		parts_to_fetch.size() > 2;
+		parts_to_add.size() > data.settings.replicated_max_unexpectedly_merged_parts ||
+		unexpected_parts.size() > data.settings.replicated_max_unexpected_parts ||
+		expected_parts.size() > data.settings.replicated_max_missing_obsolete_parts ||
+		parts_to_fetch.size() > data.settings.replicated_max_missing_active_parts;
 
 	if (insane && !skip_sanity_checks)
 	{
@@ -475,8 +541,11 @@ void StorageReplicatedMergeTree::initVirtualParts()
 	}
 }
 
-void StorageReplicatedMergeTree::checkPartAndAddToZooKeeper(MergeTreeData::DataPartPtr part, zkutil::Ops & ops)
+void StorageReplicatedMergeTree::checkPartAndAddToZooKeeper(MergeTreeData::DataPartPtr part, zkutil::Ops & ops, String part_name)
 {
+	if (part_name.empty())
+		part_name = part->name;
+
 	check(part->columns);
 	int expected_columns_version = columns_version;
 
@@ -488,22 +557,22 @@ void StorageReplicatedMergeTree::checkPartAndAddToZooKeeper(MergeTreeData::DataP
 	{
 		zkutil::Stat stat_before, stat_after;
 		String columns_str;
-		if (!zookeeper->tryGet(zookeeper_path + "/replicas/" + replica + "/parts/" + part->name + "/columns", columns_str, &stat_before))
+		if (!zookeeper->tryGet(zookeeper_path + "/replicas/" + replica + "/parts/" + part_name + "/columns", columns_str, &stat_before))
 			continue;
 		if (columns_str != expected_columns_str)
 		{
-			LOG_INFO(log, "Not checking checksums of part " << part->name << " with replica " << replica
+			LOG_INFO(log, "Not checking checksums of part " << part_name << " with replica " << replica
 				<< " because columns are different");
 			continue;
 		}
 		String checksums_str;
 		/// Проверим, что версия ноды со столбцами не изменилась, пока мы читали checksums.
 		/// Это гарантирует, что столбцы и чексуммы относятся к одним и тем же данным.
-		if (!zookeeper->tryGet(zookeeper_path + "/replicas/" + replica + "/parts/" + part->name + "/checksums", checksums_str) ||
-			!zookeeper->exists(zookeeper_path + "/replicas/" + replica + "/parts/" + part->name + "/columns", &stat_after) ||
+		if (!zookeeper->tryGet(zookeeper_path + "/replicas/" + replica + "/parts/" + part_name + "/checksums", checksums_str) ||
+			!zookeeper->exists(zookeeper_path + "/replicas/" + replica + "/parts/" + part_name + "/columns", &stat_after) ||
 			stat_before.version != stat_after.version)
 		{
-			LOG_INFO(log, "Not checking checksums of part " << part->name << " with replica " << replica
+			LOG_INFO(log, "Not checking checksums of part " << part_name << " with replica " << replica
 				<< " because part changed while we were reading its checksums");
 			continue;
 		}
@@ -512,9 +581,9 @@ void StorageReplicatedMergeTree::checkPartAndAddToZooKeeper(MergeTreeData::DataP
 		checksums.checkEqual(part->checksums, true);
 	}
 
-	if (zookeeper->exists(replica_path + "/parts/" + part->name))
+	if (zookeeper->exists(replica_path + "/parts/" + part_name))
 	{
-		LOG_ERROR(log, "checkPartAndAddToZooKeeper: node " << replica_path + "/parts/" + part->name << " already exists");
+		LOG_ERROR(log, "checkPartAndAddToZooKeeper: node " << replica_path + "/parts/" + part_name << " already exists");
 		return;
 	}
 
@@ -522,17 +591,17 @@ void StorageReplicatedMergeTree::checkPartAndAddToZooKeeper(MergeTreeData::DataP
 		zookeeper_path + "/columns",
 		expected_columns_version));
 	ops.push_back(new zkutil::Op::Create(
-		replica_path + "/parts/" + part->name,
+		replica_path + "/parts/" + part_name,
 		"",
 		zookeeper->getDefaultACL(),
 		zkutil::CreateMode::Persistent));
 	ops.push_back(new zkutil::Op::Create(
-		replica_path + "/parts/" + part->name + "/columns",
+		replica_path + "/parts/" + part_name + "/columns",
 		part->columns.toString(),
 		zookeeper->getDefaultACL(),
 		zkutil::CreateMode::Persistent));
 	ops.push_back(new zkutil::Op::Create(
-		replica_path + "/parts/" + part->name + "/checksums",
+		replica_path + "/parts/" + part_name + "/checksums",
 		part->checksums.toString(),
 		zookeeper->getDefaultACL(),
 		zkutil::CreateMode::Persistent));
@@ -673,23 +742,23 @@ void StorageReplicatedMergeTree::clearOldBlocks()
 
 void StorageReplicatedMergeTree::loadQueue()
 {
-	Poco::ScopedLock<Poco::FastMutex> lock(queue_mutex);
+	std::unique_lock<std::mutex> lock(queue_mutex);
 
 	Strings children = zookeeper->getChildren(replica_path + "/queue");
 	std::sort(children.begin(), children.end());
 	for (const String & child : children)
 	{
 		String s = zookeeper->get(replica_path + "/queue/" + child);
-		LogEntry entry = LogEntry::parse(s);
-		entry.znode_name = child;
-		entry.addResultToVirtualParts(*this);
+		LogEntryPtr entry = LogEntry::parse(s);
+		entry->znode_name = child;
+		entry->addResultToVirtualParts(*this);
 		queue.push_back(entry);
 	}
 }
 
 void StorageReplicatedMergeTree::pullLogsToQueue(zkutil::EventPtr next_update_event)
 {
-	Poco::ScopedLock<Poco::FastMutex> lock(queue_mutex);
+	std::unique_lock<std::mutex> lock(queue_mutex);
 
 	String index_str = zookeeper->get(replica_path + "/log_pointer");
 	UInt64 index;
@@ -716,7 +785,7 @@ void StorageReplicatedMergeTree::pullLogsToQueue(zkutil::EventPtr next_update_ev
 		++count;
 		++index;
 
-		LogEntry entry = LogEntry::parse(entry_str);
+		LogEntryPtr entry = LogEntry::parse(entry_str);
 
 		/// Одновременно добавим запись в очередь и продвинем указатель на лог.
 		zkutil::Ops ops;
@@ -727,8 +796,8 @@ void StorageReplicatedMergeTree::pullLogsToQueue(zkutil::EventPtr next_update_ev
 		auto results = zookeeper->multi(ops);
 
 		String path_created = dynamic_cast<zkutil::Op::Create &>(ops[0]).getPathCreated();
-		entry.znode_name = path_created.substr(path_created.find_last_of('/') + 1);
-		entry.addResultToVirtualParts(*this);
+		entry->znode_name = path_created.substr(path_created.find_last_of('/') + 1);
+		entry->addResultToVirtualParts(*this);
 		queue.push_back(entry);
 	}
 
@@ -749,7 +818,8 @@ void StorageReplicatedMergeTree::pullLogsToQueue(zkutil::EventPtr next_update_ev
 
 bool StorageReplicatedMergeTree::shouldExecuteLogEntry(const LogEntry & entry)
 {
-	if ((entry.type == LogEntry::MERGE_PARTS || entry.type == LogEntry::GET_PART) && future_parts.count(entry.new_part_name))
+	if ((entry.type == LogEntry::MERGE_PARTS || entry.type == LogEntry::GET_PART || entry.type == LogEntry::ATTACH_PART)
+		&& future_parts.count(entry.new_part_name))
 	{
 		LOG_DEBUG(log, "Not executing log entry for part " << entry.new_part_name <<
 			" because another log entry for the same part is being processed. This shouldn't happen often.");
@@ -778,8 +848,15 @@ bool StorageReplicatedMergeTree::shouldExecuteLogEntry(const LogEntry & entry)
 
 bool StorageReplicatedMergeTree::executeLogEntry(const LogEntry & entry, BackgroundProcessingPool::Context & pool_context)
 {
+	if (entry.type == LogEntry::DROP_RANGE)
+	{
+		executeDropRange(entry);
+		return true;
+	}
+
 	if (entry.type == LogEntry::GET_PART ||
-		entry.type == LogEntry::MERGE_PARTS)
+		entry.type == LogEntry::MERGE_PARTS ||
+		entry.type == LogEntry::ATTACH_PART)
 	{
 		/// Если у нас уже есть этот кусок или покрывающий его кусок, ничего делать не нужно.
 		MergeTreeData::DataPartPtr containing_part = data.getActiveContainingPart(entry.new_part_name);
@@ -802,6 +879,10 @@ bool StorageReplicatedMergeTree::executeLogEntry(const LogEntry & entry, Backgro
 	{
 		do_fetch = true;
 	}
+	else if (entry.type == LogEntry::ATTACH_PART)
+	{
+		do_fetch = !executeAttachPart(entry);
+	}
 	else if (entry.type == LogEntry::MERGE_PARTS)
 	{
 		MergeTreeData::DataPartsVector parts;
@@ -816,8 +897,8 @@ bool StorageReplicatedMergeTree::executeLogEntry(const LogEntry & entry, Backgro
 			}
 			if (part->name != name)
 			{
-				LOG_ERROR(log, "Log and parts set look inconsistent: " << name << " is covered by " << part->name
-					<< " but should be merged into " << entry.new_part_name);
+				LOG_WARNING(log, "Part " << name << " is covered by " << part->name
+					<< " but should be merged into " << entry.new_part_name << ". This shouldn't happen often.");
 				have_all_parts = false;
 				break;
 			}
@@ -851,6 +932,10 @@ bool StorageReplicatedMergeTree::executeLogEntry(const LogEntry & entry, Backgro
 			zkutil::Ops ops;
 			checkPartAndAddToZooKeeper(part, ops);
 
+			/** TODO: Переименование нового куска лучше делать здесь, а не пятью строчками выше,
+			  *  чтобы оно было как можно ближе к zookeeper->multi.
+			  */
+
 			zookeeper->multi(ops);
 
 			/** При ZCONNECTIONLOSS или ZOPERATIONTIMEOUT можем зря откатить локальные изменения кусков.
@@ -893,19 +978,19 @@ bool StorageReplicatedMergeTree::executeLogEntry(const LogEntry & entry, Backgro
 			  */
 			try
 			{
-				Poco::ScopedLock<Poco::FastMutex> lock(queue_mutex);
+				std::unique_lock<std::mutex> lock(queue_mutex);
 
 				/// Найдем действие по объединению этого куска с другими. Запомним других.
 				StringSet parts_for_merge;
 				LogEntries::iterator merge_entry;
 				for (LogEntries::iterator it = queue.begin(); it != queue.end(); ++it)
 				{
-					if (it->type == LogEntry::MERGE_PARTS)
+					if ((*it)->type == LogEntry::MERGE_PARTS)
 					{
-						if (std::find(it->parts_to_merge.begin(), it->parts_to_merge.end(), entry.new_part_name)
-							!= it->parts_to_merge.end())
+						if (std::find((*it)->parts_to_merge.begin(), (*it)->parts_to_merge.end(), entry.new_part_name)
+							!= (*it)->parts_to_merge.end())
 						{
-							parts_for_merge = StringSet(it->parts_to_merge.begin(), it->parts_to_merge.end());
+							parts_for_merge = StringSet((*it)->parts_to_merge.begin(), (*it)->parts_to_merge.end());
 							merge_entry = it;
 							break;
 						}
@@ -923,8 +1008,8 @@ bool StorageReplicatedMergeTree::executeLogEntry(const LogEntry & entry, Backgro
 						if (it0 == merge_entry)
 							break;
 
-						if ((it0->type == LogEntry::MERGE_PARTS || it0->type == LogEntry::GET_PART)
-							&& parts_for_merge.count(it0->new_part_name))
+						if (((*it0)->type == LogEntry::MERGE_PARTS || (*it0)->type == LogEntry::GET_PART)
+							&& parts_for_merge.count((*it0)->new_part_name))
 						{
 							queue.splice(queue.end(), queue, it0, it);
 						}
@@ -956,6 +1041,136 @@ bool StorageReplicatedMergeTree::executeLogEntry(const LogEntry & entry, Backgro
 	return true;
 }
 
+void StorageReplicatedMergeTree::executeDropRange(const StorageReplicatedMergeTree::LogEntry & entry)
+{
+	LOG_INFO(log, (entry.detach ? "Detaching" : "Removing") << " parts inside " << entry.new_part_name << ".");
+
+	{
+		LogEntries to_wait;
+		size_t removed_entries = 0;
+
+		/// Удалим из очереди операции с кусками, содержащимися в удаляемом диапазоне.
+		std::unique_lock<std::mutex> lock(queue_mutex);
+		for (LogEntries::iterator it = queue.begin(); it != queue.end();)
+		{
+			if (((*it)->type == LogEntry::GET_PART || (*it)->type == LogEntry::MERGE_PARTS) &&
+				ActiveDataPartSet::contains(entry.new_part_name, (*it)->new_part_name))
+			{
+				if ((*it)->currently_executing)
+					to_wait.push_back(*it);
+				auto code = zookeeper->tryRemove(replica_path + "/queue/" + (*it)->znode_name);
+				if (code != ZOK)
+					LOG_INFO(log, "Couldn't remove " << replica_path + "/queue/" + (*it)->znode_name << ": "
+						<< zkutil::ZooKeeper::error2string(code));
+				queue.erase(it++);
+				++removed_entries;
+			}
+			else
+				++it;
+		}
+
+		LOG_DEBUG(log, "Removed " << removed_entries << " entries from queue. "
+			"Waiting for " << to_wait.size() << " entries that are currently executing.");
+
+		/// Дождемся завершения операций с кусками, содержащимися в удаляемом диапазоне.
+		for (LogEntryPtr & entry : to_wait)
+			entry->execution_complete.wait(lock, [&entry] { return !entry->currently_executing; });
+	}
+
+	LOG_DEBUG(log, (entry.detach ? "Detaching" : "Removing") << " parts.");
+	size_t removed_parts = 0;
+
+	/// Удалим куски, содержащиеся в удаляемом диапазоне.
+	auto parts = data.getDataParts();
+	for (const auto & part : parts)
+	{
+		if (!ActiveDataPartSet::contains(entry.new_part_name, part->name))
+			continue;
+		LOG_DEBUG(log, "Removing part " << part->name);
+		++removed_parts;
+
+		/// Если кусок удалять не нужно, надежнее переместить директорию до изменений в ZooKeeper.
+		if (entry.detach)
+			data.renameAndDetachPart(part);
+
+		zkutil::Ops ops;
+		ops.push_back(new zkutil::Op::Remove(replica_path + "/parts/" + part->name + "/columns", -1));
+		ops.push_back(new zkutil::Op::Remove(replica_path + "/parts/" + part->name + "/checksums", -1));
+		ops.push_back(new zkutil::Op::Remove(replica_path + "/parts/" + part->name, -1));
+		zookeeper->multi(ops);
+
+		/// Если кусок нужно удалить, надежнее удалить директорию после изменений в ZooKeeper.
+		if (!entry.detach)
+			data.replaceParts({part}, {}, true);
+	}
+
+	LOG_INFO(log, (entry.detach ? "Detached " : "Removed ") << removed_parts << " parts inside " << entry.new_part_name << ".");
+
+	if (unreplicated_data)
+	{
+		Poco::ScopedLock<Poco::FastMutex> unreplicated_lock(unreplicated_mutex);
+
+		removed_parts = 0;
+		parts = unreplicated_data->getDataParts();
+		for (const auto & part : parts)
+		{
+			if (!ActiveDataPartSet::contains(entry.new_part_name, part->name))
+				continue;
+			LOG_DEBUG(log, "Removing unreplicated part " << part->name);
+			++removed_parts;
+
+			if (entry.detach)
+				unreplicated_data->renameAndDetachPart(part, "");
+			else
+				unreplicated_data->replaceParts({part}, {}, false);
+		}
+	}
+}
+
+bool StorageReplicatedMergeTree::executeAttachPart(const StorageReplicatedMergeTree::LogEntry & entry)
+{
+	String source_path = (entry.attach_unreplicated ? "unreplicated/" : "detached/") + entry.source_part_name;
+
+	LOG_INFO(log, "Attaching part " << entry.source_part_name << " from " << source_path << " as " << entry.new_part_name);
+
+	if (!Poco::File(data.getFullPath() + source_path).exists())
+	{
+		LOG_INFO(log, "No part at " << source_path << ". Will fetch it instead");
+		return false;
+	}
+
+	LOG_DEBUG(log, "Checking data");
+	MergeTreeData::MutableDataPartPtr part = data.loadPartAndFixMetadata(source_path);
+
+	zkutil::Ops ops;
+	checkPartAndAddToZooKeeper(part, ops, entry.new_part_name);
+
+	if (entry.attach_unreplicated && unreplicated_data)
+	{
+		MergeTreeData::DataPartPtr unreplicated_part = unreplicated_data->getPartIfExists(entry.source_part_name);
+		if (unreplicated_part)
+			unreplicated_data->detachPartInPlace(unreplicated_part);
+		else
+			LOG_WARNING(log, "Unreplicated part " << entry.source_part_name << " is already detached");
+	}
+
+	zookeeper->multi(ops);
+
+	/// NOTE: Не можем использовать renameTempPartAndAdd, потому что кусок не временный - если что-то пойдет не так, его не нужно удалять.
+	part->renameTo(entry.new_part_name);
+	part->name = entry.new_part_name;
+	ActiveDataPartSet::parsePartName(part->name, *part);
+
+	data.attachPart(part);
+
+	LOG_INFO(log, "Finished attaching part " << entry.new_part_name);
+
+	/// На месте удаленных кусков могут появиться новые, с другими данными.
+	context.resetCaches();
+
+	return true;
+}
+
 void StorageReplicatedMergeTree::queueUpdatingThread()
 {
 	while (!shutdown_called)
@@ -966,6 +1181,15 @@ void StorageReplicatedMergeTree::queueUpdatingThread()
 
 			queue_updating_event->wait();
 		}
+		catch (zkutil::KeeperException & e)
+		{
+			if (e.code == ZINVALIDSTATE)
+				restarting_event.set();
+
+			tryLogCurrentException(__PRETTY_FUNCTION__);
+
+			queue_updating_event->tryWait(ERROR_SLEEP_MS);
+		}
 		catch (...)
 		{
 			tryLogCurrentException(__PRETTY_FUNCTION__);
@@ -979,23 +1203,22 @@ void StorageReplicatedMergeTree::queueUpdatingThread()
 
 bool StorageReplicatedMergeTree::queueTask(BackgroundProcessingPool::Context & pool_context)
 {
-	LogEntry entry;
-	bool have_work = false;
+	LogEntryPtr entry;
 
 	try
 	{
-		Poco::ScopedLock<Poco::FastMutex> lock(queue_mutex);
+		std::unique_lock<std::mutex> lock(queue_mutex);
 		bool empty = queue.empty();
 		if (!empty)
 		{
 			for (LogEntries::iterator it = queue.begin(); it != queue.end(); ++it)
 			{
-				if (shouldExecuteLogEntry(*it))
+				if (!(*it)->currently_executing && shouldExecuteLogEntry(**it))
 				{
 					entry = *it;
-					entry.tagPartAsFuture(*this);
-					queue.erase(it);
-					have_work = true;
+					entry->tagPartAsFuture(*this);
+					queue.splice(queue.end(), queue, it);
+					entry->currently_executing = true;
 					break;
 				}
 			}
@@ -1006,7 +1229,7 @@ bool StorageReplicatedMergeTree::queueTask(BackgroundProcessingPool::Context & p
 		tryLogCurrentException(__PRETTY_FUNCTION__);
 	}
 
-	if (!have_work)
+	if (!entry)
 		return false;
 
 	bool exception = true;
@@ -1014,14 +1237,15 @@ bool StorageReplicatedMergeTree::queueTask(BackgroundProcessingPool::Context & p
 
 	try
 	{
-		success = executeLogEntry(entry, pool_context);
-
-		if (success)
+		if (executeLogEntry(*entry, pool_context))
 		{
-			auto code = zookeeper->tryRemove(replica_path + "/queue/" + entry.znode_name);
+			auto code = zookeeper->tryRemove(replica_path + "/queue/" + entry->znode_name);
+
 			if (code != ZOK)
-				LOG_ERROR(log, "Couldn't remove " << replica_path + "/queue/" + entry.znode_name << ": "
-					<< zkutil::ZooKeeper::error2string(code) + ". There must be a bug somewhere. Ignoring it.");
+				LOG_ERROR(log, "Couldn't remove " << replica_path + "/queue/" + entry->znode_name << ": "
+					<< zkutil::ZooKeeper::error2string(code) + ". This shouldn't happen often.");
+
+			success = true;
 		}
 
 		exception = false;
@@ -1039,12 +1263,26 @@ bool StorageReplicatedMergeTree::queueTask(BackgroundProcessingPool::Context & p
 		tryLogCurrentException(__PRETTY_FUNCTION__);
 	}
 
-	if (!success)
+	entry->future_part_tagger = nullptr;
+
+	std::unique_lock<std::mutex> lock(queue_mutex);
+
+	entry->currently_executing = false;
+	entry->execution_complete.notify_all();
+
+	if (success)
 	{
-		/// Добавим действие, которое не получилось выполнить, в конец очереди.
-		entry.future_part_tagger = nullptr;
-		Poco::ScopedLock<Poco::FastMutex> lock(queue_mutex);
-		queue.push_back(entry);
+		/// Удалим задание из очереди.
+		/// Нельзя просто обратиться по заранее сохраненному итератору, потому что задание мог успеть удалить кто-то другой.
+		for (LogEntries::iterator it = queue.end(); it != queue.begin();)
+		{
+			--it;
+			if (*it == entry)
+			{
+				queue.erase(it);
+				break;
+			}
+		}
 	}
 
 	/// Если не было исключения, не нужно спать.
@@ -1061,6 +1299,8 @@ void StorageReplicatedMergeTree::mergeSelectingThread()
 
 		try
 		{
+			std::unique_lock<std::mutex> merge_selecting_lock(merge_selecting_mutex);
+
 			if (need_pull)
 			{
 				/// Нужно загрузить новую запись в очередь перед тем, как выбирать куски для слияния.
@@ -1075,17 +1315,17 @@ void StorageReplicatedMergeTree::mergeSelectingThread()
 
 			if (!has_big_merge)
 			{
-				Poco::ScopedLock<Poco::FastMutex> lock(queue_mutex);
+				std::unique_lock<std::mutex> lock(queue_mutex);
 
 				for (const auto & entry : queue)
 				{
-					if (entry.type == LogEntry::MERGE_PARTS)
+					if (entry->type == LogEntry::MERGE_PARTS)
 					{
 						++merges_queued;
 
 						if (!has_big_merge)
 						{
-							for (const String & name : entry.parts_to_merge)
+							for (const String & name : entry->parts_to_merge)
 							{
 								MergeTreeData::DataPartPtr part = data.getActiveContainingPart(name);
 								if (!part || part->name != name)
@@ -1118,6 +1358,20 @@ void StorageReplicatedMergeTree::mergeSelectingThread()
 												true, false, has_big_merge, can_merge))
 					break;
 
+				bool all_in_zk = true;
+				for (const auto & part : parts)
+				{
+					/// Если о каком-то из кусков нет информации в ZK, не будем сливать.
+					if (!zookeeper->exists(replica_path + "/parts/" + part->name))
+					{
+						LOG_WARNING(log, "Part " << part->name << " exists locally but not in ZooKeeper.");
+						enqueuePartForCheck(part->name);
+						all_in_zk = false;
+					}
+				}
+				if (!all_in_zk)
+					break;
+
 				LogEntry entry;
 				entry.type = LogEntry::MERGE_PARTS;
 				entry.source_replica = replica_name;
@@ -1170,6 +1424,9 @@ void StorageReplicatedMergeTree::cleanupThread()
 		{
 			clearOldParts();
 
+			if (unreplicated_data)
+				unreplicated_data->clearOldParts();
+
 			if (is_leader_node)
 			{
 				clearOldLogs();
@@ -1313,14 +1570,14 @@ void StorageReplicatedMergeTree::removePartAndEnqueueFetch(const String & part_n
 {
 	String part_path = replica_path + "/parts/" + part_name;
 
-	LogEntry log_entry;
-	log_entry.type = LogEntry::GET_PART;
-	log_entry.source_replica = "";
-	log_entry.new_part_name = part_name;
+	LogEntryPtr log_entry = new LogEntry;
+	log_entry->type = LogEntry::GET_PART;
+	log_entry->source_replica = "";
+	log_entry->new_part_name = part_name;
 
 	zkutil::Ops ops;
 	ops.push_back(new zkutil::Op::Create(
-		replica_path + "/queue/queue-", log_entry.toString(), zookeeper->getDefaultACL(),
+		replica_path + "/queue/queue-", log_entry->toString(), zookeeper->getDefaultACL(),
 		zkutil::CreateMode::PersistentSequential));
 	ops.push_back(new zkutil::Op::Remove(part_path + "/checksums", -1));
 	ops.push_back(new zkutil::Op::Remove(part_path + "/columns", -1));
@@ -1328,11 +1585,11 @@ void StorageReplicatedMergeTree::removePartAndEnqueueFetch(const String & part_n
 	auto results = zookeeper->multi(ops);
 
 	{
-		Poco::ScopedLock<Poco::FastMutex> lock(queue_mutex);
+		std::unique_lock<std::mutex> lock(queue_mutex);
 
 		String path_created = dynamic_cast<zkutil::Op::Create &>(ops[0]).getPathCreated();
-		log_entry.znode_name = path_created.substr(path_created.find_last_of('/') + 1);
-		log_entry.addResultToVirtualParts(*this);
+		log_entry->znode_name = path_created.substr(path_created.find_last_of('/') + 1);
+		log_entry->addResultToVirtualParts(*this);
 		queue.push_back(log_entry);
 	}
 }
@@ -1437,17 +1694,13 @@ void StorageReplicatedMergeTree::partCheckThread()
 							bool was_in_queue = false;
 
 							{
-								Poco::ScopedLock<Poco::FastMutex> lock(queue_mutex);
+								std::unique_lock<std::mutex> lock(queue_mutex);
 
-								/** NOTE: Не удалятся записи в очереди, которые сейчас выполняются.
-								* Они пофейлятся и положат кусок снова в очередь на проверку.
-								* Расчитываем, что это редкая ситуация.
-								*/
 								for (LogEntries::iterator it = queue.begin(); it != queue.end(); )
 								{
-									if (it->new_part_name == part_name)
+									if ((*it)->new_part_name == part_name)
 									{
-										zookeeper->remove(replica_path + "/queue/" + it->znode_name);
+										zookeeper->tryRemove(replica_path + "/queue/" + (*it)->znode_name);
 										queue.erase(it++);
 										was_in_queue = true;
 									}
@@ -1502,8 +1755,12 @@ void StorageReplicatedMergeTree::partCheckThread()
 						if (part->columns != zk_columns)
 							throw Exception("Columns of local part " + part_name + " are different from ZooKeeper");
 
+						MergeTreePartChecker::Settings settings;
+						settings.setIndexGranularity(data.index_granularity);
+						settings.setRequireChecksums(true);
+						settings.setRequireColumnFiles(true);
 						MergeTreePartChecker::checkDataPart(
-							data.getFullPath() + part_name, data.index_granularity, true, context.getDataTypeFactory());
+							data.getFullPath() + part_name, settings, context.getDataTypeFactory());
 
 						LOG_INFO(log, "Part " << part_name << " looks good.");
 					}
@@ -1521,7 +1778,9 @@ void StorageReplicatedMergeTree::partCheckThread()
 					}
 				}
 				/// Если куска нет в ZooKeeper, удалим его локально.
-				else
+				/// Возможно, кусок кто-то только что записал, и еще не успел добавить в ZK.
+				/// Поэтому удаляем только если кусок старый (не очень надежно).
+				else if (part->modification_time + 5 * 60 < time(0))
 				{
 					ProfileEvents::increment(ProfileEvents::ReplicatedPartChecksFailed);
 
@@ -1565,11 +1824,6 @@ bool StorageReplicatedMergeTree::canMergeParts(const MergeTreeData::DataPartPtr
 		virtual_parts.getContainingPart(right->name) != right->name)
 		return false;
 
-	/// Если о каком-то из кусков нет информации в ZK, не будем сливать.
-	if (!zookeeper->exists(replica_path + "/parts/" + left->name) ||
-		!zookeeper->exists(replica_path + "/parts/" + right->name))
-		return false;
-
 	String month_name = left->name.substr(0, 6);
 
 	/// Можно слить куски, если все номера между ними заброшены - не соответствуют никаким блокам.
@@ -1630,12 +1884,12 @@ void StorageReplicatedMergeTree::fetchPart(const String & part_name, const Strin
 
 	MergeTreeData::MutableDataPartPtr part = fetcher.fetchPart(part_name, zookeeper_path + "/replicas/" + replica_name, host, port);
 
+	zkutil::Ops ops;
+	checkPartAndAddToZooKeeper(part, ops, part_name);
+
 	MergeTreeData::Transaction transaction;
 	auto removed_parts = data.renameTempPartAndReplace(part, nullptr, &transaction);
 
-	zkutil::Ops ops;
-	checkPartAndAddToZooKeeper(part, ops);
-
 	zookeeper->multi(ops);
 	transaction.commit();
 	merge_selecting_event.set();
@@ -1661,7 +1915,7 @@ void StorageReplicatedMergeTree::shutdown()
 	}
 
 	permanent_shutdown_called = true;
-	permanent_shutdown_event.set();
+	restarting_event.set();
 	restarting_thread.join();
 
 	endpoint_holder = nullptr;
@@ -1704,44 +1958,67 @@ void StorageReplicatedMergeTree::partialShutdown()
 	LOG_TRACE(log, "Threads finished");
 }
 
-void StorageReplicatedMergeTree::goReadOnly()
+void StorageReplicatedMergeTree::goReadOnlyPermanently()
 {
 	LOG_INFO(log, "Going to read-only mode");
 
 	is_read_only = true;
 	permanent_shutdown_called = true;
-	permanent_shutdown_event.set();
+	restarting_event.set();
 
 	partialShutdown();
 }
 
-void StorageReplicatedMergeTree::startup()
+bool StorageReplicatedMergeTree::tryStartup()
 {
-	shutdown_called = false;
-	shutdown_event.reset();
+	try
+	{
+		activateReplica();
 
-	merger.uncancelAll();
-	if (unreplicated_merger)
-		unreplicated_merger->uncancelAll();
+		leader_election = new zkutil::LeaderElection(zookeeper_path + "/leader_election", *zookeeper,
+			std::bind(&StorageReplicatedMergeTree::becomeLeader, this), replica_name);
 
-	activateReplica();
+		/// Все, что выше, может бросить KeeperException, если что-то не так с ZK.
+		/// Все, что ниже, не должно бросать исключений.
 
-	leader_election = new zkutil::LeaderElection(zookeeper_path + "/leader_election", *zookeeper,
-		std::bind(&StorageReplicatedMergeTree::becomeLeader, this), replica_name);
+		shutdown_called = false;
+		shutdown_event.reset();
 
-	queue_updating_thread = std::thread(&StorageReplicatedMergeTree::queueUpdatingThread, this);
-	cleanup_thread = std::thread(&StorageReplicatedMergeTree::cleanupThread, this);
-	alter_thread = std::thread(&StorageReplicatedMergeTree::alterThread, this);
-	part_check_thread = std::thread(&StorageReplicatedMergeTree::partCheckThread, this);
-	queue_task_handle = context.getBackgroundPool().addTask(
-		std::bind(&StorageReplicatedMergeTree::queueTask, this, std::placeholders::_1));
+		merger.uncancelAll();
+		if (unreplicated_merger)
+			unreplicated_merger->uncancelAll();
+
+		queue_updating_thread = std::thread(&StorageReplicatedMergeTree::queueUpdatingThread, this);
+		cleanup_thread = std::thread(&StorageReplicatedMergeTree::cleanupThread, this);
+		alter_thread = std::thread(&StorageReplicatedMergeTree::alterThread, this);
+		part_check_thread = std::thread(&StorageReplicatedMergeTree::partCheckThread, this);
+		queue_task_handle = context.getBackgroundPool().addTask(
+			std::bind(&StorageReplicatedMergeTree::queueTask, this, std::placeholders::_1));
+		queue_task_handle->wake();
+		return true;
+	}
+	catch (zkutil::KeeperException & e)
+	{
+		replica_is_active_node = nullptr;
+		leader_election = nullptr;
+		LOG_ERROR(log, "Couldn't start replication: " << e.what() << ", " << e.displayText() << ", stack trace:\n"
+			<< e.getStackTrace().toString());
+		return false;
+	}
+	catch (...)
+	{
+		replica_is_active_node = nullptr;
+		leader_election = nullptr;
+		throw;
+	}
 }
 
 void StorageReplicatedMergeTree::restartingThread()
 {
 	try
 	{
-		startup();
+		while (!permanent_shutdown_called && !tryStartup())
+			restarting_event.tryWait(10 * 1000);
 
 		while (!permanent_shutdown_called)
 		{
@@ -1749,26 +2026,38 @@ void StorageReplicatedMergeTree::restartingThread()
 			{
 				LOG_WARNING(log, "ZooKeeper session has expired. Switching to a new session.");
 
-				/// Запретим писать в таблицу, пока подменяем zookeeper.
-				LOG_TRACE(log, "Locking INSERTs");
-				auto structure_lock = lockDataForAlter();
-				LOG_TRACE(log, "Locked INSERTs");
+				{
+					/// Запретим писать в таблицу, пока подменяем zookeeper.
+					auto structure_lock = lockDataForAlter();
 
-				partialShutdown();
+					partialShutdown();
 
-				zookeeper = context.getZooKeeper();
+					zookeeper = context.getZooKeeper();
 
-				startup();
+					is_read_only = true;
+				}
+
+				while (!permanent_shutdown_called && !tryStartup())
+					restarting_event.tryWait(10 * 1000);
+
+				if (permanent_shutdown_called)
+					break;
+
+				{
+					auto structure_lock = lockDataForAlter();
+
+					is_read_only = false;
+				}
 			}
 
-			permanent_shutdown_event.tryWait(60 * 1000);
+			restarting_event.tryWait(60 * 1000);
 		}
 	}
 	catch (...)
 	{
 		tryLogCurrentException("StorageReplicatedMergeTree::restartingThread");
-		LOG_ERROR(log, "Exception in restartingThread. The storage will be read-only until server restart.");
-		goReadOnly();
+		LOG_ERROR(log, "Unexpected exception in restartingThread. The storage will be read-only until server restart.");
+		goReadOnlyPermanently();
 		LOG_DEBUG(log, "restarting thread finished");
 		return;
 	}
@@ -1871,8 +2160,9 @@ BlockOutputStreamPtr StorageReplicatedMergeTree::write(ASTPtr query)
 		throw Exception("Table is in read only mode", ErrorCodes::TABLE_IS_READ_ONLY);
 
 	String insert_id;
-	if (ASTInsertQuery * insert = typeid_cast<ASTInsertQuery *>(&*query))
-		insert_id = insert->insert_id;
+	if (query)
+		if (ASTInsertQuery * insert = typeid_cast<ASTInsertQuery *>(&*query))
+			insert_id = insert->insert_id;
 
 	return new ReplicatedMergeTreeBlockOutputStream(*this, insert_id);
 }
@@ -1881,11 +2171,12 @@ bool StorageReplicatedMergeTree::optimize()
 {
 	/// Померджим какие-нибудь куски из директории unreplicated.
 	/// TODO: Мерджить реплицируемые куски тоже.
-	/// TODO: Не давать вызывать это из нескольких потоков сразу: один кусок может принять участие в нескольких несовместимых слияниях.
 
 	if (!unreplicated_data)
 		return false;
 
+	Poco::ScopedLock<Poco::FastMutex> lock(unreplicated_mutex);
+
 	unreplicated_data->clearOldParts();
 
 	MergeTreeData::DataPartsVector parts;
@@ -1898,7 +2189,8 @@ bool StorageReplicatedMergeTree::optimize()
 	return true;
 }
 
-void StorageReplicatedMergeTree::alter(const AlterCommands & params, const String & database_name, const String & table_name, Context & context)
+void StorageReplicatedMergeTree::alter(const AlterCommands & params,
+	const String & database_name, const String & table_name, Context & context)
 {
 	LOG_DEBUG(log, "Doing ALTER");
 
@@ -1910,6 +2202,9 @@ void StorageReplicatedMergeTree::alter(const AlterCommands & params, const Strin
 	{
 		auto table_lock = lockStructureForAlter();
 
+		if (is_read_only)
+			throw Exception("Can't ALTER read-only table", ErrorCodes::TABLE_IS_READ_ONLY);
+
 		data.checkAlter(params);
 
 		new_columns = data.getColumnsList();
@@ -1986,10 +2281,184 @@ void StorageReplicatedMergeTree::alter(const AlterCommands & params, const Strin
 	LOG_DEBUG(log, "ALTER finished");
 }
 
+static bool isValidMonthName(const String & s)
+{
+	if (s.size() != 6)
+		return false;
+	if (!std::all_of(s.begin(), s.end(), isdigit))
+		return false;
+	DayNum_t date = DateLUT::instance().toDayNum(OrderedIdentifier2Date(s + "01"));
+	/// Не можем просто сравнить date с нулем, потому что 0 тоже валидный DayNum.
+	return s == toString(Date2OrderedIdentifier(DateLUT::instance().fromDayNum(date)) / 100);
+}
+
+/// Название воображаемого куска, покрывающего все возможные куски в указанном месяце с номерами в указанном диапазоне.
+static String getFakePartNameForDrop(const String & month_name, UInt64 left, UInt64 right)
+{
+	/// Диапазон дат - весь месяц.
+	DateLUT & lut = DateLUT::instance();
+	time_t start_time = OrderedIdentifier2Date(month_name + "01");
+	DayNum_t left_date = lut.toDayNum(start_time);
+	DayNum_t right_date = DayNum_t(static_cast<size_t>(left_date) + lut.daysInMonth(start_time) - 1);
+
+	/// Уровень - right-left+1: кусок не мог образоваться в результате такого или большего количества слияний.
+	return ActiveDataPartSet::getPartName(left_date, right_date, left, right, right - left + 1);
+}
+
+void StorageReplicatedMergeTree::dropPartition(const Field & field, bool detach)
+{
+	String month_name = field.getType() == Field::Types::UInt64 ? toString(field.get<UInt64>()) : field.safeGet<String>();
+
+	if (!isValidMonthName(month_name))
+		throw Exception("Invalid partition format: " + month_name + ". Partition should consist of 6 digits: YYYYMM",
+						ErrorCodes::INVALID_PARTITION_NAME);
+
+	/// TODO: Делать запрос в лидера по TCP.
+	if (!is_leader_node)
+		throw Exception("DROP PARTITION can only be done on leader replica.", ErrorCodes::NOT_LEADER);
+
+
+	/** Пропустим один номер в block_numbers для удаляемого месяца, и будем удалять только куски до этого номера.
+	  * Это запретит мерджи удаляемых кусков с новыми вставляемыми данными.
+	  * Инвариант: в логе не появятся слияния удаляемых кусков с другими кусками.
+	  * NOTE: Если понадобится аналогично поддержать запрос DROP PART, для него придется придумать какой-нибудь новый механизм,
+	  *        чтобы гарантировать этот инвариант.
+	  */
+	UInt64 right;
+
+	{
+		AbandonableLockInZooKeeper block_number_lock = allocateBlockNumber(month_name);
+		right = block_number_lock.getNumber();
+		block_number_lock.unlock();
+	}
+
+	/// Такого никогда не должно происходить.
+	if (right == 0)
+		return;
+	--right;
+
+	String fake_part_name = getFakePartNameForDrop(month_name, 0, right);
+
+	/** Запретим выбирать для слияния удаляемые куски - сделаем вид, что их всех уже собираются слить в fake_part_name.
+	  * Инвариант: после появления в логе записи DROP_RANGE, в логе не появятся слияния удаляемых кусков.
+	  */
+	{
+		std::unique_lock<std::mutex> merge_selecting_lock(merge_selecting_mutex);
+
+		virtual_parts.add(fake_part_name);
+	}
+
+	/// Наконец, добившись нужных инвариантов, можно положить запись в лог.
+	LogEntry entry;
+	entry.type = LogEntry::DROP_RANGE;
+	entry.source_replica = replica_name;
+	entry.new_part_name = fake_part_name;
+	entry.detach = detach;
+	String log_znode_path = zookeeper->create(zookeeper_path + "/log/log-", entry.toString(), zkutil::CreateMode::PersistentSequential);
+	entry.znode_name = log_znode_path.substr(log_znode_path.find_last_of('/') + 1);
+
+	/// Дождемся, пока все реплики выполнят дроп.
+	waitForAllReplicasToProcessLogEntry(entry);
+}
+
+void StorageReplicatedMergeTree::attachPartition(const Field & field, bool unreplicated, bool attach_part)
+{
+	String partition = field.getType() == Field::Types::UInt64 ? toString(field.get<UInt64>()) : field.safeGet<String>();
+
+	if (!attach_part && !isValidMonthName(partition))
+		throw Exception("Invalid partition format: " + partition + ". Partition should consist of 6 digits: YYYYMM",
+						ErrorCodes::INVALID_PARTITION_NAME);
+
+	String source_dir = (unreplicated ? "unreplicated/" : "detached/");
+
+	/// Составим список кусков, которые нужно добавить.
+	Strings parts;
+	if (attach_part)
+	{
+		parts.push_back(partition);
+	}
+	else
+	{
+		LOG_DEBUG(log, "Looking for parts for partition " << partition << " in " << source_dir);
+		ActiveDataPartSet active_parts;
+		for (Poco::DirectoryIterator it = Poco::DirectoryIterator(full_path + source_dir); it != Poco::DirectoryIterator(); ++it)
+		{
+			String name = it.name();
+			if (!ActiveDataPartSet::isPartDirectory(name))
+				continue;
+			if (name.substr(0, partition.size()) != partition)
+				continue;
+			LOG_DEBUG(log, "Found part " << name);
+			active_parts.add(name);
+		}
+		LOG_DEBUG(log, active_parts.size() << " of them are active");
+		parts = active_parts.getParts();
+	}
+
+	/// Синхронно проверим, что добавляемые куски существуют и не испорчены хотя бы на этой реплике. Запишем checksums.txt, если его нет.
+	LOG_DEBUG(log, "Checking parts");
+	for (const String & part : parts)
+	{
+		LOG_DEBUG(log, "Checking part " << part);
+		data.loadPartAndFixMetadata(source_dir + part);
+	}
+
+	/// Выделим добавляемым кускам максимальные свободные номера, меньшие RESERVED_BLOCK_NUMBERS.
+	/// NOTE: Проверка свободности номеров никак не синхронизируется. Выполнять несколько запросов ATTACH/DETACH/DROP одновременно нельзя.
+	UInt64 min_used_number = RESERVED_BLOCK_NUMBERS;
+
+	{
+		auto existing_parts = data.getDataParts();
+		for (const auto & part : existing_parts)
+		{
+			min_used_number = std::min(min_used_number, part->left);
+		}
+	}
+
+	if (parts.size() > min_used_number)
+		throw Exception("Not enough free small block numbers for attaching parts: "
+			+ toString(parts.size()) + " needed, " + toString(min_used_number) + " available", ErrorCodes::NOT_ENOUGH_BLOCK_NUMBERS);
+
+	/// Добавим записи в лог.
+	std::reverse(parts.begin(), parts.end());
+	std::list<LogEntry> entries;
+	zkutil::Ops ops;
+	for (const String & part_name : parts)
+	{
+		ActiveDataPartSet::Part part;
+		ActiveDataPartSet::parsePartName(part_name, part);
+		part.left = part.right = --min_used_number;
+		String new_part_name = ActiveDataPartSet::getPartName(part.left_date, part.right_date, part.left, part.right, part.level);
+
+		LOG_INFO(log, "Will attach " << part_name << " as " << new_part_name);
+
+		entries.emplace_back();
+		LogEntry & entry = entries.back();
+		entry.type = LogEntry::ATTACH_PART;
+		entry.source_replica = replica_name;
+		entry.source_part_name = part_name;
+		entry.new_part_name = new_part_name;
+		entry.attach_unreplicated = unreplicated;
+		ops.push_back(new zkutil::Op::Create(
+			zookeeper_path + "/log/log-", entry.toString(), zookeeper->getDefaultACL(), zkutil::CreateMode::PersistentSequential));
+	}
+
+	LOG_DEBUG(log, "Adding attaches to log");
+	zookeeper->multi(ops);
+	size_t i = 0;
+	for (LogEntry & entry : entries)
+	{
+		String log_znode_path = dynamic_cast<zkutil::Op::Create &>(ops[i++]).getPathCreated();
+		entry.znode_name = log_znode_path.substr(log_znode_path.find_last_of('/') + 1);
+
+		waitForAllReplicasToProcessLogEntry(entry);
+	}
+}
+
 void StorageReplicatedMergeTree::drop()
 {
-	if (!zookeeper)
-		throw Exception("Can't drop replicated table without ZooKeeper", ErrorCodes::NO_ZOOKEEPER);
+	if (is_read_only)
+		throw Exception("Can't drop read-only replicated table (need to drop data in ZooKeeper as well)", ErrorCodes::TABLE_IS_READ_ONLY);
 
 	shutdown();
 
@@ -2023,6 +2492,95 @@ void StorageReplicatedMergeTree::rename(const String & new_path_to_db, const Str
 	/// TODO: Можно обновить названия логгеров.
 }
 
+AbandonableLockInZooKeeper StorageReplicatedMergeTree::allocateBlockNumber(const String & month_name)
+{
+	String month_path = zookeeper_path + "/block_numbers/" + month_name;
+	if (!zookeeper->exists(month_path))
+	{
+		/// Создадим в block_numbers ноду для месяца и пропустим в ней 200 значений инкремента.
+		/// Нужно, чтобы в будущем при необходимости можно было добавить данные в начало.
+		zkutil::Ops ops;
+		auto acl = zookeeper->getDefaultACL();
+		ops.push_back(new zkutil::Op::Create(month_path, "", acl, zkutil::CreateMode::Persistent));
+		for (size_t i = 0; i < RESERVED_BLOCK_NUMBERS; ++i)
+		{
+			ops.push_back(new zkutil::Op::Create(month_path + "/skip_increment", "", acl, zkutil::CreateMode::Persistent));
+			ops.push_back(new zkutil::Op::Remove(month_path + "/skip_increment", -1));
+		}
+		/// Игнорируем ошибки - не получиться могло только если кто-то еще выполнил эту строчку раньше нас.
+		zookeeper->tryMulti(ops);
+	}
+
+	return AbandonableLockInZooKeeper(
+		zookeeper_path + "/block_numbers/" + month_name + "/block-",
+		zookeeper_path + "/temp", *zookeeper);
+}
+
+void StorageReplicatedMergeTree::waitForAllReplicasToProcessLogEntry(const LogEntry & entry)
+{
+	LOG_DEBUG(log, "Waiting for all replicas to process " << entry.znode_name);
+
+	UInt64 log_index = parse<UInt64>(entry.znode_name.substr(entry.znode_name.size() - 10));
+	String log_entry_str = entry.toString();
+
+	Strings replicas = zookeeper->getChildren(zookeeper_path + "/replicas");
+	for (const String & replica : replicas)
+	{
+		LOG_DEBUG(log, "Waiting for " << replica << " to pull " << entry.znode_name << " to queue");
+
+		/// Дождемся, пока запись попадет в очередь реплики.
+		while (true)
+		{
+			zkutil::EventPtr event = new Poco::Event;
+
+			String pointer = zookeeper->get(zookeeper_path + "/replicas/" + replica + "/log_pointer", nullptr, event);
+			if (!pointer.empty() && parse<UInt64>(pointer) > log_index)
+				break;
+
+			event->wait();
+		}
+
+		LOG_DEBUG(log, "Looking for " << entry.znode_name << " in " << replica << " queue");
+
+		/// Найдем запись в очереди реплики.
+		Strings queue_entries = zookeeper->getChildren(zookeeper_path + "/replicas/" + replica + "/queue");
+		String entry_to_wait_for;
+
+		for (const String & entry_name : queue_entries)
+		{
+			String queue_entry_str;
+			bool exists = zookeeper->tryGet(zookeeper_path + "/replicas/" + replica + "/queue/" + entry_name, queue_entry_str);
+			if (exists && queue_entry_str == log_entry_str)
+			{
+				entry_to_wait_for = entry_name;
+				break;
+			}
+		}
+
+		/// Пока искали запись, ее уже выполнили и удалили.
+		if (entry_to_wait_for.empty())
+			continue;
+
+		LOG_DEBUG(log, "Waiting for " << entry_to_wait_for << " to disappear from " << replica << " queue");
+
+		/// Дождемся, пока запись исчезнет из очереди реплики.
+		while (true)
+		{
+			zkutil::EventPtr event = new Poco::Event;
+
+			String unused;
+			/// get вместо exists, чтобы не утек watch, если ноды уже нет.
+			if (!zookeeper->tryGet(zookeeper_path + "/replicas/" + replica + "/queue/" + entry_to_wait_for, unused, nullptr, event))
+				break;
+
+			event->wait();
+		}
+	}
+
+	LOG_DEBUG(log, "Finished waiting for all replicas to process " << entry.znode_name);
+}
+
+
 void StorageReplicatedMergeTree::LogEntry::writeText(WriteBuffer & out) const
 {
 	writeString("format version: 1\n", out);
@@ -2045,6 +2603,23 @@ void StorageReplicatedMergeTree::LogEntry::writeText(WriteBuffer & out) const
 			writeString("into\n", out);
 			writeString(new_part_name, out);
 			break;
+		case DROP_RANGE:
+			if (detach)
+				writeString("detach\n", out);
+			else
+				writeString("drop\n", out);
+			writeString(new_part_name, out);
+			break;
+		case ATTACH_PART:
+			writeString("attach\n", out);
+			if (attach_unreplicated)
+				writeString("unreplicated\n", out);
+			else
+				writeString("detached\n", out);
+			writeString(source_part_name, out);
+			writeString("\ninto\n", out);
+			writeString(new_part_name, out);
+			break;
 	}
 	writeString("\n", out);
 }
@@ -2079,6 +2654,28 @@ void StorageReplicatedMergeTree::LogEntry::readText(ReadBuffer & in)
 		}
 		readString(new_part_name, in);
 	}
+	else if (type_str == "drop" || type_str == "detach")
+	{
+		type = DROP_RANGE;
+		detach = type_str == "detach";
+		readString(new_part_name, in);
+	}
+	else if (type_str == "attach")
+	{
+		type = ATTACH_PART;
+		String source_type;
+		readString(source_type, in);
+		if (source_type == "unreplicated")
+			attach_unreplicated = true;
+		else if (source_type == "detached")
+			attach_unreplicated = false;
+		else
+			throw Exception("Bad format: expected 'unreplicated' or 'detached', found '" + source_type + "'", ErrorCodes::CANNOT_PARSE_TEXT);
+		assertString("\n", in);
+		readString(source_part_name, in);
+		assertString("\ninto\n", in);
+		readString(new_part_name, in);
+	}
 	assertString("\n", in);
 }
 
diff --git a/dbms/src/Storages/StorageSystemNumbers.cpp b/dbms/src/Storages/StorageSystemNumbers.cpp
index 06114a143be..211a57f3d95 100644
--- a/dbms/src/Storages/StorageSystemNumbers.cpp
+++ b/dbms/src/Storages/StorageSystemNumbers.cpp
@@ -4,6 +4,7 @@
 #include <DB/Core/ErrorCodes.h>
 #include <DB/Columns/ColumnsNumber.h>
 #include <DB/DataTypes/DataTypesNumberFixed.h>
+#include <DB/DataStreams/IProfilingBlockInputStream.h>
 #include <DB/Storages/StorageSystemNumbers.h>
 
 
@@ -12,46 +13,55 @@ namespace DB
 
 using Poco::SharedPtr;
 
-
-NumbersBlockInputStream::NumbersBlockInputStream(size_t block_size_) : block_size(block_size_), next(0)
+class NumbersBlockInputStream : public IProfilingBlockInputStream
 {
-}
+public:
+	NumbersBlockInputStream(size_t block_size_, size_t offset_, size_t step_)
+		: block_size(block_size_), next(offset_), step(step_) {}
+
+	String getName() const { return "NumbersBlockInputStream"; }
+	String getID() const { return "Numbers"; }
+
+protected:
+	Block readImpl()
+	{
+		Block res;
+
+		ColumnWithNameAndType column_with_name_and_type;
+
+		column_with_name_and_type.name = "number";
+		column_with_name_and_type.type = new DataTypeUInt64();
+		ColumnUInt64 * column = new ColumnUInt64(block_size);
+		ColumnUInt64::Container_t & vec = column->getData();
+		column_with_name_and_type.column = column;
+
+		size_t curr = next;		/// Локальная переменная почему-то работает быстрее (>20%), чем член класса.
+		UInt64 * pos = &vec[0];	/// Это тоже ускоряет код.
+		UInt64 * end = &vec[block_size];
+		while (pos < end)
+			*pos++ = curr++;
+
+		res.insert(column_with_name_and_type);
+
+		next += step;
+		return res;
+	}
+private:
+	size_t block_size;
+	UInt64 next;
+	UInt64 step;
+};
 
 
-Block NumbersBlockInputStream::readImpl()
-{
-	Block res;
-	
-	ColumnWithNameAndType column_with_name_and_type;
-	
-	column_with_name_and_type.name = "number";
-	column_with_name_and_type.type = new DataTypeUInt64();
-	ColumnUInt64 * column = new ColumnUInt64(block_size);
-	ColumnUInt64::Container_t & vec = column->getData();
-	column_with_name_and_type.column = column;
-
-	size_t curr = next;		/// Локальная переменная почему-то работает быстрее (>20%), чем член класса.
-	UInt64 * pos = &vec[0];	/// Это тоже ускоряет код.
-	UInt64 * end = &vec[block_size];
-	while (pos < end)
-		*pos++ = curr++;
-	next = curr;
-
-	res.insert(column_with_name_and_type);
-
-	return res;
-}
-
-
-StorageSystemNumbers::StorageSystemNumbers(const std::string & name_)
-	: name(name_)
+StorageSystemNumbers::StorageSystemNumbers(const std::string & name_, bool multithreaded_)
+	: name(name_), multithreaded(multithreaded_)
 {
 	columns.push_back(NameAndTypePair("number", new DataTypeUInt64));
 }
 
-StoragePtr StorageSystemNumbers::create(const std::string & name_)
+StoragePtr StorageSystemNumbers::create(const std::string & name_, bool multithreaded_)
 {
-	return (new StorageSystemNumbers(name_))->thisPtr();
+	return (new StorageSystemNumbers(name_, multithreaded_))->thisPtr();
 }
 
 
@@ -61,7 +71,15 @@ BlockInputStreams StorageSystemNumbers::read(
 {
 	check(column_names);
 	processed_stage = QueryProcessingStage::FetchColumns;
-	return BlockInputStreams(1, new NumbersBlockInputStream(max_block_size));
+
+	if (!multithreaded)
+		threads = 1;
+
+	BlockInputStreams res(threads);
+	for (size_t i = 0; i < threads; ++i)
+		res[i] = new NumbersBlockInputStream(max_block_size, i * max_block_size, threads * max_block_size);
+
+	return res;
 }
 
 }
diff --git a/dbms/src/Storages/StorageTinyLog.cpp b/dbms/src/Storages/StorageTinyLog.cpp
index 6cb7fface3f..d48cbea70e3 100644
--- a/dbms/src/Storages/StorageTinyLog.cpp
+++ b/dbms/src/Storages/StorageTinyLog.cpp
@@ -266,6 +266,12 @@ void TinyLogBlockOutputStream::writeSuffix()
 	for (FileStreams::iterator it = streams.begin(); it != streams.end(); ++it)
 		it->second->finalize();
 
+	std::vector<Poco::File> column_files;
+	for (auto & pair : streams)
+		column_files.push_back(storage.files[pair.first].data_file);
+
+	storage.file_checker.update(column_files.begin(), column_files.end());
+
 	streams.clear();
 }
 
@@ -286,15 +292,18 @@ void TinyLogBlockOutputStream::write(const Block & block)
 
 
 StorageTinyLog::StorageTinyLog(const std::string & path_, const std::string & name_, NamesAndTypesListPtr columns_, bool attach, size_t max_compress_block_size_)
-	: path(path_), name(name_), columns(columns_), max_compress_block_size(max_compress_block_size_)
+	: path(path_), name(name_), columns(columns_),
+		max_compress_block_size(max_compress_block_size_),
+		file_checker(path + escapeForFileName(name) + '/' + "sizes.json", *this),
+		log(&Logger::get("StorageTinyLog"))
 {
 	if (columns->empty())
 		throw Exception("Empty list of columns passed to StorageTinyLog constructor", ErrorCodes::EMPTY_LIST_OF_COLUMNS_PASSED);
 
+	String full_path = path + escapeForFileName(name) + '/';
 	if (!attach)
 	{
 		/// создаём файлы, если их нет
-		String full_path = path + escapeForFileName(name) + '/';
 		if (0 != mkdir(full_path.c_str(), S_IRWXU | S_IRWXG | S_IRWXO) && errno != EEXIST)
 			throwFromErrno("Cannot create directory " + full_path, ErrorCodes::CANNOT_CREATE_DIRECTORY);
 	}
@@ -360,6 +369,7 @@ void StorageTinyLog::rename(const String & new_path_to_db, const String & new_da
 
 	path = new_path_to_db;
 	name = new_table_name;
+	file_checker.setPath(path + escapeForFileName(name) + "/" + "sizes.json");
 
 	for (Files_t::iterator it = files.begin(); it != files.end(); ++it)
 		it->second.data_file = Poco::File(path + escapeForFileName(name) + '/' + Poco::Path(it->second.data_file.path()).getFileName());
@@ -394,4 +404,19 @@ void StorageTinyLog::drop()
 			it->second.data_file.remove();
 }
 
+bool StorageTinyLog::checkData() const
+{
+	return file_checker.check();
+}
+
+StorageTinyLog::Files_t & StorageTinyLog::getFiles()
+{
+	return files;
+}
+
+TinyLogBlockOutputStream::~TinyLogBlockOutputStream()
+{
+	writeSuffix();
+}
+
 }
diff --git a/dbms/src/Storages/tests/active_parts.py b/dbms/src/Storages/tests/active_parts.py
index 24fb4a5c7e4..978ea86eb25 100644
--- a/dbms/src/Storages/tests/active_parts.py
+++ b/dbms/src/Storages/tests/active_parts.py
@@ -23,16 +23,17 @@ for s in sys.stdin.read().split():
 		parts[m1] = []
 	parts[m1].append((i1, i2, l, s))
 
-for m in parts:
-	parts[m].sort(key=lambda (i1, i2, l, s): (i1, -i2, -l))
+for m, ps in sorted(parts.items()):
+	ps.sort(key=lambda (i1, i2, l, s): (i1, -i2, -l))
 	(x2, y2, l2, s2) = (-1, -1, -1, -1)
-	for x1, y1, l1, s1 in parts[m]:
+	for x1, y1, l1, s1 in ps:
 		if x1 >= x2 and y1 <= y2 and l1 < l2 and (x1, y1) != (x2, y2): # 2 contains 1
 			pass
 		elif x1 > y2: # 1 is to the right of 2
-			if x1 != y2 + 1:
+			if x1 != y2 + 1 and y2 != -1:
 				print # чтобы на глаз было видно пропущенные номера
 			(x2, y2, l2, s2) = (x1, y1, l1, s1)
 			print s1
 		else:
 			raise Exception('invalid parts intersection: ' + s1 + ' and ' + s2)
+	print
diff --git a/dbms/src/Storages/tests/part_checker.cpp b/dbms/src/Storages/tests/part_checker.cpp
index be19a4c494f..d5376b23c37 100644
--- a/dbms/src/Storages/tests/part_checker.cpp
+++ b/dbms/src/Storages/tests/part_checker.cpp
@@ -15,8 +15,14 @@ int main(int argc, char ** argv)
 
 	try
 	{
-		DB::MergeTreePartChecker::checkDataPart(argv[1], argc == 4 ? DB::parse<size_t>(argv[3]) : 8192ul, argv[2][0] == '1',
-												DB::DataTypeFactory(), true);
+		DB::MergeTreePartChecker::Settings settings;
+		if (argc == 4)
+			settings.setIndexGranularity(DB::parse<size_t>(argv[3]));
+		settings.setRequireChecksums(argv[2][0] == '1');
+		settings.setRequireColumnFiles(argv[2][0] == '1');
+		settings.setVerbose(true);
+
+		DB::MergeTreePartChecker::checkDataPart(argv[1], settings, DB::DataTypeFactory());
 	}
 	catch (...)
 	{
diff --git a/dbms/src/Storages/tests/watchparts.sh b/dbms/src/Storages/tests/watchparts.sh
new file mode 100755
index 00000000000..ad1fc68d1ed
--- /dev/null
+++ b/dbms/src/Storages/tests/watchparts.sh
@@ -0,0 +1,5 @@
+#!/bin/bash
+
+# Принимает аргументом директорию с кусками. Постоянно показывает список активных кусков и количество всех кусков.
+
+watch "ls $1 | grep -Pc '^[0-9]{8}_[0-9]{8}_'; ls $1 | active_parts.py | grep -Pc '^[0-9]{8}_[0-9]{8}_'; ls $1 | active_parts.py"
diff --git a/dbms/tests/clickhouse-test b/dbms/tests/clickhouse-test
index 225c83abf72..92375f645c4 100755
--- a/dbms/tests/clickhouse-test
+++ b/dbms/tests/clickhouse-test
@@ -34,6 +34,10 @@ ERRORS=0
 
 if [ "$1" == "--zookeeper" ]; then
 	ZOOKEEPER=1
+	shift
+elif [ "$1" == "--no-zookeeper" ]; then
+	ZOOKEEPER=0
+	shift
 elif grep -q '<zookeeper' /etc/clickhouse-server/config-preprocessed.xml; then
 	ZOOKEEPER=1
 else
diff --git a/dbms/tests/queries/0_stateless/00031_parser_number.reference b/dbms/tests/queries/0_stateless/00031_parser_number.reference
index dba9f499bfc..aace798796f 100644
--- a/dbms/tests/queries/0_stateless/00031_parser_number.reference
+++ b/dbms/tests/queries/0_stateless/00031_parser_number.reference
@@ -1,3 +1,3 @@
-0	1	-1	128	-127	-128	255	-128	255	-127	65535	4294967295	12300	4656	-0	-0	0	18446744073709551615	2.09883e+19	-1.84467e+19	-9223372036854775807	-8.98847e+307	-2.22507e-308	inf	-inf	nan	-nan	1e-302	UInt8	UInt8	Int8	UInt8	Int8	Int8	UInt8	Int8	UInt8	Int8	UInt16	UInt32	Float64	Float64	Float64	Float64	UInt8	UInt64	Float64	Float64	Int64	Float64	Float64	Float64	Float64	Float64	Float32	Float64
+0	1	-1	128	-127	-128	255	-128	255	-127	65535	4294967295	12300	4656	-0	-0	0	18446744073709551615	2.09883e+19	-1.84467e+19	-9223372036854775807	-8.98847e+307	-2.22507e-308	inf	-inf	nan	-nan	1e-302	UInt8	UInt8	Int8	UInt8	Int8	Int8	UInt8	Int8	UInt8	Int8	UInt16	UInt32	Float64	Float64	Float64	Float64	Float64	UInt64	Float64	Float64	Int64	Float64	Float64	Float64	Float64	Float64	Float32	Float64
 1e+308
 -1e-307
diff --git a/dbms/tests/queries/0_stateless/00063_check_query.reference b/dbms/tests/queries/0_stateless/00063_check_query.reference
new file mode 100644
index 00000000000..6ed281c757a
--- /dev/null
+++ b/dbms/tests/queries/0_stateless/00063_check_query.reference
@@ -0,0 +1,2 @@
+1
+1
diff --git a/dbms/tests/queries/0_stateless/00063_check_query.sql b/dbms/tests/queries/0_stateless/00063_check_query.sql
new file mode 100644
index 00000000000..9eb617475a4
--- /dev/null
+++ b/dbms/tests/queries/0_stateless/00063_check_query.sql
@@ -0,0 +1,16 @@
+DROP TABLE IF EXISTS check_query_tiny_log;
+
+CREATE TABLE check_query_tiny_log (N UInt32, S String) Engine = TinyLog;
+
+INSERT INTO check_query_tiny_log VALUES (1, 'A'), (2, 'B'), (3, 'C')
+
+CHECK TABLE check_query_tiny_log;
+
+
+DROP TABLE IF EXISTS check_query_log;
+
+CREATE TABLE check_query_log (N UInt32,S String) Engine = Log;
+
+INSERT INTO check_query_log VALUES (1, 'A'), (2, 'B'), (3, 'C')
+
+CHECK TABLE check_query_log;
diff --git a/dbms/tests/queries/0_stateless/00064_negate_bug.reference b/dbms/tests/queries/0_stateless/00064_negate_bug.reference
new file mode 100644
index 00000000000..601e8c52f8b
--- /dev/null
+++ b/dbms/tests/queries/0_stateless/00064_negate_bug.reference
@@ -0,0 +1 @@
+-1	Int64
diff --git a/dbms/tests/queries/0_stateless/00064_negate_bug.sql b/dbms/tests/queries/0_stateless/00064_negate_bug.sql
new file mode 100644
index 00000000000..ba076770168
--- /dev/null
+++ b/dbms/tests/queries/0_stateless/00064_negate_bug.sql
@@ -0,0 +1 @@
+SELECT -toUInt32(1) AS x, toTypeName(x) AS t
diff --git a/dbms/tests/queries/0_stateless/00065_float_literals_formatting.reference b/dbms/tests/queries/0_stateless/00065_float_literals_formatting.reference
new file mode 100644
index 00000000000..f3ba2eafb28
--- /dev/null
+++ b/dbms/tests/queries/0_stateless/00065_float_literals_formatting.reference
@@ -0,0 +1,2 @@
+Float64
+Float64
diff --git a/dbms/tests/queries/0_stateless/00065_float_literals_formatting.sql b/dbms/tests/queries/0_stateless/00065_float_literals_formatting.sql
new file mode 100644
index 00000000000..0b3bffdcf9d
--- /dev/null
+++ b/dbms/tests/queries/0_stateless/00065_float_literals_formatting.sql
@@ -0,0 +1 @@
+SELECT toTypeName(1.0) FROM remote('127.0.0.{1,2}', system, one)
diff --git a/dbms/tests/queries/0_stateless/00066_group_by_in.reference b/dbms/tests/queries/0_stateless/00066_group_by_in.reference
new file mode 100644
index 00000000000..aa47d0d46d4
--- /dev/null
+++ b/dbms/tests/queries/0_stateless/00066_group_by_in.reference
@@ -0,0 +1,2 @@
+0
+0
diff --git a/dbms/tests/queries/0_stateless/00066_group_by_in.sql b/dbms/tests/queries/0_stateless/00066_group_by_in.sql
new file mode 100644
index 00000000000..457a5297bc8
--- /dev/null
+++ b/dbms/tests/queries/0_stateless/00066_group_by_in.sql
@@ -0,0 +1,2 @@
+SELECT (dummy IN (1)) AS x GROUP BY x;
+SELECT (1 IN (0,2)) AS x GROUP BY x;
diff --git a/dbms/tests/queries/0_stateless/00067_replicate_segfault.reference b/dbms/tests/queries/0_stateless/00067_replicate_segfault.reference
new file mode 100644
index 00000000000..c8711199d90
--- /dev/null
+++ b/dbms/tests/queries/0_stateless/00067_replicate_segfault.reference
@@ -0,0 +1,2 @@
+[]	1
+[]	1
diff --git a/dbms/tests/queries/0_stateless/00067_replicate_segfault.sql b/dbms/tests/queries/0_stateless/00067_replicate_segfault.sql
new file mode 100644
index 00000000000..bf1a756d887
--- /dev/null
+++ b/dbms/tests/queries/0_stateless/00067_replicate_segfault.sql
@@ -0,0 +1,2 @@
+SELECT arrayFilter(x -> materialize(0), materialize([0])) AS p, arrayAll(y -> arrayExists(x -> y != x, p), p) AS test;
+SELECT arrayFilter(x -> materialize(0), materialize([''])) AS p, arrayAll(y -> arrayExists(x -> y != x, p), p) AS test;
diff --git a/libs/libdivide/libdivide.h b/libs/libdivide/libdivide.h
new file mode 100644
index 00000000000..52b7d5638d3
--- /dev/null
+++ b/libs/libdivide/libdivide.h
@@ -0,0 +1,1332 @@
+/* libdivide.h
+   Copyright 2010 ridiculous_fish
+*/
+
+#if defined(_WIN32) || defined(WIN32)
+#define LIBDIVIDE_WINDOWS 1
+#endif
+
+#if defined(_MSC_VER)
+#define LIBDIVIDE_VC 1
+#endif
+
+#ifdef __cplusplus
+#include <cstdlib>
+#include <cstdio>
+#include <cassert>
+#else
+#include <stdlib.h>
+#include <stdio.h>
+#include <assert.h>
+#endif
+
+#if ! LIBDIVIDE_HAS_STDINT_TYPES && (! LIBDIVIDE_VC || _MSC_VER >= 1600)
+/* Only Visual C++ 2010 and later include stdint.h */
+#include <stdint.h>
+#define LIBDIVIDE_HAS_STDINT_TYPES 1
+#endif
+
+#if ! LIBDIVIDE_HAS_STDINT_TYPES
+typedef __int32 int32_t;
+typedef unsigned __int32 uint32_t;
+typedef __int64 int64_t;
+typedef unsigned __int64 uint64_t;
+typedef __int8 int8_t;
+typedef unsigned __int8 uint8_t;
+#endif
+
+#if LIBDIVIDE_USE_SSE2
+    #include <emmintrin.h>
+#endif
+
+#if LIBDIVIDE_VC
+    #include <intrin.h>
+#endif
+
+#ifndef __has_builtin
+#define __has_builtin(x) 0  // Compatibility with non-clang compilers.
+#endif
+
+#ifdef __ICC
+#define HAS_INT128_T 0
+#else
+#define HAS_INT128_T __LP64__
+#endif
+
+#if defined(__x86_64__) || defined(_WIN64) || defined(_M_64)
+#define LIBDIVIDE_IS_X86_64 1
+#endif
+
+#if defined(__i386__)
+#define LIBDIVIDE_IS_i386 1
+#endif
+
+#if __GNUC__ || __clang__
+#define LIBDIVIDE_GCC_STYLE_ASM 1
+#endif
+
+
+/* libdivide may use the pmuldq (vector signed 32x32->64 mult instruction) which is in SSE 4.1.  However, signed multiplication can be emulated efficiently with unsigned multiplication, and SSE 4.1 is currently rare, so it is OK to not turn this on */
+#ifdef LIBDIVIDE_USE_SSE4_1
+#include <smmintrin.h>
+#endif
+
+#ifdef __cplusplus
+/* We place libdivide within the libdivide namespace, and that goes in an anonymous namespace so that the functions are only visible to files that #include this header and don't get external linkage.  At least that's the theory. */
+namespace {
+namespace libdivide {
+#endif
+
+/* Explanation of "more" field: bit 6 is whether to use shift path.  If we are using the shift path, bit 7 is whether the divisor is negative in the signed case; in the unsigned case it is 0.   Bits 0-4 is shift value (for shift path or mult path).  In 32 bit case, bit 5 is always 0.  We use bit 7 as the "negative divisor indicator" so that we can use sign extension to efficiently go to a full-width -1.
+
+
+u32: [0-4] shift value
+     [5] ignored
+     [6] add indicator
+     [7] shift path
+     
+s32: [0-4] shift value
+     [5] shift path
+     [6] add indicator
+     [7] indicates negative divisor
+
+u64: [0-5] shift value
+     [6] add indicator
+     [7] shift path
+
+s64: [0-5] shift value
+     [6] add indicator
+     [7] indicates negative divisor
+     magic number of 0 indicates shift path (we ran out of bits!)
+*/
+
+enum {
+    LIBDIVIDE_32_SHIFT_MASK = 0x1F,
+    LIBDIVIDE_64_SHIFT_MASK = 0x3F,
+    LIBDIVIDE_ADD_MARKER = 0x40,
+    LIBDIVIDE_U32_SHIFT_PATH = 0x80,
+    LIBDIVIDE_U64_SHIFT_PATH = 0x80,
+    LIBDIVIDE_S32_SHIFT_PATH = 0x20,
+    LIBDIVIDE_NEGATIVE_DIVISOR = 0x80    
+};
+
+
+struct libdivide_u32_t {
+    uint32_t magic;
+    uint8_t more;
+};
+
+struct libdivide_s32_t {
+    int32_t magic;
+    uint8_t more;
+};
+
+struct libdivide_u64_t {
+    uint64_t magic;
+    uint8_t more;
+};    
+
+struct libdivide_s64_t {
+    int64_t magic;
+    uint8_t more;
+};
+
+
+
+#ifndef LIBDIVIDE_API
+    #ifdef __cplusplus
+        /* In C++, we don't want our public functions to be static, because they are arguments to templates and static functions can't do that.  They get internal linkage through virtue of the anonymous namespace.  In C, they should be static. */
+        #define LIBDIVIDE_API
+    #else
+        #define LIBDIVIDE_API static
+    #endif
+#endif
+
+
+LIBDIVIDE_API struct libdivide_s32_t libdivide_s32_gen(int32_t y);
+LIBDIVIDE_API struct libdivide_u32_t libdivide_u32_gen(uint32_t y);
+LIBDIVIDE_API struct libdivide_s64_t libdivide_s64_gen(int64_t y);
+LIBDIVIDE_API struct libdivide_u64_t libdivide_u64_gen(uint64_t y);
+ 
+LIBDIVIDE_API int32_t  libdivide_s32_do(int32_t numer, const struct libdivide_s32_t *denom);
+LIBDIVIDE_API uint32_t libdivide_u32_do(uint32_t numer, const struct libdivide_u32_t *denom);
+LIBDIVIDE_API int64_t  libdivide_s64_do(int64_t numer, const struct libdivide_s64_t *denom);
+LIBDIVIDE_API uint64_t libdivide_u64_do(uint64_t y, const struct libdivide_u64_t *denom);
+
+LIBDIVIDE_API int libdivide_u32_get_algorithm(const struct libdivide_u32_t *denom);
+LIBDIVIDE_API uint32_t libdivide_u32_do_alg0(uint32_t numer, const struct libdivide_u32_t *denom);
+LIBDIVIDE_API uint32_t libdivide_u32_do_alg1(uint32_t numer, const struct libdivide_u32_t *denom);
+LIBDIVIDE_API uint32_t libdivide_u32_do_alg2(uint32_t numer, const struct libdivide_u32_t *denom);
+ 
+LIBDIVIDE_API int libdivide_u64_get_algorithm(const struct libdivide_u64_t *denom);
+LIBDIVIDE_API uint64_t libdivide_u64_do_alg0(uint64_t numer, const struct libdivide_u64_t *denom);
+LIBDIVIDE_API uint64_t libdivide_u64_do_alg1(uint64_t numer, const struct libdivide_u64_t *denom);
+LIBDIVIDE_API uint64_t libdivide_u64_do_alg2(uint64_t numer, const struct libdivide_u64_t *denom);
+ 
+LIBDIVIDE_API int libdivide_s32_get_algorithm(const struct libdivide_s32_t *denom);
+LIBDIVIDE_API int32_t libdivide_s32_do_alg0(int32_t numer, const struct libdivide_s32_t *denom);
+LIBDIVIDE_API int32_t libdivide_s32_do_alg1(int32_t numer, const struct libdivide_s32_t *denom);
+LIBDIVIDE_API int32_t libdivide_s32_do_alg2(int32_t numer, const struct libdivide_s32_t *denom);
+LIBDIVIDE_API int32_t libdivide_s32_do_alg3(int32_t numer, const struct libdivide_s32_t *denom);
+LIBDIVIDE_API int32_t libdivide_s32_do_alg4(int32_t numer, const struct libdivide_s32_t *denom);
+ 
+LIBDIVIDE_API int libdivide_s64_get_algorithm(const struct libdivide_s64_t *denom);
+LIBDIVIDE_API int64_t libdivide_s64_do_alg0(int64_t numer, const struct libdivide_s64_t *denom);
+LIBDIVIDE_API int64_t libdivide_s64_do_alg1(int64_t numer, const struct libdivide_s64_t *denom);
+LIBDIVIDE_API int64_t libdivide_s64_do_alg2(int64_t numer, const struct libdivide_s64_t *denom);
+LIBDIVIDE_API int64_t libdivide_s64_do_alg3(int64_t numer, const struct libdivide_s64_t *denom);
+LIBDIVIDE_API int64_t libdivide_s64_do_alg4(int64_t numer, const struct libdivide_s64_t *denom);
+
+#if LIBDIVIDE_USE_SSE2
+LIBDIVIDE_API __m128i libdivide_u32_do_vector(__m128i numers, const struct libdivide_u32_t * denom);
+LIBDIVIDE_API __m128i libdivide_s32_do_vector(__m128i numers, const struct libdivide_s32_t * denom);
+LIBDIVIDE_API __m128i libdivide_u64_do_vector(__m128i numers, const struct libdivide_u64_t * denom);
+LIBDIVIDE_API __m128i libdivide_s64_do_vector(__m128i numers, const struct libdivide_s64_t * denom);
+
+LIBDIVIDE_API __m128i libdivide_u32_do_vector_alg0(__m128i numers, const struct libdivide_u32_t * denom);
+LIBDIVIDE_API __m128i libdivide_u32_do_vector_alg1(__m128i numers, const struct libdivide_u32_t * denom);
+LIBDIVIDE_API __m128i libdivide_u32_do_vector_alg2(__m128i numers, const struct libdivide_u32_t * denom);
+
+LIBDIVIDE_API __m128i libdivide_s32_do_vector_alg0(__m128i numers, const struct libdivide_s32_t * denom);
+LIBDIVIDE_API __m128i libdivide_s32_do_vector_alg1(__m128i numers, const struct libdivide_s32_t * denom);
+LIBDIVIDE_API __m128i libdivide_s32_do_vector_alg2(__m128i numers, const struct libdivide_s32_t * denom);
+LIBDIVIDE_API __m128i libdivide_s32_do_vector_alg3(__m128i numers, const struct libdivide_s32_t * denom);
+LIBDIVIDE_API __m128i libdivide_s32_do_vector_alg4(__m128i numers, const struct libdivide_s32_t * denom);
+
+LIBDIVIDE_API __m128i libdivide_u64_do_vector_alg0(__m128i numers, const struct libdivide_u64_t * denom);
+LIBDIVIDE_API __m128i libdivide_u64_do_vector_alg1(__m128i numers, const struct libdivide_u64_t * denom);
+LIBDIVIDE_API __m128i libdivide_u64_do_vector_alg2(__m128i numers, const struct libdivide_u64_t * denom);
+
+LIBDIVIDE_API __m128i libdivide_s64_do_vector_alg0(__m128i numers, const struct libdivide_s64_t * denom);
+LIBDIVIDE_API __m128i libdivide_s64_do_vector_alg1(__m128i numers, const struct libdivide_s64_t * denom);
+LIBDIVIDE_API __m128i libdivide_s64_do_vector_alg2(__m128i numers, const struct libdivide_s64_t * denom);
+LIBDIVIDE_API __m128i libdivide_s64_do_vector_alg3(__m128i numers, const struct libdivide_s64_t * denom);
+LIBDIVIDE_API __m128i libdivide_s64_do_vector_alg4(__m128i numers, const struct libdivide_s64_t * denom);
+#endif
+ 
+ 
+ 
+//////// Internal Utility Functions
+ 
+static inline uint32_t libdivide__mullhi_u32(uint32_t x, uint32_t y) {
+    uint64_t xl = x, yl = y;
+    uint64_t rl = xl * yl;
+    return (uint32_t)(rl >> 32);
+}
+ 
+static uint64_t libdivide__mullhi_u64(uint64_t x, uint64_t y) {
+#if HAS_INT128_T
+    __uint128_t xl = x, yl = y;
+    __uint128_t rl = xl * yl;
+    return (uint64_t)(rl >> 64);
+#else
+    //full 128 bits are x0 * y0 + (x0 * y1 << 32) + (x1 * y0 << 32) + (x1 * y1 << 64)
+    const uint32_t mask = 0xFFFFFFFF;
+    const uint32_t x0 = (uint32_t)(x & mask), x1 = (uint32_t)(x >> 32);
+    const uint32_t y0 = (uint32_t)(y & mask), y1 = (uint32_t)(y >> 32);
+    const uint32_t x0y0_hi = libdivide__mullhi_u32(x0, y0);
+    const uint64_t x0y1 = x0 * (uint64_t)y1;
+    const uint64_t x1y0 = x1 * (uint64_t)y0;
+    const uint64_t x1y1 = x1 * (uint64_t)y1;
+    
+    uint64_t temp = x1y0 + x0y0_hi;
+    uint64_t temp_lo = temp & mask, temp_hi = temp >> 32;
+    return x1y1 + temp_hi + ((temp_lo + x0y1) >> 32);
+#endif
+}
+ 
+static inline int64_t libdivide__mullhi_s64(int64_t x, int64_t y) {
+#if HAS_INT128_T
+    __int128_t xl = x, yl = y;
+    __int128_t rl = xl * yl;
+    return (int64_t)(rl >> 64);    
+#else
+    //full 128 bits are x0 * y0 + (x0 * y1 << 32) + (x1 * y0 << 32) + (x1 * y1 << 64)
+    const uint32_t mask = 0xFFFFFFFF;
+    const uint32_t x0 = (uint32_t)(x & mask), y0 = (uint32_t)(y & mask);
+    const int32_t x1 = (int32_t)(x >> 32), y1 = (int32_t)(y >> 32);
+    const uint32_t x0y0_hi = libdivide__mullhi_u32(x0, y0);
+    const int64_t t = x1*(int64_t)y0 + x0y0_hi;
+    const int64_t w1 = x0*(int64_t)y1 + (t & mask);
+    return x1*(int64_t)y1 + (t >> 32) + (w1 >> 32);
+#endif
+}
+    
+#if LIBDIVIDE_USE_SSE2
+
+static inline __m128i libdivide__u64_to_m128(uint64_t x) {
+#if LIBDIVIDE_VC && ! _WIN64
+    //64 bit windows doesn't seem to have an implementation of any of these load intrinsics, and 32 bit Visual C++ crashes
+    _declspec(align(16)) uint64_t temp[2] = {x, x};
+    return _mm_load_si128((const __m128i*)temp);
+#elif defined(__ICC)
+    uint64_t __attribute__((aligned(16))) temp[2] = {x,x};
+    return _mm_load_si128((const __m128i*)temp);
+#elif __clang__
+    // clang does not provide this intrinsic either
+    return (__m128i){x, x};
+#else
+    // everyone else gets it right
+    return _mm_set1_epi64x(x);
+#endif
+}
+
+static inline __m128i libdivide_get_FFFFFFFF00000000(void) {
+    //returns the same as _mm_set1_epi64(0xFFFFFFFF00000000ULL) without touching memory
+    __m128i result = _mm_set1_epi8(-1); //optimizes to pcmpeqd on OS X
+    return _mm_slli_epi64(result, 32);
+}
+    
+static inline __m128i libdivide_get_00000000FFFFFFFF(void) {
+    //returns the same as _mm_set1_epi64(0x00000000FFFFFFFFULL) without touching memory
+    __m128i result = _mm_set1_epi8(-1); //optimizes to pcmpeqd on OS X
+    result = _mm_srli_epi64(result, 32);
+    return result;
+}
+
+static inline __m128i libdivide_get_0000FFFF(void) {
+    //returns the same as _mm_set1_epi32(0x0000FFFFULL) without touching memory
+    __m128i result; //we don't care what its contents are
+    result = _mm_cmpeq_epi8(result, result); //all 1s
+    result = _mm_srli_epi32(result, 16);
+    return result;    
+}
+
+static inline __m128i libdivide_s64_signbits(__m128i v) {
+    //we want to compute v >> 63, that is, _mm_srai_epi64(v, 63).  But there is no 64 bit shift right arithmetic instruction in SSE2.  So we have to fake it by first duplicating the high 32 bit values, and then using a 32 bit shift.  Another option would be to use _mm_srli_epi64(v, 63) and then subtract that from 0, but that approach appears to be substantially slower for unknown reasons
+    __m128i hiBitsDuped = _mm_shuffle_epi32(v, _MM_SHUFFLE(3, 3, 1, 1));
+    __m128i signBits = _mm_srai_epi32(hiBitsDuped, 31);
+    return signBits;
+}
+
+/* Returns an __m128i whose low 32 bits are equal to amt and has zero elsewhere. */
+static inline __m128i libdivide_u32_to_m128i(uint32_t amt) {
+    return _mm_set_epi32(0, 0, 0, amt);
+}
+    
+static inline __m128i libdivide_s64_shift_right_vector(__m128i v, int amt) {
+    //implementation of _mm_sra_epi64.  Here we have two 64 bit values which are shifted right to logically become (64 - amt) values, and are then sign extended from a (64 - amt) bit number.
+    const int b = 64 - amt;
+    __m128i m = libdivide__u64_to_m128(1ULL << (b - 1));
+    __m128i x = _mm_srl_epi64(v, libdivide_u32_to_m128i(amt));
+    __m128i result = _mm_sub_epi64(_mm_xor_si128(x, m), m); //result = x^m - m
+    return result;
+}
+
+/* Here, b is assumed to contain one 32 bit value repeated four times.  If it did not, the function would not work. */
+static inline __m128i libdivide__mullhi_u32_flat_vector(__m128i a, __m128i b) {
+    __m128i hi_product_0Z2Z = _mm_srli_epi64(_mm_mul_epu32(a, b), 32);
+    __m128i a1X3X = _mm_srli_epi64(a, 32);
+    __m128i hi_product_Z1Z3 = _mm_and_si128(_mm_mul_epu32(a1X3X, b), libdivide_get_FFFFFFFF00000000());
+    return _mm_or_si128(hi_product_0Z2Z, hi_product_Z1Z3); // = hi_product_0123
+}
+
+    
+/* Here, y is assumed to contain one 64 bit value repeated twice. */
+static inline __m128i libdivide_mullhi_u64_flat_vector(__m128i x, __m128i y) {
+    //full 128 bits are x0 * y0 + (x0 * y1 << 32) + (x1 * y0 << 32) + (x1 * y1 << 64)
+    const __m128i mask = libdivide_get_00000000FFFFFFFF();
+    const __m128i x0 = _mm_and_si128(x, mask), x1 = _mm_srli_epi64(x, 32); //x0 is low half of 2 64 bit values, x1 is high half in low slots
+    const __m128i y0 = _mm_and_si128(y, mask), y1 = _mm_srli_epi64(y, 32);
+    const __m128i x0y0_hi = _mm_srli_epi64(_mm_mul_epu32(x0, y0), 32); //x0 happens to have the low half of the two 64 bit values in 32 bit slots 0 and 2, so _mm_mul_epu32 computes their full product, and then we shift right by 32 to get just the high values
+    const __m128i x0y1 = _mm_mul_epu32(x0, y1);
+    const __m128i x1y0 = _mm_mul_epu32(x1, y0);
+    const __m128i x1y1 = _mm_mul_epu32(x1, y1);
+    
+    const __m128i temp = _mm_add_epi64(x1y0, x0y0_hi);
+    __m128i temp_lo = _mm_and_si128(temp, mask), temp_hi = _mm_srli_epi64(temp, 32);
+    temp_lo = _mm_srli_epi64(_mm_add_epi64(temp_lo, x0y1), 32);
+    temp_hi = _mm_add_epi64(x1y1, temp_hi);
+    
+    return _mm_add_epi64(temp_lo, temp_hi);
+}
+
+/* y is one 64 bit value repeated twice */
+static inline __m128i libdivide_mullhi_s64_flat_vector(__m128i x, __m128i y) {
+    __m128i p = libdivide_mullhi_u64_flat_vector(x, y);
+    __m128i t1 = _mm_and_si128(libdivide_s64_signbits(x), y);
+    p = _mm_sub_epi64(p, t1);
+    __m128i t2 = _mm_and_si128(libdivide_s64_signbits(y), x);
+    p = _mm_sub_epi64(p, t2);
+    return p;
+}
+    
+#ifdef LIBDIVIDE_USE_SSE4_1
+    
+/* b is one 32 bit value repeated four times. */
+static inline __m128i libdivide_mullhi_s32_flat_vector(__m128i a, __m128i b) {
+    __m128i hi_product_0Z2Z = _mm_srli_epi64(_mm_mul_epi32(a, b), 32);
+    __m128i a1X3X = _mm_srli_epi64(a, 32);
+    __m128i hi_product_Z1Z3 = _mm_and_si128(_mm_mul_epi32(a1X3X, b), libdivide_get_FFFFFFFF00000000());
+    return _mm_or_si128(hi_product_0Z2Z, hi_product_Z1Z3); // = hi_product_0123
+}
+    
+#else
+
+/* SSE2 does not have a signed multiplication instruction, but we can convert unsigned to signed pretty efficiently.  Again, b is just a 32 bit value repeated four times. */
+static inline __m128i libdivide_mullhi_s32_flat_vector(__m128i a, __m128i b) {
+    __m128i p = libdivide__mullhi_u32_flat_vector(a, b);
+    __m128i t1 = _mm_and_si128(_mm_srai_epi32(a, 31), b); //t1 = (a >> 31) & y, arithmetic shift
+    __m128i t2 = _mm_and_si128(_mm_srai_epi32(b, 31), a);
+    p = _mm_sub_epi32(p, t1);
+    p = _mm_sub_epi32(p, t2);
+    return p;
+}
+#endif
+#endif
+ 
+static inline int32_t libdivide__count_trailing_zeros32(uint32_t val) {
+#if __GNUC__ || __has_builtin(__builtin_ctz)
+    /* Fast way to count trailing zeros */
+    return __builtin_ctz(val);
+#elif LIBDIVIDE_VC
+    unsigned long result;
+    if (_BitScanForward(&result, val)) {
+        return result;
+    }
+    return 0;
+#else
+    /* Dorky way to count trailing zeros.   Note that this hangs for val = 0! */
+    int32_t result = 0;
+    val = (val ^ (val - 1)) >> 1;  // Set v's trailing 0s to 1s and zero rest
+    while (val) {
+        val >>= 1;
+        result++;
+    }
+    return result;
+#endif
+}
+ 
+static inline int32_t libdivide__count_trailing_zeros64(uint64_t val) {
+#if __LP64__ && (__GNUC__ || __has_builtin(__builtin_ctzll))
+    /* Fast way to count trailing zeros.  Note that we disable this in 32 bit because gcc does something horrible - it calls through to a dynamically bound function. */
+    return __builtin_ctzll(val);
+#elif LIBDIVIDE_VC && _WIN64
+    unsigned long result;
+    if (_BitScanForward64(&result, val)) {
+            return result;
+    }
+    return 0;
+#else
+    /* Pretty good way to count trailing zeros.  Note that this hangs for val = 0! */
+    uint32_t lo = val & 0xFFFFFFFF;
+    if (lo != 0) return libdivide__count_trailing_zeros32(lo);
+    return 32 + libdivide__count_trailing_zeros32(val >> 32);
+#endif
+}
+ 
+static inline int32_t libdivide__count_leading_zeros32(uint32_t val) {
+#if __GNUC__ || __has_builtin(__builtin_clzll)
+    /* Fast way to count leading zeros */
+    return __builtin_clz(val);    
+#elif LIBDIVIDE_VC
+    unsigned long result;
+    if (_BitScanReverse(&result, val)) {
+        return 31 - result;
+    }
+    return 0;
+#else
+    /* Dorky way to count leading zeros.  Note that this hangs for val = 0! */
+    int32_t result = 0;
+    while (! (val & (1U << 31))) {
+        val <<= 1;
+        result++;
+    }
+    return result;    
+#endif
+}
+    
+static inline int32_t libdivide__count_leading_zeros64(uint64_t val) {
+#if __GNUC__ || __has_builtin(__builtin_clzll)
+    /* Fast way to count leading zeros */
+    return __builtin_clzll(val);
+#elif LIBDIVIDE_VC && _WIN64
+    unsigned long result;
+    if (_BitScanReverse64(&result, val)) {
+        return 63 - result;
+    }
+    return 0;
+#else
+    /* Dorky way to count leading zeros.  Note that this hangs for val = 0! */
+    int32_t result = 0;
+    while (! (val & (1ULL << 63))) {
+        val <<= 1;
+        result++;
+    }
+    return result;
+#endif
+}
+
+//libdivide_64_div_32_to_32: divides a 64 bit uint {u1, u0} by a 32 bit uint {v}.  The result must fit in 32 bits.  Returns the quotient directly and the remainder in *r
+#if (LIBDIVIDE_IS_i386 || LIBDIVIDE_IS_X86_64) && LIBDIVIDE_GCC_STYLE_ASM
+static uint32_t libdivide_64_div_32_to_32(uint32_t u1, uint32_t u0, uint32_t v, uint32_t *r) {
+    uint32_t result;
+    __asm__("divl %[v]"
+            : "=a"(result), "=d"(*r)
+            : [v] "r"(v), "a"(u0), "d"(u1)
+            );
+    return result;
+}
+#else
+static uint32_t libdivide_64_div_32_to_32(uint32_t u1, uint32_t u0, uint32_t v, uint32_t *r) {
+    uint64_t n = (((uint64_t)u1) << 32) | u0;
+    uint32_t result = (uint32_t)(n / v);
+    *r = (uint32_t)(n - result * (uint64_t)v);
+    return result;
+}
+#endif
+    
+#if LIBDIVIDE_IS_X86_64 && LIBDIVIDE_GCC_STYLE_ASM
+static uint64_t libdivide_128_div_64_to_64(uint64_t u1, uint64_t u0, uint64_t v, uint64_t *r) {
+    //u0 -> rax
+    //u1 -> rdx
+    //divq
+    uint64_t result;
+    __asm__("divq %[v]"
+            : "=a"(result), "=d"(*r)
+            : [v] "r"(v), "a"(u0), "d"(u1)
+            );
+    return result;
+
+}
+#else
+ 
+/* Code taken from Hacker's Delight, http://www.hackersdelight.org/HDcode/divlu.c .  License permits inclusion here per http://www.hackersdelight.org/permissions.htm
+ */
+static uint64_t libdivide_128_div_64_to_64(uint64_t u1, uint64_t u0, uint64_t v, uint64_t *r) {    
+    const uint64_t b = (1ULL << 32); // Number base (16 bits).
+    uint64_t un1, un0,        // Norm. dividend LSD's.
+    vn1, vn0,        // Norm. divisor digits.
+    q1, q0,          // Quotient digits.
+    un64, un21, un10,// Dividend digit pairs.
+    rhat;            // A remainder.
+    int s;                  // Shift amount for norm.
+    
+    if (u1 >= v) {            // If overflow, set rem.
+        if (r != NULL)         // to an impossible value,
+            *r = (uint64_t)(-1);    // and return the largest
+        return (uint64_t)(-1);}    // possible quotient.
+    
+    /* count leading zeros */
+    s = libdivide__count_leading_zeros64(v); // 0 <= s <= 63.
+    if (s > 0) {
+        v = v << s;           // Normalize divisor.
+        un64 = (u1 << s) | ((u0 >> (64 - s)) & (-s >> 31));
+        un10 = u0 << s;       // Shift dividend left.
+    } else {
+        // Avoid undefined behavior.
+        un64 = u1 | u0;
+        un10 = u0;
+    }
+
+    vn1 = v >> 32;            // Break divisor up into
+    vn0 = v & 0xFFFFFFFF;     // two 32-bit digits.
+
+    un1 = un10 >> 32;         // Break right half of
+    un0 = un10 & 0xFFFFFFFF;  // dividend into two digits.
+    
+    q1 = un64/vn1;            // Compute the first
+    rhat = un64 - q1*vn1;     // quotient digit, q1.
+again1:
+    if (q1 >= b || q1*vn0 > b*rhat + un1) {
+        q1 = q1 - 1;
+        rhat = rhat + vn1;
+        if (rhat < b) goto again1;}
+    
+    un21 = un64*b + un1 - q1*v;  // Multiply and subtract.
+    
+    q0 = un21/vn1;            // Compute the second
+    rhat = un21 - q0*vn1;     // quotient digit, q0.
+again2:
+    if (q0 >= b || q0*vn0 > b*rhat + un0) {
+        q0 = q0 - 1;
+        rhat = rhat + vn1;
+        if (rhat < b) goto again2;}
+    
+    if (r != NULL)            // If remainder is wanted,
+        *r = (un21*b + un0 - q0*v) >> s;     // return it.
+    return q1*b + q0;
+}
+#endif
+        
+#if LIBDIVIDE_ASSERTIONS_ON
+#define LIBDIVIDE_ASSERT(x) do { if (! (x)) { fprintf(stderr, "Assertion failure on line %ld: %s\n", (long)__LINE__, #x); exit(-1); } } while (0)
+#else
+#define LIBDIVIDE_ASSERT(x)    
+#endif
+ 
+#ifndef LIBDIVIDE_HEADER_ONLY
+  
+////////// UINT32
+
+struct libdivide_u32_t libdivide_u32_gen(uint32_t d) {
+    struct libdivide_u32_t result;
+    if ((d & (d - 1)) == 0) {
+        result.magic = 0;
+        result.more = libdivide__count_trailing_zeros32(d) | LIBDIVIDE_U32_SHIFT_PATH;
+    }
+    else {
+        const uint32_t floor_log_2_d = 31 - libdivide__count_leading_zeros32(d);
+        
+        uint8_t more;
+        uint32_t rem, proposed_m;
+        proposed_m = libdivide_64_div_32_to_32(1U << floor_log_2_d, 0, d, &rem);
+
+        LIBDIVIDE_ASSERT(rem > 0 && rem < d);
+        const uint32_t e = d - rem;
+        
+	/* This power works if e < 2**floor_log_2_d. */
+	if (e < (1U << floor_log_2_d)) {
+            /* This power works */
+            more = floor_log_2_d;
+        }
+        else {
+            /* We have to use the general 33-bit algorithm.  We need to compute (2**power) / d. However, we already have (2**(power-1))/d and its remainder.  By doubling both, and then correcting the remainder, we can compute the larger division. */
+            proposed_m += proposed_m; //don't care about overflow here - in fact, we expect it
+            const uint32_t twice_rem = rem + rem;
+            if (twice_rem >= d || twice_rem < rem) proposed_m += 1;
+            more = floor_log_2_d | LIBDIVIDE_ADD_MARKER;
+        }
+        result.magic = 1 + proposed_m;
+        result.more = more;
+        //result.more's shift should in general be ceil_log_2_d.  But if we used the smaller power, we subtract one from the shift because we're using the smaller power. If we're using the larger power, we subtract one from the shift because it's taken care of by the add indicator.  So floor_log_2_d happens to be correct in both cases.
+        
+    }
+    return result;
+}
+
+uint32_t libdivide_u32_do(uint32_t numer, const struct libdivide_u32_t *denom) {
+    uint8_t more = denom->more;
+    if (more & LIBDIVIDE_U32_SHIFT_PATH) {
+        return numer >> (more & LIBDIVIDE_32_SHIFT_MASK);
+    }
+    else {
+        uint32_t q = libdivide__mullhi_u32(denom->magic, numer);
+        if (more & LIBDIVIDE_ADD_MARKER) {
+            uint32_t t = ((numer - q) >> 1) + q;
+            return t >> (more & LIBDIVIDE_32_SHIFT_MASK);
+        }
+        else {
+            return q >> more; //all upper bits are 0 - don't need to mask them off
+        }
+    }
+}
+
+ 
+int libdivide_u32_get_algorithm(const struct libdivide_u32_t *denom) {
+    uint8_t more = denom->more;
+    if (more & LIBDIVIDE_U32_SHIFT_PATH) return 0;
+    else if (! (more & LIBDIVIDE_ADD_MARKER)) return 1;
+    else return 2;
+}
+ 
+uint32_t libdivide_u32_do_alg0(uint32_t numer, const struct libdivide_u32_t *denom) {
+    return numer >> (denom->more & LIBDIVIDE_32_SHIFT_MASK);
+}
+ 
+uint32_t libdivide_u32_do_alg1(uint32_t numer, const struct libdivide_u32_t *denom) {
+    uint32_t q = libdivide__mullhi_u32(denom->magic, numer);
+    return q >> denom->more;
+}    
+ 
+uint32_t libdivide_u32_do_alg2(uint32_t numer, const struct libdivide_u32_t *denom) {
+    // denom->add != 0
+    uint32_t q = libdivide__mullhi_u32(denom->magic, numer);
+    uint32_t t = ((numer - q) >> 1) + q;
+    return t >> (denom->more & LIBDIVIDE_32_SHIFT_MASK);
+}
+
+
+
+    
+#if LIBDIVIDE_USE_SSE2    
+__m128i libdivide_u32_do_vector(__m128i numers, const struct libdivide_u32_t *denom) {
+    uint8_t more = denom->more;
+    if (more & LIBDIVIDE_U32_SHIFT_PATH) {
+        return _mm_srl_epi32(numers, libdivide_u32_to_m128i(more & LIBDIVIDE_32_SHIFT_MASK));
+    }
+    else {
+        __m128i q = libdivide__mullhi_u32_flat_vector(numers, _mm_set1_epi32(denom->magic));
+        if (more & LIBDIVIDE_ADD_MARKER) {
+            //uint32_t t = ((numer - q) >> 1) + q;
+            //return t >> denom->shift;
+            __m128i t = _mm_add_epi32(_mm_srli_epi32(_mm_sub_epi32(numers, q), 1), q);
+            return _mm_srl_epi32(t, libdivide_u32_to_m128i(more & LIBDIVIDE_32_SHIFT_MASK));
+            
+        }
+        else {
+            //q >> denom->shift
+            return _mm_srl_epi32(q, libdivide_u32_to_m128i(more));
+        }
+    }
+}
+
+__m128i libdivide_u32_do_vector_alg0(__m128i numers, const struct libdivide_u32_t *denom) {
+    return _mm_srl_epi32(numers, libdivide_u32_to_m128i(denom->more & LIBDIVIDE_32_SHIFT_MASK));
+}
+
+__m128i libdivide_u32_do_vector_alg1(__m128i numers, const struct libdivide_u32_t *denom) {
+    __m128i q = libdivide__mullhi_u32_flat_vector(numers, _mm_set1_epi32(denom->magic));
+    return _mm_srl_epi32(q, libdivide_u32_to_m128i(denom->more));
+}
+
+__m128i libdivide_u32_do_vector_alg2(__m128i numers, const struct libdivide_u32_t *denom) {
+    __m128i q = libdivide__mullhi_u32_flat_vector(numers, _mm_set1_epi32(denom->magic));
+    __m128i t = _mm_add_epi32(_mm_srli_epi32(_mm_sub_epi32(numers, q), 1), q);
+    return _mm_srl_epi32(t, libdivide_u32_to_m128i(denom->more & LIBDIVIDE_32_SHIFT_MASK));
+}
+
+#endif
+ 
+/////////// UINT64
+
+struct libdivide_u64_t libdivide_u64_gen(uint64_t d) {
+    struct libdivide_u64_t result;
+    if ((d & (d - 1)) == 0) {
+        result.more = libdivide__count_trailing_zeros64(d) | LIBDIVIDE_U64_SHIFT_PATH;
+        result.magic = 0;
+    }
+    else {
+        const uint32_t floor_log_2_d = 63 - libdivide__count_leading_zeros64(d);
+        
+        uint64_t proposed_m, rem;
+        uint8_t more;
+        proposed_m = libdivide_128_div_64_to_64(1ULL << floor_log_2_d, 0, d, &rem); //== (1 << (64 + floor_log_2_d)) / d
+
+        LIBDIVIDE_ASSERT(rem > 0 && rem < d);
+        const uint64_t e = d - rem;
+	
+	/* This power works if e < 2**floor_log_2_d. */
+	if (e < (1ULL << floor_log_2_d)) {
+            /* This power works */
+            more = floor_log_2_d;
+        }
+        else {
+            /* We have to use the general 65-bit algorithm.  We need to compute (2**power) / d. However, we already have (2**(power-1))/d and its remainder.  By doubling both, and then correcting the remainder, we can compute the larger division. */
+            proposed_m += proposed_m; //don't care about overflow here - in fact, we expect it
+            const uint64_t twice_rem = rem + rem;
+            if (twice_rem >= d || twice_rem < rem) proposed_m += 1;
+            more = floor_log_2_d | LIBDIVIDE_ADD_MARKER;
+        }
+        result.magic = 1 + proposed_m;
+        result.more = more;
+        //result.more's shift should in general be ceil_log_2_d.  But if we used the smaller power, we subtract one from the shift because we're using the smaller power. If we're using the larger power, we subtract one from the shift because it's taken care of by the add indicator.  So floor_log_2_d happens to be correct in both cases, which is why we do it outside of the if statement.
+    }
+    return result;
+}
+
+uint64_t libdivide_u64_do(uint64_t numer, const struct libdivide_u64_t *denom) {
+    uint8_t more = denom->more;
+    if (more & LIBDIVIDE_U64_SHIFT_PATH) {
+        return numer >> (more & LIBDIVIDE_64_SHIFT_MASK);
+    }
+    else {
+        uint64_t q = libdivide__mullhi_u64(denom->magic, numer);
+        if (more & LIBDIVIDE_ADD_MARKER) {
+            uint64_t t = ((numer - q) >> 1) + q;
+            return t >> (more & LIBDIVIDE_64_SHIFT_MASK);
+        }
+        else {
+            return q >> more; //all upper bits are 0 - don't need to mask them off
+        }
+    }
+}
+
+ 
+int libdivide_u64_get_algorithm(const struct libdivide_u64_t *denom) {
+    uint8_t more = denom->more;
+    if (more & LIBDIVIDE_U64_SHIFT_PATH) return 0;
+    else if (! (more & LIBDIVIDE_ADD_MARKER)) return 1;
+    else return 2;
+}
+ 
+uint64_t libdivide_u64_do_alg0(uint64_t numer, const struct libdivide_u64_t *denom) {
+    return numer >> (denom->more & LIBDIVIDE_64_SHIFT_MASK);    
+}
+ 
+uint64_t libdivide_u64_do_alg1(uint64_t numer, const struct libdivide_u64_t *denom) {
+    uint64_t q = libdivide__mullhi_u64(denom->magic, numer);
+    return q >> denom->more;
+}
+ 
+uint64_t libdivide_u64_do_alg2(uint64_t numer, const struct libdivide_u64_t *denom) {
+    uint64_t q = libdivide__mullhi_u64(denom->magic, numer);
+    uint64_t t = ((numer - q) >> 1) + q;
+    return t >> (denom->more & LIBDIVIDE_64_SHIFT_MASK);
+}
+ 
+#if LIBDIVIDE_USE_SSE2    
+__m128i libdivide_u64_do_vector(__m128i numers, const struct libdivide_u64_t * denom) {
+    uint8_t more = denom->more;
+    if (more & LIBDIVIDE_U64_SHIFT_PATH) {
+        return _mm_srl_epi64(numers, libdivide_u32_to_m128i(more & LIBDIVIDE_64_SHIFT_MASK));
+    }
+    else {
+        __m128i q = libdivide_mullhi_u64_flat_vector(numers, libdivide__u64_to_m128(denom->magic));
+        if (more & LIBDIVIDE_ADD_MARKER) {
+            //uint32_t t = ((numer - q) >> 1) + q;
+            //return t >> denom->shift;
+            __m128i t = _mm_add_epi64(_mm_srli_epi64(_mm_sub_epi64(numers, q), 1), q);
+            return _mm_srl_epi64(t, libdivide_u32_to_m128i(more & LIBDIVIDE_64_SHIFT_MASK));
+        }
+        else {
+            //q >> denom->shift
+            return _mm_srl_epi64(q, libdivide_u32_to_m128i(more));
+        }
+    }
+}
+
+__m128i libdivide_u64_do_vector_alg0(__m128i numers, const struct libdivide_u64_t *denom) {
+    return _mm_srl_epi64(numers, libdivide_u32_to_m128i(denom->more & LIBDIVIDE_64_SHIFT_MASK));
+}
+
+__m128i libdivide_u64_do_vector_alg1(__m128i numers, const struct libdivide_u64_t *denom) {
+    __m128i q = libdivide_mullhi_u64_flat_vector(numers, libdivide__u64_to_m128(denom->magic));
+    return _mm_srl_epi64(q, libdivide_u32_to_m128i(denom->more));
+}
+
+__m128i libdivide_u64_do_vector_alg2(__m128i numers, const struct libdivide_u64_t *denom) {
+    __m128i q = libdivide_mullhi_u64_flat_vector(numers, libdivide__u64_to_m128(denom->magic));
+    __m128i t = _mm_add_epi64(_mm_srli_epi64(_mm_sub_epi64(numers, q), 1), q);
+    return _mm_srl_epi64(t, libdivide_u32_to_m128i(denom->more & LIBDIVIDE_64_SHIFT_MASK));
+}
+
+    
+#endif
+ 
+/////////// SINT32
+ 
+
+static inline int32_t libdivide__mullhi_s32(int32_t x, int32_t y) {
+    int64_t xl = x, yl = y;
+    int64_t rl = xl * yl;
+    return (int32_t)(rl >> 32); //needs to be arithmetic shift
+}
+
+struct libdivide_s32_t libdivide_s32_gen(int32_t d) {
+    struct libdivide_s32_t result;
+    
+    /* If d is a power of 2, or negative a power of 2, we have to use a shift.  This is especially important because the magic algorithm fails for -1.  To check if d is a power of 2 or its inverse, it suffices to check whether its absolute value has exactly one bit set.  This works even for INT_MIN, because abs(INT_MIN) == INT_MIN, and INT_MIN has one bit set and is a power of 2.  */
+    uint32_t absD = (uint32_t)(d < 0 ? -d : d); //gcc optimizes this to the fast abs trick
+    if ((absD & (absD - 1)) == 0) { //check if exactly one bit is set, don't care if absD is 0 since that's divide by zero
+        result.magic = 0;
+        result.more = libdivide__count_trailing_zeros32(absD) | (d < 0 ? LIBDIVIDE_NEGATIVE_DIVISOR : 0) | LIBDIVIDE_S32_SHIFT_PATH;
+    }
+    else {
+        const uint32_t floor_log_2_d = 31 - libdivide__count_leading_zeros32(absD);
+        LIBDIVIDE_ASSERT(floor_log_2_d >= 1);    
+        
+        uint8_t more;
+        //the dividend here is 2**(floor_log_2_d + 31), so the low 32 bit word is 0 and the high word is floor_log_2_d - 1
+        uint32_t rem, proposed_m;
+        proposed_m = libdivide_64_div_32_to_32(1U << (floor_log_2_d - 1), 0, absD, &rem);
+        const uint32_t e = absD - rem;
+        
+        /* We are going to start with a power of floor_log_2_d - 1.  This works if works if e < 2**floor_log_2_d. */
+        if (e < (1U << floor_log_2_d)) {
+            /* This power works */
+            more = floor_log_2_d - 1;
+        }
+        else {
+            /* We need to go one higher.  This should not make proposed_m overflow, but it will make it negative when interpreted as an int32_t. */
+            proposed_m += proposed_m;
+            const uint32_t twice_rem = rem + rem;
+            if (twice_rem >= absD || twice_rem < rem) proposed_m += 1;
+            more = floor_log_2_d | LIBDIVIDE_ADD_MARKER | (d < 0 ? LIBDIVIDE_NEGATIVE_DIVISOR : 0); //use the general algorithm
+        }
+        proposed_m += 1;
+        result.magic = (d < 0 ? -(int32_t)proposed_m : (int32_t)proposed_m);
+        result.more = more;
+        
+    }
+    return result;
+}
+
+int32_t libdivide_s32_do(int32_t numer, const struct libdivide_s32_t *denom) {
+    uint8_t more = denom->more;
+    if (more & LIBDIVIDE_S32_SHIFT_PATH) {
+        uint8_t shifter = more & LIBDIVIDE_32_SHIFT_MASK;
+        int32_t q = numer + ((numer >> 31) & ((1 << shifter) - 1));
+        q = q >> shifter;
+        int32_t shiftMask = (int8_t)more >> 7; //must be arithmetic shift and then sign-extend
+        q = (q ^ shiftMask) - shiftMask;
+        return q;
+    }
+    else {
+        int32_t q = libdivide__mullhi_s32(denom->magic, numer);
+        if (more & LIBDIVIDE_ADD_MARKER) {
+            int32_t sign = (int8_t)more >> 7; //must be arithmetic shift and then sign extend
+            q += ((numer ^ sign) - sign);
+        }
+        q >>= more & LIBDIVIDE_32_SHIFT_MASK;
+        q += (q < 0);
+        return q;
+    }
+}    
+ 
+int libdivide_s32_get_algorithm(const struct libdivide_s32_t *denom) {
+    uint8_t more = denom->more;
+    int positiveDivisor = ! (more & LIBDIVIDE_NEGATIVE_DIVISOR);
+    if (more & LIBDIVIDE_S32_SHIFT_PATH) return (positiveDivisor ? 0 : 1);
+    else if (more & LIBDIVIDE_ADD_MARKER) return (positiveDivisor ? 2 : 3); 
+    else return 4;
+}
+ 
+int32_t libdivide_s32_do_alg0(int32_t numer, const struct libdivide_s32_t *denom) {
+    uint8_t shifter = denom->more & LIBDIVIDE_32_SHIFT_MASK;
+    int32_t q = numer + ((numer >> 31) & ((1 << shifter) - 1));
+    return q >> shifter;
+}
+ 
+int32_t libdivide_s32_do_alg1(int32_t numer, const struct libdivide_s32_t *denom) {
+    uint8_t shifter = denom->more & LIBDIVIDE_32_SHIFT_MASK;
+    int32_t q = numer + ((numer >> 31) & ((1 << shifter) - 1));
+    return - (q >> shifter);
+}
+ 
+int32_t libdivide_s32_do_alg2(int32_t numer, const struct libdivide_s32_t *denom) {
+    int32_t q = libdivide__mullhi_s32(denom->magic, numer);
+    q += numer;
+    q >>= denom->more & LIBDIVIDE_32_SHIFT_MASK;
+    q += (q < 0);    
+    return q;
+}
+ 
+int32_t libdivide_s32_do_alg3(int32_t numer, const struct libdivide_s32_t *denom) {
+    int32_t q = libdivide__mullhi_s32(denom->magic, numer);
+    q -= numer;
+    q >>= denom->more & LIBDIVIDE_32_SHIFT_MASK;
+    q += (q < 0);    
+    return q;
+}
+ 
+int32_t libdivide_s32_do_alg4(int32_t numer, const struct libdivide_s32_t *denom) {
+    int32_t q = libdivide__mullhi_s32(denom->magic, numer);
+    q >>= denom->more & LIBDIVIDE_32_SHIFT_MASK;
+    q += (q < 0);    
+    return q;
+}
+
+#if LIBDIVIDE_USE_SSE2    
+__m128i libdivide_s32_do_vector(__m128i numers, const struct libdivide_s32_t * denom) {
+    uint8_t more = denom->more;
+    if (more & LIBDIVIDE_S32_SHIFT_PATH) {
+        uint32_t shifter = more & LIBDIVIDE_32_SHIFT_MASK;
+        __m128i roundToZeroTweak = _mm_set1_epi32((1 << shifter) - 1); //could use _mm_srli_epi32 with an all -1 register        
+        __m128i q = _mm_add_epi32(numers, _mm_and_si128(_mm_srai_epi32(numers, 31), roundToZeroTweak)); //q = numer + ((numer >> 31) & roundToZeroTweak);
+        q = _mm_sra_epi32(q, libdivide_u32_to_m128i(shifter)); // q = q >> shifter
+        __m128i shiftMask = _mm_set1_epi32((int32_t)((int8_t)more >> 7)); //set all bits of shift mask = to the sign bit of more
+        q = _mm_sub_epi32(_mm_xor_si128(q, shiftMask), shiftMask); //q = (q ^ shiftMask) - shiftMask;
+        return q;
+    }
+    else {
+        __m128i q = libdivide_mullhi_s32_flat_vector(numers, _mm_set1_epi32(denom->magic));
+        if (more & LIBDIVIDE_ADD_MARKER) {
+            __m128i sign = _mm_set1_epi32((int32_t)(int8_t)more >> 7); //must be arithmetic shift
+            q = _mm_add_epi32(q, _mm_sub_epi32(_mm_xor_si128(numers, sign), sign)); // q += ((numer ^ sign) - sign);        
+        }
+        q = _mm_sra_epi32(q, libdivide_u32_to_m128i(more & LIBDIVIDE_32_SHIFT_MASK)); //q >>= shift
+        q = _mm_add_epi32(q, _mm_srli_epi32(q, 31)); // q += (q < 0)
+        return q;
+    }
+}
+
+__m128i libdivide_s32_do_vector_alg0(__m128i numers, const struct libdivide_s32_t *denom) {
+    uint8_t shifter = denom->more & LIBDIVIDE_32_SHIFT_MASK;
+    __m128i roundToZeroTweak = _mm_set1_epi32((1 << shifter) - 1);
+    __m128i q = _mm_add_epi32(numers, _mm_and_si128(_mm_srai_epi32(numers, 31), roundToZeroTweak));
+    return _mm_sra_epi32(q, libdivide_u32_to_m128i(shifter));
+}
+
+__m128i libdivide_s32_do_vector_alg1(__m128i numers, const struct libdivide_s32_t *denom) {
+    uint8_t shifter = denom->more & LIBDIVIDE_32_SHIFT_MASK;
+    __m128i roundToZeroTweak = _mm_set1_epi32((1 << shifter) - 1);
+    __m128i q = _mm_add_epi32(numers, _mm_and_si128(_mm_srai_epi32(numers, 31), roundToZeroTweak));
+    return _mm_sub_epi32(_mm_setzero_si128(), _mm_sra_epi32(q, libdivide_u32_to_m128i(shifter)));
+}
+
+__m128i libdivide_s32_do_vector_alg2(__m128i numers, const struct libdivide_s32_t *denom) {
+    __m128i q = libdivide_mullhi_s32_flat_vector(numers, _mm_set1_epi32(denom->magic));
+    q = _mm_add_epi32(q, numers);
+    q = _mm_sra_epi32(q, libdivide_u32_to_m128i(denom->more & LIBDIVIDE_32_SHIFT_MASK));
+    q = _mm_add_epi32(q, _mm_srli_epi32(q, 31));    
+    return q;
+}
+
+__m128i libdivide_s32_do_vector_alg3(__m128i numers, const struct libdivide_s32_t *denom) {
+    __m128i q = libdivide_mullhi_s32_flat_vector(numers, _mm_set1_epi32(denom->magic));
+    q = _mm_sub_epi32(q, numers);
+    q = _mm_sra_epi32(q, libdivide_u32_to_m128i(denom->more & LIBDIVIDE_32_SHIFT_MASK));
+    q = _mm_add_epi32(q, _mm_srli_epi32(q, 31));    
+    return q;
+}
+
+__m128i libdivide_s32_do_vector_alg4(__m128i numers, const struct libdivide_s32_t *denom) {
+    __m128i q = libdivide_mullhi_s32_flat_vector(numers, _mm_set1_epi32(denom->magic));
+    q = _mm_sra_epi32(q, libdivide_u32_to_m128i(denom->more)); //q >>= shift
+    q = _mm_add_epi32(q, _mm_srli_epi32(q, 31)); // q += (q < 0)
+    return q;    
+}
+#endif
+    
+///////////// SINT64
+ 
+
+struct libdivide_s64_t libdivide_s64_gen(int64_t d) {
+    struct libdivide_s64_t result;
+    
+    /* If d is a power of 2, or negative a power of 2, we have to use a shift.  This is especially important because the magic algorithm fails for -1.  To check if d is a power of 2 or its inverse, it suffices to check whether its absolute value has exactly one bit set.  This works even for INT_MIN, because abs(INT_MIN) == INT_MIN, and INT_MIN has one bit set and is a power of 2.  */
+    const uint64_t absD = (uint64_t)(d < 0 ? -d : d); //gcc optimizes this to the fast abs trick
+    if ((absD & (absD - 1)) == 0) { //check if exactly one bit is set, don't care if absD is 0 since that's divide by zero
+        result.more = libdivide__count_trailing_zeros64(absD) | (d < 0 ? LIBDIVIDE_NEGATIVE_DIVISOR : 0);
+        result.magic = 0;
+    }
+    else {
+        const uint32_t floor_log_2_d = 63 - libdivide__count_leading_zeros64(absD);  
+        
+        //the dividend here is 2**(floor_log_2_d + 63), so the low 64 bit word is 0 and the high word is floor_log_2_d - 1
+        uint8_t more;
+        uint64_t rem, proposed_m;
+        proposed_m = libdivide_128_div_64_to_64(1ULL << (floor_log_2_d - 1), 0, absD, &rem);
+        const uint64_t e = absD - rem;
+        
+        /* We are going to start with a power of floor_log_2_d - 1.  This works if works if e < 2**floor_log_2_d. */
+        if (e < (1ULL << floor_log_2_d)) {
+            /* This power works */
+            more = floor_log_2_d - 1;
+        }
+        else {
+            /* We need to go one higher.  This should not make proposed_m overflow, but it will make it negative when interpreted as an int32_t. */
+            proposed_m += proposed_m;
+            const uint64_t twice_rem = rem + rem;
+            if (twice_rem >= absD || twice_rem < rem) proposed_m += 1;
+            more = floor_log_2_d | LIBDIVIDE_ADD_MARKER | (d < 0 ? LIBDIVIDE_NEGATIVE_DIVISOR : 0);
+        }
+        proposed_m += 1;
+        result.more = more;
+        result.magic = (d < 0 ? -(int64_t)proposed_m : (int64_t)proposed_m);
+    }
+    return result;
+}
+
+int64_t libdivide_s64_do(int64_t numer, const struct libdivide_s64_t *denom) {
+    uint8_t more = denom->more;
+    int64_t magic = denom->magic;
+    if (magic == 0) { //shift path
+        uint32_t shifter = more & LIBDIVIDE_64_SHIFT_MASK;
+        int64_t q = numer + ((numer >> 63) & ((1LL << shifter) - 1));
+        q = q >> shifter;
+        int64_t shiftMask = (int8_t)more >> 7; //must be arithmetic shift and then sign-extend
+        q = (q ^ shiftMask) - shiftMask;
+        return q;
+    }
+    else {
+        int64_t q = libdivide__mullhi_s64(magic, numer);
+        if (more & LIBDIVIDE_ADD_MARKER) {
+            int64_t sign = (int8_t)more >> 7; //must be arithmetic shift and then sign extend
+            q += ((numer ^ sign) - sign);
+        }
+        q >>= more & LIBDIVIDE_64_SHIFT_MASK;
+        q += (q < 0);
+        return q;
+    }
+}    
+    
+ 
+int libdivide_s64_get_algorithm(const struct libdivide_s64_t *denom) {
+    uint8_t more = denom->more;
+    int positiveDivisor = ! (more & LIBDIVIDE_NEGATIVE_DIVISOR);
+    if (denom->magic == 0) return (positiveDivisor ? 0 : 1); //shift path
+    else if (more & LIBDIVIDE_ADD_MARKER) return (positiveDivisor ? 2 : 3);
+    else return 4;
+}
+ 
+int64_t libdivide_s64_do_alg0(int64_t numer, const struct libdivide_s64_t *denom) {
+    uint32_t shifter = denom->more & LIBDIVIDE_64_SHIFT_MASK;
+    int64_t q = numer + ((numer >> 63) & ((1LL << shifter) - 1));
+    return q >> shifter;    
+}
+ 
+int64_t libdivide_s64_do_alg1(int64_t numer, const struct libdivide_s64_t *denom) {
+    //denom->shifter != -1 && demo->shiftMask != 0
+    uint32_t shifter = denom->more & LIBDIVIDE_64_SHIFT_MASK;
+    int64_t q = numer + ((numer >> 63) & ((1LL << shifter) - 1));
+    return - (q >> shifter);
+}
+ 
+int64_t libdivide_s64_do_alg2(int64_t numer, const struct libdivide_s64_t *denom) {
+    int64_t q = libdivide__mullhi_s64(denom->magic, numer);
+    q += numer;
+    q >>= denom->more & LIBDIVIDE_64_SHIFT_MASK;
+    q += (q < 0);
+    return q;
+}
+    
+int64_t libdivide_s64_do_alg3(int64_t numer, const struct libdivide_s64_t *denom) {
+    int64_t q = libdivide__mullhi_s64(denom->magic, numer);
+    q -= numer;
+    q >>= denom->more & LIBDIVIDE_64_SHIFT_MASK;
+    q += (q < 0);    
+    return q;
+}
+    
+int64_t libdivide_s64_do_alg4(int64_t numer, const struct libdivide_s64_t *denom) {
+    int64_t q = libdivide__mullhi_s64(denom->magic, numer);
+    q >>= denom->more;
+    q += (q < 0);
+    return q;   
+}
+
+
+#if LIBDIVIDE_USE_SSE2
+__m128i libdivide_s64_do_vector(__m128i numers, const struct libdivide_s64_t * denom) {
+    uint8_t more = denom->more;
+    int64_t magic = denom->magic;
+    if (magic == 0) { //shift path
+        uint32_t shifter = more & LIBDIVIDE_64_SHIFT_MASK;
+        __m128i roundToZeroTweak = libdivide__u64_to_m128((1LL << shifter) - 1);
+        __m128i q = _mm_add_epi64(numers, _mm_and_si128(libdivide_s64_signbits(numers), roundToZeroTweak)); //q = numer + ((numer >> 63) & roundToZeroTweak);
+        q = libdivide_s64_shift_right_vector(q, shifter); // q = q >> shifter
+        __m128i shiftMask = _mm_set1_epi32((int32_t)((int8_t)more >> 7));
+        q = _mm_sub_epi64(_mm_xor_si128(q, shiftMask), shiftMask); //q = (q ^ shiftMask) - shiftMask;
+        return q;
+    }
+    else {
+        __m128i q = libdivide_mullhi_s64_flat_vector(numers, libdivide__u64_to_m128(magic));
+        if (more & LIBDIVIDE_ADD_MARKER) {
+            __m128i sign = _mm_set1_epi32((int32_t)((int8_t)more >> 7)); //must be arithmetic shift
+            q = _mm_add_epi64(q, _mm_sub_epi64(_mm_xor_si128(numers, sign), sign)); // q += ((numer ^ sign) - sign);        
+        }
+        q = libdivide_s64_shift_right_vector(q, more & LIBDIVIDE_64_SHIFT_MASK); //q >>= denom->mult_path.shift
+        q = _mm_add_epi64(q, _mm_srli_epi64(q, 63)); // q += (q < 0)
+        return q;
+    }
+}
+
+__m128i libdivide_s64_do_vector_alg0(__m128i numers, const struct libdivide_s64_t *denom) {
+    uint32_t shifter = denom->more & LIBDIVIDE_64_SHIFT_MASK;
+    __m128i roundToZeroTweak = libdivide__u64_to_m128((1LL << shifter) - 1);
+    __m128i q = _mm_add_epi64(numers, _mm_and_si128(libdivide_s64_signbits(numers), roundToZeroTweak));
+    q = libdivide_s64_shift_right_vector(q, shifter);
+    return q;
+}
+
+__m128i libdivide_s64_do_vector_alg1(__m128i numers, const struct libdivide_s64_t *denom) {
+    uint32_t shifter = denom->more & LIBDIVIDE_64_SHIFT_MASK;
+    __m128i roundToZeroTweak = libdivide__u64_to_m128((1LL << shifter) - 1);
+    __m128i q = _mm_add_epi64(numers, _mm_and_si128(libdivide_s64_signbits(numers), roundToZeroTweak));
+    q = libdivide_s64_shift_right_vector(q, shifter);
+    return _mm_sub_epi64(_mm_setzero_si128(), q);
+}
+
+__m128i libdivide_s64_do_vector_alg2(__m128i numers, const struct libdivide_s64_t *denom) {
+    __m128i q = libdivide_mullhi_s64_flat_vector(numers, libdivide__u64_to_m128(denom->magic));
+    q = _mm_add_epi64(q, numers);
+    q = libdivide_s64_shift_right_vector(q, denom->more & LIBDIVIDE_64_SHIFT_MASK);
+    q = _mm_add_epi64(q, _mm_srli_epi64(q, 63)); // q += (q < 0)
+    return q;
+}
+
+__m128i libdivide_s64_do_vector_alg3(__m128i numers, const struct libdivide_s64_t *denom) {
+    __m128i q = libdivide_mullhi_s64_flat_vector(numers, libdivide__u64_to_m128(denom->magic));
+    q = _mm_sub_epi64(q, numers);
+    q = libdivide_s64_shift_right_vector(q, denom->more & LIBDIVIDE_64_SHIFT_MASK);
+    q = _mm_add_epi64(q, _mm_srli_epi64(q, 63)); // q += (q < 0)
+    return q;    
+}
+
+__m128i libdivide_s64_do_vector_alg4(__m128i numers, const struct libdivide_s64_t *denom) {
+    __m128i q = libdivide_mullhi_s64_flat_vector(numers, libdivide__u64_to_m128(denom->magic));
+    q = libdivide_s64_shift_right_vector(q, denom->more);
+    q = _mm_add_epi64(q, _mm_srli_epi64(q, 63));
+    return q;   
+}
+
+#endif
+ 
+/////////// C++ stuff
+ 
+#ifdef __cplusplus
+
+/* The C++ template design here is a total mess.  This needs to be fixed by someone better at templates than I.  The current design is:
+
+- The base is a template divider_base that takes the integer type, the libdivide struct, a generating function, a get algorithm function, a do function, and either a do vector function or a dummy int.
+- The base has storage for the libdivide struct.  This is the only storage (so the C++ class should be no larger than the libdivide struct).
+
+- Above that, there's divider_mid.  This is an empty struct by default, but it is specialized against our four int types.  divider_mid contains a template struct algo, that contains a typedef for a specialization of divider_base.  struct algo is specialized to take an "algorithm number," where -1 means to use the general algorithm.
+
+- Publicly we have class divider, which inherits from divider_mid::algo.  This also take an algorithm number, which defaults to -1 (the general algorithm).
+- divider has a operator / which allows you to use a divider as the divisor in a quotient expression.
+
+*/
+
+namespace libdivide_internal {
+    
+#if LIBDIVIDE_USE_SSE2
+#define MAYBE_VECTOR(x) x
+#define MAYBE_VECTOR_PARAM __m128i vector_func(__m128i, const DenomType *)
+#else
+#define MAYBE_VECTOR(x) 0
+#define MAYBE_VECTOR_PARAM int vector_func
+#endif
+
+    /* Some bogus unswitch functions for unsigned types so the same (presumably templated) code can work for both signed and unsigned. */
+    uint32_t crash_u32(uint32_t, const libdivide_u32_t *) { abort(); return *(uint32_t *)NULL; }
+    uint64_t crash_u64(uint64_t, const libdivide_u64_t *) { abort(); return *(uint64_t *)NULL; }
+#if LIBDIVIDE_USE_SSE2
+    __m128i crash_u32_vector(__m128i, const libdivide_u32_t *) { abort(); return *(__m128i *)NULL; }
+    __m128i crash_u64_vector(__m128i, const libdivide_u64_t *) { abort(); return *(__m128i *)NULL; }
+#endif
+
+    template<typename IntType, typename DenomType, DenomType gen_func(IntType), int get_algo(const DenomType *), IntType do_func(IntType, const DenomType *), MAYBE_VECTOR_PARAM>
+    class divider_base {  
+    public:
+        DenomType denom;
+        divider_base(IntType d) : denom(gen_func(d)) { }
+        divider_base(const DenomType & d) : denom(d) { }
+        
+        IntType perform_divide(IntType val) const { return do_func(val, &denom); }
+#if LIBDIVIDE_USE_SSE2
+        __m128i perform_divide_vector(__m128i val) const { return vector_func(val, &denom); }
+#endif
+
+        int get_algorithm() const { return get_algo(&denom); }
+    };
+    
+    
+    template<class T> struct divider_mid { };
+    
+    template<> struct divider_mid<uint32_t> {
+        typedef uint32_t IntType;
+        typedef struct libdivide_u32_t DenomType;
+        template<IntType do_func(IntType, const DenomType *), MAYBE_VECTOR_PARAM> struct denom {
+            typedef divider_base<IntType, DenomType, libdivide_u32_gen, libdivide_u32_get_algorithm, do_func, vector_func> divider;
+        };
+        
+        template<int ALGO, int J = 0> struct algo { };
+        template<int J> struct algo<-1, J> { typedef denom<libdivide_u32_do, MAYBE_VECTOR(libdivide_u32_do_vector)>::divider divider; };
+        template<int J> struct algo<0, J>  { typedef denom<libdivide_u32_do_alg0, MAYBE_VECTOR(libdivide_u32_do_vector_alg0)>::divider divider; };
+        template<int J> struct algo<1, J>  { typedef denom<libdivide_u32_do_alg1, MAYBE_VECTOR(libdivide_u32_do_vector_alg1)>::divider divider; };
+        template<int J> struct algo<2, J>  { typedef denom<libdivide_u32_do_alg2, MAYBE_VECTOR(libdivide_u32_do_vector_alg2)>::divider divider; };
+      
+        /* Define two more bogus ones so that the same (templated, presumably) code can handle both signed and unsigned */  
+        template<int J> struct algo<3, J>  { typedef denom<crash_u32, MAYBE_VECTOR(crash_u32_vector)>::divider divider; };
+        template<int J> struct algo<4, J>  { typedef denom<crash_u32, MAYBE_VECTOR(crash_u32_vector)>::divider divider; };
+
+    };
+    
+    template<> struct divider_mid<int32_t> {
+        typedef int32_t IntType;
+        typedef struct libdivide_s32_t DenomType;
+        template<IntType do_func(IntType, const DenomType *), MAYBE_VECTOR_PARAM> struct denom {
+            typedef divider_base<IntType, DenomType, libdivide_s32_gen, libdivide_s32_get_algorithm, do_func, vector_func> divider;
+        };
+        
+      
+        template<int ALGO, int J = 0> struct algo { };
+        template<int J> struct algo<-1, J> { typedef denom<libdivide_s32_do, MAYBE_VECTOR(libdivide_s32_do_vector)>::divider divider; };
+        template<int J> struct algo<0, J>  { typedef denom<libdivide_s32_do_alg0, MAYBE_VECTOR(libdivide_s32_do_vector_alg0)>::divider divider; };
+        template<int J> struct algo<1, J>  { typedef denom<libdivide_s32_do_alg1, MAYBE_VECTOR(libdivide_s32_do_vector_alg1)>::divider divider; };
+        template<int J> struct algo<2, J>  { typedef denom<libdivide_s32_do_alg2, MAYBE_VECTOR(libdivide_s32_do_vector_alg2)>::divider divider; };
+        template<int J> struct algo<3, J>  { typedef denom<libdivide_s32_do_alg3, MAYBE_VECTOR(libdivide_s32_do_vector_alg3)>::divider divider; };
+        template<int J> struct algo<4, J>  { typedef denom<libdivide_s32_do_alg4, MAYBE_VECTOR(libdivide_s32_do_vector_alg4)>::divider divider; };
+        
+    };
+    
+    template<> struct divider_mid<uint64_t> {
+        typedef uint64_t IntType;
+        typedef struct libdivide_u64_t DenomType;
+        template<IntType do_func(IntType, const DenomType *), MAYBE_VECTOR_PARAM> struct denom {
+            typedef divider_base<IntType, DenomType, libdivide_u64_gen, libdivide_u64_get_algorithm, do_func, vector_func> divider;
+        };
+        
+        template<int ALGO, int J = 0> struct algo { };
+        template<int J> struct algo<-1, J> { typedef denom<libdivide_u64_do, MAYBE_VECTOR(libdivide_u64_do_vector)>::divider divider; };
+        template<int J> struct algo<0, J>  { typedef denom<libdivide_u64_do_alg0, MAYBE_VECTOR(libdivide_u64_do_vector_alg0)>::divider divider; };
+        template<int J> struct algo<1, J>  { typedef denom<libdivide_u64_do_alg1, MAYBE_VECTOR(libdivide_u64_do_vector_alg1)>::divider divider; };
+        template<int J> struct algo<2, J>  { typedef denom<libdivide_u64_do_alg2, MAYBE_VECTOR(libdivide_u64_do_vector_alg2)>::divider divider; };
+        
+        /* Define two more bogus ones so that the same (templated, presumably) code can handle both signed and unsigned */
+        template<int J> struct algo<3, J>  { typedef denom<crash_u64, MAYBE_VECTOR(crash_u64_vector)>::divider divider; };
+        template<int J> struct algo<4, J>  { typedef denom<crash_u64, MAYBE_VECTOR(crash_u64_vector)>::divider divider; };
+
+
+    };
+    
+    template<> struct divider_mid<int64_t> {
+        typedef int64_t IntType;
+        typedef struct libdivide_s64_t DenomType;
+        template<IntType do_func(IntType, const DenomType *), MAYBE_VECTOR_PARAM> struct denom {
+            typedef divider_base<IntType, DenomType, libdivide_s64_gen, libdivide_s64_get_algorithm, do_func, vector_func> divider;
+        };
+        
+        template<int ALGO, int J = 0> struct algo { };
+        template<int J> struct algo<-1, J> { typedef denom<libdivide_s64_do, MAYBE_VECTOR(libdivide_s64_do_vector)>::divider divider; };
+        template<int J> struct algo<0, J>  { typedef denom<libdivide_s64_do_alg0, MAYBE_VECTOR(libdivide_s64_do_vector_alg0)>::divider divider; };
+        template<int J> struct algo<1, J>  { typedef denom<libdivide_s64_do_alg1, MAYBE_VECTOR(libdivide_s64_do_vector_alg1)>::divider divider; };
+        template<int J> struct algo<2, J>  { typedef denom<libdivide_s64_do_alg2, MAYBE_VECTOR(libdivide_s64_do_vector_alg2)>::divider divider; };
+        template<int J> struct algo<3, J>  { typedef denom<libdivide_s64_do_alg3, MAYBE_VECTOR(libdivide_s64_do_vector_alg3)>::divider divider; };
+        template<int J> struct algo<4, J>  { typedef denom<libdivide_s64_do_alg4, MAYBE_VECTOR(libdivide_s64_do_vector_alg4)>::divider divider; };
+    };
+
+}
+
+template<typename T, int ALGO = -1>
+class divider
+{
+    private:
+    typename libdivide_internal::divider_mid<T>::template algo<ALGO>::divider sub;
+    template<int NEW_ALGO, typename S> friend divider<S, NEW_ALGO> unswitch(const divider<S, -1> & d);
+    divider(const typename libdivide_internal::divider_mid<T>::DenomType & denom) : sub(denom) { }
+    
+    public:
+    
+    /* Ordinary constructor, that takes the divisor as a parameter. */
+    divider(T n) : sub(n) { }
+    
+    /* Default constructor, that divides by 1 */
+    divider() : sub(1) { }
+    
+    /* Divides the parameter by the divisor, returning the quotient */
+    T perform_divide(T val) const { return sub.perform_divide(val); }
+    
+#if LIBDIVIDE_USE_SSE2
+    /* Treats the vector as either two or four packed values (depending on the size), and divides each of them by the divisor, returning the packed quotients. */
+    __m128i perform_divide_vector(__m128i val) const { return sub.perform_divide_vector(val); } 
+#endif
+
+    /* Returns the index of algorithm, for use in the unswitch function */
+    int get_algorithm() const { return sub.get_algorithm(); } // returns the algorithm for unswitching
+    
+    /* operator== */
+    bool operator==(const divider<T, ALGO> & him) const { return sub.denom.magic == him.sub.denom.magic && sub.denom.more == him.sub.denom.more; }
+    
+    bool operator!=(const divider<T, ALGO> & him) const { return ! (*this == him); }
+};
+
+/* Returns a divider specialized for the given algorithm. */
+template<int NEW_ALGO, typename S>
+divider<S, NEW_ALGO> unswitch(const divider<S, -1> & d) { return divider<S, NEW_ALGO>(d.sub.denom); }
+
+/* Overload of the / operator for scalar division. */
+template<typename int_type, int ALGO>
+int_type operator/(int_type numer, const divider<int_type, ALGO> & denom) {
+    return denom.perform_divide(numer);
+}
+
+#if  LIBDIVIDE_USE_SSE2
+/* Overload of the / operator for vector division. */
+template<typename int_type, int ALGO>
+__m128i operator/(__m128i numer, const divider<int_type, ALGO> & denom) {
+    return denom.perform_divide_vector(numer);
+}
+#endif
+ 
+ 
+#endif //__cplusplus
+    
+#endif //LIBDIVIDE_HEADER_ONLY
+#ifdef __cplusplus
+} //close namespace libdivide
+} //close anonymous namespace
+#endif
diff --git a/libs/libmysqlxx/src/Connection.cpp b/libs/libmysqlxx/src/Connection.cpp
index c3f423f7ff8..2029de28575 100644
--- a/libs/libmysqlxx/src/Connection.cpp
+++ b/libs/libmysqlxx/src/Connection.cpp
@@ -69,7 +69,7 @@ void Connection::connect(const char* db,
 	if (!mysql_real_connect(&driver, server, user, password, db, port, nullptr, driver.client_flag))
 		throw ConnectionFailed(errorMessage(&driver), mysql_errno(&driver));
 
-	/// Установим кодировки по-умолчанию - UTF-8.
+	/// Установим кодировки по умолчанию - UTF-8.
 	if (mysql_set_character_set(&driver, "UTF8"))
 		throw ConnectionFailed(errorMessage(&driver), mysql_errno(&driver));
 
diff --git a/libs/libzkutil/include/zkutil/ZooKeeper.h b/libs/libzkutil/include/zkutil/ZooKeeper.h
index e45db4addb1..999c68319b6 100644
--- a/libs/libzkutil/include/zkutil/ZooKeeper.h
+++ b/libs/libzkutil/include/zkutil/ZooKeeper.h
@@ -84,6 +84,10 @@ public:
 	 */
 	void createIfNotExists(const std::string & path, const std::string & data);
 
+	/** Создает всех еще не существующих предков ноды, с пустыми данными. Саму указанную ноду не создает.
+	  */
+	void createAncestors(const std::string & path);
+
 	/** Удалить ноду, если ее версия равна version (если -1, подойдет любая версия).
 	  */
 	void remove(const std::string & path, int32_t version = -1);
diff --git a/libs/libzkutil/src/ZooKeeper.cpp b/libs/libzkutil/src/ZooKeeper.cpp
index 35fd1831873..d0584bf2ea4 100644
--- a/libs/libzkutil/src/ZooKeeper.cpp
+++ b/libs/libzkutil/src/ZooKeeper.cpp
@@ -236,6 +236,19 @@ void ZooKeeper::createIfNotExists(const std::string & path, const std::string &
 		throw KeeperException(code, path);
 }
 
+void ZooKeeper::createAncestors(const std::string & path)
+{
+	size_t pos = 1;
+	while (true)
+	{
+		pos = path.find('/', pos);
+		if (pos == std::string::npos)
+			break;
+		createIfNotExists(path.substr(0, pos), "");
+		++pos;
+	}
+}
+
 int32_t ZooKeeper::removeImpl(const std::string & path, int32_t version)
 {
 	int32_t code = zoo_delete(impl, path.c_str(), version);
@@ -369,6 +382,12 @@ int32_t ZooKeeper::multiImpl(const Ops & ops_, OpResultsPtr * out_results_)
 	if (ops_.empty())
 		return ZOK;
 
+	/// Workaround ошибки в сишном клиенте ZooKeeper. Если сессия истекла, zoo_multi иногда падает с segfault.
+	/// Наверно, здесь есть race condition, и возможен segfault, если сессия истечет между этой проверкой и zoo_multi.
+	/// TODO: Посмотреть, не исправлено ли это в последней версии клиента, и исправить.
+	if (expired())
+		return ZINVALIDSTATE;
+
 	size_t count = ops_.size();
 	OpResultsPtr out_results(new OpResults(count));
 
@@ -482,15 +501,21 @@ void ZooKeeper::tryRemoveRecursive(const std::string & path)
 
 ZooKeeper::~ZooKeeper()
 {
+	LOG_INFO(&Logger::get("~ZooKeeper"), "Closing ZooKeeper session");
+
 	int code = zookeeper_close(impl);
 	if (code != ZOK)
 	{
 		LOG_ERROR(&Logger::get("~ZooKeeper"), "Failed to close ZooKeeper session: " << zerror(code));
 	}
 
+	LOG_INFO(&Logger::get("~ZooKeeper"), "Removing " << watch_store.size() << " watches");
+
 	/// удаляем WatchWithEvent которые уже никогда не будут обработаны
 	for (WatchWithEvent * watch : watch_store)
 		delete watch;
+
+	LOG_INFO(&Logger::get("~ZooKeeper"), "Removed watches");
 }
 
 ZooKeeperPtr ZooKeeper::startNewSession() const
diff --git a/libs/libzkutil/src/tests/zkutil_expiration_test.cpp b/libs/libzkutil/src/tests/zkutil_expiration_test.cpp
new file mode 100644
index 00000000000..96ab72c7114
--- /dev/null
+++ b/libs/libzkutil/src/tests/zkutil_expiration_test.cpp
@@ -0,0 +1,67 @@
+#include <zkutil/ZooKeeper.h>
+#include <Poco/ConsoleChannel.h>
+
+
+/// Проверяет, какие ошибки выдает ZooKeeper при попытке сделать какую-нибудь операцию через разное время после истечения сессии.
+/// Спойлер: multi иногда падает с segfault, а до этого фейлится с marshalling error.
+///          create всегда фейлится с invalid zhandle state.
+
+int main(int argc, char ** argv)
+{
+	try
+	{
+		if (argc != 2)
+		{
+			std::cerr << "usage: " << argv[0] << " hosts" << std::endl;
+			return 2;
+		}
+
+		Poco::AutoPtr<Poco::ConsoleChannel> channel = new Poco::ConsoleChannel(std::cerr);
+		Logger::root().setChannel(channel);
+		Logger::root().setLevel("trace");
+
+		zkutil::ZooKeeper zk(argv[1]);
+		std::string unused;
+		zk.tryCreate("/test", "", zkutil::CreateMode::Persistent, unused);
+
+		std::cerr << "Please run `./nozk.sh && sleep 40s && ./yeszk.sh`" << std::endl;
+
+		time_t time0 = time(0);
+
+		while (true)
+		{
+			{
+				zkutil::Ops ops;
+				ops.push_back(new zkutil::Op::Create("/test/zk_expiration_test", "hello", zk.getDefaultACL(), zkutil::CreateMode::Persistent));
+				ops.push_back(new zkutil::Op::Remove("/test/zk_expiration_test", -1));
+
+				int code;
+				try
+				{
+					code = zk.tryMulti(ops);std::string unused;
+					//code = zk.tryCreate("/test", "", zkutil::CreateMode::Persistent, unused);
+				}
+				catch (zkutil::KeeperException & e)
+				{
+					code = e.code;
+				}
+
+				std::cout << time(0) - time0 << "s: " << zkutil::ZooKeeper::error2string(code) << std::endl;
+			}
+
+			sleep(1);
+		}
+	}
+	catch (zkutil::KeeperException & e)
+	{
+		std::cerr << "KeeperException: " << e.displayText() << std::endl;
+		return 1;
+	}
+	catch (...)
+	{
+		std::cerr << "Some exception" << std::endl;
+		return 2;
+	}
+
+	return 0;
+}
diff --git a/libs/libzkutil/src/tests/zkutil_test.cpp b/libs/libzkutil/src/tests/zkutil_test.cpp
index fc28c1e084b..0693ff93c94 100644
--- a/libs/libzkutil/src/tests/zkutil_test.cpp
+++ b/libs/libzkutil/src/tests/zkutil_test.cpp
@@ -180,6 +180,8 @@ int main(int argc, char ** argv)
 
 					DB::assertString("set", in);
 					DB::skipWhitespaceIfAny(in);
+					DB::assertString(path, in);
+					DB::skipWhitespaceIfAny(in);
 					readMaybeQuoted(data, in);
 					DB::skipWhitespaceIfAny(in);