mirror of
https://github.com/ClickHouse/ClickHouse.git
synced 2024-11-26 09:32:01 +00:00
dbms: improved performance of writing ints as text [#CONV-2944].
This commit is contained in:
parent
657deb8125
commit
45f88eb1d1
@ -15,11 +15,10 @@
|
||||
#include <DB/Core/ErrorCodes.h>
|
||||
|
||||
#include <DB/IO/WriteBuffer.h>
|
||||
#include <DB/IO/WriteIntText.h>
|
||||
#include <DB/IO/VarInt.h>
|
||||
|
||||
#define WRITE_HELPERS_DEFAULT_FLOAT_PRECISION 6U
|
||||
/// 20 цифр или 19 цифр и знак
|
||||
#define WRITE_HELPERS_MAX_INT_WIDTH 20U
|
||||
|
||||
|
||||
namespace DB
|
||||
@ -68,53 +67,6 @@ inline void writeBoolText(bool x, WriteBuffer & buf)
|
||||
}
|
||||
|
||||
|
||||
template <typename T>
|
||||
void writeIntText(T x, WriteBuffer & buf)
|
||||
{
|
||||
char tmp[WRITE_HELPERS_MAX_INT_WIDTH];
|
||||
bool negative = false;
|
||||
|
||||
if (x == 0)
|
||||
{
|
||||
writeChar('0', buf);
|
||||
return;
|
||||
}
|
||||
|
||||
/// Особый случай для самого маленького отрицательного числа
|
||||
if (unlikely(std::tr1::is_signed<T>::value && x == std::numeric_limits<T>::min()))
|
||||
{
|
||||
if (sizeof(x) == 1)
|
||||
buf.write("-128", 4);
|
||||
else if (sizeof(x) == 2)
|
||||
buf.write("-32768", 6);
|
||||
else if (sizeof(x) == 4)
|
||||
buf.write("-2147483648", 11);
|
||||
else
|
||||
buf.write("-9223372036854775808", 20);
|
||||
return;
|
||||
}
|
||||
|
||||
if (x < 0)
|
||||
{
|
||||
x = -x;
|
||||
negative = true;
|
||||
}
|
||||
|
||||
char * pos;
|
||||
for (pos = tmp + WRITE_HELPERS_MAX_INT_WIDTH - 1; x != 0; --pos)
|
||||
{
|
||||
*pos = '0' + x % 10;
|
||||
x /= 10;
|
||||
}
|
||||
|
||||
if (negative)
|
||||
*pos = '-';
|
||||
else
|
||||
++pos;
|
||||
|
||||
buf.write(pos, tmp + WRITE_HELPERS_MAX_INT_WIDTH - pos);
|
||||
}
|
||||
|
||||
template <typename T>
|
||||
void writeFloatText(T x, WriteBuffer & buf, unsigned precision = WRITE_HELPERS_DEFAULT_FLOAT_PRECISION)
|
||||
{
|
||||
|
185
dbms/include/DB/IO/WriteIntText.h
Normal file
185
dbms/include/DB/IO/WriteIntText.h
Normal file
@ -0,0 +1,185 @@
|
||||
#pragma once
|
||||
|
||||
#include <limits>
|
||||
#include <boost/type_traits.hpp>
|
||||
#include <boost/utility/enable_if.hpp>
|
||||
|
||||
/// 20 цифр или 19 цифр и знак
|
||||
#define WRITE_HELPERS_MAX_INT_WIDTH 20U
|
||||
|
||||
|
||||
namespace DB
|
||||
{
|
||||
|
||||
namespace detail
|
||||
{
|
||||
/** Смотрите:
|
||||
* https://github.com/localvoid/cxx-benchmark-itoa
|
||||
* http://www.slideshare.net/andreialexandrescu1/three-optimization-tips-for-c-15708507
|
||||
* http://vimeo.com/55639112
|
||||
*/
|
||||
|
||||
|
||||
/// Обычный способ, если в буфере не хватает места, чтобы там поместилось любое число.
|
||||
template <typename T>
|
||||
void writeUIntTextFallback(T x, WriteBuffer & buf)
|
||||
{
|
||||
char tmp[WRITE_HELPERS_MAX_INT_WIDTH];
|
||||
|
||||
char * pos;
|
||||
for (pos = tmp + WRITE_HELPERS_MAX_INT_WIDTH - 1; x != 0; --pos)
|
||||
{
|
||||
*pos = '0' + x % 10;
|
||||
x /= 10;
|
||||
}
|
||||
|
||||
++pos;
|
||||
|
||||
buf.write(pos, tmp + WRITE_HELPERS_MAX_INT_WIDTH - pos);
|
||||
}
|
||||
|
||||
|
||||
/** Подсчёт количества десятичных цифр в числе.
|
||||
* Хорошо работает для неравномерного распределения чисел, которое обычно бывает.
|
||||
* Если большинство чисел длинные, то лучше работал бы branchless код с инструкцией bsr и хитрым преобразованием.
|
||||
*/
|
||||
template <typename T>
|
||||
UInt32 digits10(T x)
|
||||
{
|
||||
if (x < 10ULL)
|
||||
return 1;
|
||||
if (x < 100ULL)
|
||||
return 2;
|
||||
if (x < 1000ULL)
|
||||
return 3;
|
||||
|
||||
if (x < 1000000000000ULL)
|
||||
{
|
||||
if (x < 100000000ULL)
|
||||
{
|
||||
if (x < 1000000ULL)
|
||||
{
|
||||
if (x < 10000ULL)
|
||||
return 4;
|
||||
else
|
||||
return 5 + (x >= 100000ULL);
|
||||
}
|
||||
|
||||
return 7 + (x >= 10000000ULL);
|
||||
}
|
||||
|
||||
if (x < 10000000000ULL)
|
||||
return 9 + (x >= 1000000000ULL);
|
||||
|
||||
return 11 + (x >= 100000000000ULL);
|
||||
}
|
||||
|
||||
return 12 + digits10(x / 1000000000000ULL);
|
||||
}
|
||||
|
||||
|
||||
/** Преобразует по две цифры за итерацию.
|
||||
* Хорошо работает для неравномерного распределения чисел, которое обычно бывает.
|
||||
* Если большинство чисел длинные, и если не жалко кэш, то лучше работал бы вариант
|
||||
* с большой таблицей и четырьмя цифрами за итерацию.
|
||||
*/
|
||||
template <typename T>
|
||||
UInt32 writeUIntText(T x, char * dst)
|
||||
{
|
||||
static const char digits[201] =
|
||||
"00010203040506070809"
|
||||
"10111213141516171819"
|
||||
"20212223242526272829"
|
||||
"30313233343536373839"
|
||||
"40414243444546474849"
|
||||
"50515253545556575859"
|
||||
"60616263646566676869"
|
||||
"70717273747576777879"
|
||||
"80818283848586878889"
|
||||
"90919293949596979899";
|
||||
|
||||
const UInt32 length = digits10(x);
|
||||
UInt32 next = length - 1;
|
||||
|
||||
while (x >= 100)
|
||||
{
|
||||
const UInt32 i = (x % 100) * 2;
|
||||
x /= 100;
|
||||
dst[next] = digits[i + 1];
|
||||
dst[next - 1] = digits[i];
|
||||
next -= 2;
|
||||
}
|
||||
|
||||
if (x < 10)
|
||||
{
|
||||
dst[next] = '0' + x;
|
||||
}
|
||||
else
|
||||
{
|
||||
const UInt32 i = x * 2;
|
||||
dst[next] = digits[i + 1];
|
||||
dst[next - 1] = digits[i];
|
||||
}
|
||||
|
||||
return length;
|
||||
}
|
||||
|
||||
|
||||
/** Если в буфере есть достаточно места - вызывает оптимизированный вариант, иначе - обычный вариант.
|
||||
*/
|
||||
template <typename T>
|
||||
void writeUIntText(T x, WriteBuffer & buf)
|
||||
{
|
||||
if (likely(buf.position() + WRITE_HELPERS_MAX_INT_WIDTH < buf.buffer().end()))
|
||||
buf.position() += writeUIntText(x, buf.position());
|
||||
else
|
||||
writeUIntTextFallback(x, buf);
|
||||
}
|
||||
|
||||
|
||||
/** Обёртка для знаковых чисел.
|
||||
*/
|
||||
template <typename T>
|
||||
void writeSIntText(T x, WriteBuffer & buf)
|
||||
{
|
||||
/// Особый случай для самого маленького отрицательного числа
|
||||
if (unlikely(x == std::numeric_limits<T>::min()))
|
||||
{
|
||||
if (sizeof(x) == 1)
|
||||
buf.write("-128", 4);
|
||||
else if (sizeof(x) == 2)
|
||||
buf.write("-32768", 6);
|
||||
else if (sizeof(x) == 4)
|
||||
buf.write("-2147483648", 11);
|
||||
else
|
||||
buf.write("-9223372036854775808", 20);
|
||||
return;
|
||||
}
|
||||
|
||||
if (x < 0)
|
||||
{
|
||||
x = -x;
|
||||
buf.nextIfAtEnd();
|
||||
*buf.position() = '-';
|
||||
++buf.position();
|
||||
}
|
||||
|
||||
writeUIntText(static_cast<typename boost::make_unsigned<T>::type>(x), buf);
|
||||
}
|
||||
|
||||
}
|
||||
|
||||
|
||||
template <typename T>
|
||||
typename boost::enable_if<std::tr1::is_signed<T>, void>::type writeIntText(T x, WriteBuffer & buf)
|
||||
{
|
||||
detail::writeSIntText(x, buf);
|
||||
}
|
||||
|
||||
template <typename T>
|
||||
typename boost::disable_if<std::tr1::is_signed<T>, void>::type writeIntText(T x, WriteBuffer & buf)
|
||||
{
|
||||
detail::writeUIntText(x, buf);
|
||||
}
|
||||
|
||||
}
|
Loading…
Reference in New Issue
Block a user