2016-06-07 08:23:15 +00:00
|
|
|
|
#pragma once
|
|
|
|
|
|
|
|
|
|
#include <typeinfo>
|
|
|
|
|
#include <Poco/Exception.h>
|
|
|
|
|
#include <DB/Core/StringRef.h>
|
|
|
|
|
#include <common/Common.h>
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
/** Очень простой класс для чтения JSON (или его кусочков).
|
|
|
|
|
* Представляет собой ссылку на кусок памяти, в котором содержится JSON (или его кусочек).
|
|
|
|
|
* Не создаёт никаких структур данных в оперативке. Не выделяет память (кроме std::string).
|
|
|
|
|
* Не парсит JSON до конца (парсит только часть, необходимую для выполнения вызванного метода).
|
|
|
|
|
* Парсинг необходимой части запускается каждый раз при вызове методов.
|
|
|
|
|
* Может работать с обрезанным JSON-ом.
|
|
|
|
|
* При этом, (в отличие от SAX-подобных парсеров), предоставляет удобные методы для работы.
|
|
|
|
|
*
|
|
|
|
|
* Эта структура данных более оптимальна, если нужно доставать несколько элементов из большого количества маленьких JSON-ов.
|
|
|
|
|
* То есть, подходит для обработки "параметров визитов" и "параметров интернет магазинов" в Яндекс.Метрике.
|
|
|
|
|
* Если нужно много работать с одним большим JSON-ом, то этот класс может быть менее оптимальным.
|
|
|
|
|
*
|
|
|
|
|
* Имеются следующие соглашения:
|
|
|
|
|
* 1. Предполагается, что в JSON-е нет пробельных символов.
|
|
|
|
|
* 2. Предполагается, что строки в JSON в кодировке UTF-8; также могут использоваться \u-последовательности.
|
|
|
|
|
* Строки возвращаются в кодировке UTF-8, \u-последовательности переводятся в UTF-8.
|
|
|
|
|
* 3. Но суррогатная пара из двух \uXXXX\uYYYY переводится не в UTF-8, а в CESU-8.
|
|
|
|
|
* 4. Корректный JSON парсится корректно.
|
|
|
|
|
* При работе с некорректным JSON-ом, кидается исключение или возвращаются неверные результаты.
|
|
|
|
|
* (пример: считается, что если встретился символ 'n', то после него идёт 'ull' (null);
|
|
|
|
|
* если после него идёт ',1,', то исключение не кидается, и, таким образом, возвращается неверный результат)
|
|
|
|
|
* 5. Глубина вложенности JSON ограничена (см. MAX_JSON_DEPTH в cpp файле).
|
|
|
|
|
* При необходимости спуститься на большую глубину, кидается исключение.
|
|
|
|
|
* 6. В отличие от JSON, пользоволяет парсить значения вида 64-битное число, со знаком, или без.
|
|
|
|
|
* При этом, если число дробное - то дробная часть тихо отбрасывается.
|
|
|
|
|
* 7. Числа с плавающей запятой парсятся не с максимальной точностью.
|
|
|
|
|
*
|
|
|
|
|
* Подходит только для чтения JSON, модификация не предусмотрена.
|
|
|
|
|
* Все методы immutable, кроме operator++.
|
|
|
|
|
*/
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
POCO_DECLARE_EXCEPTION(Foundation_API, JSONException, Poco::Exception);
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
class JSON
|
|
|
|
|
{
|
|
|
|
|
private:
|
2016-06-08 13:08:20 +00:00
|
|
|
|
using Pos = const char *;
|
2016-06-07 08:23:15 +00:00
|
|
|
|
Pos ptr_begin;
|
|
|
|
|
Pos ptr_end;
|
|
|
|
|
unsigned level;
|
|
|
|
|
|
|
|
|
|
public:
|
|
|
|
|
JSON(Pos ptr_begin_, Pos ptr_end_, unsigned level_ = 0) : ptr_begin(ptr_begin_), ptr_end(ptr_end_), level(level_)
|
|
|
|
|
{
|
|
|
|
|
checkInit();
|
|
|
|
|
}
|
|
|
|
|
|
|
|
|
|
JSON(const std::string & s) : ptr_begin(s.data()), ptr_end(s.data() + s.size()), level(0)
|
|
|
|
|
{
|
|
|
|
|
checkInit();
|
|
|
|
|
}
|
|
|
|
|
|
|
|
|
|
JSON(const JSON & rhs) : ptr_begin(rhs.ptr_begin), ptr_end(rhs.ptr_end), level(rhs.level) {}
|
|
|
|
|
|
|
|
|
|
/// Для вставки в контейнеры (создаёт некорректный объект)
|
|
|
|
|
JSON() : ptr_begin(nullptr), ptr_end(ptr_begin + 1) {}
|
|
|
|
|
|
2016-06-08 13:08:20 +00:00
|
|
|
|
const char * data() const { return ptr_begin; }
|
|
|
|
|
const char * dataEnd() const { return ptr_end; }
|
2016-06-07 08:23:15 +00:00
|
|
|
|
|
|
|
|
|
enum ElementType
|
|
|
|
|
{
|
|
|
|
|
TYPE_OBJECT,
|
|
|
|
|
TYPE_ARRAY,
|
|
|
|
|
TYPE_NUMBER,
|
|
|
|
|
TYPE_STRING,
|
|
|
|
|
TYPE_BOOL,
|
|
|
|
|
TYPE_NULL,
|
|
|
|
|
TYPE_NAME_VALUE_PAIR,
|
|
|
|
|
TYPE_NOTYPE,
|
|
|
|
|
};
|
|
|
|
|
|
2016-06-08 13:08:20 +00:00
|
|
|
|
ElementType getType() const;
|
2016-06-07 08:23:15 +00:00
|
|
|
|
|
2016-06-08 13:08:20 +00:00
|
|
|
|
bool isObject() const { return getType() == TYPE_OBJECT; };
|
|
|
|
|
bool isArray() const { return getType() == TYPE_ARRAY; };
|
|
|
|
|
bool isNumber() const { return getType() == TYPE_NUMBER; };
|
|
|
|
|
bool isString() const { return getType() == TYPE_STRING; };
|
|
|
|
|
bool isBool() const { return getType() == TYPE_BOOL; };
|
|
|
|
|
bool isNull() const { return getType() == TYPE_NULL; };
|
|
|
|
|
bool isNameValuePair() const { return getType() == TYPE_NAME_VALUE_PAIR; };
|
2016-06-07 08:23:15 +00:00
|
|
|
|
|
|
|
|
|
/// Количество элементов в массиве или объекте; если элемент - не массив или объект, то исключение.
|
2016-06-08 13:08:20 +00:00
|
|
|
|
size_t size() const;
|
2016-06-07 08:23:15 +00:00
|
|
|
|
|
|
|
|
|
/// Является ли массив или объект пустыми; если элемент - не массив или объект, то исключение.
|
2016-06-08 13:08:20 +00:00
|
|
|
|
bool empty() const;
|
2016-06-07 08:23:15 +00:00
|
|
|
|
|
|
|
|
|
/// Получить элемент массива по индексу; если элемент - не массив, то исключение.
|
2016-06-08 13:08:20 +00:00
|
|
|
|
JSON operator[] (size_t n) const;
|
2016-06-07 08:23:15 +00:00
|
|
|
|
|
|
|
|
|
/// Получить элемент объекта по имени; если элемент - не объект, то исключение.
|
2016-06-08 13:08:20 +00:00
|
|
|
|
JSON operator[] (const std::string & name) const;
|
2016-06-07 08:23:15 +00:00
|
|
|
|
|
|
|
|
|
/// Есть ли в объекте элемент с заданным именем; если элемент - не объект, то исключение.
|
2016-06-08 13:08:20 +00:00
|
|
|
|
bool has(const std::string & name) const { return has(name.data(), name.size()); }
|
|
|
|
|
bool has(const char * data, size_t size) const;
|
2016-06-07 08:23:15 +00:00
|
|
|
|
|
|
|
|
|
/// Получить значение элемента; исключение, если элемент имеет неправильный тип.
|
|
|
|
|
template <class T>
|
2016-06-08 13:08:20 +00:00
|
|
|
|
T get() const;
|
2016-06-07 08:23:15 +00:00
|
|
|
|
|
|
|
|
|
/// если значения нет, или тип неверный, то возвращает дефолтное значение
|
|
|
|
|
template <class T>
|
2016-06-08 13:08:20 +00:00
|
|
|
|
T getWithDefault(const std::string & key, const T & default_ = T()) const;
|
2016-06-07 08:23:15 +00:00
|
|
|
|
|
2016-06-08 13:08:20 +00:00
|
|
|
|
double getDouble() const;
|
|
|
|
|
Int64 getInt() const; /// Отбросить дробную часть.
|
|
|
|
|
UInt64 getUInt() const; /// Отбросить дробную часть. Если число отрицательное - исключение.
|
|
|
|
|
std::string getString() const;
|
|
|
|
|
bool getBool() const;
|
|
|
|
|
std::string getName() const; /// Получить имя name-value пары.
|
|
|
|
|
JSON getValue() const; /// Получить значение name-value пары.
|
2016-06-07 08:23:15 +00:00
|
|
|
|
|
2016-06-08 13:08:20 +00:00
|
|
|
|
StringRef getRawString() const;
|
|
|
|
|
StringRef getRawName() const;
|
2016-06-07 08:23:15 +00:00
|
|
|
|
|
|
|
|
|
/// Получить значение элемента; если элемент - строка, то распарсить значение из строки; если не строка или число - то исключение.
|
2016-06-08 13:08:20 +00:00
|
|
|
|
double toDouble() const;
|
|
|
|
|
Int64 toInt() const;
|
|
|
|
|
UInt64 toUInt() const;
|
2016-06-07 08:23:15 +00:00
|
|
|
|
|
|
|
|
|
/** Преобразовать любой элемент в строку.
|
|
|
|
|
* Для строки возвращается её значение, для всех остальных элементов - сериализованное представление.
|
|
|
|
|
*/
|
2016-06-08 13:08:20 +00:00
|
|
|
|
std::string toString() const;
|
2016-06-07 08:23:15 +00:00
|
|
|
|
|
|
|
|
|
/// Класс JSON одновременно является итератором по самому себе.
|
2016-06-08 13:08:20 +00:00
|
|
|
|
using iterator = JSON;
|
|
|
|
|
using const_iterator = JSON;
|
2016-06-07 08:23:15 +00:00
|
|
|
|
|
2016-06-08 13:08:20 +00:00
|
|
|
|
iterator operator* () const { return *this; }
|
|
|
|
|
const JSON * operator-> () const { return this; }
|
|
|
|
|
bool operator== (const JSON & rhs) const { return ptr_begin == rhs.ptr_begin; }
|
|
|
|
|
bool operator!= (const JSON & rhs) const { return ptr_begin != rhs.ptr_begin; }
|
2016-06-07 08:23:15 +00:00
|
|
|
|
|
|
|
|
|
/** Если элемент - массив или объект, то begin() возвращает iterator,
|
|
|
|
|
* который указывает на первый элемент массива или первую name-value пару объекта.
|
|
|
|
|
*/
|
2016-06-08 13:08:20 +00:00
|
|
|
|
iterator begin() const;
|
2016-06-07 08:23:15 +00:00
|
|
|
|
|
|
|
|
|
/** end() - значение, которое нельзя использовать; сигнализирует о том, что элементы закончились.
|
|
|
|
|
*/
|
2016-06-08 13:08:20 +00:00
|
|
|
|
iterator end() const;
|
2016-06-07 08:23:15 +00:00
|
|
|
|
|
|
|
|
|
/// Перейти к следующему элементу массива или следующей name-value паре объекта.
|
|
|
|
|
iterator & operator++();
|
|
|
|
|
iterator operator++(int);
|
|
|
|
|
|
|
|
|
|
/// Есть ли в строке escape-последовательности
|
2016-06-08 13:08:20 +00:00
|
|
|
|
bool hasEscapes() const;
|
2016-06-07 08:23:15 +00:00
|
|
|
|
|
|
|
|
|
/// Есть ли в строке спец-символы из набора \, ', \0, \b, \f, \r, \n, \t, возможно, заэскейпленные.
|
2016-06-08 13:08:20 +00:00
|
|
|
|
bool hasSpecialChars() const;
|
2016-06-07 08:23:15 +00:00
|
|
|
|
|
|
|
|
|
private:
|
|
|
|
|
/// Проверить глубину рекурсии, а также корректность диапазона памяти.
|
2016-06-08 13:08:20 +00:00
|
|
|
|
void checkInit() const;
|
2016-06-07 08:23:15 +00:00
|
|
|
|
/// Проверить, что pos лежит внутри диапазона памяти.
|
2016-06-08 13:08:20 +00:00
|
|
|
|
void checkPos(Pos pos) const;
|
2016-06-07 08:23:15 +00:00
|
|
|
|
|
|
|
|
|
/// Вернуть позицию после заданного элемента.
|
2016-06-08 13:08:20 +00:00
|
|
|
|
Pos skipString() const;
|
|
|
|
|
Pos skipNumber() const;
|
|
|
|
|
Pos skipBool() const;
|
|
|
|
|
Pos skipNull() const;
|
|
|
|
|
Pos skipNameValuePair() const;
|
|
|
|
|
Pos skipObject() const;
|
|
|
|
|
Pos skipArray() const;
|
2016-06-07 08:23:15 +00:00
|
|
|
|
|
2016-06-08 13:08:20 +00:00
|
|
|
|
Pos skipElement() const;
|
2016-06-07 08:23:15 +00:00
|
|
|
|
|
|
|
|
|
/// Найти name-value пару с заданным именем в объекте.
|
2016-06-08 13:08:20 +00:00
|
|
|
|
Pos searchField(const std::string & name) const { return searchField(name.data(), name.size()); }
|
|
|
|
|
Pos searchField(const char * data, size_t size) const;
|
2016-06-07 08:23:15 +00:00
|
|
|
|
|
|
|
|
|
template <class T>
|
2016-06-08 13:08:20 +00:00
|
|
|
|
bool isType() const;
|
2016-06-07 08:23:15 +00:00
|
|
|
|
};
|
|
|
|
|
|
|
|
|
|
template <class T>
|
|
|
|
|
T JSON::getWithDefault(const std::string & key, const T & default_) const
|
|
|
|
|
{
|
|
|
|
|
if (has(key))
|
|
|
|
|
{
|
|
|
|
|
JSON key_json = (*this)[key];
|
|
|
|
|
|
|
|
|
|
if (key_json.isType<T>())
|
|
|
|
|
return key_json.get<T>();
|
|
|
|
|
else
|
|
|
|
|
return default_;
|
|
|
|
|
}
|
|
|
|
|
else
|
|
|
|
|
return default_;
|
|
|
|
|
}
|