2016-06-21 00:39:22 +00:00
# Как писать код на C++
2016-06-21 00:30:30 +00:00
2016-06-21 00:39:22 +00:00
## 0. Общее
2016-06-21 00:30:30 +00:00
2016-06-21 00:48:34 +00:00
1. Этот текст носит рекомендательный характер.
2016-06-21 00:30:30 +00:00
2016-06-21 00:48:34 +00:00
2. Всё относится только к команде разработки движка Яндекс.Метрики и ClickHouse.
2016-06-21 00:30:30 +00:00
2016-06-21 00:48:34 +00:00
3. Если вы редактируйте не наш код, то имеет смысл писать так, как уже написано.
2016-06-21 00:30:30 +00:00
2016-06-21 00:48:34 +00:00
4. Стиль нужен для единообразия. Единообразие нужно, чтобы было проще (удобнее) читать код. А также, чтобы было легче осуществлять поиск по коду.
2016-06-21 00:30:30 +00:00
2016-06-21 00:48:34 +00:00
5. Многие правила продиктованы не какими либо разумными соображениями, а сложившейся практикой.
2016-06-21 00:30:30 +00:00
2016-06-21 00:39:22 +00:00
## 1. Форматирование
2016-06-21 00:30:30 +00:00
2017-03-21 19:08:09 +00:00
0. Большую часть форматирования сделает автоматически clang-format. Инструкция для подключения clang-format в kdevelop описана в файле format_sources
2017-04-01 07:17:50 +00:00
1. Отступы - 4 пробела. Настройте среду разработки так, чтобы таб добавлял четыре пробела.
2016-06-21 00:30:30 +00:00
2016-06-21 00:48:34 +00:00
2. Открывающая фигурная скобка на новой, отдельной строке. (Закрывающая - тоже.)
2017-06-06 17:22:45 +00:00
```cpp
inline void readBoolText(bool & x, ReadBuffer & buf)
{
char tmp = '0';
readChar(tmp, buf);
x = tmp != '0';
}
```
2016-06-21 00:30:30 +00:00
2016-06-21 00:48:34 +00:00
3. Н о если всё тело функции достаточно короткое (один statement) - при желании, е г о можно целиком разместить на одной строке.
2017-06-06 17:22:45 +00:00
При этом, вокруг фигурных скобок ставятся пробелы (кроме пробела на конце строки).
```cpp
inline size_t mask() const { return buf_size() - 1; }
inline size_t place(HashValue x) const { return x & mask(); }
```
2016-06-21 00:30:30 +00:00
2016-06-21 00:48:34 +00:00
4. Для функций, пробелы вокруг скобок не ставятся.
2017-06-06 17:22:45 +00:00
```cpp
void reinsert(const Value & x)
```
```cpp
memcpy(& buf[place_value], & x, sizeof(x));
```
2016-06-21 00:30:30 +00:00
2016-06-21 00:48:34 +00:00
5. При использовании выражений if, for, while, ... (в отличие от вызовов функций) перед открывающей скобкой ставится пробел.
2017-06-06 17:22:45 +00:00
```cpp
for (size_t i = 0; i < rows ; i + = storage . index_granularity )
```
2016-06-21 00:30:30 +00:00
2016-06-21 00:48:34 +00:00
6. Вокруг бинарных операторов (+, -, *, /, %, ...), а также тернарного оператора ?: ставятся пробелы.
2017-06-06 17:22:45 +00:00
```cpp
UInt16 year = (s[0] - '0') * 1000 + (s[1] - '0') * 100 + (s[2] - '0') * 10 + (s[3] - '0');
UInt8 month = (s[5] - '0') * 10 + (s[6] - '0');
UInt8 day = (s[8] - '0') * 10 + (s[9] - '0');
```
Если ставится перенос строки, то оператор пишется на новой строке, и перед ним увеличивается отступ.
```cpp
if (elapsed_ns)
message < < " ("
< < rows_read_on_server * 1000000000 / elapsed_ns < < " rows / s . , "
< < bytes_read_on_server * 1000 . 0 / elapsed_ns < < " MB / s . ) " ;
```
6.1. Внутри строки можно, при желании, выполнять выравнивание с помощью пробелов.
```cpp
dst.ClickLogID = click.LogID;
dst.ClickEventID = click.EventID;
dst.ClickGoodEvent = click.GoodEvent;
```
2016-06-21 00:30:30 +00:00
2016-06-21 00:48:34 +00:00
7. Вокруг операторов `.` , `->` не ставятся пробелы.
2017-06-06 17:22:45 +00:00
При необходимости, оператор может быть перенесён на новую строку. В этом случае, перед ним увеличивается отступ.
2016-06-21 00:30:30 +00:00
2016-06-21 00:48:34 +00:00
8. Унарные операторы (`--, ++, *, & `, ...) не отделяются от аргумента пробелом.
2016-06-21 00:30:30 +00:00
2016-06-21 00:48:34 +00:00
9. После запятой ставится пробел, а перед - нет. Аналогично для точки с запятой внутри выражения for.
2016-06-21 00:30:30 +00:00
2016-06-21 00:48:34 +00:00
10. Оператор `[]` не отделяется пробелами.
2016-06-21 00:30:30 +00:00
2016-06-21 00:48:34 +00:00
11. В выражении `template <...>` , между `template` и `<` ставится пробел; после `<` и до `>` - не ставится.
2017-06-06 17:22:45 +00:00
```cpp
template < typename TKey , typename TValue >
struct AggregatedStatElement
```
2016-06-21 00:30:30 +00:00
2016-06-21 00:48:34 +00:00
12. В классах и структурах, public, private, protected пишется на том же уровне, что и class/struct, а все остальные внутренности - глубже.
2017-06-06 17:22:45 +00:00
```cpp
template < typename T , typename Ptr = std::shared_ptr<T > >
class MultiVersion
{
public:
/// Конкретная версия объекта для использования. shared_ptr определяет время жизни версии.
using Version = Ptr;
```
2016-06-21 00:30:30 +00:00
2016-06-21 00:48:34 +00:00
13. Если на весь файл один namespace и кроме него ничего существенного нет - то отступ внутри namespace не нужен.
2016-06-21 00:30:30 +00:00
2016-06-21 00:48:34 +00:00
14. Если блок для выражения if, for, while... состоит из одного statement-а , то фигурные скобки писать не обязательно. Вместо этого поместите statement на отдельную строку. Этим statement-ом также может быть вложенный if, for, while... Н о если внутренний statement содержит фигурные скобки или else, то у внешнего блок следует писать в фигурных скобках.
2017-06-06 17:22:45 +00:00
```cpp
/// Если файлы не открыты, то открываем их.
if (streams.empty())
for (const auto & name : column_names)
streams.emplace(name, std::make_unique< Stream > (
storage.files[name].data_file.path(),
storage.files[name].marks[mark_number].offset));
```
2016-06-21 00:30:30 +00:00
2017-04-01 07:17:50 +00:00
15. Н е должно быть пробелов на концах строк.
2016-06-21 00:30:30 +00:00
2016-06-21 00:48:34 +00:00
16. Исходники в кодировке UTF-8.
2016-06-21 00:30:30 +00:00
2016-06-21 00:48:34 +00:00
17. В строковых литералах можно использовать не-ASCII.
2017-06-06 17:22:45 +00:00
```cpp
< < ", " < < (timer.elapsed() / chunks_stats.hits) < < " μsec/hit.";
```
2016-06-21 00:30:30 +00:00
2016-06-21 00:48:34 +00:00
18. Н е пишите несколько выражений в одной строке.
2016-06-21 00:30:30 +00:00
2016-06-21 00:48:34 +00:00
19. Внутри функций, группируйте куски кода, отделяя их не более, чем одной пустой строкой.
2016-06-21 00:30:30 +00:00
2016-06-21 00:48:34 +00:00
20. Функции, классы, и т. п. отделяются друг от друга минимум одной, максимум двумя пустыми строками.
2016-06-21 00:30:30 +00:00
2016-06-21 00:48:34 +00:00
21. const (относящийся к значению) пишется до имени типа.
2017-06-06 17:22:45 +00:00
```cpp
const char * pos
```
```cpp
const std::string & s
```
~~char const * pos~~
2016-06-21 00:30:30 +00:00
2016-06-21 00:48:34 +00:00
22. При объявлении указателя или ссылки, символы * и & отделяются пробелами с обеих сторон.
2017-06-06 17:22:45 +00:00
```cpp
const char * pos
```
~~const char* pos~~
~~const char *pos~~
2016-06-21 00:30:30 +00:00
2016-06-21 00:48:34 +00:00
23. При использовании шаблонных типов, пишите using (кроме, возможно, простейших случаев).
2017-06-06 17:22:45 +00:00
Т о есть, параметры шаблона указываются только в using-е и затем не повторяются в коде.
using может быть объявлен локально, например, внутри функции.
```cpp
using FileStreams = std::map< std::string , std::shared_ptr < Stream > >;
FileStreams streams;
```
~~std::map<std::string, std::shared_ptr<Stream>> streams;~~
2016-06-21 00:30:30 +00:00
2016-06-21 00:48:34 +00:00
24. Нельзя объявлять несколько переменных разных типов в одном объявлении.
2017-06-06 17:22:45 +00:00
~~int x, *y;~~
2016-06-21 00:30:30 +00:00
2016-06-21 00:48:34 +00:00
25. c-style cast не используется.
2017-06-06 17:22:45 +00:00
~~std::cerr << (int)c << std::endl;~~
```cpp
std::cerr < < static_cast < int > (c) < < std::endl ;
```
2016-06-21 00:30:30 +00:00
2016-06-21 00:48:34 +00:00
26. В классах и структурах, группируйте отдельно методы и отдельно члены, внутри каждой области видимости.
2016-06-21 00:30:30 +00:00
2016-06-21 00:48:34 +00:00
27. Для не очень большого класса/структуры, можно не отделять объявления методов от реализации.
2017-06-06 17:22:45 +00:00
Аналогично для маленьких методов в любых классах/структурах.
Для шаблонных классов/структур, лучше не отделять объявления методов от реализации (так как иначе они всё равно должны быть определены в той же единице трансляции).
2016-06-21 00:30:30 +00:00
2016-06-21 00:48:34 +00:00
28. Н е обязательно умещать код по ширине в 80 символов. Можно в 140.
2016-06-21 00:30:30 +00:00
2016-06-21 00:48:34 +00:00
29. Всегда используйте префиксный инкремент/декремент, если постфиксный не нужен.
2017-06-06 17:22:45 +00:00
```cpp
for (Names::const_iterator it = column_names.begin(); it != column_names.end(); ++it)
```
2016-06-21 00:30:30 +00:00
2016-06-21 00:39:22 +00:00
## 2. Комментарии
2016-06-21 00:30:30 +00:00
2016-06-21 00:48:34 +00:00
1. Необходимо обязательно писать комментарии во всех нетривиальных местах.
2017-06-06 17:22:45 +00:00
Это очень важно. При написании комментария, можно успеть понять, что код не нужен вообще, или что всё сделано неверно.
```cpp
/** Часть куска памяти, которую можно использовать.
* Например, если internal_buffer - 1MB, а из файла для чтения было загружено в буфер
* только 10 байт, то working_buffer будет иметь размер 10 байт
* (working_buffer.end() будет указывать на позицию сразу после тех 10 байт, которых можно прочитать).
*/
```
2016-06-21 00:30:30 +00:00
2016-06-21 00:48:34 +00:00
2. Комментарии могут быть сколь угодно подробными.
2016-06-21 00:30:30 +00:00
2016-06-21 00:48:34 +00:00
3. Комментарии пишутся до соответствующего кода. В редких случаях - после, на той же строке.
2017-06-06 17:22:45 +00:00
```cpp
/** Парсит и исполняет запрос.
*/
void executeQuery(
ReadBuffer & istr, /// Откуда читать запрос (а также данные для INSERT-а , если есть)
WriteBuffer & ostr, /// Куда писать результат
Context & context, /// БД, таблицы, типы данных, движки таблиц, функции, агрегатные функции...
BlockInputStreamPtr & query_plan, /// Сюда может быть записано описание, как выполнялся запрос
QueryProcessingStage::Enum stage = QueryProcessingStage::Complete); /// До какой стадии выполнять SELECT запрос.
```
2016-06-21 00:30:30 +00:00
2016-12-06 18:47:36 +00:00
4. Комментарии следует писать только на английском языке.
2016-06-21 00:30:30 +00:00
2016-06-21 00:48:34 +00:00
5. При написании библиотеки, разместите подробный комментарий о том, что это такое, в самом главном заголовочном файле.
2016-06-21 00:30:30 +00:00
2016-06-21 00:48:34 +00:00
6. Нельзя писать комментарии, которые не дают дополнительной информации. В частности, нельзя писать пустые комментарии.
2017-01-10 16:45:54 +00:00
2017-06-06 17:22:45 +00:00
< strike >
/\*< br >
2017-01-10 16:45:54 +00:00
\* Procedure Name: < br >
\* Original procedure name: < br >
\* Author: < br >
\* Date of creation: < br >
\* Dates of modification: < br >
\* Modification authors: < br >
\* Original file name: < br >
\* Purpose: < br >
\* Intent: < br >
\* Designation: < br >
\* Classes used: < br >
\* Constants: < br >
\* Local variables: < br >
\* Parameters: < br >
\* Date of creation: < br >
\* Purpose: < br >
*/< / strike >
2017-06-06 17:22:45 +00:00
(пример взят отсюда: http://home.tamk.fi/~jaalto/course/coding-style/doc/unmaintainable-code/)
2016-06-21 00:30:30 +00:00
2016-06-21 00:48:34 +00:00
7. Нельзя писать мусорные комментарии (автор, дата создания...) в начале каждого файла.
2016-06-21 00:30:30 +00:00
2016-06-21 00:48:34 +00:00
8. Однострочные комментарии начинаются с трёх слешей: `///` , многострочные - с `/**` . Такие комментарии считаются "документрующими".
2017-06-06 17:22:45 +00:00
Замечание: такие комментарии могут использоваться для генерации документации с помощью Doxygen. Н о , фактически, Doxygen не используется, так как для навигации по коду гораздо удобне использовать возможности IDE.
2016-06-21 00:30:30 +00:00
2016-06-21 00:48:34 +00:00
9. В начале и конце многострочного комментария, не должно быть пустых строк (кроме строки, на которой закрывается многострочный комментарий).
2016-06-21 00:30:30 +00:00
2016-06-21 00:48:34 +00:00
10. Для закомментированных кусков кода, используются обычные, не "документирующие" комментарии.
2017-06-06 17:22:45 +00:00
Удаляйте закомментированные куски кода перед коммитом.
2016-06-21 00:30:30 +00:00
2016-06-21 00:48:34 +00:00
11. Н е нужно писать нецензурную брань в комментариях.
2016-06-21 00:30:30 +00:00
2016-06-21 00:48:34 +00:00
12. Н е нужно писать в комментариях слишком много восклицательных знаков или знаков вопроса, или выделять слишком много слов большими буквами.
2017-06-06 17:22:45 +00:00
~~/// WHAT THE FAIL???~~
2016-06-21 00:30:30 +00:00
2016-06-21 00:48:34 +00:00
13. Н е нужно составлять из комментариев строки-разделители.
2017-06-06 17:22:45 +00:00
~~/*******************************************************/~~
2016-06-21 00:30:30 +00:00
2016-06-21 00:48:34 +00:00
14. Н е нужно писать в комментарии диалог (лучше сказать устно).
2017-06-06 17:22:45 +00:00
~~/// Зачем ты сделал эту фигню?~~
2016-06-21 00:30:30 +00:00
2016-06-21 00:48:34 +00:00
15. Н е нужно писать комментарий в конце блока о том, что представлял собой этот блок.
2017-06-06 17:22:45 +00:00
~~} /// for~~
2016-06-21 00:30:30 +00:00
2016-06-21 00:39:22 +00:00
## 3. Имена
2016-06-21 00:30:30 +00:00
2016-06-21 00:48:34 +00:00
1. Имена переменных и членов класса - маленькими буквами с подчёркиванием.
2017-06-06 17:22:45 +00:00
```cpp
size_t max_block_size;
```
2016-06-21 00:30:30 +00:00
2016-06-21 00:48:34 +00:00
2. Имена функций (методов) - camelCase с маленькой буквы.
2017-06-06 17:22:45 +00:00
```cpp
std::string getName() const override { return "Memory"; }
```
2016-06-21 00:30:30 +00:00
2016-06-21 00:48:34 +00:00
3. Имена классов (структур) - CamelCase с большой буквы. Префиксы кроме I для интерфейсов - не используются.
2017-06-06 17:22:45 +00:00
```cpp
class StorageMemory : public IStorage
```
2016-06-21 00:30:30 +00:00
2017-01-10 17:29:41 +00:00
4. Имена using-ов - также, как классов, либо можно добавить _t на конце.
2016-06-21 00:30:30 +00:00
2016-06-21 00:48:34 +00:00
5. Имена типов - параметров шаблонов: в простых случаях - T; T, U; T1, T2.
2017-06-06 17:22:45 +00:00
В более сложных случаях - либо также, как имена классов, либо можно добавить в начало букву T.
```cpp
template < typename TKey , typename TValue >
struct AggregatedStatElement
```
2016-06-21 00:30:30 +00:00
2016-06-21 00:48:34 +00:00
6. Имена констант - параметров шаблонов: либо также, как имена переменных, либо N - в простом случае.
2017-06-06 17:22:45 +00:00
```cpp
template < bool without_www >
struct ExtractDomain
```
2016-06-21 00:30:30 +00:00
2016-06-21 00:48:34 +00:00
7. Для абстрактных классов (интерфейсов) можно добавить в начало имени букву I.
2017-06-06 17:22:45 +00:00
```cpp
class IBlockInputStream
```
2016-06-21 00:30:30 +00:00
2016-06-21 00:48:34 +00:00
8. Если переменная используется достаточно локально, то можно использовать короткое имя.
2017-06-06 17:22:45 +00:00
В остальных случаях - используйте достаточно подробное имя, описывающее смысл.
```cpp
bool info_successfully_loaded = false;
```
2016-06-21 00:30:30 +00:00
2016-06-21 00:48:34 +00:00
9. define-ы - ALL_CAPS с подчёркиванием. Глобальные константы - тоже.
2017-06-06 17:22:45 +00:00
```cpp
#define MAX_SRC_TABLE_NAMES_TO_STORE 1000
```
2016-06-21 00:30:30 +00:00
2016-06-21 00:48:34 +00:00
10. Имена файлов с кодом называйте по стилю соответственно тому, что в них находится.
2017-06-06 17:22:45 +00:00
Если в файле находится один класс - назовите файл, как класс - в CamelCase.
Если в файле находится одна функция - назовите файл, как функцию - в camelCase.
2016-06-21 00:30:30 +00:00
2016-06-21 00:48:34 +00:00
11. Если имя содержит сокращение, то:
2017-06-06 17:22:45 +00:00
* для имён переменных, всё сокращение пишется маленькими буквами;
`mysql_connection`
~~mySQL_connection~~
2016-06-21 00:30:30 +00:00
2017-06-06 17:22:45 +00:00
* для имён классов и функций, сохраняются большие буквы в сокращении.
`MySQLConnection`
~~MySqlConnection~~
2016-06-21 00:30:30 +00:00
2016-06-21 00:48:34 +00:00
12. Параметры конструктора, использующиеся сразу же для инициализации соответствующих членов класса, следует назвать также, как и члены класса, добавив подчёркивание в конец.
2017-06-06 17:22:45 +00:00
```cpp
FileQueueProcessor(
const std::string & path_,
const std::string & prefix_,
std::shared_ptr< FileHandler > handler_)
: path(path_),
prefix(prefix_),
handler(handler_),
log(& Logger::get("FileQueueProcessor"))
{
}
```
Также можно называть параметры конструктора так же, как и члены класса (не добавлять подчёркивание), но только если этот параметр не используется в теле конструктора.
2016-06-21 00:30:30 +00:00
2016-06-21 00:48:34 +00:00
13. Именование локальных переменных и членов класса никак не отличается (никакие префиксы не нужны).
2017-06-06 17:22:45 +00:00
`timer`
~~m_timer~~
2016-06-21 00:30:30 +00:00
2016-06-21 00:48:34 +00:00
15. Константы в enum-е - CamelCase с большой буквы. Также допустимо ALL_CAPS. Если enum не локален, то используйте enum class.
2017-06-06 17:22:45 +00:00
```cpp
enum class CompressionMethod
{
QuickLZ = 0,
LZ4 = 1,
};
```
2016-06-21 00:30:30 +00:00
2016-06-21 00:48:34 +00:00
16. В с е имена - по английски. Транслит с русского использовать нельзя.
2017-06-06 17:22:45 +00:00
~~Stroka~~
2016-06-21 00:30:30 +00:00
2016-06-21 00:48:34 +00:00
17. Сокращения (из нескольких букв разных слов) в именах можно использовать только если они являются общепринятыми (если для сокращения можно найти расшифровку в английской википедии или сделав поисковый запрос).
2017-06-06 17:22:45 +00:00
`AST` `SQL`
~~NVDH (неведомая х .)~~
Сокращения в виде обрезанного слова можно использовать, только если такое сокращение является широко используемым.
Впрочем, сокращения также можно использовать, если расшифровка находится рядом в комментарии.
18. Имена файлов с исходниками на C++ должны иметь расширение только .cpp. Заголовочные файлы - только .h.
~~.hpp~~ ~~.cc~~ ~~.C~~ ~~.inl~~
Можно `.inl.h` , но не ~~.h.inl~~
2016-06-21 00:30:30 +00:00
2016-06-21 00:39:22 +00:00
## 4. Как писать код
2016-06-21 00:30:30 +00:00
2016-06-21 00:48:34 +00:00
1. Управление памятью.
2017-06-06 17:22:45 +00:00
Ручное освобождение памяти (delete) можно использовать только в библиотечном коде.
В свою очередь, в библиотечном коде, оператор delete можно использовать только в деструкторах.
В прикладном коде следует делать так, что память освобождается каким-либо объектом, который владеет ей.
Примеры:
* проще всего разместить объект на стеке, или сделать е г о членом другого класса.
* для большого количества маленьких объектов используйте контейнеры.
* для автоматического освобождения маленького количества объектов, выделенных на куче, используйте shared_ptr/unique_ptr.
2016-06-21 00:30:30 +00:00
2016-06-21 00:48:34 +00:00
2. Управление ресурсами.
2017-06-06 17:22:45 +00:00
Используйте RAII и см. пункт выше.
2016-06-21 00:30:30 +00:00
2016-06-21 00:48:34 +00:00
3. Обработка ошибок.
2017-06-06 17:22:45 +00:00
Используйте исключения. В большинстве случаев, нужно только кидать исключения, а ловить - не нужно (потому что RAII).
В программах offline обработки данных, зачастую, можно не ловить исключения.
В серверах, обрабатывающих пользовательские запросы, как правило, достаточно ловить исключения на самом верху обработчика соединения.
В функциях потока, следует ловить и запоминать все исключения, чтобы выкинуть их в основном потоке после join.
```cpp
/// Если вычислений ещё не было - вычислим первый блок синхронно
if (!started)
{
calculate();
started = true;
}
else /// Если вычисления уже идут - подождём результата
pool.wait();
if (exception)
exception->rethrow();
```
Ни в коем случае не "проглатывайте" исключения без разбора. Ни в коем случае, не превращайте все исключения без разбора в сообщения в логе.
~~catch (...) {}~~
Если вам нужно проигнорировать какие-то исключения, то игнорируйте только конкретные, а остальные - кидайте обратно.
```cpp
catch (const DB::Exception & e)
{
if (e.code() == ErrorCodes::UNKNOWN_AGGREGATE_FUNCTION)
return nullptr;
else
throw;
}
```
При использовании функций, использующих коды возврата или errno - проверяйте результат и кидайте исключение.
```cpp
if (0 != close(fd))
throwFromErrno("Cannot close file " + file_name, ErrorCodes::CANNOT_CLOSE_FILE);
```
assert-ы не используются.
2016-06-21 00:30:30 +00:00
2016-06-21 00:48:34 +00:00
4. Типы исключений.
2017-06-06 17:22:45 +00:00
В прикладном коде не требуется использовать сложную иерархию исключений. Желательно, чтобы текст исключения был понятен системному администратору.
2016-06-21 00:30:30 +00:00
2016-06-21 00:48:34 +00:00
5. Исключения, вылетающие из деструкторов.
2017-06-06 17:22:45 +00:00
Использовать не рекомендуется, но допустимо.
Используйте следующие варианты:
* Сделайте функцию (done() или finalize()), которая позволяет заранее выполнить всю работу, в процессе которой может возникнуть исключение. Если эта функция была вызвана, то затем в деструкторе не должно возникать исключений.
* Слишком сложную работу (например, отправку данных по сети) можно вообще не делать в деструкторе, рассчитывая, что пользователь заранее позовёт метод для завершения работы.
* Если в деструкторе возникло исключение, желательно не "проглатывать" е г о , а вывести информацию в лог (если в этом месте доступен логгер).
* В простых программах, если соответствующие исключения не ловятся, и приводят к завершению работы с записью информации в лог, можно не беспокоиться о б исключениях, вылетающих из деструкторов, так как вызов std::terminate (в случае noexcept по-умолчанию в C++11), является приемлимым способом обработки исключения.
2016-06-21 00:30:30 +00:00
2016-06-21 00:48:34 +00:00
6. Отдельные блоки кода.
2017-06-06 17:22:45 +00:00
Внутри одной функции, можно создать отдельный блок кода, для того, чтобы сделать некоторые переменные локальными в нём, и для того, чтобы соответствующие деструкторы были вызваны при выходе из блока.
```cpp
Block block = data.in->read();
2016-06-21 00:30:30 +00:00
2017-06-06 17:22:45 +00:00
{
std::lock_guard< std::mutex > lock(mutex);
data.ready = true;
data.block = block;
}
2016-06-21 00:30:30 +00:00
2017-06-06 17:22:45 +00:00
ready_any.set();
```
2016-06-21 00:30:30 +00:00
2016-06-21 00:48:34 +00:00
7. Многопоточность.
2017-06-06 17:22:45 +00:00
В программах offline обработки данных:
* cна ча ла добейтесь более-менее максимальной производительности на одном процессорном ядре;
* потом можно распараллеливать код, но только если есть необходимость.
В программах - серверах:
* используйте пул потоков для обработки запросов;
* на данный момент, у нас не было задач, в которых была бы необходимость использовать userspace context switching.
Fork для распараллеливания не используется.
2016-06-21 00:30:30 +00:00
2016-06-21 00:48:34 +00:00
8. Синхронизация потоков.
2017-06-06 17:22:45 +00:00
Часто можно сделать так, чтобы отдельные потоки писали данные в разные ячейки памяти (лучше - в разные кэш-линии), и не использовать синхронизацию потоков (кроме joinAll).
Если синхронизация нужна, то в большинстве случаев, достаточно использовать mutex под lock_guard-ом.
В остальных случаях, используйте системные примитивы синхронизации. Н е используйте busy wait.
Атомарные операции можно использовать только в простейших случаях.
Н е нужно писать самостоятельно lock-free структуры данных, если вы не являетесь экспертом.
2016-06-21 00:30:30 +00:00
2016-06-21 00:48:34 +00:00
9. Ссылки и указатели.
2017-06-06 17:22:45 +00:00
В большинстве случаев, предпочитайте ссылки.
2016-06-21 00:30:30 +00:00
2016-06-21 00:48:34 +00:00
10. const.
2017-06-06 17:22:45 +00:00
Используйте константные ссылки, указатели на константу, const_iterator, константные методы.
Считайте, что const - вариант написания "по-умолчанию", а отсутствие const - только при необходимости.
Для переменных, передающихся по значению, использовать const обычно не имеет смысла.
2016-06-21 00:30:30 +00:00
2016-06-21 00:48:34 +00:00
11. unsigned.
2017-06-06 17:22:45 +00:00
Используйте unsigned, если нужно.
2016-06-21 00:30:30 +00:00
2016-06-21 00:48:34 +00:00
12. Числовые типы.
2017-06-06 17:22:45 +00:00
Используйте типы UInt8, UInt16, UInt32, UInt64, Int8, Int16, Int32, Int64, а также size_t, ssize_t, ptrdiff_t.
Н е используйте для чисел типы signed/unsigned long, long long, short; signed char, unsigned char, а также char.
2016-06-21 00:30:30 +00:00
2016-06-21 00:48:34 +00:00
13. Передача аргументов.
2017-06-06 17:22:45 +00:00
Сложные значения передавайте по ссылке (включая std::string).
Если функция захватывает владение объектом, созданным на куче, то сделайте типом аргумента shared_ptr или unique_ptr.
2016-06-21 00:30:30 +00:00
2016-06-21 00:48:34 +00:00
14. Возврат значений.
2017-06-06 17:22:45 +00:00
В большинстве случаев, просто возвращайте значение с помощью return. Н е пишите ~~return std::move(res)~~ .
Если внутри функции создаётся объект на куче и отдаётся наружу, то возвращайте shared_ptr или unique_ptr.
В некоторых редких случаях, может потребоваться возвращать значение через аргумент функции. В этом случае, аргументом будет ссылка.
```cpp
using AggregateFunctionPtr = std::shared_ptr< IAggregateFunction > ;
/** Позволяет создать агрегатную функцию по её имени.
*/
class AggregateFunctionFactory
{
public:
AggregateFunctionFactory();
AggregateFunctionPtr get(const String & name, const DataTypes & argument_types) const;
```
2016-06-21 00:30:30 +00:00
2016-06-21 00:48:34 +00:00
15. namespace.
2017-06-06 17:22:45 +00:00
Для прикладного кода отдельный namespace использовать не нужно.
Для маленьких библиотек - не требуется.
Для не совсем маленьких библиотек - поместите всё в namespace.
Внутри библиотеки в .h файле можно использовать namespace detail для деталей реализации, не нужных прикладному коду.
В .cpp файле можно использовать static или анонимный namespace для скрытия символов.
Также, namespace можно использовать для enum, чтобы соответствующие имена не попали во внешний namespace (но лучше использовать enum class).
2016-06-21 00:30:30 +00:00
2016-06-21 00:48:34 +00:00
16. Отложенная инициализация.
2017-06-06 17:22:45 +00:00
Обычно, если для инициализации требуются аргументы, то не пишите конструктор по-умопчанию.
Если потом вам потребовалась отложенная инициализация, то вы можете дописать конструктор по-умолчанию (который создаст объект с некорректным состоянием). Или, для небольшого количества объектов, можно использовать shared_ptr/unique_ptr.
```cpp
Loader(DB::Connection * connection_, const std::string & query, size_t max_block_size_);
2016-06-21 00:30:30 +00:00
2017-06-06 17:22:45 +00:00
/// Для отложенной инициализации
Loader() {}
```
2016-06-21 00:30:30 +00:00
2016-06-21 00:48:34 +00:00
17. Виртуальные функции.
2017-06-06 17:22:45 +00:00
Если класс не предназначен для полиморфного использования, то не нужно делать функции виртуальными зря. Это относится и к деструктору.
2016-06-21 00:30:30 +00:00
2016-06-21 00:48:34 +00:00
17. Кодировки.
2017-06-06 17:22:45 +00:00
Везде используется UTF-8. Используется std::string, char *. Н е используется std::wstring, wchar_t.
2016-06-21 00:30:30 +00:00
2016-06-21 00:48:34 +00:00
18. Логгирование.
2017-06-06 17:22:45 +00:00
См. примеры везде в коде.
Перед коммитом, удалите всё бессмысленное и отладочное логгирование, и другие виды отладочного вывода.
Н е должно быть логгирования на каждую итерацию внутреннего цикла, даже уровня Trace.
При любом уровне логгирования, логи должно быть возможно читать.
Логгирование следует использовать, в основном, только в прикладном коде.
Сообщения в логе должны быть написаны на английском языке.
Желательно, чтобы лог был понятен системному администратору.
Н е нужно писать ругательства в лог.
В логе используется кодировка UTF-8. Изредка можно использовать в логе не-ASCII символы.
2016-06-21 00:30:30 +00:00
2016-06-21 00:48:34 +00:00
19. Ввод-вывод.
2017-06-06 17:22:45 +00:00
В о внутренних циклах (в критичных по производительности участках программы) нельзя использовать iostreams (в том числе, ни в коем случае не используйте stringstream).
Вместо этого используйте библиотеку DB/IO.
2016-06-21 00:30:30 +00:00
2016-06-21 00:48:34 +00:00
20. Дата и время.
2017-06-06 17:22:45 +00:00
См. библиотеку DateLUT.
2016-06-21 00:30:30 +00:00
2016-06-21 00:48:34 +00:00
21. include.
2017-06-06 17:22:45 +00:00
В заголовочном файле используется только #pragma once, а include guard-ы писать не нужно.
2016-06-21 00:30:30 +00:00
2016-06-21 00:48:34 +00:00
22. using.
2017-06-06 17:22:45 +00:00
using namespace не используется.
using что-то конкретное - можно. Лучше локально - внутри класса или функции.
2016-06-21 00:30:30 +00:00
2016-06-21 00:48:34 +00:00
23. Н е нужно использовать trailing return type для функций, если в этом нет необходимости.
2017-06-06 17:22:45 +00:00
~~auto f() -> void;~~
2016-06-21 00:30:30 +00:00
2016-06-21 00:48:34 +00:00
24. Н е нужно объявлять и инициализировать переменные так:
2017-06-06 17:22:45 +00:00
~~auto s = std::string{"Hello"};~~
Надо так:
`std::string s = "Hello";`
`std::string s{"Hello"};`
2016-06-21 00:30:30 +00:00
2016-06-21 00:48:34 +00:00
25. Для виртуальных функций, пишите virtual в базовом классе, а в классах-наследниках, пишите override и не пишите virtual.
2016-06-21 00:30:30 +00:00
2016-06-21 00:39:22 +00:00
## 5. Неиспользуемые возможности языка C++
2016-06-21 00:30:30 +00:00
2016-06-21 00:48:34 +00:00
1. Виртуальное наследование не используется.
2016-06-21 00:30:30 +00:00
2016-06-21 00:48:34 +00:00
2. Спецификаторы исключений из C++03 не используются.
2016-06-21 00:30:30 +00:00
2016-06-21 00:48:34 +00:00
3. Function try block не используется, за исключением функции main в тестах.
2016-06-21 00:30:30 +00:00
2016-06-21 00:39:22 +00:00
## 6. Платформа
2016-06-21 00:30:30 +00:00
2016-06-21 00:48:34 +00:00
1. Мы пишем некроссплатформенный код (под конкретную платформу).
2017-06-06 17:22:45 +00:00
Хотя, при прочих равных условиях, предпочитается более-менее кроссплатформенный или легко портируемый код.
2016-06-21 00:30:30 +00:00
2017-04-01 08:31:34 +00:00
2. Язык - C++17. Возможно использование расширений GNU при необходимости.
2016-06-21 00:30:30 +00:00
2017-04-01 08:31:34 +00:00
3. Компилятор - gcc. Н а данный момент (апрель 2017), код собирается версией 6.3. (Также код может быть собран clang 4)
2017-06-06 17:22:45 +00:00
Используется стандартная библиотека от gcc.
2016-06-21 00:30:30 +00:00
2016-06-21 00:48:34 +00:00
4. О С - Linux Ubuntu, не более старая, чем Precise.
2016-06-21 00:30:30 +00:00
2016-06-21 00:48:34 +00:00
5. Код пишется под процессор с архитектурой x86_64.
2017-06-06 17:22:45 +00:00
Н а б о р инструкций - минимальный поддерживаемый среди наших серверов. Сейчас это - SSE4.2.
2016-06-21 00:30:30 +00:00
2016-06-21 00:48:34 +00:00
6. Используются флаги компиляции -Wall -Werror.
2016-06-21 00:30:30 +00:00
2016-06-21 00:48:34 +00:00
7. Используется статическая линковка с о всеми библиотеками кроме тех, которые трудно подключить статически (см. вывод команды ldd).
2016-06-21 00:30:30 +00:00
2016-06-21 00:48:34 +00:00
8. Код разрабатывается и отлаживается с релизными параметрами сборки.
2016-06-21 00:30:30 +00:00
2016-06-21 00:39:22 +00:00
## 7. Инструментарий
2016-06-21 00:30:30 +00:00
2016-06-21 00:48:34 +00:00
1. Хорошая среда разработки - KDevelop.
2016-06-21 00:30:30 +00:00
2016-06-21 00:48:34 +00:00
2. Для отладки используется gdb, valgrind (memcheck), strace, -fsanitize=..., tcmalloc_minimal_debug.
2016-06-21 00:30:30 +00:00
2016-06-21 00:48:34 +00:00
3. Для профилирования используется Linux Perf, valgrind (callgrind), strace -cf.
2016-06-21 00:30:30 +00:00
2016-06-21 00:48:34 +00:00
4. Исходники в Git.
2016-06-21 00:30:30 +00:00
2016-06-21 00:48:34 +00:00
5. Сборка с помощью CMake.
2016-06-21 00:30:30 +00:00
2016-06-21 00:48:34 +00:00
6. Программы выкладываются с помощью deb пакетов.
2016-06-21 00:30:30 +00:00
2016-06-21 00:48:34 +00:00
7. Коммиты в master не должны ломать сборку проекта.
2017-06-06 17:22:45 +00:00
А работоспособность собранных программ гарантируется только для отдельных ревизий.
2016-06-21 00:30:30 +00:00
2016-06-21 00:48:34 +00:00
8. Коммитьте как можно чаще, в том числе и не рабочий код.
2017-06-06 17:22:45 +00:00
Для этого следует использовать бранчи.
Если ваш код в master-е ещё не собирается, перед push-ем - исключите е г о из сборки;
также вы будете должны е г о доработать или удалить в течение нескольких дней.
2016-06-21 00:30:30 +00:00
2016-06-21 00:48:34 +00:00
9. Для нетривиальных изменений, используются бранчи. Следует загружать бранчи на сервер.
2016-06-21 00:30:30 +00:00
2016-06-21 00:48:34 +00:00
10. Ненужный код удаляется из исходников.
2016-06-21 00:30:30 +00:00
2016-06-21 00:39:22 +00:00
## 8. Библиотеки
2016-06-21 00:30:30 +00:00
2016-06-21 00:48:34 +00:00
1. Используются стандартная библиотека C++14 (допустимо использовать experimental расширения) а также фреймворки boost, Poco.
2016-06-21 00:30:30 +00:00
2016-06-21 00:48:34 +00:00
2. При необходимости, можно использовать любые известные библиотеки, доступные в О С из пакетов.
2017-06-06 17:22:45 +00:00
Если есть хорошее готовое решение, то оно используется, даже если для этого придётся установить ещё одну библиотеку.
(Н о будьте готовы к тому, что иногда вам придётся выкидывать плохие библиотеки из кода.)
2016-06-21 00:30:30 +00:00
2016-06-21 00:48:34 +00:00
3. Если в пакетах нет нужной библиотеки, или её версия достаточно старая, или если она собрана не так, как нужно, то можно использовать библиотеку, устанавливаемую не из пакетов.
2016-06-21 00:30:30 +00:00
2016-06-21 00:48:34 +00:00
4. Если библиотека достаточно маленькая и у неё нет своей системы сборки, то следует включить её файлы в проект, в директорию contrib.
2016-06-21 00:30:30 +00:00
2016-06-21 00:48:34 +00:00
5. Предпочтение всегда отдаётся уже использующимся библиотекам.
2016-06-21 00:30:30 +00:00
2016-06-21 00:39:22 +00:00
## 9. Общее
2016-06-21 00:30:30 +00:00
2016-06-21 00:48:34 +00:00
1. Пишите как можно меньше кода.
2016-06-21 00:30:30 +00:00
2016-06-21 00:48:34 +00:00
2. Пробуйте самое простое решение.
2016-06-21 00:30:30 +00:00
2016-06-21 00:48:34 +00:00
3. Н е нужно писать код, если вы ещё не знаете, что будет делать ваша программа, и как будет работать её внутренний цикл.
2016-06-21 00:30:30 +00:00
2017-01-10 17:29:41 +00:00
4. В простейших случаях, используйте using вместо классов/структур.
2016-06-21 00:30:30 +00:00
2016-06-21 00:48:34 +00:00
5. Если есть возможность - не пишите конструкторы копирования, операторы присваивания, деструктор (кроме виртуального, если класс содержит хотя бы одну виртуальную функцию), move-конструкторы и move-присваивания. Т о есть, чтобы соответствущие функции, генерируемые компилятором, работали правильно. Можно использовать default.
2016-06-21 00:30:30 +00:00
2016-06-21 00:48:34 +00:00
6. Приветствуется упрощение и уменьшение объёма кода.
2016-06-21 00:30:30 +00:00
2016-06-21 00:39:22 +00:00
## A. Дополнительно
2016-06-21 00:30:30 +00:00
2016-06-21 00:48:34 +00:00
1. Явное указание std:: для типов из stddef.h.
2017-06-06 17:22:45 +00:00
Рекомендуется не указывать. Т о есть, рекомендуется писать size_t вместо std::size_t - потому что это короче.
Н о при желании, вы можете всё-таки приписать std:: - такой вариант тоже допустим.
2016-06-21 00:30:30 +00:00
2016-06-21 00:48:34 +00:00
2. Явное указание std:: для функций из стандартной библиотеки C.
2017-06-06 17:22:45 +00:00
Н е рекомендуется. Т о есть, пишите memcpy вместо std::memcpy.
Причина - существуют похожие нестандартные функции, например, memmem. Мы можем использовать и изредка используем эти функции. Эти функции отсутствуют в namespace std.
Если вы везде напишете std::memcpy вместо memcpy, то будет неудобно смотреться memmem без std::.
Тем не менее, указывать std:: тоже допустимо, если так больше нравится.
2016-06-21 00:30:30 +00:00
2016-06-21 00:48:34 +00:00
3. Использование функций из C при наличии аналогов в стандартной библиотеке C++.
2017-06-06 17:22:45 +00:00
Допустимо, если это использование эффективнее.
Для примера, для копирования длинных кусков памяти, используйте memcpy вместо std::copy.
2016-06-21 00:30:30 +00:00
2016-06-21 00:48:34 +00:00
4. Перенос длинных аргументов функций.
2017-06-06 17:22:45 +00:00
Допустимо использовать любой стиль переноса, похожий на приведённые ниже:
```
function(
T1 x1,
T2 x2)
```
```
function(
size_t left, size_t right,
const & RangesInDataParts ranges,
size_t limit)
```
```
function(size_t left, size_t right,
const & RangesInDataParts ranges,
size_t limit)
```
```
function(size_t left, size_t right,
const & RangesInDataParts ranges,
size_t limit)
```
```
function(
size_t left,
size_t right,
const & RangesInDataParts ranges,
size_t limit)
```