ClickHouse/docs/fr/query_language/syntax.md
2020-03-30 15:48:55 +03:00

12 KiB

machine_translated
true

Syntaxe

Il existe deux types d'analyseurs dans le système: L'analyseur SQL complet (un analyseur de descente récursif) et l'analyseur de format de données (un analyseur de flux rapide). Dans tous les cas à l'exception de la INSERT requête, seul L'analyseur SQL complet est utilisé. Le INSERT requête utilise les deux analyseurs:

INSERT INTO t VALUES (1, 'Hello, world'), (2, 'abc'), (3, 'def')

Le INSERT INTO t VALUES fragment est analysé par l'analyseur complet, et les données (1, 'Hello, world'), (2, 'abc'), (3, 'def') est analysé par l'analyseur de flux rapide. Vous pouvez également activer l'analyseur complet pour les données à l'aide de la input_format_values_interpret_expressions paramètre. Lorsque input_format_values_interpret_expressions = 1, ClickHouse essaie d'abord d'analyser les valeurs avec l'analyseur de flux rapide. S'il échoue, ClickHouse essaie d'utiliser l'analyseur complet pour les données, en le traitant comme un SQL expression.

Les données peuvent avoir n'importe quel format. Lorsqu'une requête est reçue, le serveur calcule pas plus que max_query_size octets de la requête en RAM (par défaut, 1 Mo), et le reste est analysé en flux. Cela signifie que le système n'a pas de problèmes avec de grandes INSERT requêtes, comme le fait MySQL.

Lors de l'utilisation de la Values format dans un INSERT de la requête, il peut sembler que les données sont analysées de même que les expressions dans un SELECT requête, mais ce n'est pas vrai. Le Values le format est beaucoup plus limitée.

Ensuite, nous allons couvrir l'analyseur complet. Pour plus d'informations sur les analyseurs de format, consultez Format section.

Espace

Il peut y avoir n'importe quel nombre de symboles d'espace entre les constructions syntaxiques (y compris le début et la fin d'une requête). Les symboles d'espace incluent l'espace, l'onglet, le saut de ligne, Le CR et le flux de formulaire.

Commentaire

Les commentaires de style SQL et C sont pris en charge. Commentaires de style SQL: de -- à la fin de la ligne. L'espace après -- peut être omis. Commentaires dans C-style: de /* de */. Ces commentaires peuvent être multilignes. Les espaces ne sont pas requis ici non plus.

Mot

Les mots clés sont insensibles à la casse lorsqu'ils correspondent à:

  • La norme SQL. Exemple, SELECT, select et SeLeCt sont toutes valides.
  • Implémentation dans certains SGBD populaires (MySQL ou Postgres). Exemple, DateTime est la même que datetime.

Si le nom du type de données est sensible à la casse peut être vérifié system.data_type_families table.

Contrairement à SQL standard, tous les autres mots clés (y compris les noms de fonctions) sont sensible à la casse.

Mots-clés ne sont pas réservés (ils sont simplement considérés comme des mots-clés dans le contexte correspondant). Si vous utilisez identificateur de même que les mots clés, les placer entre guillemets. Par exemple, la requête SELECT "FROM" FROM table_name est valide si la table table_name a colonne avec le nom de "FROM".

Identificateur

Les identificateurs sont:

  • Noms de Cluster, de base de données, de table, de partition et de colonne.
  • Fonction.
  • Types de données.
  • Expression des alias.

Les identificateurs peuvent être cités ou non cités. Il est recommandé d'utiliser des identificateurs sans guillemets.

Non identificateurs doivent correspondre à l'expression régulière ^[a-zA-Z_][0-9a-zA-Z_]*$ et ne peut pas être égale à mot. Exemple: x, _1, X_y__Z123_.

Si vous souhaitez utiliser les identifiants de la même manière que les mots-clés ou si vous souhaitez utiliser d'autres symboles dans les identifiants, citez-le en utilisant des guillemets doubles ou des backticks, par exemple, "id", `id`.

Littéral

Il y a: Numérique, chaîne, composé et NULL littéral.

Numérique

Un littéral numérique tente d'être analysé:

  • D'abord comme un nombre signé 64 bits, en utilisant le strtoull fonction.
  • En cas d'échec, en tant que nombre non signé 64 bits, strtoll fonction.
  • En cas d'échec, en tant que nombre à virgule flottante strtod fonction.
  • Sinon, une erreur est renvoyée.

La valeur correspondante aura le plus petit type dans lequel la valeur correspond. Par exemple, 1 est analysé comme UInt8, mais 256 est analysé comme UInt16. Pour plus d'informations, voir Types de données.

Exemple: 1, 18446744073709551615, 0xDEADBEEF, 01, 0.1, 1e100, -1e-100, inf, nan.

Chaîne

Seuls les littéraux de chaîne entre guillemets simples sont pris en charge. Le clos de caractères barre oblique inverse échappé. Les séquences d'échappement suivantes ont une valeur spéciale correspondante: \b, \f, \r, \n, \t, \0, \a, \v, \xHH. Dans tous les autres cas, des séquences d'échappement au format \c, où c est un caractère, sont convertis à c. Cela signifie que vous pouvez utiliser les séquences \'et\\. La valeur aurez l' Chaîne type.

L'ensemble minimum de caractères que vous devez échapper dans les littéraux de chaîne: ' et \. Apostrophe peut être échappé avec l'apostrophe, les littéraux 'It\'s' et 'It''s' sont égaux.

Composé

Les Constructions sont prises en charge pour les tableaux: [1, 2, 3] et les tuples: (1, 'Hello, world!', 2).. En fait, ce ne sont pas des littéraux, mais des expressions avec l'opérateur de création de tableau et l'opérateur de création de tuple, respectivement. Un tableau doit être composé d'au moins un élément, et un tuple doit avoir au moins deux éléments. Les Tuples ont un but spécial pour l'usage dans le IN clause de a SELECT requête. Les Tuples peuvent être obtenus à la suite d'une requête, mais ils ne peuvent pas être enregistrées dans une base de données (à l'exception de Mémoire table).

NULL

Indique que la valeur est manquante.

Afin de stocker NULL dans un champ de table, il doit être de la Nullable type.

Selon le format de données (entrée ou sortie), NULL peut avoir une représentation différente. Pour plus d'informations, consultez la documentation de formats de données.

Il y a beaucoup de nuances au traitement NULL. Par exemple, si au moins l'un des arguments d'une opération de comparaison est NULL le résultat de cette opération sera également NULL. Il en va de même pour la multiplication, l'addition et d'autres opérations. Pour plus d'informations, lisez la documentation pour chaque opération.

Dans les requêtes, vous pouvez vérifier NULL à l'aide de la IS NULL et IS NOT NULL opérateurs et les fonctions connexes isNull et isNotNull.

Fonction

Les fonctions sont écrites comme un identifiant avec une liste d'arguments (éventuellement vide) entre parenthèses. Contrairement au SQL standard, les crochets sont requis, même pour une liste d'arguments vide. Exemple: now(). Il existe des fonctions régulières et agrégées (voir la section “Aggregate functions”). Certaines fonctions d'agrégat peut contenir deux listes d'arguments entre parenthèses. Exemple: quantile (0.9) (x). Ces fonctions d'agrégation sont appelés “parametric” fonctions, et les arguments dans la première liste sont appelés “parameters”. La syntaxe des fonctions d'agrégation sans paramètres est la même que pour les fonctions régulières.

Opérateur

Les opérateurs sont convertis en leurs fonctions correspondantes lors de l'analyse des requêtes, en tenant compte de leur priorité et de leur associativité. Par exemple, l'expression 1 + 2 * 3 + 4 est transformé à plus(plus(1, multiply(2, 3)), 4).

Types de données et moteurs de Table de base de données

Types de données et moteurs de table dans CREATE les requêtes sont écrites de la même manière que les identifiants ou les fonctions. En d'autres termes, ils peuvent ou non contenir une liste d'arguments entre parenthèses. Pour plus d'informations, voir les sections “Data types,” “Table engines,” et “CREATE”.

Expression Des Alias

Un alias est un nom défini par l'utilisateur pour une expression dans une requête.

expr AS alias
  • AS — The keyword for defining aliases. You can define the alias for a table name or a column name in a SELECT clause sans utiliser le AS mot.

    For example, `SELECT table_name_alias.column_name FROM table_name table_name_alias`.
    
    In the [CAST](functions/type_conversion_functions.md#type_conversion_function-cast) function, the `AS` keyword has another meaning. See the description of the function.
    
  • expr — Any expression supported by ClickHouse.

    For example, `SELECT column_name * 2 AS double FROM some_table`.
    
  • alias — Name for expr. Les alias doivent être conformes à la identificateur syntaxe.

    For example, `SELECT "table t".column_name FROM table_name AS "table t"`.
    

Notes sur l'Utilisation de la

Les alias sont globaux pour une requête ou d'une sous-requête et vous pouvez définir un alias dans n'importe quelle partie d'une requête de toute expression. Exemple, SELECT (1 AS n) + 2, n.

Les alias ne sont pas visibles dans les sous-requêtes et entre les sous-requêtes. Par exemple, lors de l'exécution de la requête SELECT (SELECT sum(b.a) + num FROM b) - a.a AS num FROM a Clickhouse génère l'exception Unknown identifier: num.

Si un alias est défini pour les colonnes de SELECT la clause d'une sous-requête, ces colonnes sont visibles dans la requête externe. Exemple, SELECT n + m FROM (SELECT 1 AS n, 2 AS m).

Soyez prudent avec les Alias qui sont les mêmes que les noms de colonnes ou de tables. Considérons l'exemple suivant:

CREATE TABLE t
(
    a Int,
    b Int
)
ENGINE = TinyLog()
SELECT
    argMax(a, b),
    sum(b) AS b
FROM t
Received exception from server (version 18.14.17):
Code: 184. DB::Exception: Received from localhost:9000, 127.0.0.1. DB::Exception: Aggregate function sum(b) is found inside another aggregate function in query.

Dans cet exemple, nous avons déclaré table t avec la colonne b. Ensuite, lors de la sélection des données, nous avons défini le sum(b) AS b alias. Comme les alias sont globaux, ClickHouse a substitué le littéral b dans l'expression argMax(a, b) avec l'expression sum(b). Cette substitution a provoqué l'exception.

Astérisque

Dans un SELECT requête, un astérisque peut remplacer l'expression. Pour plus d'informations, consultez la section “SELECT”.

Expression

Une expression est une fonction, un identifiant, un littéral, une application d'un opérateur, une expression entre parenthèses, une sous-requête ou un astérisque. Il peut également contenir un alias. Une liste des expressions est une ou plusieurs expressions séparées par des virgules. Les fonctions et les opérateurs, à leur tour, peuvent avoir des expressions comme arguments.

Article Original