Edit on GitHub

sqlglot.dialects.snowflake

View Source

   1from __future__ import annotations
   2
   3import typing as t
   4
   5from sqlglot import exp, generator, parser, tokens, transforms
   6from sqlglot.dialects.dialect import (
   7    Dialect,
   8    NormalizationStrategy,
   9    binary_from_function,
  10    date_delta_sql,
  11    date_trunc_to_time,
  12    datestrtodate_sql,
  13    build_formatted_time,
  14    if_sql,
  15    inline_array_sql,
  16    max_or_greatest,
  17    min_or_least,
  18    rename_func,
  19    timestamptrunc_sql,
  20    timestrtotime_sql,
  21    var_map_sql,
  22)
  23from sqlglot.helper import flatten, is_float, is_int, seq_get
  24from sqlglot.tokens import TokenType
  25
  26if t.TYPE_CHECKING:
  27    from sqlglot._typing import E
  28
  29
  30# from https://docs.snowflake.com/en/sql-reference/functions/to_timestamp.html
  31def _build_datetime(
  32    name: str, kind: exp.DataType.Type, safe: bool = False
  33) -> t.Callable[[t.List], exp.Func]:
  34    def _builder(args: t.List) -> exp.Func:
  35        value = seq_get(args, 0)
  36        int_value = value is not None and is_int(value.name)
  37
  38        if isinstance(value, exp.Literal):
  39            # Converts calls like `TO_TIME('01:02:03')` into casts
  40            if len(args) == 1 and value.is_string and not int_value:
  41                return exp.cast(value, kind)
  42
  43            # Handles `TO_TIMESTAMP(str, fmt)` and `TO_TIMESTAMP(num, scale)` as special
  44            # cases so we can transpile them, since they're relatively common
  45            if kind == exp.DataType.Type.TIMESTAMP:
  46                if int_value:
  47                    return exp.UnixToTime(this=value, scale=seq_get(args, 1))
  48                if not is_float(value.this):
  49                    return build_formatted_time(exp.StrToTime, "snowflake")(args)
  50
  51        if kind == exp.DataType.Type.DATE and not int_value:
  52            formatted_exp = build_formatted_time(exp.TsOrDsToDate, "snowflake")(args)
  53            formatted_exp.set("safe", safe)
  54            return formatted_exp
  55
  56        return exp.Anonymous(this=name, expressions=args)
  57
  58    return _builder
  59
  60
  61def _build_object_construct(args: t.List) -> t.Union[exp.StarMap, exp.Struct]:
  62    expression = parser.build_var_map(args)
  63
  64    if isinstance(expression, exp.StarMap):
  65        return expression
  66
  67    return exp.Struct(
  68        expressions=[
  69            exp.PropertyEQ(this=k, expression=v) for k, v in zip(expression.keys, expression.values)
  70        ]
  71    )
  72
  73
  74def _build_datediff(args: t.List) -> exp.DateDiff:
  75    return exp.DateDiff(
  76        this=seq_get(args, 2), expression=seq_get(args, 1), unit=_map_date_part(seq_get(args, 0))
  77    )
  78
  79
  80def _build_date_time_add(expr_type: t.Type[E]) -> t.Callable[[t.List], E]:
  81    def _builder(args: t.List) -> E:
  82        return expr_type(
  83            this=seq_get(args, 2),
  84            expression=seq_get(args, 1),
  85            unit=_map_date_part(seq_get(args, 0)),
  86        )
  87
  88    return _builder
  89
  90
  91# https://docs.snowflake.com/en/sql-reference/functions/div0
  92def _build_if_from_div0(args: t.List) -> exp.If:
  93    cond = exp.EQ(this=seq_get(args, 1), expression=exp.Literal.number(0))
  94    true = exp.Literal.number(0)
  95    false = exp.Div(this=seq_get(args, 0), expression=seq_get(args, 1))
  96    return exp.If(this=cond, true=true, false=false)
  97
  98
  99# https://docs.snowflake.com/en/sql-reference/functions/zeroifnull
 100def _build_if_from_zeroifnull(args: t.List) -> exp.If:
 101    cond = exp.Is(this=seq_get(args, 0), expression=exp.Null())
 102    return exp.If(this=cond, true=exp.Literal.number(0), false=seq_get(args, 0))
 103
 104
 105# https://docs.snowflake.com/en/sql-reference/functions/zeroifnull
 106def _build_if_from_nullifzero(args: t.List) -> exp.If:
 107    cond = exp.EQ(this=seq_get(args, 0), expression=exp.Literal.number(0))
 108    return exp.If(this=cond, true=exp.Null(), false=seq_get(args, 0))
 109
 110
 111def _regexpilike_sql(self: Snowflake.Generator, expression: exp.RegexpILike) -> str:
 112    flag = expression.text("flag")
 113
 114    if "i" not in flag:
 115        flag += "i"
 116
 117    return self.func(
 118        "REGEXP_LIKE", expression.this, expression.expression, exp.Literal.string(flag)
 119    )
 120
 121
 122def _build_convert_timezone(args: t.List) -> t.Union[exp.Anonymous, exp.AtTimeZone]:
 123    if len(args) == 3:
 124        return exp.Anonymous(this="CONVERT_TIMEZONE", expressions=args)
 125    return exp.AtTimeZone(this=seq_get(args, 1), zone=seq_get(args, 0))
 126
 127
 128def _build_regexp_replace(args: t.List) -> exp.RegexpReplace:
 129    regexp_replace = exp.RegexpReplace.from_arg_list(args)
 130
 131    if not regexp_replace.args.get("replacement"):
 132        regexp_replace.set("replacement", exp.Literal.string(""))
 133
 134    return regexp_replace
 135
 136
 137def _show_parser(*args: t.Any, **kwargs: t.Any) -> t.Callable[[Snowflake.Parser], exp.Show]:
 138    def _parse(self: Snowflake.Parser) -> exp.Show:
 139        return self._parse_show_snowflake(*args, **kwargs)
 140
 141    return _parse
 142
 143
 144DATE_PART_MAPPING = {
 145    "Y": "YEAR",
 146    "YY": "YEAR",
 147    "YYY": "YEAR",
 148    "YYYY": "YEAR",
 149    "YR": "YEAR",
 150    "YEARS": "YEAR",
 151    "YRS": "YEAR",
 152    "MM": "MONTH",
 153    "MON": "MONTH",
 154    "MONS": "MONTH",
 155    "MONTHS": "MONTH",
 156    "D": "DAY",
 157    "DD": "DAY",
 158    "DAYS": "DAY",
 159    "DAYOFMONTH": "DAY",
 160    "WEEKDAY": "DAYOFWEEK",
 161    "DOW": "DAYOFWEEK",
 162    "DW": "DAYOFWEEK",
 163    "WEEKDAY_ISO": "DAYOFWEEKISO",
 164    "DOW_ISO": "DAYOFWEEKISO",
 165    "DW_ISO": "DAYOFWEEKISO",
 166    "YEARDAY": "DAYOFYEAR",
 167    "DOY": "DAYOFYEAR",
 168    "DY": "DAYOFYEAR",
 169    "W": "WEEK",
 170    "WK": "WEEK",
 171    "WEEKOFYEAR": "WEEK",
 172    "WOY": "WEEK",
 173    "WY": "WEEK",
 174    "WEEK_ISO": "WEEKISO",
 175    "WEEKOFYEARISO": "WEEKISO",
 176    "WEEKOFYEAR_ISO": "WEEKISO",
 177    "Q": "QUARTER",
 178    "QTR": "QUARTER",
 179    "QTRS": "QUARTER",
 180    "QUARTERS": "QUARTER",
 181    "H": "HOUR",
 182    "HH": "HOUR",
 183    "HR": "HOUR",
 184    "HOURS": "HOUR",
 185    "HRS": "HOUR",
 186    "M": "MINUTE",
 187    "MI": "MINUTE",
 188    "MIN": "MINUTE",
 189    "MINUTES": "MINUTE",
 190    "MINS": "MINUTE",
 191    "S": "SECOND",
 192    "SEC": "SECOND",
 193    "SECONDS": "SECOND",
 194    "SECS": "SECOND",
 195    "MS": "MILLISECOND",
 196    "MSEC": "MILLISECOND",
 197    "MILLISECONDS": "MILLISECOND",
 198    "US": "MICROSECOND",
 199    "USEC": "MICROSECOND",
 200    "MICROSECONDS": "MICROSECOND",
 201    "NS": "NANOSECOND",
 202    "NSEC": "NANOSECOND",
 203    "NANOSEC": "NANOSECOND",
 204    "NSECOND": "NANOSECOND",
 205    "NSECONDS": "NANOSECOND",
 206    "NANOSECS": "NANOSECOND",
 207    "EPOCH": "EPOCH_SECOND",
 208    "EPOCH_SECONDS": "EPOCH_SECOND",
 209    "EPOCH_MILLISECONDS": "EPOCH_MILLISECOND",
 210    "EPOCH_MICROSECONDS": "EPOCH_MICROSECOND",
 211    "EPOCH_NANOSECONDS": "EPOCH_NANOSECOND",
 212    "TZH": "TIMEZONE_HOUR",
 213    "TZM": "TIMEZONE_MINUTE",
 214}
 215
 216
 217@t.overload
 218def _map_date_part(part: exp.Expression) -> exp.Var:
 219    pass
 220
 221
 222@t.overload
 223def _map_date_part(part: t.Optional[exp.Expression]) -> t.Optional[exp.Expression]:
 224    pass
 225
 226
 227def _map_date_part(part):
 228    mapped = DATE_PART_MAPPING.get(part.name.upper()) if part else None
 229    return exp.var(mapped) if mapped else part
 230
 231
 232def _date_trunc_to_time(args: t.List) -> exp.DateTrunc | exp.TimestampTrunc:
 233    trunc = date_trunc_to_time(args)
 234    trunc.set("unit", _map_date_part(trunc.args["unit"]))
 235    return trunc
 236
 237
 238def _build_timestamp_from_parts(args: t.List) -> exp.Func:
 239    if len(args) == 2:
 240        # Other dialects don't have the TIMESTAMP_FROM_PARTS(date, time) concept,
 241        # so we parse this into Anonymous for now instead of introducing complexity
 242        return exp.Anonymous(this="TIMESTAMP_FROM_PARTS", expressions=args)
 243
 244    return exp.TimestampFromParts.from_arg_list(args)
 245
 246
 247def _unqualify_unpivot_columns(expression: exp.Expression) -> exp.Expression:
 248    """
 249    Snowflake doesn't allow columns referenced in UNPIVOT to be qualified,
 250    so we need to unqualify them.
 251
 252    Example:
 253        >>> from sqlglot import parse_one
 254        >>> expr = parse_one("SELECT * FROM m_sales UNPIVOT(sales FOR month IN (m_sales.jan, feb, mar, april))")
 255        >>> print(_unqualify_unpivot_columns(expr).sql(dialect="snowflake"))
 256        SELECT * FROM m_sales UNPIVOT(sales FOR month IN (jan, feb, mar, april))
 257    """
 258    if isinstance(expression, exp.Pivot) and expression.unpivot:
 259        expression = transforms.unqualify_columns(expression)
 260
 261    return expression
 262
 263
 264def _flatten_structured_types_unless_iceberg(expression: exp.Expression) -> exp.Expression:
 265    assert isinstance(expression, exp.Create)
 266
 267    def _flatten_structured_type(expression: exp.DataType) -> exp.DataType:
 268        if expression.this in exp.DataType.NESTED_TYPES:
 269            expression.set("expressions", None)
 270        return expression
 271
 272    props = expression.args.get("properties")
 273    if isinstance(expression.this, exp.Schema) and not (props and props.find(exp.IcebergProperty)):
 274        for schema_expression in expression.this.expressions:
 275            if isinstance(schema_expression, exp.ColumnDef):
 276                column_type = schema_expression.kind
 277                if isinstance(column_type, exp.DataType):
 278                    column_type.transform(_flatten_structured_type, copy=False)
 279
 280    return expression
 281
 282
 283class Snowflake(Dialect):
 284    # https://docs.snowflake.com/en/sql-reference/identifiers-syntax
 285    NORMALIZATION_STRATEGY = NormalizationStrategy.UPPERCASE
 286    NULL_ORDERING = "nulls_are_large"
 287    TIME_FORMAT = "'YYYY-MM-DD HH24:MI:SS'"
 288    SUPPORTS_USER_DEFINED_TYPES = False
 289    SUPPORTS_SEMI_ANTI_JOIN = False
 290    PREFER_CTE_ALIAS_COLUMN = True
 291    TABLESAMPLE_SIZE_IS_PERCENT = True
 292    COPY_PARAMS_ARE_CSV = False
 293
 294    TIME_MAPPING = {
 295        "YYYY": "%Y",
 296        "yyyy": "%Y",
 297        "YY": "%y",
 298        "yy": "%y",
 299        "MMMM": "%B",
 300        "mmmm": "%B",
 301        "MON": "%b",
 302        "mon": "%b",
 303        "MM": "%m",
 304        "mm": "%m",
 305        "DD": "%d",
 306        "dd": "%-d",
 307        "DY": "%a",
 308        "dy": "%w",
 309        "HH24": "%H",
 310        "hh24": "%H",
 311        "HH12": "%I",
 312        "hh12": "%I",
 313        "MI": "%M",
 314        "mi": "%M",
 315        "SS": "%S",
 316        "ss": "%S",
 317        "FF": "%f",
 318        "ff": "%f",
 319        "FF6": "%f",
 320        "ff6": "%f",
 321    }
 322
 323    def quote_identifier(self, expression: E, identify: bool = True) -> E:
 324        # This disables quoting DUAL in SELECT ... FROM DUAL, because Snowflake treats an
 325        # unquoted DUAL keyword in a special way and does not map it to a user-defined table
 326        if (
 327            isinstance(expression, exp.Identifier)
 328            and isinstance(expression.parent, exp.Table)
 329            and expression.name.lower() == "dual"
 330        ):
 331            return expression  # type: ignore
 332
 333        return super().quote_identifier(expression, identify=identify)
 334
 335    class Parser(parser.Parser):
 336        IDENTIFY_PIVOT_STRINGS = True
 337
 338        ID_VAR_TOKENS = {
 339            *parser.Parser.ID_VAR_TOKENS,
 340            TokenType.MATCH_CONDITION,
 341        }
 342
 343        TABLE_ALIAS_TOKENS = parser.Parser.TABLE_ALIAS_TOKENS | {TokenType.WINDOW}
 344        TABLE_ALIAS_TOKENS.discard(TokenType.MATCH_CONDITION)
 345
 346        FUNCTIONS = {
 347            **parser.Parser.FUNCTIONS,
 348            "ARRAYAGG": exp.ArrayAgg.from_arg_list,
 349            "ARRAY_CONSTRUCT": exp.Array.from_arg_list,
 350            "ARRAY_CONTAINS": lambda args: exp.ArrayContains(
 351                this=seq_get(args, 1), expression=seq_get(args, 0)
 352            ),
 353            "ARRAY_GENERATE_RANGE": lambda args: exp.GenerateSeries(
 354                # ARRAY_GENERATE_RANGE has an exlusive end; we normalize it to be inclusive
 355                start=seq_get(args, 0),
 356                end=exp.Sub(this=seq_get(args, 1), expression=exp.Literal.number(1)),
 357                step=seq_get(args, 2),
 358            ),
 359            "BITXOR": binary_from_function(exp.BitwiseXor),
 360            "BIT_XOR": binary_from_function(exp.BitwiseXor),
 361            "BOOLXOR": binary_from_function(exp.Xor),
 362            "CONVERT_TIMEZONE": _build_convert_timezone,
 363            "DATE": _build_datetime("DATE", exp.DataType.Type.DATE),
 364            "DATE_TRUNC": _date_trunc_to_time,
 365            "DATEADD": _build_date_time_add(exp.DateAdd),
 366            "DATEDIFF": _build_datediff,
 367            "DIV0": _build_if_from_div0,
 368            "FLATTEN": exp.Explode.from_arg_list,
 369            "GET_PATH": lambda args, dialect: exp.JSONExtract(
 370                this=seq_get(args, 0), expression=dialect.to_json_path(seq_get(args, 1))
 371            ),
 372            "IFF": exp.If.from_arg_list,
 373            "LAST_DAY": lambda args: exp.LastDay(
 374                this=seq_get(args, 0), unit=_map_date_part(seq_get(args, 1))
 375            ),
 376            "LISTAGG": exp.GroupConcat.from_arg_list,
 377            "MEDIAN": lambda args: exp.PercentileCont(
 378                this=seq_get(args, 0), expression=exp.Literal.number(0.5)
 379            ),
 380            "NULLIFZERO": _build_if_from_nullifzero,
 381            "OBJECT_CONSTRUCT": _build_object_construct,
 382            "REGEXP_REPLACE": _build_regexp_replace,
 383            "REGEXP_SUBSTR": exp.RegexpExtract.from_arg_list,
 384            "RLIKE": exp.RegexpLike.from_arg_list,
 385            "SQUARE": lambda args: exp.Pow(this=seq_get(args, 0), expression=exp.Literal.number(2)),
 386            "TIMEADD": _build_date_time_add(exp.TimeAdd),
 387            "TIMEDIFF": _build_datediff,
 388            "TIMESTAMPADD": _build_date_time_add(exp.DateAdd),
 389            "TIMESTAMPDIFF": _build_datediff,
 390            "TIMESTAMPFROMPARTS": _build_timestamp_from_parts,
 391            "TIMESTAMP_FROM_PARTS": _build_timestamp_from_parts,
 392            "TRY_TO_DATE": _build_datetime("TRY_TO_DATE", exp.DataType.Type.DATE, safe=True),
 393            "TO_DATE": _build_datetime("TO_DATE", exp.DataType.Type.DATE),
 394            "TO_NUMBER": lambda args: exp.ToNumber(
 395                this=seq_get(args, 0),
 396                format=seq_get(args, 1),
 397                precision=seq_get(args, 2),
 398                scale=seq_get(args, 3),
 399            ),
 400            "TO_TIME": _build_datetime("TO_TIME", exp.DataType.Type.TIME),
 401            "TO_TIMESTAMP": _build_datetime("TO_TIMESTAMP", exp.DataType.Type.TIMESTAMP),
 402            "TO_TIMESTAMP_LTZ": _build_datetime("TO_TIMESTAMP_LTZ", exp.DataType.Type.TIMESTAMPLTZ),
 403            "TO_TIMESTAMP_NTZ": _build_datetime("TO_TIMESTAMP_NTZ", exp.DataType.Type.TIMESTAMP),
 404            "TO_TIMESTAMP_TZ": _build_datetime("TO_TIMESTAMP_TZ", exp.DataType.Type.TIMESTAMPTZ),
 405            "TO_VARCHAR": exp.ToChar.from_arg_list,
 406            "ZEROIFNULL": _build_if_from_zeroifnull,
 407        }
 408
 409        FUNCTION_PARSERS = {
 410            **parser.Parser.FUNCTION_PARSERS,
 411            "DATE_PART": lambda self: self._parse_date_part(),
 412            "OBJECT_CONSTRUCT_KEEP_NULL": lambda self: self._parse_json_object(),
 413        }
 414        FUNCTION_PARSERS.pop("TRIM")
 415
 416        TIMESTAMPS = parser.Parser.TIMESTAMPS - {TokenType.TIME}
 417
 418        RANGE_PARSERS = {
 419            **parser.Parser.RANGE_PARSERS,
 420            TokenType.LIKE_ANY: parser.binary_range_parser(exp.LikeAny),
 421            TokenType.ILIKE_ANY: parser.binary_range_parser(exp.ILikeAny),
 422        }
 423
 424        ALTER_PARSERS = {
 425            **parser.Parser.ALTER_PARSERS,
 426            "SET": lambda self: self._parse_set(tag=self._match_text_seq("TAG")),
 427            "UNSET": lambda self: self.expression(
 428                exp.Set,
 429                tag=self._match_text_seq("TAG"),
 430                expressions=self._parse_csv(self._parse_id_var),
 431                unset=True,
 432            ),
 433            "SWAP": lambda self: self._parse_alter_table_swap(),
 434        }
 435
 436        STATEMENT_PARSERS = {
 437            **parser.Parser.STATEMENT_PARSERS,
 438            TokenType.SHOW: lambda self: self._parse_show(),
 439        }
 440
 441        PROPERTY_PARSERS = {
 442            **parser.Parser.PROPERTY_PARSERS,
 443            "LOCATION": lambda self: self._parse_location(),
 444        }
 445
 446        SHOW_PARSERS = {
 447            "SCHEMAS": _show_parser("SCHEMAS"),
 448            "TERSE SCHEMAS": _show_parser("SCHEMAS"),
 449            "OBJECTS": _show_parser("OBJECTS"),
 450            "TERSE OBJECTS": _show_parser("OBJECTS"),
 451            "TABLES": _show_parser("TABLES"),
 452            "TERSE TABLES": _show_parser("TABLES"),
 453            "VIEWS": _show_parser("VIEWS"),
 454            "TERSE VIEWS": _show_parser("VIEWS"),
 455            "PRIMARY KEYS": _show_parser("PRIMARY KEYS"),
 456            "TERSE PRIMARY KEYS": _show_parser("PRIMARY KEYS"),
 457            "IMPORTED KEYS": _show_parser("IMPORTED KEYS"),
 458            "TERSE IMPORTED KEYS": _show_parser("IMPORTED KEYS"),
 459            "UNIQUE KEYS": _show_parser("UNIQUE KEYS"),
 460            "TERSE UNIQUE KEYS": _show_parser("UNIQUE KEYS"),
 461            "SEQUENCES": _show_parser("SEQUENCES"),
 462            "TERSE SEQUENCES": _show_parser("SEQUENCES"),
 463            "COLUMNS": _show_parser("COLUMNS"),
 464            "USERS": _show_parser("USERS"),
 465            "TERSE USERS": _show_parser("USERS"),
 466        }
 467
 468        STAGED_FILE_SINGLE_TOKENS = {
 469            TokenType.DOT,
 470            TokenType.MOD,
 471            TokenType.SLASH,
 472        }
 473
 474        FLATTEN_COLUMNS = ["SEQ", "KEY", "PATH", "INDEX", "VALUE", "THIS"]
 475
 476        SCHEMA_KINDS = {"OBJECTS", "TABLES", "VIEWS", "SEQUENCES", "UNIQUE KEYS", "IMPORTED KEYS"}
 477
 478        def _parse_column_ops(self, this: t.Optional[exp.Expression]) -> t.Optional[exp.Expression]:
 479            this = super()._parse_column_ops(this)
 480
 481            casts = []
 482            json_path = []
 483
 484            while self._match(TokenType.COLON):
 485                path = super()._parse_column_ops(self._parse_field(any_token=True))
 486
 487                # The cast :: operator has a lower precedence than the extraction operator :, so
 488                # we rearrange the AST appropriately to avoid casting the 2nd argument of GET_PATH
 489                while isinstance(path, exp.Cast):
 490                    casts.append(path.to)
 491                    path = path.this
 492
 493                if path:
 494                    json_path.append(path.sql(dialect="snowflake", copy=False))
 495
 496            if json_path:
 497                this = self.expression(
 498                    exp.JSONExtract,
 499                    this=this,
 500                    expression=self.dialect.to_json_path(exp.Literal.string(".".join(json_path))),
 501                )
 502
 503                while casts:
 504                    this = self.expression(exp.Cast, this=this, to=casts.pop())
 505
 506            return this
 507
 508        # https://docs.snowflake.com/en/sql-reference/functions/date_part.html
 509        # https://docs.snowflake.com/en/sql-reference/functions-date-time.html#label-supported-date-time-parts
 510        def _parse_date_part(self: Snowflake.Parser) -> t.Optional[exp.Expression]:
 511            this = self._parse_var() or self._parse_type()
 512
 513            if not this:
 514                return None
 515
 516            self._match(TokenType.COMMA)
 517            expression = self._parse_bitwise()
 518            this = _map_date_part(this)
 519            name = this.name.upper()
 520
 521            if name.startswith("EPOCH"):
 522                if name == "EPOCH_MILLISECOND":
 523                    scale = 10**3
 524                elif name == "EPOCH_MICROSECOND":
 525                    scale = 10**6
 526                elif name == "EPOCH_NANOSECOND":
 527                    scale = 10**9
 528                else:
 529                    scale = None
 530
 531                ts = self.expression(exp.Cast, this=expression, to=exp.DataType.build("TIMESTAMP"))
 532                to_unix: exp.Expression = self.expression(exp.TimeToUnix, this=ts)
 533
 534                if scale:
 535                    to_unix = exp.Mul(this=to_unix, expression=exp.Literal.number(scale))
 536
 537                return to_unix
 538
 539            return self.expression(exp.Extract, this=this, expression=expression)
 540
 541        def _parse_bracket_key_value(self, is_map: bool = False) -> t.Optional[exp.Expression]:
 542            if is_map:
 543                # Keys are strings in Snowflake's objects, see also:
 544                # - https://docs.snowflake.com/en/sql-reference/data-types-semistructured
 545                # - https://docs.snowflake.com/en/sql-reference/functions/object_construct
 546                return self._parse_slice(self._parse_string())
 547
 548            return self._parse_slice(self._parse_alias(self._parse_conjunction(), explicit=True))
 549
 550        def _parse_lateral(self) -> t.Optional[exp.Lateral]:
 551            lateral = super()._parse_lateral()
 552            if not lateral:
 553                return lateral
 554
 555            if isinstance(lateral.this, exp.Explode):
 556                table_alias = lateral.args.get("alias")
 557                columns = [exp.to_identifier(col) for col in self.FLATTEN_COLUMNS]
 558                if table_alias and not table_alias.args.get("columns"):
 559                    table_alias.set("columns", columns)
 560                elif not table_alias:
 561                    exp.alias_(lateral, "_flattened", table=columns, copy=False)
 562
 563            return lateral
 564
 565        def _parse_at_before(self, table: exp.Table) -> exp.Table:
 566            # https://docs.snowflake.com/en/sql-reference/constructs/at-before
 567            index = self._index
 568            if self._match_texts(("AT", "BEFORE")):
 569                this = self._prev.text.upper()
 570                kind = (
 571                    self._match(TokenType.L_PAREN)
 572                    and self._match_texts(self.HISTORICAL_DATA_KIND)
 573                    and self._prev.text.upper()
 574                )
 575                expression = self._match(TokenType.FARROW) and self._parse_bitwise()
 576
 577                if expression:
 578                    self._match_r_paren()
 579                    when = self.expression(
 580                        exp.HistoricalData, this=this, kind=kind, expression=expression
 581                    )
 582                    table.set("when", when)
 583                else:
 584                    self._retreat(index)
 585
 586            return table
 587
 588        def _parse_table_parts(
 589            self, schema: bool = False, is_db_reference: bool = False, wildcard: bool = False
 590        ) -> exp.Table:
 591            # https://docs.snowflake.com/en/user-guide/querying-stage
 592            if self._match(TokenType.STRING, advance=False):
 593                table = self._parse_string()
 594            elif self._match_text_seq("@", advance=False):
 595                table = self._parse_location_path()
 596            else:
 597                table = None
 598
 599            if table:
 600                file_format = None
 601                pattern = None
 602
 603                self._match(TokenType.L_PAREN)
 604                while self._curr and not self._match(TokenType.R_PAREN):
 605                    if self._match_text_seq("FILE_FORMAT", "=>"):
 606                        file_format = self._parse_string() or super()._parse_table_parts(
 607                            is_db_reference=is_db_reference
 608                        )
 609                    elif self._match_text_seq("PATTERN", "=>"):
 610                        pattern = self._parse_string()
 611                    else:
 612                        break
 613
 614                    self._match(TokenType.COMMA)
 615
 616                table = self.expression(exp.Table, this=table, format=file_format, pattern=pattern)
 617            else:
 618                table = super()._parse_table_parts(schema=schema, is_db_reference=is_db_reference)
 619
 620            return self._parse_at_before(table)
 621
 622        def _parse_id_var(
 623            self,
 624            any_token: bool = True,
 625            tokens: t.Optional[t.Collection[TokenType]] = None,
 626        ) -> t.Optional[exp.Expression]:
 627            if self._match_text_seq("IDENTIFIER", "("):
 628                identifier = (
 629                    super()._parse_id_var(any_token=any_token, tokens=tokens)
 630                    or self._parse_string()
 631                )
 632                self._match_r_paren()
 633                return self.expression(exp.Anonymous, this="IDENTIFIER", expressions=[identifier])
 634
 635            return super()._parse_id_var(any_token=any_token, tokens=tokens)
 636
 637        def _parse_show_snowflake(self, this: str) -> exp.Show:
 638            scope = None
 639            scope_kind = None
 640
 641            # will identity SHOW TERSE SCHEMAS but not SHOW TERSE PRIMARY KEYS
 642            # which is syntactically valid but has no effect on the output
 643            terse = self._tokens[self._index - 2].text.upper() == "TERSE"
 644
 645            history = self._match_text_seq("HISTORY")
 646
 647            like = self._parse_string() if self._match(TokenType.LIKE) else None
 648
 649            if self._match(TokenType.IN):
 650                if self._match_text_seq("ACCOUNT"):
 651                    scope_kind = "ACCOUNT"
 652                elif self._match_set(self.DB_CREATABLES):
 653                    scope_kind = self._prev.text.upper()
 654                    if self._curr:
 655                        scope = self._parse_table_parts()
 656                elif self._curr:
 657                    scope_kind = "SCHEMA" if this in self.SCHEMA_KINDS else "TABLE"
 658                    scope = self._parse_table_parts()
 659
 660            return self.expression(
 661                exp.Show,
 662                **{
 663                    "terse": terse,
 664                    "this": this,
 665                    "history": history,
 666                    "like": like,
 667                    "scope": scope,
 668                    "scope_kind": scope_kind,
 669                    "starts_with": self._match_text_seq("STARTS", "WITH") and self._parse_string(),
 670                    "limit": self._parse_limit(),
 671                    "from": self._parse_string() if self._match(TokenType.FROM) else None,
 672                },
 673            )
 674
 675        def _parse_alter_table_swap(self) -> exp.SwapTable:
 676            self._match_text_seq("WITH")
 677            return self.expression(exp.SwapTable, this=self._parse_table(schema=True))
 678
 679        def _parse_location(self) -> exp.LocationProperty:
 680            self._match(TokenType.EQ)
 681            return self.expression(exp.LocationProperty, this=self._parse_location_path())
 682
 683        def _parse_location_path(self) -> exp.Var:
 684            parts = [self._advance_any(ignore_reserved=True)]
 685
 686            # We avoid consuming a comma token because external tables like @foo and @bar
 687            # can be joined in a query with a comma separator.
 688            while self._is_connected() and not self._match(TokenType.COMMA, advance=False):
 689                parts.append(self._advance_any(ignore_reserved=True))
 690
 691            return exp.var("".join(part.text for part in parts if part))
 692
 693    class Tokenizer(tokens.Tokenizer):
 694        STRING_ESCAPES = ["\\", "'"]
 695        HEX_STRINGS = [("x'", "'"), ("X'", "'")]
 696        RAW_STRINGS = ["$$"]
 697        COMMENTS = ["--", "//", ("/*", "*/")]
 698
 699        KEYWORDS = {
 700            **tokens.Tokenizer.KEYWORDS,
 701            "BYTEINT": TokenType.INT,
 702            "CHAR VARYING": TokenType.VARCHAR,
 703            "CHARACTER VARYING": TokenType.VARCHAR,
 704            "EXCLUDE": TokenType.EXCEPT,
 705            "ILIKE ANY": TokenType.ILIKE_ANY,
 706            "LIKE ANY": TokenType.LIKE_ANY,
 707            "MATCH_CONDITION": TokenType.MATCH_CONDITION,
 708            "MATCH_RECOGNIZE": TokenType.MATCH_RECOGNIZE,
 709            "MINUS": TokenType.EXCEPT,
 710            "NCHAR VARYING": TokenType.VARCHAR,
 711            "PUT": TokenType.COMMAND,
 712            "REMOVE": TokenType.COMMAND,
 713            "RENAME": TokenType.REPLACE,
 714            "RM": TokenType.COMMAND,
 715            "SAMPLE": TokenType.TABLE_SAMPLE,
 716            "SQL_DOUBLE": TokenType.DOUBLE,
 717            "SQL_VARCHAR": TokenType.VARCHAR,
 718            "STORAGE INTEGRATION": TokenType.STORAGE_INTEGRATION,
 719            "TIMESTAMP_TZ": TokenType.TIMESTAMPTZ,
 720            "TOP": TokenType.TOP,
 721        }
 722
 723        SINGLE_TOKENS = {
 724            **tokens.Tokenizer.SINGLE_TOKENS,
 725            "$": TokenType.PARAMETER,
 726        }
 727
 728        VAR_SINGLE_TOKENS = {"$"}
 729
 730        COMMANDS = tokens.Tokenizer.COMMANDS - {TokenType.SHOW}
 731
 732    class Generator(generator.Generator):
 733        PARAMETER_TOKEN = "$"
 734        MATCHED_BY_SOURCE = False
 735        SINGLE_STRING_INTERVAL = True
 736        JOIN_HINTS = False
 737        TABLE_HINTS = False
 738        QUERY_HINTS = False
 739        AGGREGATE_FILTER_SUPPORTED = False
 740        SUPPORTS_TABLE_COPY = False
 741        COLLATE_IS_FUNC = True
 742        LIMIT_ONLY_LITERALS = True
 743        JSON_KEY_VALUE_PAIR_SEP = ","
 744        INSERT_OVERWRITE = " OVERWRITE INTO"
 745        STRUCT_DELIMITER = ("(", ")")
 746        COPY_PARAMS_ARE_WRAPPED = False
 747        COPY_PARAMS_EQ_REQUIRED = True
 748
 749        TRANSFORMS = {
 750            **generator.Generator.TRANSFORMS,
 751            exp.ApproxDistinct: rename_func("APPROX_COUNT_DISTINCT"),
 752            exp.ArgMax: rename_func("MAX_BY"),
 753            exp.ArgMin: rename_func("MIN_BY"),
 754            exp.Array: inline_array_sql,
 755            exp.ArrayConcat: rename_func("ARRAY_CAT"),
 756            exp.ArrayContains: lambda self, e: self.func("ARRAY_CONTAINS", e.expression, e.this),
 757            exp.AtTimeZone: lambda self, e: self.func(
 758                "CONVERT_TIMEZONE", e.args.get("zone"), e.this
 759            ),
 760            exp.BitwiseXor: rename_func("BITXOR"),
 761            exp.Create: transforms.preprocess([_flatten_structured_types_unless_iceberg]),
 762            exp.DateAdd: date_delta_sql("DATEADD"),
 763            exp.DateDiff: date_delta_sql("DATEDIFF"),
 764            exp.DateStrToDate: datestrtodate_sql,
 765            exp.DayOfMonth: rename_func("DAYOFMONTH"),
 766            exp.DayOfWeek: rename_func("DAYOFWEEK"),
 767            exp.DayOfYear: rename_func("DAYOFYEAR"),
 768            exp.Explode: rename_func("FLATTEN"),
 769            exp.Extract: rename_func("DATE_PART"),
 770            exp.FromTimeZone: lambda self, e: self.func(
 771                "CONVERT_TIMEZONE", e.args.get("zone"), "'UTC'", e.this
 772            ),
 773            exp.GenerateSeries: lambda self, e: self.func(
 774                "ARRAY_GENERATE_RANGE", e.args["start"], e.args["end"] + 1, e.args.get("step")
 775            ),
 776            exp.GroupConcat: rename_func("LISTAGG"),
 777            exp.If: if_sql(name="IFF", false_value="NULL"),
 778            exp.JSONExtract: lambda self, e: self.func("GET_PATH", e.this, e.expression),
 779            exp.JSONExtractScalar: lambda self, e: self.func(
 780                "JSON_EXTRACT_PATH_TEXT", e.this, e.expression
 781            ),
 782            exp.JSONObject: lambda self, e: self.func("OBJECT_CONSTRUCT_KEEP_NULL", *e.expressions),
 783            exp.JSONPathRoot: lambda *_: "",
 784            exp.LogicalAnd: rename_func("BOOLAND_AGG"),
 785            exp.LogicalOr: rename_func("BOOLOR_AGG"),
 786            exp.Map: lambda self, e: var_map_sql(self, e, "OBJECT_CONSTRUCT"),
 787            exp.Max: max_or_greatest,
 788            exp.Min: min_or_least,
 789            exp.PartitionedByProperty: lambda self, e: f"PARTITION BY {self.sql(e, 'this')}",
 790            exp.PercentileCont: transforms.preprocess(
 791                [transforms.add_within_group_for_percentiles]
 792            ),
 793            exp.PercentileDisc: transforms.preprocess(
 794                [transforms.add_within_group_for_percentiles]
 795            ),
 796            exp.Pivot: transforms.preprocess([_unqualify_unpivot_columns]),
 797            exp.RegexpILike: _regexpilike_sql,
 798            exp.Rand: rename_func("RANDOM"),
 799            exp.Select: transforms.preprocess(
 800                [
 801                    transforms.eliminate_distinct_on,
 802                    transforms.explode_to_unnest(),
 803                    transforms.eliminate_semi_and_anti_joins,
 804                ]
 805            ),
 806            exp.SHA: rename_func("SHA1"),
 807            exp.StarMap: rename_func("OBJECT_CONSTRUCT"),
 808            exp.StartsWith: rename_func("STARTSWITH"),
 809            exp.StrPosition: lambda self, e: self.func(
 810                "POSITION", e.args.get("substr"), e.this, e.args.get("position")
 811            ),
 812            exp.StrToTime: lambda self, e: self.func("TO_TIMESTAMP", e.this, self.format_time(e)),
 813            exp.Stuff: rename_func("INSERT"),
 814            exp.TimeAdd: date_delta_sql("TIMEADD"),
 815            exp.TimestampDiff: lambda self, e: self.func(
 816                "TIMESTAMPDIFF", e.unit, e.expression, e.this
 817            ),
 818            exp.TimestampTrunc: timestamptrunc_sql,
 819            exp.TimeStrToTime: timestrtotime_sql,
 820            exp.TimeToStr: lambda self, e: self.func(
 821                "TO_CHAR", exp.cast(e.this, exp.DataType.Type.TIMESTAMP), self.format_time(e)
 822            ),
 823            exp.TimeToUnix: lambda self, e: f"EXTRACT(epoch_second FROM {self.sql(e, 'this')})",
 824            exp.ToArray: rename_func("TO_ARRAY"),
 825            exp.ToChar: lambda self, e: self.function_fallback_sql(e),
 826            exp.Trim: lambda self, e: self.func("TRIM", e.this, e.expression),
 827            exp.TsOrDsAdd: date_delta_sql("DATEADD", cast=True),
 828            exp.TsOrDsDiff: date_delta_sql("DATEDIFF"),
 829            exp.TsOrDsToDate: lambda self, e: self.func(
 830                "TRY_TO_DATE" if e.args.get("safe") else "TO_DATE", e.this, self.format_time(e)
 831            ),
 832            exp.UnixToTime: rename_func("TO_TIMESTAMP"),
 833            exp.VarMap: lambda self, e: var_map_sql(self, e, "OBJECT_CONSTRUCT"),
 834            exp.WeekOfYear: rename_func("WEEKOFYEAR"),
 835            exp.Xor: rename_func("BOOLXOR"),
 836        }
 837
 838        SUPPORTED_JSON_PATH_PARTS = {
 839            exp.JSONPathKey,
 840            exp.JSONPathRoot,
 841            exp.JSONPathSubscript,
 842        }
 843
 844        TYPE_MAPPING = {
 845            **generator.Generator.TYPE_MAPPING,
 846            exp.DataType.Type.NESTED: "OBJECT",
 847            exp.DataType.Type.STRUCT: "OBJECT",
 848        }
 849
 850        STAR_MAPPING = {
 851            "except": "EXCLUDE",
 852            "replace": "RENAME",
 853        }
 854
 855        PROPERTIES_LOCATION = {
 856            **generator.Generator.PROPERTIES_LOCATION,
 857            exp.SetProperty: exp.Properties.Location.UNSUPPORTED,
 858            exp.VolatileProperty: exp.Properties.Location.UNSUPPORTED,
 859        }
 860
 861        UNSUPPORTED_VALUES_EXPRESSIONS = {
 862            exp.Struct,
 863        }
 864
 865        def values_sql(self, expression: exp.Values, values_as_table: bool = True) -> str:
 866            if expression.find(*self.UNSUPPORTED_VALUES_EXPRESSIONS):
 867                values_as_table = False
 868
 869            return super().values_sql(expression, values_as_table=values_as_table)
 870
 871        def datatype_sql(self, expression: exp.DataType) -> str:
 872            expressions = expression.expressions
 873            if (
 874                expressions
 875                and expression.is_type(*exp.DataType.STRUCT_TYPES)
 876                and any(isinstance(field_type, exp.DataType) for field_type in expressions)
 877            ):
 878                # The correct syntax is OBJECT [ (<key> <value_type [NOT NULL] [, ...]) ]
 879                return "OBJECT"
 880
 881            return super().datatype_sql(expression)
 882
 883        def tonumber_sql(self, expression: exp.ToNumber) -> str:
 884            return self.func(
 885                "TO_NUMBER",
 886                expression.this,
 887                expression.args.get("format"),
 888                expression.args.get("precision"),
 889                expression.args.get("scale"),
 890            )
 891
 892        def timestampfromparts_sql(self, expression: exp.TimestampFromParts) -> str:
 893            milli = expression.args.get("milli")
 894            if milli is not None:
 895                milli_to_nano = milli.pop() * exp.Literal.number(1000000)
 896                expression.set("nano", milli_to_nano)
 897
 898            return rename_func("TIMESTAMP_FROM_PARTS")(self, expression)
 899
 900        def trycast_sql(self, expression: exp.TryCast) -> str:
 901            value = expression.this
 902
 903            if value.type is None:
 904                from sqlglot.optimizer.annotate_types import annotate_types
 905
 906                value = annotate_types(value)
 907
 908            if value.is_type(*exp.DataType.TEXT_TYPES, exp.DataType.Type.UNKNOWN):
 909                return super().trycast_sql(expression)
 910
 911            # TRY_CAST only works for string values in Snowflake
 912            return self.cast_sql(expression)
 913
 914        def log_sql(self, expression: exp.Log) -> str:
 915            if not expression.expression:
 916                return self.func("LN", expression.this)
 917
 918            return super().log_sql(expression)
 919
 920        def unnest_sql(self, expression: exp.Unnest) -> str:
 921            unnest_alias = expression.args.get("alias")
 922            offset = expression.args.get("offset")
 923
 924            columns = [
 925                exp.to_identifier("seq"),
 926                exp.to_identifier("key"),
 927                exp.to_identifier("path"),
 928                offset.pop() if isinstance(offset, exp.Expression) else exp.to_identifier("index"),
 929                seq_get(unnest_alias.columns if unnest_alias else [], 0)
 930                or exp.to_identifier("value"),
 931                exp.to_identifier("this"),
 932            ]
 933
 934            if unnest_alias:
 935                unnest_alias.set("columns", columns)
 936            else:
 937                unnest_alias = exp.TableAlias(this="_u", columns=columns)
 938
 939            explode = f"TABLE(FLATTEN(INPUT => {self.sql(expression.expressions[0])}))"
 940            alias = self.sql(unnest_alias)
 941            alias = f" AS {alias}" if alias else ""
 942            return f"{explode}{alias}"
 943
 944        def show_sql(self, expression: exp.Show) -> str:
 945            terse = "TERSE " if expression.args.get("terse") else ""
 946            history = " HISTORY" if expression.args.get("history") else ""
 947            like = self.sql(expression, "like")
 948            like = f" LIKE {like}" if like else ""
 949
 950            scope = self.sql(expression, "scope")
 951            scope = f" {scope}" if scope else ""
 952
 953            scope_kind = self.sql(expression, "scope_kind")
 954            if scope_kind:
 955                scope_kind = f" IN {scope_kind}"
 956
 957            starts_with = self.sql(expression, "starts_with")
 958            if starts_with:
 959                starts_with = f" STARTS WITH {starts_with}"
 960
 961            limit = self.sql(expression, "limit")
 962
 963            from_ = self.sql(expression, "from")
 964            if from_:
 965                from_ = f" FROM {from_}"
 966
 967            return f"SHOW {terse}{expression.name}{history}{like}{scope_kind}{scope}{starts_with}{limit}{from_}"
 968
 969        def regexpextract_sql(self, expression: exp.RegexpExtract) -> str:
 970            # Other dialects don't support all of the following parameters, so we need to
 971            # generate default values as necessary to ensure the transpilation is correct
 972            group = expression.args.get("group")
 973            parameters = expression.args.get("parameters") or (group and exp.Literal.string("c"))
 974            occurrence = expression.args.get("occurrence") or (parameters and exp.Literal.number(1))
 975            position = expression.args.get("position") or (occurrence and exp.Literal.number(1))
 976
 977            return self.func(
 978                "REGEXP_SUBSTR",
 979                expression.this,
 980                expression.expression,
 981                position,
 982                occurrence,
 983                parameters,
 984                group,
 985            )
 986
 987        def except_op(self, expression: exp.Except) -> str:
 988            if not expression.args.get("distinct"):
 989                self.unsupported("EXCEPT with All is not supported in Snowflake")
 990            return super().except_op(expression)
 991
 992        def intersect_op(self, expression: exp.Intersect) -> str:
 993            if not expression.args.get("distinct"):
 994                self.unsupported("INTERSECT with All is not supported in Snowflake")
 995            return super().intersect_op(expression)
 996
 997        def describe_sql(self, expression: exp.Describe) -> str:
 998            # Default to table if kind is unknown
 999            kind_value = expression.args.get("kind") or "TABLE"
1000            kind = f" {kind_value}" if kind_value else ""
1001            this = f" {self.sql(expression, 'this')}"
1002            expressions = self.expressions(expression, flat=True)
1003            expressions = f" {expressions}" if expressions else ""
1004            return f"DESCRIBE{kind}{this}{expressions}"
1005
1006        def generatedasidentitycolumnconstraint_sql(
1007            self, expression: exp.GeneratedAsIdentityColumnConstraint
1008        ) -> str:
1009            start = expression.args.get("start")
1010            start = f" START {start}" if start else ""
1011            increment = expression.args.get("increment")
1012            increment = f" INCREMENT {increment}" if increment else ""
1013            return f"AUTOINCREMENT{start}{increment}"
1014
1015        def swaptable_sql(self, expression: exp.SwapTable) -> str:
1016            this = self.sql(expression, "this")
1017            return f"SWAP WITH {this}"
1018
1019        def with_properties(self, properties: exp.Properties) -> str:
1020            return self.properties(properties, wrapped=False, prefix=self.seg(""), sep=" ")
1021
1022        def cluster_sql(self, expression: exp.Cluster) -> str:
1023            return f"CLUSTER BY ({self.expressions(expression, flat=True)})"
1024
1025        def struct_sql(self, expression: exp.Struct) -> str:
1026            keys = []
1027            values = []
1028
1029            for i, e in enumerate(expression.expressions):
1030                if isinstance(e, exp.PropertyEQ):
1031                    keys.append(
1032                        exp.Literal.string(e.name) if isinstance(e.this, exp.Identifier) else e.this
1033                    )
1034                    values.append(e.expression)
1035                else:
1036                    keys.append(exp.Literal.string(f"_{i}"))
1037                    values.append(e)
1038
1039            return self.func("OBJECT_CONSTRUCT", *flatten(zip(keys, values)))

DATE_PART_MAPPING = {'Y': 'YEAR', 'YY': 'YEAR', 'YYY': 'YEAR', 'YYYY': 'YEAR', 'YR': 'YEAR', 'YEARS': 'YEAR', 'YRS': 'YEAR', 'MM': 'MONTH', 'MON': 'MONTH', 'MONS': 'MONTH', 'MONTHS': 'MONTH', 'D': 'DAY', 'DD': 'DAY', 'DAYS': 'DAY', 'DAYOFMONTH': 'DAY', 'WEEKDAY': 'DAYOFWEEK', 'DOW': 'DAYOFWEEK', 'DW': 'DAYOFWEEK', 'WEEKDAY_ISO': 'DAYOFWEEKISO', 'DOW_ISO': 'DAYOFWEEKISO', 'DW_ISO': 'DAYOFWEEKISO', 'YEARDAY': 'DAYOFYEAR', 'DOY': 'DAYOFYEAR', 'DY': 'DAYOFYEAR', 'W': 'WEEK', 'WK': 'WEEK', 'WEEKOFYEAR': 'WEEK', 'WOY': 'WEEK', 'WY': 'WEEK', 'WEEK_ISO': 'WEEKISO', 'WEEKOFYEARISO': 'WEEKISO', 'WEEKOFYEAR_ISO': 'WEEKISO', 'Q': 'QUARTER', 'QTR': 'QUARTER', 'QTRS': 'QUARTER', 'QUARTERS': 'QUARTER', 'H': 'HOUR', 'HH': 'HOUR', 'HR': 'HOUR', 'HOURS': 'HOUR', 'HRS': 'HOUR', 'M': 'MINUTE', 'MI': 'MINUTE', 'MIN': 'MINUTE', 'MINUTES': 'MINUTE', 'MINS': 'MINUTE', 'S': 'SECOND', 'SEC': 'SECOND', 'SECONDS': 'SECOND', 'SECS': 'SECOND', 'MS': 'MILLISECOND', 'MSEC': 'MILLISECOND', 'MILLISECONDS': 'MILLISECOND', 'US': 'MICROSECOND', 'USEC': 'MICROSECOND', 'MICROSECONDS': 'MICROSECOND', 'NS': 'NANOSECOND', 'NSEC': 'NANOSECOND', 'NANOSEC': 'NANOSECOND', 'NSECOND': 'NANOSECOND', 'NSECONDS': 'NANOSECOND', 'NANOSECS': 'NANOSECOND', 'EPOCH': 'EPOCH_SECOND', 'EPOCH_SECONDS': 'EPOCH_SECOND', 'EPOCH_MILLISECONDS': 'EPOCH_MILLISECOND', 'EPOCH_MICROSECONDS': 'EPOCH_MICROSECOND', 'EPOCH_NANOSECONDS': 'EPOCH_NANOSECOND', 'TZH': 'TIMEZONE_HOUR', 'TZM': 'TIMEZONE_MINUTE'}

class Snowflake(sqlglot.dialects.dialect.Dialect): View Source

 284class Snowflake(Dialect):
 285    # https://docs.snowflake.com/en/sql-reference/identifiers-syntax
 286    NORMALIZATION_STRATEGY = NormalizationStrategy.UPPERCASE
 287    NULL_ORDERING = "nulls_are_large"
 288    TIME_FORMAT = "'YYYY-MM-DD HH24:MI:SS'"
 289    SUPPORTS_USER_DEFINED_TYPES = False
 290    SUPPORTS_SEMI_ANTI_JOIN = False
 291    PREFER_CTE_ALIAS_COLUMN = True
 292    TABLESAMPLE_SIZE_IS_PERCENT = True
 293    COPY_PARAMS_ARE_CSV = False
 294
 295    TIME_MAPPING = {
 296        "YYYY": "%Y",
 297        "yyyy": "%Y",
 298        "YY": "%y",
 299        "yy": "%y",
 300        "MMMM": "%B",
 301        "mmmm": "%B",
 302        "MON": "%b",
 303        "mon": "%b",
 304        "MM": "%m",
 305        "mm": "%m",
 306        "DD": "%d",
 307        "dd": "%-d",
 308        "DY": "%a",
 309        "dy": "%w",
 310        "HH24": "%H",
 311        "hh24": "%H",
 312        "HH12": "%I",
 313        "hh12": "%I",
 314        "MI": "%M",
 315        "mi": "%M",
 316        "SS": "%S",
 317        "ss": "%S",
 318        "FF": "%f",
 319        "ff": "%f",
 320        "FF6": "%f",
 321        "ff6": "%f",
 322    }
 323
 324    def quote_identifier(self, expression: E, identify: bool = True) -> E:
 325        # This disables quoting DUAL in SELECT ... FROM DUAL, because Snowflake treats an
 326        # unquoted DUAL keyword in a special way and does not map it to a user-defined table
 327        if (
 328            isinstance(expression, exp.Identifier)
 329            and isinstance(expression.parent, exp.Table)
 330            and expression.name.lower() == "dual"
 331        ):
 332            return expression  # type: ignore
 333
 334        return super().quote_identifier(expression, identify=identify)
 335
 336    class Parser(parser.Parser):
 337        IDENTIFY_PIVOT_STRINGS = True
 338
 339        ID_VAR_TOKENS = {
 340            *parser.Parser.ID_VAR_TOKENS,
 341            TokenType.MATCH_CONDITION,
 342        }
 343
 344        TABLE_ALIAS_TOKENS = parser.Parser.TABLE_ALIAS_TOKENS | {TokenType.WINDOW}
 345        TABLE_ALIAS_TOKENS.discard(TokenType.MATCH_CONDITION)
 346
 347        FUNCTIONS = {
 348            **parser.Parser.FUNCTIONS,
 349            "ARRAYAGG": exp.ArrayAgg.from_arg_list,
 350            "ARRAY_CONSTRUCT": exp.Array.from_arg_list,
 351            "ARRAY_CONTAINS": lambda args: exp.ArrayContains(
 352                this=seq_get(args, 1), expression=seq_get(args, 0)
 353            ),
 354            "ARRAY_GENERATE_RANGE": lambda args: exp.GenerateSeries(
 355                # ARRAY_GENERATE_RANGE has an exlusive end; we normalize it to be inclusive
 356                start=seq_get(args, 0),
 357                end=exp.Sub(this=seq_get(args, 1), expression=exp.Literal.number(1)),
 358                step=seq_get(args, 2),
 359            ),
 360            "BITXOR": binary_from_function(exp.BitwiseXor),
 361            "BIT_XOR": binary_from_function(exp.BitwiseXor),
 362            "BOOLXOR": binary_from_function(exp.Xor),
 363            "CONVERT_TIMEZONE": _build_convert_timezone,
 364            "DATE": _build_datetime("DATE", exp.DataType.Type.DATE),
 365            "DATE_TRUNC": _date_trunc_to_time,
 366            "DATEADD": _build_date_time_add(exp.DateAdd),
 367            "DATEDIFF": _build_datediff,
 368            "DIV0": _build_if_from_div0,
 369            "FLATTEN": exp.Explode.from_arg_list,
 370            "GET_PATH": lambda args, dialect: exp.JSONExtract(
 371                this=seq_get(args, 0), expression=dialect.to_json_path(seq_get(args, 1))
 372            ),
 373            "IFF": exp.If.from_arg_list,
 374            "LAST_DAY": lambda args: exp.LastDay(
 375                this=seq_get(args, 0), unit=_map_date_part(seq_get(args, 1))
 376            ),
 377            "LISTAGG": exp.GroupConcat.from_arg_list,
 378            "MEDIAN": lambda args: exp.PercentileCont(
 379                this=seq_get(args, 0), expression=exp.Literal.number(0.5)
 380            ),
 381            "NULLIFZERO": _build_if_from_nullifzero,
 382            "OBJECT_CONSTRUCT": _build_object_construct,
 383            "REGEXP_REPLACE": _build_regexp_replace,
 384            "REGEXP_SUBSTR": exp.RegexpExtract.from_arg_list,
 385            "RLIKE": exp.RegexpLike.from_arg_list,
 386            "SQUARE": lambda args: exp.Pow(this=seq_get(args, 0), expression=exp.Literal.number(2)),
 387            "TIMEADD": _build_date_time_add(exp.TimeAdd),
 388            "TIMEDIFF": _build_datediff,
 389            "TIMESTAMPADD": _build_date_time_add(exp.DateAdd),
 390            "TIMESTAMPDIFF": _build_datediff,
 391            "TIMESTAMPFROMPARTS": _build_timestamp_from_parts,
 392            "TIMESTAMP_FROM_PARTS": _build_timestamp_from_parts,
 393            "TRY_TO_DATE": _build_datetime("TRY_TO_DATE", exp.DataType.Type.DATE, safe=True),
 394            "TO_DATE": _build_datetime("TO_DATE", exp.DataType.Type.DATE),
 395            "TO_NUMBER": lambda args: exp.ToNumber(
 396                this=seq_get(args, 0),
 397                format=seq_get(args, 1),
 398                precision=seq_get(args, 2),
 399                scale=seq_get(args, 3),
 400            ),
 401            "TO_TIME": _build_datetime("TO_TIME", exp.DataType.Type.TIME),
 402            "TO_TIMESTAMP": _build_datetime("TO_TIMESTAMP", exp.DataType.Type.TIMESTAMP),
 403            "TO_TIMESTAMP_LTZ": _build_datetime("TO_TIMESTAMP_LTZ", exp.DataType.Type.TIMESTAMPLTZ),
 404            "TO_TIMESTAMP_NTZ": _build_datetime("TO_TIMESTAMP_NTZ", exp.DataType.Type.TIMESTAMP),
 405            "TO_TIMESTAMP_TZ": _build_datetime("TO_TIMESTAMP_TZ", exp.DataType.Type.TIMESTAMPTZ),
 406            "TO_VARCHAR": exp.ToChar.from_arg_list,
 407            "ZEROIFNULL": _build_if_from_zeroifnull,
 408        }
 409
 410        FUNCTION_PARSERS = {
 411            **parser.Parser.FUNCTION_PARSERS,
 412            "DATE_PART": lambda self: self._parse_date_part(),
 413            "OBJECT_CONSTRUCT_KEEP_NULL": lambda self: self._parse_json_object(),
 414        }
 415        FUNCTION_PARSERS.pop("TRIM")
 416
 417        TIMESTAMPS = parser.Parser.TIMESTAMPS - {TokenType.TIME}
 418
 419        RANGE_PARSERS = {
 420            **parser.Parser.RANGE_PARSERS,
 421            TokenType.LIKE_ANY: parser.binary_range_parser(exp.LikeAny),
 422            TokenType.ILIKE_ANY: parser.binary_range_parser(exp.ILikeAny),
 423        }
 424
 425        ALTER_PARSERS = {
 426            **parser.Parser.ALTER_PARSERS,
 427            "SET": lambda self: self._parse_set(tag=self._match_text_seq("TAG")),
 428            "UNSET": lambda self: self.expression(
 429                exp.Set,
 430                tag=self._match_text_seq("TAG"),
 431                expressions=self._parse_csv(self._parse_id_var),
 432                unset=True,
 433            ),
 434            "SWAP": lambda self: self._parse_alter_table_swap(),
 435        }
 436
 437        STATEMENT_PARSERS = {
 438            **parser.Parser.STATEMENT_PARSERS,
 439            TokenType.SHOW: lambda self: self._parse_show(),
 440        }
 441
 442        PROPERTY_PARSERS = {
 443            **parser.Parser.PROPERTY_PARSERS,
 444            "LOCATION": lambda self: self._parse_location(),
 445        }
 446
 447        SHOW_PARSERS = {
 448            "SCHEMAS": _show_parser("SCHEMAS"),
 449            "TERSE SCHEMAS": _show_parser("SCHEMAS"),
 450            "OBJECTS": _show_parser("OBJECTS"),
 451            "TERSE OBJECTS": _show_parser("OBJECTS"),
 452            "TABLES": _show_parser("TABLES"),
 453            "TERSE TABLES": _show_parser("TABLES"),
 454            "VIEWS": _show_parser("VIEWS"),
 455            "TERSE VIEWS": _show_parser("VIEWS"),
 456            "PRIMARY KEYS": _show_parser("PRIMARY KEYS"),
 457            "TERSE PRIMARY KEYS": _show_parser("PRIMARY KEYS"),
 458            "IMPORTED KEYS": _show_parser("IMPORTED KEYS"),
 459            "TERSE IMPORTED KEYS": _show_parser("IMPORTED KEYS"),
 460            "UNIQUE KEYS": _show_parser("UNIQUE KEYS"),
 461            "TERSE UNIQUE KEYS": _show_parser("UNIQUE KEYS"),
 462            "SEQUENCES": _show_parser("SEQUENCES"),
 463            "TERSE SEQUENCES": _show_parser("SEQUENCES"),
 464            "COLUMNS": _show_parser("COLUMNS"),
 465            "USERS": _show_parser("USERS"),
 466            "TERSE USERS": _show_parser("USERS"),
 467        }
 468
 469        STAGED_FILE_SINGLE_TOKENS = {
 470            TokenType.DOT,
 471            TokenType.MOD,
 472            TokenType.SLASH,
 473        }
 474
 475        FLATTEN_COLUMNS = ["SEQ", "KEY", "PATH", "INDEX", "VALUE", "THIS"]
 476
 477        SCHEMA_KINDS = {"OBJECTS", "TABLES", "VIEWS", "SEQUENCES", "UNIQUE KEYS", "IMPORTED KEYS"}
 478
 479        def _parse_column_ops(self, this: t.Optional[exp.Expression]) -> t.Optional[exp.Expression]:
 480            this = super()._parse_column_ops(this)
 481
 482            casts = []
 483            json_path = []
 484
 485            while self._match(TokenType.COLON):
 486                path = super()._parse_column_ops(self._parse_field(any_token=True))
 487
 488                # The cast :: operator has a lower precedence than the extraction operator :, so
 489                # we rearrange the AST appropriately to avoid casting the 2nd argument of GET_PATH
 490                while isinstance(path, exp.Cast):
 491                    casts.append(path.to)
 492                    path = path.this
 493
 494                if path:
 495                    json_path.append(path.sql(dialect="snowflake", copy=False))
 496
 497            if json_path:
 498                this = self.expression(
 499                    exp.JSONExtract,
 500                    this=this,
 501                    expression=self.dialect.to_json_path(exp.Literal.string(".".join(json_path))),
 502                )
 503
 504                while casts:
 505                    this = self.expression(exp.Cast, this=this, to=casts.pop())
 506
 507            return this
 508
 509        # https://docs.snowflake.com/en/sql-reference/functions/date_part.html
 510        # https://docs.snowflake.com/en/sql-reference/functions-date-time.html#label-supported-date-time-parts
 511        def _parse_date_part(self: Snowflake.Parser) -> t.Optional[exp.Expression]:
 512            this = self._parse_var() or self._parse_type()
 513
 514            if not this:
 515                return None
 516
 517            self._match(TokenType.COMMA)
 518            expression = self._parse_bitwise()
 519            this = _map_date_part(this)
 520            name = this.name.upper()
 521
 522            if name.startswith("EPOCH"):
 523                if name == "EPOCH_MILLISECOND":
 524                    scale = 10**3
 525                elif name == "EPOCH_MICROSECOND":
 526                    scale = 10**6
 527                elif name == "EPOCH_NANOSECOND":
 528                    scale = 10**9
 529                else:
 530                    scale = None
 531
 532                ts = self.expression(exp.Cast, this=expression, to=exp.DataType.build("TIMESTAMP"))
 533                to_unix: exp.Expression = self.expression(exp.TimeToUnix, this=ts)
 534
 535                if scale:
 536                    to_unix = exp.Mul(this=to_unix, expression=exp.Literal.number(scale))
 537
 538                return to_unix
 539
 540            return self.expression(exp.Extract, this=this, expression=expression)
 541
 542        def _parse_bracket_key_value(self, is_map: bool = False) -> t.Optional[exp.Expression]:
 543            if is_map:
 544                # Keys are strings in Snowflake's objects, see also:
 545                # - https://docs.snowflake.com/en/sql-reference/data-types-semistructured
 546                # - https://docs.snowflake.com/en/sql-reference/functions/object_construct
 547                return self._parse_slice(self._parse_string())
 548
 549            return self._parse_slice(self._parse_alias(self._parse_conjunction(), explicit=True))
 550
 551        def _parse_lateral(self) -> t.Optional[exp.Lateral]:
 552            lateral = super()._parse_lateral()
 553            if not lateral:
 554                return lateral
 555
 556            if isinstance(lateral.this, exp.Explode):
 557                table_alias = lateral.args.get("alias")
 558                columns = [exp.to_identifier(col) for col in self.FLATTEN_COLUMNS]
 559                if table_alias and not table_alias.args.get("columns"):
 560                    table_alias.set("columns", columns)
 561                elif not table_alias:
 562                    exp.alias_(lateral, "_flattened", table=columns, copy=False)
 563
 564            return lateral
 565
 566        def _parse_at_before(self, table: exp.Table) -> exp.Table:
 567            # https://docs.snowflake.com/en/sql-reference/constructs/at-before
 568            index = self._index
 569            if self._match_texts(("AT", "BEFORE")):
 570                this = self._prev.text.upper()
 571                kind = (
 572                    self._match(TokenType.L_PAREN)
 573                    and self._match_texts(self.HISTORICAL_DATA_KIND)
 574                    and self._prev.text.upper()
 575                )
 576                expression = self._match(TokenType.FARROW) and self._parse_bitwise()
 577
 578                if expression:
 579                    self._match_r_paren()
 580                    when = self.expression(
 581                        exp.HistoricalData, this=this, kind=kind, expression=expression
 582                    )
 583                    table.set("when", when)
 584                else:
 585                    self._retreat(index)
 586
 587            return table
 588
 589        def _parse_table_parts(
 590            self, schema: bool = False, is_db_reference: bool = False, wildcard: bool = False
 591        ) -> exp.Table:
 592            # https://docs.snowflake.com/en/user-guide/querying-stage
 593            if self._match(TokenType.STRING, advance=False):
 594                table = self._parse_string()
 595            elif self._match_text_seq("@", advance=False):
 596                table = self._parse_location_path()
 597            else:
 598                table = None
 599
 600            if table:
 601                file_format = None
 602                pattern = None
 603
 604                self._match(TokenType.L_PAREN)
 605                while self._curr and not self._match(TokenType.R_PAREN):
 606                    if self._match_text_seq("FILE_FORMAT", "=>"):
 607                        file_format = self._parse_string() or super()._parse_table_parts(
 608                            is_db_reference=is_db_reference
 609                        )
 610                    elif self._match_text_seq("PATTERN", "=>"):
 611                        pattern = self._parse_string()
 612                    else:
 613                        break
 614
 615                    self._match(TokenType.COMMA)
 616
 617                table = self.expression(exp.Table, this=table, format=file_format, pattern=pattern)
 618            else:
 619                table = super()._parse_table_parts(schema=schema, is_db_reference=is_db_reference)
 620
 621            return self._parse_at_before(table)
 622
 623        def _parse_id_var(
 624            self,
 625            any_token: bool = True,
 626            tokens: t.Optional[t.Collection[TokenType]] = None,
 627        ) -> t.Optional[exp.Expression]:
 628            if self._match_text_seq("IDENTIFIER", "("):
 629                identifier = (
 630                    super()._parse_id_var(any_token=any_token, tokens=tokens)
 631                    or self._parse_string()
 632                )
 633                self._match_r_paren()
 634                return self.expression(exp.Anonymous, this="IDENTIFIER", expressions=[identifier])
 635
 636            return super()._parse_id_var(any_token=any_token, tokens=tokens)
 637
 638        def _parse_show_snowflake(self, this: str) -> exp.Show:
 639            scope = None
 640            scope_kind = None
 641
 642            # will identity SHOW TERSE SCHEMAS but not SHOW TERSE PRIMARY KEYS
 643            # which is syntactically valid but has no effect on the output
 644            terse = self._tokens[self._index - 2].text.upper() == "TERSE"
 645
 646            history = self._match_text_seq("HISTORY")
 647
 648            like = self._parse_string() if self._match(TokenType.LIKE) else None
 649
 650            if self._match(TokenType.IN):
 651                if self._match_text_seq("ACCOUNT"):
 652                    scope_kind = "ACCOUNT"
 653                elif self._match_set(self.DB_CREATABLES):
 654                    scope_kind = self._prev.text.upper()
 655                    if self._curr:
 656                        scope = self._parse_table_parts()
 657                elif self._curr:
 658                    scope_kind = "SCHEMA" if this in self.SCHEMA_KINDS else "TABLE"
 659                    scope = self._parse_table_parts()
 660
 661            return self.expression(
 662                exp.Show,
 663                **{
 664                    "terse": terse,
 665                    "this": this,
 666                    "history": history,
 667                    "like": like,
 668                    "scope": scope,
 669                    "scope_kind": scope_kind,
 670                    "starts_with": self._match_text_seq("STARTS", "WITH") and self._parse_string(),
 671                    "limit": self._parse_limit(),
 672                    "from": self._parse_string() if self._match(TokenType.FROM) else None,
 673                },
 674            )
 675
 676        def _parse_alter_table_swap(self) -> exp.SwapTable:
 677            self._match_text_seq("WITH")
 678            return self.expression(exp.SwapTable, this=self._parse_table(schema=True))
 679
 680        def _parse_location(self) -> exp.LocationProperty:
 681            self._match(TokenType.EQ)
 682            return self.expression(exp.LocationProperty, this=self._parse_location_path())
 683
 684        def _parse_location_path(self) -> exp.Var:
 685            parts = [self._advance_any(ignore_reserved=True)]
 686
 687            # We avoid consuming a comma token because external tables like @foo and @bar
 688            # can be joined in a query with a comma separator.
 689            while self._is_connected() and not self._match(TokenType.COMMA, advance=False):
 690                parts.append(self._advance_any(ignore_reserved=True))
 691
 692            return exp.var("".join(part.text for part in parts if part))
 693
 694    class Tokenizer(tokens.Tokenizer):
 695        STRING_ESCAPES = ["\\", "'"]
 696        HEX_STRINGS = [("x'", "'"), ("X'", "'")]
 697        RAW_STRINGS = ["$$"]
 698        COMMENTS = ["--", "//", ("/*", "*/")]
 699
 700        KEYWORDS = {
 701            **tokens.Tokenizer.KEYWORDS,
 702            "BYTEINT": TokenType.INT,
 703            "CHAR VARYING": TokenType.VARCHAR,
 704            "CHARACTER VARYING": TokenType.VARCHAR,
 705            "EXCLUDE": TokenType.EXCEPT,
 706            "ILIKE ANY": TokenType.ILIKE_ANY,
 707            "LIKE ANY": TokenType.LIKE_ANY,
 708            "MATCH_CONDITION": TokenType.MATCH_CONDITION,
 709            "MATCH_RECOGNIZE": TokenType.MATCH_RECOGNIZE,
 710            "MINUS": TokenType.EXCEPT,
 711            "NCHAR VARYING": TokenType.VARCHAR,
 712            "PUT": TokenType.COMMAND,
 713            "REMOVE": TokenType.COMMAND,
 714            "RENAME": TokenType.REPLACE,
 715            "RM": TokenType.COMMAND,
 716            "SAMPLE": TokenType.TABLE_SAMPLE,
 717            "SQL_DOUBLE": TokenType.DOUBLE,
 718            "SQL_VARCHAR": TokenType.VARCHAR,
 719            "STORAGE INTEGRATION": TokenType.STORAGE_INTEGRATION,
 720            "TIMESTAMP_TZ": TokenType.TIMESTAMPTZ,
 721            "TOP": TokenType.TOP,
 722        }
 723
 724        SINGLE_TOKENS = {
 725            **tokens.Tokenizer.SINGLE_TOKENS,
 726            "$": TokenType.PARAMETER,
 727        }
 728
 729        VAR_SINGLE_TOKENS = {"$"}
 730
 731        COMMANDS = tokens.Tokenizer.COMMANDS - {TokenType.SHOW}
 732
 733    class Generator(generator.Generator):
 734        PARAMETER_TOKEN = "$"
 735        MATCHED_BY_SOURCE = False
 736        SINGLE_STRING_INTERVAL = True
 737        JOIN_HINTS = False
 738        TABLE_HINTS = False
 739        QUERY_HINTS = False
 740        AGGREGATE_FILTER_SUPPORTED = False
 741        SUPPORTS_TABLE_COPY = False
 742        COLLATE_IS_FUNC = True
 743        LIMIT_ONLY_LITERALS = True
 744        JSON_KEY_VALUE_PAIR_SEP = ","
 745        INSERT_OVERWRITE = " OVERWRITE INTO"
 746        STRUCT_DELIMITER = ("(", ")")
 747        COPY_PARAMS_ARE_WRAPPED = False
 748        COPY_PARAMS_EQ_REQUIRED = True
 749
 750        TRANSFORMS = {
 751            **generator.Generator.TRANSFORMS,
 752            exp.ApproxDistinct: rename_func("APPROX_COUNT_DISTINCT"),
 753            exp.ArgMax: rename_func("MAX_BY"),
 754            exp.ArgMin: rename_func("MIN_BY"),
 755            exp.Array: inline_array_sql,
 756            exp.ArrayConcat: rename_func("ARRAY_CAT"),
 757            exp.ArrayContains: lambda self, e: self.func("ARRAY_CONTAINS", e.expression, e.this),
 758            exp.AtTimeZone: lambda self, e: self.func(
 759                "CONVERT_TIMEZONE", e.args.get("zone"), e.this
 760            ),
 761            exp.BitwiseXor: rename_func("BITXOR"),
 762            exp.Create: transforms.preprocess([_flatten_structured_types_unless_iceberg]),
 763            exp.DateAdd: date_delta_sql("DATEADD"),
 764            exp.DateDiff: date_delta_sql("DATEDIFF"),
 765            exp.DateStrToDate: datestrtodate_sql,
 766            exp.DayOfMonth: rename_func("DAYOFMONTH"),
 767            exp.DayOfWeek: rename_func("DAYOFWEEK"),
 768            exp.DayOfYear: rename_func("DAYOFYEAR"),
 769            exp.Explode: rename_func("FLATTEN"),
 770            exp.Extract: rename_func("DATE_PART"),
 771            exp.FromTimeZone: lambda self, e: self.func(
 772                "CONVERT_TIMEZONE", e.args.get("zone"), "'UTC'", e.this
 773            ),
 774            exp.GenerateSeries: lambda self, e: self.func(
 775                "ARRAY_GENERATE_RANGE", e.args["start"], e.args["end"] + 1, e.args.get("step")
 776            ),
 777            exp.GroupConcat: rename_func("LISTAGG"),
 778            exp.If: if_sql(name="IFF", false_value="NULL"),
 779            exp.JSONExtract: lambda self, e: self.func("GET_PATH", e.this, e.expression),
 780            exp.JSONExtractScalar: lambda self, e: self.func(
 781                "JSON_EXTRACT_PATH_TEXT", e.this, e.expression
 782            ),
 783            exp.JSONObject: lambda self, e: self.func("OBJECT_CONSTRUCT_KEEP_NULL", *e.expressions),
 784            exp.JSONPathRoot: lambda *_: "",
 785            exp.LogicalAnd: rename_func("BOOLAND_AGG"),
 786            exp.LogicalOr: rename_func("BOOLOR_AGG"),
 787            exp.Map: lambda self, e: var_map_sql(self, e, "OBJECT_CONSTRUCT"),
 788            exp.Max: max_or_greatest,
 789            exp.Min: min_or_least,
 790            exp.PartitionedByProperty: lambda self, e: f"PARTITION BY {self.sql(e, 'this')}",
 791            exp.PercentileCont: transforms.preprocess(
 792                [transforms.add_within_group_for_percentiles]
 793            ),
 794            exp.PercentileDisc: transforms.preprocess(
 795                [transforms.add_within_group_for_percentiles]
 796            ),
 797            exp.Pivot: transforms.preprocess([_unqualify_unpivot_columns]),
 798            exp.RegexpILike: _regexpilike_sql,
 799            exp.Rand: rename_func("RANDOM"),
 800            exp.Select: transforms.preprocess(
 801                [
 802                    transforms.eliminate_distinct_on,
 803                    transforms.explode_to_unnest(),
 804                    transforms.eliminate_semi_and_anti_joins,
 805                ]
 806            ),
 807            exp.SHA: rename_func("SHA1"),
 808            exp.StarMap: rename_func("OBJECT_CONSTRUCT"),
 809            exp.StartsWith: rename_func("STARTSWITH"),
 810            exp.StrPosition: lambda self, e: self.func(
 811                "POSITION", e.args.get("substr"), e.this, e.args.get("position")
 812            ),
 813            exp.StrToTime: lambda self, e: self.func("TO_TIMESTAMP", e.this, self.format_time(e)),
 814            exp.Stuff: rename_func("INSERT"),
 815            exp.TimeAdd: date_delta_sql("TIMEADD"),
 816            exp.TimestampDiff: lambda self, e: self.func(
 817                "TIMESTAMPDIFF", e.unit, e.expression, e.this
 818            ),
 819            exp.TimestampTrunc: timestamptrunc_sql,
 820            exp.TimeStrToTime: timestrtotime_sql,
 821            exp.TimeToStr: lambda self, e: self.func(
 822                "TO_CHAR", exp.cast(e.this, exp.DataType.Type.TIMESTAMP), self.format_time(e)
 823            ),
 824            exp.TimeToUnix: lambda self, e: f"EXTRACT(epoch_second FROM {self.sql(e, 'this')})",
 825            exp.ToArray: rename_func("TO_ARRAY"),
 826            exp.ToChar: lambda self, e: self.function_fallback_sql(e),
 827            exp.Trim: lambda self, e: self.func("TRIM", e.this, e.expression),
 828            exp.TsOrDsAdd: date_delta_sql("DATEADD", cast=True),
 829            exp.TsOrDsDiff: date_delta_sql("DATEDIFF"),
 830            exp.TsOrDsToDate: lambda self, e: self.func(
 831                "TRY_TO_DATE" if e.args.get("safe") else "TO_DATE", e.this, self.format_time(e)
 832            ),
 833            exp.UnixToTime: rename_func("TO_TIMESTAMP"),
 834            exp.VarMap: lambda self, e: var_map_sql(self, e, "OBJECT_CONSTRUCT"),
 835            exp.WeekOfYear: rename_func("WEEKOFYEAR"),
 836            exp.Xor: rename_func("BOOLXOR"),
 837        }
 838
 839        SUPPORTED_JSON_PATH_PARTS = {
 840            exp.JSONPathKey,
 841            exp.JSONPathRoot,
 842            exp.JSONPathSubscript,
 843        }
 844
 845        TYPE_MAPPING = {
 846            **generator.Generator.TYPE_MAPPING,
 847            exp.DataType.Type.NESTED: "OBJECT",
 848            exp.DataType.Type.STRUCT: "OBJECT",
 849        }
 850
 851        STAR_MAPPING = {
 852            "except": "EXCLUDE",
 853            "replace": "RENAME",
 854        }
 855
 856        PROPERTIES_LOCATION = {
 857            **generator.Generator.PROPERTIES_LOCATION,
 858            exp.SetProperty: exp.Properties.Location.UNSUPPORTED,
 859            exp.VolatileProperty: exp.Properties.Location.UNSUPPORTED,
 860        }
 861
 862        UNSUPPORTED_VALUES_EXPRESSIONS = {
 863            exp.Struct,
 864        }
 865
 866        def values_sql(self, expression: exp.Values, values_as_table: bool = True) -> str:
 867            if expression.find(*self.UNSUPPORTED_VALUES_EXPRESSIONS):
 868                values_as_table = False
 869
 870            return super().values_sql(expression, values_as_table=values_as_table)
 871
 872        def datatype_sql(self, expression: exp.DataType) -> str:
 873            expressions = expression.expressions
 874            if (
 875                expressions
 876                and expression.is_type(*exp.DataType.STRUCT_TYPES)
 877                and any(isinstance(field_type, exp.DataType) for field_type in expressions)
 878            ):
 879                # The correct syntax is OBJECT [ (<key> <value_type [NOT NULL] [, ...]) ]
 880                return "OBJECT"
 881
 882            return super().datatype_sql(expression)
 883
 884        def tonumber_sql(self, expression: exp.ToNumber) -> str:
 885            return self.func(
 886                "TO_NUMBER",
 887                expression.this,
 888                expression.args.get("format"),
 889                expression.args.get("precision"),
 890                expression.args.get("scale"),
 891            )
 892
 893        def timestampfromparts_sql(self, expression: exp.TimestampFromParts) -> str:
 894            milli = expression.args.get("milli")
 895            if milli is not None:
 896                milli_to_nano = milli.pop() * exp.Literal.number(1000000)
 897                expression.set("nano", milli_to_nano)
 898
 899            return rename_func("TIMESTAMP_FROM_PARTS")(self, expression)
 900
 901        def trycast_sql(self, expression: exp.TryCast) -> str:
 902            value = expression.this
 903
 904            if value.type is None:
 905                from sqlglot.optimizer.annotate_types import annotate_types
 906
 907                value = annotate_types(value)
 908
 909            if value.is_type(*exp.DataType.TEXT_TYPES, exp.DataType.Type.UNKNOWN):
 910                return super().trycast_sql(expression)
 911
 912            # TRY_CAST only works for string values in Snowflake
 913            return self.cast_sql(expression)
 914
 915        def log_sql(self, expression: exp.Log) -> str:
 916            if not expression.expression:
 917                return self.func("LN", expression.this)
 918
 919            return super().log_sql(expression)
 920
 921        def unnest_sql(self, expression: exp.Unnest) -> str:
 922            unnest_alias = expression.args.get("alias")
 923            offset = expression.args.get("offset")
 924
 925            columns = [
 926                exp.to_identifier("seq"),
 927                exp.to_identifier("key"),
 928                exp.to_identifier("path"),
 929                offset.pop() if isinstance(offset, exp.Expression) else exp.to_identifier("index"),
 930                seq_get(unnest_alias.columns if unnest_alias else [], 0)
 931                or exp.to_identifier("value"),
 932                exp.to_identifier("this"),
 933            ]
 934
 935            if unnest_alias:
 936                unnest_alias.set("columns", columns)
 937            else:
 938                unnest_alias = exp.TableAlias(this="_u", columns=columns)
 939
 940            explode = f"TABLE(FLATTEN(INPUT => {self.sql(expression.expressions[0])}))"
 941            alias = self.sql(unnest_alias)
 942            alias = f" AS {alias}" if alias else ""
 943            return f"{explode}{alias}"
 944
 945        def show_sql(self, expression: exp.Show) -> str:
 946            terse = "TERSE " if expression.args.get("terse") else ""
 947            history = " HISTORY" if expression.args.get("history") else ""
 948            like = self.sql(expression, "like")
 949            like = f" LIKE {like}" if like else ""
 950
 951            scope = self.sql(expression, "scope")
 952            scope = f" {scope}" if scope else ""
 953
 954            scope_kind = self.sql(expression, "scope_kind")
 955            if scope_kind:
 956                scope_kind = f" IN {scope_kind}"
 957
 958            starts_with = self.sql(expression, "starts_with")
 959            if starts_with:
 960                starts_with = f" STARTS WITH {starts_with}"
 961
 962            limit = self.sql(expression, "limit")
 963
 964            from_ = self.sql(expression, "from")
 965            if from_:
 966                from_ = f" FROM {from_}"
 967
 968            return f"SHOW {terse}{expression.name}{history}{like}{scope_kind}{scope}{starts_with}{limit}{from_}"
 969
 970        def regexpextract_sql(self, expression: exp.RegexpExtract) -> str:
 971            # Other dialects don't support all of the following parameters, so we need to
 972            # generate default values as necessary to ensure the transpilation is correct
 973            group = expression.args.get("group")
 974            parameters = expression.args.get("parameters") or (group and exp.Literal.string("c"))
 975            occurrence = expression.args.get("occurrence") or (parameters and exp.Literal.number(1))
 976            position = expression.args.get("position") or (occurrence and exp.Literal.number(1))
 977
 978            return self.func(
 979                "REGEXP_SUBSTR",
 980                expression.this,
 981                expression.expression,
 982                position,
 983                occurrence,
 984                parameters,
 985                group,
 986            )
 987
 988        def except_op(self, expression: exp.Except) -> str:
 989            if not expression.args.get("distinct"):
 990                self.unsupported("EXCEPT with All is not supported in Snowflake")
 991            return super().except_op(expression)
 992
 993        def intersect_op(self, expression: exp.Intersect) -> str:
 994            if not expression.args.get("distinct"):
 995                self.unsupported("INTERSECT with All is not supported in Snowflake")
 996            return super().intersect_op(expression)
 997
 998        def describe_sql(self, expression: exp.Describe) -> str:
 999            # Default to table if kind is unknown
1000            kind_value = expression.args.get("kind") or "TABLE"
1001            kind = f" {kind_value}" if kind_value else ""
1002            this = f" {self.sql(expression, 'this')}"
1003            expressions = self.expressions(expression, flat=True)
1004            expressions = f" {expressions}" if expressions else ""
1005            return f"DESCRIBE{kind}{this}{expressions}"
1006
1007        def generatedasidentitycolumnconstraint_sql(
1008            self, expression: exp.GeneratedAsIdentityColumnConstraint
1009        ) -> str:
1010            start = expression.args.get("start")
1011            start = f" START {start}" if start else ""
1012            increment = expression.args.get("increment")
1013            increment = f" INCREMENT {increment}" if increment else ""
1014            return f"AUTOINCREMENT{start}{increment}"
1015
1016        def swaptable_sql(self, expression: exp.SwapTable) -> str:
1017            this = self.sql(expression, "this")
1018            return f"SWAP WITH {this}"
1019
1020        def with_properties(self, properties: exp.Properties) -> str:
1021            return self.properties(properties, wrapped=False, prefix=self.seg(""), sep=" ")
1022
1023        def cluster_sql(self, expression: exp.Cluster) -> str:
1024            return f"CLUSTER BY ({self.expressions(expression, flat=True)})"
1025
1026        def struct_sql(self, expression: exp.Struct) -> str:
1027            keys = []
1028            values = []
1029
1030            for i, e in enumerate(expression.expressions):
1031                if isinstance(e, exp.PropertyEQ):
1032                    keys.append(
1033                        exp.Literal.string(e.name) if isinstance(e.this, exp.Identifier) else e.this
1034                    )
1035                    values.append(e.expression)
1036                else:
1037                    keys.append(exp.Literal.string(f"_{i}"))
1038                    values.append(e)
1039
1040            return self.func("OBJECT_CONSTRUCT", *flatten(zip(keys, values)))

NORMALIZATION_STRATEGY = <NormalizationStrategy.UPPERCASE: 'UPPERCASE'>

Specifies the strategy according to which identifiers should be normalized.

NULL_ORDERING = 'nulls_are_large'

Default NULL ordering method to use if not explicitly set. Possible values: "nulls_are_small", "nulls_are_large", "nulls_are_last"

TIME_FORMAT = "'YYYY-MM-DD HH24:MI:SS'"

SUPPORTS_USER_DEFINED_TYPES = False

Whether user-defined data types are supported.

SUPPORTS_SEMI_ANTI_JOIN = False

Whether SEMI or ANTI joins are supported.

PREFER_CTE_ALIAS_COLUMN = True

Some dialects, such as Snowflake, allow you to reference a CTE column alias in the HAVING clause of the CTE. This flag will cause the CTE alias columns to override any projection aliases in the subquery.

For example, WITH y(c) AS ( SELECT SUM(a) FROM (SELECT 1 a) AS x HAVING c > 0 ) SELECT c FROM y;

will be rewritten as

WITH y(c) AS (
    SELECT SUM(a) AS c FROM (SELECT 1 AS a) AS x HAVING c > 0
) SELECT c FROM y;

TABLESAMPLE_SIZE_IS_PERCENT = True

Whether a size in the table sample clause represents percentage.

COPY_PARAMS_ARE_CSV = False

TIME_MAPPING: Dict[str, str] = {'YYYY': '%Y', 'yyyy': '%Y', 'YY': '%y', 'yy': '%y', 'MMMM': '%B', 'mmmm': '%B', 'MON': '%b', 'mon': '%b', 'MM': '%m', 'mm': '%m', 'DD': '%d', 'dd': '%-d', 'DY': '%a', 'dy': '%w', 'HH24': '%H', 'hh24': '%H', 'HH12': '%I', 'hh12': '%I', 'MI': '%M', 'mi': '%M', 'SS': '%S', 'ss': '%S', 'FF': '%f', 'ff': '%f', 'FF6': '%f', 'ff6': '%f'}

Associates this dialect's time formats with their equivalent Python strftime formats.

def quote_identifier(self, expression: ~E, identify: bool = True) -> ~E: View Source

324    def quote_identifier(self, expression: E, identify: bool = True) -> E:
325        # This disables quoting DUAL in SELECT ... FROM DUAL, because Snowflake treats an
326        # unquoted DUAL keyword in a special way and does not map it to a user-defined table
327        if (
328            isinstance(expression, exp.Identifier)
329            and isinstance(expression.parent, exp.Table)
330            and expression.name.lower() == "dual"
331        ):
332            return expression  # type: ignore
333
334        return super().quote_identifier(expression, identify=identify)

Adds quotes to a given identifier.

Arguments:

expression: The expression of interest. If it's not an Identifier, this method is a no-op.
identify: If set to False, the quotes will only be added if the identifier is deemed "unsafe", with respect to its characters and this dialect's normalization strategy.

UNESCAPED_SEQUENCES: Dict[str, str] = {'\\a': '\x07', '\\b': '\x08', '\\f': '\x0c', '\\n': '\n', '\\r': '\r', '\\t': '\t', '\\v': '\x0b', '\\\\': '\\'}

Mapping of an escaped sequence (\n) to its unescaped version ().

tokenizer_class = <class 'Snowflake.Tokenizer'>

parser_class = <class 'Snowflake.Parser'>

generator_class = <class 'Snowflake.Generator'>

TIME_TRIE: Dict = {'Y': {'Y': {'Y': {'Y': {0: True}}, 0: True}}, 'y': {'y': {'y': {'y': {0: True}}, 0: True}}, 'M': {'M': {'M': {'M': {0: True}}, 0: True}, 'O': {'N': {0: True}}, 'I': {0: True}}, 'm': {'m': {'m': {'m': {0: True}}, 0: True}, 'o': {'n': {0: True}}, 'i': {0: True}}, 'D': {'D': {0: True}, 'Y': {0: True}}, 'd': {'d': {0: True}, 'y': {0: True}}, 'H': {'H': {'2': {'4': {0: True}}, '1': {'2': {0: True}}}}, 'h': {'h': {'2': {'4': {0: True}}, '1': {'2': {0: True}}}}, 'S': {'S': {0: True}}, 's': {'s': {0: True}}, 'F': {'F': {0: True, '6': {0: True}}}, 'f': {'f': {0: True, '6': {0: True}}}}

FORMAT_TRIE: Dict = {'Y': {'Y': {'Y': {'Y': {0: True}}, 0: True}}, 'y': {'y': {'y': {'y': {0: True}}, 0: True}}, 'M': {'M': {'M': {'M': {0: True}}, 0: True}, 'O': {'N': {0: True}}, 'I': {0: True}}, 'm': {'m': {'m': {'m': {0: True}}, 0: True}, 'o': {'n': {0: True}}, 'i': {0: True}}, 'D': {'D': {0: True}, 'Y': {0: True}}, 'd': {'d': {0: True}, 'y': {0: True}}, 'H': {'H': {'2': {'4': {0: True}}, '1': {'2': {0: True}}}}, 'h': {'h': {'2': {'4': {0: True}}, '1': {'2': {0: True}}}}, 'S': {'S': {0: True}}, 's': {'s': {0: True}}, 'F': {'F': {0: True, '6': {0: True}}}, 'f': {'f': {0: True, '6': {0: True}}}}

INVERSE_TIME_MAPPING: Dict[str, str] = {'%Y': 'yyyy', '%y': 'yy', '%B': 'mmmm', '%b': 'mon', '%m': 'mm', '%d': 'DD', '%-d': 'dd', '%a': 'DY', '%w': 'dy', '%H': 'hh24', '%I': 'hh12', '%M': 'mi', '%S': 'ss', '%f': 'ff6'}

INVERSE_TIME_TRIE: Dict = {'%': {'Y': {0: True}, 'y': {0: True}, 'B': {0: True}, 'b': {0: True}, 'm': {0: True}, 'd': {0: True}, '-': {'d': {0: True}}, 'a': {0: True}, 'w': {0: True}, 'H': {0: True}, 'I': {0: True}, 'M': {0: True}, 'S': {0: True}, 'f': {0: True}}}

ESCAPED_SEQUENCES: Dict[str, str] = {'\x07': '\\a', '\x08': '\\b', '\x0c': '\\f', '\n': '\\n', '\r': '\\r', '\t': '\\t', '\x0b': '\\v', '\\': '\\\\'}

QUOTE_START = "'"

QUOTE_END = "'"

IDENTIFIER_START = '"'

IDENTIFIER_END = '"'

BIT_START: Optional[str] = None

BIT_END: Optional[str] = None

HEX_START: Optional[str] = "x'"

HEX_END: Optional[str] = "'"

BYTE_START: Optional[str] = None

BYTE_END: Optional[str] = None

UNICODE_START: Optional[str] = None

UNICODE_END: Optional[str] = None

Inherited Members

sqlglot.dialects.dialect.Dialect: Dialect; INDEX_OFFSET; WEEK_OFFSET; UNNEST_COLUMN_ONLY; ALIAS_POST_TABLESAMPLE; IDENTIFIERS_CAN_START_WITH_DIGIT; DPIPE_IS_STRING_CONCAT; STRICT_STRING_CONCAT; NORMALIZE_FUNCTIONS; LOG_BASE_FIRST; TYPED_DIVISION; SAFE_DIVISION; CONCAT_COALESCE; DATE_FORMAT; DATEINT_FORMAT; FORMAT_MAPPING; PSEUDOCOLUMNS; get_or_raise; format_time; normalize_identifier; case_sensitive; can_identify; to_json_path; parse; parse_into; generate; transpile; tokenize; tokenizer; parser; generator

class Snowflake.Tokenizer(sqlglot.tokens.Tokenizer): View Source

694    class Tokenizer(tokens.Tokenizer):
695        STRING_ESCAPES = ["\\", "'"]
696        HEX_STRINGS = [("x'", "'"), ("X'", "'")]
697        RAW_STRINGS = ["$$"]
698        COMMENTS = ["--", "//", ("/*", "*/")]
699
700        KEYWORDS = {
701            **tokens.Tokenizer.KEYWORDS,
702            "BYTEINT": TokenType.INT,
703            "CHAR VARYING": TokenType.VARCHAR,
704            "CHARACTER VARYING": TokenType.VARCHAR,
705            "EXCLUDE": TokenType.EXCEPT,
706            "ILIKE ANY": TokenType.ILIKE_ANY,
707            "LIKE ANY": TokenType.LIKE_ANY,
708            "MATCH_CONDITION": TokenType.MATCH_CONDITION,
709            "MATCH_RECOGNIZE": TokenType.MATCH_RECOGNIZE,
710            "MINUS": TokenType.EXCEPT,
711            "NCHAR VARYING": TokenType.VARCHAR,
712            "PUT": TokenType.COMMAND,
713            "REMOVE": TokenType.COMMAND,
714            "RENAME": TokenType.REPLACE,
715            "RM": TokenType.COMMAND,
716            "SAMPLE": TokenType.TABLE_SAMPLE,
717            "SQL_DOUBLE": TokenType.DOUBLE,
718            "SQL_VARCHAR": TokenType.VARCHAR,
719            "STORAGE INTEGRATION": TokenType.STORAGE_INTEGRATION,
720            "TIMESTAMP_TZ": TokenType.TIMESTAMPTZ,
721            "TOP": TokenType.TOP,
722        }
723
724        SINGLE_TOKENS = {
725            **tokens.Tokenizer.SINGLE_TOKENS,
726            "$": TokenType.PARAMETER,
727        }
728
729        VAR_SINGLE_TOKENS = {"$"}
730
731        COMMANDS = tokens.Tokenizer.COMMANDS - {TokenType.SHOW}

STRING_ESCAPES = ['\\', "'"]

HEX_STRINGS = [("x'", "'"), ("X'", "'")]

RAW_STRINGS = ['$$']

COMMENTS = ['--', '//', ('/*', '*/')]

KEYWORDS = {'{%': <TokenType.BLOCK_START: 'BLOCK_START'>, '{%+': <TokenType.BLOCK_START: 'BLOCK_START'>, '{%-': <TokenType.BLOCK_START: 'BLOCK_START'>, '%}': <TokenType.BLOCK_END: 'BLOCK_END'>, '+%}': <TokenType.BLOCK_END: 'BLOCK_END'>, '-%}': <TokenType.BLOCK_END: 'BLOCK_END'>, '{{+': <TokenType.BLOCK_START: 'BLOCK_START'>, '{{-': <TokenType.BLOCK_START: 'BLOCK_START'>, '+}}': <TokenType.BLOCK_END: 'BLOCK_END'>, '-}}': <TokenType.BLOCK_END: 'BLOCK_END'>, '/*+': <TokenType.HINT: 'HINT'>, '==': <TokenType.EQ: 'EQ'>, '::': <TokenType.DCOLON: 'DCOLON'>, '||': <TokenType.DPIPE: 'DPIPE'>, '>=': <TokenType.GTE: 'GTE'>, '<=': <TokenType.LTE: 'LTE'>, '<>': <TokenType.NEQ: 'NEQ'>, '!=': <TokenType.NEQ: 'NEQ'>, ':=': <TokenType.COLON_EQ: 'COLON_EQ'>, '<=>': <TokenType.NULLSAFE_EQ: 'NULLSAFE_EQ'>, '->': <TokenType.ARROW: 'ARROW'>, '->>': <TokenType.DARROW: 'DARROW'>, '=>': <TokenType.FARROW: 'FARROW'>, '#>': <TokenType.HASH_ARROW: 'HASH_ARROW'>, '#>>': <TokenType.DHASH_ARROW: 'DHASH_ARROW'>, '<->': <TokenType.LR_ARROW: 'LR_ARROW'>, '&&': <TokenType.DAMP: 'DAMP'>, '??': <TokenType.DQMARK: 'DQMARK'>, 'ALL': <TokenType.ALL: 'ALL'>, 'ALWAYS': <TokenType.ALWAYS: 'ALWAYS'>, 'AND': <TokenType.AND: 'AND'>, 'ANTI': <TokenType.ANTI: 'ANTI'>, 'ANY': <TokenType.ANY: 'ANY'>, 'ASC': <TokenType.ASC: 'ASC'>, 'AS': <TokenType.ALIAS: 'ALIAS'>, 'ASOF': <TokenType.ASOF: 'ASOF'>, 'AUTOINCREMENT': <TokenType.AUTO_INCREMENT: 'AUTO_INCREMENT'>, 'AUTO_INCREMENT': <TokenType.AUTO_INCREMENT: 'AUTO_INCREMENT'>, 'BEGIN': <TokenType.BEGIN: 'BEGIN'>, 'BETWEEN': <TokenType.BETWEEN: 'BETWEEN'>, 'CACHE': <TokenType.CACHE: 'CACHE'>, 'UNCACHE': <TokenType.UNCACHE: 'UNCACHE'>, 'CASE': <TokenType.CASE: 'CASE'>, 'CHARACTER SET': <TokenType.CHARACTER_SET: 'CHARACTER_SET'>, 'CLUSTER BY': <TokenType.CLUSTER_BY: 'CLUSTER_BY'>, 'COLLATE': <TokenType.COLLATE: 'COLLATE'>, 'COLUMN': <TokenType.COLUMN: 'COLUMN'>, 'COMMIT': <TokenType.COMMIT: 'COMMIT'>, 'CONNECT BY': <TokenType.CONNECT_BY: 'CONNECT_BY'>, 'CONSTRAINT': <TokenType.CONSTRAINT: 'CONSTRAINT'>, 'COPY': <TokenType.COPY: 'COPY'>, 'CREATE': <TokenType.CREATE: 'CREATE'>, 'CROSS': <TokenType.CROSS: 'CROSS'>, 'CUBE': <TokenType.CUBE: 'CUBE'>, 'CURRENT_DATE': <TokenType.CURRENT_DATE: 'CURRENT_DATE'>, 'CURRENT_TIME': <TokenType.CURRENT_TIME: 'CURRENT_TIME'>, 'CURRENT_TIMESTAMP': <TokenType.CURRENT_TIMESTAMP: 'CURRENT_TIMESTAMP'>, 'CURRENT_USER': <TokenType.CURRENT_USER: 'CURRENT_USER'>, 'DATABASE': <TokenType.DATABASE: 'DATABASE'>, 'DEFAULT': <TokenType.DEFAULT: 'DEFAULT'>, 'DELETE': <TokenType.DELETE: 'DELETE'>, 'DESC': <TokenType.DESC: 'DESC'>, 'DESCRIBE': <TokenType.DESCRIBE: 'DESCRIBE'>, 'DISTINCT': <TokenType.DISTINCT: 'DISTINCT'>, 'DISTRIBUTE BY': <TokenType.DISTRIBUTE_BY: 'DISTRIBUTE_BY'>, 'DIV': <TokenType.DIV: 'DIV'>, 'DROP': <TokenType.DROP: 'DROP'>, 'ELSE': <TokenType.ELSE: 'ELSE'>, 'END': <TokenType.END: 'END'>, 'ENUM': <TokenType.ENUM: 'ENUM'>, 'ESCAPE': <TokenType.ESCAPE: 'ESCAPE'>, 'EXCEPT': <TokenType.EXCEPT: 'EXCEPT'>, 'EXECUTE': <TokenType.EXECUTE: 'EXECUTE'>, 'EXISTS': <TokenType.EXISTS: 'EXISTS'>, 'FALSE': <TokenType.FALSE: 'FALSE'>, 'FETCH': <TokenType.FETCH: 'FETCH'>, 'FILTER': <TokenType.FILTER: 'FILTER'>, 'FIRST': <TokenType.FIRST: 'FIRST'>, 'FULL': <TokenType.FULL: 'FULL'>, 'FUNCTION': <TokenType.FUNCTION: 'FUNCTION'>, 'FOR': <TokenType.FOR: 'FOR'>, 'FOREIGN KEY': <TokenType.FOREIGN_KEY: 'FOREIGN_KEY'>, 'FORMAT': <TokenType.FORMAT: 'FORMAT'>, 'FROM': <TokenType.FROM: 'FROM'>, 'GEOGRAPHY': <TokenType.GEOGRAPHY: 'GEOGRAPHY'>, 'GEOMETRY': <TokenType.GEOMETRY: 'GEOMETRY'>, 'GLOB': <TokenType.GLOB: 'GLOB'>, 'GROUP BY': <TokenType.GROUP_BY: 'GROUP_BY'>, 'GROUPING SETS': <TokenType.GROUPING_SETS: 'GROUPING_SETS'>, 'HAVING': <TokenType.HAVING: 'HAVING'>, 'ILIKE': <TokenType.ILIKE: 'ILIKE'>, 'IN': <TokenType.IN: 'IN'>, 'INDEX': <TokenType.INDEX: 'INDEX'>, 'INET': <TokenType.INET: 'INET'>, 'INNER': <TokenType.INNER: 'INNER'>, 'INSERT': <TokenType.INSERT: 'INSERT'>, 'INTERVAL': <TokenType.INTERVAL: 'INTERVAL'>, 'INTERSECT': <TokenType.INTERSECT: 'INTERSECT'>, 'INTO': <TokenType.INTO: 'INTO'>, 'IS': <TokenType.IS: 'IS'>, 'ISNULL': <TokenType.ISNULL: 'ISNULL'>, 'JOIN': <TokenType.JOIN: 'JOIN'>, 'KEEP': <TokenType.KEEP: 'KEEP'>, 'KILL': <TokenType.KILL: 'KILL'>, 'LATERAL': <TokenType.LATERAL: 'LATERAL'>, 'LEFT': <TokenType.LEFT: 'LEFT'>, 'LIKE': <TokenType.LIKE: 'LIKE'>, 'LIMIT': <TokenType.LIMIT: 'LIMIT'>, 'LOAD': <TokenType.LOAD: 'LOAD'>, 'LOCK': <TokenType.LOCK: 'LOCK'>, 'MERGE': <TokenType.MERGE: 'MERGE'>, 'NATURAL': <TokenType.NATURAL: 'NATURAL'>, 'NEXT': <TokenType.NEXT: 'NEXT'>, 'NOT': <TokenType.NOT: 'NOT'>, 'NOTNULL': <TokenType.NOTNULL: 'NOTNULL'>, 'NULL': <TokenType.NULL: 'NULL'>, 'OBJECT': <TokenType.OBJECT: 'OBJECT'>, 'OFFSET': <TokenType.OFFSET: 'OFFSET'>, 'ON': <TokenType.ON: 'ON'>, 'OR': <TokenType.OR: 'OR'>, 'XOR': <TokenType.XOR: 'XOR'>, 'ORDER BY': <TokenType.ORDER_BY: 'ORDER_BY'>, 'ORDINALITY': <TokenType.ORDINALITY: 'ORDINALITY'>, 'OUTER': <TokenType.OUTER: 'OUTER'>, 'OVER': <TokenType.OVER: 'OVER'>, 'OVERLAPS': <TokenType.OVERLAPS: 'OVERLAPS'>, 'OVERWRITE': <TokenType.OVERWRITE: 'OVERWRITE'>, 'PARTITION': <TokenType.PARTITION: 'PARTITION'>, 'PARTITION BY': <TokenType.PARTITION_BY: 'PARTITION_BY'>, 'PARTITIONED BY': <TokenType.PARTITION_BY: 'PARTITION_BY'>, 'PARTITIONED_BY': <TokenType.PARTITION_BY: 'PARTITION_BY'>, 'PERCENT': <TokenType.PERCENT: 'PERCENT'>, 'PIVOT': <TokenType.PIVOT: 'PIVOT'>, 'PRAGMA': <TokenType.PRAGMA: 'PRAGMA'>, 'PRIMARY KEY': <TokenType.PRIMARY_KEY: 'PRIMARY_KEY'>, 'PROCEDURE': <TokenType.PROCEDURE: 'PROCEDURE'>, 'QUALIFY': <TokenType.QUALIFY: 'QUALIFY'>, 'RANGE': <TokenType.RANGE: 'RANGE'>, 'RECURSIVE': <TokenType.RECURSIVE: 'RECURSIVE'>, 'REGEXP': <TokenType.RLIKE: 'RLIKE'>, 'REPLACE': <TokenType.REPLACE: 'REPLACE'>, 'RETURNING': <TokenType.RETURNING: 'RETURNING'>, 'REFERENCES': <TokenType.REFERENCES: 'REFERENCES'>, 'RIGHT': <TokenType.RIGHT: 'RIGHT'>, 'RLIKE': <TokenType.RLIKE: 'RLIKE'>, 'ROLLBACK': <TokenType.ROLLBACK: 'ROLLBACK'>, 'ROLLUP': <TokenType.ROLLUP: 'ROLLUP'>, 'ROW': <TokenType.ROW: 'ROW'>, 'ROWS': <TokenType.ROWS: 'ROWS'>, 'SCHEMA': <TokenType.SCHEMA: 'SCHEMA'>, 'SELECT': <TokenType.SELECT: 'SELECT'>, 'SEMI': <TokenType.SEMI: 'SEMI'>, 'SET': <TokenType.SET: 'SET'>, 'SETTINGS': <TokenType.SETTINGS: 'SETTINGS'>, 'SHOW': <TokenType.SHOW: 'SHOW'>, 'SIMILAR TO': <TokenType.SIMILAR_TO: 'SIMILAR_TO'>, 'SOME': <TokenType.SOME: 'SOME'>, 'SORT BY': <TokenType.SORT_BY: 'SORT_BY'>, 'START WITH': <TokenType.START_WITH: 'START_WITH'>, 'TABLE': <TokenType.TABLE: 'TABLE'>, 'TABLESAMPLE': <TokenType.TABLE_SAMPLE: 'TABLE_SAMPLE'>, 'TEMP': <TokenType.TEMPORARY: 'TEMPORARY'>, 'TEMPORARY': <TokenType.TEMPORARY: 'TEMPORARY'>, 'THEN': <TokenType.THEN: 'THEN'>, 'TRUE': <TokenType.TRUE: 'TRUE'>, 'TRUNCATE': <TokenType.TRUNCATE: 'TRUNCATE'>, 'UNION': <TokenType.UNION: 'UNION'>, 'UNKNOWN': <TokenType.UNKNOWN: 'UNKNOWN'>, 'UNNEST': <TokenType.UNNEST: 'UNNEST'>, 'UNPIVOT': <TokenType.UNPIVOT: 'UNPIVOT'>, 'UPDATE': <TokenType.UPDATE: 'UPDATE'>, 'USE': <TokenType.USE: 'USE'>, 'USING': <TokenType.USING: 'USING'>, 'UUID': <TokenType.UUID: 'UUID'>, 'VALUES': <TokenType.VALUES: 'VALUES'>, 'VIEW': <TokenType.VIEW: 'VIEW'>, 'VOLATILE': <TokenType.VOLATILE: 'VOLATILE'>, 'WHEN': <TokenType.WHEN: 'WHEN'>, 'WHERE': <TokenType.WHERE: 'WHERE'>, 'WINDOW': <TokenType.WINDOW: 'WINDOW'>, 'WITH': <TokenType.WITH: 'WITH'>, 'APPLY': <TokenType.APPLY: 'APPLY'>, 'ARRAY': <TokenType.ARRAY: 'ARRAY'>, 'BIT': <TokenType.BIT: 'BIT'>, 'BOOL': <TokenType.BOOLEAN: 'BOOLEAN'>, 'BOOLEAN': <TokenType.BOOLEAN: 'BOOLEAN'>, 'BYTE': <TokenType.TINYINT: 'TINYINT'>, 'MEDIUMINT': <TokenType.MEDIUMINT: 'MEDIUMINT'>, 'INT1': <TokenType.TINYINT: 'TINYINT'>, 'TINYINT': <TokenType.TINYINT: 'TINYINT'>, 'INT16': <TokenType.SMALLINT: 'SMALLINT'>, 'SHORT': <TokenType.SMALLINT: 'SMALLINT'>, 'SMALLINT': <TokenType.SMALLINT: 'SMALLINT'>, 'INT128': <TokenType.INT128: 'INT128'>, 'HUGEINT': <TokenType.INT128: 'INT128'>, 'INT2': <TokenType.SMALLINT: 'SMALLINT'>, 'INTEGER': <TokenType.INT: 'INT'>, 'INT': <TokenType.INT: 'INT'>, 'INT4': <TokenType.INT: 'INT'>, 'INT32': <TokenType.INT: 'INT'>, 'INT64': <TokenType.BIGINT: 'BIGINT'>, 'LONG': <TokenType.BIGINT: 'BIGINT'>, 'BIGINT': <TokenType.BIGINT: 'BIGINT'>, 'INT8': <TokenType.TINYINT: 'TINYINT'>, 'UINT': <TokenType.UINT: 'UINT'>, 'DEC': <TokenType.DECIMAL: 'DECIMAL'>, 'DECIMAL': <TokenType.DECIMAL: 'DECIMAL'>, 'BIGDECIMAL': <TokenType.BIGDECIMAL: 'BIGDECIMAL'>, 'BIGNUMERIC': <TokenType.BIGDECIMAL: 'BIGDECIMAL'>, 'MAP': <TokenType.MAP: 'MAP'>, 'NULLABLE': <TokenType.NULLABLE: 'NULLABLE'>, 'NUMBER': <TokenType.DECIMAL: 'DECIMAL'>, 'NUMERIC': <TokenType.DECIMAL: 'DECIMAL'>, 'FIXED': <TokenType.DECIMAL: 'DECIMAL'>, 'REAL': <TokenType.FLOAT: 'FLOAT'>, 'FLOAT': <TokenType.FLOAT: 'FLOAT'>, 'FLOAT4': <TokenType.FLOAT: 'FLOAT'>, 'FLOAT8': <TokenType.DOUBLE: 'DOUBLE'>, 'DOUBLE': <TokenType.DOUBLE: 'DOUBLE'>, 'DOUBLE PRECISION': <TokenType.DOUBLE: 'DOUBLE'>, 'JSON': <TokenType.JSON: 'JSON'>, 'CHAR': <TokenType.CHAR: 'CHAR'>, 'CHARACTER': <TokenType.CHAR: 'CHAR'>, 'NCHAR': <TokenType.NCHAR: 'NCHAR'>, 'VARCHAR': <TokenType.VARCHAR: 'VARCHAR'>, 'VARCHAR2': <TokenType.VARCHAR: 'VARCHAR'>, 'NVARCHAR': <TokenType.NVARCHAR: 'NVARCHAR'>, 'NVARCHAR2': <TokenType.NVARCHAR: 'NVARCHAR'>, 'BPCHAR': <TokenType.BPCHAR: 'BPCHAR'>, 'STR': <TokenType.TEXT: 'TEXT'>, 'STRING': <TokenType.TEXT: 'TEXT'>, 'TEXT': <TokenType.TEXT: 'TEXT'>, 'LONGTEXT': <TokenType.LONGTEXT: 'LONGTEXT'>, 'MEDIUMTEXT': <TokenType.MEDIUMTEXT: 'MEDIUMTEXT'>, 'TINYTEXT': <TokenType.TINYTEXT: 'TINYTEXT'>, 'CLOB': <TokenType.TEXT: 'TEXT'>, 'LONGVARCHAR': <TokenType.TEXT: 'TEXT'>, 'BINARY': <TokenType.BINARY: 'BINARY'>, 'BLOB': <TokenType.VARBINARY: 'VARBINARY'>, 'LONGBLOB': <TokenType.LONGBLOB: 'LONGBLOB'>, 'MEDIUMBLOB': <TokenType.MEDIUMBLOB: 'MEDIUMBLOB'>, 'TINYBLOB': <TokenType.TINYBLOB: 'TINYBLOB'>, 'BYTEA': <TokenType.VARBINARY: 'VARBINARY'>, 'VARBINARY': <TokenType.VARBINARY: 'VARBINARY'>, 'TIME': <TokenType.TIME: 'TIME'>, 'TIMETZ': <TokenType.TIMETZ: 'TIMETZ'>, 'TIMESTAMP': <TokenType.TIMESTAMP: 'TIMESTAMP'>, 'TIMESTAMPTZ': <TokenType.TIMESTAMPTZ: 'TIMESTAMPTZ'>, 'TIMESTAMPLTZ': <TokenType.TIMESTAMPLTZ: 'TIMESTAMPLTZ'>, 'TIMESTAMP_LTZ': <TokenType.TIMESTAMPLTZ: 'TIMESTAMPLTZ'>, 'TIMESTAMPNTZ': <TokenType.TIMESTAMPNTZ: 'TIMESTAMPNTZ'>, 'TIMESTAMP_NTZ': <TokenType.TIMESTAMPNTZ: 'TIMESTAMPNTZ'>, 'DATE': <TokenType.DATE: 'DATE'>, 'DATETIME': <TokenType.DATETIME: 'DATETIME'>, 'INT4RANGE': <TokenType.INT4RANGE: 'INT4RANGE'>, 'INT4MULTIRANGE': <TokenType.INT4MULTIRANGE: 'INT4MULTIRANGE'>, 'INT8RANGE': <TokenType.INT8RANGE: 'INT8RANGE'>, 'INT8MULTIRANGE': <TokenType.INT8MULTIRANGE: 'INT8MULTIRANGE'>, 'NUMRANGE': <TokenType.NUMRANGE: 'NUMRANGE'>, 'NUMMULTIRANGE': <TokenType.NUMMULTIRANGE: 'NUMMULTIRANGE'>, 'TSRANGE': <TokenType.TSRANGE: 'TSRANGE'>, 'TSMULTIRANGE': <TokenType.TSMULTIRANGE: 'TSMULTIRANGE'>, 'TSTZRANGE': <TokenType.TSTZRANGE: 'TSTZRANGE'>, 'TSTZMULTIRANGE': <TokenType.TSTZMULTIRANGE: 'TSTZMULTIRANGE'>, 'DATERANGE': <TokenType.DATERANGE: 'DATERANGE'>, 'DATEMULTIRANGE': <TokenType.DATEMULTIRANGE: 'DATEMULTIRANGE'>, 'UNIQUE': <TokenType.UNIQUE: 'UNIQUE'>, 'STRUCT': <TokenType.STRUCT: 'STRUCT'>, 'SEQUENCE': <TokenType.SEQUENCE: 'SEQUENCE'>, 'VARIANT': <TokenType.VARIANT: 'VARIANT'>, 'ALTER': <TokenType.ALTER: 'ALTER'>, 'ANALYZE': <TokenType.COMMAND: 'COMMAND'>, 'CALL': <TokenType.COMMAND: 'COMMAND'>, 'COMMENT': <TokenType.COMMENT: 'COMMENT'>, 'EXPLAIN': <TokenType.COMMAND: 'COMMAND'>, 'GRANT': <TokenType.COMMAND: 'COMMAND'>, 'OPTIMIZE': <TokenType.COMMAND: 'COMMAND'>, 'PREPARE': <TokenType.COMMAND: 'COMMAND'>, 'VACUUM': <TokenType.COMMAND: 'COMMAND'>, 'USER-DEFINED': <TokenType.USERDEFINED: 'USERDEFINED'>, 'FOR VERSION': <TokenType.VERSION_SNAPSHOT: 'VERSION_SNAPSHOT'>, 'FOR TIMESTAMP': <TokenType.TIMESTAMP_SNAPSHOT: 'TIMESTAMP_SNAPSHOT'>, 'BYTEINT': <TokenType.INT: 'INT'>, 'CHAR VARYING': <TokenType.VARCHAR: 'VARCHAR'>, 'CHARACTER VARYING': <TokenType.VARCHAR: 'VARCHAR'>, 'EXCLUDE': <TokenType.EXCEPT: 'EXCEPT'>, 'ILIKE ANY': <TokenType.ILIKE_ANY: 'ILIKE_ANY'>, 'LIKE ANY': <TokenType.LIKE_ANY: 'LIKE_ANY'>, 'MATCH_CONDITION': <TokenType.MATCH_CONDITION: 'MATCH_CONDITION'>, 'MATCH_RECOGNIZE': <TokenType.MATCH_RECOGNIZE: 'MATCH_RECOGNIZE'>, 'MINUS': <TokenType.EXCEPT: 'EXCEPT'>, 'NCHAR VARYING': <TokenType.VARCHAR: 'VARCHAR'>, 'PUT': <TokenType.COMMAND: 'COMMAND'>, 'REMOVE': <TokenType.COMMAND: 'COMMAND'>, 'RENAME': <TokenType.REPLACE: 'REPLACE'>, 'RM': <TokenType.COMMAND: 'COMMAND'>, 'SAMPLE': <TokenType.TABLE_SAMPLE: 'TABLE_SAMPLE'>, 'SQL_DOUBLE': <TokenType.DOUBLE: 'DOUBLE'>, 'SQL_VARCHAR': <TokenType.VARCHAR: 'VARCHAR'>, 'STORAGE INTEGRATION': <TokenType.STORAGE_INTEGRATION: 'STORAGE_INTEGRATION'>, 'TIMESTAMP_TZ': <TokenType.TIMESTAMPTZ: 'TIMESTAMPTZ'>, 'TOP': <TokenType.TOP: 'TOP'>}

SINGLE_TOKENS = {'(': <TokenType.L_PAREN: 'L_PAREN'>, ')': <TokenType.R_PAREN: 'R_PAREN'>, '[': <TokenType.L_BRACKET: 'L_BRACKET'>, ']': <TokenType.R_BRACKET: 'R_BRACKET'>, '{': <TokenType.L_BRACE: 'L_BRACE'>, '}': <TokenType.R_BRACE: 'R_BRACE'>, '&': <TokenType.AMP: 'AMP'>, '^': <TokenType.CARET: 'CARET'>, ':': <TokenType.COLON: 'COLON'>, ',': <TokenType.COMMA: 'COMMA'>, '.': <TokenType.DOT: 'DOT'>, '-': <TokenType.DASH: 'DASH'>, '=': <TokenType.EQ: 'EQ'>, '>': <TokenType.GT: 'GT'>, '<': <TokenType.LT: 'LT'>, '%': <TokenType.MOD: 'MOD'>, '!': <TokenType.NOT: 'NOT'>, '|': <TokenType.PIPE: 'PIPE'>, '+': <TokenType.PLUS: 'PLUS'>, ';': <TokenType.SEMICOLON: 'SEMICOLON'>, '/': <TokenType.SLASH: 'SLASH'>, '\\': <TokenType.BACKSLASH: 'BACKSLASH'>, '*': <TokenType.STAR: 'STAR'>, '~': <TokenType.TILDA: 'TILDA'>, '?': <TokenType.PLACEHOLDER: 'PLACEHOLDER'>, '@': <TokenType.PARAMETER: 'PARAMETER'>, '#': <TokenType.HASH: 'HASH'>, "'": <TokenType.UNKNOWN: 'UNKNOWN'>, '`': <TokenType.UNKNOWN: 'UNKNOWN'>, '"': <TokenType.UNKNOWN: 'UNKNOWN'>, '$': <TokenType.PARAMETER: 'PARAMETER'>}

VAR_SINGLE_TOKENS = {'$'}

COMMANDS = {<TokenType.COMMAND: 'COMMAND'>, <TokenType.FETCH: 'FETCH'>, <TokenType.EXECUTE: 'EXECUTE'>}