Edit on GitHub

sqlglot.parser

View Source

   1from __future__ import annotations
   2
   3import logging
   4import typing as t
   5from collections import defaultdict
   6
   7from sqlglot import exp
   8from sqlglot.errors import ErrorLevel, ParseError, concat_messages, merge_errors
   9from sqlglot.helper import apply_index_offset, ensure_list, seq_get
  10from sqlglot.time import format_time
  11from sqlglot.tokens import Token, Tokenizer, TokenType
  12from sqlglot.trie import TrieResult, in_trie, new_trie
  13
  14if t.TYPE_CHECKING:
  15    from sqlglot._typing import E, Lit
  16    from sqlglot.dialects.dialect import Dialect, DialectType
  17
  18    T = t.TypeVar("T")
  19
  20logger = logging.getLogger("sqlglot")
  21
  22OPTIONS_TYPE = t.Dict[str, t.Sequence[t.Union[t.Sequence[str], str]]]
  23
  24
  25def build_var_map(args: t.List) -> exp.StarMap | exp.VarMap:
  26    if len(args) == 1 and args[0].is_star:
  27        return exp.StarMap(this=args[0])
  28
  29    keys = []
  30    values = []
  31    for i in range(0, len(args), 2):
  32        keys.append(args[i])
  33        values.append(args[i + 1])
  34
  35    return exp.VarMap(keys=exp.array(*keys, copy=False), values=exp.array(*values, copy=False))
  36
  37
  38def build_like(args: t.List) -> exp.Escape | exp.Like:
  39    like = exp.Like(this=seq_get(args, 1), expression=seq_get(args, 0))
  40    return exp.Escape(this=like, expression=seq_get(args, 2)) if len(args) > 2 else like
  41
  42
  43def binary_range_parser(
  44    expr_type: t.Type[exp.Expression], reverse_args: bool = False
  45) -> t.Callable[[Parser, t.Optional[exp.Expression]], t.Optional[exp.Expression]]:
  46    def _parse_binary_range(
  47        self: Parser, this: t.Optional[exp.Expression]
  48    ) -> t.Optional[exp.Expression]:
  49        expression = self._parse_bitwise()
  50        if reverse_args:
  51            this, expression = expression, this
  52        return self._parse_escape(self.expression(expr_type, this=this, expression=expression))
  53
  54    return _parse_binary_range
  55
  56
  57def build_logarithm(args: t.List, dialect: Dialect) -> exp.Func:
  58    # Default argument order is base, expression
  59    this = seq_get(args, 0)
  60    expression = seq_get(args, 1)
  61
  62    if expression:
  63        if not dialect.LOG_BASE_FIRST:
  64            this, expression = expression, this
  65        return exp.Log(this=this, expression=expression)
  66
  67    return (exp.Ln if dialect.parser_class.LOG_DEFAULTS_TO_LN else exp.Log)(this=this)
  68
  69
  70def build_hex(args: t.List, dialect: Dialect) -> exp.Hex | exp.LowerHex:
  71    arg = seq_get(args, 0)
  72    return exp.LowerHex(this=arg) if dialect.HEX_LOWERCASE else exp.Hex(this=arg)
  73
  74
  75def build_lower(args: t.List) -> exp.Lower | exp.Hex:
  76    # LOWER(HEX(..)) can be simplified to LowerHex to simplify its transpilation
  77    arg = seq_get(args, 0)
  78    return exp.LowerHex(this=arg.this) if isinstance(arg, exp.Hex) else exp.Lower(this=arg)
  79
  80
  81def build_upper(args: t.List) -> exp.Upper | exp.Hex:
  82    # UPPER(HEX(..)) can be simplified to Hex to simplify its transpilation
  83    arg = seq_get(args, 0)
  84    return exp.Hex(this=arg.this) if isinstance(arg, exp.Hex) else exp.Upper(this=arg)
  85
  86
  87def build_extract_json_with_path(expr_type: t.Type[E]) -> t.Callable[[t.List, Dialect], E]:
  88    def _builder(args: t.List, dialect: Dialect) -> E:
  89        expression = expr_type(
  90            this=seq_get(args, 0), expression=dialect.to_json_path(seq_get(args, 1))
  91        )
  92        if len(args) > 2 and expr_type is exp.JSONExtract:
  93            expression.set("expressions", args[2:])
  94
  95        return expression
  96
  97    return _builder
  98
  99
 100def build_mod(args: t.List) -> exp.Mod:
 101    this = seq_get(args, 0)
 102    expression = seq_get(args, 1)
 103
 104    # Wrap the operands if they are binary nodes, e.g. MOD(a + 1, 7) -> (a + 1) % 7
 105    this = exp.Paren(this=this) if isinstance(this, exp.Binary) else this
 106    expression = exp.Paren(this=expression) if isinstance(expression, exp.Binary) else expression
 107
 108    return exp.Mod(this=this, expression=expression)
 109
 110
 111def build_pad(args: t.List, is_left: bool = True):
 112    return exp.Pad(
 113        this=seq_get(args, 0),
 114        expression=seq_get(args, 1),
 115        fill_pattern=seq_get(args, 2),
 116        is_left=is_left,
 117    )
 118
 119
 120def build_array_constructor(
 121    exp_class: t.Type[E], args: t.List, bracket_kind: TokenType, dialect: Dialect
 122) -> exp.Expression:
 123    array_exp = exp_class(expressions=args)
 124
 125    if exp_class == exp.Array and dialect.HAS_DISTINCT_ARRAY_CONSTRUCTORS:
 126        array_exp.set("bracket_notation", bracket_kind == TokenType.L_BRACKET)
 127
 128    return array_exp
 129
 130
 131def build_convert_timezone(
 132    args: t.List, default_source_tz: t.Optional[str] = None
 133) -> t.Union[exp.ConvertTimezone, exp.Anonymous]:
 134    if len(args) == 2:
 135        source_tz = exp.Literal.string(default_source_tz) if default_source_tz else None
 136        return exp.ConvertTimezone(
 137            source_tz=source_tz, target_tz=seq_get(args, 0), timestamp=seq_get(args, 1)
 138        )
 139
 140    return exp.ConvertTimezone.from_arg_list(args)
 141
 142
 143class _Parser(type):
 144    def __new__(cls, clsname, bases, attrs):
 145        klass = super().__new__(cls, clsname, bases, attrs)
 146
 147        klass.SHOW_TRIE = new_trie(key.split(" ") for key in klass.SHOW_PARSERS)
 148        klass.SET_TRIE = new_trie(key.split(" ") for key in klass.SET_PARSERS)
 149
 150        return klass
 151
 152
 153class Parser(metaclass=_Parser):
 154    """
 155    Parser consumes a list of tokens produced by the Tokenizer and produces a parsed syntax tree.
 156
 157    Args:
 158        error_level: The desired error level.
 159            Default: ErrorLevel.IMMEDIATE
 160        error_message_context: The amount of context to capture from a query string when displaying
 161            the error message (in number of characters).
 162            Default: 100
 163        max_errors: Maximum number of error messages to include in a raised ParseError.
 164            This is only relevant if error_level is ErrorLevel.RAISE.
 165            Default: 3
 166    """
 167
 168    FUNCTIONS: t.Dict[str, t.Callable] = {
 169        **{name: func.from_arg_list for name, func in exp.FUNCTION_BY_NAME.items()},
 170        "ARRAY": lambda args, dialect: exp.Array(expressions=args),
 171        "CONCAT": lambda args, dialect: exp.Concat(
 172            expressions=args,
 173            safe=not dialect.STRICT_STRING_CONCAT,
 174            coalesce=dialect.CONCAT_COALESCE,
 175        ),
 176        "CONCAT_WS": lambda args, dialect: exp.ConcatWs(
 177            expressions=args,
 178            safe=not dialect.STRICT_STRING_CONCAT,
 179            coalesce=dialect.CONCAT_COALESCE,
 180        ),
 181        "CONVERT_TIMEZONE": build_convert_timezone,
 182        "DATE_TO_DATE_STR": lambda args: exp.Cast(
 183            this=seq_get(args, 0),
 184            to=exp.DataType(this=exp.DataType.Type.TEXT),
 185        ),
 186        "GENERATE_DATE_ARRAY": lambda args: exp.GenerateDateArray(
 187            start=seq_get(args, 0),
 188            end=seq_get(args, 1),
 189            step=seq_get(args, 2) or exp.Interval(this=exp.Literal.number(1), unit=exp.var("DAY")),
 190        ),
 191        "GLOB": lambda args: exp.Glob(this=seq_get(args, 1), expression=seq_get(args, 0)),
 192        "HEX": build_hex,
 193        "JSON_EXTRACT": build_extract_json_with_path(exp.JSONExtract),
 194        "JSON_EXTRACT_SCALAR": build_extract_json_with_path(exp.JSONExtractScalar),
 195        "JSON_EXTRACT_PATH_TEXT": build_extract_json_with_path(exp.JSONExtractScalar),
 196        "LIKE": build_like,
 197        "LOG": build_logarithm,
 198        "LOG2": lambda args: exp.Log(this=exp.Literal.number(2), expression=seq_get(args, 0)),
 199        "LOG10": lambda args: exp.Log(this=exp.Literal.number(10), expression=seq_get(args, 0)),
 200        "LOWER": build_lower,
 201        "LPAD": lambda args: build_pad(args),
 202        "LEFTPAD": lambda args: build_pad(args),
 203        "MOD": build_mod,
 204        "RPAD": lambda args: build_pad(args, is_left=False),
 205        "RIGHTPAD": lambda args: build_pad(args, is_left=False),
 206        "SCOPE_RESOLUTION": lambda args: exp.ScopeResolution(expression=seq_get(args, 0))
 207        if len(args) != 2
 208        else exp.ScopeResolution(this=seq_get(args, 0), expression=seq_get(args, 1)),
 209        "TIME_TO_TIME_STR": lambda args: exp.Cast(
 210            this=seq_get(args, 0),
 211            to=exp.DataType(this=exp.DataType.Type.TEXT),
 212        ),
 213        "TO_HEX": build_hex,
 214        "TS_OR_DS_TO_DATE_STR": lambda args: exp.Substring(
 215            this=exp.Cast(
 216                this=seq_get(args, 0),
 217                to=exp.DataType(this=exp.DataType.Type.TEXT),
 218            ),
 219            start=exp.Literal.number(1),
 220            length=exp.Literal.number(10),
 221        ),
 222        "UNNEST": lambda args: exp.Unnest(expressions=ensure_list(seq_get(args, 0))),
 223        "UPPER": build_upper,
 224        "VAR_MAP": build_var_map,
 225        "COALESCE": lambda args: exp.Coalesce(this=seq_get(args, 0), expressions=args[1:]),
 226    }
 227
 228    NO_PAREN_FUNCTIONS = {
 229        TokenType.CURRENT_DATE: exp.CurrentDate,
 230        TokenType.CURRENT_DATETIME: exp.CurrentDate,
 231        TokenType.CURRENT_TIME: exp.CurrentTime,
 232        TokenType.CURRENT_TIMESTAMP: exp.CurrentTimestamp,
 233        TokenType.CURRENT_USER: exp.CurrentUser,
 234    }
 235
 236    STRUCT_TYPE_TOKENS = {
 237        TokenType.NESTED,
 238        TokenType.OBJECT,
 239        TokenType.STRUCT,
 240    }
 241
 242    NESTED_TYPE_TOKENS = {
 243        TokenType.ARRAY,
 244        TokenType.LIST,
 245        TokenType.LOWCARDINALITY,
 246        TokenType.MAP,
 247        TokenType.NULLABLE,
 248        *STRUCT_TYPE_TOKENS,
 249    }
 250
 251    ENUM_TYPE_TOKENS = {
 252        TokenType.ENUM,
 253        TokenType.ENUM8,
 254        TokenType.ENUM16,
 255    }
 256
 257    AGGREGATE_TYPE_TOKENS = {
 258        TokenType.AGGREGATEFUNCTION,
 259        TokenType.SIMPLEAGGREGATEFUNCTION,
 260    }
 261
 262    TYPE_TOKENS = {
 263        TokenType.BIT,
 264        TokenType.BOOLEAN,
 265        TokenType.TINYINT,
 266        TokenType.UTINYINT,
 267        TokenType.SMALLINT,
 268        TokenType.USMALLINT,
 269        TokenType.INT,
 270        TokenType.UINT,
 271        TokenType.BIGINT,
 272        TokenType.UBIGINT,
 273        TokenType.INT128,
 274        TokenType.UINT128,
 275        TokenType.INT256,
 276        TokenType.UINT256,
 277        TokenType.MEDIUMINT,
 278        TokenType.UMEDIUMINT,
 279        TokenType.FIXEDSTRING,
 280        TokenType.FLOAT,
 281        TokenType.DOUBLE,
 282        TokenType.CHAR,
 283        TokenType.NCHAR,
 284        TokenType.VARCHAR,
 285        TokenType.NVARCHAR,
 286        TokenType.BPCHAR,
 287        TokenType.TEXT,
 288        TokenType.MEDIUMTEXT,
 289        TokenType.LONGTEXT,
 290        TokenType.MEDIUMBLOB,
 291        TokenType.LONGBLOB,
 292        TokenType.BINARY,
 293        TokenType.VARBINARY,
 294        TokenType.JSON,
 295        TokenType.JSONB,
 296        TokenType.INTERVAL,
 297        TokenType.TINYBLOB,
 298        TokenType.TINYTEXT,
 299        TokenType.TIME,
 300        TokenType.TIMETZ,
 301        TokenType.TIMESTAMP,
 302        TokenType.TIMESTAMP_S,
 303        TokenType.TIMESTAMP_MS,
 304        TokenType.TIMESTAMP_NS,
 305        TokenType.TIMESTAMPTZ,
 306        TokenType.TIMESTAMPLTZ,
 307        TokenType.TIMESTAMPNTZ,
 308        TokenType.DATETIME,
 309        TokenType.DATETIME64,
 310        TokenType.DATE,
 311        TokenType.DATE32,
 312        TokenType.INT4RANGE,
 313        TokenType.INT4MULTIRANGE,
 314        TokenType.INT8RANGE,
 315        TokenType.INT8MULTIRANGE,
 316        TokenType.NUMRANGE,
 317        TokenType.NUMMULTIRANGE,
 318        TokenType.TSRANGE,
 319        TokenType.TSMULTIRANGE,
 320        TokenType.TSTZRANGE,
 321        TokenType.TSTZMULTIRANGE,
 322        TokenType.DATERANGE,
 323        TokenType.DATEMULTIRANGE,
 324        TokenType.DECIMAL,
 325        TokenType.UDECIMAL,
 326        TokenType.BIGDECIMAL,
 327        TokenType.UUID,
 328        TokenType.GEOGRAPHY,
 329        TokenType.GEOMETRY,
 330        TokenType.HLLSKETCH,
 331        TokenType.HSTORE,
 332        TokenType.PSEUDO_TYPE,
 333        TokenType.SUPER,
 334        TokenType.SERIAL,
 335        TokenType.SMALLSERIAL,
 336        TokenType.BIGSERIAL,
 337        TokenType.XML,
 338        TokenType.YEAR,
 339        TokenType.UNIQUEIDENTIFIER,
 340        TokenType.USERDEFINED,
 341        TokenType.MONEY,
 342        TokenType.SMALLMONEY,
 343        TokenType.ROWVERSION,
 344        TokenType.IMAGE,
 345        TokenType.VARIANT,
 346        TokenType.VECTOR,
 347        TokenType.OBJECT,
 348        TokenType.OBJECT_IDENTIFIER,
 349        TokenType.INET,
 350        TokenType.IPADDRESS,
 351        TokenType.IPPREFIX,
 352        TokenType.IPV4,
 353        TokenType.IPV6,
 354        TokenType.UNKNOWN,
 355        TokenType.NULL,
 356        TokenType.NAME,
 357        TokenType.TDIGEST,
 358        *ENUM_TYPE_TOKENS,
 359        *NESTED_TYPE_TOKENS,
 360        *AGGREGATE_TYPE_TOKENS,
 361    }
 362
 363    SIGNED_TO_UNSIGNED_TYPE_TOKEN = {
 364        TokenType.BIGINT: TokenType.UBIGINT,
 365        TokenType.INT: TokenType.UINT,
 366        TokenType.MEDIUMINT: TokenType.UMEDIUMINT,
 367        TokenType.SMALLINT: TokenType.USMALLINT,
 368        TokenType.TINYINT: TokenType.UTINYINT,
 369        TokenType.DECIMAL: TokenType.UDECIMAL,
 370    }
 371
 372    SUBQUERY_PREDICATES = {
 373        TokenType.ANY: exp.Any,
 374        TokenType.ALL: exp.All,
 375        TokenType.EXISTS: exp.Exists,
 376        TokenType.SOME: exp.Any,
 377    }
 378
 379    RESERVED_TOKENS = {
 380        *Tokenizer.SINGLE_TOKENS.values(),
 381        TokenType.SELECT,
 382    } - {TokenType.IDENTIFIER}
 383
 384    DB_CREATABLES = {
 385        TokenType.DATABASE,
 386        TokenType.DICTIONARY,
 387        TokenType.MODEL,
 388        TokenType.SCHEMA,
 389        TokenType.SEQUENCE,
 390        TokenType.STORAGE_INTEGRATION,
 391        TokenType.TABLE,
 392        TokenType.TAG,
 393        TokenType.VIEW,
 394        TokenType.WAREHOUSE,
 395        TokenType.STREAMLIT,
 396    }
 397
 398    CREATABLES = {
 399        TokenType.COLUMN,
 400        TokenType.CONSTRAINT,
 401        TokenType.FOREIGN_KEY,
 402        TokenType.FUNCTION,
 403        TokenType.INDEX,
 404        TokenType.PROCEDURE,
 405        *DB_CREATABLES,
 406    }
 407
 408    ALTERABLES = {
 409        TokenType.TABLE,
 410        TokenType.VIEW,
 411    }
 412
 413    # Tokens that can represent identifiers
 414    ID_VAR_TOKENS = {
 415        TokenType.ALL,
 416        TokenType.VAR,
 417        TokenType.ANTI,
 418        TokenType.APPLY,
 419        TokenType.ASC,
 420        TokenType.ASOF,
 421        TokenType.AUTO_INCREMENT,
 422        TokenType.BEGIN,
 423        TokenType.BPCHAR,
 424        TokenType.CACHE,
 425        TokenType.CASE,
 426        TokenType.COLLATE,
 427        TokenType.COMMAND,
 428        TokenType.COMMENT,
 429        TokenType.COMMIT,
 430        TokenType.CONSTRAINT,
 431        TokenType.COPY,
 432        TokenType.CUBE,
 433        TokenType.DEFAULT,
 434        TokenType.DELETE,
 435        TokenType.DESC,
 436        TokenType.DESCRIBE,
 437        TokenType.DICTIONARY,
 438        TokenType.DIV,
 439        TokenType.END,
 440        TokenType.EXECUTE,
 441        TokenType.ESCAPE,
 442        TokenType.FALSE,
 443        TokenType.FIRST,
 444        TokenType.FILTER,
 445        TokenType.FINAL,
 446        TokenType.FORMAT,
 447        TokenType.FULL,
 448        TokenType.IDENTIFIER,
 449        TokenType.IS,
 450        TokenType.ISNULL,
 451        TokenType.INTERVAL,
 452        TokenType.KEEP,
 453        TokenType.KILL,
 454        TokenType.LEFT,
 455        TokenType.LOAD,
 456        TokenType.MERGE,
 457        TokenType.NATURAL,
 458        TokenType.NEXT,
 459        TokenType.OFFSET,
 460        TokenType.OPERATOR,
 461        TokenType.ORDINALITY,
 462        TokenType.OVERLAPS,
 463        TokenType.OVERWRITE,
 464        TokenType.PARTITION,
 465        TokenType.PERCENT,
 466        TokenType.PIVOT,
 467        TokenType.PRAGMA,
 468        TokenType.RANGE,
 469        TokenType.RECURSIVE,
 470        TokenType.REFERENCES,
 471        TokenType.REFRESH,
 472        TokenType.RENAME,
 473        TokenType.REPLACE,
 474        TokenType.RIGHT,
 475        TokenType.ROLLUP,
 476        TokenType.ROW,
 477        TokenType.ROWS,
 478        TokenType.SEMI,
 479        TokenType.SET,
 480        TokenType.SETTINGS,
 481        TokenType.SHOW,
 482        TokenType.TEMPORARY,
 483        TokenType.TOP,
 484        TokenType.TRUE,
 485        TokenType.TRUNCATE,
 486        TokenType.UNIQUE,
 487        TokenType.UNNEST,
 488        TokenType.UNPIVOT,
 489        TokenType.UPDATE,
 490        TokenType.USE,
 491        TokenType.VOLATILE,
 492        TokenType.WINDOW,
 493        *CREATABLES,
 494        *SUBQUERY_PREDICATES,
 495        *TYPE_TOKENS,
 496        *NO_PAREN_FUNCTIONS,
 497    }
 498
 499    INTERVAL_VARS = ID_VAR_TOKENS - {TokenType.END}
 500
 501    TABLE_ALIAS_TOKENS = ID_VAR_TOKENS - {
 502        TokenType.ANTI,
 503        TokenType.APPLY,
 504        TokenType.ASOF,
 505        TokenType.FULL,
 506        TokenType.LEFT,
 507        TokenType.LOCK,
 508        TokenType.NATURAL,
 509        TokenType.OFFSET,
 510        TokenType.RIGHT,
 511        TokenType.SEMI,
 512        TokenType.WINDOW,
 513    }
 514
 515    ALIAS_TOKENS = ID_VAR_TOKENS
 516
 517    ARRAY_CONSTRUCTORS = {
 518        "ARRAY": exp.Array,
 519        "LIST": exp.List,
 520    }
 521
 522    COMMENT_TABLE_ALIAS_TOKENS = TABLE_ALIAS_TOKENS - {TokenType.IS}
 523
 524    UPDATE_ALIAS_TOKENS = TABLE_ALIAS_TOKENS - {TokenType.SET}
 525
 526    TRIM_TYPES = {"LEADING", "TRAILING", "BOTH"}
 527
 528    FUNC_TOKENS = {
 529        TokenType.COLLATE,
 530        TokenType.COMMAND,
 531        TokenType.CURRENT_DATE,
 532        TokenType.CURRENT_DATETIME,
 533        TokenType.CURRENT_TIMESTAMP,
 534        TokenType.CURRENT_TIME,
 535        TokenType.CURRENT_USER,
 536        TokenType.FILTER,
 537        TokenType.FIRST,
 538        TokenType.FORMAT,
 539        TokenType.GLOB,
 540        TokenType.IDENTIFIER,
 541        TokenType.INDEX,
 542        TokenType.ISNULL,
 543        TokenType.ILIKE,
 544        TokenType.INSERT,
 545        TokenType.LIKE,
 546        TokenType.MERGE,
 547        TokenType.OFFSET,
 548        TokenType.PRIMARY_KEY,
 549        TokenType.RANGE,
 550        TokenType.REPLACE,
 551        TokenType.RLIKE,
 552        TokenType.ROW,
 553        TokenType.UNNEST,
 554        TokenType.VAR,
 555        TokenType.LEFT,
 556        TokenType.RIGHT,
 557        TokenType.SEQUENCE,
 558        TokenType.DATE,
 559        TokenType.DATETIME,
 560        TokenType.TABLE,
 561        TokenType.TIMESTAMP,
 562        TokenType.TIMESTAMPTZ,
 563        TokenType.TRUNCATE,
 564        TokenType.WINDOW,
 565        TokenType.XOR,
 566        *TYPE_TOKENS,
 567        *SUBQUERY_PREDICATES,
 568    }
 569
 570    CONJUNCTION: t.Dict[TokenType, t.Type[exp.Expression]] = {
 571        TokenType.AND: exp.And,
 572    }
 573
 574    ASSIGNMENT: t.Dict[TokenType, t.Type[exp.Expression]] = {
 575        TokenType.COLON_EQ: exp.PropertyEQ,
 576    }
 577
 578    DISJUNCTION: t.Dict[TokenType, t.Type[exp.Expression]] = {
 579        TokenType.OR: exp.Or,
 580    }
 581
 582    EQUALITY = {
 583        TokenType.EQ: exp.EQ,
 584        TokenType.NEQ: exp.NEQ,
 585        TokenType.NULLSAFE_EQ: exp.NullSafeEQ,
 586    }
 587
 588    COMPARISON = {
 589        TokenType.GT: exp.GT,
 590        TokenType.GTE: exp.GTE,
 591        TokenType.LT: exp.LT,
 592        TokenType.LTE: exp.LTE,
 593    }
 594
 595    BITWISE = {
 596        TokenType.AMP: exp.BitwiseAnd,
 597        TokenType.CARET: exp.BitwiseXor,
 598        TokenType.PIPE: exp.BitwiseOr,
 599    }
 600
 601    TERM = {
 602        TokenType.DASH: exp.Sub,
 603        TokenType.PLUS: exp.Add,
 604        TokenType.MOD: exp.Mod,
 605        TokenType.COLLATE: exp.Collate,
 606    }
 607
 608    FACTOR = {
 609        TokenType.DIV: exp.IntDiv,
 610        TokenType.LR_ARROW: exp.Distance,
 611        TokenType.SLASH: exp.Div,
 612        TokenType.STAR: exp.Mul,
 613    }
 614
 615    EXPONENT: t.Dict[TokenType, t.Type[exp.Expression]] = {}
 616
 617    TIMES = {
 618        TokenType.TIME,
 619        TokenType.TIMETZ,
 620    }
 621
 622    TIMESTAMPS = {
 623        TokenType.TIMESTAMP,
 624        TokenType.TIMESTAMPTZ,
 625        TokenType.TIMESTAMPLTZ,
 626        *TIMES,
 627    }
 628
 629    SET_OPERATIONS = {
 630        TokenType.UNION,
 631        TokenType.INTERSECT,
 632        TokenType.EXCEPT,
 633    }
 634
 635    JOIN_METHODS = {
 636        TokenType.ASOF,
 637        TokenType.NATURAL,
 638        TokenType.POSITIONAL,
 639    }
 640
 641    JOIN_SIDES = {
 642        TokenType.LEFT,
 643        TokenType.RIGHT,
 644        TokenType.FULL,
 645    }
 646
 647    JOIN_KINDS = {
 648        TokenType.ANTI,
 649        TokenType.CROSS,
 650        TokenType.INNER,
 651        TokenType.OUTER,
 652        TokenType.SEMI,
 653        TokenType.STRAIGHT_JOIN,
 654    }
 655
 656    JOIN_HINTS: t.Set[str] = set()
 657
 658    LAMBDAS = {
 659        TokenType.ARROW: lambda self, expressions: self.expression(
 660            exp.Lambda,
 661            this=self._replace_lambda(
 662                self._parse_assignment(),
 663                expressions,
 664            ),
 665            expressions=expressions,
 666        ),
 667        TokenType.FARROW: lambda self, expressions: self.expression(
 668            exp.Kwarg,
 669            this=exp.var(expressions[0].name),
 670            expression=self._parse_assignment(),
 671        ),
 672    }
 673
 674    COLUMN_OPERATORS = {
 675        TokenType.DOT: None,
 676        TokenType.DCOLON: lambda self, this, to: self.expression(
 677            exp.Cast if self.STRICT_CAST else exp.TryCast,
 678            this=this,
 679            to=to,
 680        ),
 681        TokenType.ARROW: lambda self, this, path: self.expression(
 682            exp.JSONExtract,
 683            this=this,
 684            expression=self.dialect.to_json_path(path),
 685            only_json_types=self.JSON_ARROWS_REQUIRE_JSON_TYPE,
 686        ),
 687        TokenType.DARROW: lambda self, this, path: self.expression(
 688            exp.JSONExtractScalar,
 689            this=this,
 690            expression=self.dialect.to_json_path(path),
 691            only_json_types=self.JSON_ARROWS_REQUIRE_JSON_TYPE,
 692        ),
 693        TokenType.HASH_ARROW: lambda self, this, path: self.expression(
 694            exp.JSONBExtract,
 695            this=this,
 696            expression=path,
 697        ),
 698        TokenType.DHASH_ARROW: lambda self, this, path: self.expression(
 699            exp.JSONBExtractScalar,
 700            this=this,
 701            expression=path,
 702        ),
 703        TokenType.PLACEHOLDER: lambda self, this, key: self.expression(
 704            exp.JSONBContains,
 705            this=this,
 706            expression=key,
 707        ),
 708    }
 709
 710    EXPRESSION_PARSERS = {
 711        exp.Cluster: lambda self: self._parse_sort(exp.Cluster, TokenType.CLUSTER_BY),
 712        exp.Column: lambda self: self._parse_column(),
 713        exp.Condition: lambda self: self._parse_assignment(),
 714        exp.DataType: lambda self: self._parse_types(allow_identifiers=False, schema=True),
 715        exp.Expression: lambda self: self._parse_expression(),
 716        exp.From: lambda self: self._parse_from(joins=True),
 717        exp.Group: lambda self: self._parse_group(),
 718        exp.Having: lambda self: self._parse_having(),
 719        exp.Identifier: lambda self: self._parse_id_var(),
 720        exp.Join: lambda self: self._parse_join(),
 721        exp.Lambda: lambda self: self._parse_lambda(),
 722        exp.Lateral: lambda self: self._parse_lateral(),
 723        exp.Limit: lambda self: self._parse_limit(),
 724        exp.Offset: lambda self: self._parse_offset(),
 725        exp.Order: lambda self: self._parse_order(),
 726        exp.Ordered: lambda self: self._parse_ordered(),
 727        exp.Properties: lambda self: self._parse_properties(),
 728        exp.Qualify: lambda self: self._parse_qualify(),
 729        exp.Returning: lambda self: self._parse_returning(),
 730        exp.Select: lambda self: self._parse_select(),
 731        exp.Sort: lambda self: self._parse_sort(exp.Sort, TokenType.SORT_BY),
 732        exp.Table: lambda self: self._parse_table_parts(),
 733        exp.TableAlias: lambda self: self._parse_table_alias(),
 734        exp.When: lambda self: seq_get(self._parse_when_matched(), 0),
 735        exp.Where: lambda self: self._parse_where(),
 736        exp.Window: lambda self: self._parse_named_window(),
 737        exp.With: lambda self: self._parse_with(),
 738        "JOIN_TYPE": lambda self: self._parse_join_parts(),
 739    }
 740
 741    STATEMENT_PARSERS = {
 742        TokenType.ALTER: lambda self: self._parse_alter(),
 743        TokenType.BEGIN: lambda self: self._parse_transaction(),
 744        TokenType.CACHE: lambda self: self._parse_cache(),
 745        TokenType.COMMENT: lambda self: self._parse_comment(),
 746        TokenType.COMMIT: lambda self: self._parse_commit_or_rollback(),
 747        TokenType.COPY: lambda self: self._parse_copy(),
 748        TokenType.CREATE: lambda self: self._parse_create(),
 749        TokenType.DELETE: lambda self: self._parse_delete(),
 750        TokenType.DESC: lambda self: self._parse_describe(),
 751        TokenType.DESCRIBE: lambda self: self._parse_describe(),
 752        TokenType.DROP: lambda self: self._parse_drop(),
 753        TokenType.INSERT: lambda self: self._parse_insert(),
 754        TokenType.KILL: lambda self: self._parse_kill(),
 755        TokenType.LOAD: lambda self: self._parse_load(),
 756        TokenType.MERGE: lambda self: self._parse_merge(),
 757        TokenType.PIVOT: lambda self: self._parse_simplified_pivot(),
 758        TokenType.PRAGMA: lambda self: self.expression(exp.Pragma, this=self._parse_expression()),
 759        TokenType.REFRESH: lambda self: self._parse_refresh(),
 760        TokenType.ROLLBACK: lambda self: self._parse_commit_or_rollback(),
 761        TokenType.SET: lambda self: self._parse_set(),
 762        TokenType.TRUNCATE: lambda self: self._parse_truncate_table(),
 763        TokenType.UNCACHE: lambda self: self._parse_uncache(),
 764        TokenType.UPDATE: lambda self: self._parse_update(),
 765        TokenType.USE: lambda self: self.expression(
 766            exp.Use,
 767            kind=self._parse_var_from_options(self.USABLES, raise_unmatched=False),
 768            this=self._parse_table(schema=False),
 769        ),
 770        TokenType.SEMICOLON: lambda self: self.expression(exp.Semicolon),
 771    }
 772
 773    UNARY_PARSERS = {
 774        TokenType.PLUS: lambda self: self._parse_unary(),  # Unary + is handled as a no-op
 775        TokenType.NOT: lambda self: self.expression(exp.Not, this=self._parse_equality()),
 776        TokenType.TILDA: lambda self: self.expression(exp.BitwiseNot, this=self._parse_unary()),
 777        TokenType.DASH: lambda self: self.expression(exp.Neg, this=self._parse_unary()),
 778        TokenType.PIPE_SLASH: lambda self: self.expression(exp.Sqrt, this=self._parse_unary()),
 779        TokenType.DPIPE_SLASH: lambda self: self.expression(exp.Cbrt, this=self._parse_unary()),
 780    }
 781
 782    STRING_PARSERS = {
 783        TokenType.HEREDOC_STRING: lambda self, token: self.expression(
 784            exp.RawString, this=token.text
 785        ),
 786        TokenType.NATIONAL_STRING: lambda self, token: self.expression(
 787            exp.National, this=token.text
 788        ),
 789        TokenType.RAW_STRING: lambda self, token: self.expression(exp.RawString, this=token.text),
 790        TokenType.STRING: lambda self, token: self.expression(
 791            exp.Literal, this=token.text, is_string=True
 792        ),
 793        TokenType.UNICODE_STRING: lambda self, token: self.expression(
 794            exp.UnicodeString,
 795            this=token.text,
 796            escape=self._match_text_seq("UESCAPE") and self._parse_string(),
 797        ),
 798    }
 799
 800    NUMERIC_PARSERS = {
 801        TokenType.BIT_STRING: lambda self, token: self.expression(exp.BitString, this=token.text),
 802        TokenType.BYTE_STRING: lambda self, token: self.expression(exp.ByteString, this=token.text),
 803        TokenType.HEX_STRING: lambda self, token: self.expression(exp.HexString, this=token.text),
 804        TokenType.NUMBER: lambda self, token: self.expression(
 805            exp.Literal, this=token.text, is_string=False
 806        ),
 807    }
 808
 809    PRIMARY_PARSERS = {
 810        **STRING_PARSERS,
 811        **NUMERIC_PARSERS,
 812        TokenType.INTRODUCER: lambda self, token: self._parse_introducer(token),
 813        TokenType.NULL: lambda self, _: self.expression(exp.Null),
 814        TokenType.TRUE: lambda self, _: self.expression(exp.Boolean, this=True),
 815        TokenType.FALSE: lambda self, _: self.expression(exp.Boolean, this=False),
 816        TokenType.SESSION_PARAMETER: lambda self, _: self._parse_session_parameter(),
 817        TokenType.STAR: lambda self, _: self.expression(
 818            exp.Star,
 819            **{
 820                "except": self._parse_star_op("EXCEPT", "EXCLUDE"),
 821                "replace": self._parse_star_op("REPLACE"),
 822                "rename": self._parse_star_op("RENAME"),
 823            },
 824        ),
 825    }
 826
 827    PLACEHOLDER_PARSERS = {
 828        TokenType.PLACEHOLDER: lambda self: self.expression(exp.Placeholder),
 829        TokenType.PARAMETER: lambda self: self._parse_parameter(),
 830        TokenType.COLON: lambda self: (
 831            self.expression(exp.Placeholder, this=self._prev.text)
 832            if self._match_set(self.ID_VAR_TOKENS)
 833            else None
 834        ),
 835    }
 836
 837    RANGE_PARSERS = {
 838        TokenType.BETWEEN: lambda self, this: self._parse_between(this),
 839        TokenType.GLOB: binary_range_parser(exp.Glob),
 840        TokenType.ILIKE: binary_range_parser(exp.ILike),
 841        TokenType.IN: lambda self, this: self._parse_in(this),
 842        TokenType.IRLIKE: binary_range_parser(exp.RegexpILike),
 843        TokenType.IS: lambda self, this: self._parse_is(this),
 844        TokenType.LIKE: binary_range_parser(exp.Like),
 845        TokenType.OVERLAPS: binary_range_parser(exp.Overlaps),
 846        TokenType.RLIKE: binary_range_parser(exp.RegexpLike),
 847        TokenType.SIMILAR_TO: binary_range_parser(exp.SimilarTo),
 848        TokenType.FOR: lambda self, this: self._parse_comprehension(this),
 849    }
 850
 851    PROPERTY_PARSERS: t.Dict[str, t.Callable] = {
 852        "ALLOWED_VALUES": lambda self: self.expression(
 853            exp.AllowedValuesProperty, expressions=self._parse_csv(self._parse_primary)
 854        ),
 855        "ALGORITHM": lambda self: self._parse_property_assignment(exp.AlgorithmProperty),
 856        "AUTO": lambda self: self._parse_auto_property(),
 857        "AUTO_INCREMENT": lambda self: self._parse_property_assignment(exp.AutoIncrementProperty),
 858        "BACKUP": lambda self: self.expression(
 859            exp.BackupProperty, this=self._parse_var(any_token=True)
 860        ),
 861        "BLOCKCOMPRESSION": lambda self: self._parse_blockcompression(),
 862        "CHARSET": lambda self, **kwargs: self._parse_character_set(**kwargs),
 863        "CHARACTER SET": lambda self, **kwargs: self._parse_character_set(**kwargs),
 864        "CHECKSUM": lambda self: self._parse_checksum(),
 865        "CLUSTER BY": lambda self: self._parse_cluster(),
 866        "CLUSTERED": lambda self: self._parse_clustered_by(),
 867        "COLLATE": lambda self, **kwargs: self._parse_property_assignment(
 868            exp.CollateProperty, **kwargs
 869        ),
 870        "COMMENT": lambda self: self._parse_property_assignment(exp.SchemaCommentProperty),
 871        "CONTAINS": lambda self: self._parse_contains_property(),
 872        "COPY": lambda self: self._parse_copy_property(),
 873        "DATABLOCKSIZE": lambda self, **kwargs: self._parse_datablocksize(**kwargs),
 874        "DATA_DELETION": lambda self: self._parse_data_deletion_property(),
 875        "DEFINER": lambda self: self._parse_definer(),
 876        "DETERMINISTIC": lambda self: self.expression(
 877            exp.StabilityProperty, this=exp.Literal.string("IMMUTABLE")
 878        ),
 879        "DYNAMIC": lambda self: self.expression(exp.DynamicProperty),
 880        "DISTKEY": lambda self: self._parse_distkey(),
 881        "DISTSTYLE": lambda self: self._parse_property_assignment(exp.DistStyleProperty),
 882        "EMPTY": lambda self: self.expression(exp.EmptyProperty),
 883        "ENGINE": lambda self: self._parse_property_assignment(exp.EngineProperty),
 884        "EXECUTE": lambda self: self._parse_property_assignment(exp.ExecuteAsProperty),
 885        "EXTERNAL": lambda self: self.expression(exp.ExternalProperty),
 886        "FALLBACK": lambda self, **kwargs: self._parse_fallback(**kwargs),
 887        "FORMAT": lambda self: self._parse_property_assignment(exp.FileFormatProperty),
 888        "FREESPACE": lambda self: self._parse_freespace(),
 889        "GLOBAL": lambda self: self.expression(exp.GlobalProperty),
 890        "HEAP": lambda self: self.expression(exp.HeapProperty),
 891        "ICEBERG": lambda self: self.expression(exp.IcebergProperty),
 892        "IMMUTABLE": lambda self: self.expression(
 893            exp.StabilityProperty, this=exp.Literal.string("IMMUTABLE")
 894        ),
 895        "INHERITS": lambda self: self.expression(
 896            exp.InheritsProperty, expressions=self._parse_wrapped_csv(self._parse_table)
 897        ),
 898        "INPUT": lambda self: self.expression(exp.InputModelProperty, this=self._parse_schema()),
 899        "JOURNAL": lambda self, **kwargs: self._parse_journal(**kwargs),
 900        "LANGUAGE": lambda self: self._parse_property_assignment(exp.LanguageProperty),
 901        "LAYOUT": lambda self: self._parse_dict_property(this="LAYOUT"),
 902        "LIFETIME": lambda self: self._parse_dict_range(this="LIFETIME"),
 903        "LIKE": lambda self: self._parse_create_like(),
 904        "LOCATION": lambda self: self._parse_property_assignment(exp.LocationProperty),
 905        "LOCK": lambda self: self._parse_locking(),
 906        "LOCKING": lambda self: self._parse_locking(),
 907        "LOG": lambda self, **kwargs: self._parse_log(**kwargs),
 908        "MATERIALIZED": lambda self: self.expression(exp.MaterializedProperty),
 909        "MERGEBLOCKRATIO": lambda self, **kwargs: self._parse_mergeblockratio(**kwargs),
 910        "MODIFIES": lambda self: self._parse_modifies_property(),
 911        "MULTISET": lambda self: self.expression(exp.SetProperty, multi=True),
 912        "NO": lambda self: self._parse_no_property(),
 913        "ON": lambda self: self._parse_on_property(),
 914        "ORDER BY": lambda self: self._parse_order(skip_order_token=True),
 915        "OUTPUT": lambda self: self.expression(exp.OutputModelProperty, this=self._parse_schema()),
 916        "PARTITION": lambda self: self._parse_partitioned_of(),
 917        "PARTITION BY": lambda self: self._parse_partitioned_by(),
 918        "PARTITIONED BY": lambda self: self._parse_partitioned_by(),
 919        "PARTITIONED_BY": lambda self: self._parse_partitioned_by(),
 920        "PRIMARY KEY": lambda self: self._parse_primary_key(in_props=True),
 921        "RANGE": lambda self: self._parse_dict_range(this="RANGE"),
 922        "READS": lambda self: self._parse_reads_property(),
 923        "REMOTE": lambda self: self._parse_remote_with_connection(),
 924        "RETURNS": lambda self: self._parse_returns(),
 925        "STRICT": lambda self: self.expression(exp.StrictProperty),
 926        "STREAMING": lambda self: self.expression(exp.StreamingTableProperty),
 927        "ROW": lambda self: self._parse_row(),
 928        "ROW_FORMAT": lambda self: self._parse_property_assignment(exp.RowFormatProperty),
 929        "SAMPLE": lambda self: self.expression(
 930            exp.SampleProperty, this=self._match_text_seq("BY") and self._parse_bitwise()
 931        ),
 932        "SECURE": lambda self: self.expression(exp.SecureProperty),
 933        "SET": lambda self: self.expression(exp.SetProperty, multi=False),
 934        "SETTINGS": lambda self: self._parse_settings_property(),
 935        "SHARING": lambda self: self._parse_property_assignment(exp.SharingProperty),
 936        "SORTKEY": lambda self: self._parse_sortkey(),
 937        "SOURCE": lambda self: self._parse_dict_property(this="SOURCE"),
 938        "STABLE": lambda self: self.expression(
 939            exp.StabilityProperty, this=exp.Literal.string("STABLE")
 940        ),
 941        "STORED": lambda self: self._parse_stored(),
 942        "SYSTEM_VERSIONING": lambda self: self._parse_system_versioning_property(),
 943        "TBLPROPERTIES": lambda self: self._parse_wrapped_properties(),
 944        "TEMP": lambda self: self.expression(exp.TemporaryProperty),
 945        "TEMPORARY": lambda self: self.expression(exp.TemporaryProperty),
 946        "TO": lambda self: self._parse_to_table(),
 947        "TRANSIENT": lambda self: self.expression(exp.TransientProperty),
 948        "TRANSFORM": lambda self: self.expression(
 949            exp.TransformModelProperty, expressions=self._parse_wrapped_csv(self._parse_expression)
 950        ),
 951        "TTL": lambda self: self._parse_ttl(),
 952        "USING": lambda self: self._parse_property_assignment(exp.FileFormatProperty),
 953        "UNLOGGED": lambda self: self.expression(exp.UnloggedProperty),
 954        "VOLATILE": lambda self: self._parse_volatile_property(),
 955        "WITH": lambda self: self._parse_with_property(),
 956    }
 957
 958    CONSTRAINT_PARSERS = {
 959        "AUTOINCREMENT": lambda self: self._parse_auto_increment(),
 960        "AUTO_INCREMENT": lambda self: self._parse_auto_increment(),
 961        "CASESPECIFIC": lambda self: self.expression(exp.CaseSpecificColumnConstraint, not_=False),
 962        "CHARACTER SET": lambda self: self.expression(
 963            exp.CharacterSetColumnConstraint, this=self._parse_var_or_string()
 964        ),
 965        "CHECK": lambda self: self.expression(
 966            exp.CheckColumnConstraint,
 967            this=self._parse_wrapped(self._parse_assignment),
 968            enforced=self._match_text_seq("ENFORCED"),
 969        ),
 970        "COLLATE": lambda self: self.expression(
 971            exp.CollateColumnConstraint,
 972            this=self._parse_identifier() or self._parse_column(),
 973        ),
 974        "COMMENT": lambda self: self.expression(
 975            exp.CommentColumnConstraint, this=self._parse_string()
 976        ),
 977        "COMPRESS": lambda self: self._parse_compress(),
 978        "CLUSTERED": lambda self: self.expression(
 979            exp.ClusteredColumnConstraint, this=self._parse_wrapped_csv(self._parse_ordered)
 980        ),
 981        "NONCLUSTERED": lambda self: self.expression(
 982            exp.NonClusteredColumnConstraint, this=self._parse_wrapped_csv(self._parse_ordered)
 983        ),
 984        "DEFAULT": lambda self: self.expression(
 985            exp.DefaultColumnConstraint, this=self._parse_bitwise()
 986        ),
 987        "ENCODE": lambda self: self.expression(exp.EncodeColumnConstraint, this=self._parse_var()),
 988        "EPHEMERAL": lambda self: self.expression(
 989            exp.EphemeralColumnConstraint, this=self._parse_bitwise()
 990        ),
 991        "EXCLUDE": lambda self: self.expression(
 992            exp.ExcludeColumnConstraint, this=self._parse_index_params()
 993        ),
 994        "FOREIGN KEY": lambda self: self._parse_foreign_key(),
 995        "FORMAT": lambda self: self.expression(
 996            exp.DateFormatColumnConstraint, this=self._parse_var_or_string()
 997        ),
 998        "GENERATED": lambda self: self._parse_generated_as_identity(),
 999        "IDENTITY": lambda self: self._parse_auto_increment(),
1000        "INLINE": lambda self: self._parse_inline(),
1001        "LIKE": lambda self: self._parse_create_like(),
1002        "NOT": lambda self: self._parse_not_constraint(),
1003        "NULL": lambda self: self.expression(exp.NotNullColumnConstraint, allow_null=True),
1004        "ON": lambda self: (
1005            self._match(TokenType.UPDATE)
1006            and self.expression(exp.OnUpdateColumnConstraint, this=self._parse_function())
1007        )
1008        or self.expression(exp.OnProperty, this=self._parse_id_var()),
1009        "PATH": lambda self: self.expression(exp.PathColumnConstraint, this=self._parse_string()),
1010        "PERIOD": lambda self: self._parse_period_for_system_time(),
1011        "PRIMARY KEY": lambda self: self._parse_primary_key(),
1012        "REFERENCES": lambda self: self._parse_references(match=False),
1013        "TITLE": lambda self: self.expression(
1014            exp.TitleColumnConstraint, this=self._parse_var_or_string()
1015        ),
1016        "TTL": lambda self: self.expression(exp.MergeTreeTTL, expressions=[self._parse_bitwise()]),
1017        "UNIQUE": lambda self: self._parse_unique(),
1018        "UPPERCASE": lambda self: self.expression(exp.UppercaseColumnConstraint),
1019        "WITH": lambda self: self.expression(
1020            exp.Properties, expressions=self._parse_wrapped_properties()
1021        ),
1022    }
1023
1024    ALTER_PARSERS = {
1025        "ADD": lambda self: self._parse_alter_table_add(),
1026        "ALTER": lambda self: self._parse_alter_table_alter(),
1027        "CLUSTER BY": lambda self: self._parse_cluster(wrapped=True),
1028        "DELETE": lambda self: self.expression(exp.Delete, where=self._parse_where()),
1029        "DROP": lambda self: self._parse_alter_table_drop(),
1030        "RENAME": lambda self: self._parse_alter_table_rename(),
1031        "SET": lambda self: self._parse_alter_table_set(),
1032        "AS": lambda self: self._parse_select(),
1033    }
1034
1035    ALTER_ALTER_PARSERS = {
1036        "DISTKEY": lambda self: self._parse_alter_diststyle(),
1037        "DISTSTYLE": lambda self: self._parse_alter_diststyle(),
1038        "SORTKEY": lambda self: self._parse_alter_sortkey(),
1039        "COMPOUND": lambda self: self._parse_alter_sortkey(compound=True),
1040    }
1041
1042    SCHEMA_UNNAMED_CONSTRAINTS = {
1043        "CHECK",
1044        "EXCLUDE",
1045        "FOREIGN KEY",
1046        "LIKE",
1047        "PERIOD",
1048        "PRIMARY KEY",
1049        "UNIQUE",
1050    }
1051
1052    NO_PAREN_FUNCTION_PARSERS = {
1053        "ANY": lambda self: self.expression(exp.Any, this=self._parse_bitwise()),
1054        "CASE": lambda self: self._parse_case(),
1055        "CONNECT_BY_ROOT": lambda self: self.expression(
1056            exp.ConnectByRoot, this=self._parse_column()
1057        ),
1058        "IF": lambda self: self._parse_if(),
1059        "NEXT": lambda self: self._parse_next_value_for(),
1060    }
1061
1062    INVALID_FUNC_NAME_TOKENS = {
1063        TokenType.IDENTIFIER,
1064        TokenType.STRING,
1065    }
1066
1067    FUNCTIONS_WITH_ALIASED_ARGS = {"STRUCT"}
1068
1069    KEY_VALUE_DEFINITIONS = (exp.Alias, exp.EQ, exp.PropertyEQ, exp.Slice)
1070
1071    FUNCTION_PARSERS = {
1072        "CAST": lambda self: self._parse_cast(self.STRICT_CAST),
1073        "CONVERT": lambda self: self._parse_convert(self.STRICT_CAST),
1074        "DECODE": lambda self: self._parse_decode(),
1075        "EXTRACT": lambda self: self._parse_extract(),
1076        "GAP_FILL": lambda self: self._parse_gap_fill(),
1077        "JSON_OBJECT": lambda self: self._parse_json_object(),
1078        "JSON_OBJECTAGG": lambda self: self._parse_json_object(agg=True),
1079        "JSON_TABLE": lambda self: self._parse_json_table(),
1080        "MATCH": lambda self: self._parse_match_against(),
1081        "OPENJSON": lambda self: self._parse_open_json(),
1082        "POSITION": lambda self: self._parse_position(),
1083        "PREDICT": lambda self: self._parse_predict(),
1084        "SAFE_CAST": lambda self: self._parse_cast(False, safe=True),
1085        "STRING_AGG": lambda self: self._parse_string_agg(),
1086        "SUBSTRING": lambda self: self._parse_substring(),
1087        "TRIM": lambda self: self._parse_trim(),
1088        "TRY_CAST": lambda self: self._parse_cast(False, safe=True),
1089        "TRY_CONVERT": lambda self: self._parse_convert(False, safe=True),
1090    }
1091
1092    QUERY_MODIFIER_PARSERS = {
1093        TokenType.MATCH_RECOGNIZE: lambda self: ("match", self._parse_match_recognize()),
1094        TokenType.PREWHERE: lambda self: ("prewhere", self._parse_prewhere()),
1095        TokenType.WHERE: lambda self: ("where", self._parse_where()),
1096        TokenType.GROUP_BY: lambda self: ("group", self._parse_group()),
1097        TokenType.HAVING: lambda self: ("having", self._parse_having()),
1098        TokenType.QUALIFY: lambda self: ("qualify", self._parse_qualify()),
1099        TokenType.WINDOW: lambda self: ("windows", self._parse_window_clause()),
1100        TokenType.ORDER_BY: lambda self: ("order", self._parse_order()),
1101        TokenType.LIMIT: lambda self: ("limit", self._parse_limit()),
1102        TokenType.FETCH: lambda self: ("limit", self._parse_limit()),
1103        TokenType.OFFSET: lambda self: ("offset", self._parse_offset()),
1104        TokenType.FOR: lambda self: ("locks", self._parse_locks()),
1105        TokenType.LOCK: lambda self: ("locks", self._parse_locks()),
1106        TokenType.TABLE_SAMPLE: lambda self: ("sample", self._parse_table_sample(as_modifier=True)),
1107        TokenType.USING: lambda self: ("sample", self._parse_table_sample(as_modifier=True)),
1108        TokenType.CLUSTER_BY: lambda self: (
1109            "cluster",
1110            self._parse_sort(exp.Cluster, TokenType.CLUSTER_BY),
1111        ),
1112        TokenType.DISTRIBUTE_BY: lambda self: (
1113            "distribute",
1114            self._parse_sort(exp.Distribute, TokenType.DISTRIBUTE_BY),
1115        ),
1116        TokenType.SORT_BY: lambda self: ("sort", self._parse_sort(exp.Sort, TokenType.SORT_BY)),
1117        TokenType.CONNECT_BY: lambda self: ("connect", self._parse_connect(skip_start_token=True)),
1118        TokenType.START_WITH: lambda self: ("connect", self._parse_connect()),
1119    }
1120
1121    SET_PARSERS = {
1122        "GLOBAL": lambda self: self._parse_set_item_assignment("GLOBAL"),
1123        "LOCAL": lambda self: self._parse_set_item_assignment("LOCAL"),
1124        "SESSION": lambda self: self._parse_set_item_assignment("SESSION"),
1125        "TRANSACTION": lambda self: self._parse_set_transaction(),
1126    }
1127
1128    SHOW_PARSERS: t.Dict[str, t.Callable] = {}
1129
1130    TYPE_LITERAL_PARSERS = {
1131        exp.DataType.Type.JSON: lambda self, this, _: self.expression(exp.ParseJSON, this=this),
1132    }
1133
1134    TYPE_CONVERTERS: t.Dict[exp.DataType.Type, t.Callable[[exp.DataType], exp.DataType]] = {}
1135
1136    DDL_SELECT_TOKENS = {TokenType.SELECT, TokenType.WITH, TokenType.L_PAREN}
1137
1138    PRE_VOLATILE_TOKENS = {TokenType.CREATE, TokenType.REPLACE, TokenType.UNIQUE}
1139
1140    TRANSACTION_KIND = {"DEFERRED", "IMMEDIATE", "EXCLUSIVE"}
1141    TRANSACTION_CHARACTERISTICS: OPTIONS_TYPE = {
1142        "ISOLATION": (
1143            ("LEVEL", "REPEATABLE", "READ"),
1144            ("LEVEL", "READ", "COMMITTED"),
1145            ("LEVEL", "READ", "UNCOMITTED"),
1146            ("LEVEL", "SERIALIZABLE"),
1147        ),
1148        "READ": ("WRITE", "ONLY"),
1149    }
1150
1151    CONFLICT_ACTIONS: OPTIONS_TYPE = dict.fromkeys(
1152        ("ABORT", "FAIL", "IGNORE", "REPLACE", "ROLLBACK", "UPDATE"), tuple()
1153    )
1154    CONFLICT_ACTIONS["DO"] = ("NOTHING", "UPDATE")
1155
1156    CREATE_SEQUENCE: OPTIONS_TYPE = {
1157        "SCALE": ("EXTEND", "NOEXTEND"),
1158        "SHARD": ("EXTEND", "NOEXTEND"),
1159        "NO": ("CYCLE", "CACHE", "MAXVALUE", "MINVALUE"),
1160        **dict.fromkeys(
1161            (
1162                "SESSION",
1163                "GLOBAL",
1164                "KEEP",
1165                "NOKEEP",
1166                "ORDER",
1167                "NOORDER",
1168                "NOCACHE",
1169                "CYCLE",
1170                "NOCYCLE",
1171                "NOMINVALUE",
1172                "NOMAXVALUE",
1173                "NOSCALE",
1174                "NOSHARD",
1175            ),
1176            tuple(),
1177        ),
1178    }
1179
1180    ISOLATED_LOADING_OPTIONS: OPTIONS_TYPE = {"FOR": ("ALL", "INSERT", "NONE")}
1181
1182    USABLES: OPTIONS_TYPE = dict.fromkeys(
1183        ("ROLE", "WAREHOUSE", "DATABASE", "SCHEMA", "CATALOG"), tuple()
1184    )
1185
1186    CAST_ACTIONS: OPTIONS_TYPE = dict.fromkeys(("RENAME", "ADD"), ("FIELDS",))
1187
1188    SCHEMA_BINDING_OPTIONS: OPTIONS_TYPE = {
1189        "TYPE": ("EVOLUTION",),
1190        **dict.fromkeys(("BINDING", "COMPENSATION", "EVOLUTION"), tuple()),
1191    }
1192
1193    KEY_CONSTRAINT_OPTIONS: OPTIONS_TYPE = {
1194        "NOT": ("ENFORCED",),
1195        "MATCH": (
1196            "FULL",
1197            "PARTIAL",
1198            "SIMPLE",
1199        ),
1200        "INITIALLY": ("DEFERRED", "IMMEDIATE"),
1201        **dict.fromkeys(("DEFERRABLE", "NORELY"), tuple()),
1202    }
1203
1204    INSERT_ALTERNATIVES = {"ABORT", "FAIL", "IGNORE", "REPLACE", "ROLLBACK"}
1205
1206    CLONE_KEYWORDS = {"CLONE", "COPY"}
1207    HISTORICAL_DATA_PREFIX = {"AT", "BEFORE", "END"}
1208    HISTORICAL_DATA_KIND = {"TIMESTAMP", "OFFSET", "STATEMENT", "STREAM"}
1209
1210    OPCLASS_FOLLOW_KEYWORDS = {"ASC", "DESC", "NULLS", "WITH"}
1211
1212    OPTYPE_FOLLOW_TOKENS = {TokenType.COMMA, TokenType.R_PAREN}
1213
1214    TABLE_INDEX_HINT_TOKENS = {TokenType.FORCE, TokenType.IGNORE, TokenType.USE}
1215
1216    VIEW_ATTRIBUTES = {"ENCRYPTION", "SCHEMABINDING", "VIEW_METADATA"}
1217
1218    WINDOW_ALIAS_TOKENS = ID_VAR_TOKENS - {TokenType.ROWS}
1219    WINDOW_BEFORE_PAREN_TOKENS = {TokenType.OVER}
1220    WINDOW_SIDES = {"FOLLOWING", "PRECEDING"}
1221
1222    JSON_KEY_VALUE_SEPARATOR_TOKENS = {TokenType.COLON, TokenType.COMMA, TokenType.IS}
1223
1224    FETCH_TOKENS = ID_VAR_TOKENS - {TokenType.ROW, TokenType.ROWS, TokenType.PERCENT}
1225
1226    ADD_CONSTRAINT_TOKENS = {
1227        TokenType.CONSTRAINT,
1228        TokenType.FOREIGN_KEY,
1229        TokenType.INDEX,
1230        TokenType.KEY,
1231        TokenType.PRIMARY_KEY,
1232        TokenType.UNIQUE,
1233    }
1234
1235    DISTINCT_TOKENS = {TokenType.DISTINCT}
1236
1237    NULL_TOKENS = {TokenType.NULL}
1238
1239    UNNEST_OFFSET_ALIAS_TOKENS = ID_VAR_TOKENS - SET_OPERATIONS
1240
1241    SELECT_START_TOKENS = {TokenType.L_PAREN, TokenType.WITH, TokenType.SELECT}
1242
1243    COPY_INTO_VARLEN_OPTIONS = {"FILE_FORMAT", "COPY_OPTIONS", "FORMAT_OPTIONS", "CREDENTIAL"}
1244
1245    STRICT_CAST = True
1246
1247    PREFIXED_PIVOT_COLUMNS = False
1248    IDENTIFY_PIVOT_STRINGS = False
1249
1250    LOG_DEFAULTS_TO_LN = False
1251
1252    # Whether ADD is present for each column added by ALTER TABLE
1253    ALTER_TABLE_ADD_REQUIRED_FOR_EACH_COLUMN = True
1254
1255    # Whether the table sample clause expects CSV syntax
1256    TABLESAMPLE_CSV = False
1257
1258    # The default method used for table sampling
1259    DEFAULT_SAMPLING_METHOD: t.Optional[str] = None
1260
1261    # Whether the SET command needs a delimiter (e.g. "=") for assignments
1262    SET_REQUIRES_ASSIGNMENT_DELIMITER = True
1263
1264    # Whether the TRIM function expects the characters to trim as its first argument
1265    TRIM_PATTERN_FIRST = False
1266
1267    # Whether string aliases are supported `SELECT COUNT(*) 'count'`
1268    STRING_ALIASES = False
1269
1270    # Whether query modifiers such as LIMIT are attached to the UNION node (vs its right operand)
1271    MODIFIERS_ATTACHED_TO_SET_OP = True
1272    SET_OP_MODIFIERS = {"order", "limit", "offset"}
1273
1274    # Whether to parse IF statements that aren't followed by a left parenthesis as commands
1275    NO_PAREN_IF_COMMANDS = True
1276
1277    # Whether the -> and ->> operators expect documents of type JSON (e.g. Postgres)
1278    JSON_ARROWS_REQUIRE_JSON_TYPE = False
1279
1280    # Whether the `:` operator is used to extract a value from a VARIANT column
1281    COLON_IS_VARIANT_EXTRACT = False
1282
1283    # Whether or not a VALUES keyword needs to be followed by '(' to form a VALUES clause.
1284    # If this is True and '(' is not found, the keyword will be treated as an identifier
1285    VALUES_FOLLOWED_BY_PAREN = True
1286
1287    # Whether implicit unnesting is supported, e.g. SELECT 1 FROM y.z AS z, z.a (Redshift)
1288    SUPPORTS_IMPLICIT_UNNEST = False
1289
1290    # Whether or not interval spans are supported, INTERVAL 1 YEAR TO MONTHS
1291    INTERVAL_SPANS = True
1292
1293    # Whether a PARTITION clause can follow a table reference
1294    SUPPORTS_PARTITION_SELECTION = False
1295
1296    __slots__ = (
1297        "error_level",
1298        "error_message_context",
1299        "max_errors",
1300        "dialect",
1301        "sql",
1302        "errors",
1303        "_tokens",
1304        "_index",
1305        "_curr",
1306        "_next",
1307        "_prev",
1308        "_prev_comments",
1309    )
1310
1311    # Autofilled
1312    SHOW_TRIE: t.Dict = {}
1313    SET_TRIE: t.Dict = {}
1314
1315    def __init__(
1316        self,
1317        error_level: t.Optional[ErrorLevel] = None,
1318        error_message_context: int = 100,
1319        max_errors: int = 3,
1320        dialect: DialectType = None,
1321    ):
1322        from sqlglot.dialects import Dialect
1323
1324        self.error_level = error_level or ErrorLevel.IMMEDIATE
1325        self.error_message_context = error_message_context
1326        self.max_errors = max_errors
1327        self.dialect = Dialect.get_or_raise(dialect)
1328        self.reset()
1329
1330    def reset(self):
1331        self.sql = ""
1332        self.errors = []
1333        self._tokens = []
1334        self._index = 0
1335        self._curr = None
1336        self._next = None
1337        self._prev = None
1338        self._prev_comments = None
1339
1340    def parse(
1341        self, raw_tokens: t.List[Token], sql: t.Optional[str] = None
1342    ) -> t.List[t.Optional[exp.Expression]]:
1343        """
1344        Parses a list of tokens and returns a list of syntax trees, one tree
1345        per parsed SQL statement.
1346
1347        Args:
1348            raw_tokens: The list of tokens.
1349            sql: The original SQL string, used to produce helpful debug messages.
1350
1351        Returns:
1352            The list of the produced syntax trees.
1353        """
1354        return self._parse(
1355            parse_method=self.__class__._parse_statement, raw_tokens=raw_tokens, sql=sql
1356        )
1357
1358    def parse_into(
1359        self,
1360        expression_types: exp.IntoType,
1361        raw_tokens: t.List[Token],
1362        sql: t.Optional[str] = None,
1363    ) -> t.List[t.Optional[exp.Expression]]:
1364        """
1365        Parses a list of tokens into a given Expression type. If a collection of Expression
1366        types is given instead, this method will try to parse the token list into each one
1367        of them, stopping at the first for which the parsing succeeds.
1368
1369        Args:
1370            expression_types: The expression type(s) to try and parse the token list into.
1371            raw_tokens: The list of tokens.
1372            sql: The original SQL string, used to produce helpful debug messages.
1373
1374        Returns:
1375            The target Expression.
1376        """
1377        errors = []
1378        for expression_type in ensure_list(expression_types):
1379            parser = self.EXPRESSION_PARSERS.get(expression_type)
1380            if not parser:
1381                raise TypeError(f"No parser registered for {expression_type}")
1382
1383            try:
1384                return self._parse(parser, raw_tokens, sql)
1385            except ParseError as e:
1386                e.errors[0]["into_expression"] = expression_type
1387                errors.append(e)
1388
1389        raise ParseError(
1390            f"Failed to parse '{sql or raw_tokens}' into {expression_types}",
1391            errors=merge_errors(errors),
1392        ) from errors[-1]
1393
1394    def _parse(
1395        self,
1396        parse_method: t.Callable[[Parser], t.Optional[exp.Expression]],
1397        raw_tokens: t.List[Token],
1398        sql: t.Optional[str] = None,
1399    ) -> t.List[t.Optional[exp.Expression]]:
1400        self.reset()
1401        self.sql = sql or ""
1402
1403        total = len(raw_tokens)
1404        chunks: t.List[t.List[Token]] = [[]]
1405
1406        for i, token in enumerate(raw_tokens):
1407            if token.token_type == TokenType.SEMICOLON:
1408                if token.comments:
1409                    chunks.append([token])
1410
1411                if i < total - 1:
1412                    chunks.append([])
1413            else:
1414                chunks[-1].append(token)
1415
1416        expressions = []
1417
1418        for tokens in chunks:
1419            self._index = -1
1420            self._tokens = tokens
1421            self._advance()
1422
1423            expressions.append(parse_method(self))
1424
1425            if self._index < len(self._tokens):
1426                self.raise_error("Invalid expression / Unexpected token")
1427
1428            self.check_errors()
1429
1430        return expressions
1431
1432    def check_errors(self) -> None:
1433        """Logs or raises any found errors, depending on the chosen error level setting."""
1434        if self.error_level == ErrorLevel.WARN:
1435            for error in self.errors:
1436                logger.error(str(error))
1437        elif self.error_level == ErrorLevel.RAISE and self.errors:
1438            raise ParseError(
1439                concat_messages(self.errors, self.max_errors),
1440                errors=merge_errors(self.errors),
1441            )
1442
1443    def raise_error(self, message: str, token: t.Optional[Token] = None) -> None:
1444        """
1445        Appends an error in the list of recorded errors or raises it, depending on the chosen
1446        error level setting.
1447        """
1448        token = token or self._curr or self._prev or Token.string("")
1449        start = token.start
1450        end = token.end + 1
1451        start_context = self.sql[max(start - self.error_message_context, 0) : start]
1452        highlight = self.sql[start:end]
1453        end_context = self.sql[end : end + self.error_message_context]
1454
1455        error = ParseError.new(
1456            f"{message}. Line {token.line}, Col: {token.col}.\n"
1457            f"  {start_context}\033[4m{highlight}\033[0m{end_context}",
1458            description=message,
1459            line=token.line,
1460            col=token.col,
1461            start_context=start_context,
1462            highlight=highlight,
1463            end_context=end_context,
1464        )
1465
1466        if self.error_level == ErrorLevel.IMMEDIATE:
1467            raise error
1468
1469        self.errors.append(error)
1470
1471    def expression(
1472        self, exp_class: t.Type[E], comments: t.Optional[t.List[str]] = None, **kwargs
1473    ) -> E:
1474        """
1475        Creates a new, validated Expression.
1476
1477        Args:
1478            exp_class: The expression class to instantiate.
1479            comments: An optional list of comments to attach to the expression.
1480            kwargs: The arguments to set for the expression along with their respective values.
1481
1482        Returns:
1483            The target expression.
1484        """
1485        instance = exp_class(**kwargs)
1486        instance.add_comments(comments) if comments else self._add_comments(instance)
1487        return self.validate_expression(instance)
1488
1489    def _add_comments(self, expression: t.Optional[exp.Expression]) -> None:
1490        if expression and self._prev_comments:
1491            expression.add_comments(self._prev_comments)
1492            self._prev_comments = None
1493
1494    def validate_expression(self, expression: E, args: t.Optional[t.List] = None) -> E:
1495        """
1496        Validates an Expression, making sure that all its mandatory arguments are set.
1497
1498        Args:
1499            expression: The expression to validate.
1500            args: An optional list of items that was used to instantiate the expression, if it's a Func.
1501
1502        Returns:
1503            The validated expression.
1504        """
1505        if self.error_level != ErrorLevel.IGNORE:
1506            for error_message in expression.error_messages(args):
1507                self.raise_error(error_message)
1508
1509        return expression
1510
1511    def _find_sql(self, start: Token, end: Token) -> str:
1512        return self.sql[start.start : end.end + 1]
1513
1514    def _is_connected(self) -> bool:
1515        return self._prev and self._curr and self._prev.end + 1 == self._curr.start
1516
1517    def _advance(self, times: int = 1) -> None:
1518        self._index += times
1519        self._curr = seq_get(self._tokens, self._index)
1520        self._next = seq_get(self._tokens, self._index + 1)
1521
1522        if self._index > 0:
1523            self._prev = self._tokens[self._index - 1]
1524            self._prev_comments = self._prev.comments
1525        else:
1526            self._prev = None
1527            self._prev_comments = None
1528
1529    def _retreat(self, index: int) -> None:
1530        if index != self._index:
1531            self._advance(index - self._index)
1532
1533    def _warn_unsupported(self) -> None:
1534        if len(self._tokens) <= 1:
1535            return
1536
1537        # We use _find_sql because self.sql may comprise multiple chunks, and we're only
1538        # interested in emitting a warning for the one being currently processed.
1539        sql = self._find_sql(self._tokens[0], self._tokens[-1])[: self.error_message_context]
1540
1541        logger.warning(
1542            f"'{sql}' contains unsupported syntax. Falling back to parsing as a 'Command'."
1543        )
1544
1545    def _parse_command(self) -> exp.Command:
1546        self._warn_unsupported()
1547        return self.expression(
1548            exp.Command,
1549            comments=self._prev_comments,
1550            this=self._prev.text.upper(),
1551            expression=self._parse_string(),
1552        )
1553
1554    def _try_parse(self, parse_method: t.Callable[[], T], retreat: bool = False) -> t.Optional[T]:
1555        """
1556        Attemps to backtrack if a parse function that contains a try/catch internally raises an error.
1557        This behavior can be different depending on the uset-set ErrorLevel, so _try_parse aims to
1558        solve this by setting & resetting the parser state accordingly
1559        """
1560        index = self._index
1561        error_level = self.error_level
1562
1563        self.error_level = ErrorLevel.IMMEDIATE
1564        try:
1565            this = parse_method()
1566        except ParseError:
1567            this = None
1568        finally:
1569            if not this or retreat:
1570                self._retreat(index)
1571            self.error_level = error_level
1572
1573        return this
1574
1575    def _parse_comment(self, allow_exists: bool = True) -> exp.Expression:
1576        start = self._prev
1577        exists = self._parse_exists() if allow_exists else None
1578
1579        self._match(TokenType.ON)
1580
1581        materialized = self._match_text_seq("MATERIALIZED")
1582        kind = self._match_set(self.CREATABLES) and self._prev
1583        if not kind:
1584            return self._parse_as_command(start)
1585
1586        if kind.token_type in (TokenType.FUNCTION, TokenType.PROCEDURE):
1587            this = self._parse_user_defined_function(kind=kind.token_type)
1588        elif kind.token_type == TokenType.TABLE:
1589            this = self._parse_table(alias_tokens=self.COMMENT_TABLE_ALIAS_TOKENS)
1590        elif kind.token_type == TokenType.COLUMN:
1591            this = self._parse_column()
1592        else:
1593            this = self._parse_id_var()
1594
1595        self._match(TokenType.IS)
1596
1597        return self.expression(
1598            exp.Comment,
1599            this=this,
1600            kind=kind.text,
1601            expression=self._parse_string(),
1602            exists=exists,
1603            materialized=materialized,
1604        )
1605
1606    def _parse_to_table(
1607        self,
1608    ) -> exp.ToTableProperty:
1609        table = self._parse_table_parts(schema=True)
1610        return self.expression(exp.ToTableProperty, this=table)
1611
1612    # https://clickhouse.com/docs/en/engines/table-engines/mergetree-family/mergetree#mergetree-table-ttl
1613    def _parse_ttl(self) -> exp.Expression:
1614        def _parse_ttl_action() -> t.Optional[exp.Expression]:
1615            this = self._parse_bitwise()
1616
1617            if self._match_text_seq("DELETE"):
1618                return self.expression(exp.MergeTreeTTLAction, this=this, delete=True)
1619            if self._match_text_seq("RECOMPRESS"):
1620                return self.expression(
1621                    exp.MergeTreeTTLAction, this=this, recompress=self._parse_bitwise()
1622                )
1623            if self._match_text_seq("TO", "DISK"):
1624                return self.expression(
1625                    exp.MergeTreeTTLAction, this=this, to_disk=self._parse_string()
1626                )
1627            if self._match_text_seq("TO", "VOLUME"):
1628                return self.expression(
1629                    exp.MergeTreeTTLAction, this=this, to_volume=self._parse_string()
1630                )
1631
1632            return this
1633
1634        expressions = self._parse_csv(_parse_ttl_action)
1635        where = self._parse_where()
1636        group = self._parse_group()
1637
1638        aggregates = None
1639        if group and self._match(TokenType.SET):
1640            aggregates = self._parse_csv(self._parse_set_item)
1641
1642        return self.expression(
1643            exp.MergeTreeTTL,
1644            expressions=expressions,
1645            where=where,
1646            group=group,
1647            aggregates=aggregates,
1648        )
1649
1650    def _parse_statement(self) -> t.Optional[exp.Expression]:
1651        if self._curr is None:
1652            return None
1653
1654        if self._match_set(self.STATEMENT_PARSERS):
1655            return self.STATEMENT_PARSERS[self._prev.token_type](self)
1656
1657        if self._match_set(self.dialect.tokenizer.COMMANDS):
1658            return self._parse_command()
1659
1660        expression = self._parse_expression()
1661        expression = self._parse_set_operations(expression) if expression else self._parse_select()
1662        return self._parse_query_modifiers(expression)
1663
1664    def _parse_drop(self, exists: bool = False) -> exp.Drop | exp.Command:
1665        start = self._prev
1666        temporary = self._match(TokenType.TEMPORARY)
1667        materialized = self._match_text_seq("MATERIALIZED")
1668
1669        kind = self._match_set(self.CREATABLES) and self._prev.text.upper()
1670        if not kind:
1671            return self._parse_as_command(start)
1672
1673        if_exists = exists or self._parse_exists()
1674        table = self._parse_table_parts(
1675            schema=True, is_db_reference=self._prev.token_type == TokenType.SCHEMA
1676        )
1677
1678        cluster = self._parse_on_property() if self._match(TokenType.ON) else None
1679
1680        if self._match(TokenType.L_PAREN, advance=False):
1681            expressions = self._parse_wrapped_csv(self._parse_types)
1682        else:
1683            expressions = None
1684
1685        return self.expression(
1686            exp.Drop,
1687            comments=start.comments,
1688            exists=if_exists,
1689            this=table,
1690            expressions=expressions,
1691            kind=self.dialect.CREATABLE_KIND_MAPPING.get(kind) or kind,
1692            temporary=temporary,
1693            materialized=materialized,
1694            cascade=self._match_text_seq("CASCADE"),
1695            constraints=self._match_text_seq("CONSTRAINTS"),
1696            purge=self._match_text_seq("PURGE"),
1697            cluster=cluster,
1698        )
1699
1700    def _parse_exists(self, not_: bool = False) -> t.Optional[bool]:
1701        return (
1702            self._match_text_seq("IF")
1703            and (not not_ or self._match(TokenType.NOT))
1704            and self._match(TokenType.EXISTS)
1705        )
1706
1707    def _parse_create(self) -> exp.Create | exp.Command:
1708        # Note: this can't be None because we've matched a statement parser
1709        start = self._prev
1710        comments = self._prev_comments
1711
1712        replace = (
1713            start.token_type == TokenType.REPLACE
1714            or self._match_pair(TokenType.OR, TokenType.REPLACE)
1715            or self._match_pair(TokenType.OR, TokenType.ALTER)
1716        )
1717        refresh = self._match_pair(TokenType.OR, TokenType.REFRESH)
1718
1719        unique = self._match(TokenType.UNIQUE)
1720
1721        if self._match_text_seq("CLUSTERED", "COLUMNSTORE"):
1722            clustered = True
1723        elif self._match_text_seq("NONCLUSTERED", "COLUMNSTORE") or self._match_text_seq(
1724            "COLUMNSTORE"
1725        ):
1726            clustered = False
1727        else:
1728            clustered = None
1729
1730        if self._match_pair(TokenType.TABLE, TokenType.FUNCTION, advance=False):
1731            self._advance()
1732
1733        properties = None
1734        create_token = self._match_set(self.CREATABLES) and self._prev
1735
1736        if not create_token:
1737            # exp.Properties.Location.POST_CREATE
1738            properties = self._parse_properties()
1739            create_token = self._match_set(self.CREATABLES) and self._prev
1740
1741            if not properties or not create_token:
1742                return self._parse_as_command(start)
1743
1744        concurrently = self._match_text_seq("CONCURRENTLY")
1745        exists = self._parse_exists(not_=True)
1746        this = None
1747        expression: t.Optional[exp.Expression] = None
1748        indexes = None
1749        no_schema_binding = None
1750        begin = None
1751        end = None
1752        clone = None
1753
1754        def extend_props(temp_props: t.Optional[exp.Properties]) -> None:
1755            nonlocal properties
1756            if properties and temp_props:
1757                properties.expressions.extend(temp_props.expressions)
1758            elif temp_props:
1759                properties = temp_props
1760
1761        if create_token.token_type in (TokenType.FUNCTION, TokenType.PROCEDURE):
1762            this = self._parse_user_defined_function(kind=create_token.token_type)
1763
1764            # exp.Properties.Location.POST_SCHEMA ("schema" here is the UDF's type signature)
1765            extend_props(self._parse_properties())
1766
1767            expression = self._match(TokenType.ALIAS) and self._parse_heredoc()
1768            extend_props(self._parse_properties())
1769
1770            if not expression:
1771                if self._match(TokenType.COMMAND):
1772                    expression = self._parse_as_command(self._prev)
1773                else:
1774                    begin = self._match(TokenType.BEGIN)
1775                    return_ = self._match_text_seq("RETURN")
1776
1777                    if self._match(TokenType.STRING, advance=False):
1778                        # Takes care of BigQuery's JavaScript UDF definitions that end in an OPTIONS property
1779                        # # https://cloud.google.com/bigquery/docs/reference/standard-sql/data-definition-language#create_function_statement
1780                        expression = self._parse_string()
1781                        extend_props(self._parse_properties())
1782                    else:
1783                        expression = self._parse_statement()
1784
1785                    end = self._match_text_seq("END")
1786
1787                    if return_:
1788                        expression = self.expression(exp.Return, this=expression)
1789        elif create_token.token_type == TokenType.INDEX:
1790            # Postgres allows anonymous indexes, eg. CREATE INDEX IF NOT EXISTS ON t(c)
1791            if not self._match(TokenType.ON):
1792                index = self._parse_id_var()
1793                anonymous = False
1794            else:
1795                index = None
1796                anonymous = True
1797
1798            this = self._parse_index(index=index, anonymous=anonymous)
1799        elif create_token.token_type in self.DB_CREATABLES:
1800            table_parts = self._parse_table_parts(
1801                schema=True, is_db_reference=create_token.token_type == TokenType.SCHEMA
1802            )
1803
1804            # exp.Properties.Location.POST_NAME
1805            self._match(TokenType.COMMA)
1806            extend_props(self._parse_properties(before=True))
1807
1808            this = self._parse_schema(this=table_parts)
1809
1810            # exp.Properties.Location.POST_SCHEMA and POST_WITH
1811            extend_props(self._parse_properties())
1812
1813            self._match(TokenType.ALIAS)
1814            if not self._match_set(self.DDL_SELECT_TOKENS, advance=False):
1815                # exp.Properties.Location.POST_ALIAS
1816                extend_props(self._parse_properties())
1817
1818            if create_token.token_type == TokenType.SEQUENCE:
1819                expression = self._parse_types()
1820                extend_props(self._parse_properties())
1821            else:
1822                expression = self._parse_ddl_select()
1823
1824            if create_token.token_type == TokenType.TABLE:
1825                # exp.Properties.Location.POST_EXPRESSION
1826                extend_props(self._parse_properties())
1827
1828                indexes = []
1829                while True:
1830                    index = self._parse_index()
1831
1832                    # exp.Properties.Location.POST_INDEX
1833                    extend_props(self._parse_properties())
1834                    if not index:
1835                        break
1836                    else:
1837                        self._match(TokenType.COMMA)
1838                        indexes.append(index)
1839            elif create_token.token_type == TokenType.VIEW:
1840                if self._match_text_seq("WITH", "NO", "SCHEMA", "BINDING"):
1841                    no_schema_binding = True
1842
1843            shallow = self._match_text_seq("SHALLOW")
1844
1845            if self._match_texts(self.CLONE_KEYWORDS):
1846                copy = self._prev.text.lower() == "copy"
1847                clone = self.expression(
1848                    exp.Clone, this=self._parse_table(schema=True), shallow=shallow, copy=copy
1849                )
1850
1851        if self._curr and not self._match_set((TokenType.R_PAREN, TokenType.COMMA), advance=False):
1852            return self._parse_as_command(start)
1853
1854        create_kind_text = create_token.text.upper()
1855        return self.expression(
1856            exp.Create,
1857            comments=comments,
1858            this=this,
1859            kind=self.dialect.CREATABLE_KIND_MAPPING.get(create_kind_text) or create_kind_text,
1860            replace=replace,
1861            refresh=refresh,
1862            unique=unique,
1863            expression=expression,
1864            exists=exists,
1865            properties=properties,
1866            indexes=indexes,
1867            no_schema_binding=no_schema_binding,
1868            begin=begin,
1869            end=end,
1870            clone=clone,
1871            concurrently=concurrently,
1872            clustered=clustered,
1873        )
1874
1875    def _parse_sequence_properties(self) -> t.Optional[exp.SequenceProperties]:
1876        seq = exp.SequenceProperties()
1877
1878        options = []
1879        index = self._index
1880
1881        while self._curr:
1882            self._match(TokenType.COMMA)
1883            if self._match_text_seq("INCREMENT"):
1884                self._match_text_seq("BY")
1885                self._match_text_seq("=")
1886                seq.set("increment", self._parse_term())
1887            elif self._match_text_seq("MINVALUE"):
1888                seq.set("minvalue", self._parse_term())
1889            elif self._match_text_seq("MAXVALUE"):
1890                seq.set("maxvalue", self._parse_term())
1891            elif self._match(TokenType.START_WITH) or self._match_text_seq("START"):
1892                self._match_text_seq("=")
1893                seq.set("start", self._parse_term())
1894            elif self._match_text_seq("CACHE"):
1895                # T-SQL allows empty CACHE which is initialized dynamically
1896                seq.set("cache", self._parse_number() or True)
1897            elif self._match_text_seq("OWNED", "BY"):
1898                # "OWNED BY NONE" is the default
1899                seq.set("owned", None if self._match_text_seq("NONE") else self._parse_column())
1900            else:
1901                opt = self._parse_var_from_options(self.CREATE_SEQUENCE, raise_unmatched=False)
1902                if opt:
1903                    options.append(opt)
1904                else:
1905                    break
1906
1907        seq.set("options", options if options else None)
1908        return None if self._index == index else seq
1909
1910    def _parse_property_before(self) -> t.Optional[exp.Expression]:
1911        # only used for teradata currently
1912        self._match(TokenType.COMMA)
1913
1914        kwargs = {
1915            "no": self._match_text_seq("NO"),
1916            "dual": self._match_text_seq("DUAL"),
1917            "before": self._match_text_seq("BEFORE"),
1918            "default": self._match_text_seq("DEFAULT"),
1919            "local": (self._match_text_seq("LOCAL") and "LOCAL")
1920            or (self._match_text_seq("NOT", "LOCAL") and "NOT LOCAL"),
1921            "after": self._match_text_seq("AFTER"),
1922            "minimum": self._match_texts(("MIN", "MINIMUM")),
1923            "maximum": self._match_texts(("MAX", "MAXIMUM")),
1924        }
1925
1926        if self._match_texts(self.PROPERTY_PARSERS):
1927            parser = self.PROPERTY_PARSERS[self._prev.text.upper()]
1928            try:
1929                return parser(self, **{k: v for k, v in kwargs.items() if v})
1930            except TypeError:
1931                self.raise_error(f"Cannot parse property '{self._prev.text}'")
1932
1933        return None
1934
1935    def _parse_wrapped_properties(self) -> t.List[exp.Expression]:
1936        return self._parse_wrapped_csv(self._parse_property)
1937
1938    def _parse_property(self) -> t.Optional[exp.Expression]:
1939        if self._match_texts(self.PROPERTY_PARSERS):
1940            return self.PROPERTY_PARSERS[self._prev.text.upper()](self)
1941
1942        if self._match(TokenType.DEFAULT) and self._match_texts(self.PROPERTY_PARSERS):
1943            return self.PROPERTY_PARSERS[self._prev.text.upper()](self, default=True)
1944
1945        if self._match_text_seq("COMPOUND", "SORTKEY"):
1946            return self._parse_sortkey(compound=True)
1947
1948        if self._match_text_seq("SQL", "SECURITY"):
1949            return self.expression(exp.SqlSecurityProperty, definer=self._match_text_seq("DEFINER"))
1950
1951        index = self._index
1952        key = self._parse_column()
1953
1954        if not self._match(TokenType.EQ):
1955            self._retreat(index)
1956            return self._parse_sequence_properties()
1957
1958        # Transform the key to exp.Dot if it's dotted identifiers wrapped in exp.Column or to exp.Var otherwise
1959        if isinstance(key, exp.Column):
1960            key = key.to_dot() if len(key.parts) > 1 else exp.var(key.name)
1961
1962        value = self._parse_bitwise() or self._parse_var(any_token=True)
1963
1964        # Transform the value to exp.Var if it was parsed as exp.Column(exp.Identifier())
1965        if isinstance(value, exp.Column):
1966            value = exp.var(value.name)
1967
1968        return self.expression(exp.Property, this=key, value=value)
1969
1970    def _parse_stored(self) -> exp.FileFormatProperty:
1971        self._match(TokenType.ALIAS)
1972
1973        input_format = self._parse_string() if self._match_text_seq("INPUTFORMAT") else None
1974        output_format = self._parse_string() if self._match_text_seq("OUTPUTFORMAT") else None
1975
1976        return self.expression(
1977            exp.FileFormatProperty,
1978            this=(
1979                self.expression(
1980                    exp.InputOutputFormat, input_format=input_format, output_format=output_format
1981                )
1982                if input_format or output_format
1983                else self._parse_var_or_string() or self._parse_number() or self._parse_id_var()
1984            ),
1985        )
1986
1987    def _parse_unquoted_field(self) -> t.Optional[exp.Expression]:
1988        field = self._parse_field()
1989        if isinstance(field, exp.Identifier) and not field.quoted:
1990            field = exp.var(field)
1991
1992        return field
1993
1994    def _parse_property_assignment(self, exp_class: t.Type[E], **kwargs: t.Any) -> E:
1995        self._match(TokenType.EQ)
1996        self._match(TokenType.ALIAS)
1997
1998        return self.expression(exp_class, this=self._parse_unquoted_field(), **kwargs)
1999
2000    def _parse_properties(self, before: t.Optional[bool] = None) -> t.Optional[exp.Properties]:
2001        properties = []
2002        while True:
2003            if before:
2004                prop = self._parse_property_before()
2005            else:
2006                prop = self._parse_property()
2007            if not prop:
2008                break
2009            for p in ensure_list(prop):
2010                properties.append(p)
2011
2012        if properties:
2013            return self.expression(exp.Properties, expressions=properties)
2014
2015        return None
2016
2017    def _parse_fallback(self, no: bool = False) -> exp.FallbackProperty:
2018        return self.expression(
2019            exp.FallbackProperty, no=no, protection=self._match_text_seq("PROTECTION")
2020        )
2021
2022    def _parse_settings_property(self) -> exp.SettingsProperty:
2023        return self.expression(
2024            exp.SettingsProperty, expressions=self._parse_csv(self._parse_assignment)
2025        )
2026
2027    def _parse_volatile_property(self) -> exp.VolatileProperty | exp.StabilityProperty:
2028        if self._index >= 2:
2029            pre_volatile_token = self._tokens[self._index - 2]
2030        else:
2031            pre_volatile_token = None
2032
2033        if pre_volatile_token and pre_volatile_token.token_type in self.PRE_VOLATILE_TOKENS:
2034            return exp.VolatileProperty()
2035
2036        return self.expression(exp.StabilityProperty, this=exp.Literal.string("VOLATILE"))
2037
2038    def _parse_retention_period(self) -> exp.Var:
2039        # Parse TSQL's HISTORY_RETENTION_PERIOD: {INFINITE | <number> DAY | DAYS | MONTH ...}
2040        number = self._parse_number()
2041        number_str = f"{number} " if number else ""
2042        unit = self._parse_var(any_token=True)
2043        return exp.var(f"{number_str}{unit}")
2044
2045    def _parse_system_versioning_property(
2046        self, with_: bool = False
2047    ) -> exp.WithSystemVersioningProperty:
2048        self._match(TokenType.EQ)
2049        prop = self.expression(
2050            exp.WithSystemVersioningProperty,
2051            **{  # type: ignore
2052                "on": True,
2053                "with": with_,
2054            },
2055        )
2056
2057        if self._match_text_seq("OFF"):
2058            prop.set("on", False)
2059            return prop
2060
2061        self._match(TokenType.ON)
2062        if self._match(TokenType.L_PAREN):
2063            while self._curr and not self._match(TokenType.R_PAREN):
2064                if self._match_text_seq("HISTORY_TABLE", "="):
2065                    prop.set("this", self._parse_table_parts())
2066                elif self._match_text_seq("DATA_CONSISTENCY_CHECK", "="):
2067                    prop.set("data_consistency", self._advance_any() and self._prev.text.upper())
2068                elif self._match_text_seq("HISTORY_RETENTION_PERIOD", "="):
2069                    prop.set("retention_period", self._parse_retention_period())
2070
2071                self._match(TokenType.COMMA)
2072
2073        return prop
2074
2075    def _parse_data_deletion_property(self) -> exp.DataDeletionProperty:
2076        self._match(TokenType.EQ)
2077        on = self._match_text_seq("ON") or not self._match_text_seq("OFF")
2078        prop = self.expression(exp.DataDeletionProperty, on=on)
2079
2080        if self._match(TokenType.L_PAREN):
2081            while self._curr and not self._match(TokenType.R_PAREN):
2082                if self._match_text_seq("FILTER_COLUMN", "="):
2083                    prop.set("filter_column", self._parse_column())
2084                elif self._match_text_seq("RETENTION_PERIOD", "="):
2085                    prop.set("retention_period", self._parse_retention_period())
2086
2087                self._match(TokenType.COMMA)
2088
2089        return prop
2090
2091    def _parse_with_property(self) -> t.Optional[exp.Expression] | t.List[exp.Expression]:
2092        if self._match_text_seq("(", "SYSTEM_VERSIONING"):
2093            prop = self._parse_system_versioning_property(with_=True)
2094            self._match_r_paren()
2095            return prop
2096
2097        if self._match(TokenType.L_PAREN, advance=False):
2098            return self._parse_wrapped_properties()
2099
2100        if self._match_text_seq("JOURNAL"):
2101            return self._parse_withjournaltable()
2102
2103        if self._match_texts(self.VIEW_ATTRIBUTES):
2104            return self.expression(exp.ViewAttributeProperty, this=self._prev.text.upper())
2105
2106        if self._match_text_seq("DATA"):
2107            return self._parse_withdata(no=False)
2108        elif self._match_text_seq("NO", "DATA"):
2109            return self._parse_withdata(no=True)
2110
2111        if self._match(TokenType.SERDE_PROPERTIES, advance=False):
2112            return self._parse_serde_properties(with_=True)
2113
2114        if self._match(TokenType.SCHEMA):
2115            return self.expression(
2116                exp.WithSchemaBindingProperty,
2117                this=self._parse_var_from_options(self.SCHEMA_BINDING_OPTIONS),
2118            )
2119
2120        if not self._next:
2121            return None
2122
2123        return self._parse_withisolatedloading()
2124
2125    # https://dev.mysql.com/doc/refman/8.0/en/create-view.html
2126    def _parse_definer(self) -> t.Optional[exp.DefinerProperty]:
2127        self._match(TokenType.EQ)
2128
2129        user = self._parse_id_var()
2130        self._match(TokenType.PARAMETER)
2131        host = self._parse_id_var() or (self._match(TokenType.MOD) and self._prev.text)
2132
2133        if not user or not host:
2134            return None
2135
2136        return exp.DefinerProperty(this=f"{user}@{host}")
2137
2138    def _parse_withjournaltable(self) -> exp.WithJournalTableProperty:
2139        self._match(TokenType.TABLE)
2140        self._match(TokenType.EQ)
2141        return self.expression(exp.WithJournalTableProperty, this=self._parse_table_parts())
2142
2143    def _parse_log(self, no: bool = False) -> exp.LogProperty:
2144        return self.expression(exp.LogProperty, no=no)
2145
2146    def _parse_journal(self, **kwargs) -> exp.JournalProperty:
2147        return self.expression(exp.JournalProperty, **kwargs)
2148
2149    def _parse_checksum(self) -> exp.ChecksumProperty:
2150        self._match(TokenType.EQ)
2151
2152        on = None
2153        if self._match(TokenType.ON):
2154            on = True
2155        elif self._match_text_seq("OFF"):
2156            on = False
2157
2158        return self.expression(exp.ChecksumProperty, on=on, default=self._match(TokenType.DEFAULT))
2159
2160    def _parse_cluster(self, wrapped: bool = False) -> exp.Cluster:
2161        return self.expression(
2162            exp.Cluster,
2163            expressions=(
2164                self._parse_wrapped_csv(self._parse_ordered)
2165                if wrapped
2166                else self._parse_csv(self._parse_ordered)
2167            ),
2168        )
2169
2170    def _parse_clustered_by(self) -> exp.ClusteredByProperty:
2171        self._match_text_seq("BY")
2172
2173        self._match_l_paren()
2174        expressions = self._parse_csv(self._parse_column)
2175        self._match_r_paren()
2176
2177        if self._match_text_seq("SORTED", "BY"):
2178            self._match_l_paren()
2179            sorted_by = self._parse_csv(self._parse_ordered)
2180            self._match_r_paren()
2181        else:
2182            sorted_by = None
2183
2184        self._match(TokenType.INTO)
2185        buckets = self._parse_number()
2186        self._match_text_seq("BUCKETS")
2187
2188        return self.expression(
2189            exp.ClusteredByProperty,
2190            expressions=expressions,
2191            sorted_by=sorted_by,
2192            buckets=buckets,
2193        )
2194
2195    def _parse_copy_property(self) -> t.Optional[exp.CopyGrantsProperty]:
2196        if not self._match_text_seq("GRANTS"):
2197            self._retreat(self._index - 1)
2198            return None
2199
2200        return self.expression(exp.CopyGrantsProperty)
2201
2202    def _parse_freespace(self) -> exp.FreespaceProperty:
2203        self._match(TokenType.EQ)
2204        return self.expression(
2205            exp.FreespaceProperty, this=self._parse_number(), percent=self._match(TokenType.PERCENT)
2206        )
2207
2208    def _parse_mergeblockratio(
2209        self, no: bool = False, default: bool = False
2210    ) -> exp.MergeBlockRatioProperty:
2211        if self._match(TokenType.EQ):
2212            return self.expression(
2213                exp.MergeBlockRatioProperty,
2214                this=self._parse_number(),
2215                percent=self._match(TokenType.PERCENT),
2216            )
2217
2218        return self.expression(exp.MergeBlockRatioProperty, no=no, default=default)
2219
2220    def _parse_datablocksize(
2221        self,
2222        default: t.Optional[bool] = None,
2223        minimum: t.Optional[bool] = None,
2224        maximum: t.Optional[bool] = None,
2225    ) -> exp.DataBlocksizeProperty:
2226        self._match(TokenType.EQ)
2227        size = self._parse_number()
2228
2229        units = None
2230        if self._match_texts(("BYTES", "KBYTES", "KILOBYTES")):
2231            units = self._prev.text
2232
2233        return self.expression(
2234            exp.DataBlocksizeProperty,
2235            size=size,
2236            units=units,
2237            default=default,
2238            minimum=minimum,
2239            maximum=maximum,
2240        )
2241
2242    def _parse_blockcompression(self) -> exp.BlockCompressionProperty:
2243        self._match(TokenType.EQ)
2244        always = self._match_text_seq("ALWAYS")
2245        manual = self._match_text_seq("MANUAL")
2246        never = self._match_text_seq("NEVER")
2247        default = self._match_text_seq("DEFAULT")
2248
2249        autotemp = None
2250        if self._match_text_seq("AUTOTEMP"):
2251            autotemp = self._parse_schema()
2252
2253        return self.expression(
2254            exp.BlockCompressionProperty,
2255            always=always,
2256            manual=manual,
2257            never=never,
2258            default=default,
2259            autotemp=autotemp,
2260        )
2261
2262    def _parse_withisolatedloading(self) -> t.Optional[exp.IsolatedLoadingProperty]:
2263        index = self._index
2264        no = self._match_text_seq("NO")
2265        concurrent = self._match_text_seq("CONCURRENT")
2266
2267        if not self._match_text_seq("ISOLATED", "LOADING"):
2268            self._retreat(index)
2269            return None
2270
2271        target = self._parse_var_from_options(self.ISOLATED_LOADING_OPTIONS, raise_unmatched=False)
2272        return self.expression(
2273            exp.IsolatedLoadingProperty, no=no, concurrent=concurrent, target=target
2274        )
2275
2276    def _parse_locking(self) -> exp.LockingProperty:
2277        if self._match(TokenType.TABLE):
2278            kind = "TABLE"
2279        elif self._match(TokenType.VIEW):
2280            kind = "VIEW"
2281        elif self._match(TokenType.ROW):
2282            kind = "ROW"
2283        elif self._match_text_seq("DATABASE"):
2284            kind = "DATABASE"
2285        else:
2286            kind = None
2287
2288        if kind in ("DATABASE", "TABLE", "VIEW"):
2289            this = self._parse_table_parts()
2290        else:
2291            this = None
2292
2293        if self._match(TokenType.FOR):
2294            for_or_in = "FOR"
2295        elif self._match(TokenType.IN):
2296            for_or_in = "IN"
2297        else:
2298            for_or_in = None
2299
2300        if self._match_text_seq("ACCESS"):
2301            lock_type = "ACCESS"
2302        elif self._match_texts(("EXCL", "EXCLUSIVE")):
2303            lock_type = "EXCLUSIVE"
2304        elif self._match_text_seq("SHARE"):
2305            lock_type = "SHARE"
2306        elif self._match_text_seq("READ"):
2307            lock_type = "READ"
2308        elif self._match_text_seq("WRITE"):
2309            lock_type = "WRITE"
2310        elif self._match_text_seq("CHECKSUM"):
2311            lock_type = "CHECKSUM"
2312        else:
2313            lock_type = None
2314
2315        override = self._match_text_seq("OVERRIDE")
2316
2317        return self.expression(
2318            exp.LockingProperty,
2319            this=this,
2320            kind=kind,
2321            for_or_in=for_or_in,
2322            lock_type=lock_type,
2323            override=override,
2324        )
2325
2326    def _parse_partition_by(self) -> t.List[exp.Expression]:
2327        if self._match(TokenType.PARTITION_BY):
2328            return self._parse_csv(self._parse_assignment)
2329        return []
2330
2331    def _parse_partition_bound_spec(self) -> exp.PartitionBoundSpec:
2332        def _parse_partition_bound_expr() -> t.Optional[exp.Expression]:
2333            if self._match_text_seq("MINVALUE"):
2334                return exp.var("MINVALUE")
2335            if self._match_text_seq("MAXVALUE"):
2336                return exp.var("MAXVALUE")
2337            return self._parse_bitwise()
2338
2339        this: t.Optional[exp.Expression | t.List[exp.Expression]] = None
2340        expression = None
2341        from_expressions = None
2342        to_expressions = None
2343
2344        if self._match(TokenType.IN):
2345            this = self._parse_wrapped_csv(self._parse_bitwise)
2346        elif self._match(TokenType.FROM):
2347            from_expressions = self._parse_wrapped_csv(_parse_partition_bound_expr)
2348            self._match_text_seq("TO")
2349            to_expressions = self._parse_wrapped_csv(_parse_partition_bound_expr)
2350        elif self._match_text_seq("WITH", "(", "MODULUS"):
2351            this = self._parse_number()
2352            self._match_text_seq(",", "REMAINDER")
2353            expression = self._parse_number()
2354            self._match_r_paren()
2355        else:
2356            self.raise_error("Failed to parse partition bound spec.")
2357
2358        return self.expression(
2359            exp.PartitionBoundSpec,
2360            this=this,
2361            expression=expression,
2362            from_expressions=from_expressions,
2363            to_expressions=to_expressions,
2364        )
2365
2366    # https://www.postgresql.org/docs/current/sql-createtable.html
2367    def _parse_partitioned_of(self) -> t.Optional[exp.PartitionedOfProperty]:
2368        if not self._match_text_seq("OF"):
2369            self._retreat(self._index - 1)
2370            return None
2371
2372        this = self._parse_table(schema=True)
2373
2374        if self._match(TokenType.DEFAULT):
2375            expression: exp.Var | exp.PartitionBoundSpec = exp.var("DEFAULT")
2376        elif self._match_text_seq("FOR", "VALUES"):
2377            expression = self._parse_partition_bound_spec()
2378        else:
2379            self.raise_error("Expecting either DEFAULT or FOR VALUES clause.")
2380
2381        return self.expression(exp.PartitionedOfProperty, this=this, expression=expression)
2382
2383    def _parse_partitioned_by(self) -> exp.PartitionedByProperty:
2384        self._match(TokenType.EQ)
2385        return self.expression(
2386            exp.PartitionedByProperty,
2387            this=self._parse_schema() or self._parse_bracket(self._parse_field()),
2388        )
2389
2390    def _parse_withdata(self, no: bool = False) -> exp.WithDataProperty:
2391        if self._match_text_seq("AND", "STATISTICS"):
2392            statistics = True
2393        elif self._match_text_seq("AND", "NO", "STATISTICS"):
2394            statistics = False
2395        else:
2396            statistics = None
2397
2398        return self.expression(exp.WithDataProperty, no=no, statistics=statistics)
2399
2400    def _parse_contains_property(self) -> t.Optional[exp.SqlReadWriteProperty]:
2401        if self._match_text_seq("SQL"):
2402            return self.expression(exp.SqlReadWriteProperty, this="CONTAINS SQL")
2403        return None
2404
2405    def _parse_modifies_property(self) -> t.Optional[exp.SqlReadWriteProperty]:
2406        if self._match_text_seq("SQL", "DATA"):
2407            return self.expression(exp.SqlReadWriteProperty, this="MODIFIES SQL DATA")
2408        return None
2409
2410    def _parse_no_property(self) -> t.Optional[exp.Expression]:
2411        if self._match_text_seq("PRIMARY", "INDEX"):
2412            return exp.NoPrimaryIndexProperty()
2413        if self._match_text_seq("SQL"):
2414            return self.expression(exp.SqlReadWriteProperty, this="NO SQL")
2415        return None
2416
2417    def _parse_on_property(self) -> t.Optional[exp.Expression]:
2418        if self._match_text_seq("COMMIT", "PRESERVE", "ROWS"):
2419            return exp.OnCommitProperty()
2420        if self._match_text_seq("COMMIT", "DELETE", "ROWS"):
2421            return exp.OnCommitProperty(delete=True)
2422        return self.expression(exp.OnProperty, this=self._parse_schema(self._parse_id_var()))
2423
2424    def _parse_reads_property(self) -> t.Optional[exp.SqlReadWriteProperty]:
2425        if self._match_text_seq("SQL", "DATA"):
2426            return self.expression(exp.SqlReadWriteProperty, this="READS SQL DATA")
2427        return None
2428
2429    def _parse_distkey(self) -> exp.DistKeyProperty:
2430        return self.expression(exp.DistKeyProperty, this=self._parse_wrapped(self._parse_id_var))
2431
2432    def _parse_create_like(self) -> t.Optional[exp.LikeProperty]:
2433        table = self._parse_table(schema=True)
2434
2435        options = []
2436        while self._match_texts(("INCLUDING", "EXCLUDING")):
2437            this = self._prev.text.upper()
2438
2439            id_var = self._parse_id_var()
2440            if not id_var:
2441                return None
2442
2443            options.append(
2444                self.expression(exp.Property, this=this, value=exp.var(id_var.this.upper()))
2445            )
2446
2447        return self.expression(exp.LikeProperty, this=table, expressions=options)
2448
2449    def _parse_sortkey(self, compound: bool = False) -> exp.SortKeyProperty:
2450        return self.expression(
2451            exp.SortKeyProperty, this=self._parse_wrapped_id_vars(), compound=compound
2452        )
2453
2454    def _parse_character_set(self, default: bool = False) -> exp.CharacterSetProperty:
2455        self._match(TokenType.EQ)
2456        return self.expression(
2457            exp.CharacterSetProperty, this=self._parse_var_or_string(), default=default
2458        )
2459
2460    def _parse_remote_with_connection(self) -> exp.RemoteWithConnectionModelProperty:
2461        self._match_text_seq("WITH", "CONNECTION")
2462        return self.expression(
2463            exp.RemoteWithConnectionModelProperty, this=self._parse_table_parts()
2464        )
2465
2466    def _parse_returns(self) -> exp.ReturnsProperty:
2467        value: t.Optional[exp.Expression]
2468        null = None
2469        is_table = self._match(TokenType.TABLE)
2470
2471        if is_table:
2472            if self._match(TokenType.LT):
2473                value = self.expression(
2474                    exp.Schema,
2475                    this="TABLE",
2476                    expressions=self._parse_csv(self._parse_struct_types),
2477                )
2478                if not self._match(TokenType.GT):
2479                    self.raise_error("Expecting >")
2480            else:
2481                value = self._parse_schema(exp.var("TABLE"))
2482        elif self._match_text_seq("NULL", "ON", "NULL", "INPUT"):
2483            null = True
2484            value = None
2485        else:
2486            value = self._parse_types()
2487
2488        return self.expression(exp.ReturnsProperty, this=value, is_table=is_table, null=null)
2489
2490    def _parse_describe(self) -> exp.Describe:
2491        kind = self._match_set(self.CREATABLES) and self._prev.text
2492        style = self._match_texts(("EXTENDED", "FORMATTED", "HISTORY")) and self._prev.text.upper()
2493        if self._match(TokenType.DOT):
2494            style = None
2495            self._retreat(self._index - 2)
2496        this = self._parse_table(schema=True)
2497        properties = self._parse_properties()
2498        expressions = properties.expressions if properties else None
2499        partition = self._parse_partition()
2500        return self.expression(
2501            exp.Describe,
2502            this=this,
2503            style=style,
2504            kind=kind,
2505            expressions=expressions,
2506            partition=partition,
2507        )
2508
2509    def _parse_insert(self) -> exp.Insert:
2510        comments = ensure_list(self._prev_comments)
2511        hint = self._parse_hint()
2512        overwrite = self._match(TokenType.OVERWRITE)
2513        ignore = self._match(TokenType.IGNORE)
2514        local = self._match_text_seq("LOCAL")
2515        alternative = None
2516        is_function = None
2517
2518        if self._match_text_seq("DIRECTORY"):
2519            this: t.Optional[exp.Expression] = self.expression(
2520                exp.Directory,
2521                this=self._parse_var_or_string(),
2522                local=local,
2523                row_format=self._parse_row_format(match_row=True),
2524            )
2525        else:
2526            if self._match(TokenType.OR):
2527                alternative = self._match_texts(self.INSERT_ALTERNATIVES) and self._prev.text
2528
2529            self._match(TokenType.INTO)
2530            comments += ensure_list(self._prev_comments)
2531            self._match(TokenType.TABLE)
2532            is_function = self._match(TokenType.FUNCTION)
2533
2534            this = (
2535                self._parse_table(schema=True, parse_partition=True)
2536                if not is_function
2537                else self._parse_function()
2538            )
2539
2540        returning = self._parse_returning()
2541
2542        return self.expression(
2543            exp.Insert,
2544            comments=comments,
2545            hint=hint,
2546            is_function=is_function,
2547            this=this,
2548            stored=self._match_text_seq("STORED") and self._parse_stored(),
2549            by_name=self._match_text_seq("BY", "NAME"),
2550            exists=self._parse_exists(),
2551            where=self._match_pair(TokenType.REPLACE, TokenType.WHERE) and self._parse_assignment(),
2552            partition=self._match(TokenType.PARTITION_BY) and self._parse_partitioned_by(),
2553            settings=self._match_text_seq("SETTINGS") and self._parse_settings_property(),
2554            expression=self._parse_derived_table_values() or self._parse_ddl_select(),
2555            conflict=self._parse_on_conflict(),
2556            returning=returning or self._parse_returning(),
2557            overwrite=overwrite,
2558            alternative=alternative,
2559            ignore=ignore,
2560        )
2561
2562    def _parse_kill(self) -> exp.Kill:
2563        kind = exp.var(self._prev.text) if self._match_texts(("CONNECTION", "QUERY")) else None
2564
2565        return self.expression(
2566            exp.Kill,
2567            this=self._parse_primary(),
2568            kind=kind,
2569        )
2570
2571    def _parse_on_conflict(self) -> t.Optional[exp.OnConflict]:
2572        conflict = self._match_text_seq("ON", "CONFLICT")
2573        duplicate = self._match_text_seq("ON", "DUPLICATE", "KEY")
2574
2575        if not conflict and not duplicate:
2576            return None
2577
2578        conflict_keys = None
2579        constraint = None
2580
2581        if conflict:
2582            if self._match_text_seq("ON", "CONSTRAINT"):
2583                constraint = self._parse_id_var()
2584            elif self._match(TokenType.L_PAREN):
2585                conflict_keys = self._parse_csv(self._parse_id_var)
2586                self._match_r_paren()
2587
2588        action = self._parse_var_from_options(self.CONFLICT_ACTIONS)
2589        if self._prev.token_type == TokenType.UPDATE:
2590            self._match(TokenType.SET)
2591            expressions = self._parse_csv(self._parse_equality)
2592        else:
2593            expressions = None
2594
2595        return self.expression(
2596            exp.OnConflict,
2597            duplicate=duplicate,
2598            expressions=expressions,
2599            action=action,
2600            conflict_keys=conflict_keys,
2601            constraint=constraint,
2602        )
2603
2604    def _parse_returning(self) -> t.Optional[exp.Returning]:
2605        if not self._match(TokenType.RETURNING):
2606            return None
2607        return self.expression(
2608            exp.Returning,
2609            expressions=self._parse_csv(self._parse_expression),
2610            into=self._match(TokenType.INTO) and self._parse_table_part(),
2611        )
2612
2613    def _parse_row(self) -> t.Optional[exp.RowFormatSerdeProperty | exp.RowFormatDelimitedProperty]:
2614        if not self._match(TokenType.FORMAT):
2615            return None
2616        return self._parse_row_format()
2617
2618    def _parse_serde_properties(self, with_: bool = False) -> t.Optional[exp.SerdeProperties]:
2619        index = self._index
2620        with_ = with_ or self._match_text_seq("WITH")
2621
2622        if not self._match(TokenType.SERDE_PROPERTIES):
2623            self._retreat(index)
2624            return None
2625        return self.expression(
2626            exp.SerdeProperties,
2627            **{  # type: ignore
2628                "expressions": self._parse_wrapped_properties(),
2629                "with": with_,
2630            },
2631        )
2632
2633    def _parse_row_format(
2634        self, match_row: bool = False
2635    ) -> t.Optional[exp.RowFormatSerdeProperty | exp.RowFormatDelimitedProperty]:
2636        if match_row and not self._match_pair(TokenType.ROW, TokenType.FORMAT):
2637            return None
2638
2639        if self._match_text_seq("SERDE"):
2640            this = self._parse_string()
2641
2642            serde_properties = self._parse_serde_properties()
2643
2644            return self.expression(
2645                exp.RowFormatSerdeProperty, this=this, serde_properties=serde_properties
2646            )
2647
2648        self._match_text_seq("DELIMITED")
2649
2650        kwargs = {}
2651
2652        if self._match_text_seq("FIELDS", "TERMINATED", "BY"):
2653            kwargs["fields"] = self._parse_string()
2654            if self._match_text_seq("ESCAPED", "BY"):
2655                kwargs["escaped"] = self._parse_string()
2656        if self._match_text_seq("COLLECTION", "ITEMS", "TERMINATED", "BY"):
2657            kwargs["collection_items"] = self._parse_string()
2658        if self._match_text_seq("MAP", "KEYS", "TERMINATED", "BY"):
2659            kwargs["map_keys"] = self._parse_string()
2660        if self._match_text_seq("LINES", "TERMINATED", "BY"):
2661            kwargs["lines"] = self._parse_string()
2662        if self._match_text_seq("NULL", "DEFINED", "AS"):
2663            kwargs["null"] = self._parse_string()
2664
2665        return self.expression(exp.RowFormatDelimitedProperty, **kwargs)  # type: ignore
2666
2667    def _parse_load(self) -> exp.LoadData | exp.Command:
2668        if self._match_text_seq("DATA"):
2669            local = self._match_text_seq("LOCAL")
2670            self._match_text_seq("INPATH")
2671            inpath = self._parse_string()
2672            overwrite = self._match(TokenType.OVERWRITE)
2673            self._match_pair(TokenType.INTO, TokenType.TABLE)
2674
2675            return self.expression(
2676                exp.LoadData,
2677                this=self._parse_table(schema=True),
2678                local=local,
2679                overwrite=overwrite,
2680                inpath=inpath,
2681                partition=self._parse_partition(),
2682                input_format=self._match_text_seq("INPUTFORMAT") and self._parse_string(),
2683                serde=self._match_text_seq("SERDE") and self._parse_string(),
2684            )
2685        return self._parse_as_command(self._prev)
2686
2687    def _parse_delete(self) -> exp.Delete:
2688        # This handles MySQL's "Multiple-Table Syntax"
2689        # https://dev.mysql.com/doc/refman/8.0/en/delete.html
2690        tables = None
2691        comments = self._prev_comments
2692        if not self._match(TokenType.FROM, advance=False):
2693            tables = self._parse_csv(self._parse_table) or None
2694
2695        returning = self._parse_returning()
2696
2697        return self.expression(
2698            exp.Delete,
2699            comments=comments,
2700            tables=tables,
2701            this=self._match(TokenType.FROM) and self._parse_table(joins=True),
2702            using=self._match(TokenType.USING) and self._parse_table(joins=True),
2703            where=self._parse_where(),
2704            returning=returning or self._parse_returning(),
2705            limit=self._parse_limit(),
2706        )
2707
2708    def _parse_update(self) -> exp.Update:
2709        comments = self._prev_comments
2710        this = self._parse_table(joins=True, alias_tokens=self.UPDATE_ALIAS_TOKENS)
2711        expressions = self._match(TokenType.SET) and self._parse_csv(self._parse_equality)
2712        returning = self._parse_returning()
2713        return self.expression(
2714            exp.Update,
2715            comments=comments,
2716            **{  # type: ignore
2717                "this": this,
2718                "expressions": expressions,
2719                "from": self._parse_from(joins=True),
2720                "where": self._parse_where(),
2721                "returning": returning or self._parse_returning(),
2722                "order": self._parse_order(),
2723                "limit": self._parse_limit(),
2724            },
2725        )
2726
2727    def _parse_uncache(self) -> exp.Uncache:
2728        if not self._match(TokenType.TABLE):
2729            self.raise_error("Expecting TABLE after UNCACHE")
2730
2731        return self.expression(
2732            exp.Uncache, exists=self._parse_exists(), this=self._parse_table(schema=True)
2733        )
2734
2735    def _parse_cache(self) -> exp.Cache:
2736        lazy = self._match_text_seq("LAZY")
2737        self._match(TokenType.TABLE)
2738        table = self._parse_table(schema=True)
2739
2740        options = []
2741        if self._match_text_seq("OPTIONS"):
2742            self._match_l_paren()
2743            k = self._parse_string()
2744            self._match(TokenType.EQ)
2745            v = self._parse_string()
2746            options = [k, v]
2747            self._match_r_paren()
2748
2749        self._match(TokenType.ALIAS)
2750        return self.expression(
2751            exp.Cache,
2752            this=table,
2753            lazy=lazy,
2754            options=options,
2755            expression=self._parse_select(nested=True),
2756        )
2757
2758    def _parse_partition(self) -> t.Optional[exp.Partition]:
2759        if not self._match(TokenType.PARTITION):
2760            return None
2761
2762        return self.expression(
2763            exp.Partition, expressions=self._parse_wrapped_csv(self._parse_assignment)
2764        )
2765
2766    def _parse_value(self) -> t.Optional[exp.Tuple]:
2767        if self._match(TokenType.L_PAREN):
2768            expressions = self._parse_csv(self._parse_expression)
2769            self._match_r_paren()
2770            return self.expression(exp.Tuple, expressions=expressions)
2771
2772        # In some dialects we can have VALUES 1, 2 which results in 1 column & 2 rows.
2773        expression = self._parse_expression()
2774        if expression:
2775            return self.expression(exp.Tuple, expressions=[expression])
2776        return None
2777
2778    def _parse_projections(self) -> t.List[exp.Expression]:
2779        return self._parse_expressions()
2780
2781    def _parse_select(
2782        self,
2783        nested: bool = False,
2784        table: bool = False,
2785        parse_subquery_alias: bool = True,
2786        parse_set_operation: bool = True,
2787    ) -> t.Optional[exp.Expression]:
2788        cte = self._parse_with()
2789
2790        if cte:
2791            this = self._parse_statement()
2792
2793            if not this:
2794                self.raise_error("Failed to parse any statement following CTE")
2795                return cte
2796
2797            if "with" in this.arg_types:
2798                this.set("with", cte)
2799            else:
2800                self.raise_error(f"{this.key} does not support CTE")
2801                this = cte
2802
2803            return this
2804
2805        # duckdb supports leading with FROM x
2806        from_ = self._parse_from() if self._match(TokenType.FROM, advance=False) else None
2807
2808        if self._match(TokenType.SELECT):
2809            comments = self._prev_comments
2810
2811            hint = self._parse_hint()
2812
2813            if self._next and not self._next.token_type == TokenType.DOT:
2814                all_ = self._match(TokenType.ALL)
2815                distinct = self._match_set(self.DISTINCT_TOKENS)
2816            else:
2817                all_, distinct = None, None
2818
2819            kind = (
2820                self._match(TokenType.ALIAS)
2821                and self._match_texts(("STRUCT", "VALUE"))
2822                and self._prev.text.upper()
2823            )
2824
2825            if distinct:
2826                distinct = self.expression(
2827                    exp.Distinct,
2828                    on=self._parse_value() if self._match(TokenType.ON) else None,
2829                )
2830
2831            if all_ and distinct:
2832                self.raise_error("Cannot specify both ALL and DISTINCT after SELECT")
2833
2834            limit = self._parse_limit(top=True)
2835            projections = self._parse_projections()
2836
2837            this = self.expression(
2838                exp.Select,
2839                kind=kind,
2840                hint=hint,
2841                distinct=distinct,
2842                expressions=projections,
2843                limit=limit,
2844            )
2845            this.comments = comments
2846
2847            into = self._parse_into()
2848            if into:
2849                this.set("into", into)
2850
2851            if not from_:
2852                from_ = self._parse_from()
2853
2854            if from_:
2855                this.set("from", from_)
2856
2857            this = self._parse_query_modifiers(this)
2858        elif (table or nested) and self._match(TokenType.L_PAREN):
2859            if self._match(TokenType.PIVOT):
2860                this = self._parse_simplified_pivot()
2861            elif self._match(TokenType.FROM):
2862                this = exp.select("*").from_(
2863                    t.cast(exp.From, self._parse_from(skip_from_token=True))
2864                )
2865            else:
2866                this = (
2867                    self._parse_table()
2868                    if table
2869                    else self._parse_select(nested=True, parse_set_operation=False)
2870                )
2871                this = self._parse_query_modifiers(self._parse_set_operations(this))
2872
2873            self._match_r_paren()
2874
2875            # We return early here so that the UNION isn't attached to the subquery by the
2876            # following call to _parse_set_operations, but instead becomes the parent node
2877            return self._parse_subquery(this, parse_alias=parse_subquery_alias)
2878        elif self._match(TokenType.VALUES, advance=False):
2879            this = self._parse_derived_table_values()
2880        elif from_:
2881            this = exp.select("*").from_(from_.this, copy=False)
2882        elif self._match(TokenType.SUMMARIZE):
2883            table = self._match(TokenType.TABLE)
2884            this = self._parse_select() or self._parse_string() or self._parse_table()
2885            return self.expression(exp.Summarize, this=this, table=table)
2886        elif self._match(TokenType.DESCRIBE):
2887            this = self._parse_describe()
2888        elif self._match_text_seq("STREAM"):
2889            this = self.expression(exp.Stream, this=self._parse_function())
2890        else:
2891            this = None
2892
2893        return self._parse_set_operations(this) if parse_set_operation else this
2894
2895    def _parse_with(self, skip_with_token: bool = False) -> t.Optional[exp.With]:
2896        if not skip_with_token and not self._match(TokenType.WITH):
2897            return None
2898
2899        comments = self._prev_comments
2900        recursive = self._match(TokenType.RECURSIVE)
2901
2902        expressions = []
2903        while True:
2904            expressions.append(self._parse_cte())
2905
2906            if not self._match(TokenType.COMMA) and not self._match(TokenType.WITH):
2907                break
2908            else:
2909                self._match(TokenType.WITH)
2910
2911        return self.expression(
2912            exp.With, comments=comments, expressions=expressions, recursive=recursive
2913        )
2914
2915    def _parse_cte(self) -> exp.CTE:
2916        alias = self._parse_table_alias(self.ID_VAR_TOKENS)
2917        if not alias or not alias.this:
2918            self.raise_error("Expected CTE to have alias")
2919
2920        self._match(TokenType.ALIAS)
2921        comments = self._prev_comments
2922
2923        if self._match_text_seq("NOT", "MATERIALIZED"):
2924            materialized = False
2925        elif self._match_text_seq("MATERIALIZED"):
2926            materialized = True
2927        else:
2928            materialized = None
2929
2930        return self.expression(
2931            exp.CTE,
2932            this=self._parse_wrapped(self._parse_statement),
2933            alias=alias,
2934            materialized=materialized,
2935            comments=comments,
2936        )
2937
2938    def _parse_table_alias(
2939        self, alias_tokens: t.Optional[t.Collection[TokenType]] = None
2940    ) -> t.Optional[exp.TableAlias]:
2941        any_token = self._match(TokenType.ALIAS)
2942        alias = (
2943            self._parse_id_var(any_token=any_token, tokens=alias_tokens or self.TABLE_ALIAS_TOKENS)
2944            or self._parse_string_as_identifier()
2945        )
2946
2947        index = self._index
2948        if self._match(TokenType.L_PAREN):
2949            columns = self._parse_csv(self._parse_function_parameter)
2950            self._match_r_paren() if columns else self._retreat(index)
2951        else:
2952            columns = None
2953
2954        if not alias and not columns:
2955            return None
2956
2957        table_alias = self.expression(exp.TableAlias, this=alias, columns=columns)
2958
2959        # We bubble up comments from the Identifier to the TableAlias
2960        if isinstance(alias, exp.Identifier):
2961            table_alias.add_comments(alias.pop_comments())
2962
2963        return table_alias
2964
2965    def _parse_subquery(
2966        self, this: t.Optional[exp.Expression], parse_alias: bool = True
2967    ) -> t.Optional[exp.Subquery]:
2968        if not this:
2969            return None
2970
2971        return self.expression(
2972            exp.Subquery,
2973            this=this,
2974            pivots=self._parse_pivots(),
2975            alias=self._parse_table_alias() if parse_alias else None,
2976        )
2977
2978    def _implicit_unnests_to_explicit(self, this: E) -> E:
2979        from sqlglot.optimizer.normalize_identifiers import normalize_identifiers as _norm
2980
2981        refs = {_norm(this.args["from"].this.copy(), dialect=self.dialect).alias_or_name}
2982        for i, join in enumerate(this.args.get("joins") or []):
2983            table = join.this
2984            normalized_table = table.copy()
2985            normalized_table.meta["maybe_column"] = True
2986            normalized_table = _norm(normalized_table, dialect=self.dialect)
2987
2988            if isinstance(table, exp.Table) and not join.args.get("on"):
2989                if normalized_table.parts[0].name in refs:
2990                    table_as_column = table.to_column()
2991                    unnest = exp.Unnest(expressions=[table_as_column])
2992
2993                    # Table.to_column creates a parent Alias node that we want to convert to
2994                    # a TableAlias and attach to the Unnest, so it matches the parser's output
2995                    if isinstance(table.args.get("alias"), exp.TableAlias):
2996                        table_as_column.replace(table_as_column.this)
2997                        exp.alias_(unnest, None, table=[table.args["alias"].this], copy=False)
2998
2999                    table.replace(unnest)
3000
3001            refs.add(normalized_table.alias_or_name)
3002
3003        return this
3004
3005    def _parse_query_modifiers(
3006        self, this: t.Optional[exp.Expression]
3007    ) -> t.Optional[exp.Expression]:
3008        if isinstance(this, (exp.Query, exp.Table)):
3009            for join in self._parse_joins():
3010                this.append("joins", join)
3011            for lateral in iter(self._parse_lateral, None):
3012                this.append("laterals", lateral)
3013
3014            while True:
3015                if self._match_set(self.QUERY_MODIFIER_PARSERS, advance=False):
3016                    parser = self.QUERY_MODIFIER_PARSERS[self._curr.token_type]
3017                    key, expression = parser(self)
3018
3019                    if expression:
3020                        this.set(key, expression)
3021                        if key == "limit":
3022                            offset = expression.args.pop("offset", None)
3023
3024                            if offset:
3025                                offset = exp.Offset(expression=offset)
3026                                this.set("offset", offset)
3027
3028                                limit_by_expressions = expression.expressions
3029                                expression.set("expressions", None)
3030                                offset.set("expressions", limit_by_expressions)
3031                        continue
3032                break
3033
3034        if self.SUPPORTS_IMPLICIT_UNNEST and this and this.args.get("from"):
3035            this = self._implicit_unnests_to_explicit(this)
3036
3037        return this
3038
3039    def _parse_hint(self) -> t.Optional[exp.Hint]:
3040        if self._match(TokenType.HINT):
3041            hints = []
3042            for hint in iter(
3043                lambda: self._parse_csv(
3044                    lambda: self._parse_function() or self._parse_var(upper=True)
3045                ),
3046                [],
3047            ):
3048                hints.extend(hint)
3049
3050            if not self._match_pair(TokenType.STAR, TokenType.SLASH):
3051                self.raise_error("Expected */ after HINT")
3052
3053            return self.expression(exp.Hint, expressions=hints)
3054
3055        return None
3056
3057    def _parse_into(self) -> t.Optional[exp.Into]:
3058        if not self._match(TokenType.INTO):
3059            return None
3060
3061        temp = self._match(TokenType.TEMPORARY)
3062        unlogged = self._match_text_seq("UNLOGGED")
3063        self._match(TokenType.TABLE)
3064
3065        return self.expression(
3066            exp.Into, this=self._parse_table(schema=True), temporary=temp, unlogged=unlogged
3067        )
3068
3069    def _parse_from(
3070        self, joins: bool = False, skip_from_token: bool = False
3071    ) -> t.Optional[exp.From]:
3072        if not skip_from_token and not self._match(TokenType.FROM):
3073            return None
3074
3075        return self.expression(
3076            exp.From, comments=self._prev_comments, this=self._parse_table(joins=joins)
3077        )
3078
3079    def _parse_match_recognize_measure(self) -> exp.MatchRecognizeMeasure:
3080        return self.expression(
3081            exp.MatchRecognizeMeasure,
3082            window_frame=self._match_texts(("FINAL", "RUNNING")) and self._prev.text.upper(),
3083            this=self._parse_expression(),
3084        )
3085
3086    def _parse_match_recognize(self) -> t.Optional[exp.MatchRecognize]:
3087        if not self._match(TokenType.MATCH_RECOGNIZE):
3088            return None
3089
3090        self._match_l_paren()
3091
3092        partition = self._parse_partition_by()
3093        order = self._parse_order()
3094
3095        measures = (
3096            self._parse_csv(self._parse_match_recognize_measure)
3097            if self._match_text_seq("MEASURES")
3098            else None
3099        )
3100
3101        if self._match_text_seq("ONE", "ROW", "PER", "MATCH"):
3102            rows = exp.var("ONE ROW PER MATCH")
3103        elif self._match_text_seq("ALL", "ROWS", "PER", "MATCH"):
3104            text = "ALL ROWS PER MATCH"
3105            if self._match_text_seq("SHOW", "EMPTY", "MATCHES"):
3106                text += " SHOW EMPTY MATCHES"
3107            elif self._match_text_seq("OMIT", "EMPTY", "MATCHES"):
3108                text += " OMIT EMPTY MATCHES"
3109            elif self._match_text_seq("WITH", "UNMATCHED", "ROWS"):
3110                text += " WITH UNMATCHED ROWS"
3111            rows = exp.var(text)
3112        else:
3113            rows = None
3114
3115        if self._match_text_seq("AFTER", "MATCH", "SKIP"):
3116            text = "AFTER MATCH SKIP"
3117            if self._match_text_seq("PAST", "LAST", "ROW"):
3118                text += " PAST LAST ROW"
3119            elif self._match_text_seq("TO", "NEXT", "ROW"):
3120                text += " TO NEXT ROW"
3121            elif self._match_text_seq("TO", "FIRST"):
3122                text += f" TO FIRST {self._advance_any().text}"  # type: ignore
3123            elif self._match_text_seq("TO", "LAST"):
3124                text += f" TO LAST {self._advance_any().text}"  # type: ignore
3125            after = exp.var(text)
3126        else:
3127            after = None
3128
3129        if self._match_text_seq("PATTERN"):
3130            self._match_l_paren()
3131
3132            if not self._curr:
3133                self.raise_error("Expecting )", self._curr)
3134
3135            paren = 1
3136            start = self._curr
3137
3138            while self._curr and paren > 0:
3139                if self._curr.token_type == TokenType.L_PAREN:
3140                    paren += 1
3141                if self._curr.token_type == TokenType.R_PAREN:
3142                    paren -= 1
3143
3144                end = self._prev
3145                self._advance()
3146
3147            if paren > 0:
3148                self.raise_error("Expecting )", self._curr)
3149
3150            pattern = exp.var(self._find_sql(start, end))
3151        else:
3152            pattern = None
3153
3154        define = (
3155            self._parse_csv(self._parse_name_as_expression)
3156            if self._match_text_seq("DEFINE")
3157            else None
3158        )
3159
3160        self._match_r_paren()
3161
3162        return self.expression(
3163            exp.MatchRecognize,
3164            partition_by=partition,
3165            order=order,
3166            measures=measures,
3167            rows=rows,
3168            after=after,
3169            pattern=pattern,
3170            define=define,
3171            alias=self._parse_table_alias(),
3172        )
3173
3174    def _parse_lateral(self) -> t.Optional[exp.Lateral]:
3175        cross_apply = self._match_pair(TokenType.CROSS, TokenType.APPLY)
3176        if not cross_apply and self._match_pair(TokenType.OUTER, TokenType.APPLY):
3177            cross_apply = False
3178
3179        if cross_apply is not None:
3180            this = self._parse_select(table=True)
3181            view = None
3182            outer = None
3183        elif self._match(TokenType.LATERAL):
3184            this = self._parse_select(table=True)
3185            view = self._match(TokenType.VIEW)
3186            outer = self._match(TokenType.OUTER)
3187        else:
3188            return None
3189
3190        if not this:
3191            this = (
3192                self._parse_unnest()
3193                or self._parse_function()
3194                or self._parse_id_var(any_token=False)
3195            )
3196
3197            while self._match(TokenType.DOT):
3198                this = exp.Dot(
3199                    this=this,
3200                    expression=self._parse_function() or self._parse_id_var(any_token=False),
3201                )
3202
3203        if view:
3204            table = self._parse_id_var(any_token=False)
3205            columns = self._parse_csv(self._parse_id_var) if self._match(TokenType.ALIAS) else []
3206            table_alias: t.Optional[exp.TableAlias] = self.expression(
3207                exp.TableAlias, this=table, columns=columns
3208            )
3209        elif isinstance(this, (exp.Subquery, exp.Unnest)) and this.alias:
3210            # We move the alias from the lateral's child node to the lateral itself
3211            table_alias = this.args["alias"].pop()
3212        else:
3213            table_alias = self._parse_table_alias()
3214
3215        return self.expression(
3216            exp.Lateral,
3217            this=this,
3218            view=view,
3219            outer=outer,
3220            alias=table_alias,
3221            cross_apply=cross_apply,
3222        )
3223
3224    def _parse_join_parts(
3225        self,
3226    ) -> t.Tuple[t.Optional[Token], t.Optional[Token], t.Optional[Token]]:
3227        return (
3228            self._match_set(self.JOIN_METHODS) and self._prev,
3229            self._match_set(self.JOIN_SIDES) and self._prev,
3230            self._match_set(self.JOIN_KINDS) and self._prev,
3231        )
3232
3233    def _parse_using_identifiers(self) -> t.List[exp.Expression]:
3234        def _parse_column_as_identifier() -> t.Optional[exp.Expression]:
3235            this = self._parse_column()
3236            if isinstance(this, exp.Column):
3237                return this.this
3238            return this
3239
3240        return self._parse_wrapped_csv(_parse_column_as_identifier, optional=True)
3241
3242    def _parse_join(
3243        self, skip_join_token: bool = False, parse_bracket: bool = False
3244    ) -> t.Optional[exp.Join]:
3245        if self._match(TokenType.COMMA):
3246            return self.expression(exp.Join, this=self._parse_table())
3247
3248        index = self._index
3249        method, side, kind = self._parse_join_parts()
3250        hint = self._prev.text if self._match_texts(self.JOIN_HINTS) else None
3251        join = self._match(TokenType.JOIN) or (kind and kind.token_type == TokenType.STRAIGHT_JOIN)
3252
3253        if not skip_join_token and not join:
3254            self._retreat(index)
3255            kind = None
3256            method = None
3257            side = None
3258
3259        outer_apply = self._match_pair(TokenType.OUTER, TokenType.APPLY, False)
3260        cross_apply = self._match_pair(TokenType.CROSS, TokenType.APPLY, False)
3261
3262        if not skip_join_token and not join and not outer_apply and not cross_apply:
3263            return None
3264
3265        kwargs: t.Dict[str, t.Any] = {"this": self._parse_table(parse_bracket=parse_bracket)}
3266
3267        if method:
3268            kwargs["method"] = method.text
3269        if side:
3270            kwargs["side"] = side.text
3271        if kind:
3272            kwargs["kind"] = kind.text
3273        if hint:
3274            kwargs["hint"] = hint
3275
3276        if self._match(TokenType.MATCH_CONDITION):
3277            kwargs["match_condition"] = self._parse_wrapped(self._parse_comparison)
3278
3279        if self._match(TokenType.ON):
3280            kwargs["on"] = self._parse_assignment()
3281        elif self._match(TokenType.USING):
3282            kwargs["using"] = self._parse_using_identifiers()
3283        elif (
3284            not (outer_apply or cross_apply)
3285            and not isinstance(kwargs["this"], exp.Unnest)
3286            and not (kind and kind.token_type == TokenType.CROSS)
3287        ):
3288            index = self._index
3289            joins: t.Optional[list] = list(self._parse_joins())
3290
3291            if joins and self._match(TokenType.ON):
3292                kwargs["on"] = self._parse_assignment()
3293            elif joins and self._match(TokenType.USING):
3294                kwargs["using"] = self._parse_using_identifiers()
3295            else:
3296                joins = None
3297                self._retreat(index)
3298
3299            kwargs["this"].set("joins", joins if joins else None)
3300
3301        comments = [c for token in (method, side, kind) if token for c in token.comments]
3302        return self.expression(exp.Join, comments=comments, **kwargs)
3303
3304    def _parse_opclass(self) -> t.Optional[exp.Expression]:
3305        this = self._parse_assignment()
3306
3307        if self._match_texts(self.OPCLASS_FOLLOW_KEYWORDS, advance=False):
3308            return this
3309
3310        if not self._match_set(self.OPTYPE_FOLLOW_TOKENS, advance=False):
3311            return self.expression(exp.Opclass, this=this, expression=self._parse_table_parts())
3312
3313        return this
3314
3315    def _parse_index_params(self) -> exp.IndexParameters:
3316        using = self._parse_var(any_token=True) if self._match(TokenType.USING) else None
3317
3318        if self._match(TokenType.L_PAREN, advance=False):
3319            columns = self._parse_wrapped_csv(self._parse_with_operator)
3320        else:
3321            columns = None
3322
3323        include = self._parse_wrapped_id_vars() if self._match_text_seq("INCLUDE") else None
3324        partition_by = self._parse_partition_by()
3325        with_storage = self._match(TokenType.WITH) and self._parse_wrapped_properties()
3326        tablespace = (
3327            self._parse_var(any_token=True)
3328            if self._match_text_seq("USING", "INDEX", "TABLESPACE")
3329            else None
3330        )
3331        where = self._parse_where()
3332
3333        on = self._parse_field() if self._match(TokenType.ON) else None
3334
3335        return self.expression(
3336            exp.IndexParameters,
3337            using=using,
3338            columns=columns,
3339            include=include,
3340            partition_by=partition_by,
3341            where=where,
3342            with_storage=with_storage,
3343            tablespace=tablespace,
3344            on=on,
3345        )
3346
3347    def _parse_index(
3348        self, index: t.Optional[exp.Expression] = None, anonymous: bool = False
3349    ) -> t.Optional[exp.Index]:
3350        if index or anonymous:
3351            unique = None
3352            primary = None
3353            amp = None
3354
3355            self._match(TokenType.ON)
3356            self._match(TokenType.TABLE)  # hive
3357            table = self._parse_table_parts(schema=True)
3358        else:
3359            unique = self._match(TokenType.UNIQUE)
3360            primary = self._match_text_seq("PRIMARY")
3361            amp = self._match_text_seq("AMP")
3362
3363            if not self._match(TokenType.INDEX):
3364                return None
3365
3366            index = self._parse_id_var()
3367            table = None
3368
3369        params = self._parse_index_params()
3370
3371        return self.expression(
3372            exp.Index,
3373            this=index,
3374            table=table,
3375            unique=unique,
3376            primary=primary,
3377            amp=amp,
3378            params=params,
3379        )
3380
3381    def _parse_table_hints(self) -> t.Optional[t.List[exp.Expression]]:
3382        hints: t.List[exp.Expression] = []
3383        if self._match_pair(TokenType.WITH, TokenType.L_PAREN):
3384            # https://learn.microsoft.com/en-us/sql/t-sql/queries/hints-transact-sql-table?view=sql-server-ver16
3385            hints.append(
3386                self.expression(
3387                    exp.WithTableHint,
3388                    expressions=self._parse_csv(
3389                        lambda: self._parse_function() or self._parse_var(any_token=True)
3390                    ),
3391                )
3392            )
3393            self._match_r_paren()
3394        else:
3395            # https://dev.mysql.com/doc/refman/8.0/en/index-hints.html
3396            while self._match_set(self.TABLE_INDEX_HINT_TOKENS):
3397                hint = exp.IndexTableHint(this=self._prev.text.upper())
3398
3399                self._match_set((TokenType.INDEX, TokenType.KEY))
3400                if self._match(TokenType.FOR):
3401                    hint.set("target", self._advance_any() and self._prev.text.upper())
3402
3403                hint.set("expressions", self._parse_wrapped_id_vars())
3404                hints.append(hint)
3405
3406        return hints or None
3407
3408    def _parse_table_part(self, schema: bool = False) -> t.Optional[exp.Expression]:
3409        return (
3410            (not schema and self._parse_function(optional_parens=False))
3411            or self._parse_id_var(any_token=False)
3412            or self._parse_string_as_identifier()
3413            or self._parse_placeholder()
3414        )
3415
3416    def _parse_table_parts(
3417        self, schema: bool = False, is_db_reference: bool = False, wildcard: bool = False
3418    ) -> exp.Table:
3419        catalog = None
3420        db = None
3421        table: t.Optional[exp.Expression | str] = self._parse_table_part(schema=schema)
3422
3423        while self._match(TokenType.DOT):
3424            if catalog:
3425                # This allows nesting the table in arbitrarily many dot expressions if needed
3426                table = self.expression(
3427                    exp.Dot, this=table, expression=self._parse_table_part(schema=schema)
3428                )
3429            else:
3430                catalog = db
3431                db = table
3432                # "" used for tsql FROM a..b case
3433                table = self._parse_table_part(schema=schema) or ""
3434
3435        if (
3436            wildcard
3437            and self._is_connected()
3438            and (isinstance(table, exp.Identifier) or not table)
3439            and self._match(TokenType.STAR)
3440        ):
3441            if isinstance(table, exp.Identifier):
3442                table.args["this"] += "*"
3443            else:
3444                table = exp.Identifier(this="*")
3445
3446        # We bubble up comments from the Identifier to the Table
3447        comments = table.pop_comments() if isinstance(table, exp.Expression) else None
3448
3449        if is_db_reference:
3450            catalog = db
3451            db = table
3452            table = None
3453
3454        if not table and not is_db_reference:
3455            self.raise_error(f"Expected table name but got {self._curr}")
3456        if not db and is_db_reference:
3457            self.raise_error(f"Expected database name but got {self._curr}")
3458
3459        table = self.expression(
3460            exp.Table,
3461            comments=comments,
3462            this=table,
3463            db=db,
3464            catalog=catalog,
3465        )
3466
3467        changes = self._parse_changes()
3468        if changes:
3469            table.set("changes", changes)
3470
3471        at_before = self._parse_historical_data()
3472        if at_before:
3473            table.set("when", at_before)
3474
3475        pivots = self._parse_pivots()
3476        if pivots:
3477            table.set("pivots", pivots)
3478
3479        return table
3480
3481    def _parse_table(
3482        self,
3483        schema: bool = False,
3484        joins: bool = False,
3485        alias_tokens: t.Optional[t.Collection[TokenType]] = None,
3486        parse_bracket: bool = False,
3487        is_db_reference: bool = False,
3488        parse_partition: bool = False,
3489    ) -> t.Optional[exp.Expression]:
3490        lateral = self._parse_lateral()
3491        if lateral:
3492            return lateral
3493
3494        unnest = self._parse_unnest()
3495        if unnest:
3496            return unnest
3497
3498        values = self._parse_derived_table_values()
3499        if values:
3500            return values
3501
3502        subquery = self._parse_select(table=True)
3503        if subquery:
3504            if not subquery.args.get("pivots"):
3505                subquery.set("pivots", self._parse_pivots())
3506            return subquery
3507
3508        bracket = parse_bracket and self._parse_bracket(None)
3509        bracket = self.expression(exp.Table, this=bracket) if bracket else None
3510
3511        rows_from = self._match_text_seq("ROWS", "FROM") and self._parse_wrapped_csv(
3512            self._parse_table
3513        )
3514        rows_from = self.expression(exp.Table, rows_from=rows_from) if rows_from else None
3515
3516        only = self._match(TokenType.ONLY)
3517
3518        this = t.cast(
3519            exp.Expression,
3520            bracket
3521            or rows_from
3522            or self._parse_bracket(
3523                self._parse_table_parts(schema=schema, is_db_reference=is_db_reference)
3524            ),
3525        )
3526
3527        if only:
3528            this.set("only", only)
3529
3530        # Postgres supports a wildcard (table) suffix operator, which is a no-op in this context
3531        self._match_text_seq("*")
3532
3533        parse_partition = parse_partition or self.SUPPORTS_PARTITION_SELECTION
3534        if parse_partition and self._match(TokenType.PARTITION, advance=False):
3535            this.set("partition", self._parse_partition())
3536
3537        if schema:
3538            return self._parse_schema(this=this)
3539
3540        version = self._parse_version()
3541
3542        if version:
3543            this.set("version", version)
3544
3545        if self.dialect.ALIAS_POST_TABLESAMPLE:
3546            table_sample = self._parse_table_sample()
3547
3548        alias = self._parse_table_alias(alias_tokens=alias_tokens or self.TABLE_ALIAS_TOKENS)
3549        if alias:
3550            this.set("alias", alias)
3551
3552        if isinstance(this, exp.Table) and self._match_text_seq("AT"):
3553            return self.expression(
3554                exp.AtIndex, this=this.to_column(copy=False), expression=self._parse_id_var()
3555            )
3556
3557        this.set("hints", self._parse_table_hints())
3558
3559        if not this.args.get("pivots"):
3560            this.set("pivots", self._parse_pivots())
3561
3562        if not self.dialect.ALIAS_POST_TABLESAMPLE:
3563            table_sample = self._parse_table_sample()
3564
3565        if table_sample:
3566            table_sample.set("this", this)
3567            this = table_sample
3568
3569        if joins:
3570            for join in self._parse_joins():
3571                this.append("joins", join)
3572
3573        if self._match_pair(TokenType.WITH, TokenType.ORDINALITY):
3574            this.set("ordinality", True)
3575            this.set("alias", self._parse_table_alias())
3576
3577        return this
3578
3579    def _parse_version(self) -> t.Optional[exp.Version]:
3580        if self._match(TokenType.TIMESTAMP_SNAPSHOT):
3581            this = "TIMESTAMP"
3582        elif self._match(TokenType.VERSION_SNAPSHOT):
3583            this = "VERSION"
3584        else:
3585            return None
3586
3587        if self._match_set((TokenType.FROM, TokenType.BETWEEN)):
3588            kind = self._prev.text.upper()
3589            start = self._parse_bitwise()
3590            self._match_texts(("TO", "AND"))
3591            end = self._parse_bitwise()
3592            expression: t.Optional[exp.Expression] = self.expression(
3593                exp.Tuple, expressions=[start, end]
3594            )
3595        elif self._match_text_seq("CONTAINED", "IN"):
3596            kind = "CONTAINED IN"
3597            expression = self.expression(
3598                exp.Tuple, expressions=self._parse_wrapped_csv(self._parse_bitwise)
3599            )
3600        elif self._match(TokenType.ALL):
3601            kind = "ALL"
3602            expression = None
3603        else:
3604            self._match_text_seq("AS", "OF")
3605            kind = "AS OF"
3606            expression = self._parse_type()
3607
3608        return self.expression(exp.Version, this=this, expression=expression, kind=kind)
3609
3610    def _parse_historical_data(self) -> t.Optional[exp.HistoricalData]:
3611        # https://docs.snowflake.com/en/sql-reference/constructs/at-before
3612        index = self._index
3613        historical_data = None
3614        if self._match_texts(self.HISTORICAL_DATA_PREFIX):
3615            this = self._prev.text.upper()
3616            kind = (
3617                self._match(TokenType.L_PAREN)
3618                and self._match_texts(self.HISTORICAL_DATA_KIND)
3619                and self._prev.text.upper()
3620            )
3621            expression = self._match(TokenType.FARROW) and self._parse_bitwise()
3622
3623            if expression:
3624                self._match_r_paren()
3625                historical_data = self.expression(
3626                    exp.HistoricalData, this=this, kind=kind, expression=expression
3627                )
3628            else:
3629                self._retreat(index)
3630
3631        return historical_data
3632
3633    def _parse_changes(self) -> t.Optional[exp.Changes]:
3634        if not self._match_text_seq("CHANGES", "(", "INFORMATION", "=>"):
3635            return None
3636
3637        information = self._parse_var(any_token=True)
3638        self._match_r_paren()
3639
3640        return self.expression(
3641            exp.Changes,
3642            information=information,
3643            at_before=self._parse_historical_data(),
3644            end=self._parse_historical_data(),
3645        )
3646
3647    def _parse_unnest(self, with_alias: bool = True) -> t.Optional[exp.Unnest]:
3648        if not self._match(TokenType.UNNEST):
3649            return None
3650
3651        expressions = self._parse_wrapped_csv(self._parse_equality)
3652        offset = self._match_pair(TokenType.WITH, TokenType.ORDINALITY)
3653
3654        alias = self._parse_table_alias() if with_alias else None
3655
3656        if alias:
3657            if self.dialect.UNNEST_COLUMN_ONLY:
3658                if alias.args.get("columns"):
3659                    self.raise_error("Unexpected extra column alias in unnest.")
3660
3661                alias.set("columns", [alias.this])
3662                alias.set("this", None)
3663
3664            columns = alias.args.get("columns") or []
3665            if offset and len(expressions) < len(columns):
3666                offset = columns.pop()
3667
3668        if not offset and self._match_pair(TokenType.WITH, TokenType.OFFSET):
3669            self._match(TokenType.ALIAS)
3670            offset = self._parse_id_var(
3671                any_token=False, tokens=self.UNNEST_OFFSET_ALIAS_TOKENS
3672            ) or exp.to_identifier("offset")
3673
3674        return self.expression(exp.Unnest, expressions=expressions, alias=alias, offset=offset)
3675
3676    def _parse_derived_table_values(self) -> t.Optional[exp.Values]:
3677        is_derived = self._match_pair(TokenType.L_PAREN, TokenType.VALUES)
3678        if not is_derived and not (
3679            # ClickHouse's `FORMAT Values` is equivalent to `VALUES`
3680            self._match_text_seq("VALUES") or self._match_text_seq("FORMAT", "VALUES")
3681        ):
3682            return None
3683
3684        expressions = self._parse_csv(self._parse_value)
3685        alias = self._parse_table_alias()
3686
3687        if is_derived:
3688            self._match_r_paren()
3689
3690        return self.expression(
3691            exp.Values, expressions=expressions, alias=alias or self._parse_table_alias()
3692        )
3693
3694    def _parse_table_sample(self, as_modifier: bool = False) -> t.Optional[exp.TableSample]:
3695        if not self._match(TokenType.TABLE_SAMPLE) and not (
3696            as_modifier and self._match_text_seq("USING", "SAMPLE")
3697        ):
3698            return None
3699
3700        bucket_numerator = None
3701        bucket_denominator = None
3702        bucket_field = None
3703        percent = None
3704        size = None
3705        seed = None
3706
3707        method = self._parse_var(tokens=(TokenType.ROW,), upper=True)
3708        matched_l_paren = self._match(TokenType.L_PAREN)
3709
3710        if self.TABLESAMPLE_CSV:
3711            num = None
3712            expressions = self._parse_csv(self._parse_primary)
3713        else:
3714            expressions = None
3715            num = (
3716                self._parse_factor()
3717                if self._match(TokenType.NUMBER, advance=False)
3718                else self._parse_primary() or self._parse_placeholder()
3719            )
3720
3721        if self._match_text_seq("BUCKET"):
3722            bucket_numerator = self._parse_number()
3723            self._match_text_seq("OUT", "OF")
3724            bucket_denominator = bucket_denominator = self._parse_number()
3725            self._match(TokenType.ON)
3726            bucket_field = self._parse_field()
3727        elif self._match_set((TokenType.PERCENT, TokenType.MOD)):
3728            percent = num
3729        elif self._match(TokenType.ROWS) or not self.dialect.TABLESAMPLE_SIZE_IS_PERCENT:
3730            size = num
3731        else:
3732            percent = num
3733
3734        if matched_l_paren:
3735            self._match_r_paren()
3736
3737        if self._match(TokenType.L_PAREN):
3738            method = self._parse_var(upper=True)
3739            seed = self._match(TokenType.COMMA) and self._parse_number()
3740            self._match_r_paren()
3741        elif self._match_texts(("SEED", "REPEATABLE")):
3742            seed = self._parse_wrapped(self._parse_number)
3743
3744        if not method and self.DEFAULT_SAMPLING_METHOD:
3745            method = exp.var(self.DEFAULT_SAMPLING_METHOD)
3746
3747        return self.expression(
3748            exp.TableSample,
3749            expressions=expressions,
3750            method=method,
3751            bucket_numerator=bucket_numerator,
3752            bucket_denominator=bucket_denominator,
3753            bucket_field=bucket_field,
3754            percent=percent,
3755            size=size,
3756            seed=seed,
3757        )
3758
3759    def _parse_pivots(self) -> t.Optional[t.List[exp.Pivot]]:
3760        return list(iter(self._parse_pivot, None)) or None
3761
3762    def _parse_joins(self) -> t.Iterator[exp.Join]:
3763        return iter(self._parse_join, None)
3764
3765    # https://duckdb.org/docs/sql/statements/pivot
3766    def _parse_simplified_pivot(self) -> exp.Pivot:
3767        def _parse_on() -> t.Optional[exp.Expression]:
3768            this = self._parse_bitwise()
3769            return self._parse_in(this) if self._match(TokenType.IN) else this
3770
3771        this = self._parse_table()
3772        expressions = self._match(TokenType.ON) and self._parse_csv(_parse_on)
3773        using = self._match(TokenType.USING) and self._parse_csv(
3774            lambda: self._parse_alias(self._parse_function())
3775        )
3776        group = self._parse_group()
3777        return self.expression(
3778            exp.Pivot, this=this, expressions=expressions, using=using, group=group
3779        )
3780
3781    def _parse_pivot_in(self) -> exp.In | exp.PivotAny:
3782        def _parse_aliased_expression() -> t.Optional[exp.Expression]:
3783            this = self._parse_select_or_expression()
3784
3785            self._match(TokenType.ALIAS)
3786            alias = self._parse_bitwise()
3787            if alias:
3788                if isinstance(alias, exp.Column) and not alias.db:
3789                    alias = alias.this
3790                return self.expression(exp.PivotAlias, this=this, alias=alias)
3791
3792            return this
3793
3794        value = self._parse_column()
3795
3796        if not self._match_pair(TokenType.IN, TokenType.L_PAREN):
3797            self.raise_error("Expecting IN (")
3798
3799        if self._match(TokenType.ANY):
3800            expr: exp.PivotAny | exp.In = self.expression(exp.PivotAny, this=self._parse_order())
3801        else:
3802            aliased_expressions = self._parse_csv(_parse_aliased_expression)
3803            expr = self.expression(exp.In, this=value, expressions=aliased_expressions)
3804
3805        self._match_r_paren()
3806        return expr
3807
3808    def _parse_pivot(self) -> t.Optional[exp.Pivot]:
3809        index = self._index
3810        include_nulls = None
3811
3812        if self._match(TokenType.PIVOT):
3813            unpivot = False
3814        elif self._match(TokenType.UNPIVOT):
3815            unpivot = True
3816
3817            # https://docs.databricks.com/en/sql/language-manual/sql-ref-syntax-qry-select-unpivot.html#syntax
3818            if self._match_text_seq("INCLUDE", "NULLS"):
3819                include_nulls = True
3820            elif self._match_text_seq("EXCLUDE", "NULLS"):
3821                include_nulls = False
3822        else:
3823            return None
3824
3825        expressions = []
3826
3827        if not self._match(TokenType.L_PAREN):
3828            self._retreat(index)
3829            return None
3830
3831        if unpivot:
3832            expressions = self._parse_csv(self._parse_column)
3833        else:
3834            expressions = self._parse_csv(lambda: self._parse_alias(self._parse_function()))
3835
3836        if not expressions:
3837            self.raise_error("Failed to parse PIVOT's aggregation list")
3838
3839        if not self._match(TokenType.FOR):
3840            self.raise_error("Expecting FOR")
3841
3842        field = self._parse_pivot_in()
3843        default_on_null = self._match_text_seq("DEFAULT", "ON", "NULL") and self._parse_wrapped(
3844            self._parse_bitwise
3845        )
3846
3847        self._match_r_paren()
3848
3849        pivot = self.expression(
3850            exp.Pivot,
3851            expressions=expressions,
3852            field=field,
3853            unpivot=unpivot,
3854            include_nulls=include_nulls,
3855            default_on_null=default_on_null,
3856        )
3857
3858        if not self._match_set((TokenType.PIVOT, TokenType.UNPIVOT), advance=False):
3859            pivot.set("alias", self._parse_table_alias())
3860
3861        if not unpivot:
3862            names = self._pivot_column_names(t.cast(t.List[exp.Expression], expressions))
3863
3864            columns: t.List[exp.Expression] = []
3865            for fld in pivot.args["field"].expressions:
3866                field_name = fld.sql() if self.IDENTIFY_PIVOT_STRINGS else fld.alias_or_name
3867                for name in names:
3868                    if self.PREFIXED_PIVOT_COLUMNS:
3869                        name = f"{name}_{field_name}" if name else field_name
3870                    else:
3871                        name = f"{field_name}_{name}" if name else field_name
3872
3873                    columns.append(exp.to_identifier(name))
3874
3875            pivot.set("columns", columns)
3876
3877        return pivot
3878
3879    def _pivot_column_names(self, aggregations: t.List[exp.Expression]) -> t.List[str]:
3880        return [agg.alias for agg in aggregations]
3881
3882    def _parse_prewhere(self, skip_where_token: bool = False) -> t.Optional[exp.PreWhere]:
3883        if not skip_where_token and not self._match(TokenType.PREWHERE):
3884            return None
3885
3886        return self.expression(
3887            exp.PreWhere, comments=self._prev_comments, this=self._parse_assignment()
3888        )
3889
3890    def _parse_where(self, skip_where_token: bool = False) -> t.Optional[exp.Where]:
3891        if not skip_where_token and not self._match(TokenType.WHERE):
3892            return None
3893
3894        return self.expression(
3895            exp.Where, comments=self._prev_comments, this=self._parse_assignment()
3896        )
3897
3898    def _parse_group(self, skip_group_by_token: bool = False) -> t.Optional[exp.Group]:
3899        if not skip_group_by_token and not self._match(TokenType.GROUP_BY):
3900            return None
3901
3902        elements: t.Dict[str, t.Any] = defaultdict(list)
3903
3904        if self._match(TokenType.ALL):
3905            elements["all"] = True
3906        elif self._match(TokenType.DISTINCT):
3907            elements["all"] = False
3908
3909        while True:
3910            expressions = self._parse_csv(
3911                lambda: None
3912                if self._match_set((TokenType.CUBE, TokenType.ROLLUP), advance=False)
3913                else self._parse_assignment()
3914            )
3915            if expressions:
3916                elements["expressions"].extend(expressions)
3917
3918            grouping_sets = self._parse_grouping_sets()
3919            if grouping_sets:
3920                elements["grouping_sets"].extend(grouping_sets)
3921
3922            rollup = None
3923            cube = None
3924            totals = None
3925
3926            index = self._index
3927            with_ = self._match(TokenType.WITH)
3928            if self._match(TokenType.ROLLUP):
3929                rollup = with_ or self._parse_wrapped_csv(self._parse_column)
3930                elements["rollup"].extend(ensure_list(rollup))
3931
3932            if self._match(TokenType.CUBE):
3933                cube = with_ or self._parse_wrapped_csv(self._parse_column)
3934                elements["cube"].extend(ensure_list(cube))
3935
3936            if self._match_text_seq("TOTALS"):
3937                totals = True
3938                elements["totals"] = True  # type: ignore
3939
3940            if not (grouping_sets or rollup or cube or totals):
3941                if with_:
3942                    self._retreat(index)
3943                break
3944
3945        return self.expression(exp.Group, **elements)  # type: ignore
3946
3947    def _parse_grouping_sets(self) -> t.Optional[t.List[exp.Expression]]:
3948        if not self._match(TokenType.GROUPING_SETS):
3949            return None
3950
3951        return self._parse_wrapped_csv(self._parse_grouping_set)
3952
3953    def _parse_grouping_set(self) -> t.Optional[exp.Expression]:
3954        if self._match(TokenType.L_PAREN):
3955            grouping_set = self._parse_csv(self._parse_column)
3956            self._match_r_paren()
3957            return self.expression(exp.Tuple, expressions=grouping_set)
3958
3959        return self._parse_column()
3960
3961    def _parse_having(self, skip_having_token: bool = False) -> t.Optional[exp.Having]:
3962        if not skip_having_token and not self._match(TokenType.HAVING):
3963            return None
3964        return self.expression(exp.Having, this=self._parse_assignment())
3965
3966    def _parse_qualify(self) -> t.Optional[exp.Qualify]:
3967        if not self._match(TokenType.QUALIFY):
3968            return None
3969        return self.expression(exp.Qualify, this=self._parse_assignment())
3970
3971    def _parse_connect(self, skip_start_token: bool = False) -> t.Optional[exp.Connect]:
3972        if skip_start_token:
3973            start = None
3974        elif self._match(TokenType.START_WITH):
3975            start = self._parse_assignment()
3976        else:
3977            return None
3978
3979        self._match(TokenType.CONNECT_BY)
3980        nocycle = self._match_text_seq("NOCYCLE")
3981        self.NO_PAREN_FUNCTION_PARSERS["PRIOR"] = lambda self: self.expression(
3982            exp.Prior, this=self._parse_bitwise()
3983        )
3984        connect = self._parse_assignment()
3985        self.NO_PAREN_FUNCTION_PARSERS.pop("PRIOR")
3986
3987        if not start and self._match(TokenType.START_WITH):
3988            start = self._parse_assignment()
3989
3990        return self.expression(exp.Connect, start=start, connect=connect, nocycle=nocycle)
3991
3992    def _parse_name_as_expression(self) -> exp.Alias:
3993        return self.expression(
3994            exp.Alias,
3995            alias=self._parse_id_var(any_token=True),
3996            this=self._match(TokenType.ALIAS) and self._parse_assignment(),
3997        )
3998
3999    def _parse_interpolate(self) -> t.Optional[t.List[exp.Expression]]:
4000        if self._match_text_seq("INTERPOLATE"):
4001            return self._parse_wrapped_csv(self._parse_name_as_expression)
4002        return None
4003
4004    def _parse_order(
4005        self, this: t.Optional[exp.Expression] = None, skip_order_token: bool = False
4006    ) -> t.Optional[exp.Expression]:
4007        siblings = None
4008        if not skip_order_token and not self._match(TokenType.ORDER_BY):
4009            if not self._match(TokenType.ORDER_SIBLINGS_BY):
4010                return this
4011
4012            siblings = True
4013
4014        return self.expression(
4015            exp.Order,
4016            this=this,
4017            expressions=self._parse_csv(self._parse_ordered),
4018            siblings=siblings,
4019        )
4020
4021    def _parse_sort(self, exp_class: t.Type[E], token: TokenType) -> t.Optional[E]:
4022        if not self._match(token):
4023            return None
4024        return self.expression(exp_class, expressions=self._parse_csv(self._parse_ordered))
4025
4026    def _parse_ordered(
4027        self, parse_method: t.Optional[t.Callable] = None
4028    ) -> t.Optional[exp.Ordered]:
4029        this = parse_method() if parse_method else self._parse_assignment()
4030        if not this:
4031            return None
4032
4033        if this.name.upper() == "ALL" and self.dialect.SUPPORTS_ORDER_BY_ALL:
4034            this = exp.var("ALL")
4035
4036        asc = self._match(TokenType.ASC)
4037        desc = self._match(TokenType.DESC) or (asc and False)
4038
4039        is_nulls_first = self._match_text_seq("NULLS", "FIRST")
4040        is_nulls_last = self._match_text_seq("NULLS", "LAST")
4041
4042        nulls_first = is_nulls_first or False
4043        explicitly_null_ordered = is_nulls_first or is_nulls_last
4044
4045        if (
4046            not explicitly_null_ordered
4047            and (
4048                (not desc and self.dialect.NULL_ORDERING == "nulls_are_small")
4049                or (desc and self.dialect.NULL_ORDERING != "nulls_are_small")
4050            )
4051            and self.dialect.NULL_ORDERING != "nulls_are_last"
4052        ):
4053            nulls_first = True
4054
4055        if self._match_text_seq("WITH", "FILL"):
4056            with_fill = self.expression(
4057                exp.WithFill,
4058                **{  # type: ignore
4059                    "from": self._match(TokenType.FROM) and self._parse_bitwise(),
4060                    "to": self._match_text_seq("TO") and self._parse_bitwise(),
4061                    "step": self._match_text_seq("STEP") and self._parse_bitwise(),
4062                    "interpolate": self._parse_interpolate(),
4063                },
4064            )
4065        else:
4066            with_fill = None
4067
4068        return self.expression(
4069            exp.Ordered, this=this, desc=desc, nulls_first=nulls_first, with_fill=with_fill
4070        )
4071
4072    def _parse_limit(
4073        self,
4074        this: t.Optional[exp.Expression] = None,
4075        top: bool = False,
4076        skip_limit_token: bool = False,
4077    ) -> t.Optional[exp.Expression]:
4078        if skip_limit_token or self._match(TokenType.TOP if top else TokenType.LIMIT):
4079            comments = self._prev_comments
4080            if top:
4081                limit_paren = self._match(TokenType.L_PAREN)
4082                expression = self._parse_term() if limit_paren else self._parse_number()
4083
4084                if limit_paren:
4085                    self._match_r_paren()
4086            else:
4087                expression = self._parse_term()
4088
4089            if self._match(TokenType.COMMA):
4090                offset = expression
4091                expression = self._parse_term()
4092            else:
4093                offset = None
4094
4095            limit_exp = self.expression(
4096                exp.Limit,
4097                this=this,
4098                expression=expression,
4099                offset=offset,
4100                comments=comments,
4101                expressions=self._parse_limit_by(),
4102            )
4103
4104            return limit_exp
4105
4106        if self._match(TokenType.FETCH):
4107            direction = self._match_set((TokenType.FIRST, TokenType.NEXT))
4108            direction = self._prev.text.upper() if direction else "FIRST"
4109
4110            count = self._parse_field(tokens=self.FETCH_TOKENS)
4111            percent = self._match(TokenType.PERCENT)
4112
4113            self._match_set((TokenType.ROW, TokenType.ROWS))
4114
4115            only = self._match_text_seq("ONLY")
4116            with_ties = self._match_text_seq("WITH", "TIES")
4117
4118            if only and with_ties:
4119                self.raise_error("Cannot specify both ONLY and WITH TIES in FETCH clause")
4120
4121            return self.expression(
4122                exp.Fetch,
4123                direction=direction,
4124                count=count,
4125                percent=percent,
4126                with_ties=with_ties,
4127            )
4128
4129        return this
4130
4131    def _parse_offset(self, this: t.Optional[exp.Expression] = None) -> t.Optional[exp.Expression]:
4132        if not self._match(TokenType.OFFSET):
4133            return this
4134
4135        count = self._parse_term()
4136        self._match_set((TokenType.ROW, TokenType.ROWS))
4137
4138        return self.expression(
4139            exp.Offset, this=this, expression=count, expressions=self._parse_limit_by()
4140        )
4141
4142    def _parse_limit_by(self) -> t.Optional[t.List[exp.Expression]]:
4143        return self._match_text_seq("BY") and self._parse_csv(self._parse_bitwise)
4144
4145    def _parse_locks(self) -> t.List[exp.Lock]:
4146        locks = []
4147        while True:
4148            if self._match_text_seq("FOR", "UPDATE"):
4149                update = True
4150            elif self._match_text_seq("FOR", "SHARE") or self._match_text_seq(
4151                "LOCK", "IN", "SHARE", "MODE"
4152            ):
4153                update = False
4154            else:
4155                break
4156
4157            expressions = None
4158            if self._match_text_seq("OF"):
4159                expressions = self._parse_csv(lambda: self._parse_table(schema=True))
4160
4161            wait: t.Optional[bool | exp.Expression] = None
4162            if self._match_text_seq("NOWAIT"):
4163                wait = True
4164            elif self._match_text_seq("WAIT"):
4165                wait = self._parse_primary()
4166            elif self._match_text_seq("SKIP", "LOCKED"):
4167                wait = False
4168
4169            locks.append(
4170                self.expression(exp.Lock, update=update, expressions=expressions, wait=wait)
4171            )
4172
4173        return locks
4174
4175    def _parse_set_operations(self, this: t.Optional[exp.Expression]) -> t.Optional[exp.Expression]:
4176        while this and self._match_set(self.SET_OPERATIONS):
4177            token_type = self._prev.token_type
4178
4179            if token_type == TokenType.UNION:
4180                operation: t.Type[exp.SetOperation] = exp.Union
4181            elif token_type == TokenType.EXCEPT:
4182                operation = exp.Except
4183            else:
4184                operation = exp.Intersect
4185
4186            comments = self._prev.comments
4187            distinct = self._match(TokenType.DISTINCT) or not self._match(TokenType.ALL)
4188            by_name = self._match_text_seq("BY", "NAME")
4189            expression = self._parse_select(nested=True, parse_set_operation=False)
4190
4191            this = self.expression(
4192                operation,
4193                comments=comments,
4194                this=this,
4195                distinct=distinct,
4196                by_name=by_name,
4197                expression=expression,
4198            )
4199
4200        if isinstance(this, exp.SetOperation) and self.MODIFIERS_ATTACHED_TO_SET_OP:
4201            expression = this.expression
4202
4203            if expression:
4204                for arg in self.SET_OP_MODIFIERS:
4205                    expr = expression.args.get(arg)
4206                    if expr:
4207                        this.set(arg, expr.pop())
4208
4209        return this
4210
4211    def _parse_expression(self) -> t.Optional[exp.Expression]:
4212        return self._parse_alias(self._parse_assignment())
4213
4214    def _parse_assignment(self) -> t.Optional[exp.Expression]:
4215        this = self._parse_disjunction()
4216        if not this and self._next and self._next.token_type in self.ASSIGNMENT:
4217            # This allows us to parse <non-identifier token> := <expr>
4218            this = exp.column(
4219                t.cast(str, self._advance_any(ignore_reserved=True) and self._prev.text)
4220            )
4221
4222        while self._match_set(self.ASSIGNMENT):
4223            this = self.expression(
4224                self.ASSIGNMENT[self._prev.token_type],
4225                this=this,
4226                comments=self._prev_comments,
4227                expression=self._parse_assignment(),
4228            )
4229
4230        return this
4231
4232    def _parse_disjunction(self) -> t.Optional[exp.Expression]:
4233        return self._parse_tokens(self._parse_conjunction, self.DISJUNCTION)
4234
4235    def _parse_conjunction(self) -> t.Optional[exp.Expression]:
4236        return self._parse_tokens(self._parse_equality, self.CONJUNCTION)
4237
4238    def _parse_equality(self) -> t.Optional[exp.Expression]:
4239        return self._parse_tokens(self._parse_comparison, self.EQUALITY)
4240
4241    def _parse_comparison(self) -> t.Optional[exp.Expression]:
4242        return self._parse_tokens(self._parse_range, self.COMPARISON)
4243
4244    def _parse_range(self, this: t.Optional[exp.Expression] = None) -> t.Optional[exp.Expression]:
4245        this = this or self._parse_bitwise()
4246        negate = self._match(TokenType.NOT)
4247
4248        if self._match_set(self.RANGE_PARSERS):
4249            expression = self.RANGE_PARSERS[self._prev.token_type](self, this)
4250            if not expression:
4251                return this
4252
4253            this = expression
4254        elif self._match(TokenType.ISNULL):
4255            this = self.expression(exp.Is, this=this, expression=exp.Null())
4256
4257        # Postgres supports ISNULL and NOTNULL for conditions.
4258        # https://blog.andreiavram.ro/postgresql-null-composite-type/
4259        if self._match(TokenType.NOTNULL):
4260            this = self.expression(exp.Is, this=this, expression=exp.Null())
4261            this = self.expression(exp.Not, this=this)
4262
4263        if negate:
4264            this = self._negate_range(this)
4265
4266        if self._match(TokenType.IS):
4267            this = self._parse_is(this)
4268
4269        return this
4270
4271    def _negate_range(self, this: t.Optional[exp.Expression] = None) -> t.Optional[exp.Expression]:
4272        if not this:
4273            return this
4274
4275        return self.expression(exp.Not, this=this)
4276
4277    def _parse_is(self, this: t.Optional[exp.Expression]) -> t.Optional[exp.Expression]:
4278        index = self._index - 1
4279        negate = self._match(TokenType.NOT)
4280
4281        if self._match_text_seq("DISTINCT", "FROM"):
4282            klass = exp.NullSafeEQ if negate else exp.NullSafeNEQ
4283            return self.expression(klass, this=this, expression=self._parse_bitwise())
4284
4285        expression = self._parse_null() or self._parse_boolean()
4286        if not expression:
4287            self._retreat(index)
4288            return None
4289
4290        this = self.expression(exp.Is, this=this, expression=expression)
4291        return self.expression(exp.Not, this=this) if negate else this
4292
4293    def _parse_in(self, this: t.Optional[exp.Expression], alias: bool = False) -> exp.In:
4294        unnest = self._parse_unnest(with_alias=False)
4295        if unnest:
4296            this = self.expression(exp.In, this=this, unnest=unnest)
4297        elif self._match_set((TokenType.L_PAREN, TokenType.L_BRACKET)):
4298            matched_l_paren = self._prev.token_type == TokenType.L_PAREN
4299            expressions = self._parse_csv(lambda: self._parse_select_or_expression(alias=alias))
4300
4301            if len(expressions) == 1 and isinstance(expressions[0], exp.Query):
4302                this = self.expression(exp.In, this=this, query=expressions[0].subquery(copy=False))
4303            else:
4304                this = self.expression(exp.In, this=this, expressions=expressions)
4305
4306            if matched_l_paren:
4307                self._match_r_paren(this)
4308            elif not self._match(TokenType.R_BRACKET, expression=this):
4309                self.raise_error("Expecting ]")
4310        else:
4311            this = self.expression(exp.In, this=this, field=self._parse_field())
4312
4313        return this
4314
4315    def _parse_between(self, this: t.Optional[exp.Expression]) -> exp.Between:
4316        low = self._parse_bitwise()
4317        self._match(TokenType.AND)
4318        high = self._parse_bitwise()
4319        return self.expression(exp.Between, this=this, low=low, high=high)
4320
4321    def _parse_escape(self, this: t.Optional[exp.Expression]) -> t.Optional[exp.Expression]:
4322        if not self._match(TokenType.ESCAPE):
4323            return this
4324        return self.expression(exp.Escape, this=this, expression=self._parse_string())
4325
4326    def _parse_interval(self, match_interval: bool = True) -> t.Optional[exp.Add | exp.Interval]:
4327        index = self._index
4328
4329        if not self._match(TokenType.INTERVAL) and match_interval:
4330            return None
4331
4332        if self._match(TokenType.STRING, advance=False):
4333            this = self._parse_primary()
4334        else:
4335            this = self._parse_term()
4336
4337        if not this or (
4338            isinstance(this, exp.Column)
4339            and not this.table
4340            and not this.this.quoted
4341            and this.name.upper() == "IS"
4342        ):
4343            self._retreat(index)
4344            return None
4345
4346        unit = self._parse_function() or (
4347            not self._match(TokenType.ALIAS, advance=False)
4348            and self._parse_var(any_token=True, upper=True)
4349        )
4350
4351        # Most dialects support, e.g., the form INTERVAL '5' day, thus we try to parse
4352        # each INTERVAL expression into this canonical form so it's easy to transpile
4353        if this and this.is_number:
4354            this = exp.Literal.string(this.to_py())
4355        elif this and this.is_string:
4356            parts = exp.INTERVAL_STRING_RE.findall(this.name)
4357            if len(parts) == 1:
4358                if unit:
4359                    # Unconsume the eagerly-parsed unit, since the real unit was part of the string
4360                    self._retreat(self._index - 1)
4361
4362                this = exp.Literal.string(parts[0][0])
4363                unit = self.expression(exp.Var, this=parts[0][1].upper())
4364
4365        if self.INTERVAL_SPANS and self._match_text_seq("TO"):
4366            unit = self.expression(
4367                exp.IntervalSpan, this=unit, expression=self._parse_var(any_token=True, upper=True)
4368            )
4369
4370        interval = self.expression(exp.Interval, this=this, unit=unit)
4371
4372        index = self._index
4373        self._match(TokenType.PLUS)
4374
4375        # Convert INTERVAL 'val_1' unit_1 [+] ... [+] 'val_n' unit_n into a sum of intervals
4376        if self._match_set((TokenType.STRING, TokenType.NUMBER), advance=False):
4377            return self.expression(
4378                exp.Add, this=interval, expression=self._parse_interval(match_interval=False)
4379            )
4380
4381        self._retreat(index)
4382        return interval
4383
4384    def _parse_bitwise(self) -> t.Optional[exp.Expression]:
4385        this = self._parse_term()
4386
4387        while True:
4388            if self._match_set(self.BITWISE):
4389                this = self.expression(
4390                    self.BITWISE[self._prev.token_type],
4391                    this=this,
4392                    expression=self._parse_term(),
4393                )
4394            elif self.dialect.DPIPE_IS_STRING_CONCAT and self._match(TokenType.DPIPE):
4395                this = self.expression(
4396                    exp.DPipe,
4397                    this=this,
4398                    expression=self._parse_term(),
4399                    safe=not self.dialect.STRICT_STRING_CONCAT,
4400                )
4401            elif self._match(TokenType.DQMARK):
4402                this = self.expression(exp.Coalesce, this=this, expressions=self._parse_term())
4403            elif self._match_pair(TokenType.LT, TokenType.LT):
4404                this = self.expression(
4405                    exp.BitwiseLeftShift, this=this, expression=self._parse_term()
4406                )
4407            elif self._match_pair(TokenType.GT, TokenType.GT):
4408                this = self.expression(
4409                    exp.BitwiseRightShift, this=this, expression=self._parse_term()
4410                )
4411            else:
4412                break
4413
4414        return this
4415
4416    def _parse_term(self) -> t.Optional[exp.Expression]:
4417        this = self._parse_factor()
4418
4419        while self._match_set(self.TERM):
4420            klass = self.TERM[self._prev.token_type]
4421            comments = self._prev_comments
4422            expression = self._parse_factor()
4423
4424            this = self.expression(klass, this=this, comments=comments, expression=expression)
4425
4426            if isinstance(this, exp.Collate):
4427                expr = this.expression
4428
4429                # Preserve collations such as pg_catalog."default" (Postgres) as columns, otherwise
4430                # fallback to Identifier / Var
4431                if isinstance(expr, exp.Column) and len(expr.parts) == 1:
4432                    ident = expr.this
4433                    if isinstance(ident, exp.Identifier):
4434                        this.set("expression", ident if ident.quoted else exp.var(ident.name))
4435
4436        return this
4437
4438    def _parse_factor(self) -> t.Optional[exp.Expression]:
4439        parse_method = self._parse_exponent if self.EXPONENT else self._parse_unary
4440        this = parse_method()
4441
4442        while self._match_set(self.FACTOR):
4443            klass = self.FACTOR[self._prev.token_type]
4444            comments = self._prev_comments
4445            expression = parse_method()
4446
4447            if not expression and klass is exp.IntDiv and self._prev.text.isalpha():
4448                self._retreat(self._index - 1)
4449                return this
4450
4451            this = self.expression(klass, this=this, comments=comments, expression=expression)
4452
4453            if isinstance(this, exp.Div):
4454                this.args["typed"] = self.dialect.TYPED_DIVISION
4455                this.args["safe"] = self.dialect.SAFE_DIVISION
4456
4457        return this
4458
4459    def _parse_exponent(self) -> t.Optional[exp.Expression]:
4460        return self._parse_tokens(self._parse_unary, self.EXPONENT)
4461
4462    def _parse_unary(self) -> t.Optional[exp.Expression]:
4463        if self._match_set(self.UNARY_PARSERS):
4464            return self.UNARY_PARSERS[self._prev.token_type](self)
4465        return self._parse_at_time_zone(self._parse_type())
4466
4467    def _parse_type(
4468        self, parse_interval: bool = True, fallback_to_identifier: bool = False
4469    ) -> t.Optional[exp.Expression]:
4470        interval = parse_interval and self._parse_interval()
4471        if interval:
4472            return interval
4473
4474        index = self._index
4475        data_type = self._parse_types(check_func=True, allow_identifiers=False)
4476
4477        # parse_types() returns a Cast if we parsed BQ's inline constructor <type>(<values>) e.g.
4478        # STRUCT<a INT, b STRING>(1, 'foo'), which is canonicalized to CAST(<values> AS <type>)
4479        if isinstance(data_type, exp.Cast):
4480            # This constructor can contain ops directly after it, for instance struct unnesting:
4481            # STRUCT<a INT, b STRING>(1, 'foo').* --> CAST(STRUCT(1, 'foo') AS STRUCT<a iNT, b STRING).*
4482            return self._parse_column_ops(data_type)
4483
4484        if data_type:
4485            index2 = self._index
4486            this = self._parse_primary()
4487
4488            if isinstance(this, exp.Literal):
4489                parser = self.TYPE_LITERAL_PARSERS.get(data_type.this)
4490                if parser:
4491                    return parser(self, this, data_type)
4492
4493                return self.expression(exp.Cast, this=this, to=data_type)
4494
4495            # The expressions arg gets set by the parser when we have something like DECIMAL(38, 0)
4496            # in the input SQL. In that case, we'll produce these tokens: DECIMAL ( 38 , 0 )
4497            #
4498            # If the index difference here is greater than 1, that means the parser itself must have
4499            # consumed additional tokens such as the DECIMAL scale and precision in the above example.
4500            #
4501            # If it's not greater than 1, then it must be 1, because we've consumed at least the type
4502            # keyword, meaning that the expressions arg of the DataType must have gotten set by a
4503            # callable in the TYPE_CONVERTERS mapping. For example, Snowflake converts DECIMAL to
4504            # DECIMAL(38, 0)) in order to facilitate the data type's transpilation.
4505            #
4506            # In these cases, we don't really want to return the converted type, but instead retreat
4507            # and try to parse a Column or Identifier in the section below.
4508            if data_type.expressions and index2 - index > 1:
4509                self._retreat(index2)
4510                return self._parse_column_ops(data_type)
4511
4512            self._retreat(index)
4513
4514        if fallback_to_identifier:
4515            return self._parse_id_var()
4516
4517        this = self._parse_column()
4518        return this and self._parse_column_ops(this)
4519
4520    def _parse_type_size(self) -> t.Optional[exp.DataTypeParam]:
4521        this = self._parse_type()
4522        if not this:
4523            return None
4524
4525        if isinstance(this, exp.Column) and not this.table:
4526            this = exp.var(this.name.upper())
4527
4528        return self.expression(
4529            exp.DataTypeParam, this=this, expression=self._parse_var(any_token=True)
4530        )
4531
4532    def _parse_types(
4533        self, check_func: bool = False, schema: bool = False, allow_identifiers: bool = True
4534    ) -> t.Optional[exp.Expression]:
4535        index = self._index
4536
4537        this: t.Optional[exp.Expression] = None
4538        prefix = self._match_text_seq("SYSUDTLIB", ".")
4539
4540        if not self._match_set(self.TYPE_TOKENS):
4541            identifier = allow_identifiers and self._parse_id_var(
4542                any_token=False, tokens=(TokenType.VAR,)
4543            )
4544            if isinstance(identifier, exp.Identifier):
4545                tokens = self.dialect.tokenize(identifier.sql(dialect=self.dialect))
4546
4547                if len(tokens) != 1:
4548                    self.raise_error("Unexpected identifier", self._prev)
4549
4550                if tokens[0].token_type in self.TYPE_TOKENS:
4551                    self._prev = tokens[0]
4552                elif self.dialect.SUPPORTS_USER_DEFINED_TYPES:
4553                    type_name = identifier.name
4554
4555                    while self._match(TokenType.DOT):
4556                        type_name = f"{type_name}.{self._advance_any() and self._prev.text}"
4557
4558                    this = exp.DataType.build(type_name, udt=True)
4559                else:
4560                    self._retreat(self._index - 1)
4561                    return None
4562            else:
4563                return None
4564
4565        type_token = self._prev.token_type
4566
4567        if type_token == TokenType.PSEUDO_TYPE:
4568            return self.expression(exp.PseudoType, this=self._prev.text.upper())
4569
4570        if type_token == TokenType.OBJECT_IDENTIFIER:
4571            return self.expression(exp.ObjectIdentifier, this=self._prev.text.upper())
4572
4573        # https://materialize.com/docs/sql/types/map/
4574        if type_token == TokenType.MAP and self._match(TokenType.L_BRACKET):
4575            key_type = self._parse_types(
4576                check_func=check_func, schema=schema, allow_identifiers=allow_identifiers
4577            )
4578            if not self._match(TokenType.FARROW):
4579                self._retreat(index)
4580                return None
4581
4582            value_type = self._parse_types(
4583                check_func=check_func, schema=schema, allow_identifiers=allow_identifiers
4584            )
4585            if not self._match(TokenType.R_BRACKET):
4586                self._retreat(index)
4587                return None
4588
4589            return exp.DataType(
4590                this=exp.DataType.Type.MAP,
4591                expressions=[key_type, value_type],
4592                nested=True,
4593                prefix=prefix,
4594            )
4595
4596        nested = type_token in self.NESTED_TYPE_TOKENS
4597        is_struct = type_token in self.STRUCT_TYPE_TOKENS
4598        is_aggregate = type_token in self.AGGREGATE_TYPE_TOKENS
4599        expressions = None
4600        maybe_func = False
4601
4602        if self._match(TokenType.L_PAREN):
4603            if is_struct:
4604                expressions = self._parse_csv(lambda: self._parse_struct_types(type_required=True))
4605            elif nested:
4606                expressions = self._parse_csv(
4607                    lambda: self._parse_types(
4608                        check_func=check_func, schema=schema, allow_identifiers=allow_identifiers
4609                    )
4610                )
4611            elif type_token in self.ENUM_TYPE_TOKENS:
4612                expressions = self._parse_csv(self._parse_equality)
4613            elif is_aggregate:
4614                func_or_ident = self._parse_function(anonymous=True) or self._parse_id_var(
4615                    any_token=False, tokens=(TokenType.VAR,)
4616                )
4617                if not func_or_ident or not self._match(TokenType.COMMA):
4618                    return None
4619                expressions = self._parse_csv(
4620                    lambda: self._parse_types(
4621                        check_func=check_func, schema=schema, allow_identifiers=allow_identifiers
4622                    )
4623                )
4624                expressions.insert(0, func_or_ident)
4625            else:
4626                expressions = self._parse_csv(self._parse_type_size)
4627
4628                # https://docs.snowflake.com/en/sql-reference/data-types-vector
4629                if type_token == TokenType.VECTOR and len(expressions) == 2:
4630                    expressions[0] = exp.DataType.build(expressions[0].name, dialect=self.dialect)
4631
4632            if not expressions or not self._match(TokenType.R_PAREN):
4633                self._retreat(index)
4634                return None
4635
4636            maybe_func = True
4637
4638        values: t.Optional[t.List[exp.Expression]] = None
4639
4640        if nested and self._match(TokenType.LT):
4641            if is_struct:
4642                expressions = self._parse_csv(lambda: self._parse_struct_types(type_required=True))
4643            else:
4644                expressions = self._parse_csv(
4645                    lambda: self._parse_types(
4646                        check_func=check_func, schema=schema, allow_identifiers=allow_identifiers
4647                    )
4648                )
4649
4650            if not self._match(TokenType.GT):
4651                self.raise_error("Expecting >")
4652
4653            if self._match_set((TokenType.L_BRACKET, TokenType.L_PAREN)):
4654                values = self._parse_csv(self._parse_assignment)
4655                self._match_set((TokenType.R_BRACKET, TokenType.R_PAREN))
4656
4657        if type_token in self.TIMESTAMPS:
4658            if self._match_text_seq("WITH", "TIME", "ZONE"):
4659                maybe_func = False
4660                tz_type = (
4661                    exp.DataType.Type.TIMETZ
4662                    if type_token in self.TIMES
4663                    else exp.DataType.Type.TIMESTAMPTZ
4664                )
4665                this = exp.DataType(this=tz_type, expressions=expressions)
4666            elif self._match_text_seq("WITH", "LOCAL", "TIME", "ZONE"):
4667                maybe_func = False
4668                this = exp.DataType(this=exp.DataType.Type.TIMESTAMPLTZ, expressions=expressions)
4669            elif self._match_text_seq("WITHOUT", "TIME", "ZONE"):
4670                maybe_func = False
4671        elif type_token == TokenType.INTERVAL:
4672            unit = self._parse_var(upper=True)
4673            if unit:
4674                if self._match_text_seq("TO"):
4675                    unit = exp.IntervalSpan(this=unit, expression=self._parse_var(upper=True))
4676
4677                this = self.expression(exp.DataType, this=self.expression(exp.Interval, unit=unit))
4678            else:
4679                this = self.expression(exp.DataType, this=exp.DataType.Type.INTERVAL)
4680
4681        if maybe_func and check_func:
4682            index2 = self._index
4683            peek = self._parse_string()
4684
4685            if not peek:
4686                self._retreat(index)
4687                return None
4688
4689            self._retreat(index2)
4690
4691        if not this:
4692            if self._match_text_seq("UNSIGNED"):
4693                unsigned_type_token = self.SIGNED_TO_UNSIGNED_TYPE_TOKEN.get(type_token)
4694                if not unsigned_type_token:
4695                    self.raise_error(f"Cannot convert {type_token.value} to unsigned.")
4696
4697                type_token = unsigned_type_token or type_token
4698
4699            this = exp.DataType(
4700                this=exp.DataType.Type[type_token.value],
4701                expressions=expressions,
4702                nested=nested,
4703                prefix=prefix,
4704            )
4705
4706            # Empty arrays/structs are allowed
4707            if values is not None:
4708                cls = exp.Struct if is_struct else exp.Array
4709                this = exp.cast(cls(expressions=values), this, copy=False)
4710
4711        elif expressions:
4712            this.set("expressions", expressions)
4713
4714        # https://materialize.com/docs/sql/types/list/#type-name
4715        while self._match(TokenType.LIST):
4716            this = exp.DataType(this=exp.DataType.Type.LIST, expressions=[this], nested=True)
4717
4718        index = self._index
4719
4720        # Postgres supports the INT ARRAY[3] syntax as a synonym for INT[3]
4721        matched_array = self._match(TokenType.ARRAY)
4722
4723        while self._curr:
4724            datatype_token = self._prev.token_type
4725            matched_l_bracket = self._match(TokenType.L_BRACKET)
4726            if not matched_l_bracket and not matched_array:
4727                break
4728
4729            matched_array = False
4730            values = self._parse_csv(self._parse_assignment) or None
4731            if (
4732                values
4733                and not schema
4734                and (
4735                    not self.dialect.SUPPORTS_FIXED_SIZE_ARRAYS or datatype_token == TokenType.ARRAY
4736                )
4737            ):
4738                # Retreating here means that we should not parse the following values as part of the data type, e.g. in DuckDB
4739                # ARRAY[1] should retreat and instead be parsed into exp.Array in contrast to INT[x][y] which denotes a fixed-size array data type
4740                self._retreat(index)
4741                break
4742
4743            this = exp.DataType(
4744                this=exp.DataType.Type.ARRAY, expressions=[this], values=values, nested=True
4745            )
4746            self._match(TokenType.R_BRACKET)
4747
4748        if self.TYPE_CONVERTERS and isinstance(this.this, exp.DataType.Type):
4749            converter = self.TYPE_CONVERTERS.get(this.this)
4750            if converter:
4751                this = converter(t.cast(exp.DataType, this))
4752
4753        return this
4754
4755    def _parse_struct_types(self, type_required: bool = False) -> t.Optional[exp.Expression]:
4756        index = self._index
4757
4758        if (
4759            self._curr
4760            and self._next
4761            and self._curr.token_type in self.TYPE_TOKENS
4762            and self._next.token_type in self.TYPE_TOKENS
4763        ):
4764            # Takes care of special cases like `STRUCT<list ARRAY<...>>` where the identifier is also a
4765            # type token. Without this, the list will be parsed as a type and we'll eventually crash
4766            this = self._parse_id_var()
4767        else:
4768            this = (
4769                self._parse_type(parse_interval=False, fallback_to_identifier=True)
4770                or self._parse_id_var()
4771            )
4772
4773        self._match(TokenType.COLON)
4774
4775        if (
4776            type_required
4777            and not isinstance(this, exp.DataType)
4778            and not self._match_set(self.TYPE_TOKENS, advance=False)
4779        ):
4780            self._retreat(index)
4781            return self._parse_types()
4782
4783        return self._parse_column_def(this)
4784
4785    def _parse_at_time_zone(self, this: t.Optional[exp.Expression]) -> t.Optional[exp.Expression]:
4786        if not self._match_text_seq("AT", "TIME", "ZONE"):
4787            return this
4788        return self.expression(exp.AtTimeZone, this=this, zone=self._parse_unary())
4789
4790    def _parse_column(self) -> t.Optional[exp.Expression]:
4791        this = self._parse_column_reference()
4792        column = self._parse_column_ops(this) if this else self._parse_bracket(this)
4793
4794        if self.dialect.SUPPORTS_COLUMN_JOIN_MARKS and column:
4795            column.set("join_mark", self._match(TokenType.JOIN_MARKER))
4796
4797        return column
4798
4799    def _parse_column_reference(self) -> t.Optional[exp.Expression]:
4800        this = self._parse_field()
4801        if (
4802            not this
4803            and self._match(TokenType.VALUES, advance=False)
4804            and self.VALUES_FOLLOWED_BY_PAREN
4805            and (not self._next or self._next.token_type != TokenType.L_PAREN)
4806        ):
4807            this = self._parse_id_var()
4808
4809        if isinstance(this, exp.Identifier):
4810            # We bubble up comments from the Identifier to the Column
4811            this = self.expression(exp.Column, comments=this.pop_comments(), this=this)
4812
4813        return this
4814
4815    def _parse_colon_as_variant_extract(
4816        self, this: t.Optional[exp.Expression]
4817    ) -> t.Optional[exp.Expression]:
4818        casts = []
4819        json_path = []
4820
4821        while self._match(TokenType.COLON):
4822            start_index = self._index
4823
4824            # Snowflake allows reserved keywords as json keys but advance_any() excludes TokenType.SELECT from any_tokens=True
4825            path = self._parse_column_ops(
4826                self._parse_field(any_token=True, tokens=(TokenType.SELECT,))
4827            )
4828
4829            # The cast :: operator has a lower precedence than the extraction operator :, so
4830            # we rearrange the AST appropriately to avoid casting the JSON path
4831            while isinstance(path, exp.Cast):
4832                casts.append(path.to)
4833                path = path.this
4834
4835            if casts:
4836                dcolon_offset = next(
4837                    i
4838                    for i, t in enumerate(self._tokens[start_index:])
4839                    if t.token_type == TokenType.DCOLON
4840                )
4841                end_token = self._tokens[start_index + dcolon_offset - 1]
4842            else:
4843                end_token = self._prev
4844
4845            if path:
4846                json_path.append(self._find_sql(self._tokens[start_index], end_token))
4847
4848        # The VARIANT extract in Snowflake/Databricks is parsed as a JSONExtract; Snowflake uses the json_path in GET_PATH() while
4849        # Databricks transforms it back to the colon/dot notation
4850        if json_path:
4851            this = self.expression(
4852                exp.JSONExtract,
4853                this=this,
4854                expression=self.dialect.to_json_path(exp.Literal.string(".".join(json_path))),
4855                variant_extract=True,
4856            )
4857
4858            while casts:
4859                this = self.expression(exp.Cast, this=this, to=casts.pop())
4860
4861        return this
4862
4863    def _parse_dcolon(self) -> t.Optional[exp.Expression]:
4864        return self._parse_types()
4865
4866    def _parse_column_ops(self, this: t.Optional[exp.Expression]) -> t.Optional[exp.Expression]:
4867        this = self._parse_bracket(this)
4868
4869        while self._match_set(self.COLUMN_OPERATORS):
4870            op_token = self._prev.token_type
4871            op = self.COLUMN_OPERATORS.get(op_token)
4872
4873            if op_token == TokenType.DCOLON:
4874                field = self._parse_dcolon()
4875                if not field:
4876                    self.raise_error("Expected type")
4877            elif op and self._curr:
4878                field = self._parse_column_reference()
4879            else:
4880                field = self._parse_field(any_token=True, anonymous_func=True)
4881
4882            if isinstance(field, exp.Func) and this:
4883                # bigquery allows function calls like x.y.count(...)
4884                # SAFE.SUBSTR(...)
4885                # https://cloud.google.com/bigquery/docs/reference/standard-sql/functions-reference#function_call_rules
4886                this = exp.replace_tree(
4887                    this,
4888                    lambda n: (
4889                        self.expression(exp.Dot, this=n.args.get("table"), expression=n.this)
4890                        if n.table
4891                        else n.this
4892                    )
4893                    if isinstance(n, exp.Column)
4894                    else n,
4895                )
4896
4897            if op:
4898                this = op(self, this, field)
4899            elif isinstance(this, exp.Column) and not this.args.get("catalog"):
4900                this = self.expression(
4901                    exp.Column,
4902                    this=field,
4903                    table=this.this,
4904                    db=this.args.get("table"),
4905                    catalog=this.args.get("db"),
4906                )
4907            else:
4908                this = self.expression(exp.Dot, this=this, expression=field)
4909
4910            this = self._parse_bracket(this)
4911
4912        return self._parse_colon_as_variant_extract(this) if self.COLON_IS_VARIANT_EXTRACT else this
4913
4914    def _parse_primary(self) -> t.Optional[exp.Expression]:
4915        if self._match_set(self.PRIMARY_PARSERS):
4916            token_type = self._prev.token_type
4917            primary = self.PRIMARY_PARSERS[token_type](self, self._prev)
4918
4919            if token_type == TokenType.STRING:
4920                expressions = [primary]
4921                while self._match(TokenType.STRING):
4922                    expressions.append(exp.Literal.string(self._prev.text))
4923
4924                if len(expressions) > 1:
4925                    return self.expression(exp.Concat, expressions=expressions)
4926
4927            return primary
4928
4929        if self._match_pair(TokenType.DOT, TokenType.NUMBER):
4930            return exp.Literal.number(f"0.{self._prev.text}")
4931
4932        if self._match(TokenType.L_PAREN):
4933            comments = self._prev_comments
4934            query = self._parse_select()
4935
4936            if query:
4937                expressions = [query]
4938            else:
4939                expressions = self._parse_expressions()
4940
4941            this = self._parse_query_modifiers(seq_get(expressions, 0))
4942
4943            if not this and self._match(TokenType.R_PAREN, advance=False):
4944                this = self.expression(exp.Tuple)
4945            elif isinstance(this, exp.UNWRAPPED_QUERIES):
4946                this = self._parse_subquery(this=this, parse_alias=False)
4947            elif isinstance(this, exp.Subquery):
4948                this = self._parse_subquery(
4949                    this=self._parse_set_operations(this), parse_alias=False
4950                )
4951            elif len(expressions) > 1 or self._prev.token_type == TokenType.COMMA:
4952                this = self.expression(exp.Tuple, expressions=expressions)
4953            else:
4954                this = self.expression(exp.Paren, this=this)
4955
4956            if this:
4957                this.add_comments(comments)
4958
4959            self._match_r_paren(expression=this)
4960            return this
4961
4962        return None
4963
4964    def _parse_field(
4965        self,
4966        any_token: bool = False,
4967        tokens: t.Optional[t.Collection[TokenType]] = None,
4968        anonymous_func: bool = False,
4969    ) -> t.Optional[exp.Expression]:
4970        if anonymous_func:
4971            field = (
4972                self._parse_function(anonymous=anonymous_func, any_token=any_token)
4973                or self._parse_primary()
4974            )
4975        else:
4976            field = self._parse_primary() or self._parse_function(
4977                anonymous=anonymous_func, any_token=any_token
4978            )
4979        return field or self._parse_id_var(any_token=any_token, tokens=tokens)
4980
4981    def _parse_function(
4982        self,
4983        functions: t.Optional[t.Dict[str, t.Callable]] = None,
4984        anonymous: bool = False,
4985        optional_parens: bool = True,
4986        any_token: bool = False,
4987    ) -> t.Optional[exp.Expression]:
4988        # This allows us to also parse {fn <function>} syntax (Snowflake, MySQL support this)
4989        # See: https://community.snowflake.com/s/article/SQL-Escape-Sequences
4990        fn_syntax = False
4991        if (
4992            self._match(TokenType.L_BRACE, advance=False)
4993            and self._next
4994            and self._next.text.upper() == "FN"
4995        ):
4996            self._advance(2)
4997            fn_syntax = True
4998
4999        func = self._parse_function_call(
5000            functions=functions,
5001            anonymous=anonymous,
5002            optional_parens=optional_parens,
5003            any_token=any_token,
5004        )
5005
5006        if fn_syntax:
5007            self._match(TokenType.R_BRACE)
5008
5009        return func
5010
5011    def _parse_function_call(
5012        self,
5013        functions: t.Optional[t.Dict[str, t.Callable]] = None,
5014        anonymous: bool = False,
5015        optional_parens: bool = True,
5016        any_token: bool = False,
5017    ) -> t.Optional[exp.Expression]:
5018        if not self._curr:
5019            return None
5020
5021        comments = self._curr.comments
5022        token_type = self._curr.token_type
5023        this = self._curr.text
5024        upper = this.upper()
5025
5026        parser = self.NO_PAREN_FUNCTION_PARSERS.get(upper)
5027        if optional_parens and parser and token_type not in self.INVALID_FUNC_NAME_TOKENS:
5028            self._advance()
5029            return self._parse_window(parser(self))
5030
5031        if not self._next or self._next.token_type != TokenType.L_PAREN:
5032            if optional_parens and token_type in self.NO_PAREN_FUNCTIONS:
5033                self._advance()
5034                return self.expression(self.NO_PAREN_FUNCTIONS[token_type])
5035
5036            return None
5037
5038        if any_token:
5039            if token_type in self.RESERVED_TOKENS:
5040                return None
5041        elif token_type not in self.FUNC_TOKENS:
5042            return None
5043
5044        self._advance(2)
5045
5046        parser = self.FUNCTION_PARSERS.get(upper)
5047        if parser and not anonymous:
5048            this = parser(self)
5049        else:
5050            subquery_predicate = self.SUBQUERY_PREDICATES.get(token_type)
5051
5052            if subquery_predicate and self._curr.token_type in (TokenType.SELECT, TokenType.WITH):
5053                this = self.expression(subquery_predicate, this=self._parse_select())
5054                self._match_r_paren()
5055                return this
5056
5057            if functions is None:
5058                functions = self.FUNCTIONS
5059
5060            function = functions.get(upper)
5061
5062            alias = upper in self.FUNCTIONS_WITH_ALIASED_ARGS
5063            args = self._parse_csv(lambda: self._parse_lambda(alias=alias))
5064
5065            if alias:
5066                args = self._kv_to_prop_eq(args)
5067
5068            if function and not anonymous:
5069                if "dialect" in function.__code__.co_varnames:
5070                    func = function(args, dialect=self.dialect)
5071                else:
5072                    func = function(args)
5073
5074                func = self.validate_expression(func, args)
5075                if not self.dialect.NORMALIZE_FUNCTIONS:
5076                    func.meta["name"] = this
5077
5078                this = func
5079            else:
5080                if token_type == TokenType.IDENTIFIER:
5081                    this = exp.Identifier(this=this, quoted=True)
5082                this = self.expression(exp.Anonymous, this=this, expressions=args)
5083
5084        if isinstance(this, exp.Expression):
5085            this.add_comments(comments)
5086
5087        self._match_r_paren(this)
5088        return self._parse_window(this)
5089
5090    def _kv_to_prop_eq(self, expressions: t.List[exp.Expression]) -> t.List[exp.Expression]:
5091        transformed = []
5092
5093        for e in expressions:
5094            if isinstance(e, self.KEY_VALUE_DEFINITIONS):
5095                if isinstance(e, exp.Alias):
5096                    e = self.expression(exp.PropertyEQ, this=e.args.get("alias"), expression=e.this)
5097
5098                if not isinstance(e, exp.PropertyEQ):
5099                    e = self.expression(
5100                        exp.PropertyEQ, this=exp.to_identifier(e.this.name), expression=e.expression
5101                    )
5102
5103                if isinstance(e.this, exp.Column):
5104                    e.this.replace(e.this.this)
5105
5106            transformed.append(e)
5107
5108        return transformed
5109
5110    def _parse_function_parameter(self) -> t.Optional[exp.Expression]:
5111        return self._parse_column_def(self._parse_id_var())
5112
5113    def _parse_user_defined_function(
5114        self, kind: t.Optional[TokenType] = None
5115    ) -> t.Optional[exp.Expression]:
5116        this = self._parse_id_var()
5117
5118        while self._match(TokenType.DOT):
5119            this = self.expression(exp.Dot, this=this, expression=self._parse_id_var())
5120
5121        if not self._match(TokenType.L_PAREN):
5122            return this
5123
5124        expressions = self._parse_csv(self._parse_function_parameter)
5125        self._match_r_paren()
5126        return self.expression(
5127            exp.UserDefinedFunction, this=this, expressions=expressions, wrapped=True
5128        )
5129
5130    def _parse_introducer(self, token: Token) -> exp.Introducer | exp.Identifier:
5131        literal = self._parse_primary()
5132        if literal:
5133            return self.expression(exp.Introducer, this=token.text, expression=literal)
5134
5135        return self.expression(exp.Identifier, this=token.text)
5136
5137    def _parse_session_parameter(self) -> exp.SessionParameter:
5138        kind = None
5139        this = self._parse_id_var() or self._parse_primary()
5140
5141        if this and self._match(TokenType.DOT):
5142            kind = this.name
5143            this = self._parse_var() or self._parse_primary()
5144
5145        return self.expression(exp.SessionParameter, this=this, kind=kind)
5146
5147    def _parse_lambda_arg(self) -> t.Optional[exp.Expression]:
5148        return self._parse_id_var()
5149
5150    def _parse_lambda(self, alias: bool = False) -> t.Optional[exp.Expression]:
5151        index = self._index
5152
5153        if self._match(TokenType.L_PAREN):
5154            expressions = t.cast(
5155                t.List[t.Optional[exp.Expression]], self._parse_csv(self._parse_lambda_arg)
5156            )
5157
5158            if not self._match(TokenType.R_PAREN):
5159                self._retreat(index)
5160        else:
5161            expressions = [self._parse_lambda_arg()]
5162
5163        if self._match_set(self.LAMBDAS):
5164            return self.LAMBDAS[self._prev.token_type](self, expressions)
5165
5166        self._retreat(index)
5167
5168        this: t.Optional[exp.Expression]
5169
5170        if self._match(TokenType.DISTINCT):
5171            this = self.expression(
5172                exp.Distinct, expressions=self._parse_csv(self._parse_assignment)
5173            )
5174        else:
5175            this = self._parse_select_or_expression(alias=alias)
5176
5177        return self._parse_limit(
5178            self._parse_order(self._parse_having_max(self._parse_respect_or_ignore_nulls(this)))
5179        )
5180
5181    def _parse_schema(self, this: t.Optional[exp.Expression] = None) -> t.Optional[exp.Expression]:
5182        index = self._index
5183        if not self._match(TokenType.L_PAREN):
5184            return this
5185
5186        # Disambiguate between schema and subquery/CTE, e.g. in INSERT INTO table (<expr>),
5187        # expr can be of both types
5188        if self._match_set(self.SELECT_START_TOKENS):
5189            self._retreat(index)
5190            return this
5191        args = self._parse_csv(lambda: self._parse_constraint() or self._parse_field_def())
5192        self._match_r_paren()
5193        return self.expression(exp.Schema, this=this, expressions=args)
5194
5195    def _parse_field_def(self) -> t.Optional[exp.Expression]:
5196        return self._parse_column_def(self._parse_field(any_token=True))
5197
5198    def _parse_column_def(self, this: t.Optional[exp.Expression]) -> t.Optional[exp.Expression]:
5199        # column defs are not really columns, they're identifiers
5200        if isinstance(this, exp.Column):
5201            this = this.this
5202
5203        kind = self._parse_types(schema=True)
5204
5205        if self._match_text_seq("FOR", "ORDINALITY"):
5206            return self.expression(exp.ColumnDef, this=this, ordinality=True)
5207
5208        constraints: t.List[exp.Expression] = []
5209
5210        if (not kind and self._match(TokenType.ALIAS)) or self._match_texts(
5211            ("ALIAS", "MATERIALIZED")
5212        ):
5213            persisted = self._prev.text.upper() == "MATERIALIZED"
5214            constraints.append(
5215                self.expression(
5216                    exp.ComputedColumnConstraint,
5217                    this=self._parse_assignment(),
5218                    persisted=persisted or self._match_text_seq("PERSISTED"),
5219                    not_null=self._match_pair(TokenType.NOT, TokenType.NULL),
5220                )
5221            )
5222        elif kind and self._match_pair(TokenType.ALIAS, TokenType.L_PAREN, advance=False):
5223            self._match(TokenType.ALIAS)
5224            constraints.append(
5225                self.expression(exp.TransformColumnConstraint, this=self._parse_field())
5226            )
5227
5228        while True:
5229            constraint = self._parse_column_constraint()
5230            if not constraint:
5231                break
5232            constraints.append(constraint)
5233
5234        if not kind and not constraints:
5235            return this
5236
5237        return self.expression(exp.ColumnDef, this=this, kind=kind, constraints=constraints)
5238
5239    def _parse_auto_increment(
5240        self,
5241    ) -> exp.GeneratedAsIdentityColumnConstraint | exp.AutoIncrementColumnConstraint:
5242        start = None
5243        increment = None
5244
5245        if self._match(TokenType.L_PAREN, advance=False):
5246            args = self._parse_wrapped_csv(self._parse_bitwise)
5247            start = seq_get(args, 0)
5248            increment = seq_get(args, 1)
5249        elif self._match_text_seq("START"):
5250            start = self._parse_bitwise()
5251            self._match_text_seq("INCREMENT")
5252            increment = self._parse_bitwise()
5253
5254        if start and increment:
5255            return exp.GeneratedAsIdentityColumnConstraint(start=start, increment=increment)
5256
5257        return exp.AutoIncrementColumnConstraint()
5258
5259    def _parse_auto_property(self) -> t.Optional[exp.AutoRefreshProperty]:
5260        if not self._match_text_seq("REFRESH"):
5261            self._retreat(self._index - 1)
5262            return None
5263        return self.expression(exp.AutoRefreshProperty, this=self._parse_var(upper=True))
5264
5265    def _parse_compress(self) -> exp.CompressColumnConstraint:
5266        if self._match(TokenType.L_PAREN, advance=False):
5267            return self.expression(
5268                exp.CompressColumnConstraint, this=self._parse_wrapped_csv(self._parse_bitwise)
5269            )
5270
5271        return self.expression(exp.CompressColumnConstraint, this=self._parse_bitwise())
5272
5273    def _parse_generated_as_identity(
5274        self,
5275    ) -> (
5276        exp.GeneratedAsIdentityColumnConstraint
5277        | exp.ComputedColumnConstraint
5278        | exp.GeneratedAsRowColumnConstraint
5279    ):
5280        if self._match_text_seq("BY", "DEFAULT"):
5281            on_null = self._match_pair(TokenType.ON, TokenType.NULL)
5282            this = self.expression(
5283                exp.GeneratedAsIdentityColumnConstraint, this=False, on_null=on_null
5284            )
5285        else:
5286            self._match_text_seq("ALWAYS")
5287            this = self.expression(exp.GeneratedAsIdentityColumnConstraint, this=True)
5288
5289        self._match(TokenType.ALIAS)
5290
5291        if self._match_text_seq("ROW"):
5292            start = self._match_text_seq("START")
5293            if not start:
5294                self._match(TokenType.END)
5295            hidden = self._match_text_seq("HIDDEN")
5296            return self.expression(exp.GeneratedAsRowColumnConstraint, start=start, hidden=hidden)
5297
5298        identity = self._match_text_seq("IDENTITY")
5299
5300        if self._match(TokenType.L_PAREN):
5301            if self._match(TokenType.START_WITH):
5302                this.set("start", self._parse_bitwise())
5303            if self._match_text_seq("INCREMENT", "BY"):
5304                this.set("increment", self._parse_bitwise())
5305            if self._match_text_seq("MINVALUE"):
5306                this.set("minvalue", self._parse_bitwise())
5307            if self._match_text_seq("MAXVALUE"):
5308                this.set("maxvalue", self._parse_bitwise())
5309
5310            if self._match_text_seq("CYCLE"):
5311                this.set("cycle", True)
5312            elif self._match_text_seq("NO", "CYCLE"):
5313                this.set("cycle", False)
5314
5315            if not identity:
5316                this.set("expression", self._parse_range())
5317            elif not this.args.get("start") and self._match(TokenType.NUMBER, advance=False):
5318                args = self._parse_csv(self._parse_bitwise)
5319                this.set("start", seq_get(args, 0))
5320                this.set("increment", seq_get(args, 1))
5321
5322            self._match_r_paren()
5323
5324        return this
5325
5326    def _parse_inline(self) -> exp.InlineLengthColumnConstraint:
5327        self._match_text_seq("LENGTH")
5328        return self.expression(exp.InlineLengthColumnConstraint, this=self._parse_bitwise())
5329
5330    def _parse_not_constraint(self) -> t.Optional[exp.Expression]:
5331        if self._match_text_seq("NULL"):
5332            return self.expression(exp.NotNullColumnConstraint)
5333        if self._match_text_seq("CASESPECIFIC"):
5334            return self.expression(exp.CaseSpecificColumnConstraint, not_=True)
5335        if self._match_text_seq("FOR", "REPLICATION"):
5336            return self.expression(exp.NotForReplicationColumnConstraint)
5337        return None
5338
5339    def _parse_column_constraint(self) -> t.Optional[exp.Expression]:
5340        if self._match(TokenType.CONSTRAINT):
5341            this = self._parse_id_var()
5342        else:
5343            this = None
5344
5345        if self._match_texts(self.CONSTRAINT_PARSERS):
5346            return self.expression(
5347                exp.ColumnConstraint,
5348                this=this,
5349                kind=self.CONSTRAINT_PARSERS[self._prev.text.upper()](self),
5350            )
5351
5352        return this
5353
5354    def _parse_constraint(self) -> t.Optional[exp.Expression]:
5355        if not self._match(TokenType.CONSTRAINT):
5356            return self._parse_unnamed_constraint(constraints=self.SCHEMA_UNNAMED_CONSTRAINTS)
5357
5358        return self.expression(
5359            exp.Constraint,
5360            this=self._parse_id_var(),
5361            expressions=self._parse_unnamed_constraints(),
5362        )
5363
5364    def _parse_unnamed_constraints(self) -> t.List[exp.Expression]:
5365        constraints = []
5366        while True:
5367            constraint = self._parse_unnamed_constraint() or self._parse_function()
5368            if not constraint:
5369                break
5370            constraints.append(constraint)
5371
5372        return constraints
5373
5374    def _parse_unnamed_constraint(
5375        self, constraints: t.Optional[t.Collection[str]] = None
5376    ) -> t.Optional[exp.Expression]:
5377        if self._match(TokenType.IDENTIFIER, advance=False) or not self._match_texts(
5378            constraints or self.CONSTRAINT_PARSERS
5379        ):
5380            return None
5381
5382        constraint = self._prev.text.upper()
5383        if constraint not in self.CONSTRAINT_PARSERS:
5384            self.raise_error(f"No parser found for schema constraint {constraint}.")
5385
5386        return self.CONSTRAINT_PARSERS[constraint](self)
5387
5388    def _parse_unique_key(self) -> t.Optional[exp.Expression]:
5389        return self._parse_id_var(any_token=False)
5390
5391    def _parse_unique(self) -> exp.UniqueColumnConstraint:
5392        self._match_text_seq("KEY")
5393        return self.expression(
5394            exp.UniqueColumnConstraint,
5395            nulls=self._match_text_seq("NULLS", "NOT", "DISTINCT"),
5396            this=self._parse_schema(self._parse_unique_key()),
5397            index_type=self._match(TokenType.USING) and self._advance_any() and self._prev.text,
5398            on_conflict=self._parse_on_conflict(),
5399        )
5400
5401    def _parse_key_constraint_options(self) -> t.List[str]:
5402        options = []
5403        while True:
5404            if not self._curr:
5405                break
5406
5407            if self._match(TokenType.ON):
5408                action = None
5409                on = self._advance_any() and self._prev.text
5410
5411                if self._match_text_seq("NO", "ACTION"):
5412                    action = "NO ACTION"
5413                elif self._match_text_seq("CASCADE"):
5414                    action = "CASCADE"
5415                elif self._match_text_seq("RESTRICT"):
5416                    action = "RESTRICT"
5417                elif self._match_pair(TokenType.SET, TokenType.NULL):
5418                    action = "SET NULL"
5419                elif self._match_pair(TokenType.SET, TokenType.DEFAULT):
5420                    action = "SET DEFAULT"
5421                else:
5422                    self.raise_error("Invalid key constraint")
5423
5424                options.append(f"ON {on} {action}")
5425            else:
5426                var = self._parse_var_from_options(
5427                    self.KEY_CONSTRAINT_OPTIONS, raise_unmatched=False
5428                )
5429                if not var:
5430                    break
5431                options.append(var.name)
5432
5433        return options
5434
5435    def _parse_references(self, match: bool = True) -> t.Optional[exp.Reference]:
5436        if match and not self._match(TokenType.REFERENCES):
5437            return None
5438
5439        expressions = None
5440        this = self._parse_table(schema=True)
5441        options = self._parse_key_constraint_options()
5442        return self.expression(exp.Reference, this=this, expressions=expressions, options=options)
5443
5444    def _parse_foreign_key(self) -> exp.ForeignKey:
5445        expressions = self._parse_wrapped_id_vars()
5446        reference = self._parse_references()
5447        options = {}
5448
5449        while self._match(TokenType.ON):
5450            if not self._match_set((TokenType.DELETE, TokenType.UPDATE)):
5451                self.raise_error("Expected DELETE or UPDATE")
5452
5453            kind = self._prev.text.lower()
5454
5455            if self._match_text_seq("NO", "ACTION"):
5456                action = "NO ACTION"
5457            elif self._match(TokenType.SET):
5458                self._match_set((TokenType.NULL, TokenType.DEFAULT))
5459                action = "SET " + self._prev.text.upper()
5460            else:
5461                self._advance()
5462                action = self._prev.text.upper()
5463
5464            options[kind] = action
5465
5466        return self.expression(
5467            exp.ForeignKey,
5468            expressions=expressions,
5469            reference=reference,
5470            **options,  # type: ignore
5471        )
5472
5473    def _parse_primary_key_part(self) -> t.Optional[exp.Expression]:
5474        return self._parse_field()
5475
5476    def _parse_period_for_system_time(self) -> t.Optional[exp.PeriodForSystemTimeConstraint]:
5477        if not self._match(TokenType.TIMESTAMP_SNAPSHOT):
5478            self._retreat(self._index - 1)
5479            return None
5480
5481        id_vars = self._parse_wrapped_id_vars()
5482        return self.expression(
5483            exp.PeriodForSystemTimeConstraint,
5484            this=seq_get(id_vars, 0),
5485            expression=seq_get(id_vars, 1),
5486        )
5487
5488    def _parse_primary_key(
5489        self, wrapped_optional: bool = False, in_props: bool = False
5490    ) -> exp.PrimaryKeyColumnConstraint | exp.PrimaryKey:
5491        desc = (
5492            self._match_set((TokenType.ASC, TokenType.DESC))
5493            and self._prev.token_type == TokenType.DESC
5494        )
5495
5496        if not in_props and not self._match(TokenType.L_PAREN, advance=False):
5497            return self.expression(exp.PrimaryKeyColumnConstraint, desc=desc)
5498
5499        expressions = self._parse_wrapped_csv(
5500            self._parse_primary_key_part, optional=wrapped_optional
5501        )
5502        options = self._parse_key_constraint_options()
5503        return self.expression(exp.PrimaryKey, expressions=expressions, options=options)
5504
5505    def _parse_bracket_key_value(self, is_map: bool = False) -> t.Optional[exp.Expression]:
5506        return self._parse_slice(self._parse_alias(self._parse_assignment(), explicit=True))
5507
5508    def _parse_bracket(self, this: t.Optional[exp.Expression] = None) -> t.Optional[exp.Expression]:
5509        if not self._match_set((TokenType.L_BRACKET, TokenType.L_BRACE)):
5510            return this
5511
5512        bracket_kind = self._prev.token_type
5513        expressions = self._parse_csv(
5514            lambda: self._parse_bracket_key_value(is_map=bracket_kind == TokenType.L_BRACE)
5515        )
5516
5517        if bracket_kind == TokenType.L_BRACKET and not self._match(TokenType.R_BRACKET):
5518            self.raise_error("Expected ]")
5519        elif bracket_kind == TokenType.L_BRACE and not self._match(TokenType.R_BRACE):
5520            self.raise_error("Expected }")
5521
5522        # https://duckdb.org/docs/sql/data_types/struct.html#creating-structs
5523        if bracket_kind == TokenType.L_BRACE:
5524            this = self.expression(exp.Struct, expressions=self._kv_to_prop_eq(expressions))
5525        elif not this:
5526            this = build_array_constructor(
5527                exp.Array, args=expressions, bracket_kind=bracket_kind, dialect=self.dialect
5528            )
5529        else:
5530            constructor_type = self.ARRAY_CONSTRUCTORS.get(this.name.upper())
5531            if constructor_type:
5532                return build_array_constructor(
5533                    constructor_type,
5534                    args=expressions,
5535                    bracket_kind=bracket_kind,
5536                    dialect=self.dialect,
5537                )
5538
5539            expressions = apply_index_offset(this, expressions, -self.dialect.INDEX_OFFSET)
5540            this = self.expression(exp.Bracket, this=this, expressions=expressions)
5541
5542        self._add_comments(this)
5543        return self._parse_bracket(this)
5544
5545    def _parse_slice(self, this: t.Optional[exp.Expression]) -> t.Optional[exp.Expression]:
5546        if self._match(TokenType.COLON):
5547            return self.expression(exp.Slice, this=this, expression=self._parse_assignment())
5548        return this
5549
5550    def _parse_case(self) -> t.Optional[exp.Expression]:
5551        ifs = []
5552        default = None
5553
5554        comments = self._prev_comments
5555        expression = self._parse_assignment()
5556
5557        while self._match(TokenType.WHEN):
5558            this = self._parse_assignment()
5559            self._match(TokenType.THEN)
5560            then = self._parse_assignment()
5561            ifs.append(self.expression(exp.If, this=this, true=then))
5562
5563        if self._match(TokenType.ELSE):
5564            default = self._parse_assignment()
5565
5566        if not self._match(TokenType.END):
5567            if isinstance(default, exp.Interval) and default.this.sql().upper() == "END":
5568                default = exp.column("interval")
5569            else:
5570                self.raise_error("Expected END after CASE", self._prev)
5571
5572        return self.expression(
5573            exp.Case, comments=comments, this=expression, ifs=ifs, default=default
5574        )
5575
5576    def _parse_if(self) -> t.Optional[exp.Expression]:
5577        if self._match(TokenType.L_PAREN):
5578            args = self._parse_csv(self._parse_assignment)
5579            this = self.validate_expression(exp.If.from_arg_list(args), args)
5580            self._match_r_paren()
5581        else:
5582            index = self._index - 1
5583
5584            if self.NO_PAREN_IF_COMMANDS and index == 0:
5585                return self._parse_as_command(self._prev)
5586
5587            condition = self._parse_assignment()
5588
5589            if not condition:
5590                self._retreat(index)
5591                return None
5592
5593            self._match(TokenType.THEN)
5594            true = self._parse_assignment()
5595            false = self._parse_assignment() if self._match(TokenType.ELSE) else None
5596            self._match(TokenType.END)
5597            this = self.expression(exp.If, this=condition, true=true, false=false)
5598
5599        return this
5600
5601    def _parse_next_value_for(self) -> t.Optional[exp.Expression]:
5602        if not self._match_text_seq("VALUE", "FOR"):
5603            self._retreat(self._index - 1)
5604            return None
5605
5606        return self.expression(
5607            exp.NextValueFor,
5608            this=self._parse_column(),
5609            order=self._match(TokenType.OVER) and self._parse_wrapped(self._parse_order),
5610        )
5611
5612    def _parse_extract(self) -> exp.Extract | exp.Anonymous:
5613        this = self._parse_function() or self._parse_var_or_string(upper=True)
5614
5615        if self._match(TokenType.FROM):
5616            return self.expression(exp.Extract, this=this, expression=self._parse_bitwise())
5617
5618        if not self._match(TokenType.COMMA):
5619            self.raise_error("Expected FROM or comma after EXTRACT", self._prev)
5620
5621        return self.expression(exp.Extract, this=this, expression=self._parse_bitwise())
5622
5623    def _parse_gap_fill(self) -> exp.GapFill:
5624        self._match(TokenType.TABLE)
5625        this = self._parse_table()
5626
5627        self._match(TokenType.COMMA)
5628        args = [this, *self._parse_csv(self._parse_lambda)]
5629
5630        gap_fill = exp.GapFill.from_arg_list(args)
5631        return self.validate_expression(gap_fill, args)
5632
5633    def _parse_cast(self, strict: bool, safe: t.Optional[bool] = None) -> exp.Expression:
5634        this = self._parse_assignment()
5635
5636        if not self._match(TokenType.ALIAS):
5637            if self._match(TokenType.COMMA):
5638                return self.expression(exp.CastToStrType, this=this, to=self._parse_string())
5639
5640            self.raise_error("Expected AS after CAST")
5641
5642        fmt = None
5643        to = self._parse_types()
5644
5645        if self._match(TokenType.FORMAT):
5646            fmt_string = self._parse_string()
5647            fmt = self._parse_at_time_zone(fmt_string)
5648
5649            if not to:
5650                to = exp.DataType.build(exp.DataType.Type.UNKNOWN)
5651            if to.this in exp.DataType.TEMPORAL_TYPES:
5652                this = self.expression(
5653                    exp.StrToDate if to.this == exp.DataType.Type.DATE else exp.StrToTime,
5654                    this=this,
5655                    format=exp.Literal.string(
5656                        format_time(
5657                            fmt_string.this if fmt_string else "",
5658                            self.dialect.FORMAT_MAPPING or self.dialect.TIME_MAPPING,
5659                            self.dialect.FORMAT_TRIE or self.dialect.TIME_TRIE,
5660                        )
5661                    ),
5662                    safe=safe,
5663                )
5664
5665                if isinstance(fmt, exp.AtTimeZone) and isinstance(this, exp.StrToTime):
5666                    this.set("zone", fmt.args["zone"])
5667                return this
5668        elif not to:
5669            self.raise_error("Expected TYPE after CAST")
5670        elif isinstance(to, exp.Identifier):
5671            to = exp.DataType.build(to.name, udt=True)
5672        elif to.this == exp.DataType.Type.CHAR:
5673            if self._match(TokenType.CHARACTER_SET):
5674                to = self.expression(exp.CharacterSet, this=self._parse_var_or_string())
5675
5676        return self.expression(
5677            exp.Cast if strict else exp.TryCast,
5678            this=this,
5679            to=to,
5680            format=fmt,
5681            safe=safe,
5682            action=self._parse_var_from_options(self.CAST_ACTIONS, raise_unmatched=False),
5683        )
5684
5685    def _parse_string_agg(self) -> exp.Expression:
5686        if self._match(TokenType.DISTINCT):
5687            args: t.List[t.Optional[exp.Expression]] = [
5688                self.expression(exp.Distinct, expressions=[self._parse_assignment()])
5689            ]
5690            if self._match(TokenType.COMMA):
5691                args.extend(self._parse_csv(self._parse_assignment))
5692        else:
5693            args = self._parse_csv(self._parse_assignment)  # type: ignore
5694
5695        index = self._index
5696        if not self._match(TokenType.R_PAREN) and args:
5697            # postgres: STRING_AGG([DISTINCT] expression, separator [ORDER BY expression1 {ASC | DESC} [, ...]])
5698            # bigquery: STRING_AGG([DISTINCT] expression [, separator] [ORDER BY key [{ASC | DESC}] [, ... ]] [LIMIT n])
5699            args[-1] = self._parse_limit(this=self._parse_order(this=args[-1]))
5700            return self.expression(exp.GroupConcat, this=args[0], separator=seq_get(args, 1))
5701
5702        # Checks if we can parse an order clause: WITHIN GROUP (ORDER BY <order_by_expression_list> [ASC | DESC]).
5703        # This is done "manually", instead of letting _parse_window parse it into an exp.WithinGroup node, so that
5704        # the STRING_AGG call is parsed like in MySQL / SQLite and can thus be transpiled more easily to them.
5705        if not self._match_text_seq("WITHIN", "GROUP"):
5706            self._retreat(index)
5707            return self.validate_expression(exp.GroupConcat.from_arg_list(args), args)
5708
5709        self._match_l_paren()  # The corresponding match_r_paren will be called in parse_function (caller)
5710        order = self._parse_order(this=seq_get(args, 0))
5711        return self.expression(exp.GroupConcat, this=order, separator=seq_get(args, 1))
5712
5713    def _parse_convert(
5714        self, strict: bool, safe: t.Optional[bool] = None
5715    ) -> t.Optional[exp.Expression]:
5716        this = self._parse_bitwise()
5717
5718        if self._match(TokenType.USING):
5719            to: t.Optional[exp.Expression] = self.expression(
5720                exp.CharacterSet, this=self._parse_var()
5721            )
5722        elif self._match(TokenType.COMMA):
5723            to = self._parse_types()
5724        else:
5725            to = None
5726
5727        return self.expression(exp.Cast if strict else exp.TryCast, this=this, to=to, safe=safe)
5728
5729    def _parse_decode(self) -> t.Optional[exp.Decode | exp.Case]:
5730        """
5731        There are generally two variants of the DECODE function:
5732
5733        - DECODE(bin, charset)
5734        - DECODE(expression, search, result [, search, result] ... [, default])
5735
5736        The second variant will always be parsed into a CASE expression. Note that NULL
5737        needs special treatment, since we need to explicitly check for it with `IS NULL`,
5738        instead of relying on pattern matching.
5739        """
5740        args = self._parse_csv(self._parse_assignment)
5741
5742        if len(args) < 3:
5743            return self.expression(exp.Decode, this=seq_get(args, 0), charset=seq_get(args, 1))
5744
5745        expression, *expressions = args
5746        if not expression:
5747            return None
5748
5749        ifs = []
5750        for search, result in zip(expressions[::2], expressions[1::2]):
5751            if not search or not result:
5752                return None
5753
5754            if isinstance(search, exp.Literal):
5755                ifs.append(
5756                    exp.If(this=exp.EQ(this=expression.copy(), expression=search), true=result)
5757                )
5758            elif isinstance(search, exp.Null):
5759                ifs.append(
5760                    exp.If(this=exp.Is(this=expression.copy(), expression=exp.Null()), true=result)
5761                )
5762            else:
5763                cond = exp.or_(
5764                    exp.EQ(this=expression.copy(), expression=search),
5765                    exp.and_(
5766                        exp.Is(this=expression.copy(), expression=exp.Null()),
5767                        exp.Is(this=search.copy(), expression=exp.Null()),
5768                        copy=False,
5769                    ),
5770                    copy=False,
5771                )
5772                ifs.append(exp.If(this=cond, true=result))
5773
5774        return exp.Case(ifs=ifs, default=expressions[-1] if len(expressions) % 2 == 1 else None)
5775
5776    def _parse_json_key_value(self) -> t.Optional[exp.JSONKeyValue]:
5777        self._match_text_seq("KEY")
5778        key = self._parse_column()
5779        self._match_set(self.JSON_KEY_VALUE_SEPARATOR_TOKENS)
5780        self._match_text_seq("VALUE")
5781        value = self._parse_bitwise()
5782
5783        if not key and not value:
5784            return None
5785        return self.expression(exp.JSONKeyValue, this=key, expression=value)
5786
5787    def _parse_format_json(self, this: t.Optional[exp.Expression]) -> t.Optional[exp.Expression]:
5788        if not this or not self._match_text_seq("FORMAT", "JSON"):
5789            return this
5790
5791        return self.expression(exp.FormatJson, this=this)
5792
5793    def _parse_on_handling(self, on: str, *values: str) -> t.Optional[str]:
5794        # Parses the "X ON Y" syntax, i.e. NULL ON NULL (Oracle, T-SQL)
5795        for value in values:
5796            if self._match_text_seq(value, "ON", on):
5797                return f"{value} ON {on}"
5798
5799        return None
5800
5801    @t.overload
5802    def _parse_json_object(self, agg: Lit[False]) -> exp.JSONObject: ...
5803
5804    @t.overload
5805    def _parse_json_object(self, agg: Lit[True]) -> exp.JSONObjectAgg: ...
5806
5807    def _parse_json_object(self, agg=False):
5808        star = self._parse_star()
5809        expressions = (
5810            [star]
5811            if star
5812            else self._parse_csv(lambda: self._parse_format_json(self._parse_json_key_value()))
5813        )
5814        null_handling = self._parse_on_handling("NULL", "NULL", "ABSENT")
5815
5816        unique_keys = None
5817        if self._match_text_seq("WITH", "UNIQUE"):
5818            unique_keys = True
5819        elif self._match_text_seq("WITHOUT", "UNIQUE"):
5820            unique_keys = False
5821
5822        self._match_text_seq("KEYS")
5823
5824        return_type = self._match_text_seq("RETURNING") and self._parse_format_json(
5825            self._parse_type()
5826        )
5827        encoding = self._match_text_seq("ENCODING") and self._parse_var()
5828
5829        return self.expression(
5830            exp.JSONObjectAgg if agg else exp.JSONObject,
5831            expressions=expressions,
5832            null_handling=null_handling,
5833            unique_keys=unique_keys,
5834            return_type=return_type,
5835            encoding=encoding,
5836        )
5837
5838    # Note: this is currently incomplete; it only implements the "JSON_value_column" part
5839    def _parse_json_column_def(self) -> exp.JSONColumnDef:
5840        if not self._match_text_seq("NESTED"):
5841            this = self._parse_id_var()
5842            kind = self._parse_types(allow_identifiers=False)
5843            nested = None
5844        else:
5845            this = None
5846            kind = None
5847            nested = True
5848
5849        path = self._match_text_seq("PATH") and self._parse_string()
5850        nested_schema = nested and self._parse_json_schema()
5851
5852        return self.expression(
5853            exp.JSONColumnDef,
5854            this=this,
5855            kind=kind,
5856            path=path,
5857            nested_schema=nested_schema,
5858        )
5859
5860    def _parse_json_schema(self) -> exp.JSONSchema:
5861        self._match_text_seq("COLUMNS")
5862        return self.expression(
5863            exp.JSONSchema,
5864            expressions=self._parse_wrapped_csv(self._parse_json_column_def, optional=True),
5865        )
5866
5867    def _parse_json_table(self) -> exp.JSONTable:
5868        this = self._parse_format_json(self._parse_bitwise())
5869        path = self._match(TokenType.COMMA) and self._parse_string()
5870        error_handling = self._parse_on_handling("ERROR", "ERROR", "NULL")
5871        empty_handling = self._parse_on_handling("EMPTY", "ERROR", "NULL")
5872        schema = self._parse_json_schema()
5873
5874        return exp.JSONTable(
5875            this=this,
5876            schema=schema,
5877            path=path,
5878            error_handling=error_handling,
5879            empty_handling=empty_handling,
5880        )
5881
5882    def _parse_match_against(self) -> exp.MatchAgainst:
5883        expressions = self._parse_csv(self._parse_column)
5884
5885        self._match_text_seq(")", "AGAINST", "(")
5886
5887        this = self._parse_string()
5888
5889        if self._match_text_seq("IN", "NATURAL", "LANGUAGE", "MODE"):
5890            modifier = "IN NATURAL LANGUAGE MODE"
5891            if self._match_text_seq("WITH", "QUERY", "EXPANSION"):
5892                modifier = f"{modifier} WITH QUERY EXPANSION"
5893        elif self._match_text_seq("IN", "BOOLEAN", "MODE"):
5894            modifier = "IN BOOLEAN MODE"
5895        elif self._match_text_seq("WITH", "QUERY", "EXPANSION"):
5896            modifier = "WITH QUERY EXPANSION"
5897        else:
5898            modifier = None
5899
5900        return self.expression(
5901            exp.MatchAgainst, this=this, expressions=expressions, modifier=modifier
5902        )
5903
5904    # https://learn.microsoft.com/en-us/sql/t-sql/functions/openjson-transact-sql?view=sql-server-ver16
5905    def _parse_open_json(self) -> exp.OpenJSON:
5906        this = self._parse_bitwise()
5907        path = self._match(TokenType.COMMA) and self._parse_string()
5908
5909        def _parse_open_json_column_def() -> exp.OpenJSONColumnDef:
5910            this = self._parse_field(any_token=True)
5911            kind = self._parse_types()
5912            path = self._parse_string()
5913            as_json = self._match_pair(TokenType.ALIAS, TokenType.JSON)
5914
5915            return self.expression(
5916                exp.OpenJSONColumnDef, this=this, kind=kind, path=path, as_json=as_json
5917            )
5918
5919        expressions = None
5920        if self._match_pair(TokenType.R_PAREN, TokenType.WITH):
5921            self._match_l_paren()
5922            expressions = self._parse_csv(_parse_open_json_column_def)
5923
5924        return self.expression(exp.OpenJSON, this=this, path=path, expressions=expressions)
5925
5926    def _parse_position(self, haystack_first: bool = False) -> exp.StrPosition:
5927        args = self._parse_csv(self._parse_bitwise)
5928
5929        if self._match(TokenType.IN):
5930            return self.expression(
5931                exp.StrPosition, this=self._parse_bitwise(), substr=seq_get(args, 0)
5932            )
5933
5934        if haystack_first:
5935            haystack = seq_get(args, 0)
5936            needle = seq_get(args, 1)
5937        else:
5938            needle = seq_get(args, 0)
5939            haystack = seq_get(args, 1)
5940
5941        return self.expression(
5942            exp.StrPosition, this=haystack, substr=needle, position=seq_get(args, 2)
5943        )
5944
5945    def _parse_predict(self) -> exp.Predict:
5946        self._match_text_seq("MODEL")
5947        this = self._parse_table()
5948
5949        self._match(TokenType.COMMA)
5950        self._match_text_seq("TABLE")
5951
5952        return self.expression(
5953            exp.Predict,
5954            this=this,
5955            expression=self._parse_table(),
5956            params_struct=self._match(TokenType.COMMA) and self._parse_bitwise(),
5957        )
5958
5959    def _parse_join_hint(self, func_name: str) -> exp.JoinHint:
5960        args = self._parse_csv(self._parse_table)
5961        return exp.JoinHint(this=func_name.upper(), expressions=args)
5962
5963    def _parse_substring(self) -> exp.Substring:
5964        # Postgres supports the form: substring(string [from int] [for int])
5965        # https://www.postgresql.org/docs/9.1/functions-string.html @ Table 9-6
5966
5967        args = t.cast(t.List[t.Optional[exp.Expression]], self._parse_csv(self._parse_bitwise))
5968
5969        if self._match(TokenType.FROM):
5970            args.append(self._parse_bitwise())
5971        if self._match(TokenType.FOR):
5972            if len(args) == 1:
5973                args.append(exp.Literal.number(1))
5974            args.append(self._parse_bitwise())
5975
5976        return self.validate_expression(exp.Substring.from_arg_list(args), args)
5977
5978    def _parse_trim(self) -> exp.Trim:
5979        # https://www.w3resource.com/sql/character-functions/trim.php
5980        # https://docs.oracle.com/javadb/10.8.3.0/ref/rreftrimfunc.html
5981
5982        position = None
5983        collation = None
5984        expression = None
5985
5986        if self._match_texts(self.TRIM_TYPES):
5987            position = self._prev.text.upper()
5988
5989        this = self._parse_bitwise()
5990        if self._match_set((TokenType.FROM, TokenType.COMMA)):
5991            invert_order = self._prev.token_type == TokenType.FROM or self.TRIM_PATTERN_FIRST
5992            expression = self._parse_bitwise()
5993
5994            if invert_order:
5995                this, expression = expression, this
5996
5997        if self._match(TokenType.COLLATE):
5998            collation = self._parse_bitwise()
5999
6000        return self.expression(
6001            exp.Trim, this=this, position=position, expression=expression, collation=collation
6002        )
6003
6004    def _parse_window_clause(self) -> t.Optional[t.List[exp.Expression]]:
6005        return self._match(TokenType.WINDOW) and self._parse_csv(self._parse_named_window)
6006
6007    def _parse_named_window(self) -> t.Optional[exp.Expression]:
6008        return self._parse_window(self._parse_id_var(), alias=True)
6009
6010    def _parse_respect_or_ignore_nulls(
6011        self, this: t.Optional[exp.Expression]
6012    ) -> t.Optional[exp.Expression]:
6013        if self._match_text_seq("IGNORE", "NULLS"):
6014            return self.expression(exp.IgnoreNulls, this=this)
6015        if self._match_text_seq("RESPECT", "NULLS"):
6016            return self.expression(exp.RespectNulls, this=this)
6017        return this
6018
6019    def _parse_having_max(self, this: t.Optional[exp.Expression]) -> t.Optional[exp.Expression]:
6020        if self._match(TokenType.HAVING):
6021            self._match_texts(("MAX", "MIN"))
6022            max = self._prev.text.upper() != "MIN"
6023            return self.expression(
6024                exp.HavingMax, this=this, expression=self._parse_column(), max=max
6025            )
6026
6027        return this
6028
6029    def _parse_window(
6030        self, this: t.Optional[exp.Expression], alias: bool = False
6031    ) -> t.Optional[exp.Expression]:
6032        func = this
6033        comments = func.comments if isinstance(func, exp.Expression) else None
6034
6035        if self._match_pair(TokenType.FILTER, TokenType.L_PAREN):
6036            self._match(TokenType.WHERE)
6037            this = self.expression(
6038                exp.Filter, this=this, expression=self._parse_where(skip_where_token=True)
6039            )
6040            self._match_r_paren()
6041
6042        # T-SQL allows the OVER (...) syntax after WITHIN GROUP.
6043        # https://learn.microsoft.com/en-us/sql/t-sql/functions/percentile-disc-transact-sql?view=sql-server-ver16
6044        if self._match_text_seq("WITHIN", "GROUP"):
6045            order = self._parse_wrapped(self._parse_order)
6046            this = self.expression(exp.WithinGroup, this=this, expression=order)
6047
6048        # SQL spec defines an optional [ { IGNORE | RESPECT } NULLS ] OVER
6049        # Some dialects choose to implement and some do not.
6050        # https://dev.mysql.com/doc/refman/8.0/en/window-function-descriptions.html
6051
6052        # There is some code above in _parse_lambda that handles
6053        #   SELECT FIRST_VALUE(TABLE.COLUMN IGNORE|RESPECT NULLS) OVER ...
6054
6055        # The below changes handle
6056        #   SELECT FIRST_VALUE(TABLE.COLUMN) IGNORE|RESPECT NULLS OVER ...
6057
6058        # Oracle allows both formats
6059        #   (https://docs.oracle.com/en/database/oracle/oracle-database/19/sqlrf/img_text/first_value.html)
6060        #   and Snowflake chose to do the same for familiarity
6061        #   https://docs.snowflake.com/en/sql-reference/functions/first_value.html#usage-notes
6062        if isinstance(this, exp.AggFunc):
6063            ignore_respect = this.find(exp.IgnoreNulls, exp.RespectNulls)
6064
6065            if ignore_respect and ignore_respect is not this:
6066                ignore_respect.replace(ignore_respect.this)
6067                this = self.expression(ignore_respect.__class__, this=this)
6068
6069        this = self._parse_respect_or_ignore_nulls(this)
6070
6071        # bigquery select from window x AS (partition by ...)
6072        if alias:
6073            over = None
6074            self._match(TokenType.ALIAS)
6075        elif not self._match_set(self.WINDOW_BEFORE_PAREN_TOKENS):
6076            return this
6077        else:
6078            over = self._prev.text.upper()
6079
6080        if comments and isinstance(func, exp.Expression):
6081            func.pop_comments()
6082
6083        if not self._match(TokenType.L_PAREN):
6084            return self.expression(
6085                exp.Window,
6086                comments=comments,
6087                this=this,
6088                alias=self._parse_id_var(False),
6089                over=over,
6090            )
6091
6092        window_alias = self._parse_id_var(any_token=False, tokens=self.WINDOW_ALIAS_TOKENS)
6093
6094        first = self._match(TokenType.FIRST)
6095        if self._match_text_seq("LAST"):
6096            first = False
6097
6098        partition, order = self._parse_partition_and_order()
6099        kind = self._match_set((TokenType.ROWS, TokenType.RANGE)) and self._prev.text
6100
6101        if kind:
6102            self._match(TokenType.BETWEEN)
6103            start = self._parse_window_spec()
6104            self._match(TokenType.AND)
6105            end = self._parse_window_spec()
6106
6107            spec = self.expression(
6108                exp.WindowSpec,
6109                kind=kind,
6110                start=start["value"],
6111                start_side=start["side"],
6112                end=end["value"],
6113                end_side=end["side"],
6114            )
6115        else:
6116            spec = None
6117
6118        self._match_r_paren()
6119
6120        window = self.expression(
6121            exp.Window,
6122            comments=comments,
6123            this=this,
6124            partition_by=partition,
6125            order=order,
6126            spec=spec,
6127            alias=window_alias,
6128            over=over,
6129            first=first,
6130        )
6131
6132        # This covers Oracle's FIRST/LAST syntax: aggregate KEEP (...) OVER (...)
6133        if self._match_set(self.WINDOW_BEFORE_PAREN_TOKENS, advance=False):
6134            return self._parse_window(window, alias=alias)
6135
6136        return window
6137
6138    def _parse_partition_and_order(
6139        self,
6140    ) -> t.Tuple[t.List[exp.Expression], t.Optional[exp.Expression]]:
6141        return self._parse_partition_by(), self._parse_order()
6142
6143    def _parse_window_spec(self) -> t.Dict[str, t.Optional[str | exp.Expression]]:
6144        self._match(TokenType.BETWEEN)
6145
6146        return {
6147            "value": (
6148                (self._match_text_seq("UNBOUNDED") and "UNBOUNDED")
6149                or (self._match_text_seq("CURRENT", "ROW") and "CURRENT ROW")
6150                or self._parse_bitwise()
6151            ),
6152            "side": self._match_texts(self.WINDOW_SIDES) and self._prev.text,
6153        }
6154
6155    def _parse_alias(
6156        self, this: t.Optional[exp.Expression], explicit: bool = False
6157    ) -> t.Optional[exp.Expression]:
6158        any_token = self._match(TokenType.ALIAS)
6159        comments = self._prev_comments or []
6160
6161        if explicit and not any_token:
6162            return this
6163
6164        if self._match(TokenType.L_PAREN):
6165            aliases = self.expression(
6166                exp.Aliases,
6167                comments=comments,
6168                this=this,
6169                expressions=self._parse_csv(lambda: self._parse_id_var(any_token)),
6170            )
6171            self._match_r_paren(aliases)
6172            return aliases
6173
6174        alias = self._parse_id_var(any_token, tokens=self.ALIAS_TOKENS) or (
6175            self.STRING_ALIASES and self._parse_string_as_identifier()
6176        )
6177
6178        if alias:
6179            comments.extend(alias.pop_comments())
6180            this = self.expression(exp.Alias, comments=comments, this=this, alias=alias)
6181            column = this.this
6182
6183            # Moves the comment next to the alias in `expr /* comment */ AS alias`
6184            if not this.comments and column and column.comments:
6185                this.comments = column.pop_comments()
6186
6187        return this
6188
6189    def _parse_id_var(
6190        self,
6191        any_token: bool = True,
6192        tokens: t.Optional[t.Collection[TokenType]] = None,
6193    ) -> t.Optional[exp.Expression]:
6194        expression = self._parse_identifier()
6195        if not expression and (
6196            (any_token and self._advance_any()) or self._match_set(tokens or self.ID_VAR_TOKENS)
6197        ):
6198            quoted = self._prev.token_type == TokenType.STRING
6199            expression = self.expression(exp.Identifier, this=self._prev.text, quoted=quoted)
6200
6201        return expression
6202
6203    def _parse_string(self) -> t.Optional[exp.Expression]:
6204        if self._match_set(self.STRING_PARSERS):
6205            return self.STRING_PARSERS[self._prev.token_type](self, self._prev)
6206        return self._parse_placeholder()
6207
6208    def _parse_string_as_identifier(self) -> t.Optional[exp.Identifier]:
6209        return exp.to_identifier(self._match(TokenType.STRING) and self._prev.text, quoted=True)
6210
6211    def _parse_number(self) -> t.Optional[exp.Expression]:
6212        if self._match_set(self.NUMERIC_PARSERS):
6213            return self.NUMERIC_PARSERS[self._prev.token_type](self, self._prev)
6214        return self._parse_placeholder()
6215
6216    def _parse_identifier(self) -> t.Optional[exp.Expression]:
6217        if self._match(TokenType.IDENTIFIER):
6218            return self.expression(exp.Identifier, this=self._prev.text, quoted=True)
6219        return self._parse_placeholder()
6220
6221    def _parse_var(
6222        self,
6223        any_token: bool = False,
6224        tokens: t.Optional[t.Collection[TokenType]] = None,
6225        upper: bool = False,
6226    ) -> t.Optional[exp.Expression]:
6227        if (
6228            (any_token and self._advance_any())
6229            or self._match(TokenType.VAR)
6230            or (self._match_set(tokens) if tokens else False)
6231        ):
6232            return self.expression(
6233                exp.Var, this=self._prev.text.upper() if upper else self._prev.text
6234            )
6235        return self._parse_placeholder()
6236
6237    def _advance_any(self, ignore_reserved: bool = False) -> t.Optional[Token]:
6238        if self._curr and (ignore_reserved or self._curr.token_type not in self.RESERVED_TOKENS):
6239            self._advance()
6240            return self._prev
6241        return None
6242
6243    def _parse_var_or_string(self, upper: bool = False) -> t.Optional[exp.Expression]:
6244        return self._parse_string() or self._parse_var(any_token=True, upper=upper)
6245
6246    def _parse_primary_or_var(self) -> t.Optional[exp.Expression]:
6247        return self._parse_primary() or self._parse_var(any_token=True)
6248
6249    def _parse_null(self) -> t.Optional[exp.Expression]:
6250        if self._match_set(self.NULL_TOKENS):
6251            return self.PRIMARY_PARSERS[TokenType.NULL](self, self._prev)
6252        return self._parse_placeholder()
6253
6254    def _parse_boolean(self) -> t.Optional[exp.Expression]:
6255        if self._match(TokenType.TRUE):
6256            return self.PRIMARY_PARSERS[TokenType.TRUE](self, self._prev)
6257        if self._match(TokenType.FALSE):
6258            return self.PRIMARY_PARSERS[TokenType.FALSE](self, self._prev)
6259        return self._parse_placeholder()
6260
6261    def _parse_star(self) -> t.Optional[exp.Expression]:
6262        if self._match(TokenType.STAR):
6263            return self.PRIMARY_PARSERS[TokenType.STAR](self, self._prev)
6264        return self._parse_placeholder()
6265
6266    def _parse_parameter(self) -> exp.Parameter:
6267        this = self._parse_identifier() or self._parse_primary_or_var()
6268        return self.expression(exp.Parameter, this=this)
6269
6270    def _parse_placeholder(self) -> t.Optional[exp.Expression]:
6271        if self._match_set(self.PLACEHOLDER_PARSERS):
6272            placeholder = self.PLACEHOLDER_PARSERS[self._prev.token_type](self)
6273            if placeholder:
6274                return placeholder
6275            self._advance(-1)
6276        return None
6277
6278    def _parse_star_op(self, *keywords: str) -> t.Optional[t.List[exp.Expression]]:
6279        if not self._match_texts(keywords):
6280            return None
6281        if self._match(TokenType.L_PAREN, advance=False):
6282            return self._parse_wrapped_csv(self._parse_expression)
6283
6284        expression = self._parse_expression()
6285        return [expression] if expression else None
6286
6287    def _parse_csv(
6288        self, parse_method: t.Callable, sep: TokenType = TokenType.COMMA
6289    ) -> t.List[exp.Expression]:
6290        parse_result = parse_method()
6291        items = [parse_result] if parse_result is not None else []
6292
6293        while self._match(sep):
6294            self._add_comments(parse_result)
6295            parse_result = parse_method()
6296            if parse_result is not None:
6297                items.append(parse_result)
6298
6299        return items
6300
6301    def _parse_tokens(
6302        self, parse_method: t.Callable, expressions: t.Dict
6303    ) -> t.Optional[exp.Expression]:
6304        this = parse_method()
6305
6306        while self._match_set(expressions):
6307            this = self.expression(
6308                expressions[self._prev.token_type],
6309                this=this,
6310                comments=self._prev_comments,
6311                expression=parse_method(),
6312            )
6313
6314        return this
6315
6316    def _parse_wrapped_id_vars(self, optional: bool = False) -> t.List[exp.Expression]:
6317        return self._parse_wrapped_csv(self._parse_id_var, optional=optional)
6318
6319    def _parse_wrapped_csv(
6320        self, parse_method: t.Callable, sep: TokenType = TokenType.COMMA, optional: bool = False
6321    ) -> t.List[exp.Expression]:
6322        return self._parse_wrapped(
6323            lambda: self._parse_csv(parse_method, sep=sep), optional=optional
6324        )
6325
6326    def _parse_wrapped(self, parse_method: t.Callable, optional: bool = False) -> t.Any:
6327        wrapped = self._match(TokenType.L_PAREN)
6328        if not wrapped and not optional:
6329            self.raise_error("Expecting (")
6330        parse_result = parse_method()
6331        if wrapped:
6332            self._match_r_paren()
6333        return parse_result
6334
6335    def _parse_expressions(self) -> t.List[exp.Expression]:
6336        return self._parse_csv(self._parse_expression)
6337
6338    def _parse_select_or_expression(self, alias: bool = False) -> t.Optional[exp.Expression]:
6339        return self._parse_select() or self._parse_set_operations(
6340            self._parse_expression() if alias else self._parse_assignment()
6341        )
6342
6343    def _parse_ddl_select(self) -> t.Optional[exp.Expression]:
6344        return self._parse_query_modifiers(
6345            self._parse_set_operations(self._parse_select(nested=True, parse_subquery_alias=False))
6346        )
6347
6348    def _parse_transaction(self) -> exp.Transaction | exp.Command:
6349        this = None
6350        if self._match_texts(self.TRANSACTION_KIND):
6351            this = self._prev.text
6352
6353        self._match_texts(("TRANSACTION", "WORK"))
6354
6355        modes = []
6356        while True:
6357            mode = []
6358            while self._match(TokenType.VAR):
6359                mode.append(self._prev.text)
6360
6361            if mode:
6362                modes.append(" ".join(mode))
6363            if not self._match(TokenType.COMMA):
6364                break
6365
6366        return self.expression(exp.Transaction, this=this, modes=modes)
6367
6368    def _parse_commit_or_rollback(self) -> exp.Commit | exp.Rollback:
6369        chain = None
6370        savepoint = None
6371        is_rollback = self._prev.token_type == TokenType.ROLLBACK
6372
6373        self._match_texts(("TRANSACTION", "WORK"))
6374
6375        if self._match_text_seq("TO"):
6376            self._match_text_seq("SAVEPOINT")
6377            savepoint = self._parse_id_var()
6378
6379        if self._match(TokenType.AND):
6380            chain = not self._match_text_seq("NO")
6381            self._match_text_seq("CHAIN")
6382
6383        if is_rollback:
6384            return self.expression(exp.Rollback, savepoint=savepoint)
6385
6386        return self.expression(exp.Commit, chain=chain)
6387
6388    def _parse_refresh(self) -> exp.Refresh:
6389        self._match(TokenType.TABLE)
6390        return self.expression(exp.Refresh, this=self._parse_string() or self._parse_table())
6391
6392    def _parse_add_column(self) -> t.Optional[exp.Expression]:
6393        if not self._match_text_seq("ADD"):
6394            return None
6395
6396        self._match(TokenType.COLUMN)
6397        exists_column = self._parse_exists(not_=True)
6398        expression = self._parse_field_def()
6399
6400        if expression:
6401            expression.set("exists", exists_column)
6402
6403            # https://docs.databricks.com/delta/update-schema.html#explicitly-update-schema-to-add-columns
6404            if self._match_texts(("FIRST", "AFTER")):
6405                position = self._prev.text
6406                column_position = self.expression(
6407                    exp.ColumnPosition, this=self._parse_column(), position=position
6408                )
6409                expression.set("position", column_position)
6410
6411        return expression
6412
6413    def _parse_drop_column(self) -> t.Optional[exp.Drop | exp.Command]:
6414        drop = self._match(TokenType.DROP) and self._parse_drop()
6415        if drop and not isinstance(drop, exp.Command):
6416            drop.set("kind", drop.args.get("kind", "COLUMN"))
6417        return drop
6418
6419    # https://docs.aws.amazon.com/athena/latest/ug/alter-table-drop-partition.html
6420    def _parse_drop_partition(self, exists: t.Optional[bool] = None) -> exp.DropPartition:
6421        return self.expression(
6422            exp.DropPartition, expressions=self._parse_csv(self._parse_partition), exists=exists
6423        )
6424
6425    def _parse_alter_table_add(self) -> t.List[exp.Expression]:
6426        index = self._index - 1
6427
6428        if self._match_set(self.ADD_CONSTRAINT_TOKENS, advance=False):
6429            return self._parse_csv(
6430                lambda: self.expression(
6431                    exp.AddConstraint, expressions=self._parse_csv(self._parse_constraint)
6432                )
6433            )
6434
6435        self._retreat(index)
6436        if not self.ALTER_TABLE_ADD_REQUIRED_FOR_EACH_COLUMN and self._match_text_seq("ADD"):
6437            return self._parse_wrapped_csv(self._parse_field_def, optional=True)
6438
6439        if self._match_text_seq("ADD", "COLUMNS"):
6440            schema = self._parse_schema()
6441            if schema:
6442                return [schema]
6443            return []
6444
6445        return self._parse_wrapped_csv(self._parse_add_column, optional=True)
6446
6447    def _parse_alter_table_alter(self) -> t.Optional[exp.Expression]:
6448        if self._match_texts(self.ALTER_ALTER_PARSERS):
6449            return self.ALTER_ALTER_PARSERS[self._prev.text.upper()](self)
6450
6451        # Many dialects support the ALTER [COLUMN] syntax, so if there is no
6452        # keyword after ALTER we default to parsing this statement
6453        self._match(TokenType.COLUMN)
6454        column = self._parse_field(any_token=True)
6455
6456        if self._match_pair(TokenType.DROP, TokenType.DEFAULT):
6457            return self.expression(exp.AlterColumn, this=column, drop=True)
6458        if self._match_pair(TokenType.SET, TokenType.DEFAULT):
6459            return self.expression(exp.AlterColumn, this=column, default=self._parse_assignment())
6460        if self._match(TokenType.COMMENT):
6461            return self.expression(exp.AlterColumn, this=column, comment=self._parse_string())
6462        if self._match_text_seq("DROP", "NOT", "NULL"):
6463            return self.expression(
6464                exp.AlterColumn,
6465                this=column,
6466                drop=True,
6467                allow_null=True,
6468            )
6469        if self._match_text_seq("SET", "NOT", "NULL"):
6470            return self.expression(
6471                exp.AlterColumn,
6472                this=column,
6473                allow_null=False,
6474            )
6475        self._match_text_seq("SET", "DATA")
6476        self._match_text_seq("TYPE")
6477        return self.expression(
6478            exp.AlterColumn,
6479            this=column,
6480            dtype=self._parse_types(),
6481            collate=self._match(TokenType.COLLATE) and self._parse_term(),
6482            using=self._match(TokenType.USING) and self._parse_assignment(),
6483        )
6484
6485    def _parse_alter_diststyle(self) -> exp.AlterDistStyle:
6486        if self._match_texts(("ALL", "EVEN", "AUTO")):
6487            return self.expression(exp.AlterDistStyle, this=exp.var(self._prev.text.upper()))
6488
6489        self._match_text_seq("KEY", "DISTKEY")
6490        return self.expression(exp.AlterDistStyle, this=self._parse_column())
6491
6492    def _parse_alter_sortkey(self, compound: t.Optional[bool] = None) -> exp.AlterSortKey:
6493        if compound:
6494            self._match_text_seq("SORTKEY")
6495
6496        if self._match(TokenType.L_PAREN, advance=False):
6497            return self.expression(
6498                exp.AlterSortKey, expressions=self._parse_wrapped_id_vars(), compound=compound
6499            )
6500
6501        self._match_texts(("AUTO", "NONE"))
6502        return self.expression(
6503            exp.AlterSortKey, this=exp.var(self._prev.text.upper()), compound=compound
6504        )
6505
6506    def _parse_alter_table_drop(self) -> t.List[exp.Expression]:
6507        index = self._index - 1
6508
6509        partition_exists = self._parse_exists()
6510        if self._match(TokenType.PARTITION, advance=False):
6511            return self._parse_csv(lambda: self._parse_drop_partition(exists=partition_exists))
6512
6513        self._retreat(index)
6514        return self._parse_csv(self._parse_drop_column)
6515
6516    def _parse_alter_table_rename(self) -> t.Optional[exp.RenameTable | exp.RenameColumn]:
6517        if self._match(TokenType.COLUMN):
6518            exists = self._parse_exists()
6519            old_column = self._parse_column()
6520            to = self._match_text_seq("TO")
6521            new_column = self._parse_column()
6522
6523            if old_column is None or to is None or new_column is None:
6524                return None
6525
6526            return self.expression(exp.RenameColumn, this=old_column, to=new_column, exists=exists)
6527
6528        self._match_text_seq("TO")
6529        return self.expression(exp.RenameTable, this=self._parse_table(schema=True))
6530
6531    def _parse_alter_table_set(self) -> exp.AlterSet:
6532        alter_set = self.expression(exp.AlterSet)
6533
6534        if self._match(TokenType.L_PAREN, advance=False) or self._match_text_seq(
6535            "TABLE", "PROPERTIES"
6536        ):
6537            alter_set.set("expressions", self._parse_wrapped_csv(self._parse_assignment))
6538        elif self._match_text_seq("FILESTREAM_ON", advance=False):
6539            alter_set.set("expressions", [self._parse_assignment()])
6540        elif self._match_texts(("LOGGED", "UNLOGGED")):
6541            alter_set.set("option", exp.var(self._prev.text.upper()))
6542        elif self._match_text_seq("WITHOUT") and self._match_texts(("CLUSTER", "OIDS")):
6543            alter_set.set("option", exp.var(f"WITHOUT {self._prev.text.upper()}"))
6544        elif self._match_text_seq("LOCATION"):
6545            alter_set.set("location", self._parse_field())
6546        elif self._match_text_seq("ACCESS", "METHOD"):
6547            alter_set.set("access_method", self._parse_field())
6548        elif self._match_text_seq("TABLESPACE"):
6549            alter_set.set("tablespace", self._parse_field())
6550        elif self._match_text_seq("FILE", "FORMAT") or self._match_text_seq("FILEFORMAT"):
6551            alter_set.set("file_format", [self._parse_field()])
6552        elif self._match_text_seq("STAGE_FILE_FORMAT"):
6553            alter_set.set("file_format", self._parse_wrapped_options())
6554        elif self._match_text_seq("STAGE_COPY_OPTIONS"):
6555            alter_set.set("copy_options", self._parse_wrapped_options())
6556        elif self._match_text_seq("TAG") or self._match_text_seq("TAGS"):
6557            alter_set.set("tag", self._parse_csv(self._parse_assignment))
6558        else:
6559            if self._match_text_seq("SERDE"):
6560                alter_set.set("serde", self._parse_field())
6561
6562            alter_set.set("expressions", [self._parse_properties()])
6563
6564        return alter_set
6565
6566    def _parse_alter(self) -> exp.Alter | exp.Command:
6567        start = self._prev
6568
6569        alter_token = self._match_set(self.ALTERABLES) and self._prev
6570        if not alter_token:
6571            return self._parse_as_command(start)
6572
6573        exists = self._parse_exists()
6574        only = self._match_text_seq("ONLY")
6575        this = self._parse_table(schema=True)
6576        cluster = self._parse_on_property() if self._match(TokenType.ON) else None
6577
6578        if self._next:
6579            self._advance()
6580
6581        parser = self.ALTER_PARSERS.get(self._prev.text.upper()) if self._prev else None
6582        if parser:
6583            actions = ensure_list(parser(self))
6584            options = self._parse_csv(self._parse_property)
6585
6586            if not self._curr and actions:
6587                return self.expression(
6588                    exp.Alter,
6589                    this=this,
6590                    kind=alter_token.text.upper(),
6591                    exists=exists,
6592                    actions=actions,
6593                    only=only,
6594                    options=options,
6595                    cluster=cluster,
6596                )
6597
6598        return self._parse_as_command(start)
6599
6600    def _parse_merge(self) -> exp.Merge:
6601        self._match(TokenType.INTO)
6602        target = self._parse_table()
6603
6604        if target and self._match(TokenType.ALIAS, advance=False):
6605            target.set("alias", self._parse_table_alias())
6606
6607        self._match(TokenType.USING)
6608        using = self._parse_table()
6609
6610        self._match(TokenType.ON)
6611        on = self._parse_assignment()
6612
6613        return self.expression(
6614            exp.Merge,
6615            this=target,
6616            using=using,
6617            on=on,
6618            expressions=self._parse_when_matched(),
6619        )
6620
6621    def _parse_when_matched(self) -> t.List[exp.When]:
6622        whens = []
6623
6624        while self._match(TokenType.WHEN):
6625            matched = not self._match(TokenType.NOT)
6626            self._match_text_seq("MATCHED")
6627            source = (
6628                False
6629                if self._match_text_seq("BY", "TARGET")
6630                else self._match_text_seq("BY", "SOURCE")
6631            )
6632            condition = self._parse_assignment() if self._match(TokenType.AND) else None
6633
6634            self._match(TokenType.THEN)
6635
6636            if self._match(TokenType.INSERT):
6637                _this = self._parse_star()
6638                if _this:
6639                    then: t.Optional[exp.Expression] = self.expression(exp.Insert, this=_this)
6640                else:
6641                    then = self.expression(
6642                        exp.Insert,
6643                        this=self._parse_value(),
6644                        expression=self._match_text_seq("VALUES") and self._parse_value(),
6645                    )
6646            elif self._match(TokenType.UPDATE):
6647                expressions = self._parse_star()
6648                if expressions:
6649                    then = self.expression(exp.Update, expressions=expressions)
6650                else:
6651                    then = self.expression(
6652                        exp.Update,
6653                        expressions=self._match(TokenType.SET)
6654                        and self._parse_csv(self._parse_equality),
6655                    )
6656            elif self._match(TokenType.DELETE):
6657                then = self.expression(exp.Var, this=self._prev.text)
6658            else:
6659                then = None
6660
6661            whens.append(
6662                self.expression(
6663                    exp.When,
6664                    matched=matched,
6665                    source=source,
6666                    condition=condition,
6667                    then=then,
6668                )
6669            )
6670        return whens
6671
6672    def _parse_show(self) -> t.Optional[exp.Expression]:
6673        parser = self._find_parser(self.SHOW_PARSERS, self.SHOW_TRIE)
6674        if parser:
6675            return parser(self)
6676        return self._parse_as_command(self._prev)
6677
6678    def _parse_set_item_assignment(
6679        self, kind: t.Optional[str] = None
6680    ) -> t.Optional[exp.Expression]:
6681        index = self._index
6682
6683        if kind in ("GLOBAL", "SESSION") and self._match_text_seq("TRANSACTION"):
6684            return self._parse_set_transaction(global_=kind == "GLOBAL")
6685
6686        left = self._parse_primary() or self._parse_column()
6687        assignment_delimiter = self._match_texts(("=", "TO"))
6688
6689        if not left or (self.SET_REQUIRES_ASSIGNMENT_DELIMITER and not assignment_delimiter):
6690            self._retreat(index)
6691            return None
6692
6693        right = self._parse_statement() or self._parse_id_var()
6694        if isinstance(right, (exp.Column, exp.Identifier)):
6695            right = exp.var(right.name)
6696
6697        this = self.expression(exp.EQ, this=left, expression=right)
6698        return self.expression(exp.SetItem, this=this, kind=kind)
6699
6700    def _parse_set_transaction(self, global_: bool = False) -> exp.Expression:
6701        self._match_text_seq("TRANSACTION")
6702        characteristics = self._parse_csv(
6703            lambda: self._parse_var_from_options(self.TRANSACTION_CHARACTERISTICS)
6704        )
6705        return self.expression(
6706            exp.SetItem,
6707            expressions=characteristics,
6708            kind="TRANSACTION",
6709            **{"global": global_},  # type: ignore
6710        )
6711
6712    def _parse_set_item(self) -> t.Optional[exp.Expression]:
6713        parser = self._find_parser(self.SET_PARSERS, self.SET_TRIE)
6714        return parser(self) if parser else self._parse_set_item_assignment(kind=None)
6715
6716    def _parse_set(self, unset: bool = False, tag: bool = False) -> exp.Set | exp.Command:
6717        index = self._index
6718        set_ = self.expression(
6719            exp.Set, expressions=self._parse_csv(self._parse_set_item), unset=unset, tag=tag
6720        )
6721
6722        if self._curr:
6723            self._retreat(index)
6724            return self._parse_as_command(self._prev)
6725
6726        return set_
6727
6728    def _parse_var_from_options(
6729        self, options: OPTIONS_TYPE, raise_unmatched: bool = True
6730    ) -> t.Optional[exp.Var]:
6731        start = self._curr
6732        if not start:
6733            return None
6734
6735        option = start.text.upper()
6736        continuations = options.get(option)
6737
6738        index = self._index
6739        self._advance()
6740        for keywords in continuations or []:
6741            if isinstance(keywords, str):
6742                keywords = (keywords,)
6743
6744            if self._match_text_seq(*keywords):
6745                option = f"{option} {' '.join(keywords)}"
6746                break
6747        else:
6748            if continuations or continuations is None:
6749                if raise_unmatched:
6750                    self.raise_error(f"Unknown option {option}")
6751
6752                self._retreat(index)
6753                return None
6754
6755        return exp.var(option)
6756
6757    def _parse_as_command(self, start: Token) -> exp.Command:
6758        while self._curr:
6759            self._advance()
6760        text = self._find_sql(start, self._prev)
6761        size = len(start.text)
6762        self._warn_unsupported()
6763        return exp.Command(this=text[:size], expression=text[size:])
6764
6765    def _parse_dict_property(self, this: str) -> exp.DictProperty:
6766        settings = []
6767
6768        self._match_l_paren()
6769        kind = self._parse_id_var()
6770
6771        if self._match(TokenType.L_PAREN):
6772            while True:
6773                key = self._parse_id_var()
6774                value = self._parse_primary()
6775
6776                if not key and value is None:
6777                    break
6778                settings.append(self.expression(exp.DictSubProperty, this=key, value=value))
6779            self._match(TokenType.R_PAREN)
6780
6781        self._match_r_paren()
6782
6783        return self.expression(
6784            exp.DictProperty,
6785            this=this,
6786            kind=kind.this if kind else None,
6787            settings=settings,
6788        )
6789
6790    def _parse_dict_range(self, this: str) -> exp.DictRange:
6791        self._match_l_paren()
6792        has_min = self._match_text_seq("MIN")
6793        if has_min:
6794            min = self._parse_var() or self._parse_primary()
6795            self._match_text_seq("MAX")
6796            max = self._parse_var() or self._parse_primary()
6797        else:
6798            max = self._parse_var() or self._parse_primary()
6799            min = exp.Literal.number(0)
6800        self._match_r_paren()
6801        return self.expression(exp.DictRange, this=this, min=min, max=max)
6802
6803    def _parse_comprehension(
6804        self, this: t.Optional[exp.Expression]
6805    ) -> t.Optional[exp.Comprehension]:
6806        index = self._index
6807        expression = self._parse_column()
6808        if not self._match(TokenType.IN):
6809            self._retreat(index - 1)
6810            return None
6811        iterator = self._parse_column()
6812        condition = self._parse_assignment() if self._match_text_seq("IF") else None
6813        return self.expression(
6814            exp.Comprehension,
6815            this=this,
6816            expression=expression,
6817            iterator=iterator,
6818            condition=condition,
6819        )
6820
6821    def _parse_heredoc(self) -> t.Optional[exp.Heredoc]:
6822        if self._match(TokenType.HEREDOC_STRING):
6823            return self.expression(exp.Heredoc, this=self._prev.text)
6824
6825        if not self._match_text_seq("$"):
6826            return None
6827
6828        tags = ["$"]
6829        tag_text = None
6830
6831        if self._is_connected():
6832            self._advance()
6833            tags.append(self._prev.text.upper())
6834        else:
6835            self.raise_error("No closing $ found")
6836
6837        if tags[-1] != "$":
6838            if self._is_connected() and self._match_text_seq("$"):
6839                tag_text = tags[-1]
6840                tags.append("$")
6841            else:
6842                self.raise_error("No closing $ found")
6843
6844        heredoc_start = self._curr
6845
6846        while self._curr:
6847            if self._match_text_seq(*tags, advance=False):
6848                this = self._find_sql(heredoc_start, self._prev)
6849                self._advance(len(tags))
6850                return self.expression(exp.Heredoc, this=this, tag=tag_text)
6851
6852            self._advance()
6853
6854        self.raise_error(f"No closing {''.join(tags)} found")
6855        return None
6856
6857    def _find_parser(
6858        self, parsers: t.Dict[str, t.Callable], trie: t.Dict
6859    ) -> t.Optional[t.Callable]:
6860        if not self._curr:
6861            return None
6862
6863        index = self._index
6864        this = []
6865        while True:
6866            # The current token might be multiple words
6867            curr = self._curr.text.upper()
6868            key = curr.split(" ")
6869            this.append(curr)
6870
6871            self._advance()
6872            result, trie = in_trie(trie, key)
6873            if result == TrieResult.FAILED:
6874                break
6875
6876            if result == TrieResult.EXISTS:
6877                subparser = parsers[" ".join(this)]
6878                return subparser
6879
6880        self._retreat(index)
6881        return None
6882
6883    def _match(self, token_type, advance=True, expression=None):
6884        if not self._curr:
6885            return None
6886
6887        if self._curr.token_type == token_type:
6888            if advance:
6889                self._advance()
6890            self._add_comments(expression)
6891            return True
6892
6893        return None
6894
6895    def _match_set(self, types, advance=True):
6896        if not self._curr:
6897            return None
6898
6899        if self._curr.token_type in types:
6900            if advance:
6901                self._advance()
6902            return True
6903
6904        return None
6905
6906    def _match_pair(self, token_type_a, token_type_b, advance=True):
6907        if not self._curr or not self._next:
6908            return None
6909
6910        if self._curr.token_type == token_type_a and self._next.token_type == token_type_b:
6911            if advance:
6912                self._advance(2)
6913            return True
6914
6915        return None
6916
6917    def _match_l_paren(self, expression: t.Optional[exp.Expression] = None) -> None:
6918        if not self._match(TokenType.L_PAREN, expression=expression):
6919            self.raise_error("Expecting (")
6920
6921    def _match_r_paren(self, expression: t.Optional[exp.Expression] = None) -> None:
6922        if not self._match(TokenType.R_PAREN, expression=expression):
6923            self.raise_error("Expecting )")
6924
6925    def _match_texts(self, texts, advance=True):
6926        if self._curr and self._curr.text.upper() in texts:
6927            if advance:
6928                self._advance()
6929            return True
6930        return None
6931
6932    def _match_text_seq(self, *texts, advance=True):
6933        index = self._index
6934        for text in texts:
6935            if self._curr and self._curr.text.upper() == text:
6936                self._advance()
6937            else:
6938                self._retreat(index)
6939                return None
6940
6941        if not advance:
6942            self._retreat(index)
6943
6944        return True
6945
6946    def _replace_lambda(
6947        self, node: t.Optional[exp.Expression], expressions: t.List[exp.Expression]
6948    ) -> t.Optional[exp.Expression]:
6949        if not node:
6950            return node
6951
6952        lambda_types = {e.name: e.args.get("to") or False for e in expressions}
6953
6954        for column in node.find_all(exp.Column):
6955            typ = lambda_types.get(column.parts[0].name)
6956            if typ is not None:
6957                dot_or_id = column.to_dot() if column.table else column.this
6958
6959                if typ:
6960                    dot_or_id = self.expression(
6961                        exp.Cast,
6962                        this=dot_or_id,
6963                        to=typ,
6964                    )
6965
6966                parent = column.parent
6967
6968                while isinstance(parent, exp.Dot):
6969                    if not isinstance(parent.parent, exp.Dot):
6970                        parent.replace(dot_or_id)
6971                        break
6972                    parent = parent.parent
6973                else:
6974                    if column is node:
6975                        node = dot_or_id
6976                    else:
6977                        column.replace(dot_or_id)
6978        return node
6979
6980    def _parse_truncate_table(self) -> t.Optional[exp.TruncateTable] | exp.Expression:
6981        start = self._prev
6982
6983        # Not to be confused with TRUNCATE(number, decimals) function call
6984        if self._match(TokenType.L_PAREN):
6985            self._retreat(self._index - 2)
6986            return self._parse_function()
6987
6988        # Clickhouse supports TRUNCATE DATABASE as well
6989        is_database = self._match(TokenType.DATABASE)
6990
6991        self._match(TokenType.TABLE)
6992
6993        exists = self._parse_exists(not_=False)
6994
6995        expressions = self._parse_csv(
6996            lambda: self._parse_table(schema=True, is_db_reference=is_database)
6997        )
6998
6999        cluster = self._parse_on_property() if self._match(TokenType.ON) else None
7000
7001        if self._match_text_seq("RESTART", "IDENTITY"):
7002            identity = "RESTART"
7003        elif self._match_text_seq("CONTINUE", "IDENTITY"):
7004            identity = "CONTINUE"
7005        else:
7006            identity = None
7007
7008        if self._match_text_seq("CASCADE") or self._match_text_seq("RESTRICT"):
7009            option = self._prev.text
7010        else:
7011            option = None
7012
7013        partition = self._parse_partition()
7014
7015        # Fallback case
7016        if self._curr:
7017            return self._parse_as_command(start)
7018
7019        return self.expression(
7020            exp.TruncateTable,
7021            expressions=expressions,
7022            is_database=is_database,
7023            exists=exists,
7024            cluster=cluster,
7025            identity=identity,
7026            option=option,
7027            partition=partition,
7028        )
7029
7030    def _parse_with_operator(self) -> t.Optional[exp.Expression]:
7031        this = self._parse_ordered(self._parse_opclass)
7032
7033        if not self._match(TokenType.WITH):
7034            return this
7035
7036        op = self._parse_var(any_token=True)
7037
7038        return self.expression(exp.WithOperator, this=this, op=op)
7039
7040    def _parse_wrapped_options(self) -> t.List[t.Optional[exp.Expression]]:
7041        self._match(TokenType.EQ)
7042        self._match(TokenType.L_PAREN)
7043
7044        opts: t.List[t.Optional[exp.Expression]] = []
7045        while self._curr and not self._match(TokenType.R_PAREN):
7046            if self._match_text_seq("FORMAT_NAME", "="):
7047                # The FORMAT_NAME can be set to an identifier for Snowflake and T-SQL,
7048                # so we parse it separately to use _parse_field()
7049                prop = self.expression(
7050                    exp.Property, this=exp.var("FORMAT_NAME"), value=self._parse_field()
7051                )
7052                opts.append(prop)
7053            else:
7054                opts.append(self._parse_property())
7055
7056            self._match(TokenType.COMMA)
7057
7058        return opts
7059
7060    def _parse_copy_parameters(self) -> t.List[exp.CopyParameter]:
7061        sep = TokenType.COMMA if self.dialect.COPY_PARAMS_ARE_CSV else None
7062
7063        options = []
7064        while self._curr and not self._match(TokenType.R_PAREN, advance=False):
7065            option = self._parse_var(any_token=True)
7066            prev = self._prev.text.upper()
7067
7068            # Different dialects might separate options and values by white space, "=" and "AS"
7069            self._match(TokenType.EQ)
7070            self._match(TokenType.ALIAS)
7071
7072            param = self.expression(exp.CopyParameter, this=option)
7073
7074            if prev in self.COPY_INTO_VARLEN_OPTIONS and self._match(
7075                TokenType.L_PAREN, advance=False
7076            ):
7077                # Snowflake FILE_FORMAT case, Databricks COPY & FORMAT options
7078                param.set("expressions", self._parse_wrapped_options())
7079            elif prev == "FILE_FORMAT":
7080                # T-SQL's external file format case
7081                param.set("expression", self._parse_field())
7082            else:
7083                param.set("expression", self._parse_unquoted_field())
7084
7085            options.append(param)
7086            self._match(sep)
7087
7088        return options
7089
7090    def _parse_credentials(self) -> t.Optional[exp.Credentials]:
7091        expr = self.expression(exp.Credentials)
7092
7093        if self._match_text_seq("STORAGE_INTEGRATION", "="):
7094            expr.set("storage", self._parse_field())
7095        if self._match_text_seq("CREDENTIALS"):
7096            # Snowflake case: CREDENTIALS = (...), Redshift case: CREDENTIALS <string>
7097            creds = (
7098                self._parse_wrapped_options() if self._match(TokenType.EQ) else self._parse_field()
7099            )
7100            expr.set("credentials", creds)
7101        if self._match_text_seq("ENCRYPTION"):
7102            expr.set("encryption", self._parse_wrapped_options())
7103        if self._match_text_seq("IAM_ROLE"):
7104            expr.set("iam_role", self._parse_field())
7105        if self._match_text_seq("REGION"):
7106            expr.set("region", self._parse_field())
7107
7108        return expr
7109
7110    def _parse_file_location(self) -> t.Optional[exp.Expression]:
7111        return self._parse_field()
7112
7113    def _parse_copy(self) -> exp.Copy | exp.Command:
7114        start = self._prev
7115
7116        self._match(TokenType.INTO)
7117
7118        this = (
7119            self._parse_select(nested=True, parse_subquery_alias=False)
7120            if self._match(TokenType.L_PAREN, advance=False)
7121            else self._parse_table(schema=True)
7122        )
7123
7124        kind = self._match(TokenType.FROM) or not self._match_text_seq("TO")
7125
7126        files = self._parse_csv(self._parse_file_location)
7127        credentials = self._parse_credentials()
7128
7129        self._match_text_seq("WITH")
7130
7131        params = self._parse_wrapped(self._parse_copy_parameters, optional=True)
7132
7133        # Fallback case
7134        if self._curr:
7135            return self._parse_as_command(start)
7136
7137        return self.expression(
7138            exp.Copy,
7139            this=this,
7140            kind=kind,
7141            credentials=credentials,
7142            files=files,
7143            params=params,
7144        )

logger = <Logger sqlglot (WARNING)>

OPTIONS_TYPE = typing.Dict[str, typing.Sequence[typing.Union[typing.Sequence[str], str]]]

def build_var_map(args: List) -> sqlglot.expressions.StarMap | sqlglot.expressions.VarMap: View Source

26def build_var_map(args: t.List) -> exp.StarMap | exp.VarMap:
27    if len(args) == 1 and args[0].is_star:
28        return exp.StarMap(this=args[0])
29
30    keys = []
31    values = []
32    for i in range(0, len(args), 2):
33        keys.append(args[i])
34        values.append(args[i + 1])
35
36    return exp.VarMap(keys=exp.array(*keys, copy=False), values=exp.array(*values, copy=False))

def build_like(args: List) -> sqlglot.expressions.Escape | sqlglot.expressions.Like: View Source

39def build_like(args: t.List) -> exp.Escape | exp.Like:
40    like = exp.Like(this=seq_get(args, 1), expression=seq_get(args, 0))
41    return exp.Escape(this=like, expression=seq_get(args, 2)) if len(args) > 2 else like

def binary_range_parser( expr_type: Type[sqlglot.expressions.Expression], reverse_args: bool = False) -> Callable[[Parser, Optional[sqlglot.expressions.Expression]], Optional[sqlglot.expressions.Expression]]: View Source

44def binary_range_parser(
45    expr_type: t.Type[exp.Expression], reverse_args: bool = False
46) -> t.Callable[[Parser, t.Optional[exp.Expression]], t.Optional[exp.Expression]]:
47    def _parse_binary_range(
48        self: Parser, this: t.Optional[exp.Expression]
49    ) -> t.Optional[exp.Expression]:
50        expression = self._parse_bitwise()
51        if reverse_args:
52            this, expression = expression, this
53        return self._parse_escape(self.expression(expr_type, this=this, expression=expression))
54
55    return _parse_binary_range

def build_logarithm( args: List, dialect: sqlglot.dialects.dialect.Dialect) -> sqlglot.expressions.Func: View Source

58def build_logarithm(args: t.List, dialect: Dialect) -> exp.Func:
59    # Default argument order is base, expression
60    this = seq_get(args, 0)
61    expression = seq_get(args, 1)
62
63    if expression:
64        if not dialect.LOG_BASE_FIRST:
65            this, expression = expression, this
66        return exp.Log(this=this, expression=expression)
67
68    return (exp.Ln if dialect.parser_class.LOG_DEFAULTS_TO_LN else exp.Log)(this=this)

def build_hex( args: List, dialect: sqlglot.dialects.dialect.Dialect) -> sqlglot.expressions.Hex | sqlglot.expressions.LowerHex: View Source

71def build_hex(args: t.List, dialect: Dialect) -> exp.Hex | exp.LowerHex:
72    arg = seq_get(args, 0)
73    return exp.LowerHex(this=arg) if dialect.HEX_LOWERCASE else exp.Hex(this=arg)

def build_lower(args: List) -> sqlglot.expressions.Lower | sqlglot.expressions.Hex: View Source

76def build_lower(args: t.List) -> exp.Lower | exp.Hex:
77    # LOWER(HEX(..)) can be simplified to LowerHex to simplify its transpilation
78    arg = seq_get(args, 0)
79    return exp.LowerHex(this=arg.this) if isinstance(arg, exp.Hex) else exp.Lower(this=arg)

def build_upper(args: List) -> sqlglot.expressions.Upper | sqlglot.expressions.Hex: View Source

82def build_upper(args: t.List) -> exp.Upper | exp.Hex:
83    # UPPER(HEX(..)) can be simplified to Hex to simplify its transpilation
84    arg = seq_get(args, 0)
85    return exp.Hex(this=arg.this) if isinstance(arg, exp.Hex) else exp.Upper(this=arg)

def build_extract_json_with_path( expr_type: Type[~E]) -> Callable[[List, sqlglot.dialects.dialect.Dialect], ~E]: View Source

88def build_extract_json_with_path(expr_type: t.Type[E]) -> t.Callable[[t.List, Dialect], E]:
89    def _builder(args: t.List, dialect: Dialect) -> E:
90        expression = expr_type(
91            this=seq_get(args, 0), expression=dialect.to_json_path(seq_get(args, 1))
92        )
93        if len(args) > 2 and expr_type is exp.JSONExtract:
94            expression.set("expressions", args[2:])
95
96        return expression
97
98    return _builder

def build_mod(args: List) -> sqlglot.expressions.Mod: View Source

101def build_mod(args: t.List) -> exp.Mod:
102    this = seq_get(args, 0)
103    expression = seq_get(args, 1)
104
105    # Wrap the operands if they are binary nodes, e.g. MOD(a + 1, 7) -> (a + 1) % 7
106    this = exp.Paren(this=this) if isinstance(this, exp.Binary) else this
107    expression = exp.Paren(this=expression) if isinstance(expression, exp.Binary) else expression
108
109    return exp.Mod(this=this, expression=expression)

def build_pad(args: List, is_left: bool = True): View Source

112def build_pad(args: t.List, is_left: bool = True):
113    return exp.Pad(
114        this=seq_get(args, 0),
115        expression=seq_get(args, 1),
116        fill_pattern=seq_get(args, 2),
117        is_left=is_left,
118    )

def build_array_constructor( exp_class: Type[~E], args: List, bracket_kind: sqlglot.tokens.TokenType, dialect: sqlglot.dialects.dialect.Dialect) -> sqlglot.expressions.Expression: View Source

121def build_array_constructor(
122    exp_class: t.Type[E], args: t.List, bracket_kind: TokenType, dialect: Dialect
123) -> exp.Expression:
124    array_exp = exp_class(expressions=args)
125
126    if exp_class == exp.Array and dialect.HAS_DISTINCT_ARRAY_CONSTRUCTORS:
127        array_exp.set("bracket_notation", bracket_kind == TokenType.L_BRACKET)
128
129    return array_exp

def build_convert_timezone( args: List, default_source_tz: Optional[str] = None) -> Union[sqlglot.expressions.ConvertTimezone, sqlglot.expressions.Anonymous]: View Source

132def build_convert_timezone(
133    args: t.List, default_source_tz: t.Optional[str] = None
134) -> t.Union[exp.ConvertTimezone, exp.Anonymous]:
135    if len(args) == 2:
136        source_tz = exp.Literal.string(default_source_tz) if default_source_tz else None
137        return exp.ConvertTimezone(
138            source_tz=source_tz, target_tz=seq_get(args, 0), timestamp=seq_get(args, 1)
139        )
140
141    return exp.ConvertTimezone.from_arg_list(args)

sqlglot.parser

Arguments:

Arguments:

Returns:

Arguments:

Returns:

Arguments:

Returns:

Arguments:

Returns: