Edit on GitHub

sqlglot.parser

View Source

   1from __future__ import annotations
   2
   3import logging
   4import typing as t
   5from collections import defaultdict
   6
   7from sqlglot import exp
   8from sqlglot.errors import ErrorLevel, ParseError, concat_messages, merge_errors
   9from sqlglot.helper import apply_index_offset, ensure_list, seq_get
  10from sqlglot.time import format_time
  11from sqlglot.tokens import Token, Tokenizer, TokenType
  12from sqlglot.trie import TrieResult, in_trie, new_trie
  13
  14if t.TYPE_CHECKING:
  15    from sqlglot._typing import E, Lit
  16    from sqlglot.dialects.dialect import Dialect, DialectType
  17
  18    T = t.TypeVar("T")
  19    TCeilFloor = t.TypeVar("TCeilFloor", exp.Ceil, exp.Floor)
  20
  21logger = logging.getLogger("sqlglot")
  22
  23OPTIONS_TYPE = t.Dict[str, t.Sequence[t.Union[t.Sequence[str], str]]]
  24
  25
  26def build_var_map(args: t.List) -> exp.StarMap | exp.VarMap:
  27    if len(args) == 1 and args[0].is_star:
  28        return exp.StarMap(this=args[0])
  29
  30    keys = []
  31    values = []
  32    for i in range(0, len(args), 2):
  33        keys.append(args[i])
  34        values.append(args[i + 1])
  35
  36    return exp.VarMap(keys=exp.array(*keys, copy=False), values=exp.array(*values, copy=False))
  37
  38
  39def build_like(args: t.List) -> exp.Escape | exp.Like:
  40    like = exp.Like(this=seq_get(args, 1), expression=seq_get(args, 0))
  41    return exp.Escape(this=like, expression=seq_get(args, 2)) if len(args) > 2 else like
  42
  43
  44def binary_range_parser(
  45    expr_type: t.Type[exp.Expression], reverse_args: bool = False
  46) -> t.Callable[[Parser, t.Optional[exp.Expression]], t.Optional[exp.Expression]]:
  47    def _parse_binary_range(
  48        self: Parser, this: t.Optional[exp.Expression]
  49    ) -> t.Optional[exp.Expression]:
  50        expression = self._parse_bitwise()
  51        if reverse_args:
  52            this, expression = expression, this
  53        return self._parse_escape(self.expression(expr_type, this=this, expression=expression))
  54
  55    return _parse_binary_range
  56
  57
  58def build_logarithm(args: t.List, dialect: Dialect) -> exp.Func:
  59    # Default argument order is base, expression
  60    this = seq_get(args, 0)
  61    expression = seq_get(args, 1)
  62
  63    if expression:
  64        if not dialect.LOG_BASE_FIRST:
  65            this, expression = expression, this
  66        return exp.Log(this=this, expression=expression)
  67
  68    return (exp.Ln if dialect.parser_class.LOG_DEFAULTS_TO_LN else exp.Log)(this=this)
  69
  70
  71def build_hex(args: t.List, dialect: Dialect) -> exp.Hex | exp.LowerHex:
  72    arg = seq_get(args, 0)
  73    return exp.LowerHex(this=arg) if dialect.HEX_LOWERCASE else exp.Hex(this=arg)
  74
  75
  76def build_lower(args: t.List) -> exp.Lower | exp.Hex:
  77    # LOWER(HEX(..)) can be simplified to LowerHex to simplify its transpilation
  78    arg = seq_get(args, 0)
  79    return exp.LowerHex(this=arg.this) if isinstance(arg, exp.Hex) else exp.Lower(this=arg)
  80
  81
  82def build_upper(args: t.List) -> exp.Upper | exp.Hex:
  83    # UPPER(HEX(..)) can be simplified to Hex to simplify its transpilation
  84    arg = seq_get(args, 0)
  85    return exp.Hex(this=arg.this) if isinstance(arg, exp.Hex) else exp.Upper(this=arg)
  86
  87
  88def build_extract_json_with_path(expr_type: t.Type[E]) -> t.Callable[[t.List, Dialect], E]:
  89    def _builder(args: t.List, dialect: Dialect) -> E:
  90        expression = expr_type(
  91            this=seq_get(args, 0), expression=dialect.to_json_path(seq_get(args, 1))
  92        )
  93        if len(args) > 2 and expr_type is exp.JSONExtract:
  94            expression.set("expressions", args[2:])
  95
  96        return expression
  97
  98    return _builder
  99
 100
 101def build_mod(args: t.List) -> exp.Mod:
 102    this = seq_get(args, 0)
 103    expression = seq_get(args, 1)
 104
 105    # Wrap the operands if they are binary nodes, e.g. MOD(a + 1, 7) -> (a + 1) % 7
 106    this = exp.Paren(this=this) if isinstance(this, exp.Binary) else this
 107    expression = exp.Paren(this=expression) if isinstance(expression, exp.Binary) else expression
 108
 109    return exp.Mod(this=this, expression=expression)
 110
 111
 112def build_pad(args: t.List, is_left: bool = True):
 113    return exp.Pad(
 114        this=seq_get(args, 0),
 115        expression=seq_get(args, 1),
 116        fill_pattern=seq_get(args, 2),
 117        is_left=is_left,
 118    )
 119
 120
 121def build_array_constructor(
 122    exp_class: t.Type[E], args: t.List, bracket_kind: TokenType, dialect: Dialect
 123) -> exp.Expression:
 124    array_exp = exp_class(expressions=args)
 125
 126    if exp_class == exp.Array and dialect.HAS_DISTINCT_ARRAY_CONSTRUCTORS:
 127        array_exp.set("bracket_notation", bracket_kind == TokenType.L_BRACKET)
 128
 129    return array_exp
 130
 131
 132def build_convert_timezone(
 133    args: t.List, default_source_tz: t.Optional[str] = None
 134) -> t.Union[exp.ConvertTimezone, exp.Anonymous]:
 135    if len(args) == 2:
 136        source_tz = exp.Literal.string(default_source_tz) if default_source_tz else None
 137        return exp.ConvertTimezone(
 138            source_tz=source_tz, target_tz=seq_get(args, 0), timestamp=seq_get(args, 1)
 139        )
 140
 141    return exp.ConvertTimezone.from_arg_list(args)
 142
 143
 144def build_trim(args: t.List, is_left: bool = True):
 145    return exp.Trim(
 146        this=seq_get(args, 0),
 147        expression=seq_get(args, 1),
 148        position="LEADING" if is_left else "TRAILING",
 149    )
 150
 151
 152def build_coalesce(args: t.List, is_nvl: t.Optional[bool] = None) -> exp.Coalesce:
 153    return exp.Coalesce(this=seq_get(args, 0), expressions=args[1:], is_nvl=is_nvl)
 154
 155
 156def build_locate_strposition(args: t.List):
 157    return exp.StrPosition(
 158        this=seq_get(args, 1),
 159        substr=seq_get(args, 0),
 160        position=seq_get(args, 2),
 161    )
 162
 163
 164class _Parser(type):
 165    def __new__(cls, clsname, bases, attrs):
 166        klass = super().__new__(cls, clsname, bases, attrs)
 167
 168        klass.SHOW_TRIE = new_trie(key.split(" ") for key in klass.SHOW_PARSERS)
 169        klass.SET_TRIE = new_trie(key.split(" ") for key in klass.SET_PARSERS)
 170
 171        return klass
 172
 173
 174class Parser(metaclass=_Parser):
 175    """
 176    Parser consumes a list of tokens produced by the Tokenizer and produces a parsed syntax tree.
 177
 178    Args:
 179        error_level: The desired error level.
 180            Default: ErrorLevel.IMMEDIATE
 181        error_message_context: The amount of context to capture from a query string when displaying
 182            the error message (in number of characters).
 183            Default: 100
 184        max_errors: Maximum number of error messages to include in a raised ParseError.
 185            This is only relevant if error_level is ErrorLevel.RAISE.
 186            Default: 3
 187    """
 188
 189    FUNCTIONS: t.Dict[str, t.Callable] = {
 190        **{name: func.from_arg_list for name, func in exp.FUNCTION_BY_NAME.items()},
 191        **dict.fromkeys(("COALESCE", "IFNULL", "NVL"), build_coalesce),
 192        "ARRAY": lambda args, dialect: exp.Array(expressions=args),
 193        "ARRAYAGG": lambda args, dialect: exp.ArrayAgg(
 194            this=seq_get(args, 0), nulls_excluded=dialect.ARRAY_AGG_INCLUDES_NULLS is None or None
 195        ),
 196        "ARRAY_AGG": lambda args, dialect: exp.ArrayAgg(
 197            this=seq_get(args, 0), nulls_excluded=dialect.ARRAY_AGG_INCLUDES_NULLS is None or None
 198        ),
 199        "CHAR": lambda args: exp.Chr(expressions=args),
 200        "CHR": lambda args: exp.Chr(expressions=args),
 201        "COUNT": lambda args: exp.Count(this=seq_get(args, 0), expressions=args[1:], big_int=True),
 202        "CONCAT": lambda args, dialect: exp.Concat(
 203            expressions=args,
 204            safe=not dialect.STRICT_STRING_CONCAT,
 205            coalesce=dialect.CONCAT_COALESCE,
 206        ),
 207        "CONCAT_WS": lambda args, dialect: exp.ConcatWs(
 208            expressions=args,
 209            safe=not dialect.STRICT_STRING_CONCAT,
 210            coalesce=dialect.CONCAT_COALESCE,
 211        ),
 212        "CONVERT_TIMEZONE": build_convert_timezone,
 213        "DATE_TO_DATE_STR": lambda args: exp.Cast(
 214            this=seq_get(args, 0),
 215            to=exp.DataType(this=exp.DataType.Type.TEXT),
 216        ),
 217        "GENERATE_DATE_ARRAY": lambda args: exp.GenerateDateArray(
 218            start=seq_get(args, 0),
 219            end=seq_get(args, 1),
 220            step=seq_get(args, 2) or exp.Interval(this=exp.Literal.number(1), unit=exp.var("DAY")),
 221        ),
 222        "GLOB": lambda args: exp.Glob(this=seq_get(args, 1), expression=seq_get(args, 0)),
 223        "HEX": build_hex,
 224        "JSON_EXTRACT": build_extract_json_with_path(exp.JSONExtract),
 225        "JSON_EXTRACT_SCALAR": build_extract_json_with_path(exp.JSONExtractScalar),
 226        "JSON_EXTRACT_PATH_TEXT": build_extract_json_with_path(exp.JSONExtractScalar),
 227        "LIKE": build_like,
 228        "LOG": build_logarithm,
 229        "LOG2": lambda args: exp.Log(this=exp.Literal.number(2), expression=seq_get(args, 0)),
 230        "LOG10": lambda args: exp.Log(this=exp.Literal.number(10), expression=seq_get(args, 0)),
 231        "LOWER": build_lower,
 232        "LPAD": lambda args: build_pad(args),
 233        "LEFTPAD": lambda args: build_pad(args),
 234        "LTRIM": lambda args: build_trim(args),
 235        "MOD": build_mod,
 236        "RIGHTPAD": lambda args: build_pad(args, is_left=False),
 237        "RPAD": lambda args: build_pad(args, is_left=False),
 238        "RTRIM": lambda args: build_trim(args, is_left=False),
 239        "SCOPE_RESOLUTION": lambda args: exp.ScopeResolution(expression=seq_get(args, 0))
 240        if len(args) != 2
 241        else exp.ScopeResolution(this=seq_get(args, 0), expression=seq_get(args, 1)),
 242        "STRPOS": exp.StrPosition.from_arg_list,
 243        "CHARINDEX": lambda args: build_locate_strposition(args),
 244        "INSTR": exp.StrPosition.from_arg_list,
 245        "LOCATE": lambda args: build_locate_strposition(args),
 246        "TIME_TO_TIME_STR": lambda args: exp.Cast(
 247            this=seq_get(args, 0),
 248            to=exp.DataType(this=exp.DataType.Type.TEXT),
 249        ),
 250        "TO_HEX": build_hex,
 251        "TS_OR_DS_TO_DATE_STR": lambda args: exp.Substring(
 252            this=exp.Cast(
 253                this=seq_get(args, 0),
 254                to=exp.DataType(this=exp.DataType.Type.TEXT),
 255            ),
 256            start=exp.Literal.number(1),
 257            length=exp.Literal.number(10),
 258        ),
 259        "UNNEST": lambda args: exp.Unnest(expressions=ensure_list(seq_get(args, 0))),
 260        "UPPER": build_upper,
 261        "VAR_MAP": build_var_map,
 262    }
 263
 264    NO_PAREN_FUNCTIONS = {
 265        TokenType.CURRENT_DATE: exp.CurrentDate,
 266        TokenType.CURRENT_DATETIME: exp.CurrentDate,
 267        TokenType.CURRENT_TIME: exp.CurrentTime,
 268        TokenType.CURRENT_TIMESTAMP: exp.CurrentTimestamp,
 269        TokenType.CURRENT_USER: exp.CurrentUser,
 270    }
 271
 272    STRUCT_TYPE_TOKENS = {
 273        TokenType.NESTED,
 274        TokenType.OBJECT,
 275        TokenType.STRUCT,
 276        TokenType.UNION,
 277    }
 278
 279    NESTED_TYPE_TOKENS = {
 280        TokenType.ARRAY,
 281        TokenType.LIST,
 282        TokenType.LOWCARDINALITY,
 283        TokenType.MAP,
 284        TokenType.NULLABLE,
 285        TokenType.RANGE,
 286        *STRUCT_TYPE_TOKENS,
 287    }
 288
 289    ENUM_TYPE_TOKENS = {
 290        TokenType.DYNAMIC,
 291        TokenType.ENUM,
 292        TokenType.ENUM8,
 293        TokenType.ENUM16,
 294    }
 295
 296    AGGREGATE_TYPE_TOKENS = {
 297        TokenType.AGGREGATEFUNCTION,
 298        TokenType.SIMPLEAGGREGATEFUNCTION,
 299    }
 300
 301    TYPE_TOKENS = {
 302        TokenType.BIT,
 303        TokenType.BOOLEAN,
 304        TokenType.TINYINT,
 305        TokenType.UTINYINT,
 306        TokenType.SMALLINT,
 307        TokenType.USMALLINT,
 308        TokenType.INT,
 309        TokenType.UINT,
 310        TokenType.BIGINT,
 311        TokenType.UBIGINT,
 312        TokenType.INT128,
 313        TokenType.UINT128,
 314        TokenType.INT256,
 315        TokenType.UINT256,
 316        TokenType.MEDIUMINT,
 317        TokenType.UMEDIUMINT,
 318        TokenType.FIXEDSTRING,
 319        TokenType.FLOAT,
 320        TokenType.DOUBLE,
 321        TokenType.UDOUBLE,
 322        TokenType.CHAR,
 323        TokenType.NCHAR,
 324        TokenType.VARCHAR,
 325        TokenType.NVARCHAR,
 326        TokenType.BPCHAR,
 327        TokenType.TEXT,
 328        TokenType.MEDIUMTEXT,
 329        TokenType.LONGTEXT,
 330        TokenType.MEDIUMBLOB,
 331        TokenType.LONGBLOB,
 332        TokenType.BINARY,
 333        TokenType.VARBINARY,
 334        TokenType.JSON,
 335        TokenType.JSONB,
 336        TokenType.INTERVAL,
 337        TokenType.TINYBLOB,
 338        TokenType.TINYTEXT,
 339        TokenType.TIME,
 340        TokenType.TIMETZ,
 341        TokenType.TIMESTAMP,
 342        TokenType.TIMESTAMP_S,
 343        TokenType.TIMESTAMP_MS,
 344        TokenType.TIMESTAMP_NS,
 345        TokenType.TIMESTAMPTZ,
 346        TokenType.TIMESTAMPLTZ,
 347        TokenType.TIMESTAMPNTZ,
 348        TokenType.DATETIME,
 349        TokenType.DATETIME2,
 350        TokenType.DATETIME64,
 351        TokenType.SMALLDATETIME,
 352        TokenType.DATE,
 353        TokenType.DATE32,
 354        TokenType.INT4RANGE,
 355        TokenType.INT4MULTIRANGE,
 356        TokenType.INT8RANGE,
 357        TokenType.INT8MULTIRANGE,
 358        TokenType.NUMRANGE,
 359        TokenType.NUMMULTIRANGE,
 360        TokenType.TSRANGE,
 361        TokenType.TSMULTIRANGE,
 362        TokenType.TSTZRANGE,
 363        TokenType.TSTZMULTIRANGE,
 364        TokenType.DATERANGE,
 365        TokenType.DATEMULTIRANGE,
 366        TokenType.DECIMAL,
 367        TokenType.DECIMAL32,
 368        TokenType.DECIMAL64,
 369        TokenType.DECIMAL128,
 370        TokenType.DECIMAL256,
 371        TokenType.UDECIMAL,
 372        TokenType.BIGDECIMAL,
 373        TokenType.UUID,
 374        TokenType.GEOGRAPHY,
 375        TokenType.GEOMETRY,
 376        TokenType.POINT,
 377        TokenType.RING,
 378        TokenType.LINESTRING,
 379        TokenType.MULTILINESTRING,
 380        TokenType.POLYGON,
 381        TokenType.MULTIPOLYGON,
 382        TokenType.HLLSKETCH,
 383        TokenType.HSTORE,
 384        TokenType.PSEUDO_TYPE,
 385        TokenType.SUPER,
 386        TokenType.SERIAL,
 387        TokenType.SMALLSERIAL,
 388        TokenType.BIGSERIAL,
 389        TokenType.XML,
 390        TokenType.YEAR,
 391        TokenType.USERDEFINED,
 392        TokenType.MONEY,
 393        TokenType.SMALLMONEY,
 394        TokenType.ROWVERSION,
 395        TokenType.IMAGE,
 396        TokenType.VARIANT,
 397        TokenType.VECTOR,
 398        TokenType.OBJECT,
 399        TokenType.OBJECT_IDENTIFIER,
 400        TokenType.INET,
 401        TokenType.IPADDRESS,
 402        TokenType.IPPREFIX,
 403        TokenType.IPV4,
 404        TokenType.IPV6,
 405        TokenType.UNKNOWN,
 406        TokenType.NULL,
 407        TokenType.NAME,
 408        TokenType.TDIGEST,
 409        TokenType.DYNAMIC,
 410        *ENUM_TYPE_TOKENS,
 411        *NESTED_TYPE_TOKENS,
 412        *AGGREGATE_TYPE_TOKENS,
 413    }
 414
 415    SIGNED_TO_UNSIGNED_TYPE_TOKEN = {
 416        TokenType.BIGINT: TokenType.UBIGINT,
 417        TokenType.INT: TokenType.UINT,
 418        TokenType.MEDIUMINT: TokenType.UMEDIUMINT,
 419        TokenType.SMALLINT: TokenType.USMALLINT,
 420        TokenType.TINYINT: TokenType.UTINYINT,
 421        TokenType.DECIMAL: TokenType.UDECIMAL,
 422        TokenType.DOUBLE: TokenType.UDOUBLE,
 423    }
 424
 425    SUBQUERY_PREDICATES = {
 426        TokenType.ANY: exp.Any,
 427        TokenType.ALL: exp.All,
 428        TokenType.EXISTS: exp.Exists,
 429        TokenType.SOME: exp.Any,
 430    }
 431
 432    RESERVED_TOKENS = {
 433        *Tokenizer.SINGLE_TOKENS.values(),
 434        TokenType.SELECT,
 435    } - {TokenType.IDENTIFIER}
 436
 437    DB_CREATABLES = {
 438        TokenType.DATABASE,
 439        TokenType.DICTIONARY,
 440        TokenType.MODEL,
 441        TokenType.NAMESPACE,
 442        TokenType.SCHEMA,
 443        TokenType.SEQUENCE,
 444        TokenType.SINK,
 445        TokenType.SOURCE,
 446        TokenType.STORAGE_INTEGRATION,
 447        TokenType.STREAMLIT,
 448        TokenType.TABLE,
 449        TokenType.TAG,
 450        TokenType.VIEW,
 451        TokenType.WAREHOUSE,
 452    }
 453
 454    CREATABLES = {
 455        TokenType.COLUMN,
 456        TokenType.CONSTRAINT,
 457        TokenType.FOREIGN_KEY,
 458        TokenType.FUNCTION,
 459        TokenType.INDEX,
 460        TokenType.PROCEDURE,
 461        *DB_CREATABLES,
 462    }
 463
 464    ALTERABLES = {
 465        TokenType.INDEX,
 466        TokenType.TABLE,
 467        TokenType.VIEW,
 468    }
 469
 470    # Tokens that can represent identifiers
 471    ID_VAR_TOKENS = {
 472        TokenType.ALL,
 473        TokenType.ATTACH,
 474        TokenType.VAR,
 475        TokenType.ANTI,
 476        TokenType.APPLY,
 477        TokenType.ASC,
 478        TokenType.ASOF,
 479        TokenType.AUTO_INCREMENT,
 480        TokenType.BEGIN,
 481        TokenType.BPCHAR,
 482        TokenType.CACHE,
 483        TokenType.CASE,
 484        TokenType.COLLATE,
 485        TokenType.COMMAND,
 486        TokenType.COMMENT,
 487        TokenType.COMMIT,
 488        TokenType.CONSTRAINT,
 489        TokenType.COPY,
 490        TokenType.CUBE,
 491        TokenType.CURRENT_SCHEMA,
 492        TokenType.DEFAULT,
 493        TokenType.DELETE,
 494        TokenType.DESC,
 495        TokenType.DESCRIBE,
 496        TokenType.DETACH,
 497        TokenType.DICTIONARY,
 498        TokenType.DIV,
 499        TokenType.END,
 500        TokenType.EXECUTE,
 501        TokenType.EXPORT,
 502        TokenType.ESCAPE,
 503        TokenType.FALSE,
 504        TokenType.FIRST,
 505        TokenType.FILTER,
 506        TokenType.FINAL,
 507        TokenType.FORMAT,
 508        TokenType.FULL,
 509        TokenType.IDENTIFIER,
 510        TokenType.IS,
 511        TokenType.ISNULL,
 512        TokenType.INTERVAL,
 513        TokenType.KEEP,
 514        TokenType.KILL,
 515        TokenType.LEFT,
 516        TokenType.LIMIT,
 517        TokenType.LOAD,
 518        TokenType.MERGE,
 519        TokenType.NATURAL,
 520        TokenType.NEXT,
 521        TokenType.OFFSET,
 522        TokenType.OPERATOR,
 523        TokenType.ORDINALITY,
 524        TokenType.OVERLAPS,
 525        TokenType.OVERWRITE,
 526        TokenType.PARTITION,
 527        TokenType.PERCENT,
 528        TokenType.PIVOT,
 529        TokenType.PRAGMA,
 530        TokenType.RANGE,
 531        TokenType.RECURSIVE,
 532        TokenType.REFERENCES,
 533        TokenType.REFRESH,
 534        TokenType.RENAME,
 535        TokenType.REPLACE,
 536        TokenType.RIGHT,
 537        TokenType.ROLLUP,
 538        TokenType.ROW,
 539        TokenType.ROWS,
 540        TokenType.SEMI,
 541        TokenType.SET,
 542        TokenType.SETTINGS,
 543        TokenType.SHOW,
 544        TokenType.TEMPORARY,
 545        TokenType.TOP,
 546        TokenType.TRUE,
 547        TokenType.TRUNCATE,
 548        TokenType.UNIQUE,
 549        TokenType.UNNEST,
 550        TokenType.UNPIVOT,
 551        TokenType.UPDATE,
 552        TokenType.USE,
 553        TokenType.VOLATILE,
 554        TokenType.WINDOW,
 555        *CREATABLES,
 556        *SUBQUERY_PREDICATES,
 557        *TYPE_TOKENS,
 558        *NO_PAREN_FUNCTIONS,
 559    }
 560    ID_VAR_TOKENS.remove(TokenType.UNION)
 561
 562    TABLE_ALIAS_TOKENS = ID_VAR_TOKENS - {
 563        TokenType.ANTI,
 564        TokenType.APPLY,
 565        TokenType.ASOF,
 566        TokenType.FULL,
 567        TokenType.LEFT,
 568        TokenType.LOCK,
 569        TokenType.NATURAL,
 570        TokenType.RIGHT,
 571        TokenType.SEMI,
 572        TokenType.WINDOW,
 573    }
 574
 575    ALIAS_TOKENS = ID_VAR_TOKENS
 576
 577    ARRAY_CONSTRUCTORS = {
 578        "ARRAY": exp.Array,
 579        "LIST": exp.List,
 580    }
 581
 582    COMMENT_TABLE_ALIAS_TOKENS = TABLE_ALIAS_TOKENS - {TokenType.IS}
 583
 584    UPDATE_ALIAS_TOKENS = TABLE_ALIAS_TOKENS - {TokenType.SET}
 585
 586    TRIM_TYPES = {"LEADING", "TRAILING", "BOTH"}
 587
 588    FUNC_TOKENS = {
 589        TokenType.COLLATE,
 590        TokenType.COMMAND,
 591        TokenType.CURRENT_DATE,
 592        TokenType.CURRENT_DATETIME,
 593        TokenType.CURRENT_SCHEMA,
 594        TokenType.CURRENT_TIMESTAMP,
 595        TokenType.CURRENT_TIME,
 596        TokenType.CURRENT_USER,
 597        TokenType.FILTER,
 598        TokenType.FIRST,
 599        TokenType.FORMAT,
 600        TokenType.GLOB,
 601        TokenType.IDENTIFIER,
 602        TokenType.INDEX,
 603        TokenType.ISNULL,
 604        TokenType.ILIKE,
 605        TokenType.INSERT,
 606        TokenType.LIKE,
 607        TokenType.MERGE,
 608        TokenType.NEXT,
 609        TokenType.OFFSET,
 610        TokenType.PRIMARY_KEY,
 611        TokenType.RANGE,
 612        TokenType.REPLACE,
 613        TokenType.RLIKE,
 614        TokenType.ROW,
 615        TokenType.UNNEST,
 616        TokenType.VAR,
 617        TokenType.LEFT,
 618        TokenType.RIGHT,
 619        TokenType.SEQUENCE,
 620        TokenType.DATE,
 621        TokenType.DATETIME,
 622        TokenType.TABLE,
 623        TokenType.TIMESTAMP,
 624        TokenType.TIMESTAMPTZ,
 625        TokenType.TRUNCATE,
 626        TokenType.WINDOW,
 627        TokenType.XOR,
 628        *TYPE_TOKENS,
 629        *SUBQUERY_PREDICATES,
 630    }
 631
 632    CONJUNCTION: t.Dict[TokenType, t.Type[exp.Expression]] = {
 633        TokenType.AND: exp.And,
 634    }
 635
 636    ASSIGNMENT: t.Dict[TokenType, t.Type[exp.Expression]] = {
 637        TokenType.COLON_EQ: exp.PropertyEQ,
 638    }
 639
 640    DISJUNCTION: t.Dict[TokenType, t.Type[exp.Expression]] = {
 641        TokenType.OR: exp.Or,
 642    }
 643
 644    EQUALITY = {
 645        TokenType.EQ: exp.EQ,
 646        TokenType.NEQ: exp.NEQ,
 647        TokenType.NULLSAFE_EQ: exp.NullSafeEQ,
 648    }
 649
 650    COMPARISON = {
 651        TokenType.GT: exp.GT,
 652        TokenType.GTE: exp.GTE,
 653        TokenType.LT: exp.LT,
 654        TokenType.LTE: exp.LTE,
 655    }
 656
 657    BITWISE = {
 658        TokenType.AMP: exp.BitwiseAnd,
 659        TokenType.CARET: exp.BitwiseXor,
 660        TokenType.PIPE: exp.BitwiseOr,
 661    }
 662
 663    TERM = {
 664        TokenType.DASH: exp.Sub,
 665        TokenType.PLUS: exp.Add,
 666        TokenType.MOD: exp.Mod,
 667        TokenType.COLLATE: exp.Collate,
 668    }
 669
 670    FACTOR = {
 671        TokenType.DIV: exp.IntDiv,
 672        TokenType.LR_ARROW: exp.Distance,
 673        TokenType.SLASH: exp.Div,
 674        TokenType.STAR: exp.Mul,
 675    }
 676
 677    EXPONENT: t.Dict[TokenType, t.Type[exp.Expression]] = {}
 678
 679    TIMES = {
 680        TokenType.TIME,
 681        TokenType.TIMETZ,
 682    }
 683
 684    TIMESTAMPS = {
 685        TokenType.TIMESTAMP,
 686        TokenType.TIMESTAMPTZ,
 687        TokenType.TIMESTAMPLTZ,
 688        *TIMES,
 689    }
 690
 691    SET_OPERATIONS = {
 692        TokenType.UNION,
 693        TokenType.INTERSECT,
 694        TokenType.EXCEPT,
 695    }
 696
 697    JOIN_METHODS = {
 698        TokenType.ASOF,
 699        TokenType.NATURAL,
 700        TokenType.POSITIONAL,
 701    }
 702
 703    JOIN_SIDES = {
 704        TokenType.LEFT,
 705        TokenType.RIGHT,
 706        TokenType.FULL,
 707    }
 708
 709    JOIN_KINDS = {
 710        TokenType.ANTI,
 711        TokenType.CROSS,
 712        TokenType.INNER,
 713        TokenType.OUTER,
 714        TokenType.SEMI,
 715        TokenType.STRAIGHT_JOIN,
 716    }
 717
 718    JOIN_HINTS: t.Set[str] = set()
 719
 720    LAMBDAS = {
 721        TokenType.ARROW: lambda self, expressions: self.expression(
 722            exp.Lambda,
 723            this=self._replace_lambda(
 724                self._parse_assignment(),
 725                expressions,
 726            ),
 727            expressions=expressions,
 728        ),
 729        TokenType.FARROW: lambda self, expressions: self.expression(
 730            exp.Kwarg,
 731            this=exp.var(expressions[0].name),
 732            expression=self._parse_assignment(),
 733        ),
 734    }
 735
 736    COLUMN_OPERATORS = {
 737        TokenType.DOT: None,
 738        TokenType.DOTCOLON: lambda self, this, to: self.expression(
 739            exp.JSONCast,
 740            this=this,
 741            to=to,
 742        ),
 743        TokenType.DCOLON: lambda self, this, to: self.expression(
 744            exp.Cast if self.STRICT_CAST else exp.TryCast,
 745            this=this,
 746            to=to,
 747        ),
 748        TokenType.ARROW: lambda self, this, path: self.expression(
 749            exp.JSONExtract,
 750            this=this,
 751            expression=self.dialect.to_json_path(path),
 752            only_json_types=self.JSON_ARROWS_REQUIRE_JSON_TYPE,
 753        ),
 754        TokenType.DARROW: lambda self, this, path: self.expression(
 755            exp.JSONExtractScalar,
 756            this=this,
 757            expression=self.dialect.to_json_path(path),
 758            only_json_types=self.JSON_ARROWS_REQUIRE_JSON_TYPE,
 759        ),
 760        TokenType.HASH_ARROW: lambda self, this, path: self.expression(
 761            exp.JSONBExtract,
 762            this=this,
 763            expression=path,
 764        ),
 765        TokenType.DHASH_ARROW: lambda self, this, path: self.expression(
 766            exp.JSONBExtractScalar,
 767            this=this,
 768            expression=path,
 769        ),
 770        TokenType.PLACEHOLDER: lambda self, this, key: self.expression(
 771            exp.JSONBContains,
 772            this=this,
 773            expression=key,
 774        ),
 775    }
 776
 777    EXPRESSION_PARSERS = {
 778        exp.Cluster: lambda self: self._parse_sort(exp.Cluster, TokenType.CLUSTER_BY),
 779        exp.Column: lambda self: self._parse_column(),
 780        exp.Condition: lambda self: self._parse_assignment(),
 781        exp.DataType: lambda self: self._parse_types(allow_identifiers=False, schema=True),
 782        exp.Expression: lambda self: self._parse_expression(),
 783        exp.From: lambda self: self._parse_from(joins=True),
 784        exp.Group: lambda self: self._parse_group(),
 785        exp.Having: lambda self: self._parse_having(),
 786        exp.Hint: lambda self: self._parse_hint_body(),
 787        exp.Identifier: lambda self: self._parse_id_var(),
 788        exp.Join: lambda self: self._parse_join(),
 789        exp.Lambda: lambda self: self._parse_lambda(),
 790        exp.Lateral: lambda self: self._parse_lateral(),
 791        exp.Limit: lambda self: self._parse_limit(),
 792        exp.Offset: lambda self: self._parse_offset(),
 793        exp.Order: lambda self: self._parse_order(),
 794        exp.Ordered: lambda self: self._parse_ordered(),
 795        exp.Properties: lambda self: self._parse_properties(),
 796        exp.Qualify: lambda self: self._parse_qualify(),
 797        exp.Returning: lambda self: self._parse_returning(),
 798        exp.Select: lambda self: self._parse_select(),
 799        exp.Sort: lambda self: self._parse_sort(exp.Sort, TokenType.SORT_BY),
 800        exp.Table: lambda self: self._parse_table_parts(),
 801        exp.TableAlias: lambda self: self._parse_table_alias(),
 802        exp.Tuple: lambda self: self._parse_value(),
 803        exp.Whens: lambda self: self._parse_when_matched(),
 804        exp.Where: lambda self: self._parse_where(),
 805        exp.Window: lambda self: self._parse_named_window(),
 806        exp.With: lambda self: self._parse_with(),
 807        "JOIN_TYPE": lambda self: self._parse_join_parts(),
 808    }
 809
 810    STATEMENT_PARSERS = {
 811        TokenType.ALTER: lambda self: self._parse_alter(),
 812        TokenType.ANALYZE: lambda self: self._parse_analyze(),
 813        TokenType.BEGIN: lambda self: self._parse_transaction(),
 814        TokenType.CACHE: lambda self: self._parse_cache(),
 815        TokenType.COMMENT: lambda self: self._parse_comment(),
 816        TokenType.COMMIT: lambda self: self._parse_commit_or_rollback(),
 817        TokenType.COPY: lambda self: self._parse_copy(),
 818        TokenType.CREATE: lambda self: self._parse_create(),
 819        TokenType.DELETE: lambda self: self._parse_delete(),
 820        TokenType.DESC: lambda self: self._parse_describe(),
 821        TokenType.DESCRIBE: lambda self: self._parse_describe(),
 822        TokenType.DROP: lambda self: self._parse_drop(),
 823        TokenType.GRANT: lambda self: self._parse_grant(),
 824        TokenType.INSERT: lambda self: self._parse_insert(),
 825        TokenType.KILL: lambda self: self._parse_kill(),
 826        TokenType.LOAD: lambda self: self._parse_load(),
 827        TokenType.MERGE: lambda self: self._parse_merge(),
 828        TokenType.PIVOT: lambda self: self._parse_simplified_pivot(),
 829        TokenType.PRAGMA: lambda self: self.expression(exp.Pragma, this=self._parse_expression()),
 830        TokenType.REFRESH: lambda self: self._parse_refresh(),
 831        TokenType.ROLLBACK: lambda self: self._parse_commit_or_rollback(),
 832        TokenType.SET: lambda self: self._parse_set(),
 833        TokenType.TRUNCATE: lambda self: self._parse_truncate_table(),
 834        TokenType.UNCACHE: lambda self: self._parse_uncache(),
 835        TokenType.UNPIVOT: lambda self: self._parse_simplified_pivot(is_unpivot=True),
 836        TokenType.UPDATE: lambda self: self._parse_update(),
 837        TokenType.USE: lambda self: self._parse_use(),
 838        TokenType.SEMICOLON: lambda self: exp.Semicolon(),
 839    }
 840
 841    UNARY_PARSERS = {
 842        TokenType.PLUS: lambda self: self._parse_unary(),  # Unary + is handled as a no-op
 843        TokenType.NOT: lambda self: self.expression(exp.Not, this=self._parse_equality()),
 844        TokenType.TILDA: lambda self: self.expression(exp.BitwiseNot, this=self._parse_unary()),
 845        TokenType.DASH: lambda self: self.expression(exp.Neg, this=self._parse_unary()),
 846        TokenType.PIPE_SLASH: lambda self: self.expression(exp.Sqrt, this=self._parse_unary()),
 847        TokenType.DPIPE_SLASH: lambda self: self.expression(exp.Cbrt, this=self._parse_unary()),
 848    }
 849
 850    STRING_PARSERS = {
 851        TokenType.HEREDOC_STRING: lambda self, token: self.expression(
 852            exp.RawString, this=token.text
 853        ),
 854        TokenType.NATIONAL_STRING: lambda self, token: self.expression(
 855            exp.National, this=token.text
 856        ),
 857        TokenType.RAW_STRING: lambda self, token: self.expression(exp.RawString, this=token.text),
 858        TokenType.STRING: lambda self, token: self.expression(
 859            exp.Literal, this=token.text, is_string=True
 860        ),
 861        TokenType.UNICODE_STRING: lambda self, token: self.expression(
 862            exp.UnicodeString,
 863            this=token.text,
 864            escape=self._match_text_seq("UESCAPE") and self._parse_string(),
 865        ),
 866    }
 867
 868    NUMERIC_PARSERS = {
 869        TokenType.BIT_STRING: lambda self, token: self.expression(exp.BitString, this=token.text),
 870        TokenType.BYTE_STRING: lambda self, token: self.expression(exp.ByteString, this=token.text),
 871        TokenType.HEX_STRING: lambda self, token: self.expression(
 872            exp.HexString,
 873            this=token.text,
 874            is_integer=self.dialect.HEX_STRING_IS_INTEGER_TYPE or None,
 875        ),
 876        TokenType.NUMBER: lambda self, token: self.expression(
 877            exp.Literal, this=token.text, is_string=False
 878        ),
 879    }
 880
 881    PRIMARY_PARSERS = {
 882        **STRING_PARSERS,
 883        **NUMERIC_PARSERS,
 884        TokenType.INTRODUCER: lambda self, token: self._parse_introducer(token),
 885        TokenType.NULL: lambda self, _: self.expression(exp.Null),
 886        TokenType.TRUE: lambda self, _: self.expression(exp.Boolean, this=True),
 887        TokenType.FALSE: lambda self, _: self.expression(exp.Boolean, this=False),
 888        TokenType.SESSION_PARAMETER: lambda self, _: self._parse_session_parameter(),
 889        TokenType.STAR: lambda self, _: self._parse_star_ops(),
 890    }
 891
 892    PLACEHOLDER_PARSERS = {
 893        TokenType.PLACEHOLDER: lambda self: self.expression(exp.Placeholder),
 894        TokenType.PARAMETER: lambda self: self._parse_parameter(),
 895        TokenType.COLON: lambda self: (
 896            self.expression(exp.Placeholder, this=self._prev.text)
 897            if self._match_set(self.ID_VAR_TOKENS)
 898            else None
 899        ),
 900    }
 901
 902    RANGE_PARSERS = {
 903        TokenType.AT_GT: binary_range_parser(exp.ArrayContainsAll),
 904        TokenType.BETWEEN: lambda self, this: self._parse_between(this),
 905        TokenType.GLOB: binary_range_parser(exp.Glob),
 906        TokenType.ILIKE: binary_range_parser(exp.ILike),
 907        TokenType.IN: lambda self, this: self._parse_in(this),
 908        TokenType.IRLIKE: binary_range_parser(exp.RegexpILike),
 909        TokenType.IS: lambda self, this: self._parse_is(this),
 910        TokenType.LIKE: binary_range_parser(exp.Like),
 911        TokenType.LT_AT: binary_range_parser(exp.ArrayContainsAll, reverse_args=True),
 912        TokenType.OVERLAPS: binary_range_parser(exp.Overlaps),
 913        TokenType.RLIKE: binary_range_parser(exp.RegexpLike),
 914        TokenType.SIMILAR_TO: binary_range_parser(exp.SimilarTo),
 915        TokenType.FOR: lambda self, this: self._parse_comprehension(this),
 916    }
 917
 918    PROPERTY_PARSERS: t.Dict[str, t.Callable] = {
 919        "ALLOWED_VALUES": lambda self: self.expression(
 920            exp.AllowedValuesProperty, expressions=self._parse_csv(self._parse_primary)
 921        ),
 922        "ALGORITHM": lambda self: self._parse_property_assignment(exp.AlgorithmProperty),
 923        "AUTO": lambda self: self._parse_auto_property(),
 924        "AUTO_INCREMENT": lambda self: self._parse_property_assignment(exp.AutoIncrementProperty),
 925        "BACKUP": lambda self: self.expression(
 926            exp.BackupProperty, this=self._parse_var(any_token=True)
 927        ),
 928        "BLOCKCOMPRESSION": lambda self: self._parse_blockcompression(),
 929        "CHARSET": lambda self, **kwargs: self._parse_character_set(**kwargs),
 930        "CHARACTER SET": lambda self, **kwargs: self._parse_character_set(**kwargs),
 931        "CHECKSUM": lambda self: self._parse_checksum(),
 932        "CLUSTER BY": lambda self: self._parse_cluster(),
 933        "CLUSTERED": lambda self: self._parse_clustered_by(),
 934        "COLLATE": lambda self, **kwargs: self._parse_property_assignment(
 935            exp.CollateProperty, **kwargs
 936        ),
 937        "COMMENT": lambda self: self._parse_property_assignment(exp.SchemaCommentProperty),
 938        "CONTAINS": lambda self: self._parse_contains_property(),
 939        "COPY": lambda self: self._parse_copy_property(),
 940        "DATABLOCKSIZE": lambda self, **kwargs: self._parse_datablocksize(**kwargs),
 941        "DATA_DELETION": lambda self: self._parse_data_deletion_property(),
 942        "DEFINER": lambda self: self._parse_definer(),
 943        "DETERMINISTIC": lambda self: self.expression(
 944            exp.StabilityProperty, this=exp.Literal.string("IMMUTABLE")
 945        ),
 946        "DISTRIBUTED": lambda self: self._parse_distributed_property(),
 947        "DUPLICATE": lambda self: self._parse_composite_key_property(exp.DuplicateKeyProperty),
 948        "DYNAMIC": lambda self: self.expression(exp.DynamicProperty),
 949        "DISTKEY": lambda self: self._parse_distkey(),
 950        "DISTSTYLE": lambda self: self._parse_property_assignment(exp.DistStyleProperty),
 951        "EMPTY": lambda self: self.expression(exp.EmptyProperty),
 952        "ENGINE": lambda self: self._parse_property_assignment(exp.EngineProperty),
 953        "EXECUTE": lambda self: self._parse_property_assignment(exp.ExecuteAsProperty),
 954        "EXTERNAL": lambda self: self.expression(exp.ExternalProperty),
 955        "FALLBACK": lambda self, **kwargs: self._parse_fallback(**kwargs),
 956        "FORMAT": lambda self: self._parse_property_assignment(exp.FileFormatProperty),
 957        "FREESPACE": lambda self: self._parse_freespace(),
 958        "GLOBAL": lambda self: self.expression(exp.GlobalProperty),
 959        "HEAP": lambda self: self.expression(exp.HeapProperty),
 960        "ICEBERG": lambda self: self.expression(exp.IcebergProperty),
 961        "IMMUTABLE": lambda self: self.expression(
 962            exp.StabilityProperty, this=exp.Literal.string("IMMUTABLE")
 963        ),
 964        "INHERITS": lambda self: self.expression(
 965            exp.InheritsProperty, expressions=self._parse_wrapped_csv(self._parse_table)
 966        ),
 967        "INPUT": lambda self: self.expression(exp.InputModelProperty, this=self._parse_schema()),
 968        "JOURNAL": lambda self, **kwargs: self._parse_journal(**kwargs),
 969        "LANGUAGE": lambda self: self._parse_property_assignment(exp.LanguageProperty),
 970        "LAYOUT": lambda self: self._parse_dict_property(this="LAYOUT"),
 971        "LIFETIME": lambda self: self._parse_dict_range(this="LIFETIME"),
 972        "LIKE": lambda self: self._parse_create_like(),
 973        "LOCATION": lambda self: self._parse_property_assignment(exp.LocationProperty),
 974        "LOCK": lambda self: self._parse_locking(),
 975        "LOCKING": lambda self: self._parse_locking(),
 976        "LOG": lambda self, **kwargs: self._parse_log(**kwargs),
 977        "MATERIALIZED": lambda self: self.expression(exp.MaterializedProperty),
 978        "MERGEBLOCKRATIO": lambda self, **kwargs: self._parse_mergeblockratio(**kwargs),
 979        "MODIFIES": lambda self: self._parse_modifies_property(),
 980        "MULTISET": lambda self: self.expression(exp.SetProperty, multi=True),
 981        "NO": lambda self: self._parse_no_property(),
 982        "ON": lambda self: self._parse_on_property(),
 983        "ORDER BY": lambda self: self._parse_order(skip_order_token=True),
 984        "OUTPUT": lambda self: self.expression(exp.OutputModelProperty, this=self._parse_schema()),
 985        "PARTITION": lambda self: self._parse_partitioned_of(),
 986        "PARTITION BY": lambda self: self._parse_partitioned_by(),
 987        "PARTITIONED BY": lambda self: self._parse_partitioned_by(),
 988        "PARTITIONED_BY": lambda self: self._parse_partitioned_by(),
 989        "PRIMARY KEY": lambda self: self._parse_primary_key(in_props=True),
 990        "RANGE": lambda self: self._parse_dict_range(this="RANGE"),
 991        "READS": lambda self: self._parse_reads_property(),
 992        "REMOTE": lambda self: self._parse_remote_with_connection(),
 993        "RETURNS": lambda self: self._parse_returns(),
 994        "STRICT": lambda self: self.expression(exp.StrictProperty),
 995        "STREAMING": lambda self: self.expression(exp.StreamingTableProperty),
 996        "ROW": lambda self: self._parse_row(),
 997        "ROW_FORMAT": lambda self: self._parse_property_assignment(exp.RowFormatProperty),
 998        "SAMPLE": lambda self: self.expression(
 999            exp.SampleProperty, this=self._match_text_seq("BY") and self._parse_bitwise()
1000        ),
1001        "SECURE": lambda self: self.expression(exp.SecureProperty),
1002        "SECURITY": lambda self: self._parse_security(),
1003        "SET": lambda self: self.expression(exp.SetProperty, multi=False),
1004        "SETTINGS": lambda self: self._parse_settings_property(),
1005        "SHARING": lambda self: self._parse_property_assignment(exp.SharingProperty),
1006        "SORTKEY": lambda self: self._parse_sortkey(),
1007        "SOURCE": lambda self: self._parse_dict_property(this="SOURCE"),
1008        "STABLE": lambda self: self.expression(
1009            exp.StabilityProperty, this=exp.Literal.string("STABLE")
1010        ),
1011        "STORED": lambda self: self._parse_stored(),
1012        "SYSTEM_VERSIONING": lambda self: self._parse_system_versioning_property(),
1013        "TBLPROPERTIES": lambda self: self._parse_wrapped_properties(),
1014        "TEMP": lambda self: self.expression(exp.TemporaryProperty),
1015        "TEMPORARY": lambda self: self.expression(exp.TemporaryProperty),
1016        "TO": lambda self: self._parse_to_table(),
1017        "TRANSIENT": lambda self: self.expression(exp.TransientProperty),
1018        "TRANSFORM": lambda self: self.expression(
1019            exp.TransformModelProperty, expressions=self._parse_wrapped_csv(self._parse_expression)
1020        ),
1021        "TTL": lambda self: self._parse_ttl(),
1022        "USING": lambda self: self._parse_property_assignment(exp.FileFormatProperty),
1023        "UNLOGGED": lambda self: self.expression(exp.UnloggedProperty),
1024        "VOLATILE": lambda self: self._parse_volatile_property(),
1025        "WITH": lambda self: self._parse_with_property(),
1026    }
1027
1028    CONSTRAINT_PARSERS = {
1029        "AUTOINCREMENT": lambda self: self._parse_auto_increment(),
1030        "AUTO_INCREMENT": lambda self: self._parse_auto_increment(),
1031        "CASESPECIFIC": lambda self: self.expression(exp.CaseSpecificColumnConstraint, not_=False),
1032        "CHARACTER SET": lambda self: self.expression(
1033            exp.CharacterSetColumnConstraint, this=self._parse_var_or_string()
1034        ),
1035        "CHECK": lambda self: self.expression(
1036            exp.CheckColumnConstraint,
1037            this=self._parse_wrapped(self._parse_assignment),
1038            enforced=self._match_text_seq("ENFORCED"),
1039        ),
1040        "COLLATE": lambda self: self.expression(
1041            exp.CollateColumnConstraint,
1042            this=self._parse_identifier() or self._parse_column(),
1043        ),
1044        "COMMENT": lambda self: self.expression(
1045            exp.CommentColumnConstraint, this=self._parse_string()
1046        ),
1047        "COMPRESS": lambda self: self._parse_compress(),
1048        "CLUSTERED": lambda self: self.expression(
1049            exp.ClusteredColumnConstraint, this=self._parse_wrapped_csv(self._parse_ordered)
1050        ),
1051        "NONCLUSTERED": lambda self: self.expression(
1052            exp.NonClusteredColumnConstraint, this=self._parse_wrapped_csv(self._parse_ordered)
1053        ),
1054        "DEFAULT": lambda self: self.expression(
1055            exp.DefaultColumnConstraint, this=self._parse_bitwise()
1056        ),
1057        "ENCODE": lambda self: self.expression(exp.EncodeColumnConstraint, this=self._parse_var()),
1058        "EPHEMERAL": lambda self: self.expression(
1059            exp.EphemeralColumnConstraint, this=self._parse_bitwise()
1060        ),
1061        "EXCLUDE": lambda self: self.expression(
1062            exp.ExcludeColumnConstraint, this=self._parse_index_params()
1063        ),
1064        "FOREIGN KEY": lambda self: self._parse_foreign_key(),
1065        "FORMAT": lambda self: self.expression(
1066            exp.DateFormatColumnConstraint, this=self._parse_var_or_string()
1067        ),
1068        "GENERATED": lambda self: self._parse_generated_as_identity(),
1069        "IDENTITY": lambda self: self._parse_auto_increment(),
1070        "INLINE": lambda self: self._parse_inline(),
1071        "LIKE": lambda self: self._parse_create_like(),
1072        "NOT": lambda self: self._parse_not_constraint(),
1073        "NULL": lambda self: self.expression(exp.NotNullColumnConstraint, allow_null=True),
1074        "ON": lambda self: (
1075            self._match(TokenType.UPDATE)
1076            and self.expression(exp.OnUpdateColumnConstraint, this=self._parse_function())
1077        )
1078        or self.expression(exp.OnProperty, this=self._parse_id_var()),
1079        "PATH": lambda self: self.expression(exp.PathColumnConstraint, this=self._parse_string()),
1080        "PERIOD": lambda self: self._parse_period_for_system_time(),
1081        "PRIMARY KEY": lambda self: self._parse_primary_key(),
1082        "REFERENCES": lambda self: self._parse_references(match=False),
1083        "TITLE": lambda self: self.expression(
1084            exp.TitleColumnConstraint, this=self._parse_var_or_string()
1085        ),
1086        "TTL": lambda self: self.expression(exp.MergeTreeTTL, expressions=[self._parse_bitwise()]),
1087        "UNIQUE": lambda self: self._parse_unique(),
1088        "UPPERCASE": lambda self: self.expression(exp.UppercaseColumnConstraint),
1089        "WATERMARK": lambda self: self.expression(
1090            exp.WatermarkColumnConstraint,
1091            this=self._match(TokenType.FOR) and self._parse_column(),
1092            expression=self._match(TokenType.ALIAS) and self._parse_disjunction(),
1093        ),
1094        "WITH": lambda self: self.expression(
1095            exp.Properties, expressions=self._parse_wrapped_properties()
1096        ),
1097    }
1098
1099    ALTER_PARSERS = {
1100        "ADD": lambda self: self._parse_alter_table_add(),
1101        "AS": lambda self: self._parse_select(),
1102        "ALTER": lambda self: self._parse_alter_table_alter(),
1103        "CLUSTER BY": lambda self: self._parse_cluster(wrapped=True),
1104        "DELETE": lambda self: self.expression(exp.Delete, where=self._parse_where()),
1105        "DROP": lambda self: self._parse_alter_table_drop(),
1106        "RENAME": lambda self: self._parse_alter_table_rename(),
1107        "SET": lambda self: self._parse_alter_table_set(),
1108        "SWAP": lambda self: self.expression(
1109            exp.SwapTable, this=self._match(TokenType.WITH) and self._parse_table(schema=True)
1110        ),
1111    }
1112
1113    ALTER_ALTER_PARSERS = {
1114        "DISTKEY": lambda self: self._parse_alter_diststyle(),
1115        "DISTSTYLE": lambda self: self._parse_alter_diststyle(),
1116        "SORTKEY": lambda self: self._parse_alter_sortkey(),
1117        "COMPOUND": lambda self: self._parse_alter_sortkey(compound=True),
1118    }
1119
1120    SCHEMA_UNNAMED_CONSTRAINTS = {
1121        "CHECK",
1122        "EXCLUDE",
1123        "FOREIGN KEY",
1124        "LIKE",
1125        "PERIOD",
1126        "PRIMARY KEY",
1127        "UNIQUE",
1128        "WATERMARK",
1129    }
1130
1131    NO_PAREN_FUNCTION_PARSERS = {
1132        "ANY": lambda self: self.expression(exp.Any, this=self._parse_bitwise()),
1133        "CASE": lambda self: self._parse_case(),
1134        "CONNECT_BY_ROOT": lambda self: self.expression(
1135            exp.ConnectByRoot, this=self._parse_column()
1136        ),
1137        "IF": lambda self: self._parse_if(),
1138    }
1139
1140    INVALID_FUNC_NAME_TOKENS = {
1141        TokenType.IDENTIFIER,
1142        TokenType.STRING,
1143    }
1144
1145    FUNCTIONS_WITH_ALIASED_ARGS = {"STRUCT"}
1146
1147    KEY_VALUE_DEFINITIONS = (exp.Alias, exp.EQ, exp.PropertyEQ, exp.Slice)
1148
1149    FUNCTION_PARSERS = {
1150        "CAST": lambda self: self._parse_cast(self.STRICT_CAST),
1151        "CEIL": lambda self: self._parse_ceil_floor(exp.Ceil),
1152        "CONVERT": lambda self: self._parse_convert(self.STRICT_CAST),
1153        "DECODE": lambda self: self._parse_decode(),
1154        "EXTRACT": lambda self: self._parse_extract(),
1155        "FLOOR": lambda self: self._parse_ceil_floor(exp.Floor),
1156        "GAP_FILL": lambda self: self._parse_gap_fill(),
1157        "JSON_OBJECT": lambda self: self._parse_json_object(),
1158        "JSON_OBJECTAGG": lambda self: self._parse_json_object(agg=True),
1159        "JSON_TABLE": lambda self: self._parse_json_table(),
1160        "MATCH": lambda self: self._parse_match_against(),
1161        "NORMALIZE": lambda self: self._parse_normalize(),
1162        "OPENJSON": lambda self: self._parse_open_json(),
1163        "OVERLAY": lambda self: self._parse_overlay(),
1164        "POSITION": lambda self: self._parse_position(),
1165        "PREDICT": lambda self: self._parse_predict(),
1166        "SAFE_CAST": lambda self: self._parse_cast(False, safe=True),
1167        "STRING_AGG": lambda self: self._parse_string_agg(),
1168        "SUBSTRING": lambda self: self._parse_substring(),
1169        "TRIM": lambda self: self._parse_trim(),
1170        "TRY_CAST": lambda self: self._parse_cast(False, safe=True),
1171        "TRY_CONVERT": lambda self: self._parse_convert(False, safe=True),
1172        "XMLELEMENT": lambda self: self.expression(
1173            exp.XMLElement,
1174            this=self._match_text_seq("NAME") and self._parse_id_var(),
1175            expressions=self._match(TokenType.COMMA) and self._parse_csv(self._parse_expression),
1176        ),
1177        "XMLTABLE": lambda self: self._parse_xml_table(),
1178    }
1179
1180    QUERY_MODIFIER_PARSERS = {
1181        TokenType.MATCH_RECOGNIZE: lambda self: ("match", self._parse_match_recognize()),
1182        TokenType.PREWHERE: lambda self: ("prewhere", self._parse_prewhere()),
1183        TokenType.WHERE: lambda self: ("where", self._parse_where()),
1184        TokenType.GROUP_BY: lambda self: ("group", self._parse_group()),
1185        TokenType.HAVING: lambda self: ("having", self._parse_having()),
1186        TokenType.QUALIFY: lambda self: ("qualify", self._parse_qualify()),
1187        TokenType.WINDOW: lambda self: ("windows", self._parse_window_clause()),
1188        TokenType.ORDER_BY: lambda self: ("order", self._parse_order()),
1189        TokenType.LIMIT: lambda self: ("limit", self._parse_limit()),
1190        TokenType.FETCH: lambda self: ("limit", self._parse_limit()),
1191        TokenType.OFFSET: lambda self: ("offset", self._parse_offset()),
1192        TokenType.FOR: lambda self: ("locks", self._parse_locks()),
1193        TokenType.LOCK: lambda self: ("locks", self._parse_locks()),
1194        TokenType.TABLE_SAMPLE: lambda self: ("sample", self._parse_table_sample(as_modifier=True)),
1195        TokenType.USING: lambda self: ("sample", self._parse_table_sample(as_modifier=True)),
1196        TokenType.CLUSTER_BY: lambda self: (
1197            "cluster",
1198            self._parse_sort(exp.Cluster, TokenType.CLUSTER_BY),
1199        ),
1200        TokenType.DISTRIBUTE_BY: lambda self: (
1201            "distribute",
1202            self._parse_sort(exp.Distribute, TokenType.DISTRIBUTE_BY),
1203        ),
1204        TokenType.SORT_BY: lambda self: ("sort", self._parse_sort(exp.Sort, TokenType.SORT_BY)),
1205        TokenType.CONNECT_BY: lambda self: ("connect", self._parse_connect(skip_start_token=True)),
1206        TokenType.START_WITH: lambda self: ("connect", self._parse_connect()),
1207    }
1208
1209    SET_PARSERS = {
1210        "GLOBAL": lambda self: self._parse_set_item_assignment("GLOBAL"),
1211        "LOCAL": lambda self: self._parse_set_item_assignment("LOCAL"),
1212        "SESSION": lambda self: self._parse_set_item_assignment("SESSION"),
1213        "TRANSACTION": lambda self: self._parse_set_transaction(),
1214    }
1215
1216    SHOW_PARSERS: t.Dict[str, t.Callable] = {}
1217
1218    TYPE_LITERAL_PARSERS = {
1219        exp.DataType.Type.JSON: lambda self, this, _: self.expression(exp.ParseJSON, this=this),
1220    }
1221
1222    TYPE_CONVERTERS: t.Dict[exp.DataType.Type, t.Callable[[exp.DataType], exp.DataType]] = {}
1223
1224    DDL_SELECT_TOKENS = {TokenType.SELECT, TokenType.WITH, TokenType.L_PAREN}
1225
1226    PRE_VOLATILE_TOKENS = {TokenType.CREATE, TokenType.REPLACE, TokenType.UNIQUE}
1227
1228    TRANSACTION_KIND = {"DEFERRED", "IMMEDIATE", "EXCLUSIVE"}
1229    TRANSACTION_CHARACTERISTICS: OPTIONS_TYPE = {
1230        "ISOLATION": (
1231            ("LEVEL", "REPEATABLE", "READ"),
1232            ("LEVEL", "READ", "COMMITTED"),
1233            ("LEVEL", "READ", "UNCOMITTED"),
1234            ("LEVEL", "SERIALIZABLE"),
1235        ),
1236        "READ": ("WRITE", "ONLY"),
1237    }
1238
1239    CONFLICT_ACTIONS: OPTIONS_TYPE = dict.fromkeys(
1240        ("ABORT", "FAIL", "IGNORE", "REPLACE", "ROLLBACK", "UPDATE"), tuple()
1241    )
1242    CONFLICT_ACTIONS["DO"] = ("NOTHING", "UPDATE")
1243
1244    CREATE_SEQUENCE: OPTIONS_TYPE = {
1245        "SCALE": ("EXTEND", "NOEXTEND"),
1246        "SHARD": ("EXTEND", "NOEXTEND"),
1247        "NO": ("CYCLE", "CACHE", "MAXVALUE", "MINVALUE"),
1248        **dict.fromkeys(
1249            (
1250                "SESSION",
1251                "GLOBAL",
1252                "KEEP",
1253                "NOKEEP",
1254                "ORDER",
1255                "NOORDER",
1256                "NOCACHE",
1257                "CYCLE",
1258                "NOCYCLE",
1259                "NOMINVALUE",
1260                "NOMAXVALUE",
1261                "NOSCALE",
1262                "NOSHARD",
1263            ),
1264            tuple(),
1265        ),
1266    }
1267
1268    ISOLATED_LOADING_OPTIONS: OPTIONS_TYPE = {"FOR": ("ALL", "INSERT", "NONE")}
1269
1270    USABLES: OPTIONS_TYPE = dict.fromkeys(
1271        ("ROLE", "WAREHOUSE", "DATABASE", "SCHEMA", "CATALOG"), tuple()
1272    )
1273
1274    CAST_ACTIONS: OPTIONS_TYPE = dict.fromkeys(("RENAME", "ADD"), ("FIELDS",))
1275
1276    SCHEMA_BINDING_OPTIONS: OPTIONS_TYPE = {
1277        "TYPE": ("EVOLUTION",),
1278        **dict.fromkeys(("BINDING", "COMPENSATION", "EVOLUTION"), tuple()),
1279    }
1280
1281    PROCEDURE_OPTIONS: OPTIONS_TYPE = {}
1282
1283    EXECUTE_AS_OPTIONS: OPTIONS_TYPE = dict.fromkeys(("CALLER", "SELF", "OWNER"), tuple())
1284
1285    KEY_CONSTRAINT_OPTIONS: OPTIONS_TYPE = {
1286        "NOT": ("ENFORCED",),
1287        "MATCH": (
1288            "FULL",
1289            "PARTIAL",
1290            "SIMPLE",
1291        ),
1292        "INITIALLY": ("DEFERRED", "IMMEDIATE"),
1293        **dict.fromkeys(("DEFERRABLE", "NORELY"), tuple()),
1294    }
1295
1296    INSERT_ALTERNATIVES = {"ABORT", "FAIL", "IGNORE", "REPLACE", "ROLLBACK"}
1297
1298    CLONE_KEYWORDS = {"CLONE", "COPY"}
1299    HISTORICAL_DATA_PREFIX = {"AT", "BEFORE", "END"}
1300    HISTORICAL_DATA_KIND = {"TIMESTAMP", "OFFSET", "STATEMENT", "STREAM"}
1301
1302    OPCLASS_FOLLOW_KEYWORDS = {"ASC", "DESC", "NULLS", "WITH"}
1303
1304    OPTYPE_FOLLOW_TOKENS = {TokenType.COMMA, TokenType.R_PAREN}
1305
1306    TABLE_INDEX_HINT_TOKENS = {TokenType.FORCE, TokenType.IGNORE, TokenType.USE}
1307
1308    VIEW_ATTRIBUTES = {"ENCRYPTION", "SCHEMABINDING", "VIEW_METADATA"}
1309
1310    WINDOW_ALIAS_TOKENS = ID_VAR_TOKENS - {TokenType.ROWS}
1311    WINDOW_BEFORE_PAREN_TOKENS = {TokenType.OVER}
1312    WINDOW_SIDES = {"FOLLOWING", "PRECEDING"}
1313
1314    JSON_KEY_VALUE_SEPARATOR_TOKENS = {TokenType.COLON, TokenType.COMMA, TokenType.IS}
1315
1316    FETCH_TOKENS = ID_VAR_TOKENS - {TokenType.ROW, TokenType.ROWS, TokenType.PERCENT}
1317
1318    ADD_CONSTRAINT_TOKENS = {
1319        TokenType.CONSTRAINT,
1320        TokenType.FOREIGN_KEY,
1321        TokenType.INDEX,
1322        TokenType.KEY,
1323        TokenType.PRIMARY_KEY,
1324        TokenType.UNIQUE,
1325    }
1326
1327    DISTINCT_TOKENS = {TokenType.DISTINCT}
1328
1329    NULL_TOKENS = {TokenType.NULL}
1330
1331    UNNEST_OFFSET_ALIAS_TOKENS = ID_VAR_TOKENS - SET_OPERATIONS
1332
1333    SELECT_START_TOKENS = {TokenType.L_PAREN, TokenType.WITH, TokenType.SELECT}
1334
1335    COPY_INTO_VARLEN_OPTIONS = {"FILE_FORMAT", "COPY_OPTIONS", "FORMAT_OPTIONS", "CREDENTIAL"}
1336
1337    IS_JSON_PREDICATE_KIND = {"VALUE", "SCALAR", "ARRAY", "OBJECT"}
1338
1339    ODBC_DATETIME_LITERALS = {
1340        "d": exp.Date,
1341        "t": exp.Time,
1342        "ts": exp.Timestamp,
1343    }
1344
1345    ON_CONDITION_TOKENS = {"ERROR", "NULL", "TRUE", "FALSE", "EMPTY"}
1346
1347    PRIVILEGE_FOLLOW_TOKENS = {TokenType.ON, TokenType.COMMA, TokenType.L_PAREN}
1348
1349    # The style options for the DESCRIBE statement
1350    DESCRIBE_STYLES = {"ANALYZE", "EXTENDED", "FORMATTED", "HISTORY"}
1351
1352    # The style options for the ANALYZE statement
1353    ANALYZE_STYLES = {
1354        "BUFFER_USAGE_LIMIT",
1355        "FULL",
1356        "LOCAL",
1357        "NO_WRITE_TO_BINLOG",
1358        "SAMPLE",
1359        "SKIP_LOCKED",
1360        "VERBOSE",
1361    }
1362
1363    ANALYZE_EXPRESSION_PARSERS = {
1364        "ALL": lambda self: self._parse_analyze_columns(),
1365        "COMPUTE": lambda self: self._parse_analyze_statistics(),
1366        "DELETE": lambda self: self._parse_analyze_delete(),
1367        "DROP": lambda self: self._parse_analyze_histogram(),
1368        "ESTIMATE": lambda self: self._parse_analyze_statistics(),
1369        "LIST": lambda self: self._parse_analyze_list(),
1370        "PREDICATE": lambda self: self._parse_analyze_columns(),
1371        "UPDATE": lambda self: self._parse_analyze_histogram(),
1372        "VALIDATE": lambda self: self._parse_analyze_validate(),
1373    }
1374
1375    PARTITION_KEYWORDS = {"PARTITION", "SUBPARTITION"}
1376
1377    AMBIGUOUS_ALIAS_TOKENS = (TokenType.LIMIT, TokenType.OFFSET)
1378
1379    OPERATION_MODIFIERS: t.Set[str] = set()
1380
1381    RECURSIVE_CTE_SEARCH_KIND = {"BREADTH", "DEPTH", "CYCLE"}
1382
1383    STRICT_CAST = True
1384
1385    PREFIXED_PIVOT_COLUMNS = False
1386    IDENTIFY_PIVOT_STRINGS = False
1387
1388    LOG_DEFAULTS_TO_LN = False
1389
1390    # Whether ADD is present for each column added by ALTER TABLE
1391    ALTER_TABLE_ADD_REQUIRED_FOR_EACH_COLUMN = True
1392
1393    # Whether the table sample clause expects CSV syntax
1394    TABLESAMPLE_CSV = False
1395
1396    # The default method used for table sampling
1397    DEFAULT_SAMPLING_METHOD: t.Optional[str] = None
1398
1399    # Whether the SET command needs a delimiter (e.g. "=") for assignments
1400    SET_REQUIRES_ASSIGNMENT_DELIMITER = True
1401
1402    # Whether the TRIM function expects the characters to trim as its first argument
1403    TRIM_PATTERN_FIRST = False
1404
1405    # Whether string aliases are supported `SELECT COUNT(*) 'count'`
1406    STRING_ALIASES = False
1407
1408    # Whether query modifiers such as LIMIT are attached to the UNION node (vs its right operand)
1409    MODIFIERS_ATTACHED_TO_SET_OP = True
1410    SET_OP_MODIFIERS = {"order", "limit", "offset"}
1411
1412    # Whether to parse IF statements that aren't followed by a left parenthesis as commands
1413    NO_PAREN_IF_COMMANDS = True
1414
1415    # Whether the -> and ->> operators expect documents of type JSON (e.g. Postgres)
1416    JSON_ARROWS_REQUIRE_JSON_TYPE = False
1417
1418    # Whether the `:` operator is used to extract a value from a VARIANT column
1419    COLON_IS_VARIANT_EXTRACT = False
1420
1421    # Whether or not a VALUES keyword needs to be followed by '(' to form a VALUES clause.
1422    # If this is True and '(' is not found, the keyword will be treated as an identifier
1423    VALUES_FOLLOWED_BY_PAREN = True
1424
1425    # Whether implicit unnesting is supported, e.g. SELECT 1 FROM y.z AS z, z.a (Redshift)
1426    SUPPORTS_IMPLICIT_UNNEST = False
1427
1428    # Whether or not interval spans are supported, INTERVAL 1 YEAR TO MONTHS
1429    INTERVAL_SPANS = True
1430
1431    # Whether a PARTITION clause can follow a table reference
1432    SUPPORTS_PARTITION_SELECTION = False
1433
1434    # Whether the `name AS expr` schema/column constraint requires parentheses around `expr`
1435    WRAPPED_TRANSFORM_COLUMN_CONSTRAINT = True
1436
1437    # Whether the 'AS' keyword is optional in the CTE definition syntax
1438    OPTIONAL_ALIAS_TOKEN_CTE = True
1439
1440    __slots__ = (
1441        "error_level",
1442        "error_message_context",
1443        "max_errors",
1444        "dialect",
1445        "sql",
1446        "errors",
1447        "_tokens",
1448        "_index",
1449        "_curr",
1450        "_next",
1451        "_prev",
1452        "_prev_comments",
1453    )
1454
1455    # Autofilled
1456    SHOW_TRIE: t.Dict = {}
1457    SET_TRIE: t.Dict = {}
1458
1459    def __init__(
1460        self,
1461        error_level: t.Optional[ErrorLevel] = None,
1462        error_message_context: int = 100,
1463        max_errors: int = 3,
1464        dialect: DialectType = None,
1465    ):
1466        from sqlglot.dialects import Dialect
1467
1468        self.error_level = error_level or ErrorLevel.IMMEDIATE
1469        self.error_message_context = error_message_context
1470        self.max_errors = max_errors
1471        self.dialect = Dialect.get_or_raise(dialect)
1472        self.reset()
1473
1474    def reset(self):
1475        self.sql = ""
1476        self.errors = []
1477        self._tokens = []
1478        self._index = 0
1479        self._curr = None
1480        self._next = None
1481        self._prev = None
1482        self._prev_comments = None
1483
1484    def parse(
1485        self, raw_tokens: t.List[Token], sql: t.Optional[str] = None
1486    ) -> t.List[t.Optional[exp.Expression]]:
1487        """
1488        Parses a list of tokens and returns a list of syntax trees, one tree
1489        per parsed SQL statement.
1490
1491        Args:
1492            raw_tokens: The list of tokens.
1493            sql: The original SQL string, used to produce helpful debug messages.
1494
1495        Returns:
1496            The list of the produced syntax trees.
1497        """
1498        return self._parse(
1499            parse_method=self.__class__._parse_statement, raw_tokens=raw_tokens, sql=sql
1500        )
1501
1502    def parse_into(
1503        self,
1504        expression_types: exp.IntoType,
1505        raw_tokens: t.List[Token],
1506        sql: t.Optional[str] = None,
1507    ) -> t.List[t.Optional[exp.Expression]]:
1508        """
1509        Parses a list of tokens into a given Expression type. If a collection of Expression
1510        types is given instead, this method will try to parse the token list into each one
1511        of them, stopping at the first for which the parsing succeeds.
1512
1513        Args:
1514            expression_types: The expression type(s) to try and parse the token list into.
1515            raw_tokens: The list of tokens.
1516            sql: The original SQL string, used to produce helpful debug messages.
1517
1518        Returns:
1519            The target Expression.
1520        """
1521        errors = []
1522        for expression_type in ensure_list(expression_types):
1523            parser = self.EXPRESSION_PARSERS.get(expression_type)
1524            if not parser:
1525                raise TypeError(f"No parser registered for {expression_type}")
1526
1527            try:
1528                return self._parse(parser, raw_tokens, sql)
1529            except ParseError as e:
1530                e.errors[0]["into_expression"] = expression_type
1531                errors.append(e)
1532
1533        raise ParseError(
1534            f"Failed to parse '{sql or raw_tokens}' into {expression_types}",
1535            errors=merge_errors(errors),
1536        ) from errors[-1]
1537
1538    def _parse(
1539        self,
1540        parse_method: t.Callable[[Parser], t.Optional[exp.Expression]],
1541        raw_tokens: t.List[Token],
1542        sql: t.Optional[str] = None,
1543    ) -> t.List[t.Optional[exp.Expression]]:
1544        self.reset()
1545        self.sql = sql or ""
1546
1547        total = len(raw_tokens)
1548        chunks: t.List[t.List[Token]] = [[]]
1549
1550        for i, token in enumerate(raw_tokens):
1551            if token.token_type == TokenType.SEMICOLON:
1552                if token.comments:
1553                    chunks.append([token])
1554
1555                if i < total - 1:
1556                    chunks.append([])
1557            else:
1558                chunks[-1].append(token)
1559
1560        expressions = []
1561
1562        for tokens in chunks:
1563            self._index = -1
1564            self._tokens = tokens
1565            self._advance()
1566
1567            expressions.append(parse_method(self))
1568
1569            if self._index < len(self._tokens):
1570                self.raise_error("Invalid expression / Unexpected token")
1571
1572            self.check_errors()
1573
1574        return expressions
1575
1576    def check_errors(self) -> None:
1577        """Logs or raises any found errors, depending on the chosen error level setting."""
1578        if self.error_level == ErrorLevel.WARN:
1579            for error in self.errors:
1580                logger.error(str(error))
1581        elif self.error_level == ErrorLevel.RAISE and self.errors:
1582            raise ParseError(
1583                concat_messages(self.errors, self.max_errors),
1584                errors=merge_errors(self.errors),
1585            )
1586
1587    def raise_error(self, message: str, token: t.Optional[Token] = None) -> None:
1588        """
1589        Appends an error in the list of recorded errors or raises it, depending on the chosen
1590        error level setting.
1591        """
1592        token = token or self._curr or self._prev or Token.string("")
1593        start = token.start
1594        end = token.end + 1
1595        start_context = self.sql[max(start - self.error_message_context, 0) : start]
1596        highlight = self.sql[start:end]
1597        end_context = self.sql[end : end + self.error_message_context]
1598
1599        error = ParseError.new(
1600            f"{message}. Line {token.line}, Col: {token.col}.\n"
1601            f"  {start_context}\033[4m{highlight}\033[0m{end_context}",
1602            description=message,
1603            line=token.line,
1604            col=token.col,
1605            start_context=start_context,
1606            highlight=highlight,
1607            end_context=end_context,
1608        )
1609
1610        if self.error_level == ErrorLevel.IMMEDIATE:
1611            raise error
1612
1613        self.errors.append(error)
1614
1615    def expression(
1616        self, exp_class: t.Type[E], comments: t.Optional[t.List[str]] = None, **kwargs
1617    ) -> E:
1618        """
1619        Creates a new, validated Expression.
1620
1621        Args:
1622            exp_class: The expression class to instantiate.
1623            comments: An optional list of comments to attach to the expression.
1624            kwargs: The arguments to set for the expression along with their respective values.
1625
1626        Returns:
1627            The target expression.
1628        """
1629        instance = exp_class(**kwargs)
1630        instance.add_comments(comments) if comments else self._add_comments(instance)
1631        return self.validate_expression(instance)
1632
1633    def _add_comments(self, expression: t.Optional[exp.Expression]) -> None:
1634        if expression and self._prev_comments:
1635            expression.add_comments(self._prev_comments)
1636            self._prev_comments = None
1637
1638    def validate_expression(self, expression: E, args: t.Optional[t.List] = None) -> E:
1639        """
1640        Validates an Expression, making sure that all its mandatory arguments are set.
1641
1642        Args:
1643            expression: The expression to validate.
1644            args: An optional list of items that was used to instantiate the expression, if it's a Func.
1645
1646        Returns:
1647            The validated expression.
1648        """
1649        if self.error_level != ErrorLevel.IGNORE:
1650            for error_message in expression.error_messages(args):
1651                self.raise_error(error_message)
1652
1653        return expression
1654
1655    def _find_sql(self, start: Token, end: Token) -> str:
1656        return self.sql[start.start : end.end + 1]
1657
1658    def _is_connected(self) -> bool:
1659        return self._prev and self._curr and self._prev.end + 1 == self._curr.start
1660
1661    def _advance(self, times: int = 1) -> None:
1662        self._index += times
1663        self._curr = seq_get(self._tokens, self._index)
1664        self._next = seq_get(self._tokens, self._index + 1)
1665
1666        if self._index > 0:
1667            self._prev = self._tokens[self._index - 1]
1668            self._prev_comments = self._prev.comments
1669        else:
1670            self._prev = None
1671            self._prev_comments = None
1672
1673    def _retreat(self, index: int) -> None:
1674        if index != self._index:
1675            self._advance(index - self._index)
1676
1677    def _warn_unsupported(self) -> None:
1678        if len(self._tokens) <= 1:
1679            return
1680
1681        # We use _find_sql because self.sql may comprise multiple chunks, and we're only
1682        # interested in emitting a warning for the one being currently processed.
1683        sql = self._find_sql(self._tokens[0], self._tokens[-1])[: self.error_message_context]
1684
1685        logger.warning(
1686            f"'{sql}' contains unsupported syntax. Falling back to parsing as a 'Command'."
1687        )
1688
1689    def _parse_command(self) -> exp.Command:
1690        self._warn_unsupported()
1691        return self.expression(
1692            exp.Command,
1693            comments=self._prev_comments,
1694            this=self._prev.text.upper(),
1695            expression=self._parse_string(),
1696        )
1697
1698    def _try_parse(self, parse_method: t.Callable[[], T], retreat: bool = False) -> t.Optional[T]:
1699        """
1700        Attemps to backtrack if a parse function that contains a try/catch internally raises an error.
1701        This behavior can be different depending on the uset-set ErrorLevel, so _try_parse aims to
1702        solve this by setting & resetting the parser state accordingly
1703        """
1704        index = self._index
1705        error_level = self.error_level
1706
1707        self.error_level = ErrorLevel.IMMEDIATE
1708        try:
1709            this = parse_method()
1710        except ParseError:
1711            this = None
1712        finally:
1713            if not this or retreat:
1714                self._retreat(index)
1715            self.error_level = error_level
1716
1717        return this
1718
1719    def _parse_comment(self, allow_exists: bool = True) -> exp.Expression:
1720        start = self._prev
1721        exists = self._parse_exists() if allow_exists else None
1722
1723        self._match(TokenType.ON)
1724
1725        materialized = self._match_text_seq("MATERIALIZED")
1726        kind = self._match_set(self.CREATABLES) and self._prev
1727        if not kind:
1728            return self._parse_as_command(start)
1729
1730        if kind.token_type in (TokenType.FUNCTION, TokenType.PROCEDURE):
1731            this = self._parse_user_defined_function(kind=kind.token_type)
1732        elif kind.token_type == TokenType.TABLE:
1733            this = self._parse_table(alias_tokens=self.COMMENT_TABLE_ALIAS_TOKENS)
1734        elif kind.token_type == TokenType.COLUMN:
1735            this = self._parse_column()
1736        else:
1737            this = self._parse_id_var()
1738
1739        self._match(TokenType.IS)
1740
1741        return self.expression(
1742            exp.Comment,
1743            this=this,
1744            kind=kind.text,
1745            expression=self._parse_string(),
1746            exists=exists,
1747            materialized=materialized,
1748        )
1749
1750    def _parse_to_table(
1751        self,
1752    ) -> exp.ToTableProperty:
1753        table = self._parse_table_parts(schema=True)
1754        return self.expression(exp.ToTableProperty, this=table)
1755
1756    # https://clickhouse.com/docs/en/engines/table-engines/mergetree-family/mergetree#mergetree-table-ttl
1757    def _parse_ttl(self) -> exp.Expression:
1758        def _parse_ttl_action() -> t.Optional[exp.Expression]:
1759            this = self._parse_bitwise()
1760
1761            if self._match_text_seq("DELETE"):
1762                return self.expression(exp.MergeTreeTTLAction, this=this, delete=True)
1763            if self._match_text_seq("RECOMPRESS"):
1764                return self.expression(
1765                    exp.MergeTreeTTLAction, this=this, recompress=self._parse_bitwise()
1766                )
1767            if self._match_text_seq("TO", "DISK"):
1768                return self.expression(
1769                    exp.MergeTreeTTLAction, this=this, to_disk=self._parse_string()
1770                )
1771            if self._match_text_seq("TO", "VOLUME"):
1772                return self.expression(
1773                    exp.MergeTreeTTLAction, this=this, to_volume=self._parse_string()
1774                )
1775
1776            return this
1777
1778        expressions = self._parse_csv(_parse_ttl_action)
1779        where = self._parse_where()
1780        group = self._parse_group()
1781
1782        aggregates = None
1783        if group and self._match(TokenType.SET):
1784            aggregates = self._parse_csv(self._parse_set_item)
1785
1786        return self.expression(
1787            exp.MergeTreeTTL,
1788            expressions=expressions,
1789            where=where,
1790            group=group,
1791            aggregates=aggregates,
1792        )
1793
1794    def _parse_statement(self) -> t.Optional[exp.Expression]:
1795        if self._curr is None:
1796            return None
1797
1798        if self._match_set(self.STATEMENT_PARSERS):
1799            comments = self._prev_comments
1800            stmt = self.STATEMENT_PARSERS[self._prev.token_type](self)
1801            stmt.add_comments(comments, prepend=True)
1802            return stmt
1803
1804        if self._match_set(self.dialect.tokenizer.COMMANDS):
1805            return self._parse_command()
1806
1807        expression = self._parse_expression()
1808        expression = self._parse_set_operations(expression) if expression else self._parse_select()
1809        return self._parse_query_modifiers(expression)
1810
1811    def _parse_drop(self, exists: bool = False) -> exp.Drop | exp.Command:
1812        start = self._prev
1813        temporary = self._match(TokenType.TEMPORARY)
1814        materialized = self._match_text_seq("MATERIALIZED")
1815
1816        kind = self._match_set(self.CREATABLES) and self._prev.text.upper()
1817        if not kind:
1818            return self._parse_as_command(start)
1819
1820        concurrently = self._match_text_seq("CONCURRENTLY")
1821        if_exists = exists or self._parse_exists()
1822
1823        if kind == "COLUMN":
1824            this = self._parse_column()
1825        else:
1826            this = self._parse_table_parts(
1827                schema=True, is_db_reference=self._prev.token_type == TokenType.SCHEMA
1828            )
1829
1830        cluster = self._parse_on_property() if self._match(TokenType.ON) else None
1831
1832        if self._match(TokenType.L_PAREN, advance=False):
1833            expressions = self._parse_wrapped_csv(self._parse_types)
1834        else:
1835            expressions = None
1836
1837        return self.expression(
1838            exp.Drop,
1839            exists=if_exists,
1840            this=this,
1841            expressions=expressions,
1842            kind=self.dialect.CREATABLE_KIND_MAPPING.get(kind) or kind,
1843            temporary=temporary,
1844            materialized=materialized,
1845            cascade=self._match_text_seq("CASCADE"),
1846            constraints=self._match_text_seq("CONSTRAINTS"),
1847            purge=self._match_text_seq("PURGE"),
1848            cluster=cluster,
1849            concurrently=concurrently,
1850        )
1851
1852    def _parse_exists(self, not_: bool = False) -> t.Optional[bool]:
1853        return (
1854            self._match_text_seq("IF")
1855            and (not not_ or self._match(TokenType.NOT))
1856            and self._match(TokenType.EXISTS)
1857        )
1858
1859    def _parse_create(self) -> exp.Create | exp.Command:
1860        # Note: this can't be None because we've matched a statement parser
1861        start = self._prev
1862
1863        replace = (
1864            start.token_type == TokenType.REPLACE
1865            or self._match_pair(TokenType.OR, TokenType.REPLACE)
1866            or self._match_pair(TokenType.OR, TokenType.ALTER)
1867        )
1868        refresh = self._match_pair(TokenType.OR, TokenType.REFRESH)
1869
1870        unique = self._match(TokenType.UNIQUE)
1871
1872        if self._match_text_seq("CLUSTERED", "COLUMNSTORE"):
1873            clustered = True
1874        elif self._match_text_seq("NONCLUSTERED", "COLUMNSTORE") or self._match_text_seq(
1875            "COLUMNSTORE"
1876        ):
1877            clustered = False
1878        else:
1879            clustered = None
1880
1881        if self._match_pair(TokenType.TABLE, TokenType.FUNCTION, advance=False):
1882            self._advance()
1883
1884        properties = None
1885        create_token = self._match_set(self.CREATABLES) and self._prev
1886
1887        if not create_token:
1888            # exp.Properties.Location.POST_CREATE
1889            properties = self._parse_properties()
1890            create_token = self._match_set(self.CREATABLES) and self._prev
1891
1892            if not properties or not create_token:
1893                return self._parse_as_command(start)
1894
1895        concurrently = self._match_text_seq("CONCURRENTLY")
1896        exists = self._parse_exists(not_=True)
1897        this = None
1898        expression: t.Optional[exp.Expression] = None
1899        indexes = None
1900        no_schema_binding = None
1901        begin = None
1902        end = None
1903        clone = None
1904
1905        def extend_props(temp_props: t.Optional[exp.Properties]) -> None:
1906            nonlocal properties
1907            if properties and temp_props:
1908                properties.expressions.extend(temp_props.expressions)
1909            elif temp_props:
1910                properties = temp_props
1911
1912        if create_token.token_type in (TokenType.FUNCTION, TokenType.PROCEDURE):
1913            this = self._parse_user_defined_function(kind=create_token.token_type)
1914
1915            # exp.Properties.Location.POST_SCHEMA ("schema" here is the UDF's type signature)
1916            extend_props(self._parse_properties())
1917
1918            expression = self._match(TokenType.ALIAS) and self._parse_heredoc()
1919            extend_props(self._parse_properties())
1920
1921            if not expression:
1922                if self._match(TokenType.COMMAND):
1923                    expression = self._parse_as_command(self._prev)
1924                else:
1925                    begin = self._match(TokenType.BEGIN)
1926                    return_ = self._match_text_seq("RETURN")
1927
1928                    if self._match(TokenType.STRING, advance=False):
1929                        # Takes care of BigQuery's JavaScript UDF definitions that end in an OPTIONS property
1930                        # # https://cloud.google.com/bigquery/docs/reference/standard-sql/data-definition-language#create_function_statement
1931                        expression = self._parse_string()
1932                        extend_props(self._parse_properties())
1933                    else:
1934                        expression = self._parse_user_defined_function_expression()
1935
1936                    end = self._match_text_seq("END")
1937
1938                    if return_:
1939                        expression = self.expression(exp.Return, this=expression)
1940        elif create_token.token_type == TokenType.INDEX:
1941            # Postgres allows anonymous indexes, eg. CREATE INDEX IF NOT EXISTS ON t(c)
1942            if not self._match(TokenType.ON):
1943                index = self._parse_id_var()
1944                anonymous = False
1945            else:
1946                index = None
1947                anonymous = True
1948
1949            this = self._parse_index(index=index, anonymous=anonymous)
1950        elif create_token.token_type in self.DB_CREATABLES:
1951            table_parts = self._parse_table_parts(
1952                schema=True, is_db_reference=create_token.token_type == TokenType.SCHEMA
1953            )
1954
1955            # exp.Properties.Location.POST_NAME
1956            self._match(TokenType.COMMA)
1957            extend_props(self._parse_properties(before=True))
1958
1959            this = self._parse_schema(this=table_parts)
1960
1961            # exp.Properties.Location.POST_SCHEMA and POST_WITH
1962            extend_props(self._parse_properties())
1963
1964            self._match(TokenType.ALIAS)
1965            if not self._match_set(self.DDL_SELECT_TOKENS, advance=False):
1966                # exp.Properties.Location.POST_ALIAS
1967                extend_props(self._parse_properties())
1968
1969            if create_token.token_type == TokenType.SEQUENCE:
1970                expression = self._parse_types()
1971                extend_props(self._parse_properties())
1972            else:
1973                expression = self._parse_ddl_select()
1974
1975            if create_token.token_type == TokenType.TABLE:
1976                # exp.Properties.Location.POST_EXPRESSION
1977                extend_props(self._parse_properties())
1978
1979                indexes = []
1980                while True:
1981                    index = self._parse_index()
1982
1983                    # exp.Properties.Location.POST_INDEX
1984                    extend_props(self._parse_properties())
1985                    if not index:
1986                        break
1987                    else:
1988                        self._match(TokenType.COMMA)
1989                        indexes.append(index)
1990            elif create_token.token_type == TokenType.VIEW:
1991                if self._match_text_seq("WITH", "NO", "SCHEMA", "BINDING"):
1992                    no_schema_binding = True
1993            elif create_token.token_type in (TokenType.SINK, TokenType.SOURCE):
1994                extend_props(self._parse_properties())
1995
1996            shallow = self._match_text_seq("SHALLOW")
1997
1998            if self._match_texts(self.CLONE_KEYWORDS):
1999                copy = self._prev.text.lower() == "copy"
2000                clone = self.expression(
2001                    exp.Clone, this=self._parse_table(schema=True), shallow=shallow, copy=copy
2002                )
2003
2004        if self._curr and not self._match_set((TokenType.R_PAREN, TokenType.COMMA), advance=False):
2005            return self._parse_as_command(start)
2006
2007        create_kind_text = create_token.text.upper()
2008        return self.expression(
2009            exp.Create,
2010            this=this,
2011            kind=self.dialect.CREATABLE_KIND_MAPPING.get(create_kind_text) or create_kind_text,
2012            replace=replace,
2013            refresh=refresh,
2014            unique=unique,
2015            expression=expression,
2016            exists=exists,
2017            properties=properties,
2018            indexes=indexes,
2019            no_schema_binding=no_schema_binding,
2020            begin=begin,
2021            end=end,
2022            clone=clone,
2023            concurrently=concurrently,
2024            clustered=clustered,
2025        )
2026
2027    def _parse_sequence_properties(self) -> t.Optional[exp.SequenceProperties]:
2028        seq = exp.SequenceProperties()
2029
2030        options = []
2031        index = self._index
2032
2033        while self._curr:
2034            self._match(TokenType.COMMA)
2035            if self._match_text_seq("INCREMENT"):
2036                self._match_text_seq("BY")
2037                self._match_text_seq("=")
2038                seq.set("increment", self._parse_term())
2039            elif self._match_text_seq("MINVALUE"):
2040                seq.set("minvalue", self._parse_term())
2041            elif self._match_text_seq("MAXVALUE"):
2042                seq.set("maxvalue", self._parse_term())
2043            elif self._match(TokenType.START_WITH) or self._match_text_seq("START"):
2044                self._match_text_seq("=")
2045                seq.set("start", self._parse_term())
2046            elif self._match_text_seq("CACHE"):
2047                # T-SQL allows empty CACHE which is initialized dynamically
2048                seq.set("cache", self._parse_number() or True)
2049            elif self._match_text_seq("OWNED", "BY"):
2050                # "OWNED BY NONE" is the default
2051                seq.set("owned", None if self._match_text_seq("NONE") else self._parse_column())
2052            else:
2053                opt = self._parse_var_from_options(self.CREATE_SEQUENCE, raise_unmatched=False)
2054                if opt:
2055                    options.append(opt)
2056                else:
2057                    break
2058
2059        seq.set("options", options if options else None)
2060        return None if self._index == index else seq
2061
2062    def _parse_property_before(self) -> t.Optional[exp.Expression]:
2063        # only used for teradata currently
2064        self._match(TokenType.COMMA)
2065
2066        kwargs = {
2067            "no": self._match_text_seq("NO"),
2068            "dual": self._match_text_seq("DUAL"),
2069            "before": self._match_text_seq("BEFORE"),
2070            "default": self._match_text_seq("DEFAULT"),
2071            "local": (self._match_text_seq("LOCAL") and "LOCAL")
2072            or (self._match_text_seq("NOT", "LOCAL") and "NOT LOCAL"),
2073            "after": self._match_text_seq("AFTER"),
2074            "minimum": self._match_texts(("MIN", "MINIMUM")),
2075            "maximum": self._match_texts(("MAX", "MAXIMUM")),
2076        }
2077
2078        if self._match_texts(self.PROPERTY_PARSERS):
2079            parser = self.PROPERTY_PARSERS[self._prev.text.upper()]
2080            try:
2081                return parser(self, **{k: v for k, v in kwargs.items() if v})
2082            except TypeError:
2083                self.raise_error(f"Cannot parse property '{self._prev.text}'")
2084
2085        return None
2086
2087    def _parse_wrapped_properties(self) -> t.List[exp.Expression]:
2088        return self._parse_wrapped_csv(self._parse_property)
2089
2090    def _parse_property(self) -> t.Optional[exp.Expression]:
2091        if self._match_texts(self.PROPERTY_PARSERS):
2092            return self.PROPERTY_PARSERS[self._prev.text.upper()](self)
2093
2094        if self._match(TokenType.DEFAULT) and self._match_texts(self.PROPERTY_PARSERS):
2095            return self.PROPERTY_PARSERS[self._prev.text.upper()](self, default=True)
2096
2097        if self._match_text_seq("COMPOUND", "SORTKEY"):
2098            return self._parse_sortkey(compound=True)
2099
2100        if self._match_text_seq("SQL", "SECURITY"):
2101            return self.expression(exp.SqlSecurityProperty, definer=self._match_text_seq("DEFINER"))
2102
2103        index = self._index
2104        key = self._parse_column()
2105
2106        if not self._match(TokenType.EQ):
2107            self._retreat(index)
2108            return self._parse_sequence_properties()
2109
2110        # Transform the key to exp.Dot if it's dotted identifiers wrapped in exp.Column or to exp.Var otherwise
2111        if isinstance(key, exp.Column):
2112            key = key.to_dot() if len(key.parts) > 1 else exp.var(key.name)
2113
2114        value = self._parse_bitwise() or self._parse_var(any_token=True)
2115
2116        # Transform the value to exp.Var if it was parsed as exp.Column(exp.Identifier())
2117        if isinstance(value, exp.Column):
2118            value = exp.var(value.name)
2119
2120        return self.expression(exp.Property, this=key, value=value)
2121
2122    def _parse_stored(self) -> exp.FileFormatProperty:
2123        self._match(TokenType.ALIAS)
2124
2125        input_format = self._parse_string() if self._match_text_seq("INPUTFORMAT") else None
2126        output_format = self._parse_string() if self._match_text_seq("OUTPUTFORMAT") else None
2127
2128        return self.expression(
2129            exp.FileFormatProperty,
2130            this=(
2131                self.expression(
2132                    exp.InputOutputFormat, input_format=input_format, output_format=output_format
2133                )
2134                if input_format or output_format
2135                else self._parse_var_or_string() or self._parse_number() or self._parse_id_var()
2136            ),
2137        )
2138
2139    def _parse_unquoted_field(self) -> t.Optional[exp.Expression]:
2140        field = self._parse_field()
2141        if isinstance(field, exp.Identifier) and not field.quoted:
2142            field = exp.var(field)
2143
2144        return field
2145
2146    def _parse_property_assignment(self, exp_class: t.Type[E], **kwargs: t.Any) -> E:
2147        self._match(TokenType.EQ)
2148        self._match(TokenType.ALIAS)
2149
2150        return self.expression(exp_class, this=self._parse_unquoted_field(), **kwargs)
2151
2152    def _parse_properties(self, before: t.Optional[bool] = None) -> t.Optional[exp.Properties]:
2153        properties = []
2154        while True:
2155            if before:
2156                prop = self._parse_property_before()
2157            else:
2158                prop = self._parse_property()
2159            if not prop:
2160                break
2161            for p in ensure_list(prop):
2162                properties.append(p)
2163
2164        if properties:
2165            return self.expression(exp.Properties, expressions=properties)
2166
2167        return None
2168
2169    def _parse_fallback(self, no: bool = False) -> exp.FallbackProperty:
2170        return self.expression(
2171            exp.FallbackProperty, no=no, protection=self._match_text_seq("PROTECTION")
2172        )
2173
2174    def _parse_security(self) -> t.Optional[exp.SecurityProperty]:
2175        if self._match_texts(("DEFINER", "INVOKER")):
2176            security_specifier = self._prev.text.upper()
2177            return self.expression(exp.SecurityProperty, this=security_specifier)
2178        return None
2179
2180    def _parse_settings_property(self) -> exp.SettingsProperty:
2181        return self.expression(
2182            exp.SettingsProperty, expressions=self._parse_csv(self._parse_assignment)
2183        )
2184
2185    def _parse_volatile_property(self) -> exp.VolatileProperty | exp.StabilityProperty:
2186        if self._index >= 2:
2187            pre_volatile_token = self._tokens[self._index - 2]
2188        else:
2189            pre_volatile_token = None
2190
2191        if pre_volatile_token and pre_volatile_token.token_type in self.PRE_VOLATILE_TOKENS:
2192            return exp.VolatileProperty()
2193
2194        return self.expression(exp.StabilityProperty, this=exp.Literal.string("VOLATILE"))
2195
2196    def _parse_retention_period(self) -> exp.Var:
2197        # Parse TSQL's HISTORY_RETENTION_PERIOD: {INFINITE | <number> DAY | DAYS | MONTH ...}
2198        number = self._parse_number()
2199        number_str = f"{number} " if number else ""
2200        unit = self._parse_var(any_token=True)
2201        return exp.var(f"{number_str}{unit}")
2202
2203    def _parse_system_versioning_property(
2204        self, with_: bool = False
2205    ) -> exp.WithSystemVersioningProperty:
2206        self._match(TokenType.EQ)
2207        prop = self.expression(
2208            exp.WithSystemVersioningProperty,
2209            **{  # type: ignore
2210                "on": True,
2211                "with": with_,
2212            },
2213        )
2214
2215        if self._match_text_seq("OFF"):
2216            prop.set("on", False)
2217            return prop
2218
2219        self._match(TokenType.ON)
2220        if self._match(TokenType.L_PAREN):
2221            while self._curr and not self._match(TokenType.R_PAREN):
2222                if self._match_text_seq("HISTORY_TABLE", "="):
2223                    prop.set("this", self._parse_table_parts())
2224                elif self._match_text_seq("DATA_CONSISTENCY_CHECK", "="):
2225                    prop.set("data_consistency", self._advance_any() and self._prev.text.upper())
2226                elif self._match_text_seq("HISTORY_RETENTION_PERIOD", "="):
2227                    prop.set("retention_period", self._parse_retention_period())
2228
2229                self._match(TokenType.COMMA)
2230
2231        return prop
2232
2233    def _parse_data_deletion_property(self) -> exp.DataDeletionProperty:
2234        self._match(TokenType.EQ)
2235        on = self._match_text_seq("ON") or not self._match_text_seq("OFF")
2236        prop = self.expression(exp.DataDeletionProperty, on=on)
2237
2238        if self._match(TokenType.L_PAREN):
2239            while self._curr and not self._match(TokenType.R_PAREN):
2240                if self._match_text_seq("FILTER_COLUMN", "="):
2241                    prop.set("filter_column", self._parse_column())
2242                elif self._match_text_seq("RETENTION_PERIOD", "="):
2243                    prop.set("retention_period", self._parse_retention_period())
2244
2245                self._match(TokenType.COMMA)
2246
2247        return prop
2248
2249    def _parse_distributed_property(self) -> exp.DistributedByProperty:
2250        kind = "HASH"
2251        expressions: t.Optional[t.List[exp.Expression]] = None
2252        if self._match_text_seq("BY", "HASH"):
2253            expressions = self._parse_wrapped_csv(self._parse_id_var)
2254        elif self._match_text_seq("BY", "RANDOM"):
2255            kind = "RANDOM"
2256
2257        # If the BUCKETS keyword is not present, the number of buckets is AUTO
2258        buckets: t.Optional[exp.Expression] = None
2259        if self._match_text_seq("BUCKETS") and not self._match_text_seq("AUTO"):
2260            buckets = self._parse_number()
2261
2262        return self.expression(
2263            exp.DistributedByProperty,
2264            expressions=expressions,
2265            kind=kind,
2266            buckets=buckets,
2267            order=self._parse_order(),
2268        )
2269
2270    def _parse_composite_key_property(self, expr_type: t.Type[E]) -> E:
2271        self._match_text_seq("KEY")
2272        expressions = self._parse_wrapped_id_vars()
2273        return self.expression(expr_type, expressions=expressions)
2274
2275    def _parse_with_property(self) -> t.Optional[exp.Expression] | t.List[exp.Expression]:
2276        if self._match_text_seq("(", "SYSTEM_VERSIONING"):
2277            prop = self._parse_system_versioning_property(with_=True)
2278            self._match_r_paren()
2279            return prop
2280
2281        if self._match(TokenType.L_PAREN, advance=False):
2282            return self._parse_wrapped_properties()
2283
2284        if self._match_text_seq("JOURNAL"):
2285            return self._parse_withjournaltable()
2286
2287        if self._match_texts(self.VIEW_ATTRIBUTES):
2288            return self.expression(exp.ViewAttributeProperty, this=self._prev.text.upper())
2289
2290        if self._match_text_seq("DATA"):
2291            return self._parse_withdata(no=False)
2292        elif self._match_text_seq("NO", "DATA"):
2293            return self._parse_withdata(no=True)
2294
2295        if self._match(TokenType.SERDE_PROPERTIES, advance=False):
2296            return self._parse_serde_properties(with_=True)
2297
2298        if self._match(TokenType.SCHEMA):
2299            return self.expression(
2300                exp.WithSchemaBindingProperty,
2301                this=self._parse_var_from_options(self.SCHEMA_BINDING_OPTIONS),
2302            )
2303
2304        if self._match_texts(self.PROCEDURE_OPTIONS, advance=False):
2305            return self.expression(
2306                exp.WithProcedureOptions, expressions=self._parse_csv(self._parse_procedure_option)
2307            )
2308
2309        if not self._next:
2310            return None
2311
2312        return self._parse_withisolatedloading()
2313
2314    def _parse_procedure_option(self) -> exp.Expression | None:
2315        if self._match_text_seq("EXECUTE", "AS"):
2316            return self.expression(
2317                exp.ExecuteAsProperty,
2318                this=self._parse_var_from_options(self.EXECUTE_AS_OPTIONS, raise_unmatched=False)
2319                or self._parse_string(),
2320            )
2321
2322        return self._parse_var_from_options(self.PROCEDURE_OPTIONS)
2323
2324    # https://dev.mysql.com/doc/refman/8.0/en/create-view.html
2325    def _parse_definer(self) -> t.Optional[exp.DefinerProperty]:
2326        self._match(TokenType.EQ)
2327
2328        user = self._parse_id_var()
2329        self._match(TokenType.PARAMETER)
2330        host = self._parse_id_var() or (self._match(TokenType.MOD) and self._prev.text)
2331
2332        if not user or not host:
2333            return None
2334
2335        return exp.DefinerProperty(this=f"{user}@{host}")
2336
2337    def _parse_withjournaltable(self) -> exp.WithJournalTableProperty:
2338        self._match(TokenType.TABLE)
2339        self._match(TokenType.EQ)
2340        return self.expression(exp.WithJournalTableProperty, this=self._parse_table_parts())
2341
2342    def _parse_log(self, no: bool = False) -> exp.LogProperty:
2343        return self.expression(exp.LogProperty, no=no)
2344
2345    def _parse_journal(self, **kwargs) -> exp.JournalProperty:
2346        return self.expression(exp.JournalProperty, **kwargs)
2347
2348    def _parse_checksum(self) -> exp.ChecksumProperty:
2349        self._match(TokenType.EQ)
2350
2351        on = None
2352        if self._match(TokenType.ON):
2353            on = True
2354        elif self._match_text_seq("OFF"):
2355            on = False
2356
2357        return self.expression(exp.ChecksumProperty, on=on, default=self._match(TokenType.DEFAULT))
2358
2359    def _parse_cluster(self, wrapped: bool = False) -> exp.Cluster:
2360        return self.expression(
2361            exp.Cluster,
2362            expressions=(
2363                self._parse_wrapped_csv(self._parse_ordered)
2364                if wrapped
2365                else self._parse_csv(self._parse_ordered)
2366            ),
2367        )
2368
2369    def _parse_clustered_by(self) -> exp.ClusteredByProperty:
2370        self._match_text_seq("BY")
2371
2372        self._match_l_paren()
2373        expressions = self._parse_csv(self._parse_column)
2374        self._match_r_paren()
2375
2376        if self._match_text_seq("SORTED", "BY"):
2377            self._match_l_paren()
2378            sorted_by = self._parse_csv(self._parse_ordered)
2379            self._match_r_paren()
2380        else:
2381            sorted_by = None
2382
2383        self._match(TokenType.INTO)
2384        buckets = self._parse_number()
2385        self._match_text_seq("BUCKETS")
2386
2387        return self.expression(
2388            exp.ClusteredByProperty,
2389            expressions=expressions,
2390            sorted_by=sorted_by,
2391            buckets=buckets,
2392        )
2393
2394    def _parse_copy_property(self) -> t.Optional[exp.CopyGrantsProperty]:
2395        if not self._match_text_seq("GRANTS"):
2396            self._retreat(self._index - 1)
2397            return None
2398
2399        return self.expression(exp.CopyGrantsProperty)
2400
2401    def _parse_freespace(self) -> exp.FreespaceProperty:
2402        self._match(TokenType.EQ)
2403        return self.expression(
2404            exp.FreespaceProperty, this=self._parse_number(), percent=self._match(TokenType.PERCENT)
2405        )
2406
2407    def _parse_mergeblockratio(
2408        self, no: bool = False, default: bool = False
2409    ) -> exp.MergeBlockRatioProperty:
2410        if self._match(TokenType.EQ):
2411            return self.expression(
2412                exp.MergeBlockRatioProperty,
2413                this=self._parse_number(),
2414                percent=self._match(TokenType.PERCENT),
2415            )
2416
2417        return self.expression(exp.MergeBlockRatioProperty, no=no, default=default)
2418
2419    def _parse_datablocksize(
2420        self,
2421        default: t.Optional[bool] = None,
2422        minimum: t.Optional[bool] = None,
2423        maximum: t.Optional[bool] = None,
2424    ) -> exp.DataBlocksizeProperty:
2425        self._match(TokenType.EQ)
2426        size = self._parse_number()
2427
2428        units = None
2429        if self._match_texts(("BYTES", "KBYTES", "KILOBYTES")):
2430            units = self._prev.text
2431
2432        return self.expression(
2433            exp.DataBlocksizeProperty,
2434            size=size,
2435            units=units,
2436            default=default,
2437            minimum=minimum,
2438            maximum=maximum,
2439        )
2440
2441    def _parse_blockcompression(self) -> exp.BlockCompressionProperty:
2442        self._match(TokenType.EQ)
2443        always = self._match_text_seq("ALWAYS")
2444        manual = self._match_text_seq("MANUAL")
2445        never = self._match_text_seq("NEVER")
2446        default = self._match_text_seq("DEFAULT")
2447
2448        autotemp = None
2449        if self._match_text_seq("AUTOTEMP"):
2450            autotemp = self._parse_schema()
2451
2452        return self.expression(
2453            exp.BlockCompressionProperty,
2454            always=always,
2455            manual=manual,
2456            never=never,
2457            default=default,
2458            autotemp=autotemp,
2459        )
2460
2461    def _parse_withisolatedloading(self) -> t.Optional[exp.IsolatedLoadingProperty]:
2462        index = self._index
2463        no = self._match_text_seq("NO")
2464        concurrent = self._match_text_seq("CONCURRENT")
2465
2466        if not self._match_text_seq("ISOLATED", "LOADING"):
2467            self._retreat(index)
2468            return None
2469
2470        target = self._parse_var_from_options(self.ISOLATED_LOADING_OPTIONS, raise_unmatched=False)
2471        return self.expression(
2472            exp.IsolatedLoadingProperty, no=no, concurrent=concurrent, target=target
2473        )
2474
2475    def _parse_locking(self) -> exp.LockingProperty:
2476        if self._match(TokenType.TABLE):
2477            kind = "TABLE"
2478        elif self._match(TokenType.VIEW):
2479            kind = "VIEW"
2480        elif self._match(TokenType.ROW):
2481            kind = "ROW"
2482        elif self._match_text_seq("DATABASE"):
2483            kind = "DATABASE"
2484        else:
2485            kind = None
2486
2487        if kind in ("DATABASE", "TABLE", "VIEW"):
2488            this = self._parse_table_parts()
2489        else:
2490            this = None
2491
2492        if self._match(TokenType.FOR):
2493            for_or_in = "FOR"
2494        elif self._match(TokenType.IN):
2495            for_or_in = "IN"
2496        else:
2497            for_or_in = None
2498
2499        if self._match_text_seq("ACCESS"):
2500            lock_type = "ACCESS"
2501        elif self._match_texts(("EXCL", "EXCLUSIVE")):
2502            lock_type = "EXCLUSIVE"
2503        elif self._match_text_seq("SHARE"):
2504            lock_type = "SHARE"
2505        elif self._match_text_seq("READ"):
2506            lock_type = "READ"
2507        elif self._match_text_seq("WRITE"):
2508            lock_type = "WRITE"
2509        elif self._match_text_seq("CHECKSUM"):
2510            lock_type = "CHECKSUM"
2511        else:
2512            lock_type = None
2513
2514        override = self._match_text_seq("OVERRIDE")
2515
2516        return self.expression(
2517            exp.LockingProperty,
2518            this=this,
2519            kind=kind,
2520            for_or_in=for_or_in,
2521            lock_type=lock_type,
2522            override=override,
2523        )
2524
2525    def _parse_partition_by(self) -> t.List[exp.Expression]:
2526        if self._match(TokenType.PARTITION_BY):
2527            return self._parse_csv(self._parse_assignment)
2528        return []
2529
2530    def _parse_partition_bound_spec(self) -> exp.PartitionBoundSpec:
2531        def _parse_partition_bound_expr() -> t.Optional[exp.Expression]:
2532            if self._match_text_seq("MINVALUE"):
2533                return exp.var("MINVALUE")
2534            if self._match_text_seq("MAXVALUE"):
2535                return exp.var("MAXVALUE")
2536            return self._parse_bitwise()
2537
2538        this: t.Optional[exp.Expression | t.List[exp.Expression]] = None
2539        expression = None
2540        from_expressions = None
2541        to_expressions = None
2542
2543        if self._match(TokenType.IN):
2544            this = self._parse_wrapped_csv(self._parse_bitwise)
2545        elif self._match(TokenType.FROM):
2546            from_expressions = self._parse_wrapped_csv(_parse_partition_bound_expr)
2547            self._match_text_seq("TO")
2548            to_expressions = self._parse_wrapped_csv(_parse_partition_bound_expr)
2549        elif self._match_text_seq("WITH", "(", "MODULUS"):
2550            this = self._parse_number()
2551            self._match_text_seq(",", "REMAINDER")
2552            expression = self._parse_number()
2553            self._match_r_paren()
2554        else:
2555            self.raise_error("Failed to parse partition bound spec.")
2556
2557        return self.expression(
2558            exp.PartitionBoundSpec,
2559            this=this,
2560            expression=expression,
2561            from_expressions=from_expressions,
2562            to_expressions=to_expressions,
2563        )
2564
2565    # https://www.postgresql.org/docs/current/sql-createtable.html
2566    def _parse_partitioned_of(self) -> t.Optional[exp.PartitionedOfProperty]:
2567        if not self._match_text_seq("OF"):
2568            self._retreat(self._index - 1)
2569            return None
2570
2571        this = self._parse_table(schema=True)
2572
2573        if self._match(TokenType.DEFAULT):
2574            expression: exp.Var | exp.PartitionBoundSpec = exp.var("DEFAULT")
2575        elif self._match_text_seq("FOR", "VALUES"):
2576            expression = self._parse_partition_bound_spec()
2577        else:
2578            self.raise_error("Expecting either DEFAULT or FOR VALUES clause.")
2579
2580        return self.expression(exp.PartitionedOfProperty, this=this, expression=expression)
2581
2582    def _parse_partitioned_by(self) -> exp.PartitionedByProperty:
2583        self._match(TokenType.EQ)
2584        return self.expression(
2585            exp.PartitionedByProperty,
2586            this=self._parse_schema() or self._parse_bracket(self._parse_field()),
2587        )
2588
2589    def _parse_withdata(self, no: bool = False) -> exp.WithDataProperty:
2590        if self._match_text_seq("AND", "STATISTICS"):
2591            statistics = True
2592        elif self._match_text_seq("AND", "NO", "STATISTICS"):
2593            statistics = False
2594        else:
2595            statistics = None
2596
2597        return self.expression(exp.WithDataProperty, no=no, statistics=statistics)
2598
2599    def _parse_contains_property(self) -> t.Optional[exp.SqlReadWriteProperty]:
2600        if self._match_text_seq("SQL"):
2601            return self.expression(exp.SqlReadWriteProperty, this="CONTAINS SQL")
2602        return None
2603
2604    def _parse_modifies_property(self) -> t.Optional[exp.SqlReadWriteProperty]:
2605        if self._match_text_seq("SQL", "DATA"):
2606            return self.expression(exp.SqlReadWriteProperty, this="MODIFIES SQL DATA")
2607        return None
2608
2609    def _parse_no_property(self) -> t.Optional[exp.Expression]:
2610        if self._match_text_seq("PRIMARY", "INDEX"):
2611            return exp.NoPrimaryIndexProperty()
2612        if self._match_text_seq("SQL"):
2613            return self.expression(exp.SqlReadWriteProperty, this="NO SQL")
2614        return None
2615
2616    def _parse_on_property(self) -> t.Optional[exp.Expression]:
2617        if self._match_text_seq("COMMIT", "PRESERVE", "ROWS"):
2618            return exp.OnCommitProperty()
2619        if self._match_text_seq("COMMIT", "DELETE", "ROWS"):
2620            return exp.OnCommitProperty(delete=True)
2621        return self.expression(exp.OnProperty, this=self._parse_schema(self._parse_id_var()))
2622
2623    def _parse_reads_property(self) -> t.Optional[exp.SqlReadWriteProperty]:
2624        if self._match_text_seq("SQL", "DATA"):
2625            return self.expression(exp.SqlReadWriteProperty, this="READS SQL DATA")
2626        return None
2627
2628    def _parse_distkey(self) -> exp.DistKeyProperty:
2629        return self.expression(exp.DistKeyProperty, this=self._parse_wrapped(self._parse_id_var))
2630
2631    def _parse_create_like(self) -> t.Optional[exp.LikeProperty]:
2632        table = self._parse_table(schema=True)
2633
2634        options = []
2635        while self._match_texts(("INCLUDING", "EXCLUDING")):
2636            this = self._prev.text.upper()
2637
2638            id_var = self._parse_id_var()
2639            if not id_var:
2640                return None
2641
2642            options.append(
2643                self.expression(exp.Property, this=this, value=exp.var(id_var.this.upper()))
2644            )
2645
2646        return self.expression(exp.LikeProperty, this=table, expressions=options)
2647
2648    def _parse_sortkey(self, compound: bool = False) -> exp.SortKeyProperty:
2649        return self.expression(
2650            exp.SortKeyProperty, this=self._parse_wrapped_id_vars(), compound=compound
2651        )
2652
2653    def _parse_character_set(self, default: bool = False) -> exp.CharacterSetProperty:
2654        self._match(TokenType.EQ)
2655        return self.expression(
2656            exp.CharacterSetProperty, this=self._parse_var_or_string(), default=default
2657        )
2658
2659    def _parse_remote_with_connection(self) -> exp.RemoteWithConnectionModelProperty:
2660        self._match_text_seq("WITH", "CONNECTION")
2661        return self.expression(
2662            exp.RemoteWithConnectionModelProperty, this=self._parse_table_parts()
2663        )
2664
2665    def _parse_returns(self) -> exp.ReturnsProperty:
2666        value: t.Optional[exp.Expression]
2667        null = None
2668        is_table = self._match(TokenType.TABLE)
2669
2670        if is_table:
2671            if self._match(TokenType.LT):
2672                value = self.expression(
2673                    exp.Schema,
2674                    this="TABLE",
2675                    expressions=self._parse_csv(self._parse_struct_types),
2676                )
2677                if not self._match(TokenType.GT):
2678                    self.raise_error("Expecting >")
2679            else:
2680                value = self._parse_schema(exp.var("TABLE"))
2681        elif self._match_text_seq("NULL", "ON", "NULL", "INPUT"):
2682            null = True
2683            value = None
2684        else:
2685            value = self._parse_types()
2686
2687        return self.expression(exp.ReturnsProperty, this=value, is_table=is_table, null=null)
2688
2689    def _parse_describe(self) -> exp.Describe:
2690        kind = self._match_set(self.CREATABLES) and self._prev.text
2691        style = self._match_texts(self.DESCRIBE_STYLES) and self._prev.text.upper()
2692        if self._match(TokenType.DOT):
2693            style = None
2694            self._retreat(self._index - 2)
2695
2696        format = self._parse_property() if self._match(TokenType.FORMAT, advance=False) else None
2697
2698        if self._match_set(self.STATEMENT_PARSERS, advance=False):
2699            this = self._parse_statement()
2700        else:
2701            this = self._parse_table(schema=True)
2702
2703        properties = self._parse_properties()
2704        expressions = properties.expressions if properties else None
2705        partition = self._parse_partition()
2706        return self.expression(
2707            exp.Describe,
2708            this=this,
2709            style=style,
2710            kind=kind,
2711            expressions=expressions,
2712            partition=partition,
2713            format=format,
2714        )
2715
2716    def _parse_multitable_inserts(self, comments: t.Optional[t.List[str]]) -> exp.MultitableInserts:
2717        kind = self._prev.text.upper()
2718        expressions = []
2719
2720        def parse_conditional_insert() -> t.Optional[exp.ConditionalInsert]:
2721            if self._match(TokenType.WHEN):
2722                expression = self._parse_disjunction()
2723                self._match(TokenType.THEN)
2724            else:
2725                expression = None
2726
2727            else_ = self._match(TokenType.ELSE)
2728
2729            if not self._match(TokenType.INTO):
2730                return None
2731
2732            return self.expression(
2733                exp.ConditionalInsert,
2734                this=self.expression(
2735                    exp.Insert,
2736                    this=self._parse_table(schema=True),
2737                    expression=self._parse_derived_table_values(),
2738                ),
2739                expression=expression,
2740                else_=else_,
2741            )
2742
2743        expression = parse_conditional_insert()
2744        while expression is not None:
2745            expressions.append(expression)
2746            expression = parse_conditional_insert()
2747
2748        return self.expression(
2749            exp.MultitableInserts,
2750            kind=kind,
2751            comments=comments,
2752            expressions=expressions,
2753            source=self._parse_table(),
2754        )
2755
2756    def _parse_insert(self) -> t.Union[exp.Insert, exp.MultitableInserts]:
2757        comments = []
2758        hint = self._parse_hint()
2759        overwrite = self._match(TokenType.OVERWRITE)
2760        ignore = self._match(TokenType.IGNORE)
2761        local = self._match_text_seq("LOCAL")
2762        alternative = None
2763        is_function = None
2764
2765        if self._match_text_seq("DIRECTORY"):
2766            this: t.Optional[exp.Expression] = self.expression(
2767                exp.Directory,
2768                this=self._parse_var_or_string(),
2769                local=local,
2770                row_format=self._parse_row_format(match_row=True),
2771            )
2772        else:
2773            if self._match_set((TokenType.FIRST, TokenType.ALL)):
2774                comments += ensure_list(self._prev_comments)
2775                return self._parse_multitable_inserts(comments)
2776
2777            if self._match(TokenType.OR):
2778                alternative = self._match_texts(self.INSERT_ALTERNATIVES) and self._prev.text
2779
2780            self._match(TokenType.INTO)
2781            comments += ensure_list(self._prev_comments)
2782            self._match(TokenType.TABLE)
2783            is_function = self._match(TokenType.FUNCTION)
2784
2785            this = (
2786                self._parse_table(schema=True, parse_partition=True)
2787                if not is_function
2788                else self._parse_function()
2789            )
2790            if isinstance(this, exp.Table) and self._match(TokenType.ALIAS, advance=False):
2791                this.set("alias", self._parse_table_alias())
2792
2793        returning = self._parse_returning()
2794
2795        return self.expression(
2796            exp.Insert,
2797            comments=comments,
2798            hint=hint,
2799            is_function=is_function,
2800            this=this,
2801            stored=self._match_text_seq("STORED") and self._parse_stored(),
2802            by_name=self._match_text_seq("BY", "NAME"),
2803            exists=self._parse_exists(),
2804            where=self._match_pair(TokenType.REPLACE, TokenType.WHERE) and self._parse_assignment(),
2805            partition=self._match(TokenType.PARTITION_BY) and self._parse_partitioned_by(),
2806            settings=self._match_text_seq("SETTINGS") and self._parse_settings_property(),
2807            expression=self._parse_derived_table_values() or self._parse_ddl_select(),
2808            conflict=self._parse_on_conflict(),
2809            returning=returning or self._parse_returning(),
2810            overwrite=overwrite,
2811            alternative=alternative,
2812            ignore=ignore,
2813            source=self._match(TokenType.TABLE) and self._parse_table(),
2814        )
2815
2816    def _parse_kill(self) -> exp.Kill:
2817        kind = exp.var(self._prev.text) if self._match_texts(("CONNECTION", "QUERY")) else None
2818
2819        return self.expression(
2820            exp.Kill,
2821            this=self._parse_primary(),
2822            kind=kind,
2823        )
2824
2825    def _parse_on_conflict(self) -> t.Optional[exp.OnConflict]:
2826        conflict = self._match_text_seq("ON", "CONFLICT")
2827        duplicate = self._match_text_seq("ON", "DUPLICATE", "KEY")
2828
2829        if not conflict and not duplicate:
2830            return None
2831
2832        conflict_keys = None
2833        constraint = None
2834
2835        if conflict:
2836            if self._match_text_seq("ON", "CONSTRAINT"):
2837                constraint = self._parse_id_var()
2838            elif self._match(TokenType.L_PAREN):
2839                conflict_keys = self._parse_csv(self._parse_id_var)
2840                self._match_r_paren()
2841
2842        action = self._parse_var_from_options(self.CONFLICT_ACTIONS)
2843        if self._prev.token_type == TokenType.UPDATE:
2844            self._match(TokenType.SET)
2845            expressions = self._parse_csv(self._parse_equality)
2846        else:
2847            expressions = None
2848
2849        return self.expression(
2850            exp.OnConflict,
2851            duplicate=duplicate,
2852            expressions=expressions,
2853            action=action,
2854            conflict_keys=conflict_keys,
2855            constraint=constraint,
2856            where=self._parse_where(),
2857        )
2858
2859    def _parse_returning(self) -> t.Optional[exp.Returning]:
2860        if not self._match(TokenType.RETURNING):
2861            return None
2862        return self.expression(
2863            exp.Returning,
2864            expressions=self._parse_csv(self._parse_expression),
2865            into=self._match(TokenType.INTO) and self._parse_table_part(),
2866        )
2867
2868    def _parse_row(self) -> t.Optional[exp.RowFormatSerdeProperty | exp.RowFormatDelimitedProperty]:
2869        if not self._match(TokenType.FORMAT):
2870            return None
2871        return self._parse_row_format()
2872
2873    def _parse_serde_properties(self, with_: bool = False) -> t.Optional[exp.SerdeProperties]:
2874        index = self._index
2875        with_ = with_ or self._match_text_seq("WITH")
2876
2877        if not self._match(TokenType.SERDE_PROPERTIES):
2878            self._retreat(index)
2879            return None
2880        return self.expression(
2881            exp.SerdeProperties,
2882            **{  # type: ignore
2883                "expressions": self._parse_wrapped_properties(),
2884                "with": with_,
2885            },
2886        )
2887
2888    def _parse_row_format(
2889        self, match_row: bool = False
2890    ) -> t.Optional[exp.RowFormatSerdeProperty | exp.RowFormatDelimitedProperty]:
2891        if match_row and not self._match_pair(TokenType.ROW, TokenType.FORMAT):
2892            return None
2893
2894        if self._match_text_seq("SERDE"):
2895            this = self._parse_string()
2896
2897            serde_properties = self._parse_serde_properties()
2898
2899            return self.expression(
2900                exp.RowFormatSerdeProperty, this=this, serde_properties=serde_properties
2901            )
2902
2903        self._match_text_seq("DELIMITED")
2904
2905        kwargs = {}
2906
2907        if self._match_text_seq("FIELDS", "TERMINATED", "BY"):
2908            kwargs["fields"] = self._parse_string()
2909            if self._match_text_seq("ESCAPED", "BY"):
2910                kwargs["escaped"] = self._parse_string()
2911        if self._match_text_seq("COLLECTION", "ITEMS", "TERMINATED", "BY"):
2912            kwargs["collection_items"] = self._parse_string()
2913        if self._match_text_seq("MAP", "KEYS", "TERMINATED", "BY"):
2914            kwargs["map_keys"] = self._parse_string()
2915        if self._match_text_seq("LINES", "TERMINATED", "BY"):
2916            kwargs["lines"] = self._parse_string()
2917        if self._match_text_seq("NULL", "DEFINED", "AS"):
2918            kwargs["null"] = self._parse_string()
2919
2920        return self.expression(exp.RowFormatDelimitedProperty, **kwargs)  # type: ignore
2921
2922    def _parse_load(self) -> exp.LoadData | exp.Command:
2923        if self._match_text_seq("DATA"):
2924            local = self._match_text_seq("LOCAL")
2925            self._match_text_seq("INPATH")
2926            inpath = self._parse_string()
2927            overwrite = self._match(TokenType.OVERWRITE)
2928            self._match_pair(TokenType.INTO, TokenType.TABLE)
2929
2930            return self.expression(
2931                exp.LoadData,
2932                this=self._parse_table(schema=True),
2933                local=local,
2934                overwrite=overwrite,
2935                inpath=inpath,
2936                partition=self._parse_partition(),
2937                input_format=self._match_text_seq("INPUTFORMAT") and self._parse_string(),
2938                serde=self._match_text_seq("SERDE") and self._parse_string(),
2939            )
2940        return self._parse_as_command(self._prev)
2941
2942    def _parse_delete(self) -> exp.Delete:
2943        # This handles MySQL's "Multiple-Table Syntax"
2944        # https://dev.mysql.com/doc/refman/8.0/en/delete.html
2945        tables = None
2946        if not self._match(TokenType.FROM, advance=False):
2947            tables = self._parse_csv(self._parse_table) or None
2948
2949        returning = self._parse_returning()
2950
2951        return self.expression(
2952            exp.Delete,
2953            tables=tables,
2954            this=self._match(TokenType.FROM) and self._parse_table(joins=True),
2955            using=self._match(TokenType.USING) and self._parse_table(joins=True),
2956            cluster=self._match(TokenType.ON) and self._parse_on_property(),
2957            where=self._parse_where(),
2958            returning=returning or self._parse_returning(),
2959            limit=self._parse_limit(),
2960        )
2961
2962    def _parse_update(self) -> exp.Update:
2963        this = self._parse_table(joins=True, alias_tokens=self.UPDATE_ALIAS_TOKENS)
2964        expressions = self._match(TokenType.SET) and self._parse_csv(self._parse_equality)
2965        returning = self._parse_returning()
2966        return self.expression(
2967            exp.Update,
2968            **{  # type: ignore
2969                "this": this,
2970                "expressions": expressions,
2971                "from": self._parse_from(joins=True),
2972                "where": self._parse_where(),
2973                "returning": returning or self._parse_returning(),
2974                "order": self._parse_order(),
2975                "limit": self._parse_limit(),
2976            },
2977        )
2978
2979    def _parse_use(self) -> exp.Use:
2980        return self.expression(
2981            exp.Use,
2982            kind=self._parse_var_from_options(self.USABLES, raise_unmatched=False),
2983            this=self._parse_table(schema=False),
2984        )
2985
2986    def _parse_uncache(self) -> exp.Uncache:
2987        if not self._match(TokenType.TABLE):
2988            self.raise_error("Expecting TABLE after UNCACHE")
2989
2990        return self.expression(
2991            exp.Uncache, exists=self._parse_exists(), this=self._parse_table(schema=True)
2992        )
2993
2994    def _parse_cache(self) -> exp.Cache:
2995        lazy = self._match_text_seq("LAZY")
2996        self._match(TokenType.TABLE)
2997        table = self._parse_table(schema=True)
2998
2999        options = []
3000        if self._match_text_seq("OPTIONS"):
3001            self._match_l_paren()
3002            k = self._parse_string()
3003            self._match(TokenType.EQ)
3004            v = self._parse_string()
3005            options = [k, v]
3006            self._match_r_paren()
3007
3008        self._match(TokenType.ALIAS)
3009        return self.expression(
3010            exp.Cache,
3011            this=table,
3012            lazy=lazy,
3013            options=options,
3014            expression=self._parse_select(nested=True),
3015        )
3016
3017    def _parse_partition(self) -> t.Optional[exp.Partition]:
3018        if not self._match_texts(self.PARTITION_KEYWORDS):
3019            return None
3020
3021        return self.expression(
3022            exp.Partition,
3023            subpartition=self._prev.text.upper() == "SUBPARTITION",
3024            expressions=self._parse_wrapped_csv(self._parse_assignment),
3025        )
3026
3027    def _parse_value(self) -> t.Optional[exp.Tuple]:
3028        def _parse_value_expression() -> t.Optional[exp.Expression]:
3029            if self.dialect.SUPPORTS_VALUES_DEFAULT and self._match(TokenType.DEFAULT):
3030                return exp.var(self._prev.text.upper())
3031            return self._parse_expression()
3032
3033        if self._match(TokenType.L_PAREN):
3034            expressions = self._parse_csv(_parse_value_expression)
3035            self._match_r_paren()
3036            return self.expression(exp.Tuple, expressions=expressions)
3037
3038        # In some dialects we can have VALUES 1, 2 which results in 1 column & 2 rows.
3039        expression = self._parse_expression()
3040        if expression:
3041            return self.expression(exp.Tuple, expressions=[expression])
3042        return None
3043
3044    def _parse_projections(self) -> t.List[exp.Expression]:
3045        return self._parse_expressions()
3046
3047    def _parse_select(
3048        self,
3049        nested: bool = False,
3050        table: bool = False,
3051        parse_subquery_alias: bool = True,
3052        parse_set_operation: bool = True,
3053    ) -> t.Optional[exp.Expression]:
3054        cte = self._parse_with()
3055
3056        if cte:
3057            this = self._parse_statement()
3058
3059            if not this:
3060                self.raise_error("Failed to parse any statement following CTE")
3061                return cte
3062
3063            if "with" in this.arg_types:
3064                this.set("with", cte)
3065            else:
3066                self.raise_error(f"{this.key} does not support CTE")
3067                this = cte
3068
3069            return this
3070
3071        # duckdb supports leading with FROM x
3072        from_ = self._parse_from() if self._match(TokenType.FROM, advance=False) else None
3073
3074        if self._match(TokenType.SELECT):
3075            comments = self._prev_comments
3076
3077            hint = self._parse_hint()
3078
3079            if self._next and not self._next.token_type == TokenType.DOT:
3080                all_ = self._match(TokenType.ALL)
3081                distinct = self._match_set(self.DISTINCT_TOKENS)
3082            else:
3083                all_, distinct = None, None
3084
3085            kind = (
3086                self._match(TokenType.ALIAS)
3087                and self._match_texts(("STRUCT", "VALUE"))
3088                and self._prev.text.upper()
3089            )
3090
3091            if distinct:
3092                distinct = self.expression(
3093                    exp.Distinct,
3094                    on=self._parse_value() if self._match(TokenType.ON) else None,
3095                )
3096
3097            if all_ and distinct:
3098                self.raise_error("Cannot specify both ALL and DISTINCT after SELECT")
3099
3100            operation_modifiers = []
3101            while self._curr and self._match_texts(self.OPERATION_MODIFIERS):
3102                operation_modifiers.append(exp.var(self._prev.text.upper()))
3103
3104            limit = self._parse_limit(top=True)
3105            projections = self._parse_projections()
3106
3107            this = self.expression(
3108                exp.Select,
3109                kind=kind,
3110                hint=hint,
3111                distinct=distinct,
3112                expressions=projections,
3113                limit=limit,
3114                operation_modifiers=operation_modifiers or None,
3115            )
3116            this.comments = comments
3117
3118            into = self._parse_into()
3119            if into:
3120                this.set("into", into)
3121
3122            if not from_:
3123                from_ = self._parse_from()
3124
3125            if from_:
3126                this.set("from", from_)
3127
3128            this = self._parse_query_modifiers(this)
3129        elif (table or nested) and self._match(TokenType.L_PAREN):
3130            if self._match_set((TokenType.PIVOT, TokenType.UNPIVOT)):
3131                this = self._parse_simplified_pivot(
3132                    is_unpivot=self._prev.token_type == TokenType.UNPIVOT
3133                )
3134            elif self._match(TokenType.FROM):
3135                from_ = self._parse_from(skip_from_token=True)
3136                # Support parentheses for duckdb FROM-first syntax
3137                select = self._parse_select()
3138                if select:
3139                    select.set("from", from_)
3140                    this = select
3141                else:
3142                    this = exp.select("*").from_(t.cast(exp.From, from_))
3143            else:
3144                this = (
3145                    self._parse_table()
3146                    if table
3147                    else self._parse_select(nested=True, parse_set_operation=False)
3148                )
3149
3150                # Transform exp.Values into a exp.Table to pass through parse_query_modifiers
3151                # in case a modifier (e.g. join) is following
3152                if table and isinstance(this, exp.Values) and this.alias:
3153                    alias = this.args["alias"].pop()
3154                    this = exp.Table(this=this, alias=alias)
3155
3156                this = self._parse_query_modifiers(self._parse_set_operations(this))
3157
3158            self._match_r_paren()
3159
3160            # We return early here so that the UNION isn't attached to the subquery by the
3161            # following call to _parse_set_operations, but instead becomes the parent node
3162            return self._parse_subquery(this, parse_alias=parse_subquery_alias)
3163        elif self._match(TokenType.VALUES, advance=False):
3164            this = self._parse_derived_table_values()
3165        elif from_:
3166            this = exp.select("*").from_(from_.this, copy=False)
3167        elif self._match(TokenType.SUMMARIZE):
3168            table = self._match(TokenType.TABLE)
3169            this = self._parse_select() or self._parse_string() or self._parse_table()
3170            return self.expression(exp.Summarize, this=this, table=table)
3171        elif self._match(TokenType.DESCRIBE):
3172            this = self._parse_describe()
3173        elif self._match_text_seq("STREAM"):
3174            this = self._parse_function()
3175            if this:
3176                this = self.expression(exp.Stream, this=this)
3177            else:
3178                self._retreat(self._index - 1)
3179        else:
3180            this = None
3181
3182        return self._parse_set_operations(this) if parse_set_operation else this
3183
3184    def _parse_recursive_with_search(self) -> t.Optional[exp.RecursiveWithSearch]:
3185        self._match_text_seq("SEARCH")
3186
3187        kind = self._match_texts(self.RECURSIVE_CTE_SEARCH_KIND) and self._prev.text.upper()
3188
3189        if not kind:
3190            return None
3191
3192        self._match_text_seq("FIRST", "BY")
3193
3194        return self.expression(
3195            exp.RecursiveWithSearch,
3196            kind=kind,
3197            this=self._parse_id_var(),
3198            expression=self._match_text_seq("SET") and self._parse_id_var(),
3199            using=self._match_text_seq("USING") and self._parse_id_var(),
3200        )
3201
3202    def _parse_with(self, skip_with_token: bool = False) -> t.Optional[exp.With]:
3203        if not skip_with_token and not self._match(TokenType.WITH):
3204            return None
3205
3206        comments = self._prev_comments
3207        recursive = self._match(TokenType.RECURSIVE)
3208
3209        last_comments = None
3210        expressions = []
3211        while True:
3212            cte = self._parse_cte()
3213            if isinstance(cte, exp.CTE):
3214                expressions.append(cte)
3215                if last_comments:
3216                    cte.add_comments(last_comments)
3217
3218            if not self._match(TokenType.COMMA) and not self._match(TokenType.WITH):
3219                break
3220            else:
3221                self._match(TokenType.WITH)
3222
3223            last_comments = self._prev_comments
3224
3225        return self.expression(
3226            exp.With,
3227            comments=comments,
3228            expressions=expressions,
3229            recursive=recursive,
3230            search=self._parse_recursive_with_search(),
3231        )
3232
3233    def _parse_cte(self) -> t.Optional[exp.CTE]:
3234        index = self._index
3235
3236        alias = self._parse_table_alias(self.ID_VAR_TOKENS)
3237        if not alias or not alias.this:
3238            self.raise_error("Expected CTE to have alias")
3239
3240        if not self._match(TokenType.ALIAS) and not self.OPTIONAL_ALIAS_TOKEN_CTE:
3241            self._retreat(index)
3242            return None
3243
3244        comments = self._prev_comments
3245
3246        if self._match_text_seq("NOT", "MATERIALIZED"):
3247            materialized = False
3248        elif self._match_text_seq("MATERIALIZED"):
3249            materialized = True
3250        else:
3251            materialized = None
3252
3253        cte = self.expression(
3254            exp.CTE,
3255            this=self._parse_wrapped(self._parse_statement),
3256            alias=alias,
3257            materialized=materialized,
3258            comments=comments,
3259        )
3260
3261        if isinstance(cte.this, exp.Values):
3262            cte.set("this", exp.select("*").from_(exp.alias_(cte.this, "_values", table=True)))
3263
3264        return cte
3265
3266    def _parse_table_alias(
3267        self, alias_tokens: t.Optional[t.Collection[TokenType]] = None
3268    ) -> t.Optional[exp.TableAlias]:
3269        # In some dialects, LIMIT and OFFSET can act as both identifiers and keywords (clauses)
3270        # so this section tries to parse the clause version and if it fails, it treats the token
3271        # as an identifier (alias)
3272        if self._can_parse_limit_or_offset():
3273            return None
3274
3275        any_token = self._match(TokenType.ALIAS)
3276        alias = (
3277            self._parse_id_var(any_token=any_token, tokens=alias_tokens or self.TABLE_ALIAS_TOKENS)
3278            or self._parse_string_as_identifier()
3279        )
3280
3281        index = self._index
3282        if self._match(TokenType.L_PAREN):
3283            columns = self._parse_csv(self._parse_function_parameter)
3284            self._match_r_paren() if columns else self._retreat(index)
3285        else:
3286            columns = None
3287
3288        if not alias and not columns:
3289            return None
3290
3291        table_alias = self.expression(exp.TableAlias, this=alias, columns=columns)
3292
3293        # We bubble up comments from the Identifier to the TableAlias
3294        if isinstance(alias, exp.Identifier):
3295            table_alias.add_comments(alias.pop_comments())
3296
3297        return table_alias
3298
3299    def _parse_subquery(
3300        self, this: t.Optional[exp.Expression], parse_alias: bool = True
3301    ) -> t.Optional[exp.Subquery]:
3302        if not this:
3303            return None
3304
3305        return self.expression(
3306            exp.Subquery,
3307            this=this,
3308            pivots=self._parse_pivots(),
3309            alias=self._parse_table_alias() if parse_alias else None,
3310            sample=self._parse_table_sample(),
3311        )
3312
3313    def _implicit_unnests_to_explicit(self, this: E) -> E:
3314        from sqlglot.optimizer.normalize_identifiers import normalize_identifiers as _norm
3315
3316        refs = {_norm(this.args["from"].this.copy(), dialect=self.dialect).alias_or_name}
3317        for i, join in enumerate(this.args.get("joins") or []):
3318            table = join.this
3319            normalized_table = table.copy()
3320            normalized_table.meta["maybe_column"] = True
3321            normalized_table = _norm(normalized_table, dialect=self.dialect)
3322
3323            if isinstance(table, exp.Table) and not join.args.get("on"):
3324                if normalized_table.parts[0].name in refs:
3325                    table_as_column = table.to_column()
3326                    unnest = exp.Unnest(expressions=[table_as_column])
3327
3328                    # Table.to_column creates a parent Alias node that we want to convert to
3329                    # a TableAlias and attach to the Unnest, so it matches the parser's output
3330                    if isinstance(table.args.get("alias"), exp.TableAlias):
3331                        table_as_column.replace(table_as_column.this)
3332                        exp.alias_(unnest, None, table=[table.args["alias"].this], copy=False)
3333
3334                    table.replace(unnest)
3335
3336            refs.add(normalized_table.alias_or_name)
3337
3338        return this
3339
3340    def _parse_query_modifiers(
3341        self, this: t.Optional[exp.Expression]
3342    ) -> t.Optional[exp.Expression]:
3343        if isinstance(this, (exp.Query, exp.Table)):
3344            for join in self._parse_joins():
3345                this.append("joins", join)
3346            for lateral in iter(self._parse_lateral, None):
3347                this.append("laterals", lateral)
3348
3349            while True:
3350                if self._match_set(self.QUERY_MODIFIER_PARSERS, advance=False):
3351                    parser = self.QUERY_MODIFIER_PARSERS[self._curr.token_type]
3352                    key, expression = parser(self)
3353
3354                    if expression:
3355                        this.set(key, expression)
3356                        if key == "limit":
3357                            offset = expression.args.pop("offset", None)
3358
3359                            if offset:
3360                                offset = exp.Offset(expression=offset)
3361                                this.set("offset", offset)
3362
3363                                limit_by_expressions = expression.expressions
3364                                expression.set("expressions", None)
3365                                offset.set("expressions", limit_by_expressions)
3366                        continue
3367                break
3368
3369        if self.SUPPORTS_IMPLICIT_UNNEST and this and this.args.get("from"):
3370            this = self._implicit_unnests_to_explicit(this)
3371
3372        return this
3373
3374    def _parse_hint_fallback_to_string(self) -> t.Optional[exp.Hint]:
3375        start = self._curr
3376        while self._curr:
3377            self._advance()
3378
3379        end = self._tokens[self._index - 1]
3380        return exp.Hint(expressions=[self._find_sql(start, end)])
3381
3382    def _parse_hint_function_call(self) -> t.Optional[exp.Expression]:
3383        return self._parse_function_call()
3384
3385    def _parse_hint_body(self) -> t.Optional[exp.Hint]:
3386        start_index = self._index
3387        should_fallback_to_string = False
3388
3389        hints = []
3390        try:
3391            for hint in iter(
3392                lambda: self._parse_csv(
3393                    lambda: self._parse_hint_function_call() or self._parse_var(upper=True),
3394                ),
3395                [],
3396            ):
3397                hints.extend(hint)
3398        except ParseError:
3399            should_fallback_to_string = True
3400
3401        if should_fallback_to_string or self._curr:
3402            self._retreat(start_index)
3403            return self._parse_hint_fallback_to_string()
3404
3405        return self.expression(exp.Hint, expressions=hints)
3406
3407    def _parse_hint(self) -> t.Optional[exp.Hint]:
3408        if self._match(TokenType.HINT) and self._prev_comments:
3409            return exp.maybe_parse(self._prev_comments[0], into=exp.Hint, dialect=self.dialect)
3410
3411        return None
3412
3413    def _parse_into(self) -> t.Optional[exp.Into]:
3414        if not self._match(TokenType.INTO):
3415            return None
3416
3417        temp = self._match(TokenType.TEMPORARY)
3418        unlogged = self._match_text_seq("UNLOGGED")
3419        self._match(TokenType.TABLE)
3420
3421        return self.expression(
3422            exp.Into, this=self._parse_table(schema=True), temporary=temp, unlogged=unlogged
3423        )
3424
3425    def _parse_from(
3426        self, joins: bool = False, skip_from_token: bool = False
3427    ) -> t.Optional[exp.From]:
3428        if not skip_from_token and not self._match(TokenType.FROM):
3429            return None
3430
3431        return self.expression(
3432            exp.From, comments=self._prev_comments, this=self._parse_table(joins=joins)
3433        )
3434
3435    def _parse_match_recognize_measure(self) -> exp.MatchRecognizeMeasure:
3436        return self.expression(
3437            exp.MatchRecognizeMeasure,
3438            window_frame=self._match_texts(("FINAL", "RUNNING")) and self._prev.text.upper(),
3439            this=self._parse_expression(),
3440        )
3441
3442    def _parse_match_recognize(self) -> t.Optional[exp.MatchRecognize]:
3443        if not self._match(TokenType.MATCH_RECOGNIZE):
3444            return None
3445
3446        self._match_l_paren()
3447
3448        partition = self._parse_partition_by()
3449        order = self._parse_order()
3450
3451        measures = (
3452            self._parse_csv(self._parse_match_recognize_measure)
3453            if self._match_text_seq("MEASURES")
3454            else None
3455        )
3456
3457        if self._match_text_seq("ONE", "ROW", "PER", "MATCH"):
3458            rows = exp.var("ONE ROW PER MATCH")
3459        elif self._match_text_seq("ALL", "ROWS", "PER", "MATCH"):
3460            text = "ALL ROWS PER MATCH"
3461            if self._match_text_seq("SHOW", "EMPTY", "MATCHES"):
3462                text += " SHOW EMPTY MATCHES"
3463            elif self._match_text_seq("OMIT", "EMPTY", "MATCHES"):
3464                text += " OMIT EMPTY MATCHES"
3465            elif self._match_text_seq("WITH", "UNMATCHED", "ROWS"):
3466                text += " WITH UNMATCHED ROWS"
3467            rows = exp.var(text)
3468        else:
3469            rows = None
3470
3471        if self._match_text_seq("AFTER", "MATCH", "SKIP"):
3472            text = "AFTER MATCH SKIP"
3473            if self._match_text_seq("PAST", "LAST", "ROW"):
3474                text += " PAST LAST ROW"
3475            elif self._match_text_seq("TO", "NEXT", "ROW"):
3476                text += " TO NEXT ROW"
3477            elif self._match_text_seq("TO", "FIRST"):
3478                text += f" TO FIRST {self._advance_any().text}"  # type: ignore
3479            elif self._match_text_seq("TO", "LAST"):
3480                text += f" TO LAST {self._advance_any().text}"  # type: ignore
3481            after = exp.var(text)
3482        else:
3483            after = None
3484
3485        if self._match_text_seq("PATTERN"):
3486            self._match_l_paren()
3487
3488            if not self._curr:
3489                self.raise_error("Expecting )", self._curr)
3490
3491            paren = 1
3492            start = self._curr
3493
3494            while self._curr and paren > 0:
3495                if self._curr.token_type == TokenType.L_PAREN:
3496                    paren += 1
3497                if self._curr.token_type == TokenType.R_PAREN:
3498                    paren -= 1
3499
3500                end = self._prev
3501                self._advance()
3502
3503            if paren > 0:
3504                self.raise_error("Expecting )", self._curr)
3505
3506            pattern = exp.var(self._find_sql(start, end))
3507        else:
3508            pattern = None
3509
3510        define = (
3511            self._parse_csv(self._parse_name_as_expression)
3512            if self._match_text_seq("DEFINE")
3513            else None
3514        )
3515
3516        self._match_r_paren()
3517
3518        return self.expression(
3519            exp.MatchRecognize,
3520            partition_by=partition,
3521            order=order,
3522            measures=measures,
3523            rows=rows,
3524            after=after,
3525            pattern=pattern,
3526            define=define,
3527            alias=self._parse_table_alias(),
3528        )
3529
3530    def _parse_lateral(self) -> t.Optional[exp.Lateral]:
3531        cross_apply = self._match_pair(TokenType.CROSS, TokenType.APPLY)
3532        if not cross_apply and self._match_pair(TokenType.OUTER, TokenType.APPLY):
3533            cross_apply = False
3534
3535        if cross_apply is not None:
3536            this = self._parse_select(table=True)
3537            view = None
3538            outer = None
3539        elif self._match(TokenType.LATERAL):
3540            this = self._parse_select(table=True)
3541            view = self._match(TokenType.VIEW)
3542            outer = self._match(TokenType.OUTER)
3543        else:
3544            return None
3545
3546        if not this:
3547            this = (
3548                self._parse_unnest()
3549                or self._parse_function()
3550                or self._parse_id_var(any_token=False)
3551            )
3552
3553            while self._match(TokenType.DOT):
3554                this = exp.Dot(
3555                    this=this,
3556                    expression=self._parse_function() or self._parse_id_var(any_token=False),
3557                )
3558
3559        if view:
3560            table = self._parse_id_var(any_token=False)
3561            columns = self._parse_csv(self._parse_id_var) if self._match(TokenType.ALIAS) else []
3562            table_alias: t.Optional[exp.TableAlias] = self.expression(
3563                exp.TableAlias, this=table, columns=columns
3564            )
3565        elif isinstance(this, (exp.Subquery, exp.Unnest)) and this.alias:
3566            # We move the alias from the lateral's child node to the lateral itself
3567            table_alias = this.args["alias"].pop()
3568        else:
3569            table_alias = self._parse_table_alias()
3570
3571        return self.expression(
3572            exp.Lateral,
3573            this=this,
3574            view=view,
3575            outer=outer,
3576            alias=table_alias,
3577            cross_apply=cross_apply,
3578        )
3579
3580    def _parse_join_parts(
3581        self,
3582    ) -> t.Tuple[t.Optional[Token], t.Optional[Token], t.Optional[Token]]:
3583        return (
3584            self._match_set(self.JOIN_METHODS) and self._prev,
3585            self._match_set(self.JOIN_SIDES) and self._prev,
3586            self._match_set(self.JOIN_KINDS) and self._prev,
3587        )
3588
3589    def _parse_using_identifiers(self) -> t.List[exp.Expression]:
3590        def _parse_column_as_identifier() -> t.Optional[exp.Expression]:
3591            this = self._parse_column()
3592            if isinstance(this, exp.Column):
3593                return this.this
3594            return this
3595
3596        return self._parse_wrapped_csv(_parse_column_as_identifier, optional=True)
3597
3598    def _parse_join(
3599        self, skip_join_token: bool = False, parse_bracket: bool = False
3600    ) -> t.Optional[exp.Join]:
3601        if self._match(TokenType.COMMA):
3602            return self.expression(exp.Join, this=self._parse_table())
3603
3604        index = self._index
3605        method, side, kind = self._parse_join_parts()
3606        hint = self._prev.text if self._match_texts(self.JOIN_HINTS) else None
3607        join = self._match(TokenType.JOIN) or (kind and kind.token_type == TokenType.STRAIGHT_JOIN)
3608
3609        if not skip_join_token and not join:
3610            self._retreat(index)
3611            kind = None
3612            method = None
3613            side = None
3614
3615        outer_apply = self._match_pair(TokenType.OUTER, TokenType.APPLY, False)
3616        cross_apply = self._match_pair(TokenType.CROSS, TokenType.APPLY, False)
3617
3618        if not skip_join_token and not join and not outer_apply and not cross_apply:
3619            return None
3620
3621        kwargs: t.Dict[str, t.Any] = {"this": self._parse_table(parse_bracket=parse_bracket)}
3622        if kind and kind.token_type == TokenType.ARRAY and self._match(TokenType.COMMA):
3623            kwargs["expressions"] = self._parse_csv(
3624                lambda: self._parse_table(parse_bracket=parse_bracket)
3625            )
3626
3627        if method:
3628            kwargs["method"] = method.text
3629        if side:
3630            kwargs["side"] = side.text
3631        if kind:
3632            kwargs["kind"] = kind.text
3633        if hint:
3634            kwargs["hint"] = hint
3635
3636        if self._match(TokenType.MATCH_CONDITION):
3637            kwargs["match_condition"] = self._parse_wrapped(self._parse_comparison)
3638
3639        if self._match(TokenType.ON):
3640            kwargs["on"] = self._parse_assignment()
3641        elif self._match(TokenType.USING):
3642            kwargs["using"] = self._parse_using_identifiers()
3643        elif (
3644            not (outer_apply or cross_apply)
3645            and not isinstance(kwargs["this"], exp.Unnest)
3646            and not (kind and kind.token_type in (TokenType.CROSS, TokenType.ARRAY))
3647        ):
3648            index = self._index
3649            joins: t.Optional[list] = list(self._parse_joins())
3650
3651            if joins and self._match(TokenType.ON):
3652                kwargs["on"] = self._parse_assignment()
3653            elif joins and self._match(TokenType.USING):
3654                kwargs["using"] = self._parse_using_identifiers()
3655            else:
3656                joins = None
3657                self._retreat(index)
3658
3659            kwargs["this"].set("joins", joins if joins else None)
3660
3661        comments = [c for token in (method, side, kind) if token for c in token.comments]
3662        return self.expression(exp.Join, comments=comments, **kwargs)
3663
3664    def _parse_opclass(self) -> t.Optional[exp.Expression]:
3665        this = self._parse_assignment()
3666
3667        if self._match_texts(self.OPCLASS_FOLLOW_KEYWORDS, advance=False):
3668            return this
3669
3670        if not self._match_set(self.OPTYPE_FOLLOW_TOKENS, advance=False):
3671            return self.expression(exp.Opclass, this=this, expression=self._parse_table_parts())
3672
3673        return this
3674
3675    def _parse_index_params(self) -> exp.IndexParameters:
3676        using = self._parse_var(any_token=True) if self._match(TokenType.USING) else None
3677
3678        if self._match(TokenType.L_PAREN, advance=False):
3679            columns = self._parse_wrapped_csv(self._parse_with_operator)
3680        else:
3681            columns = None
3682
3683        include = self._parse_wrapped_id_vars() if self._match_text_seq("INCLUDE") else None
3684        partition_by = self._parse_partition_by()
3685        with_storage = self._match(TokenType.WITH) and self._parse_wrapped_properties()
3686        tablespace = (
3687            self._parse_var(any_token=True)
3688            if self._match_text_seq("USING", "INDEX", "TABLESPACE")
3689            else None
3690        )
3691        where = self._parse_where()
3692
3693        on = self._parse_field() if self._match(TokenType.ON) else None
3694
3695        return self.expression(
3696            exp.IndexParameters,
3697            using=using,
3698            columns=columns,
3699            include=include,
3700            partition_by=partition_by,
3701            where=where,
3702            with_storage=with_storage,
3703            tablespace=tablespace,
3704            on=on,
3705        )
3706
3707    def _parse_index(
3708        self, index: t.Optional[exp.Expression] = None, anonymous: bool = False
3709    ) -> t.Optional[exp.Index]:
3710        if index or anonymous:
3711            unique = None
3712            primary = None
3713            amp = None
3714
3715            self._match(TokenType.ON)
3716            self._match(TokenType.TABLE)  # hive
3717            table = self._parse_table_parts(schema=True)
3718        else:
3719            unique = self._match(TokenType.UNIQUE)
3720            primary = self._match_text_seq("PRIMARY")
3721            amp = self._match_text_seq("AMP")
3722
3723            if not self._match(TokenType.INDEX):
3724                return None
3725
3726            index = self._parse_id_var()
3727            table = None
3728
3729        params = self._parse_index_params()
3730
3731        return self.expression(
3732            exp.Index,
3733            this=index,
3734            table=table,
3735            unique=unique,
3736            primary=primary,
3737            amp=amp,
3738            params=params,
3739        )
3740
3741    def _parse_table_hints(self) -> t.Optional[t.List[exp.Expression]]:
3742        hints: t.List[exp.Expression] = []
3743        if self._match_pair(TokenType.WITH, TokenType.L_PAREN):
3744            # https://learn.microsoft.com/en-us/sql/t-sql/queries/hints-transact-sql-table?view=sql-server-ver16
3745            hints.append(
3746                self.expression(
3747                    exp.WithTableHint,
3748                    expressions=self._parse_csv(
3749                        lambda: self._parse_function() or self._parse_var(any_token=True)
3750                    ),
3751                )
3752            )
3753            self._match_r_paren()
3754        else:
3755            # https://dev.mysql.com/doc/refman/8.0/en/index-hints.html
3756            while self._match_set(self.TABLE_INDEX_HINT_TOKENS):
3757                hint = exp.IndexTableHint(this=self._prev.text.upper())
3758
3759                self._match_set((TokenType.INDEX, TokenType.KEY))
3760                if self._match(TokenType.FOR):
3761                    hint.set("target", self._advance_any() and self._prev.text.upper())
3762
3763                hint.set("expressions", self._parse_wrapped_id_vars())
3764                hints.append(hint)
3765
3766        return hints or None
3767
3768    def _parse_table_part(self, schema: bool = False) -> t.Optional[exp.Expression]:
3769        return (
3770            (not schema and self._parse_function(optional_parens=False))
3771            or self._parse_id_var(any_token=False)
3772            or self._parse_string_as_identifier()
3773            or self._parse_placeholder()
3774        )
3775
3776    def _parse_table_parts(
3777        self, schema: bool = False, is_db_reference: bool = False, wildcard: bool = False
3778    ) -> exp.Table:
3779        catalog = None
3780        db = None
3781        table: t.Optional[exp.Expression | str] = self._parse_table_part(schema=schema)
3782
3783        while self._match(TokenType.DOT):
3784            if catalog:
3785                # This allows nesting the table in arbitrarily many dot expressions if needed
3786                table = self.expression(
3787                    exp.Dot, this=table, expression=self._parse_table_part(schema=schema)
3788                )
3789            else:
3790                catalog = db
3791                db = table
3792                # "" used for tsql FROM a..b case
3793                table = self._parse_table_part(schema=schema) or ""
3794
3795        if (
3796            wildcard
3797            and self._is_connected()
3798            and (isinstance(table, exp.Identifier) or not table)
3799            and self._match(TokenType.STAR)
3800        ):
3801            if isinstance(table, exp.Identifier):
3802                table.args["this"] += "*"
3803            else:
3804                table = exp.Identifier(this="*")
3805
3806        # We bubble up comments from the Identifier to the Table
3807        comments = table.pop_comments() if isinstance(table, exp.Expression) else None
3808
3809        if is_db_reference:
3810            catalog = db
3811            db = table
3812            table = None
3813
3814        if not table and not is_db_reference:
3815            self.raise_error(f"Expected table name but got {self._curr}")
3816        if not db and is_db_reference:
3817            self.raise_error(f"Expected database name but got {self._curr}")
3818
3819        table = self.expression(
3820            exp.Table,
3821            comments=comments,
3822            this=table,
3823            db=db,
3824            catalog=catalog,
3825        )
3826
3827        changes = self._parse_changes()
3828        if changes:
3829            table.set("changes", changes)
3830
3831        at_before = self._parse_historical_data()
3832        if at_before:
3833            table.set("when", at_before)
3834
3835        pivots = self._parse_pivots()
3836        if pivots:
3837            table.set("pivots", pivots)
3838
3839        return table
3840
3841    def _parse_table(
3842        self,
3843        schema: bool = False,
3844        joins: bool = False,
3845        alias_tokens: t.Optional[t.Collection[TokenType]] = None,
3846        parse_bracket: bool = False,
3847        is_db_reference: bool = False,
3848        parse_partition: bool = False,
3849    ) -> t.Optional[exp.Expression]:
3850        lateral = self._parse_lateral()
3851        if lateral:
3852            return lateral
3853
3854        unnest = self._parse_unnest()
3855        if unnest:
3856            return unnest
3857
3858        values = self._parse_derived_table_values()
3859        if values:
3860            return values
3861
3862        subquery = self._parse_select(table=True)
3863        if subquery:
3864            if not subquery.args.get("pivots"):
3865                subquery.set("pivots", self._parse_pivots())
3866            return subquery
3867
3868        bracket = parse_bracket and self._parse_bracket(None)
3869        bracket = self.expression(exp.Table, this=bracket) if bracket else None
3870
3871        rows_from = self._match_text_seq("ROWS", "FROM") and self._parse_wrapped_csv(
3872            self._parse_table
3873        )
3874        rows_from = self.expression(exp.Table, rows_from=rows_from) if rows_from else None
3875
3876        only = self._match(TokenType.ONLY)
3877
3878        this = t.cast(
3879            exp.Expression,
3880            bracket
3881            or rows_from
3882            or self._parse_bracket(
3883                self._parse_table_parts(schema=schema, is_db_reference=is_db_reference)
3884            ),
3885        )
3886
3887        if only:
3888            this.set("only", only)
3889
3890        # Postgres supports a wildcard (table) suffix operator, which is a no-op in this context
3891        self._match_text_seq("*")
3892
3893        parse_partition = parse_partition or self.SUPPORTS_PARTITION_SELECTION
3894        if parse_partition and self._match(TokenType.PARTITION, advance=False):
3895            this.set("partition", self._parse_partition())
3896
3897        if schema:
3898            return self._parse_schema(this=this)
3899
3900        version = self._parse_version()
3901
3902        if version:
3903            this.set("version", version)
3904
3905        if self.dialect.ALIAS_POST_TABLESAMPLE:
3906            this.set("sample", self._parse_table_sample())
3907
3908        alias = self._parse_table_alias(alias_tokens=alias_tokens or self.TABLE_ALIAS_TOKENS)
3909        if alias:
3910            this.set("alias", alias)
3911
3912        if isinstance(this, exp.Table) and self._match_text_seq("AT"):
3913            return self.expression(
3914                exp.AtIndex, this=this.to_column(copy=False), expression=self._parse_id_var()
3915            )
3916
3917        this.set("hints", self._parse_table_hints())
3918
3919        if not this.args.get("pivots"):
3920            this.set("pivots", self._parse_pivots())
3921
3922        if not self.dialect.ALIAS_POST_TABLESAMPLE:
3923            this.set("sample", self._parse_table_sample())
3924
3925        if joins:
3926            for join in self._parse_joins():
3927                this.append("joins", join)
3928
3929        if self._match_pair(TokenType.WITH, TokenType.ORDINALITY):
3930            this.set("ordinality", True)
3931            this.set("alias", self._parse_table_alias())
3932
3933        return this
3934
3935    def _parse_version(self) -> t.Optional[exp.Version]:
3936        if self._match(TokenType.TIMESTAMP_SNAPSHOT):
3937            this = "TIMESTAMP"
3938        elif self._match(TokenType.VERSION_SNAPSHOT):
3939            this = "VERSION"
3940        else:
3941            return None
3942
3943        if self._match_set((TokenType.FROM, TokenType.BETWEEN)):
3944            kind = self._prev.text.upper()
3945            start = self._parse_bitwise()
3946            self._match_texts(("TO", "AND"))
3947            end = self._parse_bitwise()
3948            expression: t.Optional[exp.Expression] = self.expression(
3949                exp.Tuple, expressions=[start, end]
3950            )
3951        elif self._match_text_seq("CONTAINED", "IN"):
3952            kind = "CONTAINED IN"
3953            expression = self.expression(
3954                exp.Tuple, expressions=self._parse_wrapped_csv(self._parse_bitwise)
3955            )
3956        elif self._match(TokenType.ALL):
3957            kind = "ALL"
3958            expression = None
3959        else:
3960            self._match_text_seq("AS", "OF")
3961            kind = "AS OF"
3962            expression = self._parse_type()
3963
3964        return self.expression(exp.Version, this=this, expression=expression, kind=kind)
3965
3966    def _parse_historical_data(self) -> t.Optional[exp.HistoricalData]:
3967        # https://docs.snowflake.com/en/sql-reference/constructs/at-before
3968        index = self._index
3969        historical_data = None
3970        if self._match_texts(self.HISTORICAL_DATA_PREFIX):
3971            this = self._prev.text.upper()
3972            kind = (
3973                self._match(TokenType.L_PAREN)
3974                and self._match_texts(self.HISTORICAL_DATA_KIND)
3975                and self._prev.text.upper()
3976            )
3977            expression = self._match(TokenType.FARROW) and self._parse_bitwise()
3978
3979            if expression:
3980                self._match_r_paren()
3981                historical_data = self.expression(
3982                    exp.HistoricalData, this=this, kind=kind, expression=expression
3983                )
3984            else:
3985                self._retreat(index)
3986
3987        return historical_data
3988
3989    def _parse_changes(self) -> t.Optional[exp.Changes]:
3990        if not self._match_text_seq("CHANGES", "(", "INFORMATION", "=>"):
3991            return None
3992
3993        information = self._parse_var(any_token=True)
3994        self._match_r_paren()
3995
3996        return self.expression(
3997            exp.Changes,
3998            information=information,
3999            at_before=self._parse_historical_data(),
4000            end=self._parse_historical_data(),
4001        )
4002
4003    def _parse_unnest(self, with_alias: bool = True) -> t.Optional[exp.Unnest]:
4004        if not self._match(TokenType.UNNEST):
4005            return None
4006
4007        expressions = self._parse_wrapped_csv(self._parse_equality)
4008        offset = self._match_pair(TokenType.WITH, TokenType.ORDINALITY)
4009
4010        alias = self._parse_table_alias() if with_alias else None
4011
4012        if alias:
4013            if self.dialect.UNNEST_COLUMN_ONLY:
4014                if alias.args.get("columns"):
4015                    self.raise_error("Unexpected extra column alias in unnest.")
4016
4017                alias.set("columns", [alias.this])
4018                alias.set("this", None)
4019
4020            columns = alias.args.get("columns") or []
4021            if offset and len(expressions) < len(columns):
4022                offset = columns.pop()
4023
4024        if not offset and self._match_pair(TokenType.WITH, TokenType.OFFSET):
4025            self._match(TokenType.ALIAS)
4026            offset = self._parse_id_var(
4027                any_token=False, tokens=self.UNNEST_OFFSET_ALIAS_TOKENS
4028            ) or exp.to_identifier("offset")
4029
4030        return self.expression(exp.Unnest, expressions=expressions, alias=alias, offset=offset)
4031
4032    def _parse_derived_table_values(self) -> t.Optional[exp.Values]:
4033        is_derived = self._match_pair(TokenType.L_PAREN, TokenType.VALUES)
4034        if not is_derived and not (
4035            # ClickHouse's `FORMAT Values` is equivalent to `VALUES`
4036            self._match_text_seq("VALUES") or self._match_text_seq("FORMAT", "VALUES")
4037        ):
4038            return None
4039
4040        expressions = self._parse_csv(self._parse_value)
4041        alias = self._parse_table_alias()
4042
4043        if is_derived:
4044            self._match_r_paren()
4045
4046        return self.expression(
4047            exp.Values, expressions=expressions, alias=alias or self._parse_table_alias()
4048        )
4049
4050    def _parse_table_sample(self, as_modifier: bool = False) -> t.Optional[exp.TableSample]:
4051        if not self._match(TokenType.TABLE_SAMPLE) and not (
4052            as_modifier and self._match_text_seq("USING", "SAMPLE")
4053        ):
4054            return None
4055
4056        bucket_numerator = None
4057        bucket_denominator = None
4058        bucket_field = None
4059        percent = None
4060        size = None
4061        seed = None
4062
4063        method = self._parse_var(tokens=(TokenType.ROW,), upper=True)
4064        matched_l_paren = self._match(TokenType.L_PAREN)
4065
4066        if self.TABLESAMPLE_CSV:
4067            num = None
4068            expressions = self._parse_csv(self._parse_primary)
4069        else:
4070            expressions = None
4071            num = (
4072                self._parse_factor()
4073                if self._match(TokenType.NUMBER, advance=False)
4074                else self._parse_primary() or self._parse_placeholder()
4075            )
4076
4077        if self._match_text_seq("BUCKET"):
4078            bucket_numerator = self._parse_number()
4079            self._match_text_seq("OUT", "OF")
4080            bucket_denominator = bucket_denominator = self._parse_number()
4081            self._match(TokenType.ON)
4082            bucket_field = self._parse_field()
4083        elif self._match_set((TokenType.PERCENT, TokenType.MOD)):
4084            percent = num
4085        elif self._match(TokenType.ROWS) or not self.dialect.TABLESAMPLE_SIZE_IS_PERCENT:
4086            size = num
4087        else:
4088            percent = num
4089
4090        if matched_l_paren:
4091            self._match_r_paren()
4092
4093        if self._match(TokenType.L_PAREN):
4094            method = self._parse_var(upper=True)
4095            seed = self._match(TokenType.COMMA) and self._parse_number()
4096            self._match_r_paren()
4097        elif self._match_texts(("SEED", "REPEATABLE")):
4098            seed = self._parse_wrapped(self._parse_number)
4099
4100        if not method and self.DEFAULT_SAMPLING_METHOD:
4101            method = exp.var(self.DEFAULT_SAMPLING_METHOD)
4102
4103        return self.expression(
4104            exp.TableSample,
4105            expressions=expressions,
4106            method=method,
4107            bucket_numerator=bucket_numerator,
4108            bucket_denominator=bucket_denominator,
4109            bucket_field=bucket_field,
4110            percent=percent,
4111            size=size,
4112            seed=seed,
4113        )
4114
4115    def _parse_pivots(self) -> t.Optional[t.List[exp.Pivot]]:
4116        return list(iter(self._parse_pivot, None)) or None
4117
4118    def _parse_joins(self) -> t.Iterator[exp.Join]:
4119        return iter(self._parse_join, None)
4120
4121    def _parse_unpivot_columns(self) -> t.Optional[exp.UnpivotColumns]:
4122        if not self._match(TokenType.INTO):
4123            return None
4124
4125        return self.expression(
4126            exp.UnpivotColumns,
4127            this=self._match_text_seq("NAME") and self._parse_column(),
4128            expressions=self._match_text_seq("VALUE") and self._parse_csv(self._parse_column),
4129        )
4130
4131    # https://duckdb.org/docs/sql/statements/pivot
4132    def _parse_simplified_pivot(self, is_unpivot: t.Optional[bool] = None) -> exp.Pivot:
4133        def _parse_on() -> t.Optional[exp.Expression]:
4134            this = self._parse_bitwise()
4135
4136            if self._match(TokenType.IN):
4137                # PIVOT ... ON col IN (row_val1, row_val2)
4138                return self._parse_in(this)
4139            if self._match(TokenType.ALIAS, advance=False):
4140                # UNPIVOT ... ON (col1, col2, col3) AS row_val
4141                return self._parse_alias(this)
4142
4143            return this
4144
4145        this = self._parse_table()
4146        expressions = self._match(TokenType.ON) and self._parse_csv(_parse_on)
4147        into = self._parse_unpivot_columns()
4148        using = self._match(TokenType.USING) and self._parse_csv(
4149            lambda: self._parse_alias(self._parse_function())
4150        )
4151        group = self._parse_group()
4152
4153        return self.expression(
4154            exp.Pivot,
4155            this=this,
4156            expressions=expressions,
4157            using=using,
4158            group=group,
4159            unpivot=is_unpivot,
4160            into=into,
4161        )
4162
4163    def _parse_pivot_in(self) -> exp.In | exp.PivotAny:
4164        def _parse_aliased_expression() -> t.Optional[exp.Expression]:
4165            this = self._parse_select_or_expression()
4166
4167            self._match(TokenType.ALIAS)
4168            alias = self._parse_bitwise()
4169            if alias:
4170                if isinstance(alias, exp.Column) and not alias.db:
4171                    alias = alias.this
4172                return self.expression(exp.PivotAlias, this=this, alias=alias)
4173
4174            return this
4175
4176        value = self._parse_column()
4177
4178        if not self._match_pair(TokenType.IN, TokenType.L_PAREN):
4179            self.raise_error("Expecting IN (")
4180
4181        if self._match(TokenType.ANY):
4182            exprs: t.List[exp.Expression] = ensure_list(exp.PivotAny(this=self._parse_order()))
4183        else:
4184            exprs = self._parse_csv(_parse_aliased_expression)
4185
4186        self._match_r_paren()
4187        return self.expression(exp.In, this=value, expressions=exprs)
4188
4189    def _parse_pivot(self) -> t.Optional[exp.Pivot]:
4190        index = self._index
4191        include_nulls = None
4192
4193        if self._match(TokenType.PIVOT):
4194            unpivot = False
4195        elif self._match(TokenType.UNPIVOT):
4196            unpivot = True
4197
4198            # https://docs.databricks.com/en/sql/language-manual/sql-ref-syntax-qry-select-unpivot.html#syntax
4199            if self._match_text_seq("INCLUDE", "NULLS"):
4200                include_nulls = True
4201            elif self._match_text_seq("EXCLUDE", "NULLS"):
4202                include_nulls = False
4203        else:
4204            return None
4205
4206        expressions = []
4207
4208        if not self._match(TokenType.L_PAREN):
4209            self._retreat(index)
4210            return None
4211
4212        if unpivot:
4213            expressions = self._parse_csv(self._parse_column)
4214        else:
4215            expressions = self._parse_csv(lambda: self._parse_alias(self._parse_function()))
4216
4217        if not expressions:
4218            self.raise_error("Failed to parse PIVOT's aggregation list")
4219
4220        if not self._match(TokenType.FOR):
4221            self.raise_error("Expecting FOR")
4222
4223        field = self._parse_pivot_in()
4224        default_on_null = self._match_text_seq("DEFAULT", "ON", "NULL") and self._parse_wrapped(
4225            self._parse_bitwise
4226        )
4227
4228        self._match_r_paren()
4229
4230        pivot = self.expression(
4231            exp.Pivot,
4232            expressions=expressions,
4233            field=field,
4234            unpivot=unpivot,
4235            include_nulls=include_nulls,
4236            default_on_null=default_on_null,
4237        )
4238
4239        if not self._match_set((TokenType.PIVOT, TokenType.UNPIVOT), advance=False):
4240            pivot.set("alias", self._parse_table_alias())
4241
4242        if not unpivot:
4243            names = self._pivot_column_names(t.cast(t.List[exp.Expression], expressions))
4244
4245            columns: t.List[exp.Expression] = []
4246            pivot_field_expressions = pivot.args["field"].expressions
4247
4248            # The `PivotAny` expression corresponds to `ANY ORDER BY <column>`; we can't infer in this case.
4249            if not isinstance(seq_get(pivot_field_expressions, 0), exp.PivotAny):
4250                for fld in pivot_field_expressions:
4251                    field_name = fld.sql() if self.IDENTIFY_PIVOT_STRINGS else fld.alias_or_name
4252                    for name in names:
4253                        if self.PREFIXED_PIVOT_COLUMNS:
4254                            name = f"{name}_{field_name}" if name else field_name
4255                        else:
4256                            name = f"{field_name}_{name}" if name else field_name
4257
4258                        columns.append(exp.to_identifier(name))
4259
4260            pivot.set("columns", columns)
4261
4262        return pivot
4263
4264    def _pivot_column_names(self, aggregations: t.List[exp.Expression]) -> t.List[str]:
4265        return [agg.alias for agg in aggregations]
4266
4267    def _parse_prewhere(self, skip_where_token: bool = False) -> t.Optional[exp.PreWhere]:
4268        if not skip_where_token and not self._match(TokenType.PREWHERE):
4269            return None
4270
4271        return self.expression(
4272            exp.PreWhere, comments=self._prev_comments, this=self._parse_assignment()
4273        )
4274
4275    def _parse_where(self, skip_where_token: bool = False) -> t.Optional[exp.Where]:
4276        if not skip_where_token and not self._match(TokenType.WHERE):
4277            return None
4278
4279        return self.expression(
4280            exp.Where, comments=self._prev_comments, this=self._parse_assignment()
4281        )
4282
4283    def _parse_group(self, skip_group_by_token: bool = False) -> t.Optional[exp.Group]:
4284        if not skip_group_by_token and not self._match(TokenType.GROUP_BY):
4285            return None
4286
4287        elements: t.Dict[str, t.Any] = defaultdict(list)
4288
4289        if self._match(TokenType.ALL):
4290            elements["all"] = True
4291        elif self._match(TokenType.DISTINCT):
4292            elements["all"] = False
4293
4294        while True:
4295            index = self._index
4296
4297            elements["expressions"].extend(
4298                self._parse_csv(
4299                    lambda: None
4300                    if self._match_set((TokenType.CUBE, TokenType.ROLLUP), advance=False)
4301                    else self._parse_assignment()
4302                )
4303            )
4304
4305            before_with_index = self._index
4306            with_prefix = self._match(TokenType.WITH)
4307
4308            if self._match(TokenType.ROLLUP):
4309                elements["rollup"].append(
4310                    self._parse_cube_or_rollup(exp.Rollup, with_prefix=with_prefix)
4311                )
4312            elif self._match(TokenType.CUBE):
4313                elements["cube"].append(
4314                    self._parse_cube_or_rollup(exp.Cube, with_prefix=with_prefix)
4315                )
4316            elif self._match(TokenType.GROUPING_SETS):
4317                elements["grouping_sets"].append(
4318                    self.expression(
4319                        exp.GroupingSets,
4320                        expressions=self._parse_wrapped_csv(self._parse_grouping_set),
4321                    )
4322                )
4323            elif self._match_text_seq("TOTALS"):
4324                elements["totals"] = True  # type: ignore
4325
4326            if before_with_index <= self._index <= before_with_index + 1:
4327                self._retreat(before_with_index)
4328                break
4329
4330            if index == self._index:
4331                break
4332
4333        return self.expression(exp.Group, **elements)  # type: ignore
4334
4335    def _parse_cube_or_rollup(self, kind: t.Type[E], with_prefix: bool = False) -> E:
4336        return self.expression(
4337            kind, expressions=[] if with_prefix else self._parse_wrapped_csv(self._parse_column)
4338        )
4339
4340    def _parse_grouping_set(self) -> t.Optional[exp.Expression]:
4341        if self._match(TokenType.L_PAREN):
4342            grouping_set = self._parse_csv(self._parse_column)
4343            self._match_r_paren()
4344            return self.expression(exp.Tuple, expressions=grouping_set)
4345
4346        return self._parse_column()
4347
4348    def _parse_having(self, skip_having_token: bool = False) -> t.Optional[exp.Having]:
4349        if not skip_having_token and not self._match(TokenType.HAVING):
4350            return None
4351        return self.expression(exp.Having, this=self._parse_assignment())
4352
4353    def _parse_qualify(self) -> t.Optional[exp.Qualify]:
4354        if not self._match(TokenType.QUALIFY):
4355            return None
4356        return self.expression(exp.Qualify, this=self._parse_assignment())
4357
4358    def _parse_connect(self, skip_start_token: bool = False) -> t.Optional[exp.Connect]:
4359        if skip_start_token:
4360            start = None
4361        elif self._match(TokenType.START_WITH):
4362            start = self._parse_assignment()
4363        else:
4364            return None
4365
4366        self._match(TokenType.CONNECT_BY)
4367        nocycle = self._match_text_seq("NOCYCLE")
4368        self.NO_PAREN_FUNCTION_PARSERS["PRIOR"] = lambda self: self.expression(
4369            exp.Prior, this=self._parse_bitwise()
4370        )
4371        connect = self._parse_assignment()
4372        self.NO_PAREN_FUNCTION_PARSERS.pop("PRIOR")
4373
4374        if not start and self._match(TokenType.START_WITH):
4375            start = self._parse_assignment()
4376
4377        return self.expression(exp.Connect, start=start, connect=connect, nocycle=nocycle)
4378
4379    def _parse_name_as_expression(self) -> t.Optional[exp.Expression]:
4380        this = self._parse_id_var(any_token=True)
4381        if self._match(TokenType.ALIAS):
4382            this = self.expression(exp.Alias, alias=this, this=self._parse_assignment())
4383        return this
4384
4385    def _parse_interpolate(self) -> t.Optional[t.List[exp.Expression]]:
4386        if self._match_text_seq("INTERPOLATE"):
4387            return self._parse_wrapped_csv(self._parse_name_as_expression)
4388        return None
4389
4390    def _parse_order(
4391        self, this: t.Optional[exp.Expression] = None, skip_order_token: bool = False
4392    ) -> t.Optional[exp.Expression]:
4393        siblings = None
4394        if not skip_order_token and not self._match(TokenType.ORDER_BY):
4395            if not self._match(TokenType.ORDER_SIBLINGS_BY):
4396                return this
4397
4398            siblings = True
4399
4400        return self.expression(
4401            exp.Order,
4402            this=this,
4403            expressions=self._parse_csv(self._parse_ordered),
4404            siblings=siblings,
4405        )
4406
4407    def _parse_sort(self, exp_class: t.Type[E], token: TokenType) -> t.Optional[E]:
4408        if not self._match(token):
4409            return None
4410        return self.expression(exp_class, expressions=self._parse_csv(self._parse_ordered))
4411
4412    def _parse_ordered(
4413        self, parse_method: t.Optional[t.Callable] = None
4414    ) -> t.Optional[exp.Ordered]:
4415        this = parse_method() if parse_method else self._parse_assignment()
4416        if not this:
4417            return None
4418
4419        if this.name.upper() == "ALL" and self.dialect.SUPPORTS_ORDER_BY_ALL:
4420            this = exp.var("ALL")
4421
4422        asc = self._match(TokenType.ASC)
4423        desc = self._match(TokenType.DESC) or (asc and False)
4424
4425        is_nulls_first = self._match_text_seq("NULLS", "FIRST")
4426        is_nulls_last = self._match_text_seq("NULLS", "LAST")
4427
4428        nulls_first = is_nulls_first or False
4429        explicitly_null_ordered = is_nulls_first or is_nulls_last
4430
4431        if (
4432            not explicitly_null_ordered
4433            and (
4434                (not desc and self.dialect.NULL_ORDERING == "nulls_are_small")
4435                or (desc and self.dialect.NULL_ORDERING != "nulls_are_small")
4436            )
4437            and self.dialect.NULL_ORDERING != "nulls_are_last"
4438        ):
4439            nulls_first = True
4440
4441        if self._match_text_seq("WITH", "FILL"):
4442            with_fill = self.expression(
4443                exp.WithFill,
4444                **{  # type: ignore
4445                    "from": self._match(TokenType.FROM) and self._parse_bitwise(),
4446                    "to": self._match_text_seq("TO") and self._parse_bitwise(),
4447                    "step": self._match_text_seq("STEP") and self._parse_bitwise(),
4448                    "interpolate": self._parse_interpolate(),
4449                },
4450            )
4451        else:
4452            with_fill = None
4453
4454        return self.expression(
4455            exp.Ordered, this=this, desc=desc, nulls_first=nulls_first, with_fill=with_fill
4456        )
4457
4458    def _parse_limit_options(self) -> exp.LimitOptions:
4459        percent = self._match(TokenType.PERCENT)
4460        rows = self._match_set((TokenType.ROW, TokenType.ROWS))
4461        self._match_text_seq("ONLY")
4462        with_ties = self._match_text_seq("WITH", "TIES")
4463        return self.expression(exp.LimitOptions, percent=percent, rows=rows, with_ties=with_ties)
4464
4465    def _parse_limit(
4466        self,
4467        this: t.Optional[exp.Expression] = None,
4468        top: bool = False,
4469        skip_limit_token: bool = False,
4470    ) -> t.Optional[exp.Expression]:
4471        if skip_limit_token or self._match(TokenType.TOP if top else TokenType.LIMIT):
4472            comments = self._prev_comments
4473            if top:
4474                limit_paren = self._match(TokenType.L_PAREN)
4475                expression = self._parse_term() if limit_paren else self._parse_number()
4476
4477                if limit_paren:
4478                    self._match_r_paren()
4479
4480                limit_options = self._parse_limit_options()
4481            else:
4482                limit_options = None
4483                expression = self._parse_term()
4484
4485            if self._match(TokenType.COMMA):
4486                offset = expression
4487                expression = self._parse_term()
4488            else:
4489                offset = None
4490
4491            limit_exp = self.expression(
4492                exp.Limit,
4493                this=this,
4494                expression=expression,
4495                offset=offset,
4496                comments=comments,
4497                limit_options=limit_options,
4498                expressions=self._parse_limit_by(),
4499            )
4500
4501            return limit_exp
4502
4503        if self._match(TokenType.FETCH):
4504            direction = self._match_set((TokenType.FIRST, TokenType.NEXT))
4505            direction = self._prev.text.upper() if direction else "FIRST"
4506
4507            count = self._parse_field(tokens=self.FETCH_TOKENS)
4508
4509            return self.expression(
4510                exp.Fetch,
4511                direction=direction,
4512                count=count,
4513                limit_options=self._parse_limit_options(),
4514            )
4515
4516        return this
4517
4518    def _parse_offset(self, this: t.Optional[exp.Expression] = None) -> t.Optional[exp.Expression]:
4519        if not self._match(TokenType.OFFSET):
4520            return this
4521
4522        count = self._parse_term()
4523        self._match_set((TokenType.ROW, TokenType.ROWS))
4524
4525        return self.expression(
4526            exp.Offset, this=this, expression=count, expressions=self._parse_limit_by()
4527        )
4528
4529    def _can_parse_limit_or_offset(self) -> bool:
4530        if not self._match_set(self.AMBIGUOUS_ALIAS_TOKENS, advance=False):
4531            return False
4532
4533        index = self._index
4534        result = bool(
4535            self._try_parse(self._parse_limit, retreat=True)
4536            or self._try_parse(self._parse_offset, retreat=True)
4537        )
4538        self._retreat(index)
4539        return result
4540
4541    def _parse_limit_by(self) -> t.Optional[t.List[exp.Expression]]:
4542        return self._match_text_seq("BY") and self._parse_csv(self._parse_bitwise)
4543
4544    def _parse_locks(self) -> t.List[exp.Lock]:
4545        locks = []
4546        while True:
4547            if self._match_text_seq("FOR", "UPDATE"):
4548                update = True
4549            elif self._match_text_seq("FOR", "SHARE") or self._match_text_seq(
4550                "LOCK", "IN", "SHARE", "MODE"
4551            ):
4552                update = False
4553            else:
4554                break
4555
4556            expressions = None
4557            if self._match_text_seq("OF"):
4558                expressions = self._parse_csv(lambda: self._parse_table(schema=True))
4559
4560            wait: t.Optional[bool | exp.Expression] = None
4561            if self._match_text_seq("NOWAIT"):
4562                wait = True
4563            elif self._match_text_seq("WAIT"):
4564                wait = self._parse_primary()
4565            elif self._match_text_seq("SKIP", "LOCKED"):
4566                wait = False
4567
4568            locks.append(
4569                self.expression(exp.Lock, update=update, expressions=expressions, wait=wait)
4570            )
4571
4572        return locks
4573
4574    def _parse_set_operations(self, this: t.Optional[exp.Expression]) -> t.Optional[exp.Expression]:
4575        while this and self._match_set(self.SET_OPERATIONS):
4576            token_type = self._prev.token_type
4577
4578            if token_type == TokenType.UNION:
4579                operation: t.Type[exp.SetOperation] = exp.Union
4580            elif token_type == TokenType.EXCEPT:
4581                operation = exp.Except
4582            else:
4583                operation = exp.Intersect
4584
4585            comments = self._prev.comments
4586
4587            if self._match(TokenType.DISTINCT):
4588                distinct: t.Optional[bool] = True
4589            elif self._match(TokenType.ALL):
4590                distinct = False
4591            else:
4592                distinct = self.dialect.SET_OP_DISTINCT_BY_DEFAULT[operation]
4593                if distinct is None:
4594                    self.raise_error(f"Expected DISTINCT or ALL for {operation.__name__}")
4595
4596            by_name = self._match_text_seq("BY", "NAME")
4597            expression = self._parse_select(nested=True, parse_set_operation=False)
4598
4599            this = self.expression(
4600                operation,
4601                comments=comments,
4602                this=this,
4603                distinct=distinct,
4604                by_name=by_name,
4605                expression=expression,
4606            )
4607
4608        if isinstance(this, exp.SetOperation) and self.MODIFIERS_ATTACHED_TO_SET_OP:
4609            expression = this.expression
4610
4611            if expression:
4612                for arg in self.SET_OP_MODIFIERS:
4613                    expr = expression.args.get(arg)
4614                    if expr:
4615                        this.set(arg, expr.pop())
4616
4617        return this
4618
4619    def _parse_expression(self) -> t.Optional[exp.Expression]:
4620        return self._parse_alias(self._parse_assignment())
4621
4622    def _parse_assignment(self) -> t.Optional[exp.Expression]:
4623        this = self._parse_disjunction()
4624        if not this and self._next and self._next.token_type in self.ASSIGNMENT:
4625            # This allows us to parse <non-identifier token> := <expr>
4626            this = exp.column(
4627                t.cast(str, self._advance_any(ignore_reserved=True) and self._prev.text)
4628            )
4629
4630        while self._match_set(self.ASSIGNMENT):
4631            if isinstance(this, exp.Column) and len(this.parts) == 1:
4632                this = this.this
4633
4634            this = self.expression(
4635                self.ASSIGNMENT[self._prev.token_type],
4636                this=this,
4637                comments=self._prev_comments,
4638                expression=self._parse_assignment(),
4639            )
4640
4641        return this
4642
4643    def _parse_disjunction(self) -> t.Optional[exp.Expression]:
4644        return self._parse_tokens(self._parse_conjunction, self.DISJUNCTION)
4645
4646    def _parse_conjunction(self) -> t.Optional[exp.Expression]:
4647        return self._parse_tokens(self._parse_equality, self.CONJUNCTION)
4648
4649    def _parse_equality(self) -> t.Optional[exp.Expression]:
4650        return self._parse_tokens(self._parse_comparison, self.EQUALITY)
4651
4652    def _parse_comparison(self) -> t.Optional[exp.Expression]:
4653        return self._parse_tokens(self._parse_range, self.COMPARISON)
4654
4655    def _parse_range(self, this: t.Optional[exp.Expression] = None) -> t.Optional[exp.Expression]:
4656        this = this or self._parse_bitwise()
4657        negate = self._match(TokenType.NOT)
4658
4659        if self._match_set(self.RANGE_PARSERS):
4660            expression = self.RANGE_PARSERS[self._prev.token_type](self, this)
4661            if not expression:
4662                return this
4663
4664            this = expression
4665        elif self._match(TokenType.ISNULL):
4666            this = self.expression(exp.Is, this=this, expression=exp.Null())
4667
4668        # Postgres supports ISNULL and NOTNULL for conditions.
4669        # https://blog.andreiavram.ro/postgresql-null-composite-type/
4670        if self._match(TokenType.NOTNULL):
4671            this = self.expression(exp.Is, this=this, expression=exp.Null())
4672            this = self.expression(exp.Not, this=this)
4673
4674        if negate:
4675            this = self._negate_range(this)
4676
4677        if self._match(TokenType.IS):
4678            this = self._parse_is(this)
4679
4680        return this
4681
4682    def _negate_range(self, this: t.Optional[exp.Expression] = None) -> t.Optional[exp.Expression]:
4683        if not this:
4684            return this
4685
4686        return self.expression(exp.Not, this=this)
4687
4688    def _parse_is(self, this: t.Optional[exp.Expression]) -> t.Optional[exp.Expression]:
4689        index = self._index - 1
4690        negate = self._match(TokenType.NOT)
4691
4692        if self._match_text_seq("DISTINCT", "FROM"):
4693            klass = exp.NullSafeEQ if negate else exp.NullSafeNEQ
4694            return self.expression(klass, this=this, expression=self._parse_bitwise())
4695
4696        if self._match(TokenType.JSON):
4697            kind = self._match_texts(self.IS_JSON_PREDICATE_KIND) and self._prev.text.upper()
4698
4699            if self._match_text_seq("WITH"):
4700                _with = True
4701            elif self._match_text_seq("WITHOUT"):
4702                _with = False
4703            else:
4704                _with = None
4705
4706            unique = self._match(TokenType.UNIQUE)
4707            self._match_text_seq("KEYS")
4708            expression: t.Optional[exp.Expression] = self.expression(
4709                exp.JSON, **{"this": kind, "with": _with, "unique": unique}
4710            )
4711        else:
4712            expression = self._parse_primary() or self._parse_null()
4713            if not expression:
4714                self._retreat(index)
4715                return None
4716
4717        this = self.expression(exp.Is, this=this, expression=expression)
4718        return self.expression(exp.Not, this=this) if negate else this
4719
4720    def _parse_in(self, this: t.Optional[exp.Expression], alias: bool = False) -> exp.In:
4721        unnest = self._parse_unnest(with_alias=False)
4722        if unnest:
4723            this = self.expression(exp.In, this=this, unnest=unnest)
4724        elif self._match_set((TokenType.L_PAREN, TokenType.L_BRACKET)):
4725            matched_l_paren = self._prev.token_type == TokenType.L_PAREN
4726            expressions = self._parse_csv(lambda: self._parse_select_or_expression(alias=alias))
4727
4728            if len(expressions) == 1 and isinstance(expressions[0], exp.Query):
4729                this = self.expression(exp.In, this=this, query=expressions[0].subquery(copy=False))
4730            else:
4731                this = self.expression(exp.In, this=this, expressions=expressions)
4732
4733            if matched_l_paren:
4734                self._match_r_paren(this)
4735            elif not self._match(TokenType.R_BRACKET, expression=this):
4736                self.raise_error("Expecting ]")
4737        else:
4738            this = self.expression(exp.In, this=this, field=self._parse_column())
4739
4740        return this
4741
4742    def _parse_between(self, this: t.Optional[exp.Expression]) -> exp.Between:
4743        low = self._parse_bitwise()
4744        self._match(TokenType.AND)
4745        high = self._parse_bitwise()
4746        return self.expression(exp.Between, this=this, low=low, high=high)
4747
4748    def _parse_escape(self, this: t.Optional[exp.Expression]) -> t.Optional[exp.Expression]:
4749        if not self._match(TokenType.ESCAPE):
4750            return this
4751        return self.expression(exp.Escape, this=this, expression=self._parse_string())
4752
4753    def _parse_interval(self, match_interval: bool = True) -> t.Optional[exp.Add | exp.Interval]:
4754        index = self._index
4755
4756        if not self._match(TokenType.INTERVAL) and match_interval:
4757            return None
4758
4759        if self._match(TokenType.STRING, advance=False):
4760            this = self._parse_primary()
4761        else:
4762            this = self._parse_term()
4763
4764        if not this or (
4765            isinstance(this, exp.Column)
4766            and not this.table
4767            and not this.this.quoted
4768            and this.name.upper() == "IS"
4769        ):
4770            self._retreat(index)
4771            return None
4772
4773        unit = self._parse_function() or (
4774            not self._match(TokenType.ALIAS, advance=False)
4775            and self._parse_var(any_token=True, upper=True)
4776        )
4777
4778        # Most dialects support, e.g., the form INTERVAL '5' day, thus we try to parse
4779        # each INTERVAL expression into this canonical form so it's easy to transpile
4780        if this and this.is_number:
4781            this = exp.Literal.string(this.to_py())
4782        elif this and this.is_string:
4783            parts = exp.INTERVAL_STRING_RE.findall(this.name)
4784            if parts and unit:
4785                # Unconsume the eagerly-parsed unit, since the real unit was part of the string
4786                unit = None
4787                self._retreat(self._index - 1)
4788
4789            if len(parts) == 1:
4790                this = exp.Literal.string(parts[0][0])
4791                unit = self.expression(exp.Var, this=parts[0][1].upper())
4792        if self.INTERVAL_SPANS and self._match_text_seq("TO"):
4793            unit = self.expression(
4794                exp.IntervalSpan, this=unit, expression=self._parse_var(any_token=True, upper=True)
4795            )
4796
4797        interval = self.expression(exp.Interval, this=this, unit=unit)
4798
4799        index = self._index
4800        self._match(TokenType.PLUS)
4801
4802        # Convert INTERVAL 'val_1' unit_1 [+] ... [+] 'val_n' unit_n into a sum of intervals
4803        if self._match_set((TokenType.STRING, TokenType.NUMBER), advance=False):
4804            return self.expression(
4805                exp.Add, this=interval, expression=self._parse_interval(match_interval=False)
4806            )
4807
4808        self._retreat(index)
4809        return interval
4810
4811    def _parse_bitwise(self) -> t.Optional[exp.Expression]:
4812        this = self._parse_term()
4813
4814        while True:
4815            if self._match_set(self.BITWISE):
4816                this = self.expression(
4817                    self.BITWISE[self._prev.token_type],
4818                    this=this,
4819                    expression=self._parse_term(),
4820                )
4821            elif self.dialect.DPIPE_IS_STRING_CONCAT and self._match(TokenType.DPIPE):
4822                this = self.expression(
4823                    exp.DPipe,
4824                    this=this,
4825                    expression=self._parse_term(),
4826                    safe=not self.dialect.STRICT_STRING_CONCAT,
4827                )
4828            elif self._match(TokenType.DQMARK):
4829                this = self.expression(
4830                    exp.Coalesce, this=this, expressions=ensure_list(self._parse_term())
4831                )
4832            elif self._match_pair(TokenType.LT, TokenType.LT):
4833                this = self.expression(
4834                    exp.BitwiseLeftShift, this=this, expression=self._parse_term()
4835                )
4836            elif self._match_pair(TokenType.GT, TokenType.GT):
4837                this = self.expression(
4838                    exp.BitwiseRightShift, this=this, expression=self._parse_term()
4839                )
4840            else:
4841                break
4842
4843        return this
4844
4845    def _parse_term(self) -> t.Optional[exp.Expression]:
4846        this = self._parse_factor()
4847
4848        while self._match_set(self.TERM):
4849            klass = self.TERM[self._prev.token_type]
4850            comments = self._prev_comments
4851            expression = self._parse_factor()
4852
4853            this = self.expression(klass, this=this, comments=comments, expression=expression)
4854
4855            if isinstance(this, exp.Collate):
4856                expr = this.expression
4857
4858                # Preserve collations such as pg_catalog."default" (Postgres) as columns, otherwise
4859                # fallback to Identifier / Var
4860                if isinstance(expr, exp.Column) and len(expr.parts) == 1:
4861                    ident = expr.this
4862                    if isinstance(ident, exp.Identifier):
4863                        this.set("expression", ident if ident.quoted else exp.var(ident.name))
4864
4865        return this
4866
4867    def _parse_factor(self) -> t.Optional[exp.Expression]:
4868        parse_method = self._parse_exponent if self.EXPONENT else self._parse_unary
4869        this = parse_method()
4870
4871        while self._match_set(self.FACTOR):
4872            klass = self.FACTOR[self._prev.token_type]
4873            comments = self._prev_comments
4874            expression = parse_method()
4875
4876            if not expression and klass is exp.IntDiv and self._prev.text.isalpha():
4877                self._retreat(self._index - 1)
4878                return this
4879
4880            this = self.expression(klass, this=this, comments=comments, expression=expression)
4881
4882            if isinstance(this, exp.Div):
4883                this.args["typed"] = self.dialect.TYPED_DIVISION
4884                this.args["safe"] = self.dialect.SAFE_DIVISION
4885
4886        return this
4887
4888    def _parse_exponent(self) -> t.Optional[exp.Expression]:
4889        return self._parse_tokens(self._parse_unary, self.EXPONENT)
4890
4891    def _parse_unary(self) -> t.Optional[exp.Expression]:
4892        if self._match_set(self.UNARY_PARSERS):
4893            return self.UNARY_PARSERS[self._prev.token_type](self)
4894        return self._parse_at_time_zone(self._parse_type())
4895
4896    def _parse_type(
4897        self, parse_interval: bool = True, fallback_to_identifier: bool = False
4898    ) -> t.Optional[exp.Expression]:
4899        interval = parse_interval and self._parse_interval()
4900        if interval:
4901            return interval
4902
4903        index = self._index
4904        data_type = self._parse_types(check_func=True, allow_identifiers=False)
4905
4906        # parse_types() returns a Cast if we parsed BQ's inline constructor <type>(<values>) e.g.
4907        # STRUCT<a INT, b STRING>(1, 'foo'), which is canonicalized to CAST(<values> AS <type>)
4908        if isinstance(data_type, exp.Cast):
4909            # This constructor can contain ops directly after it, for instance struct unnesting:
4910            # STRUCT<a INT, b STRING>(1, 'foo').* --> CAST(STRUCT(1, 'foo') AS STRUCT<a iNT, b STRING).*
4911            return self._parse_column_ops(data_type)
4912
4913        if data_type:
4914            index2 = self._index
4915            this = self._parse_primary()
4916
4917            if isinstance(this, exp.Literal):
4918                parser = self.TYPE_LITERAL_PARSERS.get(data_type.this)
4919                if parser:
4920                    return parser(self, this, data_type)
4921
4922                return self.expression(exp.Cast, this=this, to=data_type)
4923
4924            # The expressions arg gets set by the parser when we have something like DECIMAL(38, 0)
4925            # in the input SQL. In that case, we'll produce these tokens: DECIMAL ( 38 , 0 )
4926            #
4927            # If the index difference here is greater than 1, that means the parser itself must have
4928            # consumed additional tokens such as the DECIMAL scale and precision in the above example.
4929            #
4930            # If it's not greater than 1, then it must be 1, because we've consumed at least the type
4931            # keyword, meaning that the expressions arg of the DataType must have gotten set by a
4932            # callable in the TYPE_CONVERTERS mapping. For example, Snowflake converts DECIMAL to
4933            # DECIMAL(38, 0)) in order to facilitate the data type's transpilation.
4934            #
4935            # In these cases, we don't really want to return the converted type, but instead retreat
4936            # and try to parse a Column or Identifier in the section below.
4937            if data_type.expressions and index2 - index > 1:
4938                self._retreat(index2)
4939                return self._parse_column_ops(data_type)
4940
4941            self._retreat(index)
4942
4943        if fallback_to_identifier:
4944            return self._parse_id_var()
4945
4946        this = self._parse_column()
4947        return this and self._parse_column_ops(this)
4948
4949    def _parse_type_size(self) -> t.Optional[exp.DataTypeParam]:
4950        this = self._parse_type()
4951        if not this:
4952            return None
4953
4954        if isinstance(this, exp.Column) and not this.table:
4955            this = exp.var(this.name.upper())
4956
4957        return self.expression(
4958            exp.DataTypeParam, this=this, expression=self._parse_var(any_token=True)
4959        )
4960
4961    def _parse_types(
4962        self, check_func: bool = False, schema: bool = False, allow_identifiers: bool = True
4963    ) -> t.Optional[exp.Expression]:
4964        index = self._index
4965
4966        this: t.Optional[exp.Expression] = None
4967        prefix = self._match_text_seq("SYSUDTLIB", ".")
4968
4969        if not self._match_set(self.TYPE_TOKENS):
4970            identifier = allow_identifiers and self._parse_id_var(
4971                any_token=False, tokens=(TokenType.VAR,)
4972            )
4973            if isinstance(identifier, exp.Identifier):
4974                tokens = self.dialect.tokenize(identifier.sql(dialect=self.dialect))
4975
4976                if len(tokens) != 1:
4977                    self.raise_error("Unexpected identifier", self._prev)
4978
4979                if tokens[0].token_type in self.TYPE_TOKENS:
4980                    self._prev = tokens[0]
4981                elif self.dialect.SUPPORTS_USER_DEFINED_TYPES:
4982                    type_name = identifier.name
4983
4984                    while self._match(TokenType.DOT):
4985                        type_name = f"{type_name}.{self._advance_any() and self._prev.text}"
4986
4987                    this = exp.DataType.build(type_name, udt=True)
4988                else:
4989                    self._retreat(self._index - 1)
4990                    return None
4991            else:
4992                return None
4993
4994        type_token = self._prev.token_type
4995
4996        if type_token == TokenType.PSEUDO_TYPE:
4997            return self.expression(exp.PseudoType, this=self._prev.text.upper())
4998
4999        if type_token == TokenType.OBJECT_IDENTIFIER:
5000            return self.expression(exp.ObjectIdentifier, this=self._prev.text.upper())
5001
5002        # https://materialize.com/docs/sql/types/map/
5003        if type_token == TokenType.MAP and self._match(TokenType.L_BRACKET):
5004            key_type = self._parse_types(
5005                check_func=check_func, schema=schema, allow_identifiers=allow_identifiers
5006            )
5007            if not self._match(TokenType.FARROW):
5008                self._retreat(index)
5009                return None
5010
5011            value_type = self._parse_types(
5012                check_func=check_func, schema=schema, allow_identifiers=allow_identifiers
5013            )
5014            if not self._match(TokenType.R_BRACKET):
5015                self._retreat(index)
5016                return None
5017
5018            return exp.DataType(
5019                this=exp.DataType.Type.MAP,
5020                expressions=[key_type, value_type],
5021                nested=True,
5022                prefix=prefix,
5023            )
5024
5025        nested = type_token in self.NESTED_TYPE_TOKENS
5026        is_struct = type_token in self.STRUCT_TYPE_TOKENS
5027        is_aggregate = type_token in self.AGGREGATE_TYPE_TOKENS
5028        expressions = None
5029        maybe_func = False
5030
5031        if self._match(TokenType.L_PAREN):
5032            if is_struct:
5033                expressions = self._parse_csv(lambda: self._parse_struct_types(type_required=True))
5034            elif nested:
5035                expressions = self._parse_csv(
5036                    lambda: self._parse_types(
5037                        check_func=check_func, schema=schema, allow_identifiers=allow_identifiers
5038                    )
5039                )
5040                if type_token == TokenType.NULLABLE and len(expressions) == 1:
5041                    this = expressions[0]
5042                    this.set("nullable", True)
5043                    self._match_r_paren()
5044                    return this
5045            elif type_token in self.ENUM_TYPE_TOKENS:
5046                expressions = self._parse_csv(self._parse_equality)
5047            elif is_aggregate:
5048                func_or_ident = self._parse_function(anonymous=True) or self._parse_id_var(
5049                    any_token=False, tokens=(TokenType.VAR, TokenType.ANY)
5050                )
5051                if not func_or_ident or not self._match(TokenType.COMMA):
5052                    return None
5053                expressions = self._parse_csv(
5054                    lambda: self._parse_types(
5055                        check_func=check_func, schema=schema, allow_identifiers=allow_identifiers
5056                    )
5057                )
5058                expressions.insert(0, func_or_ident)
5059            else:
5060                expressions = self._parse_csv(self._parse_type_size)
5061
5062                # https://docs.snowflake.com/en/sql-reference/data-types-vector
5063                if type_token == TokenType.VECTOR and len(expressions) == 2:
5064                    expressions[0] = exp.DataType.build(expressions[0].name, dialect=self.dialect)
5065
5066            if not expressions or not self._match(TokenType.R_PAREN):
5067                self._retreat(index)
5068                return None
5069
5070            maybe_func = True
5071
5072        values: t.Optional[t.List[exp.Expression]] = None
5073
5074        if nested and self._match(TokenType.LT):
5075            if is_struct:
5076                expressions = self._parse_csv(lambda: self._parse_struct_types(type_required=True))
5077            else:
5078                expressions = self._parse_csv(
5079                    lambda: self._parse_types(
5080                        check_func=check_func, schema=schema, allow_identifiers=allow_identifiers
5081                    )
5082                )
5083
5084            if not self._match(TokenType.GT):
5085                self.raise_error("Expecting >")
5086
5087            if self._match_set((TokenType.L_BRACKET, TokenType.L_PAREN)):
5088                values = self._parse_csv(self._parse_assignment)
5089                if not values and is_struct:
5090                    values = None
5091                    self._retreat(self._index - 1)
5092                else:
5093                    self._match_set((TokenType.R_BRACKET, TokenType.R_PAREN))
5094
5095        if type_token in self.TIMESTAMPS:
5096            if self._match_text_seq("WITH", "TIME", "ZONE"):
5097                maybe_func = False
5098                tz_type = (
5099                    exp.DataType.Type.TIMETZ
5100                    if type_token in self.TIMES
5101                    else exp.DataType.Type.TIMESTAMPTZ
5102                )
5103                this = exp.DataType(this=tz_type, expressions=expressions)
5104            elif self._match_text_seq("WITH", "LOCAL", "TIME", "ZONE"):
5105                maybe_func = False
5106                this = exp.DataType(this=exp.DataType.Type.TIMESTAMPLTZ, expressions=expressions)
5107            elif self._match_text_seq("WITHOUT", "TIME", "ZONE"):
5108                maybe_func = False
5109        elif type_token == TokenType.INTERVAL:
5110            unit = self._parse_var(upper=True)
5111            if unit:
5112                if self._match_text_seq("TO"):
5113                    unit = exp.IntervalSpan(this=unit, expression=self._parse_var(upper=True))
5114
5115                this = self.expression(exp.DataType, this=self.expression(exp.Interval, unit=unit))
5116            else:
5117                this = self.expression(exp.DataType, this=exp.DataType.Type.INTERVAL)
5118
5119        if maybe_func and check_func:
5120            index2 = self._index
5121            peek = self._parse_string()
5122
5123            if not peek:
5124                self._retreat(index)
5125                return None
5126
5127            self._retreat(index2)
5128
5129        if not this:
5130            if self._match_text_seq("UNSIGNED"):
5131                unsigned_type_token = self.SIGNED_TO_UNSIGNED_TYPE_TOKEN.get(type_token)
5132                if not unsigned_type_token:
5133                    self.raise_error(f"Cannot convert {type_token.value} to unsigned.")
5134
5135                type_token = unsigned_type_token or type_token
5136
5137            this = exp.DataType(
5138                this=exp.DataType.Type[type_token.value],
5139                expressions=expressions,
5140                nested=nested,
5141                prefix=prefix,
5142            )
5143
5144            # Empty arrays/structs are allowed
5145            if values is not None:
5146                cls = exp.Struct if is_struct else exp.Array
5147                this = exp.cast(cls(expressions=values), this, copy=False)
5148
5149        elif expressions:
5150            this.set("expressions", expressions)
5151
5152        # https://materialize.com/docs/sql/types/list/#type-name
5153        while self._match(TokenType.LIST):
5154            this = exp.DataType(this=exp.DataType.Type.LIST, expressions=[this], nested=True)
5155
5156        index = self._index
5157
5158        # Postgres supports the INT ARRAY[3] syntax as a synonym for INT[3]
5159        matched_array = self._match(TokenType.ARRAY)
5160
5161        while self._curr:
5162            datatype_token = self._prev.token_type
5163            matched_l_bracket = self._match(TokenType.L_BRACKET)
5164
5165            if (not matched_l_bracket and not matched_array) or (
5166                datatype_token == TokenType.ARRAY and self._match(TokenType.R_BRACKET)
5167            ):
5168                # Postgres allows casting empty arrays such as ARRAY[]::INT[],
5169                # not to be confused with the fixed size array parsing
5170                break
5171
5172            matched_array = False
5173            values = self._parse_csv(self._parse_assignment) or None
5174            if (
5175                values
5176                and not schema
5177                and (
5178                    not self.dialect.SUPPORTS_FIXED_SIZE_ARRAYS or datatype_token == TokenType.ARRAY
5179                )
5180            ):
5181                # Retreating here means that we should not parse the following values as part of the data type, e.g. in DuckDB
5182                # ARRAY[1] should retreat and instead be parsed into exp.Array in contrast to INT[x][y] which denotes a fixed-size array data type
5183                self._retreat(index)
5184                break
5185
5186            this = exp.DataType(
5187                this=exp.DataType.Type.ARRAY, expressions=[this], values=values, nested=True
5188            )
5189            self._match(TokenType.R_BRACKET)
5190
5191        if self.TYPE_CONVERTERS and isinstance(this.this, exp.DataType.Type):
5192            converter = self.TYPE_CONVERTERS.get(this.this)
5193            if converter:
5194                this = converter(t.cast(exp.DataType, this))
5195
5196        return this
5197
5198    def _parse_struct_types(self, type_required: bool = False) -> t.Optional[exp.Expression]:
5199        index = self._index
5200
5201        if (
5202            self._curr
5203            and self._next
5204            and self._curr.token_type in self.TYPE_TOKENS
5205            and self._next.token_type in self.TYPE_TOKENS
5206        ):
5207            # Takes care of special cases like `STRUCT<list ARRAY<...>>` where the identifier is also a
5208            # type token. Without this, the list will be parsed as a type and we'll eventually crash
5209            this = self._parse_id_var()
5210        else:
5211            this = (
5212                self._parse_type(parse_interval=False, fallback_to_identifier=True)
5213                or self._parse_id_var()
5214            )
5215
5216        self._match(TokenType.COLON)
5217
5218        if (
5219            type_required
5220            and not isinstance(this, exp.DataType)
5221            and not self._match_set(self.TYPE_TOKENS, advance=False)
5222        ):
5223            self._retreat(index)
5224            return self._parse_types()
5225
5226        return self._parse_column_def(this)
5227
5228    def _parse_at_time_zone(self, this: t.Optional[exp.Expression]) -> t.Optional[exp.Expression]:
5229        if not self._match_text_seq("AT", "TIME", "ZONE"):
5230            return this
5231        return self.expression(exp.AtTimeZone, this=this, zone=self._parse_unary())
5232
5233    def _parse_column(self) -> t.Optional[exp.Expression]:
5234        this = self._parse_column_reference()
5235        column = self._parse_column_ops(this) if this else self._parse_bracket(this)
5236
5237        if self.dialect.SUPPORTS_COLUMN_JOIN_MARKS and column:
5238            column.set("join_mark", self._match(TokenType.JOIN_MARKER))
5239
5240        return column
5241
5242    def _parse_column_reference(self) -> t.Optional[exp.Expression]:
5243        this = self._parse_field()
5244        if (
5245            not this
5246            and self._match(TokenType.VALUES, advance=False)
5247            and self.VALUES_FOLLOWED_BY_PAREN
5248            and (not self._next or self._next.token_type != TokenType.L_PAREN)
5249        ):
5250            this = self._parse_id_var()
5251
5252        if isinstance(this, exp.Identifier):
5253            # We bubble up comments from the Identifier to the Column
5254            this = self.expression(exp.Column, comments=this.pop_comments(), this=this)
5255
5256        return this
5257
5258    def _parse_colon_as_variant_extract(
5259        self, this: t.Optional[exp.Expression]
5260    ) -> t.Optional[exp.Expression]:
5261        casts = []
5262        json_path = []
5263        escape = None
5264
5265        while self._match(TokenType.COLON):
5266            start_index = self._index
5267
5268            # Snowflake allows reserved keywords as json keys but advance_any() excludes TokenType.SELECT from any_tokens=True
5269            path = self._parse_column_ops(
5270                self._parse_field(any_token=True, tokens=(TokenType.SELECT,))
5271            )
5272
5273            # The cast :: operator has a lower precedence than the extraction operator :, so
5274            # we rearrange the AST appropriately to avoid casting the JSON path
5275            while isinstance(path, exp.Cast):
5276                casts.append(path.to)
5277                path = path.this
5278
5279            if casts:
5280                dcolon_offset = next(
5281                    i
5282                    for i, t in enumerate(self._tokens[start_index:])
5283                    if t.token_type == TokenType.DCOLON
5284                )
5285                end_token = self._tokens[start_index + dcolon_offset - 1]
5286            else:
5287                end_token = self._prev
5288
5289            if path:
5290                # Escape single quotes from Snowflake's colon extraction (e.g. col:"a'b") as
5291                # it'll roundtrip to a string literal in GET_PATH
5292                if isinstance(path, exp.Identifier) and path.quoted:
5293                    escape = True
5294
5295                json_path.append(self._find_sql(self._tokens[start_index], end_token))
5296
5297        # The VARIANT extract in Snowflake/Databricks is parsed as a JSONExtract; Snowflake uses the json_path in GET_PATH() while
5298        # Databricks transforms it back to the colon/dot notation
5299        if json_path:
5300            json_path_expr = self.dialect.to_json_path(exp.Literal.string(".".join(json_path)))
5301
5302            if json_path_expr:
5303                json_path_expr.set("escape", escape)
5304
5305            this = self.expression(
5306                exp.JSONExtract,
5307                this=this,
5308                expression=json_path_expr,
5309                variant_extract=True,
5310            )
5311
5312            while casts:
5313                this = self.expression(exp.Cast, this=this, to=casts.pop())
5314
5315        return this
5316
5317    def _parse_dcolon(self) -> t.Optional[exp.Expression]:
5318        return self._parse_types()
5319
5320    def _parse_column_ops(self, this: t.Optional[exp.Expression]) -> t.Optional[exp.Expression]:
5321        this = self._parse_bracket(this)
5322
5323        while self._match_set(self.COLUMN_OPERATORS):
5324            op_token = self._prev.token_type
5325            op = self.COLUMN_OPERATORS.get(op_token)
5326
5327            if op_token in (TokenType.DCOLON, TokenType.DOTCOLON):
5328                field = self._parse_dcolon()
5329                if not field:
5330                    self.raise_error("Expected type")
5331            elif op and self._curr:
5332                field = self._parse_column_reference() or self._parse_bracket()
5333            else:
5334                field = self._parse_field(any_token=True, anonymous_func=True)
5335
5336            if isinstance(field, (exp.Func, exp.Window)) and this:
5337                # BQ & snowflake allow function calls like x.y.count(...), SAFE.SUBSTR(...) etc
5338                # https://cloud.google.com/bigquery/docs/reference/standard-sql/functions-reference#function_call_rules
5339                this = exp.replace_tree(
5340                    this,
5341                    lambda n: (
5342                        self.expression(exp.Dot, this=n.args.get("table"), expression=n.this)
5343                        if n.table
5344                        else n.this
5345                    )
5346                    if isinstance(n, exp.Column)
5347                    else n,
5348                )
5349
5350            if op:
5351                this = op(self, this, field)
5352            elif isinstance(this, exp.Column) and not this.args.get("catalog"):
5353                this = self.expression(
5354                    exp.Column,
5355                    comments=this.comments,
5356                    this=field,
5357                    table=this.this,
5358                    db=this.args.get("table"),
5359                    catalog=this.args.get("db"),
5360                )
5361            elif isinstance(field, exp.Window):
5362                # Move the exp.Dot's to the window's function
5363                window_func = self.expression(exp.Dot, this=this, expression=field.this)
5364                field.set("this", window_func)
5365                this = field
5366            else:
5367                this = self.expression(exp.Dot, this=this, expression=field)
5368
5369            if field and field.comments:
5370                t.cast(exp.Expression, this).add_comments(field.pop_comments())
5371
5372            this = self._parse_bracket(this)
5373
5374        return self._parse_colon_as_variant_extract(this) if self.COLON_IS_VARIANT_EXTRACT else this
5375
5376    def _parse_primary(self) -> t.Optional[exp.Expression]:
5377        if self._match_set(self.PRIMARY_PARSERS):
5378            token_type = self._prev.token_type
5379            primary = self.PRIMARY_PARSERS[token_type](self, self._prev)
5380
5381            if token_type == TokenType.STRING:
5382                expressions = [primary]
5383                while self._match(TokenType.STRING):
5384                    expressions.append(exp.Literal.string(self._prev.text))
5385
5386                if len(expressions) > 1:
5387                    return self.expression(exp.Concat, expressions=expressions)
5388
5389            return primary
5390
5391        if self._match_pair(TokenType.DOT, TokenType.NUMBER):
5392            return exp.Literal.number(f"0.{self._prev.text}")
5393
5394        if self._match(TokenType.L_PAREN):
5395            comments = self._prev_comments
5396            query = self._parse_select()
5397
5398            if query:
5399                expressions = [query]
5400            else:
5401                expressions = self._parse_expressions()
5402
5403            this = self._parse_query_modifiers(seq_get(expressions, 0))
5404
5405            if not this and self._match(TokenType.R_PAREN, advance=False):
5406                this = self.expression(exp.Tuple)
5407            elif isinstance(this, exp.UNWRAPPED_QUERIES):
5408                this = self._parse_subquery(this=this, parse_alias=False)
5409            elif isinstance(this, exp.Subquery):
5410                this = self._parse_subquery(
5411                    this=self._parse_set_operations(this), parse_alias=False
5412                )
5413            elif len(expressions) > 1 or self._prev.token_type == TokenType.COMMA:
5414                this = self.expression(exp.Tuple, expressions=expressions)
5415            else:
5416                this = self.expression(exp.Paren, this=this)
5417
5418            if this:
5419                this.add_comments(comments)
5420
5421            self._match_r_paren(expression=this)
5422            return this
5423
5424        return None
5425
5426    def _parse_field(
5427        self,
5428        any_token: bool = False,
5429        tokens: t.Optional[t.Collection[TokenType]] = None,
5430        anonymous_func: bool = False,
5431    ) -> t.Optional[exp.Expression]:
5432        if anonymous_func:
5433            field = (
5434                self._parse_function(anonymous=anonymous_func, any_token=any_token)
5435                or self._parse_primary()
5436            )
5437        else:
5438            field = self._parse_primary() or self._parse_function(
5439                anonymous=anonymous_func, any_token=any_token
5440            )
5441        return field or self._parse_id_var(any_token=any_token, tokens=tokens)
5442
5443    def _parse_function(
5444        self,
5445        functions: t.Optional[t.Dict[str, t.Callable]] = None,
5446        anonymous: bool = False,
5447        optional_parens: bool = True,
5448        any_token: bool = False,
5449    ) -> t.Optional[exp.Expression]:
5450        # This allows us to also parse {fn <function>} syntax (Snowflake, MySQL support this)
5451        # See: https://community.snowflake.com/s/article/SQL-Escape-Sequences
5452        fn_syntax = False
5453        if (
5454            self._match(TokenType.L_BRACE, advance=False)
5455            and self._next
5456            and self._next.text.upper() == "FN"
5457        ):
5458            self._advance(2)
5459            fn_syntax = True
5460
5461        func = self._parse_function_call(
5462            functions=functions,
5463            anonymous=anonymous,
5464            optional_parens=optional_parens,
5465            any_token=any_token,
5466        )
5467
5468        if fn_syntax:
5469            self._match(TokenType.R_BRACE)
5470
5471        return func
5472
5473    def _parse_function_call(
5474        self,
5475        functions: t.Optional[t.Dict[str, t.Callable]] = None,
5476        anonymous: bool = False,
5477        optional_parens: bool = True,
5478        any_token: bool = False,
5479    ) -> t.Optional[exp.Expression]:
5480        if not self._curr:
5481            return None
5482
5483        comments = self._curr.comments
5484        token_type = self._curr.token_type
5485        this = self._curr.text
5486        upper = this.upper()
5487
5488        parser = self.NO_PAREN_FUNCTION_PARSERS.get(upper)
5489        if optional_parens and parser and token_type not in self.INVALID_FUNC_NAME_TOKENS:
5490            self._advance()
5491            return self._parse_window(parser(self))
5492
5493        if not self._next or self._next.token_type != TokenType.L_PAREN:
5494            if optional_parens and token_type in self.NO_PAREN_FUNCTIONS:
5495                self._advance()
5496                return self.expression(self.NO_PAREN_FUNCTIONS[token_type])
5497
5498            return None
5499
5500        if any_token:
5501            if token_type in self.RESERVED_TOKENS:
5502                return None
5503        elif token_type not in self.FUNC_TOKENS:
5504            return None
5505
5506        self._advance(2)
5507
5508        parser = self.FUNCTION_PARSERS.get(upper)
5509        if parser and not anonymous:
5510            this = parser(self)
5511        else:
5512            subquery_predicate = self.SUBQUERY_PREDICATES.get(token_type)
5513
5514            if subquery_predicate and self._curr.token_type in (TokenType.SELECT, TokenType.WITH):
5515                this = self.expression(
5516                    subquery_predicate, comments=comments, this=self._parse_select()
5517                )
5518                self._match_r_paren()
5519                return this
5520
5521            if functions is None:
5522                functions = self.FUNCTIONS
5523
5524            function = functions.get(upper)
5525            known_function = function and not anonymous
5526
5527            alias = not known_function or upper in self.FUNCTIONS_WITH_ALIASED_ARGS
5528            args = self._parse_csv(lambda: self._parse_lambda(alias=alias))
5529
5530            post_func_comments = self._curr and self._curr.comments
5531            if known_function and post_func_comments:
5532                # If the user-inputted comment "/* sqlglot.anonymous */" is following the function
5533                # call we'll construct it as exp.Anonymous, even if it's "known"
5534                if any(
5535                    comment.lstrip().startswith(exp.SQLGLOT_ANONYMOUS)
5536                    for comment in post_func_comments
5537                ):
5538                    known_function = False
5539
5540            if alias and known_function:
5541                args = self._kv_to_prop_eq(args)
5542
5543            if known_function:
5544                func_builder = t.cast(t.Callable, function)
5545
5546                if "dialect" in func_builder.__code__.co_varnames:
5547                    func = func_builder(args, dialect=self.dialect)
5548                else:
5549                    func = func_builder(args)
5550
5551                func = self.validate_expression(func, args)
5552                if self.dialect.PRESERVE_ORIGINAL_NAMES:
5553                    func.meta["name"] = this
5554
5555                this = func
5556            else:
5557                if token_type == TokenType.IDENTIFIER:
5558                    this = exp.Identifier(this=this, quoted=True)
5559                this = self.expression(exp.Anonymous, this=this, expressions=args)
5560
5561        if isinstance(this, exp.Expression):
5562            this.add_comments(comments)
5563
5564        self._match_r_paren(this)
5565        return self._parse_window(this)
5566
5567    def _to_prop_eq(self, expression: exp.Expression, index: int) -> exp.Expression:
5568        return expression
5569
5570    def _kv_to_prop_eq(self, expressions: t.List[exp.Expression]) -> t.List[exp.Expression]:
5571        transformed = []
5572
5573        for index, e in enumerate(expressions):
5574            if isinstance(e, self.KEY_VALUE_DEFINITIONS):
5575                if isinstance(e, exp.Alias):
5576                    e = self.expression(exp.PropertyEQ, this=e.args.get("alias"), expression=e.this)
5577
5578                if not isinstance(e, exp.PropertyEQ):
5579                    e = self.expression(
5580                        exp.PropertyEQ, this=exp.to_identifier(e.this.name), expression=e.expression
5581                    )
5582
5583                if isinstance(e.this, exp.Column):
5584                    e.this.replace(e.this.this)
5585            else:
5586                e = self._to_prop_eq(e, index)
5587
5588            transformed.append(e)
5589
5590        return transformed
5591
5592    def _parse_user_defined_function_expression(self) -> t.Optional[exp.Expression]:
5593        return self._parse_statement()
5594
5595    def _parse_function_parameter(self) -> t.Optional[exp.Expression]:
5596        return self._parse_column_def(this=self._parse_id_var(), computed_column=False)
5597
5598    def _parse_user_defined_function(
5599        self, kind: t.Optional[TokenType] = None
5600    ) -> t.Optional[exp.Expression]:
5601        this = self._parse_id_var()
5602
5603        while self._match(TokenType.DOT):
5604            this = self.expression(exp.Dot, this=this, expression=self._parse_id_var())
5605
5606        if not self._match(TokenType.L_PAREN):
5607            return this
5608
5609        expressions = self._parse_csv(self._parse_function_parameter)
5610        self._match_r_paren()
5611        return self.expression(
5612            exp.UserDefinedFunction, this=this, expressions=expressions, wrapped=True
5613        )
5614
5615    def _parse_introducer(self, token: Token) -> exp.Introducer | exp.Identifier:
5616        literal = self._parse_primary()
5617        if literal:
5618            return self.expression(exp.Introducer, this=token.text, expression=literal)
5619
5620        return self.expression(exp.Identifier, this=token.text)
5621
5622    def _parse_session_parameter(self) -> exp.SessionParameter:
5623        kind = None
5624        this = self._parse_id_var() or self._parse_primary()
5625
5626        if this and self._match(TokenType.DOT):
5627            kind = this.name
5628            this = self._parse_var() or self._parse_primary()
5629
5630        return self.expression(exp.SessionParameter, this=this, kind=kind)
5631
5632    def _parse_lambda_arg(self) -> t.Optional[exp.Expression]:
5633        return self._parse_id_var()
5634
5635    def _parse_lambda(self, alias: bool = False) -> t.Optional[exp.Expression]:
5636        index = self._index
5637
5638        if self._match(TokenType.L_PAREN):
5639            expressions = t.cast(
5640                t.List[t.Optional[exp.Expression]], self._parse_csv(self._parse_lambda_arg)
5641            )
5642
5643            if not self._match(TokenType.R_PAREN):
5644                self._retreat(index)
5645        else:
5646            expressions = [self._parse_lambda_arg()]
5647
5648        if self._match_set(self.LAMBDAS):
5649            return self.LAMBDAS[self._prev.token_type](self, expressions)
5650
5651        self._retreat(index)
5652
5653        this: t.Optional[exp.Expression]
5654
5655        if self._match(TokenType.DISTINCT):
5656            this = self.expression(
5657                exp.Distinct, expressions=self._parse_csv(self._parse_assignment)
5658            )
5659        else:
5660            this = self._parse_select_or_expression(alias=alias)
5661
5662        return self._parse_limit(
5663            self._parse_order(self._parse_having_max(self._parse_respect_or_ignore_nulls(this)))
5664        )
5665
5666    def _parse_schema(self, this: t.Optional[exp.Expression] = None) -> t.Optional[exp.Expression]:
5667        index = self._index
5668        if not self._match(TokenType.L_PAREN):
5669            return this
5670
5671        # Disambiguate between schema and subquery/CTE, e.g. in INSERT INTO table (<expr>),
5672        # expr can be of both types
5673        if self._match_set(self.SELECT_START_TOKENS):
5674            self._retreat(index)
5675            return this
5676        args = self._parse_csv(lambda: self._parse_constraint() or self._parse_field_def())
5677        self._match_r_paren()
5678        return self.expression(exp.Schema, this=this, expressions=args)
5679
5680    def _parse_field_def(self) -> t.Optional[exp.Expression]:
5681        return self._parse_column_def(self._parse_field(any_token=True))
5682
5683    def _parse_column_def(
5684        self, this: t.Optional[exp.Expression], computed_column: bool = True
5685    ) -> t.Optional[exp.Expression]:
5686        # column defs are not really columns, they're identifiers
5687        if isinstance(this, exp.Column):
5688            this = this.this
5689
5690        if not computed_column:
5691            self._match(TokenType.ALIAS)
5692
5693        kind = self._parse_types(schema=True)
5694
5695        if self._match_text_seq("FOR", "ORDINALITY"):
5696            return self.expression(exp.ColumnDef, this=this, ordinality=True)
5697
5698        constraints: t.List[exp.Expression] = []
5699
5700        if (not kind and self._match(TokenType.ALIAS)) or self._match_texts(
5701            ("ALIAS", "MATERIALIZED")
5702        ):
5703            persisted = self._prev.text.upper() == "MATERIALIZED"
5704            constraint_kind = exp.ComputedColumnConstraint(
5705                this=self._parse_assignment(),
5706                persisted=persisted or self._match_text_seq("PERSISTED"),
5707                not_null=self._match_pair(TokenType.NOT, TokenType.NULL),
5708            )
5709            constraints.append(self.expression(exp.ColumnConstraint, kind=constraint_kind))
5710        elif (
5711            kind
5712            and self._match(TokenType.ALIAS, advance=False)
5713            and (
5714                not self.WRAPPED_TRANSFORM_COLUMN_CONSTRAINT
5715                or (self._next and self._next.token_type == TokenType.L_PAREN)
5716            )
5717        ):
5718            self._advance()
5719            constraints.append(
5720                self.expression(
5721                    exp.ColumnConstraint,
5722                    kind=exp.TransformColumnConstraint(this=self._parse_disjunction()),
5723                )
5724            )
5725
5726        while True:
5727            constraint = self._parse_column_constraint()
5728            if not constraint:
5729                break
5730            constraints.append(constraint)
5731
5732        if not kind and not constraints:
5733            return this
5734
5735        return self.expression(exp.ColumnDef, this=this, kind=kind, constraints=constraints)
5736
5737    def _parse_auto_increment(
5738        self,
5739    ) -> exp.GeneratedAsIdentityColumnConstraint | exp.AutoIncrementColumnConstraint:
5740        start = None
5741        increment = None
5742
5743        if self._match(TokenType.L_PAREN, advance=False):
5744            args = self._parse_wrapped_csv(self._parse_bitwise)
5745            start = seq_get(args, 0)
5746            increment = seq_get(args, 1)
5747        elif self._match_text_seq("START"):
5748            start = self._parse_bitwise()
5749            self._match_text_seq("INCREMENT")
5750            increment = self._parse_bitwise()
5751
5752        if start and increment:
5753            return exp.GeneratedAsIdentityColumnConstraint(
5754                start=start, increment=increment, this=False
5755            )
5756
5757        return exp.AutoIncrementColumnConstraint()
5758
5759    def _parse_auto_property(self) -> t.Optional[exp.AutoRefreshProperty]:
5760        if not self._match_text_seq("REFRESH"):
5761            self._retreat(self._index - 1)
5762            return None
5763        return self.expression(exp.AutoRefreshProperty, this=self._parse_var(upper=True))
5764
5765    def _parse_compress(self) -> exp.CompressColumnConstraint:
5766        if self._match(TokenType.L_PAREN, advance=False):
5767            return self.expression(
5768                exp.CompressColumnConstraint, this=self._parse_wrapped_csv(self._parse_bitwise)
5769            )
5770
5771        return self.expression(exp.CompressColumnConstraint, this=self._parse_bitwise())
5772
5773    def _parse_generated_as_identity(
5774        self,
5775    ) -> (
5776        exp.GeneratedAsIdentityColumnConstraint
5777        | exp.ComputedColumnConstraint
5778        | exp.GeneratedAsRowColumnConstraint
5779    ):
5780        if self._match_text_seq("BY", "DEFAULT"):
5781            on_null = self._match_pair(TokenType.ON, TokenType.NULL)
5782            this = self.expression(
5783                exp.GeneratedAsIdentityColumnConstraint, this=False, on_null=on_null
5784            )
5785        else:
5786            self._match_text_seq("ALWAYS")
5787            this = self.expression(exp.GeneratedAsIdentityColumnConstraint, this=True)
5788
5789        self._match(TokenType.ALIAS)
5790
5791        if self._match_text_seq("ROW"):
5792            start = self._match_text_seq("START")
5793            if not start:
5794                self._match(TokenType.END)
5795            hidden = self._match_text_seq("HIDDEN")
5796            return self.expression(exp.GeneratedAsRowColumnConstraint, start=start, hidden=hidden)
5797
5798        identity = self._match_text_seq("IDENTITY")
5799
5800        if self._match(TokenType.L_PAREN):
5801            if self._match(TokenType.START_WITH):
5802                this.set("start", self._parse_bitwise())
5803            if self._match_text_seq("INCREMENT", "BY"):
5804                this.set("increment", self._parse_bitwise())
5805            if self._match_text_seq("MINVALUE"):
5806                this.set("minvalue", self._parse_bitwise())
5807            if self._match_text_seq("MAXVALUE"):
5808                this.set("maxvalue", self._parse_bitwise())
5809
5810            if self._match_text_seq("CYCLE"):
5811                this.set("cycle", True)
5812            elif self._match_text_seq("NO", "CYCLE"):
5813                this.set("cycle", False)
5814
5815            if not identity:
5816                this.set("expression", self._parse_range())
5817            elif not this.args.get("start") and self._match(TokenType.NUMBER, advance=False):
5818                args = self._parse_csv(self._parse_bitwise)
5819                this.set("start", seq_get(args, 0))
5820                this.set("increment", seq_get(args, 1))
5821
5822            self._match_r_paren()
5823
5824        return this
5825
5826    def _parse_inline(self) -> exp.InlineLengthColumnConstraint:
5827        self._match_text_seq("LENGTH")
5828        return self.expression(exp.InlineLengthColumnConstraint, this=self._parse_bitwise())
5829
5830    def _parse_not_constraint(self) -> t.Optional[exp.Expression]:
5831        if self._match_text_seq("NULL"):
5832            return self.expression(exp.NotNullColumnConstraint)
5833        if self._match_text_seq("CASESPECIFIC"):
5834            return self.expression(exp.CaseSpecificColumnConstraint, not_=True)
5835        if self._match_text_seq("FOR", "REPLICATION"):
5836            return self.expression(exp.NotForReplicationColumnConstraint)
5837
5838        # Unconsume the `NOT` token
5839        self._retreat(self._index - 1)
5840        return None
5841
5842    def _parse_column_constraint(self) -> t.Optional[exp.Expression]:
5843        this = self._match(TokenType.CONSTRAINT) and self._parse_id_var()
5844
5845        procedure_option_follows = (
5846            self._match(TokenType.WITH, advance=False)
5847            and self._next
5848            and self._next.text.upper() in self.PROCEDURE_OPTIONS
5849        )
5850
5851        if not procedure_option_follows and self._match_texts(self.CONSTRAINT_PARSERS):
5852            return self.expression(
5853                exp.ColumnConstraint,
5854                this=this,
5855                kind=self.CONSTRAINT_PARSERS[self._prev.text.upper()](self),
5856            )
5857
5858        return this
5859
5860    def _parse_constraint(self) -> t.Optional[exp.Expression]:
5861        if not self._match(TokenType.CONSTRAINT):
5862            return self._parse_unnamed_constraint(constraints=self.SCHEMA_UNNAMED_CONSTRAINTS)
5863
5864        return self.expression(
5865            exp.Constraint,
5866            this=self._parse_id_var(),
5867            expressions=self._parse_unnamed_constraints(),
5868        )
5869
5870    def _parse_unnamed_constraints(self) -> t.List[exp.Expression]:
5871        constraints = []
5872        while True:
5873            constraint = self._parse_unnamed_constraint() or self._parse_function()
5874            if not constraint:
5875                break
5876            constraints.append(constraint)
5877
5878        return constraints
5879
5880    def _parse_unnamed_constraint(
5881        self, constraints: t.Optional[t.Collection[str]] = None
5882    ) -> t.Optional[exp.Expression]:
5883        if self._match(TokenType.IDENTIFIER, advance=False) or not self._match_texts(
5884            constraints or self.CONSTRAINT_PARSERS
5885        ):
5886            return None
5887
5888        constraint = self._prev.text.upper()
5889        if constraint not in self.CONSTRAINT_PARSERS:
5890            self.raise_error(f"No parser found for schema constraint {constraint}.")
5891
5892        return self.CONSTRAINT_PARSERS[constraint](self)
5893
5894    def _parse_unique_key(self) -> t.Optional[exp.Expression]:
5895        return self._parse_id_var(any_token=False)
5896
5897    def _parse_unique(self) -> exp.UniqueColumnConstraint:
5898        self._match_text_seq("KEY")
5899        return self.expression(
5900            exp.UniqueColumnConstraint,
5901            nulls=self._match_text_seq("NULLS", "NOT", "DISTINCT"),
5902            this=self._parse_schema(self._parse_unique_key()),
5903            index_type=self._match(TokenType.USING) and self._advance_any() and self._prev.text,
5904            on_conflict=self._parse_on_conflict(),
5905        )
5906
5907    def _parse_key_constraint_options(self) -> t.List[str]:
5908        options = []
5909        while True:
5910            if not self._curr:
5911                break
5912
5913            if self._match(TokenType.ON):
5914                action = None
5915                on = self._advance_any() and self._prev.text
5916
5917                if self._match_text_seq("NO", "ACTION"):
5918                    action = "NO ACTION"
5919                elif self._match_text_seq("CASCADE"):
5920                    action = "CASCADE"
5921                elif self._match_text_seq("RESTRICT"):
5922                    action = "RESTRICT"
5923                elif self._match_pair(TokenType.SET, TokenType.NULL):
5924                    action = "SET NULL"
5925                elif self._match_pair(TokenType.SET, TokenType.DEFAULT):
5926                    action = "SET DEFAULT"
5927                else:
5928                    self.raise_error("Invalid key constraint")
5929
5930                options.append(f"ON {on} {action}")
5931            else:
5932                var = self._parse_var_from_options(
5933                    self.KEY_CONSTRAINT_OPTIONS, raise_unmatched=False
5934                )
5935                if not var:
5936                    break
5937                options.append(var.name)
5938
5939        return options
5940
5941    def _parse_references(self, match: bool = True) -> t.Optional[exp.Reference]:
5942        if match and not self._match(TokenType.REFERENCES):
5943            return None
5944
5945        expressions = None
5946        this = self._parse_table(schema=True)
5947        options = self._parse_key_constraint_options()
5948        return self.expression(exp.Reference, this=this, expressions=expressions, options=options)
5949
5950    def _parse_foreign_key(self) -> exp.ForeignKey:
5951        expressions = self._parse_wrapped_id_vars()
5952        reference = self._parse_references()
5953        options = {}
5954
5955        while self._match(TokenType.ON):
5956            if not self._match_set((TokenType.DELETE, TokenType.UPDATE)):
5957                self.raise_error("Expected DELETE or UPDATE")
5958
5959            kind = self._prev.text.lower()
5960
5961            if self._match_text_seq("NO", "ACTION"):
5962                action = "NO ACTION"
5963            elif self._match(TokenType.SET):
5964                self._match_set((TokenType.NULL, TokenType.DEFAULT))
5965                action = "SET " + self._prev.text.upper()
5966            else:
5967                self._advance()
5968                action = self._prev.text.upper()
5969
5970            options[kind] = action
5971
5972        return self.expression(
5973            exp.ForeignKey,
5974            expressions=expressions,
5975            reference=reference,
5976            **options,  # type: ignore
5977        )
5978
5979    def _parse_primary_key_part(self) -> t.Optional[exp.Expression]:
5980        return self._parse_ordered() or self._parse_field()
5981
5982    def _parse_period_for_system_time(self) -> t.Optional[exp.PeriodForSystemTimeConstraint]:
5983        if not self._match(TokenType.TIMESTAMP_SNAPSHOT):
5984            self._retreat(self._index - 1)
5985            return None
5986
5987        id_vars = self._parse_wrapped_id_vars()
5988        return self.expression(
5989            exp.PeriodForSystemTimeConstraint,
5990            this=seq_get(id_vars, 0),
5991            expression=seq_get(id_vars, 1),
5992        )
5993
5994    def _parse_primary_key(
5995        self, wrapped_optional: bool = False, in_props: bool = False
5996    ) -> exp.PrimaryKeyColumnConstraint | exp.PrimaryKey:
5997        desc = (
5998            self._match_set((TokenType.ASC, TokenType.DESC))
5999            and self._prev.token_type == TokenType.DESC
6000        )
6001
6002        if not in_props and not self._match(TokenType.L_PAREN, advance=False):
6003            return self.expression(exp.PrimaryKeyColumnConstraint, desc=desc)
6004
6005        expressions = self._parse_wrapped_csv(
6006            self._parse_primary_key_part, optional=wrapped_optional
6007        )
6008        options = self._parse_key_constraint_options()
6009        return self.expression(exp.PrimaryKey, expressions=expressions, options=options)
6010
6011    def _parse_bracket_key_value(self, is_map: bool = False) -> t.Optional[exp.Expression]:
6012        return self._parse_slice(self._parse_alias(self._parse_assignment(), explicit=True))
6013
6014    def _parse_odbc_datetime_literal(self) -> exp.Expression:
6015        """
6016        Parses a datetime column in ODBC format. We parse the column into the corresponding
6017        types, for example `{d'yyyy-mm-dd'}` will be parsed as a `Date` column, exactly the
6018        same as we did for `DATE('yyyy-mm-dd')`.
6019
6020        Reference:
6021        https://learn.microsoft.com/en-us/sql/odbc/reference/develop-app/date-time-and-timestamp-literals
6022        """
6023        self._match(TokenType.VAR)
6024        exp_class = self.ODBC_DATETIME_LITERALS[self._prev.text.lower()]
6025        expression = self.expression(exp_class=exp_class, this=self._parse_string())
6026        if not self._match(TokenType.R_BRACE):
6027            self.raise_error("Expected }")
6028        return expression
6029
6030    def _parse_bracket(self, this: t.Optional[exp.Expression] = None) -> t.Optional[exp.Expression]:
6031        if not self._match_set((TokenType.L_BRACKET, TokenType.L_BRACE)):
6032            return this
6033
6034        bracket_kind = self._prev.token_type
6035        if (
6036            bracket_kind == TokenType.L_BRACE
6037            and self._curr
6038            and self._curr.token_type == TokenType.VAR
6039            and self._curr.text.lower() in self.ODBC_DATETIME_LITERALS
6040        ):
6041            return self._parse_odbc_datetime_literal()
6042
6043        expressions = self._parse_csv(
6044            lambda: self._parse_bracket_key_value(is_map=bracket_kind == TokenType.L_BRACE)
6045        )
6046
6047        if bracket_kind == TokenType.L_BRACKET and not self._match(TokenType.R_BRACKET):
6048            self.raise_error("Expected ]")
6049        elif bracket_kind == TokenType.L_BRACE and not self._match(TokenType.R_BRACE):
6050            self.raise_error("Expected }")
6051
6052        # https://duckdb.org/docs/sql/data_types/struct.html#creating-structs
6053        if bracket_kind == TokenType.L_BRACE:
6054            this = self.expression(exp.Struct, expressions=self._kv_to_prop_eq(expressions))
6055        elif not this:
6056            this = build_array_constructor(
6057                exp.Array, args=expressions, bracket_kind=bracket_kind, dialect=self.dialect
6058            )
6059        else:
6060            constructor_type = self.ARRAY_CONSTRUCTORS.get(this.name.upper())
6061            if constructor_type:
6062                return build_array_constructor(
6063                    constructor_type,
6064                    args=expressions,
6065                    bracket_kind=bracket_kind,
6066                    dialect=self.dialect,
6067                )
6068
6069            expressions = apply_index_offset(this, expressions, -self.dialect.INDEX_OFFSET)
6070            this = self.expression(exp.Bracket, this=this, expressions=expressions)
6071
6072        self._add_comments(this)
6073        return self._parse_bracket(this)
6074
6075    def _parse_slice(self, this: t.Optional[exp.Expression]) -> t.Optional[exp.Expression]:
6076        if self._match(TokenType.COLON):
6077            return self.expression(exp.Slice, this=this, expression=self._parse_assignment())
6078        return this
6079
6080    def _parse_case(self) -> t.Optional[exp.Expression]:
6081        ifs = []
6082        default = None
6083
6084        comments = self._prev_comments
6085        expression = self._parse_assignment()
6086
6087        while self._match(TokenType.WHEN):
6088            this = self._parse_assignment()
6089            self._match(TokenType.THEN)
6090            then = self._parse_assignment()
6091            ifs.append(self.expression(exp.If, this=this, true=then))
6092
6093        if self._match(TokenType.ELSE):
6094            default = self._parse_assignment()
6095
6096        if not self._match(TokenType.END):
6097            if isinstance(default, exp.Interval) and default.this.sql().upper() == "END":
6098                default = exp.column("interval")
6099            else:
6100                self.raise_error("Expected END after CASE", self._prev)
6101
6102        return self.expression(
6103            exp.Case, comments=comments, this=expression, ifs=ifs, default=default
6104        )
6105
6106    def _parse_if(self) -> t.Optional[exp.Expression]:
6107        if self._match(TokenType.L_PAREN):
6108            args = self._parse_csv(self._parse_assignment)
6109            this = self.validate_expression(exp.If.from_arg_list(args), args)
6110            self._match_r_paren()
6111        else:
6112            index = self._index - 1
6113
6114            if self.NO_PAREN_IF_COMMANDS and index == 0:
6115                return self._parse_as_command(self._prev)
6116
6117            condition = self._parse_assignment()
6118
6119            if not condition:
6120                self._retreat(index)
6121                return None
6122
6123            self._match(TokenType.THEN)
6124            true = self._parse_assignment()
6125            false = self._parse_assignment() if self._match(TokenType.ELSE) else None
6126            self._match(TokenType.END)
6127            this = self.expression(exp.If, this=condition, true=true, false=false)
6128
6129        return this
6130
6131    def _parse_next_value_for(self) -> t.Optional[exp.Expression]:
6132        if not self._match_text_seq("VALUE", "FOR"):
6133            self._retreat(self._index - 1)
6134            return None
6135
6136        return self.expression(
6137            exp.NextValueFor,
6138            this=self._parse_column(),
6139            order=self._match(TokenType.OVER) and self._parse_wrapped(self._parse_order),
6140        )
6141
6142    def _parse_extract(self) -> exp.Extract | exp.Anonymous:
6143        this = self._parse_function() or self._parse_var_or_string(upper=True)
6144
6145        if self._match(TokenType.FROM):
6146            return self.expression(exp.Extract, this=this, expression=self._parse_bitwise())
6147
6148        if not self._match(TokenType.COMMA):
6149            self.raise_error("Expected FROM or comma after EXTRACT", self._prev)
6150
6151        return self.expression(exp.Extract, this=this, expression=self._parse_bitwise())
6152
6153    def _parse_gap_fill(self) -> exp.GapFill:
6154        self._match(TokenType.TABLE)
6155        this = self._parse_table()
6156
6157        self._match(TokenType.COMMA)
6158        args = [this, *self._parse_csv(self._parse_lambda)]
6159
6160        gap_fill = exp.GapFill.from_arg_list(args)
6161        return self.validate_expression(gap_fill, args)
6162
6163    def _parse_cast(self, strict: bool, safe: t.Optional[bool] = None) -> exp.Expression:
6164        this = self._parse_assignment()
6165
6166        if not self._match(TokenType.ALIAS):
6167            if self._match(TokenType.COMMA):
6168                return self.expression(exp.CastToStrType, this=this, to=self._parse_string())
6169
6170            self.raise_error("Expected AS after CAST")
6171
6172        fmt = None
6173        to = self._parse_types()
6174
6175        default = self._match(TokenType.DEFAULT)
6176        if default:
6177            default = self._parse_bitwise()
6178            self._match_text_seq("ON", "CONVERSION", "ERROR")
6179
6180        if self._match_set((TokenType.FORMAT, TokenType.COMMA)):
6181            fmt_string = self._parse_string()
6182            fmt = self._parse_at_time_zone(fmt_string)
6183
6184            if not to:
6185                to = exp.DataType.build(exp.DataType.Type.UNKNOWN)
6186            if to.this in exp.DataType.TEMPORAL_TYPES:
6187                this = self.expression(
6188                    exp.StrToDate if to.this == exp.DataType.Type.DATE else exp.StrToTime,
6189                    this=this,
6190                    format=exp.Literal.string(
6191                        format_time(
6192                            fmt_string.this if fmt_string else "",
6193                            self.dialect.FORMAT_MAPPING or self.dialect.TIME_MAPPING,
6194                            self.dialect.FORMAT_TRIE or self.dialect.TIME_TRIE,
6195                        )
6196                    ),
6197                    safe=safe,
6198                )
6199
6200                if isinstance(fmt, exp.AtTimeZone) and isinstance(this, exp.StrToTime):
6201                    this.set("zone", fmt.args["zone"])
6202                return this
6203        elif not to:
6204            self.raise_error("Expected TYPE after CAST")
6205        elif isinstance(to, exp.Identifier):
6206            to = exp.DataType.build(to.name, udt=True)
6207        elif to.this == exp.DataType.Type.CHAR:
6208            if self._match(TokenType.CHARACTER_SET):
6209                to = self.expression(exp.CharacterSet, this=self._parse_var_or_string())
6210
6211        return self.expression(
6212            exp.Cast if strict else exp.TryCast,
6213            this=this,
6214            to=to,
6215            format=fmt,
6216            safe=safe,
6217            action=self._parse_var_from_options(self.CAST_ACTIONS, raise_unmatched=False),
6218            default=default,
6219        )
6220
6221    def _parse_string_agg(self) -> exp.GroupConcat:
6222        if self._match(TokenType.DISTINCT):
6223            args: t.List[t.Optional[exp.Expression]] = [
6224                self.expression(exp.Distinct, expressions=[self._parse_assignment()])
6225            ]
6226            if self._match(TokenType.COMMA):
6227                args.extend(self._parse_csv(self._parse_assignment))
6228        else:
6229            args = self._parse_csv(self._parse_assignment)  # type: ignore
6230
6231        if self._match_text_seq("ON", "OVERFLOW"):
6232            # trino: LISTAGG(expression [, separator] [ON OVERFLOW overflow_behavior])
6233            if self._match_text_seq("ERROR"):
6234                on_overflow: t.Optional[exp.Expression] = exp.var("ERROR")
6235            else:
6236                self._match_text_seq("TRUNCATE")
6237                on_overflow = self.expression(
6238                    exp.OverflowTruncateBehavior,
6239                    this=self._parse_string(),
6240                    with_count=(
6241                        self._match_text_seq("WITH", "COUNT")
6242                        or not self._match_text_seq("WITHOUT", "COUNT")
6243                    ),
6244                )
6245        else:
6246            on_overflow = None
6247
6248        index = self._index
6249        if not self._match(TokenType.R_PAREN) and args:
6250            # postgres: STRING_AGG([DISTINCT] expression, separator [ORDER BY expression1 {ASC | DESC} [, ...]])
6251            # bigquery: STRING_AGG([DISTINCT] expression [, separator] [ORDER BY key [{ASC | DESC}] [, ... ]] [LIMIT n])
6252            args[-1] = self._parse_limit(this=self._parse_order(this=args[-1]))
6253            return self.expression(exp.GroupConcat, this=args[0], separator=seq_get(args, 1))
6254
6255        # Checks if we can parse an order clause: WITHIN GROUP (ORDER BY <order_by_expression_list> [ASC | DESC]).
6256        # This is done "manually", instead of letting _parse_window parse it into an exp.WithinGroup node, so that
6257        # the STRING_AGG call is parsed like in MySQL / SQLite and can thus be transpiled more easily to them.
6258        if not self._match_text_seq("WITHIN", "GROUP"):
6259            self._retreat(index)
6260            return self.validate_expression(exp.GroupConcat.from_arg_list(args), args)
6261
6262        # The corresponding match_r_paren will be called in parse_function (caller)
6263        self._match_l_paren()
6264
6265        return self.expression(
6266            exp.GroupConcat,
6267            this=self._parse_order(this=seq_get(args, 0)),
6268            separator=seq_get(args, 1),
6269            on_overflow=on_overflow,
6270        )
6271
6272    def _parse_convert(
6273        self, strict: bool, safe: t.Optional[bool] = None
6274    ) -> t.Optional[exp.Expression]:
6275        this = self._parse_bitwise()
6276
6277        if self._match(TokenType.USING):
6278            to: t.Optional[exp.Expression] = self.expression(
6279                exp.CharacterSet, this=self._parse_var()
6280            )
6281        elif self._match(TokenType.COMMA):
6282            to = self._parse_types()
6283        else:
6284            to = None
6285
6286        return self.expression(exp.Cast if strict else exp.TryCast, this=this, to=to, safe=safe)
6287
6288    def _parse_xml_table(self) -> exp.XMLTable:
6289        namespaces = None
6290        passing = None
6291        columns = None
6292
6293        if self._match_text_seq("XMLNAMESPACES", "("):
6294            namespaces = self._parse_xml_namespace()
6295            self._match_text_seq(")", ",")
6296
6297        this = self._parse_string()
6298
6299        if self._match_text_seq("PASSING"):
6300            # The BY VALUE keywords are optional and are provided for semantic clarity
6301            self._match_text_seq("BY", "VALUE")
6302            passing = self._parse_csv(self._parse_column)
6303
6304        by_ref = self._match_text_seq("RETURNING", "SEQUENCE", "BY", "REF")
6305
6306        if self._match_text_seq("COLUMNS"):
6307            columns = self._parse_csv(self._parse_field_def)
6308
6309        return self.expression(
6310            exp.XMLTable,
6311            this=this,
6312            namespaces=namespaces,
6313            passing=passing,
6314            columns=columns,
6315            by_ref=by_ref,
6316        )
6317
6318    def _parse_xml_namespace(self) -> t.List[exp.XMLNamespace]:
6319        namespaces = []
6320
6321        while True:
6322            if self._match(TokenType.DEFAULT):
6323                uri = self._parse_string()
6324            else:
6325                uri = self._parse_alias(self._parse_string())
6326            namespaces.append(self.expression(exp.XMLNamespace, this=uri))
6327            if not self._match(TokenType.COMMA):
6328                break
6329
6330        return namespaces
6331
6332    def _parse_decode(self) -> t.Optional[exp.Decode | exp.Case]:
6333        """
6334        There are generally two variants of the DECODE function:
6335
6336        - DECODE(bin, charset)
6337        - DECODE(expression, search, result [, search, result] ... [, default])
6338
6339        The second variant will always be parsed into a CASE expression. Note that NULL
6340        needs special treatment, since we need to explicitly check for it with `IS NULL`,
6341        instead of relying on pattern matching.
6342        """
6343        args = self._parse_csv(self._parse_assignment)
6344
6345        if len(args) < 3:
6346            return self.expression(exp.Decode, this=seq_get(args, 0), charset=seq_get(args, 1))
6347
6348        expression, *expressions = args
6349        if not expression:
6350            return None
6351
6352        ifs = []
6353        for search, result in zip(expressions[::2], expressions[1::2]):
6354            if not search or not result:
6355                return None
6356
6357            if isinstance(search, exp.Literal):
6358                ifs.append(
6359                    exp.If(this=exp.EQ(this=expression.copy(), expression=search), true=result)
6360                )
6361            elif isinstance(search, exp.Null):
6362                ifs.append(
6363                    exp.If(this=exp.Is(this=expression.copy(), expression=exp.Null()), true=result)
6364                )
6365            else:
6366                cond = exp.or_(
6367                    exp.EQ(this=expression.copy(), expression=search),
6368                    exp.and_(
6369                        exp.Is(this=expression.copy(), expression=exp.Null()),
6370                        exp.Is(this=search.copy(), expression=exp.Null()),
6371                        copy=False,
6372                    ),
6373                    copy=False,
6374                )
6375                ifs.append(exp.If(this=cond, true=result))
6376
6377        return exp.Case(ifs=ifs, default=expressions[-1] if len(expressions) % 2 == 1 else None)
6378
6379    def _parse_json_key_value(self) -> t.Optional[exp.JSONKeyValue]:
6380        self._match_text_seq("KEY")
6381        key = self._parse_column()
6382        self._match_set(self.JSON_KEY_VALUE_SEPARATOR_TOKENS)
6383        self._match_text_seq("VALUE")
6384        value = self._parse_bitwise()
6385
6386        if not key and not value:
6387            return None
6388        return self.expression(exp.JSONKeyValue, this=key, expression=value)
6389
6390    def _parse_format_json(self, this: t.Optional[exp.Expression]) -> t.Optional[exp.Expression]:
6391        if not this or not self._match_text_seq("FORMAT", "JSON"):
6392            return this
6393
6394        return self.expression(exp.FormatJson, this=this)
6395
6396    def _parse_on_condition(self) -> t.Optional[exp.OnCondition]:
6397        # MySQL uses "X ON EMPTY Y ON ERROR" (e.g. JSON_VALUE) while Oracle uses the opposite (e.g. JSON_EXISTS)
6398        if self.dialect.ON_CONDITION_EMPTY_BEFORE_ERROR:
6399            empty = self._parse_on_handling("EMPTY", *self.ON_CONDITION_TOKENS)
6400            error = self._parse_on_handling("ERROR", *self.ON_CONDITION_TOKENS)
6401        else:
6402            error = self._parse_on_handling("ERROR", *self.ON_CONDITION_TOKENS)
6403            empty = self._parse_on_handling("EMPTY", *self.ON_CONDITION_TOKENS)
6404
6405        null = self._parse_on_handling("NULL", *self.ON_CONDITION_TOKENS)
6406
6407        if not empty and not error and not null:
6408            return None
6409
6410        return self.expression(
6411            exp.OnCondition,
6412            empty=empty,
6413            error=error,
6414            null=null,
6415        )
6416
6417    def _parse_on_handling(
6418        self, on: str, *values: str
6419    ) -> t.Optional[str] | t.Optional[exp.Expression]:
6420        # Parses the "X ON Y" or "DEFAULT <expr> ON Y syntax, e.g. NULL ON NULL (Oracle, T-SQL, MySQL)
6421        for value in values:
6422            if self._match_text_seq(value, "ON", on):
6423                return f"{value} ON {on}"
6424
6425        index = self._index
6426        if self._match(TokenType.DEFAULT):
6427            default_value = self._parse_bitwise()
6428            if self._match_text_seq("ON", on):
6429                return default_value
6430
6431            self._retreat(index)
6432
6433        return None
6434
6435    @t.overload
6436    def _parse_json_object(self, agg: Lit[False]) -> exp.JSONObject: ...
6437
6438    @t.overload
6439    def _parse_json_object(self, agg: Lit[True]) -> exp.JSONObjectAgg: ...
6440
6441    def _parse_json_object(self, agg=False):
6442        star = self._parse_star()
6443        expressions = (
6444            [star]
6445            if star
6446            else self._parse_csv(lambda: self._parse_format_json(self._parse_json_key_value()))
6447        )
6448        null_handling = self._parse_on_handling("NULL", "NULL", "ABSENT")
6449
6450        unique_keys = None
6451        if self._match_text_seq("WITH", "UNIQUE"):
6452            unique_keys = True
6453        elif self._match_text_seq("WITHOUT", "UNIQUE"):
6454            unique_keys = False
6455
6456        self._match_text_seq("KEYS")
6457
6458        return_type = self._match_text_seq("RETURNING") and self._parse_format_json(
6459            self._parse_type()
6460        )
6461        encoding = self._match_text_seq("ENCODING") and self._parse_var()
6462
6463        return self.expression(
6464            exp.JSONObjectAgg if agg else exp.JSONObject,
6465            expressions=expressions,
6466            null_handling=null_handling,
6467            unique_keys=unique_keys,
6468            return_type=return_type,
6469            encoding=encoding,
6470        )
6471
6472    # Note: this is currently incomplete; it only implements the "JSON_value_column" part
6473    def _parse_json_column_def(self) -> exp.JSONColumnDef:
6474        if not self._match_text_seq("NESTED"):
6475            this = self._parse_id_var()
6476            kind = self._parse_types(allow_identifiers=False)
6477            nested = None
6478        else:
6479            this = None
6480            kind = None
6481            nested = True
6482
6483        path = self._match_text_seq("PATH") and self._parse_string()
6484        nested_schema = nested and self._parse_json_schema()
6485
6486        return self.expression(
6487            exp.JSONColumnDef,
6488            this=this,
6489            kind=kind,
6490            path=path,
6491            nested_schema=nested_schema,
6492        )
6493
6494    def _parse_json_schema(self) -> exp.JSONSchema:
6495        self._match_text_seq("COLUMNS")
6496        return self.expression(
6497            exp.JSONSchema,
6498            expressions=self._parse_wrapped_csv(self._parse_json_column_def, optional=True),
6499        )
6500
6501    def _parse_json_table(self) -> exp.JSONTable:
6502        this = self._parse_format_json(self._parse_bitwise())
6503        path = self._match(TokenType.COMMA) and self._parse_string()
6504        error_handling = self._parse_on_handling("ERROR", "ERROR", "NULL")
6505        empty_handling = self._parse_on_handling("EMPTY", "ERROR", "NULL")
6506        schema = self._parse_json_schema()
6507
6508        return exp.JSONTable(
6509            this=this,
6510            schema=schema,
6511            path=path,
6512            error_handling=error_handling,
6513            empty_handling=empty_handling,
6514        )
6515
6516    def _parse_match_against(self) -> exp.MatchAgainst:
6517        expressions = self._parse_csv(self._parse_column)
6518
6519        self._match_text_seq(")", "AGAINST", "(")
6520
6521        this = self._parse_string()
6522
6523        if self._match_text_seq("IN", "NATURAL", "LANGUAGE", "MODE"):
6524            modifier = "IN NATURAL LANGUAGE MODE"
6525            if self._match_text_seq("WITH", "QUERY", "EXPANSION"):
6526                modifier = f"{modifier} WITH QUERY EXPANSION"
6527        elif self._match_text_seq("IN", "BOOLEAN", "MODE"):
6528            modifier = "IN BOOLEAN MODE"
6529        elif self._match_text_seq("WITH", "QUERY", "EXPANSION"):
6530            modifier = "WITH QUERY EXPANSION"
6531        else:
6532            modifier = None
6533
6534        return self.expression(
6535            exp.MatchAgainst, this=this, expressions=expressions, modifier=modifier
6536        )
6537
6538    # https://learn.microsoft.com/en-us/sql/t-sql/functions/openjson-transact-sql?view=sql-server-ver16
6539    def _parse_open_json(self) -> exp.OpenJSON:
6540        this = self._parse_bitwise()
6541        path = self._match(TokenType.COMMA) and self._parse_string()
6542
6543        def _parse_open_json_column_def() -> exp.OpenJSONColumnDef:
6544            this = self._parse_field(any_token=True)
6545            kind = self._parse_types()
6546            path = self._parse_string()
6547            as_json = self._match_pair(TokenType.ALIAS, TokenType.JSON)
6548
6549            return self.expression(
6550                exp.OpenJSONColumnDef, this=this, kind=kind, path=path, as_json=as_json
6551            )
6552
6553        expressions = None
6554        if self._match_pair(TokenType.R_PAREN, TokenType.WITH):
6555            self._match_l_paren()
6556            expressions = self._parse_csv(_parse_open_json_column_def)
6557
6558        return self.expression(exp.OpenJSON, this=this, path=path, expressions=expressions)
6559
6560    def _parse_position(self, haystack_first: bool = False) -> exp.StrPosition:
6561        args = self._parse_csv(self._parse_bitwise)
6562
6563        if self._match(TokenType.IN):
6564            return self.expression(
6565                exp.StrPosition, this=self._parse_bitwise(), substr=seq_get(args, 0)
6566            )
6567
6568        if haystack_first:
6569            haystack = seq_get(args, 0)
6570            needle = seq_get(args, 1)
6571        else:
6572            haystack = seq_get(args, 1)
6573            needle = seq_get(args, 0)
6574
6575        return self.expression(
6576            exp.StrPosition, this=haystack, substr=needle, position=seq_get(args, 2)
6577        )
6578
6579    def _parse_predict(self) -> exp.Predict:
6580        self._match_text_seq("MODEL")
6581        this = self._parse_table()
6582
6583        self._match(TokenType.COMMA)
6584        self._match_text_seq("TABLE")
6585
6586        return self.expression(
6587            exp.Predict,
6588            this=this,
6589            expression=self._parse_table(),
6590            params_struct=self._match(TokenType.COMMA) and self._parse_bitwise(),
6591        )
6592
6593    def _parse_join_hint(self, func_name: str) -> exp.JoinHint:
6594        args = self._parse_csv(self._parse_table)
6595        return exp.JoinHint(this=func_name.upper(), expressions=args)
6596
6597    def _parse_substring(self) -> exp.Substring:
6598        # Postgres supports the form: substring(string [from int] [for int])
6599        # https://www.postgresql.org/docs/9.1/functions-string.html @ Table 9-6
6600
6601        args = t.cast(t.List[t.Optional[exp.Expression]], self._parse_csv(self._parse_bitwise))
6602
6603        if self._match(TokenType.FROM):
6604            args.append(self._parse_bitwise())
6605        if self._match(TokenType.FOR):
6606            if len(args) == 1:
6607                args.append(exp.Literal.number(1))
6608            args.append(self._parse_bitwise())
6609
6610        return self.validate_expression(exp.Substring.from_arg_list(args), args)
6611
6612    def _parse_trim(self) -> exp.Trim:
6613        # https://www.w3resource.com/sql/character-functions/trim.php
6614        # https://docs.oracle.com/javadb/10.8.3.0/ref/rreftrimfunc.html
6615
6616        position = None
6617        collation = None
6618        expression = None
6619
6620        if self._match_texts(self.TRIM_TYPES):
6621            position = self._prev.text.upper()
6622
6623        this = self._parse_bitwise()
6624        if self._match_set((TokenType.FROM, TokenType.COMMA)):
6625            invert_order = self._prev.token_type == TokenType.FROM or self.TRIM_PATTERN_FIRST
6626            expression = self._parse_bitwise()
6627
6628            if invert_order:
6629                this, expression = expression, this
6630
6631        if self._match(TokenType.COLLATE):
6632            collation = self._parse_bitwise()
6633
6634        return self.expression(
6635            exp.Trim, this=this, position=position, expression=expression, collation=collation
6636        )
6637
6638    def _parse_window_clause(self) -> t.Optional[t.List[exp.Expression]]:
6639        return self._match(TokenType.WINDOW) and self._parse_csv(self._parse_named_window)
6640
6641    def _parse_named_window(self) -> t.Optional[exp.Expression]:
6642        return self._parse_window(self._parse_id_var(), alias=True)
6643
6644    def _parse_respect_or_ignore_nulls(
6645        self, this: t.Optional[exp.Expression]
6646    ) -> t.Optional[exp.Expression]:
6647        if self._match_text_seq("IGNORE", "NULLS"):
6648            return self.expression(exp.IgnoreNulls, this=this)
6649        if self._match_text_seq("RESPECT", "NULLS"):
6650            return self.expression(exp.RespectNulls, this=this)
6651        return this
6652
6653    def _parse_having_max(self, this: t.Optional[exp.Expression]) -> t.Optional[exp.Expression]:
6654        if self._match(TokenType.HAVING):
6655            self._match_texts(("MAX", "MIN"))
6656            max = self._prev.text.upper() != "MIN"
6657            return self.expression(
6658                exp.HavingMax, this=this, expression=self._parse_column(), max=max
6659            )
6660
6661        return this
6662
6663    def _parse_window(
6664        self, this: t.Optional[exp.Expression], alias: bool = False
6665    ) -> t.Optional[exp.Expression]:
6666        func = this
6667        comments = func.comments if isinstance(func, exp.Expression) else None
6668
6669        # T-SQL allows the OVER (...) syntax after WITHIN GROUP.
6670        # https://learn.microsoft.com/en-us/sql/t-sql/functions/percentile-disc-transact-sql?view=sql-server-ver16
6671        if self._match_text_seq("WITHIN", "GROUP"):
6672            order = self._parse_wrapped(self._parse_order)
6673            this = self.expression(exp.WithinGroup, this=this, expression=order)
6674
6675        if self._match_pair(TokenType.FILTER, TokenType.L_PAREN):
6676            self._match(TokenType.WHERE)
6677            this = self.expression(
6678                exp.Filter, this=this, expression=self._parse_where(skip_where_token=True)
6679            )
6680            self._match_r_paren()
6681
6682        # SQL spec defines an optional [ { IGNORE | RESPECT } NULLS ] OVER
6683        # Some dialects choose to implement and some do not.
6684        # https://dev.mysql.com/doc/refman/8.0/en/window-function-descriptions.html
6685
6686        # There is some code above in _parse_lambda that handles
6687        #   SELECT FIRST_VALUE(TABLE.COLUMN IGNORE|RESPECT NULLS) OVER ...
6688
6689        # The below changes handle
6690        #   SELECT FIRST_VALUE(TABLE.COLUMN) IGNORE|RESPECT NULLS OVER ...
6691
6692        # Oracle allows both formats
6693        #   (https://docs.oracle.com/en/database/oracle/oracle-database/19/sqlrf/img_text/first_value.html)
6694        #   and Snowflake chose to do the same for familiarity
6695        #   https://docs.snowflake.com/en/sql-reference/functions/first_value.html#usage-notes
6696        if isinstance(this, exp.AggFunc):
6697            ignore_respect = this.find(exp.IgnoreNulls, exp.RespectNulls)
6698
6699            if ignore_respect and ignore_respect is not this:
6700                ignore_respect.replace(ignore_respect.this)
6701                this = self.expression(ignore_respect.__class__, this=this)
6702
6703        this = self._parse_respect_or_ignore_nulls(this)
6704
6705        # bigquery select from window x AS (partition by ...)
6706        if alias:
6707            over = None
6708            self._match(TokenType.ALIAS)
6709        elif not self._match_set(self.WINDOW_BEFORE_PAREN_TOKENS):
6710            return this
6711        else:
6712            over = self._prev.text.upper()
6713
6714        if comments and isinstance(func, exp.Expression):
6715            func.pop_comments()
6716
6717        if not self._match(TokenType.L_PAREN):
6718            return self.expression(
6719                exp.Window,
6720                comments=comments,
6721                this=this,
6722                alias=self._parse_id_var(False),
6723                over=over,
6724            )
6725
6726        window_alias = self._parse_id_var(any_token=False, tokens=self.WINDOW_ALIAS_TOKENS)
6727
6728        first = self._match(TokenType.FIRST)
6729        if self._match_text_seq("LAST"):
6730            first = False
6731
6732        partition, order = self._parse_partition_and_order()
6733        kind = self._match_set((TokenType.ROWS, TokenType.RANGE)) and self._prev.text
6734
6735        if kind:
6736            self._match(TokenType.BETWEEN)
6737            start = self._parse_window_spec()
6738            self._match(TokenType.AND)
6739            end = self._parse_window_spec()
6740
6741            spec = self.expression(
6742                exp.WindowSpec,
6743                kind=kind,
6744                start=start["value"],
6745                start_side=start["side"],
6746                end=end["value"],
6747                end_side=end["side"],
6748            )
6749        else:
6750            spec = None
6751
6752        self._match_r_paren()
6753
6754        window = self.expression(
6755            exp.Window,
6756            comments=comments,
6757            this=this,
6758            partition_by=partition,
6759            order=order,
6760            spec=spec,
6761            alias=window_alias,
6762            over=over,
6763            first=first,
6764        )
6765
6766        # This covers Oracle's FIRST/LAST syntax: aggregate KEEP (...) OVER (...)
6767        if self._match_set(self.WINDOW_BEFORE_PAREN_TOKENS, advance=False):
6768            return self._parse_window(window, alias=alias)
6769
6770        return window
6771
6772    def _parse_partition_and_order(
6773        self,
6774    ) -> t.Tuple[t.List[exp.Expression], t.Optional[exp.Expression]]:
6775        return self._parse_partition_by(), self._parse_order()
6776
6777    def _parse_window_spec(self) -> t.Dict[str, t.Optional[str | exp.Expression]]:
6778        self._match(TokenType.BETWEEN)
6779
6780        return {
6781            "value": (
6782                (self._match_text_seq("UNBOUNDED") and "UNBOUNDED")
6783                or (self._match_text_seq("CURRENT", "ROW") and "CURRENT ROW")
6784                or self._parse_bitwise()
6785            ),
6786            "side": self._match_texts(self.WINDOW_SIDES) and self._prev.text,
6787        }
6788
6789    def _parse_alias(
6790        self, this: t.Optional[exp.Expression], explicit: bool = False
6791    ) -> t.Optional[exp.Expression]:
6792        # In some dialects, LIMIT and OFFSET can act as both identifiers and keywords (clauses)
6793        # so this section tries to parse the clause version and if it fails, it treats the token
6794        # as an identifier (alias)
6795        if self._can_parse_limit_or_offset():
6796            return this
6797
6798        any_token = self._match(TokenType.ALIAS)
6799        comments = self._prev_comments or []
6800
6801        if explicit and not any_token:
6802            return this
6803
6804        if self._match(TokenType.L_PAREN):
6805            aliases = self.expression(
6806                exp.Aliases,
6807                comments=comments,
6808                this=this,
6809                expressions=self._parse_csv(lambda: self._parse_id_var(any_token)),
6810            )
6811            self._match_r_paren(aliases)
6812            return aliases
6813
6814        alias = self._parse_id_var(any_token, tokens=self.ALIAS_TOKENS) or (
6815            self.STRING_ALIASES and self._parse_string_as_identifier()
6816        )
6817
6818        if alias:
6819            comments.extend(alias.pop_comments())
6820            this = self.expression(exp.Alias, comments=comments, this=this, alias=alias)
6821            column = this.this
6822
6823            # Moves the comment next to the alias in `expr /* comment */ AS alias`
6824            if not this.comments and column and column.comments:
6825                this.comments = column.pop_comments()
6826
6827        return this
6828
6829    def _parse_id_var(
6830        self,
6831        any_token: bool = True,
6832        tokens: t.Optional[t.Collection[TokenType]] = None,
6833    ) -> t.Optional[exp.Expression]:
6834        expression = self._parse_identifier()
6835        if not expression and (
6836            (any_token and self._advance_any()) or self._match_set(tokens or self.ID_VAR_TOKENS)
6837        ):
6838            quoted = self._prev.token_type == TokenType.STRING
6839            expression = self.expression(exp.Identifier, this=self._prev.text, quoted=quoted)
6840
6841        return expression
6842
6843    def _parse_string(self) -> t.Optional[exp.Expression]:
6844        if self._match_set(self.STRING_PARSERS):
6845            return self.STRING_PARSERS[self._prev.token_type](self, self._prev)
6846        return self._parse_placeholder()
6847
6848    def _parse_string_as_identifier(self) -> t.Optional[exp.Identifier]:
6849        return exp.to_identifier(self._match(TokenType.STRING) and self._prev.text, quoted=True)
6850
6851    def _parse_number(self) -> t.Optional[exp.Expression]:
6852        if self._match_set(self.NUMERIC_PARSERS):
6853            return self.NUMERIC_PARSERS[self._prev.token_type](self, self._prev)
6854        return self._parse_placeholder()
6855
6856    def _parse_identifier(self) -> t.Optional[exp.Expression]:
6857        if self._match(TokenType.IDENTIFIER):
6858            return self.expression(exp.Identifier, this=self._prev.text, quoted=True)
6859        return self._parse_placeholder()
6860
6861    def _parse_var(
6862        self,
6863        any_token: bool = False,
6864        tokens: t.Optional[t.Collection[TokenType]] = None,
6865        upper: bool = False,
6866    ) -> t.Optional[exp.Expression]:
6867        if (
6868            (any_token and self._advance_any())
6869            or self._match(TokenType.VAR)
6870            or (self._match_set(tokens) if tokens else False)
6871        ):
6872            return self.expression(
6873                exp.Var, this=self._prev.text.upper() if upper else self._prev.text
6874            )
6875        return self._parse_placeholder()
6876
6877    def _advance_any(self, ignore_reserved: bool = False) -> t.Optional[Token]:
6878        if self._curr and (ignore_reserved or self._curr.token_type not in self.RESERVED_TOKENS):
6879            self._advance()
6880            return self._prev
6881        return None
6882
6883    def _parse_var_or_string(self, upper: bool = False) -> t.Optional[exp.Expression]:
6884        return self._parse_string() or self._parse_var(any_token=True, upper=upper)
6885
6886    def _parse_primary_or_var(self) -> t.Optional[exp.Expression]:
6887        return self._parse_primary() or self._parse_var(any_token=True)
6888
6889    def _parse_null(self) -> t.Optional[exp.Expression]:
6890        if self._match_set(self.NULL_TOKENS):
6891            return self.PRIMARY_PARSERS[TokenType.NULL](self, self._prev)
6892        return self._parse_placeholder()
6893
6894    def _parse_boolean(self) -> t.Optional[exp.Expression]:
6895        if self._match(TokenType.TRUE):
6896            return self.PRIMARY_PARSERS[TokenType.TRUE](self, self._prev)
6897        if self._match(TokenType.FALSE):
6898            return self.PRIMARY_PARSERS[TokenType.FALSE](self, self._prev)
6899        return self._parse_placeholder()
6900
6901    def _parse_star(self) -> t.Optional[exp.Expression]:
6902        if self._match(TokenType.STAR):
6903            return self.PRIMARY_PARSERS[TokenType.STAR](self, self._prev)
6904        return self._parse_placeholder()
6905
6906    def _parse_parameter(self) -> exp.Parameter:
6907        this = self._parse_identifier() or self._parse_primary_or_var()
6908        return self.expression(exp.Parameter, this=this)
6909
6910    def _parse_placeholder(self) -> t.Optional[exp.Expression]:
6911        if self._match_set(self.PLACEHOLDER_PARSERS):
6912            placeholder = self.PLACEHOLDER_PARSERS[self._prev.token_type](self)
6913            if placeholder:
6914                return placeholder
6915            self._advance(-1)
6916        return None
6917
6918    def _parse_star_op(self, *keywords: str) -> t.Optional[t.List[exp.Expression]]:
6919        if not self._match_texts(keywords):
6920            return None
6921        if self._match(TokenType.L_PAREN, advance=False):
6922            return self._parse_wrapped_csv(self._parse_expression)
6923
6924        expression = self._parse_expression()
6925        return [expression] if expression else None
6926
6927    def _parse_csv(
6928        self, parse_method: t.Callable, sep: TokenType = TokenType.COMMA
6929    ) -> t.List[exp.Expression]:
6930        parse_result = parse_method()
6931        items = [parse_result] if parse_result is not None else []
6932
6933        while self._match(sep):
6934            self._add_comments(parse_result)
6935            parse_result = parse_method()
6936            if parse_result is not None:
6937                items.append(parse_result)
6938
6939        return items
6940
6941    def _parse_tokens(
6942        self, parse_method: t.Callable, expressions: t.Dict
6943    ) -> t.Optional[exp.Expression]:
6944        this = parse_method()
6945
6946        while self._match_set(expressions):
6947            this = self.expression(
6948                expressions[self._prev.token_type],
6949                this=this,
6950                comments=self._prev_comments,
6951                expression=parse_method(),
6952            )
6953
6954        return this
6955
6956    def _parse_wrapped_id_vars(self, optional: bool = False) -> t.List[exp.Expression]:
6957        return self._parse_wrapped_csv(self._parse_id_var, optional=optional)
6958
6959    def _parse_wrapped_csv(
6960        self, parse_method: t.Callable, sep: TokenType = TokenType.COMMA, optional: bool = False
6961    ) -> t.List[exp.Expression]:
6962        return self._parse_wrapped(
6963            lambda: self._parse_csv(parse_method, sep=sep), optional=optional
6964        )
6965
6966    def _parse_wrapped(self, parse_method: t.Callable, optional: bool = False) -> t.Any:
6967        wrapped = self._match(TokenType.L_PAREN)
6968        if not wrapped and not optional:
6969            self.raise_error("Expecting (")
6970        parse_result = parse_method()
6971        if wrapped:
6972            self._match_r_paren()
6973        return parse_result
6974
6975    def _parse_expressions(self) -> t.List[exp.Expression]:
6976        return self._parse_csv(self._parse_expression)
6977
6978    def _parse_select_or_expression(self, alias: bool = False) -> t.Optional[exp.Expression]:
6979        return self._parse_select() or self._parse_set_operations(
6980            self._parse_alias(self._parse_assignment(), explicit=True)
6981            if alias
6982            else self._parse_assignment()
6983        )
6984
6985    def _parse_ddl_select(self) -> t.Optional[exp.Expression]:
6986        return self._parse_query_modifiers(
6987            self._parse_set_operations(self._parse_select(nested=True, parse_subquery_alias=False))
6988        )
6989
6990    def _parse_transaction(self) -> exp.Transaction | exp.Command:
6991        this = None
6992        if self._match_texts(self.TRANSACTION_KIND):
6993            this = self._prev.text
6994
6995        self._match_texts(("TRANSACTION", "WORK"))
6996
6997        modes = []
6998        while True:
6999            mode = []
7000            while self._match(TokenType.VAR):
7001                mode.append(self._prev.text)
7002
7003            if mode:
7004                modes.append(" ".join(mode))
7005            if not self._match(TokenType.COMMA):
7006                break
7007
7008        return self.expression(exp.Transaction, this=this, modes=modes)
7009
7010    def _parse_commit_or_rollback(self) -> exp.Commit | exp.Rollback:
7011        chain = None
7012        savepoint = None
7013        is_rollback = self._prev.token_type == TokenType.ROLLBACK
7014
7015        self._match_texts(("TRANSACTION", "WORK"))
7016
7017        if self._match_text_seq("TO"):
7018            self._match_text_seq("SAVEPOINT")
7019            savepoint = self._parse_id_var()
7020
7021        if self._match(TokenType.AND):
7022            chain = not self._match_text_seq("NO")
7023            self._match_text_seq("CHAIN")
7024
7025        if is_rollback:
7026            return self.expression(exp.Rollback, savepoint=savepoint)
7027
7028        return self.expression(exp.Commit, chain=chain)
7029
7030    def _parse_refresh(self) -> exp.Refresh:
7031        self._match(TokenType.TABLE)
7032        return self.expression(exp.Refresh, this=self._parse_string() or self._parse_table())
7033
7034    def _parse_add_column(self) -> t.Optional[exp.Expression]:
7035        if not self._match_text_seq("ADD"):
7036            return None
7037
7038        self._match(TokenType.COLUMN)
7039        exists_column = self._parse_exists(not_=True)
7040        expression = self._parse_field_def()
7041
7042        if expression:
7043            expression.set("exists", exists_column)
7044
7045            # https://docs.databricks.com/delta/update-schema.html#explicitly-update-schema-to-add-columns
7046            if self._match_texts(("FIRST", "AFTER")):
7047                position = self._prev.text
7048                column_position = self.expression(
7049                    exp.ColumnPosition, this=self._parse_column(), position=position
7050                )
7051                expression.set("position", column_position)
7052
7053        return expression
7054
7055    def _parse_drop_column(self) -> t.Optional[exp.Drop | exp.Command]:
7056        drop = self._match(TokenType.DROP) and self._parse_drop()
7057        if drop and not isinstance(drop, exp.Command):
7058            drop.set("kind", drop.args.get("kind", "COLUMN"))
7059        return drop
7060
7061    # https://docs.aws.amazon.com/athena/latest/ug/alter-table-drop-partition.html
7062    def _parse_drop_partition(self, exists: t.Optional[bool] = None) -> exp.DropPartition:
7063        return self.expression(
7064            exp.DropPartition, expressions=self._parse_csv(self._parse_partition), exists=exists
7065        )
7066
7067    def _parse_alter_table_add(self) -> t.List[exp.Expression]:
7068        index = self._index - 1
7069
7070        if self._match_set(self.ADD_CONSTRAINT_TOKENS, advance=False):
7071            return self._parse_csv(
7072                lambda: self.expression(
7073                    exp.AddConstraint, expressions=self._parse_csv(self._parse_constraint)
7074                )
7075            )
7076
7077        self._retreat(index)
7078        if not self.ALTER_TABLE_ADD_REQUIRED_FOR_EACH_COLUMN and self._match_text_seq("ADD"):
7079            return self._parse_wrapped_csv(self._parse_field_def, optional=True)
7080
7081        if self._match_text_seq("ADD", "COLUMNS"):
7082            schema = self._parse_schema()
7083            if schema:
7084                return [schema]
7085            return []
7086
7087        return self._parse_wrapped_csv(self._parse_add_column, optional=True)
7088
7089    def _parse_alter_table_alter(self) -> t.Optional[exp.Expression]:
7090        if self._match_texts(self.ALTER_ALTER_PARSERS):
7091            return self.ALTER_ALTER_PARSERS[self._prev.text.upper()](self)
7092
7093        # Many dialects support the ALTER [COLUMN] syntax, so if there is no
7094        # keyword after ALTER we default to parsing this statement
7095        self._match(TokenType.COLUMN)
7096        column = self._parse_field(any_token=True)
7097
7098        if self._match_pair(TokenType.DROP, TokenType.DEFAULT):
7099            return self.expression(exp.AlterColumn, this=column, drop=True)
7100        if self._match_pair(TokenType.SET, TokenType.DEFAULT):
7101            return self.expression(exp.AlterColumn, this=column, default=self._parse_assignment())
7102        if self._match(TokenType.COMMENT):
7103            return self.expression(exp.AlterColumn, this=column, comment=self._parse_string())
7104        if self._match_text_seq("DROP", "NOT", "NULL"):
7105            return self.expression(
7106                exp.AlterColumn,
7107                this=column,
7108                drop=True,
7109                allow_null=True,
7110            )
7111        if self._match_text_seq("SET", "NOT", "NULL"):
7112            return self.expression(
7113                exp.AlterColumn,
7114                this=column,
7115                allow_null=False,
7116            )
7117        self._match_text_seq("SET", "DATA")
7118        self._match_text_seq("TYPE")
7119        return self.expression(
7120            exp.AlterColumn,
7121            this=column,
7122            dtype=self._parse_types(),
7123            collate=self._match(TokenType.COLLATE) and self._parse_term(),
7124            using=self._match(TokenType.USING) and self._parse_assignment(),
7125        )
7126
7127    def _parse_alter_diststyle(self) -> exp.AlterDistStyle:
7128        if self._match_texts(("ALL", "EVEN", "AUTO")):
7129            return self.expression(exp.AlterDistStyle, this=exp.var(self._prev.text.upper()))
7130
7131        self._match_text_seq("KEY", "DISTKEY")
7132        return self.expression(exp.AlterDistStyle, this=self._parse_column())
7133
7134    def _parse_alter_sortkey(self, compound: t.Optional[bool] = None) -> exp.AlterSortKey:
7135        if compound:
7136            self._match_text_seq("SORTKEY")
7137
7138        if self._match(TokenType.L_PAREN, advance=False):
7139            return self.expression(
7140                exp.AlterSortKey, expressions=self._parse_wrapped_id_vars(), compound=compound
7141            )
7142
7143        self._match_texts(("AUTO", "NONE"))
7144        return self.expression(
7145            exp.AlterSortKey, this=exp.var(self._prev.text.upper()), compound=compound
7146        )
7147
7148    def _parse_alter_table_drop(self) -> t.List[exp.Expression]:
7149        index = self._index - 1
7150
7151        partition_exists = self._parse_exists()
7152        if self._match(TokenType.PARTITION, advance=False):
7153            return self._parse_csv(lambda: self._parse_drop_partition(exists=partition_exists))
7154
7155        self._retreat(index)
7156        return self._parse_csv(self._parse_drop_column)
7157
7158    def _parse_alter_table_rename(self) -> t.Optional[exp.AlterRename | exp.RenameColumn]:
7159        if self._match(TokenType.COLUMN):
7160            exists = self._parse_exists()
7161            old_column = self._parse_column()
7162            to = self._match_text_seq("TO")
7163            new_column = self._parse_column()
7164
7165            if old_column is None or to is None or new_column is None:
7166                return None
7167
7168            return self.expression(exp.RenameColumn, this=old_column, to=new_column, exists=exists)
7169
7170        self._match_text_seq("TO")
7171        return self.expression(exp.AlterRename, this=self._parse_table(schema=True))
7172
7173    def _parse_alter_table_set(self) -> exp.AlterSet:
7174        alter_set = self.expression(exp.AlterSet)
7175
7176        if self._match(TokenType.L_PAREN, advance=False) or self._match_text_seq(
7177            "TABLE", "PROPERTIES"
7178        ):
7179            alter_set.set("expressions", self._parse_wrapped_csv(self._parse_assignment))
7180        elif self._match_text_seq("FILESTREAM_ON", advance=False):
7181            alter_set.set("expressions", [self._parse_assignment()])
7182        elif self._match_texts(("LOGGED", "UNLOGGED")):
7183            alter_set.set("option", exp.var(self._prev.text.upper()))
7184        elif self._match_text_seq("WITHOUT") and self._match_texts(("CLUSTER", "OIDS")):
7185            alter_set.set("option", exp.var(f"WITHOUT {self._prev.text.upper()}"))
7186        elif self._match_text_seq("LOCATION"):
7187            alter_set.set("location", self._parse_field())
7188        elif self._match_text_seq("ACCESS", "METHOD"):
7189            alter_set.set("access_method", self._parse_field())
7190        elif self._match_text_seq("TABLESPACE"):
7191            alter_set.set("tablespace", self._parse_field())
7192        elif self._match_text_seq("FILE", "FORMAT") or self._match_text_seq("FILEFORMAT"):
7193            alter_set.set("file_format", [self._parse_field()])
7194        elif self._match_text_seq("STAGE_FILE_FORMAT"):
7195            alter_set.set("file_format", self._parse_wrapped_options())
7196        elif self._match_text_seq("STAGE_COPY_OPTIONS"):
7197            alter_set.set("copy_options", self._parse_wrapped_options())
7198        elif self._match_text_seq("TAG") or self._match_text_seq("TAGS"):
7199            alter_set.set("tag", self._parse_csv(self._parse_assignment))
7200        else:
7201            if self._match_text_seq("SERDE"):
7202                alter_set.set("serde", self._parse_field())
7203
7204            alter_set.set("expressions", [self._parse_properties()])
7205
7206        return alter_set
7207
7208    def _parse_alter(self) -> exp.Alter | exp.Command:
7209        start = self._prev
7210
7211        alter_token = self._match_set(self.ALTERABLES) and self._prev
7212        if not alter_token:
7213            return self._parse_as_command(start)
7214
7215        exists = self._parse_exists()
7216        only = self._match_text_seq("ONLY")
7217        this = self._parse_table(schema=True)
7218        cluster = self._parse_on_property() if self._match(TokenType.ON) else None
7219
7220        if self._next:
7221            self._advance()
7222
7223        parser = self.ALTER_PARSERS.get(self._prev.text.upper()) if self._prev else None
7224        if parser:
7225            actions = ensure_list(parser(self))
7226            not_valid = self._match_text_seq("NOT", "VALID")
7227            options = self._parse_csv(self._parse_property)
7228
7229            if not self._curr and actions:
7230                return self.expression(
7231                    exp.Alter,
7232                    this=this,
7233                    kind=alter_token.text.upper(),
7234                    exists=exists,
7235                    actions=actions,
7236                    only=only,
7237                    options=options,
7238                    cluster=cluster,
7239                    not_valid=not_valid,
7240                )
7241
7242        return self._parse_as_command(start)
7243
7244    def _parse_analyze(self) -> exp.Analyze | exp.Command:
7245        start = self._prev
7246        # https://duckdb.org/docs/sql/statements/analyze
7247        if not self._curr:
7248            return self.expression(exp.Analyze)
7249
7250        options = []
7251        while self._match_texts(self.ANALYZE_STYLES):
7252            if self._prev.text.upper() == "BUFFER_USAGE_LIMIT":
7253                options.append(f"BUFFER_USAGE_LIMIT {self._parse_number()}")
7254            else:
7255                options.append(self._prev.text.upper())
7256
7257        this: t.Optional[exp.Expression] = None
7258        inner_expression: t.Optional[exp.Expression] = None
7259
7260        kind = self._curr and self._curr.text.upper()
7261
7262        if self._match(TokenType.TABLE) or self._match(TokenType.INDEX):
7263            this = self._parse_table_parts()
7264        elif self._match_text_seq("TABLES"):
7265            if self._match_set((TokenType.FROM, TokenType.IN)):
7266                kind = f"{kind} {self._prev.text.upper()}"
7267                this = self._parse_table(schema=True, is_db_reference=True)
7268        elif self._match_text_seq("DATABASE"):
7269            this = self._parse_table(schema=True, is_db_reference=True)
7270        elif self._match_text_seq("CLUSTER"):
7271            this = self._parse_table()
7272        # Try matching inner expr keywords before fallback to parse table.
7273        elif self._match_texts(self.ANALYZE_EXPRESSION_PARSERS):
7274            kind = None
7275            inner_expression = self.ANALYZE_EXPRESSION_PARSERS[self._prev.text.upper()](self)
7276        else:
7277            # Empty kind  https://prestodb.io/docs/current/sql/analyze.html
7278            kind = None
7279            this = self._parse_table_parts()
7280
7281        partition = self._try_parse(self._parse_partition)
7282        if not partition and self._match_texts(self.PARTITION_KEYWORDS):
7283            return self._parse_as_command(start)
7284
7285        # https://docs.starrocks.io/docs/sql-reference/sql-statements/cbo_stats/ANALYZE_TABLE/
7286        if self._match_text_seq("WITH", "SYNC", "MODE") or self._match_text_seq(
7287            "WITH", "ASYNC", "MODE"
7288        ):
7289            mode = f"WITH {self._tokens[self._index-2].text.upper()} MODE"
7290        else:
7291            mode = None
7292
7293        if self._match_texts(self.ANALYZE_EXPRESSION_PARSERS):
7294            inner_expression = self.ANALYZE_EXPRESSION_PARSERS[self._prev.text.upper()](self)
7295
7296        properties = self._parse_properties()
7297        return self.expression(
7298            exp.Analyze,
7299            kind=kind,
7300            this=this,
7301            mode=mode,
7302            partition=partition,
7303            properties=properties,
7304            expression=inner_expression,
7305            options=options,
7306        )
7307
7308    # https://spark.apache.org/docs/3.5.1/sql-ref-syntax-aux-analyze-table.html
7309    def _parse_analyze_statistics(self) -> exp.AnalyzeStatistics:
7310        this = None
7311        kind = self._prev.text.upper()
7312        option = self._prev.text.upper() if self._match_text_seq("DELTA") else None
7313        expressions = []
7314
7315        if not self._match_text_seq("STATISTICS"):
7316            self.raise_error("Expecting token STATISTICS")
7317
7318        if self._match_text_seq("NOSCAN"):
7319            this = "NOSCAN"
7320        elif self._match(TokenType.FOR):
7321            if self._match_text_seq("ALL", "COLUMNS"):
7322                this = "FOR ALL COLUMNS"
7323            if self._match_texts("COLUMNS"):
7324                this = "FOR COLUMNS"
7325                expressions = self._parse_csv(self._parse_column_reference)
7326        elif self._match_text_seq("SAMPLE"):
7327            sample = self._parse_number()
7328            expressions = [
7329                self.expression(
7330                    exp.AnalyzeSample,
7331                    sample=sample,
7332                    kind=self._prev.text.upper() if self._match(TokenType.PERCENT) else None,
7333                )
7334            ]
7335
7336        return self.expression(
7337            exp.AnalyzeStatistics, kind=kind, option=option, this=this, expressions=expressions
7338        )
7339
7340    # https://docs.oracle.com/en/database/oracle/oracle-database/21/sqlrf/ANALYZE.html
7341    def _parse_analyze_validate(self) -> exp.AnalyzeValidate:
7342        kind = None
7343        this = None
7344        expression: t.Optional[exp.Expression] = None
7345        if self._match_text_seq("REF", "UPDATE"):
7346            kind = "REF"
7347            this = "UPDATE"
7348            if self._match_text_seq("SET", "DANGLING", "TO", "NULL"):
7349                this = "UPDATE SET DANGLING TO NULL"
7350        elif self._match_text_seq("STRUCTURE"):
7351            kind = "STRUCTURE"
7352            if self._match_text_seq("CASCADE", "FAST"):
7353                this = "CASCADE FAST"
7354            elif self._match_text_seq("CASCADE", "COMPLETE") and self._match_texts(
7355                ("ONLINE", "OFFLINE")
7356            ):
7357                this = f"CASCADE COMPLETE {self._prev.text.upper()}"
7358                expression = self._parse_into()
7359
7360        return self.expression(exp.AnalyzeValidate, kind=kind, this=this, expression=expression)
7361
7362    def _parse_analyze_columns(self) -> t.Optional[exp.AnalyzeColumns]:
7363        this = self._prev.text.upper()
7364        if self._match_text_seq("COLUMNS"):
7365            return self.expression(exp.AnalyzeColumns, this=f"{this} {self._prev.text.upper()}")
7366        return None
7367
7368    def _parse_analyze_delete(self) -> t.Optional[exp.AnalyzeDelete]:
7369        kind = self._prev.text.upper() if self._match_text_seq("SYSTEM") else None
7370        if self._match_text_seq("STATISTICS"):
7371            return self.expression(exp.AnalyzeDelete, kind=kind)
7372        return None
7373
7374    def _parse_analyze_list(self) -> t.Optional[exp.AnalyzeListChainedRows]:
7375        if self._match_text_seq("CHAINED", "ROWS"):
7376            return self.expression(exp.AnalyzeListChainedRows, expression=self._parse_into())
7377        return None
7378
7379    # https://dev.mysql.com/doc/refman/8.4/en/analyze-table.html
7380    def _parse_analyze_histogram(self) -> exp.AnalyzeHistogram:
7381        this = self._prev.text.upper()
7382        expression: t.Optional[exp.Expression] = None
7383        expressions = []
7384        update_options = None
7385
7386        if self._match_text_seq("HISTOGRAM", "ON"):
7387            expressions = self._parse_csv(self._parse_column_reference)
7388            with_expressions = []
7389            while self._match(TokenType.WITH):
7390                # https://docs.starrocks.io/docs/sql-reference/sql-statements/cbo_stats/ANALYZE_TABLE/
7391                if self._match_texts(("SYNC", "ASYNC")):
7392                    if self._match_text_seq("MODE", advance=False):
7393                        with_expressions.append(f"{self._prev.text.upper()} MODE")
7394                        self._advance()
7395                else:
7396                    buckets = self._parse_number()
7397                    if self._match_text_seq("BUCKETS"):
7398                        with_expressions.append(f"{buckets} BUCKETS")
7399            if with_expressions:
7400                expression = self.expression(exp.AnalyzeWith, expressions=with_expressions)
7401
7402            if self._match_texts(("MANUAL", "AUTO")) and self._match(
7403                TokenType.UPDATE, advance=False
7404            ):
7405                update_options = self._prev.text.upper()
7406                self._advance()
7407            elif self._match_text_seq("USING", "DATA"):
7408                expression = self.expression(exp.UsingData, this=self._parse_string())
7409
7410        return self.expression(
7411            exp.AnalyzeHistogram,
7412            this=this,
7413            expressions=expressions,
7414            expression=expression,
7415            update_options=update_options,
7416        )
7417
7418    def _parse_merge(self) -> exp.Merge:
7419        self._match(TokenType.INTO)
7420        target = self._parse_table()
7421
7422        if target and self._match(TokenType.ALIAS, advance=False):
7423            target.set("alias", self._parse_table_alias())
7424
7425        self._match(TokenType.USING)
7426        using = self._parse_table()
7427
7428        self._match(TokenType.ON)
7429        on = self._parse_assignment()
7430
7431        return self.expression(
7432            exp.Merge,
7433            this=target,
7434            using=using,
7435            on=on,
7436            whens=self._parse_when_matched(),
7437            returning=self._parse_returning(),
7438        )
7439
7440    def _parse_when_matched(self) -> exp.Whens:
7441        whens = []
7442
7443        while self._match(TokenType.WHEN):
7444            matched = not self._match(TokenType.NOT)
7445            self._match_text_seq("MATCHED")
7446            source = (
7447                False
7448                if self._match_text_seq("BY", "TARGET")
7449                else self._match_text_seq("BY", "SOURCE")
7450            )
7451            condition = self._parse_assignment() if self._match(TokenType.AND) else None
7452
7453            self._match(TokenType.THEN)
7454
7455            if self._match(TokenType.INSERT):
7456                this = self._parse_star()
7457                if this:
7458                    then: t.Optional[exp.Expression] = self.expression(exp.Insert, this=this)
7459                else:
7460                    then = self.expression(
7461                        exp.Insert,
7462                        this=exp.var("ROW") if self._match_text_seq("ROW") else self._parse_value(),
7463                        expression=self._match_text_seq("VALUES") and self._parse_value(),
7464                    )
7465            elif self._match(TokenType.UPDATE):
7466                expressions = self._parse_star()
7467                if expressions:
7468                    then = self.expression(exp.Update, expressions=expressions)
7469                else:
7470                    then = self.expression(
7471                        exp.Update,
7472                        expressions=self._match(TokenType.SET)
7473                        and self._parse_csv(self._parse_equality),
7474                    )
7475            elif self._match(TokenType.DELETE):
7476                then = self.expression(exp.Var, this=self._prev.text)
7477            else:
7478                then = self._parse_var_from_options(self.CONFLICT_ACTIONS)
7479
7480            whens.append(
7481                self.expression(
7482                    exp.When,
7483                    matched=matched,
7484                    source=source,
7485                    condition=condition,
7486                    then=then,
7487                )
7488            )
7489        return self.expression(exp.Whens, expressions=whens)
7490
7491    def _parse_show(self) -> t.Optional[exp.Expression]:
7492        parser = self._find_parser(self.SHOW_PARSERS, self.SHOW_TRIE)
7493        if parser:
7494            return parser(self)
7495        return self._parse_as_command(self._prev)
7496
7497    def _parse_set_item_assignment(
7498        self, kind: t.Optional[str] = None
7499    ) -> t.Optional[exp.Expression]:
7500        index = self._index
7501
7502        if kind in ("GLOBAL", "SESSION") and self._match_text_seq("TRANSACTION"):
7503            return self._parse_set_transaction(global_=kind == "GLOBAL")
7504
7505        left = self._parse_primary() or self._parse_column()
7506        assignment_delimiter = self._match_texts(("=", "TO"))
7507
7508        if not left or (self.SET_REQUIRES_ASSIGNMENT_DELIMITER and not assignment_delimiter):
7509            self._retreat(index)
7510            return None
7511
7512        right = self._parse_statement() or self._parse_id_var()
7513        if isinstance(right, (exp.Column, exp.Identifier)):
7514            right = exp.var(right.name)
7515
7516        this = self.expression(exp.EQ, this=left, expression=right)
7517        return self.expression(exp.SetItem, this=this, kind=kind)
7518
7519    def _parse_set_transaction(self, global_: bool = False) -> exp.Expression:
7520        self._match_text_seq("TRANSACTION")
7521        characteristics = self._parse_csv(
7522            lambda: self._parse_var_from_options(self.TRANSACTION_CHARACTERISTICS)
7523        )
7524        return self.expression(
7525            exp.SetItem,
7526            expressions=characteristics,
7527            kind="TRANSACTION",
7528            **{"global": global_},  # type: ignore
7529        )
7530
7531    def _parse_set_item(self) -> t.Optional[exp.Expression]:
7532        parser = self._find_parser(self.SET_PARSERS, self.SET_TRIE)
7533        return parser(self) if parser else self._parse_set_item_assignment(kind=None)
7534
7535    def _parse_set(self, unset: bool = False, tag: bool = False) -> exp.Set | exp.Command:
7536        index = self._index
7537        set_ = self.expression(
7538            exp.Set, expressions=self._parse_csv(self._parse_set_item), unset=unset, tag=tag
7539        )
7540
7541        if self._curr:
7542            self._retreat(index)
7543            return self._parse_as_command(self._prev)
7544
7545        return set_
7546
7547    def _parse_var_from_options(
7548        self, options: OPTIONS_TYPE, raise_unmatched: bool = True
7549    ) -> t.Optional[exp.Var]:
7550        start = self._curr
7551        if not start:
7552            return None
7553
7554        option = start.text.upper()
7555        continuations = options.get(option)
7556
7557        index = self._index
7558        self._advance()
7559        for keywords in continuations or []:
7560            if isinstance(keywords, str):
7561                keywords = (keywords,)
7562
7563            if self._match_text_seq(*keywords):
7564                option = f"{option} {' '.join(keywords)}"
7565                break
7566        else:
7567            if continuations or continuations is None:
7568                if raise_unmatched:
7569                    self.raise_error(f"Unknown option {option}")
7570
7571                self._retreat(index)
7572                return None
7573
7574        return exp.var(option)
7575
7576    def _parse_as_command(self, start: Token) -> exp.Command:
7577        while self._curr:
7578            self._advance()
7579        text = self._find_sql(start, self._prev)
7580        size = len(start.text)
7581        self._warn_unsupported()
7582        return exp.Command(this=text[:size], expression=text[size:])
7583
7584    def _parse_dict_property(self, this: str) -> exp.DictProperty:
7585        settings = []
7586
7587        self._match_l_paren()
7588        kind = self._parse_id_var()
7589
7590        if self._match(TokenType.L_PAREN):
7591            while True:
7592                key = self._parse_id_var()
7593                value = self._parse_primary()
7594                if not key and value is None:
7595                    break
7596                settings.append(self.expression(exp.DictSubProperty, this=key, value=value))
7597            self._match(TokenType.R_PAREN)
7598
7599        self._match_r_paren()
7600
7601        return self.expression(
7602            exp.DictProperty,
7603            this=this,
7604            kind=kind.this if kind else None,
7605            settings=settings,
7606        )
7607
7608    def _parse_dict_range(self, this: str) -> exp.DictRange:
7609        self._match_l_paren()
7610        has_min = self._match_text_seq("MIN")
7611        if has_min:
7612            min = self._parse_var() or self._parse_primary()
7613            self._match_text_seq("MAX")
7614            max = self._parse_var() or self._parse_primary()
7615        else:
7616            max = self._parse_var() or self._parse_primary()
7617            min = exp.Literal.number(0)
7618        self._match_r_paren()
7619        return self.expression(exp.DictRange, this=this, min=min, max=max)
7620
7621    def _parse_comprehension(
7622        self, this: t.Optional[exp.Expression]
7623    ) -> t.Optional[exp.Comprehension]:
7624        index = self._index
7625        expression = self._parse_column()
7626        if not self._match(TokenType.IN):
7627            self._retreat(index - 1)
7628            return None
7629        iterator = self._parse_column()
7630        condition = self._parse_assignment() if self._match_text_seq("IF") else None
7631        return self.expression(
7632            exp.Comprehension,
7633            this=this,
7634            expression=expression,
7635            iterator=iterator,
7636            condition=condition,
7637        )
7638
7639    def _parse_heredoc(self) -> t.Optional[exp.Heredoc]:
7640        if self._match(TokenType.HEREDOC_STRING):
7641            return self.expression(exp.Heredoc, this=self._prev.text)
7642
7643        if not self._match_text_seq("$"):
7644            return None
7645
7646        tags = ["$"]
7647        tag_text = None
7648
7649        if self._is_connected():
7650            self._advance()
7651            tags.append(self._prev.text.upper())
7652        else:
7653            self.raise_error("No closing $ found")
7654
7655        if tags[-1] != "$":
7656            if self._is_connected() and self._match_text_seq("$"):
7657                tag_text = tags[-1]
7658                tags.append("$")
7659            else:
7660                self.raise_error("No closing $ found")
7661
7662        heredoc_start = self._curr
7663
7664        while self._curr:
7665            if self._match_text_seq(*tags, advance=False):
7666                this = self._find_sql(heredoc_start, self._prev)
7667                self._advance(len(tags))
7668                return self.expression(exp.Heredoc, this=this, tag=tag_text)
7669
7670            self._advance()
7671
7672        self.raise_error(f"No closing {''.join(tags)} found")
7673        return None
7674
7675    def _find_parser(
7676        self, parsers: t.Dict[str, t.Callable], trie: t.Dict
7677    ) -> t.Optional[t.Callable]:
7678        if not self._curr:
7679            return None
7680
7681        index = self._index
7682        this = []
7683        while True:
7684            # The current token might be multiple words
7685            curr = self._curr.text.upper()
7686            key = curr.split(" ")
7687            this.append(curr)
7688
7689            self._advance()
7690            result, trie = in_trie(trie, key)
7691            if result == TrieResult.FAILED:
7692                break
7693
7694            if result == TrieResult.EXISTS:
7695                subparser = parsers[" ".join(this)]
7696                return subparser
7697
7698        self._retreat(index)
7699        return None
7700
7701    def _match(self, token_type, advance=True, expression=None):
7702        if not self._curr:
7703            return None
7704
7705        if self._curr.token_type == token_type:
7706            if advance:
7707                self._advance()
7708            self._add_comments(expression)
7709            return True
7710
7711        return None
7712
7713    def _match_set(self, types, advance=True):
7714        if not self._curr:
7715            return None
7716
7717        if self._curr.token_type in types:
7718            if advance:
7719                self._advance()
7720            return True
7721
7722        return None
7723
7724    def _match_pair(self, token_type_a, token_type_b, advance=True):
7725        if not self._curr or not self._next:
7726            return None
7727
7728        if self._curr.token_type == token_type_a and self._next.token_type == token_type_b:
7729            if advance:
7730                self._advance(2)
7731            return True
7732
7733        return None
7734
7735    def _match_l_paren(self, expression: t.Optional[exp.Expression] = None) -> None:
7736        if not self._match(TokenType.L_PAREN, expression=expression):
7737            self.raise_error("Expecting (")
7738
7739    def _match_r_paren(self, expression: t.Optional[exp.Expression] = None) -> None:
7740        if not self._match(TokenType.R_PAREN, expression=expression):
7741            self.raise_error("Expecting )")
7742
7743    def _match_texts(self, texts, advance=True):
7744        if (
7745            self._curr
7746            and self._curr.token_type != TokenType.STRING
7747            and self._curr.text.upper() in texts
7748        ):
7749            if advance:
7750                self._advance()
7751            return True
7752        return None
7753
7754    def _match_text_seq(self, *texts, advance=True):
7755        index = self._index
7756        for text in texts:
7757            if (
7758                self._curr
7759                and self._curr.token_type != TokenType.STRING
7760                and self._curr.text.upper() == text
7761            ):
7762                self._advance()
7763            else:
7764                self._retreat(index)
7765                return None
7766
7767        if not advance:
7768            self._retreat(index)
7769
7770        return True
7771
7772    def _replace_lambda(
7773        self, node: t.Optional[exp.Expression], expressions: t.List[exp.Expression]
7774    ) -> t.Optional[exp.Expression]:
7775        if not node:
7776            return node
7777
7778        lambda_types = {e.name: e.args.get("to") or False for e in expressions}
7779
7780        for column in node.find_all(exp.Column):
7781            typ = lambda_types.get(column.parts[0].name)
7782            if typ is not None:
7783                dot_or_id = column.to_dot() if column.table else column.this
7784
7785                if typ:
7786                    dot_or_id = self.expression(
7787                        exp.Cast,
7788                        this=dot_or_id,
7789                        to=typ,
7790                    )
7791
7792                parent = column.parent
7793
7794                while isinstance(parent, exp.Dot):
7795                    if not isinstance(parent.parent, exp.Dot):
7796                        parent.replace(dot_or_id)
7797                        break
7798                    parent = parent.parent
7799                else:
7800                    if column is node:
7801                        node = dot_or_id
7802                    else:
7803                        column.replace(dot_or_id)
7804        return node
7805
7806    def _parse_truncate_table(self) -> t.Optional[exp.TruncateTable] | exp.Expression:
7807        start = self._prev
7808
7809        # Not to be confused with TRUNCATE(number, decimals) function call
7810        if self._match(TokenType.L_PAREN):
7811            self._retreat(self._index - 2)
7812            return self._parse_function()
7813
7814        # Clickhouse supports TRUNCATE DATABASE as well
7815        is_database = self._match(TokenType.DATABASE)
7816
7817        self._match(TokenType.TABLE)
7818
7819        exists = self._parse_exists(not_=False)
7820
7821        expressions = self._parse_csv(
7822            lambda: self._parse_table(schema=True, is_db_reference=is_database)
7823        )
7824
7825        cluster = self._parse_on_property() if self._match(TokenType.ON) else None
7826
7827        if self._match_text_seq("RESTART", "IDENTITY"):
7828            identity = "RESTART"
7829        elif self._match_text_seq("CONTINUE", "IDENTITY"):
7830            identity = "CONTINUE"
7831        else:
7832            identity = None
7833
7834        if self._match_text_seq("CASCADE") or self._match_text_seq("RESTRICT"):
7835            option = self._prev.text
7836        else:
7837            option = None
7838
7839        partition = self._parse_partition()
7840
7841        # Fallback case
7842        if self._curr:
7843            return self._parse_as_command(start)
7844
7845        return self.expression(
7846            exp.TruncateTable,
7847            expressions=expressions,
7848            is_database=is_database,
7849            exists=exists,
7850            cluster=cluster,
7851            identity=identity,
7852            option=option,
7853            partition=partition,
7854        )
7855
7856    def _parse_with_operator(self) -> t.Optional[exp.Expression]:
7857        this = self._parse_ordered(self._parse_opclass)
7858
7859        if not self._match(TokenType.WITH):
7860            return this
7861
7862        op = self._parse_var(any_token=True)
7863
7864        return self.expression(exp.WithOperator, this=this, op=op)
7865
7866    def _parse_wrapped_options(self) -> t.List[t.Optional[exp.Expression]]:
7867        self._match(TokenType.EQ)
7868        self._match(TokenType.L_PAREN)
7869
7870        opts: t.List[t.Optional[exp.Expression]] = []
7871        while self._curr and not self._match(TokenType.R_PAREN):
7872            if self._match_text_seq("FORMAT_NAME", "="):
7873                # The FORMAT_NAME can be set to an identifier for Snowflake and T-SQL,
7874                # so we parse it separately to use _parse_field()
7875                prop = self.expression(
7876                    exp.Property, this=exp.var("FORMAT_NAME"), value=self._parse_field()
7877                )
7878                opts.append(prop)
7879            else:
7880                opts.append(self._parse_property())
7881
7882            self._match(TokenType.COMMA)
7883
7884        return opts
7885
7886    def _parse_copy_parameters(self) -> t.List[exp.CopyParameter]:
7887        sep = TokenType.COMMA if self.dialect.COPY_PARAMS_ARE_CSV else None
7888
7889        options = []
7890        while self._curr and not self._match(TokenType.R_PAREN, advance=False):
7891            option = self._parse_var(any_token=True)
7892            prev = self._prev.text.upper()
7893
7894            # Different dialects might separate options and values by white space, "=" and "AS"
7895            self._match(TokenType.EQ)
7896            self._match(TokenType.ALIAS)
7897
7898            param = self.expression(exp.CopyParameter, this=option)
7899
7900            if prev in self.COPY_INTO_VARLEN_OPTIONS and self._match(
7901                TokenType.L_PAREN, advance=False
7902            ):
7903                # Snowflake FILE_FORMAT case, Databricks COPY & FORMAT options
7904                param.set("expressions", self._parse_wrapped_options())
7905            elif prev == "FILE_FORMAT":
7906                # T-SQL's external file format case
7907                param.set("expression", self._parse_field())
7908            else:
7909                param.set("expression", self._parse_unquoted_field())
7910
7911            options.append(param)
7912            self._match(sep)
7913
7914        return options
7915
7916    def _parse_credentials(self) -> t.Optional[exp.Credentials]:
7917        expr = self.expression(exp.Credentials)
7918
7919        if self._match_text_seq("STORAGE_INTEGRATION", "="):
7920            expr.set("storage", self._parse_field())
7921        if self._match_text_seq("CREDENTIALS"):
7922            # Snowflake case: CREDENTIALS = (...), Redshift case: CREDENTIALS <string>
7923            creds = (
7924                self._parse_wrapped_options() if self._match(TokenType.EQ) else self._parse_field()
7925            )
7926            expr.set("credentials", creds)
7927        if self._match_text_seq("ENCRYPTION"):
7928            expr.set("encryption", self._parse_wrapped_options())
7929        if self._match_text_seq("IAM_ROLE"):
7930            expr.set("iam_role", self._parse_field())
7931        if self._match_text_seq("REGION"):
7932            expr.set("region", self._parse_field())
7933
7934        return expr
7935
7936    def _parse_file_location(self) -> t.Optional[exp.Expression]:
7937        return self._parse_field()
7938
7939    def _parse_copy(self) -> exp.Copy | exp.Command:
7940        start = self._prev
7941
7942        self._match(TokenType.INTO)
7943
7944        this = (
7945            self._parse_select(nested=True, parse_subquery_alias=False)
7946            if self._match(TokenType.L_PAREN, advance=False)
7947            else self._parse_table(schema=True)
7948        )
7949
7950        kind = self._match(TokenType.FROM) or not self._match_text_seq("TO")
7951
7952        files = self._parse_csv(self._parse_file_location)
7953        credentials = self._parse_credentials()
7954
7955        self._match_text_seq("WITH")
7956
7957        params = self._parse_wrapped(self._parse_copy_parameters, optional=True)
7958
7959        # Fallback case
7960        if self._curr:
7961            return self._parse_as_command(start)
7962
7963        return self.expression(
7964            exp.Copy,
7965            this=this,
7966            kind=kind,
7967            credentials=credentials,
7968            files=files,
7969            params=params,
7970        )
7971
7972    def _parse_normalize(self) -> exp.Normalize:
7973        return self.expression(
7974            exp.Normalize,
7975            this=self._parse_bitwise(),
7976            form=self._match(TokenType.COMMA) and self._parse_var(),
7977        )
7978
7979    def _parse_ceil_floor(self, expr_type: t.Type[TCeilFloor]) -> TCeilFloor:
7980        args = self._parse_csv(lambda: self._parse_lambda())
7981
7982        this = seq_get(args, 0)
7983        decimals = seq_get(args, 1)
7984
7985        return expr_type(
7986            this=this, decimals=decimals, to=self._match_text_seq("TO") and self._parse_var()
7987        )
7988
7989    def _parse_star_ops(self) -> t.Optional[exp.Expression]:
7990        if self._match_text_seq("COLUMNS", "(", advance=False):
7991            this = self._parse_function()
7992            if isinstance(this, exp.Columns):
7993                this.set("unpack", True)
7994            return this
7995
7996        return self.expression(
7997            exp.Star,
7998            **{  # type: ignore
7999                "except": self._parse_star_op("EXCEPT", "EXCLUDE"),
8000                "replace": self._parse_star_op("REPLACE"),
8001                "rename": self._parse_star_op("RENAME"),
8002            },
8003        )
8004
8005    def _parse_grant_privilege(self) -> t.Optional[exp.GrantPrivilege]:
8006        privilege_parts = []
8007
8008        # Keep consuming consecutive keywords until comma (end of this privilege) or ON
8009        # (end of privilege list) or L_PAREN (start of column list) are met
8010        while self._curr and not self._match_set(self.PRIVILEGE_FOLLOW_TOKENS, advance=False):
8011            privilege_parts.append(self._curr.text.upper())
8012            self._advance()
8013
8014        this = exp.var(" ".join(privilege_parts))
8015        expressions = (
8016            self._parse_wrapped_csv(self._parse_column)
8017            if self._match(TokenType.L_PAREN, advance=False)
8018            else None
8019        )
8020
8021        return self.expression(exp.GrantPrivilege, this=this, expressions=expressions)
8022
8023    def _parse_grant_principal(self) -> t.Optional[exp.GrantPrincipal]:
8024        kind = self._match_texts(("ROLE", "GROUP")) and self._prev.text.upper()
8025        principal = self._parse_id_var()
8026
8027        if not principal:
8028            return None
8029
8030        return self.expression(exp.GrantPrincipal, this=principal, kind=kind)
8031
8032    def _parse_grant(self) -> exp.Grant | exp.Command:
8033        start = self._prev
8034
8035        privileges = self._parse_csv(self._parse_grant_privilege)
8036
8037        self._match(TokenType.ON)
8038        kind = self._match_set(self.CREATABLES) and self._prev.text.upper()
8039
8040        # Attempt to parse the securable e.g. MySQL allows names
8041        # such as "foo.*", "*.*" which are not easily parseable yet
8042        securable = self._try_parse(self._parse_table_parts)
8043
8044        if not securable or not self._match_text_seq("TO"):
8045            return self._parse_as_command(start)
8046
8047        principals = self._parse_csv(self._parse_grant_principal)
8048
8049        grant_option = self._match_text_seq("WITH", "GRANT", "OPTION")
8050
8051        if self._curr:
8052            return self._parse_as_command(start)
8053
8054        return self.expression(
8055            exp.Grant,
8056            privileges=privileges,
8057            kind=kind,
8058            securable=securable,
8059            principals=principals,
8060            grant_option=grant_option,
8061        )
8062
8063    def _parse_overlay(self) -> exp.Overlay:
8064        return self.expression(
8065            exp.Overlay,
8066            **{  # type: ignore
8067                "this": self._parse_bitwise(),
8068                "expression": self._match_text_seq("PLACING") and self._parse_bitwise(),
8069                "from": self._match_text_seq("FROM") and self._parse_bitwise(),
8070                "for": self._match_text_seq("FOR") and self._parse_bitwise(),
8071            },
8072        )

logger = <Logger sqlglot (WARNING)>

OPTIONS_TYPE = typing.Dict[str, typing.Sequence[typing.Union[typing.Sequence[str], str]]]

def build_var_map(args: List) -> sqlglot.expressions.StarMap | sqlglot.expressions.VarMap: View Source

27def build_var_map(args: t.List) -> exp.StarMap | exp.VarMap:
28    if len(args) == 1 and args[0].is_star:
29        return exp.StarMap(this=args[0])
30
31    keys = []
32    values = []
33    for i in range(0, len(args), 2):
34        keys.append(args[i])
35        values.append(args[i + 1])
36
37    return exp.VarMap(keys=exp.array(*keys, copy=False), values=exp.array(*values, copy=False))

def build_like(args: List) -> sqlglot.expressions.Escape | sqlglot.expressions.Like: View Source

40def build_like(args: t.List) -> exp.Escape | exp.Like:
41    like = exp.Like(this=seq_get(args, 1), expression=seq_get(args, 0))
42    return exp.Escape(this=like, expression=seq_get(args, 2)) if len(args) > 2 else like

def binary_range_parser( expr_type: Type[sqlglot.expressions.Expression], reverse_args: bool = False) -> Callable[[Parser, Optional[sqlglot.expressions.Expression]], Optional[sqlglot.expressions.Expression]]: View Source

45def binary_range_parser(
46    expr_type: t.Type[exp.Expression], reverse_args: bool = False
47) -> t.Callable[[Parser, t.Optional[exp.Expression]], t.Optional[exp.Expression]]:
48    def _parse_binary_range(
49        self: Parser, this: t.Optional[exp.Expression]
50    ) -> t.Optional[exp.Expression]:
51        expression = self._parse_bitwise()
52        if reverse_args:
53            this, expression = expression, this
54        return self._parse_escape(self.expression(expr_type, this=this, expression=expression))
55
56    return _parse_binary_range

def build_logarithm( args: List, dialect: sqlglot.dialects.Dialect) -> sqlglot.expressions.Func: View Source

59def build_logarithm(args: t.List, dialect: Dialect) -> exp.Func:
60    # Default argument order is base, expression
61    this = seq_get(args, 0)
62    expression = seq_get(args, 1)
63
64    if expression:
65        if not dialect.LOG_BASE_FIRST:
66            this, expression = expression, this
67        return exp.Log(this=this, expression=expression)
68
69    return (exp.Ln if dialect.parser_class.LOG_DEFAULTS_TO_LN else exp.Log)(this=this)

def build_hex( args: List, dialect: sqlglot.dialects.Dialect) -> sqlglot.expressions.Hex | sqlglot.expressions.LowerHex: View Source

72def build_hex(args: t.List, dialect: Dialect) -> exp.Hex | exp.LowerHex:
73    arg = seq_get(args, 0)
74    return exp.LowerHex(this=arg) if dialect.HEX_LOWERCASE else exp.Hex(this=arg)

def build_lower(args: List) -> sqlglot.expressions.Lower | sqlglot.expressions.Hex: View Source

77def build_lower(args: t.List) -> exp.Lower | exp.Hex:
78    # LOWER(HEX(..)) can be simplified to LowerHex to simplify its transpilation
79    arg = seq_get(args, 0)
80    return exp.LowerHex(this=arg.this) if isinstance(arg, exp.Hex) else exp.Lower(this=arg)

def build_upper(args: List) -> sqlglot.expressions.Upper | sqlglot.expressions.Hex: View Source

83def build_upper(args: t.List) -> exp.Upper | exp.Hex:
84    # UPPER(HEX(..)) can be simplified to Hex to simplify its transpilation
85    arg = seq_get(args, 0)
86    return exp.Hex(this=arg.this) if isinstance(arg, exp.Hex) else exp.Upper(this=arg)

def build_extract_json_with_path( expr_type: Type[~E]) -> Callable[[List, sqlglot.dialects.Dialect], ~E]: View Source

89def build_extract_json_with_path(expr_type: t.Type[E]) -> t.Callable[[t.List, Dialect], E]:
90    def _builder(args: t.List, dialect: Dialect) -> E:
91        expression = expr_type(
92            this=seq_get(args, 0), expression=dialect.to_json_path(seq_get(args, 1))
93        )
94        if len(args) > 2 and expr_type is exp.JSONExtract:
95            expression.set("expressions", args[2:])
96
97        return expression
98
99    return _builder

def build_mod(args: List) -> sqlglot.expressions.Mod: View Source

102def build_mod(args: t.List) -> exp.Mod:
103    this = seq_get(args, 0)
104    expression = seq_get(args, 1)
105
106    # Wrap the operands if they are binary nodes, e.g. MOD(a + 1, 7) -> (a + 1) % 7
107    this = exp.Paren(this=this) if isinstance(this, exp.Binary) else this
108    expression = exp.Paren(this=expression) if isinstance(expression, exp.Binary) else expression
109
110    return exp.Mod(this=this, expression=expression)

def build_pad(args: List, is_left: bool = True): View Source

113def build_pad(args: t.List, is_left: bool = True):
114    return exp.Pad(
115        this=seq_get(args, 0),
116        expression=seq_get(args, 1),
117        fill_pattern=seq_get(args, 2),
118        is_left=is_left,
119    )

def build_array_constructor( exp_class: Type[~E], args: List, bracket_kind: sqlglot.tokens.TokenType, dialect: sqlglot.dialects.Dialect) -> sqlglot.expressions.Expression: View Source

122def build_array_constructor(
123    exp_class: t.Type[E], args: t.List, bracket_kind: TokenType, dialect: Dialect
124) -> exp.Expression:
125    array_exp = exp_class(expressions=args)
126
127    if exp_class == exp.Array and dialect.HAS_DISTINCT_ARRAY_CONSTRUCTORS:
128        array_exp.set("bracket_notation", bracket_kind == TokenType.L_BRACKET)
129
130    return array_exp

def build_convert_timezone( args: List, default_source_tz: Optional[str] = None) -> Union[sqlglot.expressions.ConvertTimezone, sqlglot.expressions.Anonymous]: View Source

133def build_convert_timezone(
134    args: t.List, default_source_tz: t.Optional[str] = None
135) -> t.Union[exp.ConvertTimezone, exp.Anonymous]:
136    if len(args) == 2:
137        source_tz = exp.Literal.string(default_source_tz) if default_source_tz else None
138        return exp.ConvertTimezone(
139            source_tz=source_tz, target_tz=seq_get(args, 0), timestamp=seq_get(args, 1)
140        )
141
142    return exp.ConvertTimezone.from_arg_list(args)

def build_trim(args: List, is_left: bool = True): View Source

145def build_trim(args: t.List, is_left: bool = True):
146    return exp.Trim(
147        this=seq_get(args, 0),
148        expression=seq_get(args, 1),
149        position="LEADING" if is_left else "TRAILING",
150    )

def build_coalesce( args: List, is_nvl: Optional[bool] = None) -> sqlglot.expressions.Coalesce: View Source

153def build_coalesce(args: t.List, is_nvl: t.Optional[bool] = None) -> exp.Coalesce:
154    return exp.Coalesce(this=seq_get(args, 0), expressions=args[1:], is_nvl=is_nvl)

def build_locate_strposition(args: List): View Source

157def build_locate_strposition(args: t.List):
158    return exp.StrPosition(
159        this=seq_get(args, 1),
160        substr=seq_get(args, 0),
161        position=seq_get(args, 2),
162    )

sqlglot.parser

Arguments:

Arguments:

Returns:

Arguments:

Returns:

Arguments:

Returns:

Arguments:

Returns: