Edit on GitHub

sqlglot.parser

View Source

   1from __future__ import annotations
   2
   3import logging
   4import typing as t
   5from collections import defaultdict
   6
   7from sqlglot import exp
   8from sqlglot.errors import ErrorLevel, ParseError, concat_messages, merge_errors
   9from sqlglot.helper import apply_index_offset, ensure_list, seq_get
  10from sqlglot.time import format_time
  11from sqlglot.tokens import Token, Tokenizer, TokenType
  12from sqlglot.trie import TrieResult, in_trie, new_trie
  13
  14if t.TYPE_CHECKING:
  15    from sqlglot._typing import E, Lit
  16    from sqlglot.dialects.dialect import Dialect, DialectType
  17
  18    T = t.TypeVar("T")
  19
  20logger = logging.getLogger("sqlglot")
  21
  22OPTIONS_TYPE = t.Dict[str, t.Sequence[t.Union[t.Sequence[str], str]]]
  23
  24
  25def build_var_map(args: t.List) -> exp.StarMap | exp.VarMap:
  26    if len(args) == 1 and args[0].is_star:
  27        return exp.StarMap(this=args[0])
  28
  29    keys = []
  30    values = []
  31    for i in range(0, len(args), 2):
  32        keys.append(args[i])
  33        values.append(args[i + 1])
  34
  35    return exp.VarMap(keys=exp.array(*keys, copy=False), values=exp.array(*values, copy=False))
  36
  37
  38def build_like(args: t.List) -> exp.Escape | exp.Like:
  39    like = exp.Like(this=seq_get(args, 1), expression=seq_get(args, 0))
  40    return exp.Escape(this=like, expression=seq_get(args, 2)) if len(args) > 2 else like
  41
  42
  43def binary_range_parser(
  44    expr_type: t.Type[exp.Expression], reverse_args: bool = False
  45) -> t.Callable[[Parser, t.Optional[exp.Expression]], t.Optional[exp.Expression]]:
  46    def _parse_binary_range(
  47        self: Parser, this: t.Optional[exp.Expression]
  48    ) -> t.Optional[exp.Expression]:
  49        expression = self._parse_bitwise()
  50        if reverse_args:
  51            this, expression = expression, this
  52        return self._parse_escape(self.expression(expr_type, this=this, expression=expression))
  53
  54    return _parse_binary_range
  55
  56
  57def build_logarithm(args: t.List, dialect: Dialect) -> exp.Func:
  58    # Default argument order is base, expression
  59    this = seq_get(args, 0)
  60    expression = seq_get(args, 1)
  61
  62    if expression:
  63        if not dialect.LOG_BASE_FIRST:
  64            this, expression = expression, this
  65        return exp.Log(this=this, expression=expression)
  66
  67    return (exp.Ln if dialect.parser_class.LOG_DEFAULTS_TO_LN else exp.Log)(this=this)
  68
  69
  70def build_hex(args: t.List, dialect: Dialect) -> exp.Hex | exp.LowerHex:
  71    arg = seq_get(args, 0)
  72    return exp.LowerHex(this=arg) if dialect.HEX_LOWERCASE else exp.Hex(this=arg)
  73
  74
  75def build_lower(args: t.List) -> exp.Lower | exp.Hex:
  76    # LOWER(HEX(..)) can be simplified to LowerHex to simplify its transpilation
  77    arg = seq_get(args, 0)
  78    return exp.LowerHex(this=arg.this) if isinstance(arg, exp.Hex) else exp.Lower(this=arg)
  79
  80
  81def build_upper(args: t.List) -> exp.Upper | exp.Hex:
  82    # UPPER(HEX(..)) can be simplified to Hex to simplify its transpilation
  83    arg = seq_get(args, 0)
  84    return exp.Hex(this=arg.this) if isinstance(arg, exp.Hex) else exp.Upper(this=arg)
  85
  86
  87def build_extract_json_with_path(expr_type: t.Type[E]) -> t.Callable[[t.List, Dialect], E]:
  88    def _builder(args: t.List, dialect: Dialect) -> E:
  89        expression = expr_type(
  90            this=seq_get(args, 0), expression=dialect.to_json_path(seq_get(args, 1))
  91        )
  92        if len(args) > 2 and expr_type is exp.JSONExtract:
  93            expression.set("expressions", args[2:])
  94
  95        return expression
  96
  97    return _builder
  98
  99
 100def build_mod(args: t.List) -> exp.Mod:
 101    this = seq_get(args, 0)
 102    expression = seq_get(args, 1)
 103
 104    # Wrap the operands if they are binary nodes, e.g. MOD(a + 1, 7) -> (a + 1) % 7
 105    this = exp.Paren(this=this) if isinstance(this, exp.Binary) else this
 106    expression = exp.Paren(this=expression) if isinstance(expression, exp.Binary) else expression
 107
 108    return exp.Mod(this=this, expression=expression)
 109
 110
 111def build_pad(args: t.List, is_left: bool = True):
 112    return exp.Pad(
 113        this=seq_get(args, 0),
 114        expression=seq_get(args, 1),
 115        fill_pattern=seq_get(args, 2),
 116        is_left=is_left,
 117    )
 118
 119
 120def build_array_constructor(
 121    exp_class: t.Type[E], args: t.List, bracket_kind: TokenType, dialect: Dialect
 122) -> exp.Expression:
 123    array_exp = exp_class(expressions=args)
 124
 125    if exp_class == exp.Array and dialect.HAS_DISTINCT_ARRAY_CONSTRUCTORS:
 126        array_exp.set("bracket_notation", bracket_kind == TokenType.L_BRACKET)
 127
 128    return array_exp
 129
 130
 131def build_convert_timezone(
 132    args: t.List, default_source_tz: t.Optional[str] = None
 133) -> t.Union[exp.ConvertTimezone, exp.Anonymous]:
 134    if len(args) == 2:
 135        source_tz = exp.Literal.string(default_source_tz) if default_source_tz else None
 136        return exp.ConvertTimezone(
 137            source_tz=source_tz, target_tz=seq_get(args, 0), timestamp=seq_get(args, 1)
 138        )
 139
 140    return exp.ConvertTimezone.from_arg_list(args)
 141
 142
 143def build_trim(args: t.List, is_left: bool = True):
 144    return exp.Trim(
 145        this=seq_get(args, 0),
 146        expression=seq_get(args, 1),
 147        position="LEADING" if is_left else "TRAILING",
 148    )
 149
 150
 151def build_coalesce(args: t.List, is_nvl: t.Optional[bool] = None) -> exp.Coalesce:
 152    return exp.Coalesce(this=seq_get(args, 0), expressions=args[1:], is_nvl=is_nvl)
 153
 154
 155class _Parser(type):
 156    def __new__(cls, clsname, bases, attrs):
 157        klass = super().__new__(cls, clsname, bases, attrs)
 158
 159        klass.SHOW_TRIE = new_trie(key.split(" ") for key in klass.SHOW_PARSERS)
 160        klass.SET_TRIE = new_trie(key.split(" ") for key in klass.SET_PARSERS)
 161
 162        return klass
 163
 164
 165class Parser(metaclass=_Parser):
 166    """
 167    Parser consumes a list of tokens produced by the Tokenizer and produces a parsed syntax tree.
 168
 169    Args:
 170        error_level: The desired error level.
 171            Default: ErrorLevel.IMMEDIATE
 172        error_message_context: The amount of context to capture from a query string when displaying
 173            the error message (in number of characters).
 174            Default: 100
 175        max_errors: Maximum number of error messages to include in a raised ParseError.
 176            This is only relevant if error_level is ErrorLevel.RAISE.
 177            Default: 3
 178    """
 179
 180    FUNCTIONS: t.Dict[str, t.Callable] = {
 181        **{name: func.from_arg_list for name, func in exp.FUNCTION_BY_NAME.items()},
 182        **dict.fromkeys(("COALESCE", "IFNULL", "NVL"), build_coalesce),
 183        "ARRAY": lambda args, dialect: exp.Array(expressions=args),
 184        "ARRAYAGG": lambda args, dialect: exp.ArrayAgg(
 185            this=seq_get(args, 0), nulls_excluded=dialect.ARRAY_AGG_INCLUDES_NULLS is None or None
 186        ),
 187        "ARRAY_AGG": lambda args, dialect: exp.ArrayAgg(
 188            this=seq_get(args, 0), nulls_excluded=dialect.ARRAY_AGG_INCLUDES_NULLS is None or None
 189        ),
 190        "COUNT": lambda args: exp.Count(this=seq_get(args, 0), expressions=args[1:], big_int=True),
 191        "CONCAT": lambda args, dialect: exp.Concat(
 192            expressions=args,
 193            safe=not dialect.STRICT_STRING_CONCAT,
 194            coalesce=dialect.CONCAT_COALESCE,
 195        ),
 196        "CONCAT_WS": lambda args, dialect: exp.ConcatWs(
 197            expressions=args,
 198            safe=not dialect.STRICT_STRING_CONCAT,
 199            coalesce=dialect.CONCAT_COALESCE,
 200        ),
 201        "CONVERT_TIMEZONE": build_convert_timezone,
 202        "DATE_TO_DATE_STR": lambda args: exp.Cast(
 203            this=seq_get(args, 0),
 204            to=exp.DataType(this=exp.DataType.Type.TEXT),
 205        ),
 206        "GENERATE_DATE_ARRAY": lambda args: exp.GenerateDateArray(
 207            start=seq_get(args, 0),
 208            end=seq_get(args, 1),
 209            step=seq_get(args, 2) or exp.Interval(this=exp.Literal.number(1), unit=exp.var("DAY")),
 210        ),
 211        "GLOB": lambda args: exp.Glob(this=seq_get(args, 1), expression=seq_get(args, 0)),
 212        "HEX": build_hex,
 213        "JSON_EXTRACT": build_extract_json_with_path(exp.JSONExtract),
 214        "JSON_EXTRACT_SCALAR": build_extract_json_with_path(exp.JSONExtractScalar),
 215        "JSON_EXTRACT_PATH_TEXT": build_extract_json_with_path(exp.JSONExtractScalar),
 216        "LIKE": build_like,
 217        "LOG": build_logarithm,
 218        "LOG2": lambda args: exp.Log(this=exp.Literal.number(2), expression=seq_get(args, 0)),
 219        "LOG10": lambda args: exp.Log(this=exp.Literal.number(10), expression=seq_get(args, 0)),
 220        "LOWER": build_lower,
 221        "LPAD": lambda args: build_pad(args),
 222        "LEFTPAD": lambda args: build_pad(args),
 223        "LTRIM": lambda args: build_trim(args),
 224        "MOD": build_mod,
 225        "RIGHTPAD": lambda args: build_pad(args, is_left=False),
 226        "RPAD": lambda args: build_pad(args, is_left=False),
 227        "RTRIM": lambda args: build_trim(args, is_left=False),
 228        "SCOPE_RESOLUTION": lambda args: exp.ScopeResolution(expression=seq_get(args, 0))
 229        if len(args) != 2
 230        else exp.ScopeResolution(this=seq_get(args, 0), expression=seq_get(args, 1)),
 231        "TIME_TO_TIME_STR": lambda args: exp.Cast(
 232            this=seq_get(args, 0),
 233            to=exp.DataType(this=exp.DataType.Type.TEXT),
 234        ),
 235        "TO_HEX": build_hex,
 236        "TS_OR_DS_TO_DATE_STR": lambda args: exp.Substring(
 237            this=exp.Cast(
 238                this=seq_get(args, 0),
 239                to=exp.DataType(this=exp.DataType.Type.TEXT),
 240            ),
 241            start=exp.Literal.number(1),
 242            length=exp.Literal.number(10),
 243        ),
 244        "UNNEST": lambda args: exp.Unnest(expressions=ensure_list(seq_get(args, 0))),
 245        "UPPER": build_upper,
 246        "VAR_MAP": build_var_map,
 247    }
 248
 249    NO_PAREN_FUNCTIONS = {
 250        TokenType.CURRENT_DATE: exp.CurrentDate,
 251        TokenType.CURRENT_DATETIME: exp.CurrentDate,
 252        TokenType.CURRENT_TIME: exp.CurrentTime,
 253        TokenType.CURRENT_TIMESTAMP: exp.CurrentTimestamp,
 254        TokenType.CURRENT_USER: exp.CurrentUser,
 255    }
 256
 257    STRUCT_TYPE_TOKENS = {
 258        TokenType.NESTED,
 259        TokenType.OBJECT,
 260        TokenType.STRUCT,
 261    }
 262
 263    NESTED_TYPE_TOKENS = {
 264        TokenType.ARRAY,
 265        TokenType.LIST,
 266        TokenType.LOWCARDINALITY,
 267        TokenType.MAP,
 268        TokenType.NULLABLE,
 269        *STRUCT_TYPE_TOKENS,
 270    }
 271
 272    ENUM_TYPE_TOKENS = {
 273        TokenType.ENUM,
 274        TokenType.ENUM8,
 275        TokenType.ENUM16,
 276    }
 277
 278    AGGREGATE_TYPE_TOKENS = {
 279        TokenType.AGGREGATEFUNCTION,
 280        TokenType.SIMPLEAGGREGATEFUNCTION,
 281    }
 282
 283    TYPE_TOKENS = {
 284        TokenType.BIT,
 285        TokenType.BOOLEAN,
 286        TokenType.TINYINT,
 287        TokenType.UTINYINT,
 288        TokenType.SMALLINT,
 289        TokenType.USMALLINT,
 290        TokenType.INT,
 291        TokenType.UINT,
 292        TokenType.BIGINT,
 293        TokenType.UBIGINT,
 294        TokenType.INT128,
 295        TokenType.UINT128,
 296        TokenType.INT256,
 297        TokenType.UINT256,
 298        TokenType.MEDIUMINT,
 299        TokenType.UMEDIUMINT,
 300        TokenType.FIXEDSTRING,
 301        TokenType.FLOAT,
 302        TokenType.DOUBLE,
 303        TokenType.CHAR,
 304        TokenType.NCHAR,
 305        TokenType.VARCHAR,
 306        TokenType.NVARCHAR,
 307        TokenType.BPCHAR,
 308        TokenType.TEXT,
 309        TokenType.MEDIUMTEXT,
 310        TokenType.LONGTEXT,
 311        TokenType.MEDIUMBLOB,
 312        TokenType.LONGBLOB,
 313        TokenType.BINARY,
 314        TokenType.VARBINARY,
 315        TokenType.JSON,
 316        TokenType.JSONB,
 317        TokenType.INTERVAL,
 318        TokenType.TINYBLOB,
 319        TokenType.TINYTEXT,
 320        TokenType.TIME,
 321        TokenType.TIMETZ,
 322        TokenType.TIMESTAMP,
 323        TokenType.TIMESTAMP_S,
 324        TokenType.TIMESTAMP_MS,
 325        TokenType.TIMESTAMP_NS,
 326        TokenType.TIMESTAMPTZ,
 327        TokenType.TIMESTAMPLTZ,
 328        TokenType.TIMESTAMPNTZ,
 329        TokenType.DATETIME,
 330        TokenType.DATETIME64,
 331        TokenType.DATE,
 332        TokenType.DATE32,
 333        TokenType.INT4RANGE,
 334        TokenType.INT4MULTIRANGE,
 335        TokenType.INT8RANGE,
 336        TokenType.INT8MULTIRANGE,
 337        TokenType.NUMRANGE,
 338        TokenType.NUMMULTIRANGE,
 339        TokenType.TSRANGE,
 340        TokenType.TSMULTIRANGE,
 341        TokenType.TSTZRANGE,
 342        TokenType.TSTZMULTIRANGE,
 343        TokenType.DATERANGE,
 344        TokenType.DATEMULTIRANGE,
 345        TokenType.DECIMAL,
 346        TokenType.DECIMAL32,
 347        TokenType.DECIMAL64,
 348        TokenType.DECIMAL128,
 349        TokenType.UDECIMAL,
 350        TokenType.BIGDECIMAL,
 351        TokenType.UUID,
 352        TokenType.GEOGRAPHY,
 353        TokenType.GEOMETRY,
 354        TokenType.HLLSKETCH,
 355        TokenType.HSTORE,
 356        TokenType.PSEUDO_TYPE,
 357        TokenType.SUPER,
 358        TokenType.SERIAL,
 359        TokenType.SMALLSERIAL,
 360        TokenType.BIGSERIAL,
 361        TokenType.XML,
 362        TokenType.YEAR,
 363        TokenType.UNIQUEIDENTIFIER,
 364        TokenType.USERDEFINED,
 365        TokenType.MONEY,
 366        TokenType.SMALLMONEY,
 367        TokenType.ROWVERSION,
 368        TokenType.IMAGE,
 369        TokenType.VARIANT,
 370        TokenType.VECTOR,
 371        TokenType.OBJECT,
 372        TokenType.OBJECT_IDENTIFIER,
 373        TokenType.INET,
 374        TokenType.IPADDRESS,
 375        TokenType.IPPREFIX,
 376        TokenType.IPV4,
 377        TokenType.IPV6,
 378        TokenType.UNKNOWN,
 379        TokenType.NULL,
 380        TokenType.NAME,
 381        TokenType.TDIGEST,
 382        *ENUM_TYPE_TOKENS,
 383        *NESTED_TYPE_TOKENS,
 384        *AGGREGATE_TYPE_TOKENS,
 385    }
 386
 387    SIGNED_TO_UNSIGNED_TYPE_TOKEN = {
 388        TokenType.BIGINT: TokenType.UBIGINT,
 389        TokenType.INT: TokenType.UINT,
 390        TokenType.MEDIUMINT: TokenType.UMEDIUMINT,
 391        TokenType.SMALLINT: TokenType.USMALLINT,
 392        TokenType.TINYINT: TokenType.UTINYINT,
 393        TokenType.DECIMAL: TokenType.UDECIMAL,
 394    }
 395
 396    SUBQUERY_PREDICATES = {
 397        TokenType.ANY: exp.Any,
 398        TokenType.ALL: exp.All,
 399        TokenType.EXISTS: exp.Exists,
 400        TokenType.SOME: exp.Any,
 401    }
 402
 403    RESERVED_TOKENS = {
 404        *Tokenizer.SINGLE_TOKENS.values(),
 405        TokenType.SELECT,
 406    } - {TokenType.IDENTIFIER}
 407
 408    DB_CREATABLES = {
 409        TokenType.DATABASE,
 410        TokenType.DICTIONARY,
 411        TokenType.MODEL,
 412        TokenType.SCHEMA,
 413        TokenType.SEQUENCE,
 414        TokenType.STORAGE_INTEGRATION,
 415        TokenType.TABLE,
 416        TokenType.TAG,
 417        TokenType.VIEW,
 418        TokenType.WAREHOUSE,
 419        TokenType.STREAMLIT,
 420    }
 421
 422    CREATABLES = {
 423        TokenType.COLUMN,
 424        TokenType.CONSTRAINT,
 425        TokenType.FOREIGN_KEY,
 426        TokenType.FUNCTION,
 427        TokenType.INDEX,
 428        TokenType.PROCEDURE,
 429        *DB_CREATABLES,
 430    }
 431
 432    ALTERABLES = {
 433        TokenType.TABLE,
 434        TokenType.VIEW,
 435    }
 436
 437    # Tokens that can represent identifiers
 438    ID_VAR_TOKENS = {
 439        TokenType.ALL,
 440        TokenType.VAR,
 441        TokenType.ANTI,
 442        TokenType.APPLY,
 443        TokenType.ASC,
 444        TokenType.ASOF,
 445        TokenType.AUTO_INCREMENT,
 446        TokenType.BEGIN,
 447        TokenType.BPCHAR,
 448        TokenType.CACHE,
 449        TokenType.CASE,
 450        TokenType.COLLATE,
 451        TokenType.COMMAND,
 452        TokenType.COMMENT,
 453        TokenType.COMMIT,
 454        TokenType.CONSTRAINT,
 455        TokenType.COPY,
 456        TokenType.CUBE,
 457        TokenType.DEFAULT,
 458        TokenType.DELETE,
 459        TokenType.DESC,
 460        TokenType.DESCRIBE,
 461        TokenType.DICTIONARY,
 462        TokenType.DIV,
 463        TokenType.END,
 464        TokenType.EXECUTE,
 465        TokenType.ESCAPE,
 466        TokenType.FALSE,
 467        TokenType.FIRST,
 468        TokenType.FILTER,
 469        TokenType.FINAL,
 470        TokenType.FORMAT,
 471        TokenType.FULL,
 472        TokenType.IDENTIFIER,
 473        TokenType.IS,
 474        TokenType.ISNULL,
 475        TokenType.INTERVAL,
 476        TokenType.KEEP,
 477        TokenType.KILL,
 478        TokenType.LEFT,
 479        TokenType.LOAD,
 480        TokenType.MERGE,
 481        TokenType.NATURAL,
 482        TokenType.NEXT,
 483        TokenType.OFFSET,
 484        TokenType.OPERATOR,
 485        TokenType.ORDINALITY,
 486        TokenType.OVERLAPS,
 487        TokenType.OVERWRITE,
 488        TokenType.PARTITION,
 489        TokenType.PERCENT,
 490        TokenType.PIVOT,
 491        TokenType.PRAGMA,
 492        TokenType.RANGE,
 493        TokenType.RECURSIVE,
 494        TokenType.REFERENCES,
 495        TokenType.REFRESH,
 496        TokenType.RENAME,
 497        TokenType.REPLACE,
 498        TokenType.RIGHT,
 499        TokenType.ROLLUP,
 500        TokenType.ROW,
 501        TokenType.ROWS,
 502        TokenType.SEMI,
 503        TokenType.SET,
 504        TokenType.SETTINGS,
 505        TokenType.SHOW,
 506        TokenType.TEMPORARY,
 507        TokenType.TOP,
 508        TokenType.TRUE,
 509        TokenType.TRUNCATE,
 510        TokenType.UNIQUE,
 511        TokenType.UNNEST,
 512        TokenType.UNPIVOT,
 513        TokenType.UPDATE,
 514        TokenType.USE,
 515        TokenType.VOLATILE,
 516        TokenType.WINDOW,
 517        *CREATABLES,
 518        *SUBQUERY_PREDICATES,
 519        *TYPE_TOKENS,
 520        *NO_PAREN_FUNCTIONS,
 521    }
 522
 523    INTERVAL_VARS = ID_VAR_TOKENS - {TokenType.END}
 524
 525    TABLE_ALIAS_TOKENS = ID_VAR_TOKENS - {
 526        TokenType.ANTI,
 527        TokenType.APPLY,
 528        TokenType.ASOF,
 529        TokenType.FULL,
 530        TokenType.LEFT,
 531        TokenType.LOCK,
 532        TokenType.NATURAL,
 533        TokenType.OFFSET,
 534        TokenType.RIGHT,
 535        TokenType.SEMI,
 536        TokenType.WINDOW,
 537    }
 538
 539    ALIAS_TOKENS = ID_VAR_TOKENS
 540
 541    ARRAY_CONSTRUCTORS = {
 542        "ARRAY": exp.Array,
 543        "LIST": exp.List,
 544    }
 545
 546    COMMENT_TABLE_ALIAS_TOKENS = TABLE_ALIAS_TOKENS - {TokenType.IS}
 547
 548    UPDATE_ALIAS_TOKENS = TABLE_ALIAS_TOKENS - {TokenType.SET}
 549
 550    TRIM_TYPES = {"LEADING", "TRAILING", "BOTH"}
 551
 552    FUNC_TOKENS = {
 553        TokenType.COLLATE,
 554        TokenType.COMMAND,
 555        TokenType.CURRENT_DATE,
 556        TokenType.CURRENT_DATETIME,
 557        TokenType.CURRENT_TIMESTAMP,
 558        TokenType.CURRENT_TIME,
 559        TokenType.CURRENT_USER,
 560        TokenType.FILTER,
 561        TokenType.FIRST,
 562        TokenType.FORMAT,
 563        TokenType.GLOB,
 564        TokenType.IDENTIFIER,
 565        TokenType.INDEX,
 566        TokenType.ISNULL,
 567        TokenType.ILIKE,
 568        TokenType.INSERT,
 569        TokenType.LIKE,
 570        TokenType.MERGE,
 571        TokenType.OFFSET,
 572        TokenType.PRIMARY_KEY,
 573        TokenType.RANGE,
 574        TokenType.REPLACE,
 575        TokenType.RLIKE,
 576        TokenType.ROW,
 577        TokenType.UNNEST,
 578        TokenType.VAR,
 579        TokenType.LEFT,
 580        TokenType.RIGHT,
 581        TokenType.SEQUENCE,
 582        TokenType.DATE,
 583        TokenType.DATETIME,
 584        TokenType.TABLE,
 585        TokenType.TIMESTAMP,
 586        TokenType.TIMESTAMPTZ,
 587        TokenType.TRUNCATE,
 588        TokenType.WINDOW,
 589        TokenType.XOR,
 590        *TYPE_TOKENS,
 591        *SUBQUERY_PREDICATES,
 592    }
 593
 594    CONJUNCTION: t.Dict[TokenType, t.Type[exp.Expression]] = {
 595        TokenType.AND: exp.And,
 596    }
 597
 598    ASSIGNMENT: t.Dict[TokenType, t.Type[exp.Expression]] = {
 599        TokenType.COLON_EQ: exp.PropertyEQ,
 600    }
 601
 602    DISJUNCTION: t.Dict[TokenType, t.Type[exp.Expression]] = {
 603        TokenType.OR: exp.Or,
 604    }
 605
 606    EQUALITY = {
 607        TokenType.EQ: exp.EQ,
 608        TokenType.NEQ: exp.NEQ,
 609        TokenType.NULLSAFE_EQ: exp.NullSafeEQ,
 610    }
 611
 612    COMPARISON = {
 613        TokenType.GT: exp.GT,
 614        TokenType.GTE: exp.GTE,
 615        TokenType.LT: exp.LT,
 616        TokenType.LTE: exp.LTE,
 617    }
 618
 619    BITWISE = {
 620        TokenType.AMP: exp.BitwiseAnd,
 621        TokenType.CARET: exp.BitwiseXor,
 622        TokenType.PIPE: exp.BitwiseOr,
 623    }
 624
 625    TERM = {
 626        TokenType.DASH: exp.Sub,
 627        TokenType.PLUS: exp.Add,
 628        TokenType.MOD: exp.Mod,
 629        TokenType.COLLATE: exp.Collate,
 630    }
 631
 632    FACTOR = {
 633        TokenType.DIV: exp.IntDiv,
 634        TokenType.LR_ARROW: exp.Distance,
 635        TokenType.SLASH: exp.Div,
 636        TokenType.STAR: exp.Mul,
 637    }
 638
 639    EXPONENT: t.Dict[TokenType, t.Type[exp.Expression]] = {}
 640
 641    TIMES = {
 642        TokenType.TIME,
 643        TokenType.TIMETZ,
 644    }
 645
 646    TIMESTAMPS = {
 647        TokenType.TIMESTAMP,
 648        TokenType.TIMESTAMPTZ,
 649        TokenType.TIMESTAMPLTZ,
 650        *TIMES,
 651    }
 652
 653    SET_OPERATIONS = {
 654        TokenType.UNION,
 655        TokenType.INTERSECT,
 656        TokenType.EXCEPT,
 657    }
 658
 659    JOIN_METHODS = {
 660        TokenType.ASOF,
 661        TokenType.NATURAL,
 662        TokenType.POSITIONAL,
 663    }
 664
 665    JOIN_SIDES = {
 666        TokenType.LEFT,
 667        TokenType.RIGHT,
 668        TokenType.FULL,
 669    }
 670
 671    JOIN_KINDS = {
 672        TokenType.ANTI,
 673        TokenType.CROSS,
 674        TokenType.INNER,
 675        TokenType.OUTER,
 676        TokenType.SEMI,
 677        TokenType.STRAIGHT_JOIN,
 678    }
 679
 680    JOIN_HINTS: t.Set[str] = set()
 681
 682    LAMBDAS = {
 683        TokenType.ARROW: lambda self, expressions: self.expression(
 684            exp.Lambda,
 685            this=self._replace_lambda(
 686                self._parse_assignment(),
 687                expressions,
 688            ),
 689            expressions=expressions,
 690        ),
 691        TokenType.FARROW: lambda self, expressions: self.expression(
 692            exp.Kwarg,
 693            this=exp.var(expressions[0].name),
 694            expression=self._parse_assignment(),
 695        ),
 696    }
 697
 698    COLUMN_OPERATORS = {
 699        TokenType.DOT: None,
 700        TokenType.DCOLON: lambda self, this, to: self.expression(
 701            exp.Cast if self.STRICT_CAST else exp.TryCast,
 702            this=this,
 703            to=to,
 704        ),
 705        TokenType.ARROW: lambda self, this, path: self.expression(
 706            exp.JSONExtract,
 707            this=this,
 708            expression=self.dialect.to_json_path(path),
 709            only_json_types=self.JSON_ARROWS_REQUIRE_JSON_TYPE,
 710        ),
 711        TokenType.DARROW: lambda self, this, path: self.expression(
 712            exp.JSONExtractScalar,
 713            this=this,
 714            expression=self.dialect.to_json_path(path),
 715            only_json_types=self.JSON_ARROWS_REQUIRE_JSON_TYPE,
 716        ),
 717        TokenType.HASH_ARROW: lambda self, this, path: self.expression(
 718            exp.JSONBExtract,
 719            this=this,
 720            expression=path,
 721        ),
 722        TokenType.DHASH_ARROW: lambda self, this, path: self.expression(
 723            exp.JSONBExtractScalar,
 724            this=this,
 725            expression=path,
 726        ),
 727        TokenType.PLACEHOLDER: lambda self, this, key: self.expression(
 728            exp.JSONBContains,
 729            this=this,
 730            expression=key,
 731        ),
 732    }
 733
 734    EXPRESSION_PARSERS = {
 735        exp.Cluster: lambda self: self._parse_sort(exp.Cluster, TokenType.CLUSTER_BY),
 736        exp.Column: lambda self: self._parse_column(),
 737        exp.Condition: lambda self: self._parse_assignment(),
 738        exp.DataType: lambda self: self._parse_types(allow_identifiers=False, schema=True),
 739        exp.Expression: lambda self: self._parse_expression(),
 740        exp.From: lambda self: self._parse_from(joins=True),
 741        exp.Group: lambda self: self._parse_group(),
 742        exp.Having: lambda self: self._parse_having(),
 743        exp.Identifier: lambda self: self._parse_id_var(),
 744        exp.Join: lambda self: self._parse_join(),
 745        exp.Lambda: lambda self: self._parse_lambda(),
 746        exp.Lateral: lambda self: self._parse_lateral(),
 747        exp.Limit: lambda self: self._parse_limit(),
 748        exp.Offset: lambda self: self._parse_offset(),
 749        exp.Order: lambda self: self._parse_order(),
 750        exp.Ordered: lambda self: self._parse_ordered(),
 751        exp.Properties: lambda self: self._parse_properties(),
 752        exp.Qualify: lambda self: self._parse_qualify(),
 753        exp.Returning: lambda self: self._parse_returning(),
 754        exp.Select: lambda self: self._parse_select(),
 755        exp.Sort: lambda self: self._parse_sort(exp.Sort, TokenType.SORT_BY),
 756        exp.Table: lambda self: self._parse_table_parts(),
 757        exp.TableAlias: lambda self: self._parse_table_alias(),
 758        exp.When: lambda self: seq_get(self._parse_when_matched(), 0),
 759        exp.Where: lambda self: self._parse_where(),
 760        exp.Window: lambda self: self._parse_named_window(),
 761        exp.With: lambda self: self._parse_with(),
 762        "JOIN_TYPE": lambda self: self._parse_join_parts(),
 763    }
 764
 765    STATEMENT_PARSERS = {
 766        TokenType.ALTER: lambda self: self._parse_alter(),
 767        TokenType.BEGIN: lambda self: self._parse_transaction(),
 768        TokenType.CACHE: lambda self: self._parse_cache(),
 769        TokenType.COMMENT: lambda self: self._parse_comment(),
 770        TokenType.COMMIT: lambda self: self._parse_commit_or_rollback(),
 771        TokenType.COPY: lambda self: self._parse_copy(),
 772        TokenType.CREATE: lambda self: self._parse_create(),
 773        TokenType.DELETE: lambda self: self._parse_delete(),
 774        TokenType.DESC: lambda self: self._parse_describe(),
 775        TokenType.DESCRIBE: lambda self: self._parse_describe(),
 776        TokenType.DROP: lambda self: self._parse_drop(),
 777        TokenType.INSERT: lambda self: self._parse_insert(),
 778        TokenType.KILL: lambda self: self._parse_kill(),
 779        TokenType.LOAD: lambda self: self._parse_load(),
 780        TokenType.MERGE: lambda self: self._parse_merge(),
 781        TokenType.PIVOT: lambda self: self._parse_simplified_pivot(),
 782        TokenType.PRAGMA: lambda self: self.expression(exp.Pragma, this=self._parse_expression()),
 783        TokenType.REFRESH: lambda self: self._parse_refresh(),
 784        TokenType.ROLLBACK: lambda self: self._parse_commit_or_rollback(),
 785        TokenType.SET: lambda self: self._parse_set(),
 786        TokenType.TRUNCATE: lambda self: self._parse_truncate_table(),
 787        TokenType.UNCACHE: lambda self: self._parse_uncache(),
 788        TokenType.UPDATE: lambda self: self._parse_update(),
 789        TokenType.USE: lambda self: self.expression(
 790            exp.Use,
 791            kind=self._parse_var_from_options(self.USABLES, raise_unmatched=False),
 792            this=self._parse_table(schema=False),
 793        ),
 794        TokenType.SEMICOLON: lambda self: self.expression(exp.Semicolon),
 795    }
 796
 797    UNARY_PARSERS = {
 798        TokenType.PLUS: lambda self: self._parse_unary(),  # Unary + is handled as a no-op
 799        TokenType.NOT: lambda self: self.expression(exp.Not, this=self._parse_equality()),
 800        TokenType.TILDA: lambda self: self.expression(exp.BitwiseNot, this=self._parse_unary()),
 801        TokenType.DASH: lambda self: self.expression(exp.Neg, this=self._parse_unary()),
 802        TokenType.PIPE_SLASH: lambda self: self.expression(exp.Sqrt, this=self._parse_unary()),
 803        TokenType.DPIPE_SLASH: lambda self: self.expression(exp.Cbrt, this=self._parse_unary()),
 804    }
 805
 806    STRING_PARSERS = {
 807        TokenType.HEREDOC_STRING: lambda self, token: self.expression(
 808            exp.RawString, this=token.text
 809        ),
 810        TokenType.NATIONAL_STRING: lambda self, token: self.expression(
 811            exp.National, this=token.text
 812        ),
 813        TokenType.RAW_STRING: lambda self, token: self.expression(exp.RawString, this=token.text),
 814        TokenType.STRING: lambda self, token: self.expression(
 815            exp.Literal, this=token.text, is_string=True
 816        ),
 817        TokenType.UNICODE_STRING: lambda self, token: self.expression(
 818            exp.UnicodeString,
 819            this=token.text,
 820            escape=self._match_text_seq("UESCAPE") and self._parse_string(),
 821        ),
 822    }
 823
 824    NUMERIC_PARSERS = {
 825        TokenType.BIT_STRING: lambda self, token: self.expression(exp.BitString, this=token.text),
 826        TokenType.BYTE_STRING: lambda self, token: self.expression(exp.ByteString, this=token.text),
 827        TokenType.HEX_STRING: lambda self, token: self.expression(exp.HexString, this=token.text),
 828        TokenType.NUMBER: lambda self, token: self.expression(
 829            exp.Literal, this=token.text, is_string=False
 830        ),
 831    }
 832
 833    PRIMARY_PARSERS = {
 834        **STRING_PARSERS,
 835        **NUMERIC_PARSERS,
 836        TokenType.INTRODUCER: lambda self, token: self._parse_introducer(token),
 837        TokenType.NULL: lambda self, _: self.expression(exp.Null),
 838        TokenType.TRUE: lambda self, _: self.expression(exp.Boolean, this=True),
 839        TokenType.FALSE: lambda self, _: self.expression(exp.Boolean, this=False),
 840        TokenType.SESSION_PARAMETER: lambda self, _: self._parse_session_parameter(),
 841        TokenType.STAR: lambda self, _: self.expression(
 842            exp.Star,
 843            **{
 844                "except": self._parse_star_op("EXCEPT", "EXCLUDE"),
 845                "replace": self._parse_star_op("REPLACE"),
 846                "rename": self._parse_star_op("RENAME"),
 847            },
 848        ),
 849    }
 850
 851    PLACEHOLDER_PARSERS = {
 852        TokenType.PLACEHOLDER: lambda self: self.expression(exp.Placeholder),
 853        TokenType.PARAMETER: lambda self: self._parse_parameter(),
 854        TokenType.COLON: lambda self: (
 855            self.expression(exp.Placeholder, this=self._prev.text)
 856            if self._match_set(self.ID_VAR_TOKENS)
 857            else None
 858        ),
 859    }
 860
 861    RANGE_PARSERS = {
 862        TokenType.BETWEEN: lambda self, this: self._parse_between(this),
 863        TokenType.GLOB: binary_range_parser(exp.Glob),
 864        TokenType.ILIKE: binary_range_parser(exp.ILike),
 865        TokenType.IN: lambda self, this: self._parse_in(this),
 866        TokenType.IRLIKE: binary_range_parser(exp.RegexpILike),
 867        TokenType.IS: lambda self, this: self._parse_is(this),
 868        TokenType.LIKE: binary_range_parser(exp.Like),
 869        TokenType.OVERLAPS: binary_range_parser(exp.Overlaps),
 870        TokenType.RLIKE: binary_range_parser(exp.RegexpLike),
 871        TokenType.SIMILAR_TO: binary_range_parser(exp.SimilarTo),
 872        TokenType.FOR: lambda self, this: self._parse_comprehension(this),
 873    }
 874
 875    PROPERTY_PARSERS: t.Dict[str, t.Callable] = {
 876        "ALLOWED_VALUES": lambda self: self.expression(
 877            exp.AllowedValuesProperty, expressions=self._parse_csv(self._parse_primary)
 878        ),
 879        "ALGORITHM": lambda self: self._parse_property_assignment(exp.AlgorithmProperty),
 880        "AUTO": lambda self: self._parse_auto_property(),
 881        "AUTO_INCREMENT": lambda self: self._parse_property_assignment(exp.AutoIncrementProperty),
 882        "BACKUP": lambda self: self.expression(
 883            exp.BackupProperty, this=self._parse_var(any_token=True)
 884        ),
 885        "BLOCKCOMPRESSION": lambda self: self._parse_blockcompression(),
 886        "CHARSET": lambda self, **kwargs: self._parse_character_set(**kwargs),
 887        "CHARACTER SET": lambda self, **kwargs: self._parse_character_set(**kwargs),
 888        "CHECKSUM": lambda self: self._parse_checksum(),
 889        "CLUSTER BY": lambda self: self._parse_cluster(),
 890        "CLUSTERED": lambda self: self._parse_clustered_by(),
 891        "COLLATE": lambda self, **kwargs: self._parse_property_assignment(
 892            exp.CollateProperty, **kwargs
 893        ),
 894        "COMMENT": lambda self: self._parse_property_assignment(exp.SchemaCommentProperty),
 895        "CONTAINS": lambda self: self._parse_contains_property(),
 896        "COPY": lambda self: self._parse_copy_property(),
 897        "DATABLOCKSIZE": lambda self, **kwargs: self._parse_datablocksize(**kwargs),
 898        "DATA_DELETION": lambda self: self._parse_data_deletion_property(),
 899        "DEFINER": lambda self: self._parse_definer(),
 900        "DETERMINISTIC": lambda self: self.expression(
 901            exp.StabilityProperty, this=exp.Literal.string("IMMUTABLE")
 902        ),
 903        "DISTRIBUTED": lambda self: self._parse_distributed_property(),
 904        "DUPLICATE": lambda self: self._parse_duplicate(),
 905        "DYNAMIC": lambda self: self.expression(exp.DynamicProperty),
 906        "DISTKEY": lambda self: self._parse_distkey(),
 907        "DISTSTYLE": lambda self: self._parse_property_assignment(exp.DistStyleProperty),
 908        "EMPTY": lambda self: self.expression(exp.EmptyProperty),
 909        "ENGINE": lambda self: self._parse_property_assignment(exp.EngineProperty),
 910        "EXECUTE": lambda self: self._parse_property_assignment(exp.ExecuteAsProperty),
 911        "EXTERNAL": lambda self: self.expression(exp.ExternalProperty),
 912        "FALLBACK": lambda self, **kwargs: self._parse_fallback(**kwargs),
 913        "FORMAT": lambda self: self._parse_property_assignment(exp.FileFormatProperty),
 914        "FREESPACE": lambda self: self._parse_freespace(),
 915        "GLOBAL": lambda self: self.expression(exp.GlobalProperty),
 916        "HEAP": lambda self: self.expression(exp.HeapProperty),
 917        "ICEBERG": lambda self: self.expression(exp.IcebergProperty),
 918        "IMMUTABLE": lambda self: self.expression(
 919            exp.StabilityProperty, this=exp.Literal.string("IMMUTABLE")
 920        ),
 921        "INHERITS": lambda self: self.expression(
 922            exp.InheritsProperty, expressions=self._parse_wrapped_csv(self._parse_table)
 923        ),
 924        "INPUT": lambda self: self.expression(exp.InputModelProperty, this=self._parse_schema()),
 925        "JOURNAL": lambda self, **kwargs: self._parse_journal(**kwargs),
 926        "LANGUAGE": lambda self: self._parse_property_assignment(exp.LanguageProperty),
 927        "LAYOUT": lambda self: self._parse_dict_property(this="LAYOUT"),
 928        "LIFETIME": lambda self: self._parse_dict_range(this="LIFETIME"),
 929        "LIKE": lambda self: self._parse_create_like(),
 930        "LOCATION": lambda self: self._parse_property_assignment(exp.LocationProperty),
 931        "LOCK": lambda self: self._parse_locking(),
 932        "LOCKING": lambda self: self._parse_locking(),
 933        "LOG": lambda self, **kwargs: self._parse_log(**kwargs),
 934        "MATERIALIZED": lambda self: self.expression(exp.MaterializedProperty),
 935        "MERGEBLOCKRATIO": lambda self, **kwargs: self._parse_mergeblockratio(**kwargs),
 936        "MODIFIES": lambda self: self._parse_modifies_property(),
 937        "MULTISET": lambda self: self.expression(exp.SetProperty, multi=True),
 938        "NO": lambda self: self._parse_no_property(),
 939        "ON": lambda self: self._parse_on_property(),
 940        "ORDER BY": lambda self: self._parse_order(skip_order_token=True),
 941        "OUTPUT": lambda self: self.expression(exp.OutputModelProperty, this=self._parse_schema()),
 942        "PARTITION": lambda self: self._parse_partitioned_of(),
 943        "PARTITION BY": lambda self: self._parse_partitioned_by(),
 944        "PARTITIONED BY": lambda self: self._parse_partitioned_by(),
 945        "PARTITIONED_BY": lambda self: self._parse_partitioned_by(),
 946        "PRIMARY KEY": lambda self: self._parse_primary_key(in_props=True),
 947        "RANGE": lambda self: self._parse_dict_range(this="RANGE"),
 948        "READS": lambda self: self._parse_reads_property(),
 949        "REMOTE": lambda self: self._parse_remote_with_connection(),
 950        "RETURNS": lambda self: self._parse_returns(),
 951        "STRICT": lambda self: self.expression(exp.StrictProperty),
 952        "STREAMING": lambda self: self.expression(exp.StreamingTableProperty),
 953        "ROW": lambda self: self._parse_row(),
 954        "ROW_FORMAT": lambda self: self._parse_property_assignment(exp.RowFormatProperty),
 955        "SAMPLE": lambda self: self.expression(
 956            exp.SampleProperty, this=self._match_text_seq("BY") and self._parse_bitwise()
 957        ),
 958        "SECURE": lambda self: self.expression(exp.SecureProperty),
 959        "SECURITY": lambda self: self._parse_security(),
 960        "SET": lambda self: self.expression(exp.SetProperty, multi=False),
 961        "SETTINGS": lambda self: self._parse_settings_property(),
 962        "SHARING": lambda self: self._parse_property_assignment(exp.SharingProperty),
 963        "SORTKEY": lambda self: self._parse_sortkey(),
 964        "SOURCE": lambda self: self._parse_dict_property(this="SOURCE"),
 965        "STABLE": lambda self: self.expression(
 966            exp.StabilityProperty, this=exp.Literal.string("STABLE")
 967        ),
 968        "STORED": lambda self: self._parse_stored(),
 969        "SYSTEM_VERSIONING": lambda self: self._parse_system_versioning_property(),
 970        "TBLPROPERTIES": lambda self: self._parse_wrapped_properties(),
 971        "TEMP": lambda self: self.expression(exp.TemporaryProperty),
 972        "TEMPORARY": lambda self: self.expression(exp.TemporaryProperty),
 973        "TO": lambda self: self._parse_to_table(),
 974        "TRANSIENT": lambda self: self.expression(exp.TransientProperty),
 975        "TRANSFORM": lambda self: self.expression(
 976            exp.TransformModelProperty, expressions=self._parse_wrapped_csv(self._parse_expression)
 977        ),
 978        "TTL": lambda self: self._parse_ttl(),
 979        "USING": lambda self: self._parse_property_assignment(exp.FileFormatProperty),
 980        "UNLOGGED": lambda self: self.expression(exp.UnloggedProperty),
 981        "VOLATILE": lambda self: self._parse_volatile_property(),
 982        "WITH": lambda self: self._parse_with_property(),
 983    }
 984
 985    CONSTRAINT_PARSERS = {
 986        "AUTOINCREMENT": lambda self: self._parse_auto_increment(),
 987        "AUTO_INCREMENT": lambda self: self._parse_auto_increment(),
 988        "CASESPECIFIC": lambda self: self.expression(exp.CaseSpecificColumnConstraint, not_=False),
 989        "CHARACTER SET": lambda self: self.expression(
 990            exp.CharacterSetColumnConstraint, this=self._parse_var_or_string()
 991        ),
 992        "CHECK": lambda self: self.expression(
 993            exp.CheckColumnConstraint,
 994            this=self._parse_wrapped(self._parse_assignment),
 995            enforced=self._match_text_seq("ENFORCED"),
 996        ),
 997        "COLLATE": lambda self: self.expression(
 998            exp.CollateColumnConstraint,
 999            this=self._parse_identifier() or self._parse_column(),
1000        ),
1001        "COMMENT": lambda self: self.expression(
1002            exp.CommentColumnConstraint, this=self._parse_string()
1003        ),
1004        "COMPRESS": lambda self: self._parse_compress(),
1005        "CLUSTERED": lambda self: self.expression(
1006            exp.ClusteredColumnConstraint, this=self._parse_wrapped_csv(self._parse_ordered)
1007        ),
1008        "NONCLUSTERED": lambda self: self.expression(
1009            exp.NonClusteredColumnConstraint, this=self._parse_wrapped_csv(self._parse_ordered)
1010        ),
1011        "DEFAULT": lambda self: self.expression(
1012            exp.DefaultColumnConstraint, this=self._parse_bitwise()
1013        ),
1014        "ENCODE": lambda self: self.expression(exp.EncodeColumnConstraint, this=self._parse_var()),
1015        "EPHEMERAL": lambda self: self.expression(
1016            exp.EphemeralColumnConstraint, this=self._parse_bitwise()
1017        ),
1018        "EXCLUDE": lambda self: self.expression(
1019            exp.ExcludeColumnConstraint, this=self._parse_index_params()
1020        ),
1021        "FOREIGN KEY": lambda self: self._parse_foreign_key(),
1022        "FORMAT": lambda self: self.expression(
1023            exp.DateFormatColumnConstraint, this=self._parse_var_or_string()
1024        ),
1025        "GENERATED": lambda self: self._parse_generated_as_identity(),
1026        "IDENTITY": lambda self: self._parse_auto_increment(),
1027        "INLINE": lambda self: self._parse_inline(),
1028        "LIKE": lambda self: self._parse_create_like(),
1029        "NOT": lambda self: self._parse_not_constraint(),
1030        "NULL": lambda self: self.expression(exp.NotNullColumnConstraint, allow_null=True),
1031        "ON": lambda self: (
1032            self._match(TokenType.UPDATE)
1033            and self.expression(exp.OnUpdateColumnConstraint, this=self._parse_function())
1034        )
1035        or self.expression(exp.OnProperty, this=self._parse_id_var()),
1036        "PATH": lambda self: self.expression(exp.PathColumnConstraint, this=self._parse_string()),
1037        "PERIOD": lambda self: self._parse_period_for_system_time(),
1038        "PRIMARY KEY": lambda self: self._parse_primary_key(),
1039        "REFERENCES": lambda self: self._parse_references(match=False),
1040        "TITLE": lambda self: self.expression(
1041            exp.TitleColumnConstraint, this=self._parse_var_or_string()
1042        ),
1043        "TTL": lambda self: self.expression(exp.MergeTreeTTL, expressions=[self._parse_bitwise()]),
1044        "UNIQUE": lambda self: self._parse_unique(),
1045        "UPPERCASE": lambda self: self.expression(exp.UppercaseColumnConstraint),
1046        "WITH": lambda self: self.expression(
1047            exp.Properties, expressions=self._parse_wrapped_properties()
1048        ),
1049    }
1050
1051    ALTER_PARSERS = {
1052        "ADD": lambda self: self._parse_alter_table_add(),
1053        "ALTER": lambda self: self._parse_alter_table_alter(),
1054        "CLUSTER BY": lambda self: self._parse_cluster(wrapped=True),
1055        "DELETE": lambda self: self.expression(exp.Delete, where=self._parse_where()),
1056        "DROP": lambda self: self._parse_alter_table_drop(),
1057        "RENAME": lambda self: self._parse_alter_table_rename(),
1058        "SET": lambda self: self._parse_alter_table_set(),
1059        "AS": lambda self: self._parse_select(),
1060    }
1061
1062    ALTER_ALTER_PARSERS = {
1063        "DISTKEY": lambda self: self._parse_alter_diststyle(),
1064        "DISTSTYLE": lambda self: self._parse_alter_diststyle(),
1065        "SORTKEY": lambda self: self._parse_alter_sortkey(),
1066        "COMPOUND": lambda self: self._parse_alter_sortkey(compound=True),
1067    }
1068
1069    SCHEMA_UNNAMED_CONSTRAINTS = {
1070        "CHECK",
1071        "EXCLUDE",
1072        "FOREIGN KEY",
1073        "LIKE",
1074        "PERIOD",
1075        "PRIMARY KEY",
1076        "UNIQUE",
1077    }
1078
1079    NO_PAREN_FUNCTION_PARSERS = {
1080        "ANY": lambda self: self.expression(exp.Any, this=self._parse_bitwise()),
1081        "CASE": lambda self: self._parse_case(),
1082        "CONNECT_BY_ROOT": lambda self: self.expression(
1083            exp.ConnectByRoot, this=self._parse_column()
1084        ),
1085        "IF": lambda self: self._parse_if(),
1086        "NEXT": lambda self: self._parse_next_value_for(),
1087    }
1088
1089    INVALID_FUNC_NAME_TOKENS = {
1090        TokenType.IDENTIFIER,
1091        TokenType.STRING,
1092    }
1093
1094    FUNCTIONS_WITH_ALIASED_ARGS = {"STRUCT"}
1095
1096    KEY_VALUE_DEFINITIONS = (exp.Alias, exp.EQ, exp.PropertyEQ, exp.Slice)
1097
1098    FUNCTION_PARSERS = {
1099        "CAST": lambda self: self._parse_cast(self.STRICT_CAST),
1100        "CONVERT": lambda self: self._parse_convert(self.STRICT_CAST),
1101        "DECODE": lambda self: self._parse_decode(),
1102        "EXTRACT": lambda self: self._parse_extract(),
1103        "GAP_FILL": lambda self: self._parse_gap_fill(),
1104        "JSON_OBJECT": lambda self: self._parse_json_object(),
1105        "JSON_OBJECTAGG": lambda self: self._parse_json_object(agg=True),
1106        "JSON_TABLE": lambda self: self._parse_json_table(),
1107        "MATCH": lambda self: self._parse_match_against(),
1108        "NORMALIZE": lambda self: self._parse_normalize(),
1109        "OPENJSON": lambda self: self._parse_open_json(),
1110        "POSITION": lambda self: self._parse_position(),
1111        "PREDICT": lambda self: self._parse_predict(),
1112        "SAFE_CAST": lambda self: self._parse_cast(False, safe=True),
1113        "STRING_AGG": lambda self: self._parse_string_agg(),
1114        "SUBSTRING": lambda self: self._parse_substring(),
1115        "TRIM": lambda self: self._parse_trim(),
1116        "TRY_CAST": lambda self: self._parse_cast(False, safe=True),
1117        "TRY_CONVERT": lambda self: self._parse_convert(False, safe=True),
1118    }
1119
1120    QUERY_MODIFIER_PARSERS = {
1121        TokenType.MATCH_RECOGNIZE: lambda self: ("match", self._parse_match_recognize()),
1122        TokenType.PREWHERE: lambda self: ("prewhere", self._parse_prewhere()),
1123        TokenType.WHERE: lambda self: ("where", self._parse_where()),
1124        TokenType.GROUP_BY: lambda self: ("group", self._parse_group()),
1125        TokenType.HAVING: lambda self: ("having", self._parse_having()),
1126        TokenType.QUALIFY: lambda self: ("qualify", self._parse_qualify()),
1127        TokenType.WINDOW: lambda self: ("windows", self._parse_window_clause()),
1128        TokenType.ORDER_BY: lambda self: ("order", self._parse_order()),
1129        TokenType.LIMIT: lambda self: ("limit", self._parse_limit()),
1130        TokenType.FETCH: lambda self: ("limit", self._parse_limit()),
1131        TokenType.OFFSET: lambda self: ("offset", self._parse_offset()),
1132        TokenType.FOR: lambda self: ("locks", self._parse_locks()),
1133        TokenType.LOCK: lambda self: ("locks", self._parse_locks()),
1134        TokenType.TABLE_SAMPLE: lambda self: ("sample", self._parse_table_sample(as_modifier=True)),
1135        TokenType.USING: lambda self: ("sample", self._parse_table_sample(as_modifier=True)),
1136        TokenType.CLUSTER_BY: lambda self: (
1137            "cluster",
1138            self._parse_sort(exp.Cluster, TokenType.CLUSTER_BY),
1139        ),
1140        TokenType.DISTRIBUTE_BY: lambda self: (
1141            "distribute",
1142            self._parse_sort(exp.Distribute, TokenType.DISTRIBUTE_BY),
1143        ),
1144        TokenType.SORT_BY: lambda self: ("sort", self._parse_sort(exp.Sort, TokenType.SORT_BY)),
1145        TokenType.CONNECT_BY: lambda self: ("connect", self._parse_connect(skip_start_token=True)),
1146        TokenType.START_WITH: lambda self: ("connect", self._parse_connect()),
1147    }
1148
1149    SET_PARSERS = {
1150        "GLOBAL": lambda self: self._parse_set_item_assignment("GLOBAL"),
1151        "LOCAL": lambda self: self._parse_set_item_assignment("LOCAL"),
1152        "SESSION": lambda self: self._parse_set_item_assignment("SESSION"),
1153        "TRANSACTION": lambda self: self._parse_set_transaction(),
1154    }
1155
1156    SHOW_PARSERS: t.Dict[str, t.Callable] = {}
1157
1158    TYPE_LITERAL_PARSERS = {
1159        exp.DataType.Type.JSON: lambda self, this, _: self.expression(exp.ParseJSON, this=this),
1160    }
1161
1162    TYPE_CONVERTERS: t.Dict[exp.DataType.Type, t.Callable[[exp.DataType], exp.DataType]] = {}
1163
1164    DDL_SELECT_TOKENS = {TokenType.SELECT, TokenType.WITH, TokenType.L_PAREN}
1165
1166    PRE_VOLATILE_TOKENS = {TokenType.CREATE, TokenType.REPLACE, TokenType.UNIQUE}
1167
1168    TRANSACTION_KIND = {"DEFERRED", "IMMEDIATE", "EXCLUSIVE"}
1169    TRANSACTION_CHARACTERISTICS: OPTIONS_TYPE = {
1170        "ISOLATION": (
1171            ("LEVEL", "REPEATABLE", "READ"),
1172            ("LEVEL", "READ", "COMMITTED"),
1173            ("LEVEL", "READ", "UNCOMITTED"),
1174            ("LEVEL", "SERIALIZABLE"),
1175        ),
1176        "READ": ("WRITE", "ONLY"),
1177    }
1178
1179    CONFLICT_ACTIONS: OPTIONS_TYPE = dict.fromkeys(
1180        ("ABORT", "FAIL", "IGNORE", "REPLACE", "ROLLBACK", "UPDATE"), tuple()
1181    )
1182    CONFLICT_ACTIONS["DO"] = ("NOTHING", "UPDATE")
1183
1184    CREATE_SEQUENCE: OPTIONS_TYPE = {
1185        "SCALE": ("EXTEND", "NOEXTEND"),
1186        "SHARD": ("EXTEND", "NOEXTEND"),
1187        "NO": ("CYCLE", "CACHE", "MAXVALUE", "MINVALUE"),
1188        **dict.fromkeys(
1189            (
1190                "SESSION",
1191                "GLOBAL",
1192                "KEEP",
1193                "NOKEEP",
1194                "ORDER",
1195                "NOORDER",
1196                "NOCACHE",
1197                "CYCLE",
1198                "NOCYCLE",
1199                "NOMINVALUE",
1200                "NOMAXVALUE",
1201                "NOSCALE",
1202                "NOSHARD",
1203            ),
1204            tuple(),
1205        ),
1206    }
1207
1208    ISOLATED_LOADING_OPTIONS: OPTIONS_TYPE = {"FOR": ("ALL", "INSERT", "NONE")}
1209
1210    USABLES: OPTIONS_TYPE = dict.fromkeys(
1211        ("ROLE", "WAREHOUSE", "DATABASE", "SCHEMA", "CATALOG"), tuple()
1212    )
1213
1214    CAST_ACTIONS: OPTIONS_TYPE = dict.fromkeys(("RENAME", "ADD"), ("FIELDS",))
1215
1216    SCHEMA_BINDING_OPTIONS: OPTIONS_TYPE = {
1217        "TYPE": ("EVOLUTION",),
1218        **dict.fromkeys(("BINDING", "COMPENSATION", "EVOLUTION"), tuple()),
1219    }
1220
1221    KEY_CONSTRAINT_OPTIONS: OPTIONS_TYPE = {
1222        "NOT": ("ENFORCED",),
1223        "MATCH": (
1224            "FULL",
1225            "PARTIAL",
1226            "SIMPLE",
1227        ),
1228        "INITIALLY": ("DEFERRED", "IMMEDIATE"),
1229        **dict.fromkeys(("DEFERRABLE", "NORELY"), tuple()),
1230    }
1231
1232    INSERT_ALTERNATIVES = {"ABORT", "FAIL", "IGNORE", "REPLACE", "ROLLBACK"}
1233
1234    CLONE_KEYWORDS = {"CLONE", "COPY"}
1235    HISTORICAL_DATA_PREFIX = {"AT", "BEFORE", "END"}
1236    HISTORICAL_DATA_KIND = {"TIMESTAMP", "OFFSET", "STATEMENT", "STREAM"}
1237
1238    OPCLASS_FOLLOW_KEYWORDS = {"ASC", "DESC", "NULLS", "WITH"}
1239
1240    OPTYPE_FOLLOW_TOKENS = {TokenType.COMMA, TokenType.R_PAREN}
1241
1242    TABLE_INDEX_HINT_TOKENS = {TokenType.FORCE, TokenType.IGNORE, TokenType.USE}
1243
1244    VIEW_ATTRIBUTES = {"ENCRYPTION", "SCHEMABINDING", "VIEW_METADATA"}
1245
1246    WINDOW_ALIAS_TOKENS = ID_VAR_TOKENS - {TokenType.ROWS}
1247    WINDOW_BEFORE_PAREN_TOKENS = {TokenType.OVER}
1248    WINDOW_SIDES = {"FOLLOWING", "PRECEDING"}
1249
1250    JSON_KEY_VALUE_SEPARATOR_TOKENS = {TokenType.COLON, TokenType.COMMA, TokenType.IS}
1251
1252    FETCH_TOKENS = ID_VAR_TOKENS - {TokenType.ROW, TokenType.ROWS, TokenType.PERCENT}
1253
1254    ADD_CONSTRAINT_TOKENS = {
1255        TokenType.CONSTRAINT,
1256        TokenType.FOREIGN_KEY,
1257        TokenType.INDEX,
1258        TokenType.KEY,
1259        TokenType.PRIMARY_KEY,
1260        TokenType.UNIQUE,
1261    }
1262
1263    DISTINCT_TOKENS = {TokenType.DISTINCT}
1264
1265    NULL_TOKENS = {TokenType.NULL}
1266
1267    UNNEST_OFFSET_ALIAS_TOKENS = ID_VAR_TOKENS - SET_OPERATIONS
1268
1269    SELECT_START_TOKENS = {TokenType.L_PAREN, TokenType.WITH, TokenType.SELECT}
1270
1271    COPY_INTO_VARLEN_OPTIONS = {"FILE_FORMAT", "COPY_OPTIONS", "FORMAT_OPTIONS", "CREDENTIAL"}
1272
1273    IS_JSON_PREDICATE_KIND = {"VALUE", "SCALAR", "ARRAY", "OBJECT"}
1274
1275    ODBC_DATETIME_LITERALS = {
1276        "d": exp.Date,
1277        "t": exp.Time,
1278        "ts": exp.Timestamp,
1279    }
1280
1281    ON_CONDITION_TOKENS = {"ERROR", "NULL", "TRUE", "FALSE", "EMPTY"}
1282
1283    STRICT_CAST = True
1284
1285    PREFIXED_PIVOT_COLUMNS = False
1286    IDENTIFY_PIVOT_STRINGS = False
1287
1288    LOG_DEFAULTS_TO_LN = False
1289
1290    # Whether ADD is present for each column added by ALTER TABLE
1291    ALTER_TABLE_ADD_REQUIRED_FOR_EACH_COLUMN = True
1292
1293    # Whether the table sample clause expects CSV syntax
1294    TABLESAMPLE_CSV = False
1295
1296    # The default method used for table sampling
1297    DEFAULT_SAMPLING_METHOD: t.Optional[str] = None
1298
1299    # Whether the SET command needs a delimiter (e.g. "=") for assignments
1300    SET_REQUIRES_ASSIGNMENT_DELIMITER = True
1301
1302    # Whether the TRIM function expects the characters to trim as its first argument
1303    TRIM_PATTERN_FIRST = False
1304
1305    # Whether string aliases are supported `SELECT COUNT(*) 'count'`
1306    STRING_ALIASES = False
1307
1308    # Whether query modifiers such as LIMIT are attached to the UNION node (vs its right operand)
1309    MODIFIERS_ATTACHED_TO_SET_OP = True
1310    SET_OP_MODIFIERS = {"order", "limit", "offset"}
1311
1312    # Whether to parse IF statements that aren't followed by a left parenthesis as commands
1313    NO_PAREN_IF_COMMANDS = True
1314
1315    # Whether the -> and ->> operators expect documents of type JSON (e.g. Postgres)
1316    JSON_ARROWS_REQUIRE_JSON_TYPE = False
1317
1318    # Whether the `:` operator is used to extract a value from a VARIANT column
1319    COLON_IS_VARIANT_EXTRACT = False
1320
1321    # Whether or not a VALUES keyword needs to be followed by '(' to form a VALUES clause.
1322    # If this is True and '(' is not found, the keyword will be treated as an identifier
1323    VALUES_FOLLOWED_BY_PAREN = True
1324
1325    # Whether implicit unnesting is supported, e.g. SELECT 1 FROM y.z AS z, z.a (Redshift)
1326    SUPPORTS_IMPLICIT_UNNEST = False
1327
1328    # Whether or not interval spans are supported, INTERVAL 1 YEAR TO MONTHS
1329    INTERVAL_SPANS = True
1330
1331    # Whether a PARTITION clause can follow a table reference
1332    SUPPORTS_PARTITION_SELECTION = False
1333
1334    __slots__ = (
1335        "error_level",
1336        "error_message_context",
1337        "max_errors",
1338        "dialect",
1339        "sql",
1340        "errors",
1341        "_tokens",
1342        "_index",
1343        "_curr",
1344        "_next",
1345        "_prev",
1346        "_prev_comments",
1347    )
1348
1349    # Autofilled
1350    SHOW_TRIE: t.Dict = {}
1351    SET_TRIE: t.Dict = {}
1352
1353    def __init__(
1354        self,
1355        error_level: t.Optional[ErrorLevel] = None,
1356        error_message_context: int = 100,
1357        max_errors: int = 3,
1358        dialect: DialectType = None,
1359    ):
1360        from sqlglot.dialects import Dialect
1361
1362        self.error_level = error_level or ErrorLevel.IMMEDIATE
1363        self.error_message_context = error_message_context
1364        self.max_errors = max_errors
1365        self.dialect = Dialect.get_or_raise(dialect)
1366        self.reset()
1367
1368    def reset(self):
1369        self.sql = ""
1370        self.errors = []
1371        self._tokens = []
1372        self._index = 0
1373        self._curr = None
1374        self._next = None
1375        self._prev = None
1376        self._prev_comments = None
1377
1378    def parse(
1379        self, raw_tokens: t.List[Token], sql: t.Optional[str] = None
1380    ) -> t.List[t.Optional[exp.Expression]]:
1381        """
1382        Parses a list of tokens and returns a list of syntax trees, one tree
1383        per parsed SQL statement.
1384
1385        Args:
1386            raw_tokens: The list of tokens.
1387            sql: The original SQL string, used to produce helpful debug messages.
1388
1389        Returns:
1390            The list of the produced syntax trees.
1391        """
1392        return self._parse(
1393            parse_method=self.__class__._parse_statement, raw_tokens=raw_tokens, sql=sql
1394        )
1395
1396    def parse_into(
1397        self,
1398        expression_types: exp.IntoType,
1399        raw_tokens: t.List[Token],
1400        sql: t.Optional[str] = None,
1401    ) -> t.List[t.Optional[exp.Expression]]:
1402        """
1403        Parses a list of tokens into a given Expression type. If a collection of Expression
1404        types is given instead, this method will try to parse the token list into each one
1405        of them, stopping at the first for which the parsing succeeds.
1406
1407        Args:
1408            expression_types: The expression type(s) to try and parse the token list into.
1409            raw_tokens: The list of tokens.
1410            sql: The original SQL string, used to produce helpful debug messages.
1411
1412        Returns:
1413            The target Expression.
1414        """
1415        errors = []
1416        for expression_type in ensure_list(expression_types):
1417            parser = self.EXPRESSION_PARSERS.get(expression_type)
1418            if not parser:
1419                raise TypeError(f"No parser registered for {expression_type}")
1420
1421            try:
1422                return self._parse(parser, raw_tokens, sql)
1423            except ParseError as e:
1424                e.errors[0]["into_expression"] = expression_type
1425                errors.append(e)
1426
1427        raise ParseError(
1428            f"Failed to parse '{sql or raw_tokens}' into {expression_types}",
1429            errors=merge_errors(errors),
1430        ) from errors[-1]
1431
1432    def _parse(
1433        self,
1434        parse_method: t.Callable[[Parser], t.Optional[exp.Expression]],
1435        raw_tokens: t.List[Token],
1436        sql: t.Optional[str] = None,
1437    ) -> t.List[t.Optional[exp.Expression]]:
1438        self.reset()
1439        self.sql = sql or ""
1440
1441        total = len(raw_tokens)
1442        chunks: t.List[t.List[Token]] = [[]]
1443
1444        for i, token in enumerate(raw_tokens):
1445            if token.token_type == TokenType.SEMICOLON:
1446                if token.comments:
1447                    chunks.append([token])
1448
1449                if i < total - 1:
1450                    chunks.append([])
1451            else:
1452                chunks[-1].append(token)
1453
1454        expressions = []
1455
1456        for tokens in chunks:
1457            self._index = -1
1458            self._tokens = tokens
1459            self._advance()
1460
1461            expressions.append(parse_method(self))
1462
1463            if self._index < len(self._tokens):
1464                self.raise_error("Invalid expression / Unexpected token")
1465
1466            self.check_errors()
1467
1468        return expressions
1469
1470    def check_errors(self) -> None:
1471        """Logs or raises any found errors, depending on the chosen error level setting."""
1472        if self.error_level == ErrorLevel.WARN:
1473            for error in self.errors:
1474                logger.error(str(error))
1475        elif self.error_level == ErrorLevel.RAISE and self.errors:
1476            raise ParseError(
1477                concat_messages(self.errors, self.max_errors),
1478                errors=merge_errors(self.errors),
1479            )
1480
1481    def raise_error(self, message: str, token: t.Optional[Token] = None) -> None:
1482        """
1483        Appends an error in the list of recorded errors or raises it, depending on the chosen
1484        error level setting.
1485        """
1486        token = token or self._curr or self._prev or Token.string("")
1487        start = token.start
1488        end = token.end + 1
1489        start_context = self.sql[max(start - self.error_message_context, 0) : start]
1490        highlight = self.sql[start:end]
1491        end_context = self.sql[end : end + self.error_message_context]
1492
1493        error = ParseError.new(
1494            f"{message}. Line {token.line}, Col: {token.col}.\n"
1495            f"  {start_context}\033[4m{highlight}\033[0m{end_context}",
1496            description=message,
1497            line=token.line,
1498            col=token.col,
1499            start_context=start_context,
1500            highlight=highlight,
1501            end_context=end_context,
1502        )
1503
1504        if self.error_level == ErrorLevel.IMMEDIATE:
1505            raise error
1506
1507        self.errors.append(error)
1508
1509    def expression(
1510        self, exp_class: t.Type[E], comments: t.Optional[t.List[str]] = None, **kwargs
1511    ) -> E:
1512        """
1513        Creates a new, validated Expression.
1514
1515        Args:
1516            exp_class: The expression class to instantiate.
1517            comments: An optional list of comments to attach to the expression.
1518            kwargs: The arguments to set for the expression along with their respective values.
1519
1520        Returns:
1521            The target expression.
1522        """
1523        instance = exp_class(**kwargs)
1524        instance.add_comments(comments) if comments else self._add_comments(instance)
1525        return self.validate_expression(instance)
1526
1527    def _add_comments(self, expression: t.Optional[exp.Expression]) -> None:
1528        if expression and self._prev_comments:
1529            expression.add_comments(self._prev_comments)
1530            self._prev_comments = None
1531
1532    def validate_expression(self, expression: E, args: t.Optional[t.List] = None) -> E:
1533        """
1534        Validates an Expression, making sure that all its mandatory arguments are set.
1535
1536        Args:
1537            expression: The expression to validate.
1538            args: An optional list of items that was used to instantiate the expression, if it's a Func.
1539
1540        Returns:
1541            The validated expression.
1542        """
1543        if self.error_level != ErrorLevel.IGNORE:
1544            for error_message in expression.error_messages(args):
1545                self.raise_error(error_message)
1546
1547        return expression
1548
1549    def _find_sql(self, start: Token, end: Token) -> str:
1550        return self.sql[start.start : end.end + 1]
1551
1552    def _is_connected(self) -> bool:
1553        return self._prev and self._curr and self._prev.end + 1 == self._curr.start
1554
1555    def _advance(self, times: int = 1) -> None:
1556        self._index += times
1557        self._curr = seq_get(self._tokens, self._index)
1558        self._next = seq_get(self._tokens, self._index + 1)
1559
1560        if self._index > 0:
1561            self._prev = self._tokens[self._index - 1]
1562            self._prev_comments = self._prev.comments
1563        else:
1564            self._prev = None
1565            self._prev_comments = None
1566
1567    def _retreat(self, index: int) -> None:
1568        if index != self._index:
1569            self._advance(index - self._index)
1570
1571    def _warn_unsupported(self) -> None:
1572        if len(self._tokens) <= 1:
1573            return
1574
1575        # We use _find_sql because self.sql may comprise multiple chunks, and we're only
1576        # interested in emitting a warning for the one being currently processed.
1577        sql = self._find_sql(self._tokens[0], self._tokens[-1])[: self.error_message_context]
1578
1579        logger.warning(
1580            f"'{sql}' contains unsupported syntax. Falling back to parsing as a 'Command'."
1581        )
1582
1583    def _parse_command(self) -> exp.Command:
1584        self._warn_unsupported()
1585        return self.expression(
1586            exp.Command,
1587            comments=self._prev_comments,
1588            this=self._prev.text.upper(),
1589            expression=self._parse_string(),
1590        )
1591
1592    def _try_parse(self, parse_method: t.Callable[[], T], retreat: bool = False) -> t.Optional[T]:
1593        """
1594        Attemps to backtrack if a parse function that contains a try/catch internally raises an error.
1595        This behavior can be different depending on the uset-set ErrorLevel, so _try_parse aims to
1596        solve this by setting & resetting the parser state accordingly
1597        """
1598        index = self._index
1599        error_level = self.error_level
1600
1601        self.error_level = ErrorLevel.IMMEDIATE
1602        try:
1603            this = parse_method()
1604        except ParseError:
1605            this = None
1606        finally:
1607            if not this or retreat:
1608                self._retreat(index)
1609            self.error_level = error_level
1610
1611        return this
1612
1613    def _parse_comment(self, allow_exists: bool = True) -> exp.Expression:
1614        start = self._prev
1615        exists = self._parse_exists() if allow_exists else None
1616
1617        self._match(TokenType.ON)
1618
1619        materialized = self._match_text_seq("MATERIALIZED")
1620        kind = self._match_set(self.CREATABLES) and self._prev
1621        if not kind:
1622            return self._parse_as_command(start)
1623
1624        if kind.token_type in (TokenType.FUNCTION, TokenType.PROCEDURE):
1625            this = self._parse_user_defined_function(kind=kind.token_type)
1626        elif kind.token_type == TokenType.TABLE:
1627            this = self._parse_table(alias_tokens=self.COMMENT_TABLE_ALIAS_TOKENS)
1628        elif kind.token_type == TokenType.COLUMN:
1629            this = self._parse_column()
1630        else:
1631            this = self._parse_id_var()
1632
1633        self._match(TokenType.IS)
1634
1635        return self.expression(
1636            exp.Comment,
1637            this=this,
1638            kind=kind.text,
1639            expression=self._parse_string(),
1640            exists=exists,
1641            materialized=materialized,
1642        )
1643
1644    def _parse_to_table(
1645        self,
1646    ) -> exp.ToTableProperty:
1647        table = self._parse_table_parts(schema=True)
1648        return self.expression(exp.ToTableProperty, this=table)
1649
1650    # https://clickhouse.com/docs/en/engines/table-engines/mergetree-family/mergetree#mergetree-table-ttl
1651    def _parse_ttl(self) -> exp.Expression:
1652        def _parse_ttl_action() -> t.Optional[exp.Expression]:
1653            this = self._parse_bitwise()
1654
1655            if self._match_text_seq("DELETE"):
1656                return self.expression(exp.MergeTreeTTLAction, this=this, delete=True)
1657            if self._match_text_seq("RECOMPRESS"):
1658                return self.expression(
1659                    exp.MergeTreeTTLAction, this=this, recompress=self._parse_bitwise()
1660                )
1661            if self._match_text_seq("TO", "DISK"):
1662                return self.expression(
1663                    exp.MergeTreeTTLAction, this=this, to_disk=self._parse_string()
1664                )
1665            if self._match_text_seq("TO", "VOLUME"):
1666                return self.expression(
1667                    exp.MergeTreeTTLAction, this=this, to_volume=self._parse_string()
1668                )
1669
1670            return this
1671
1672        expressions = self._parse_csv(_parse_ttl_action)
1673        where = self._parse_where()
1674        group = self._parse_group()
1675
1676        aggregates = None
1677        if group and self._match(TokenType.SET):
1678            aggregates = self._parse_csv(self._parse_set_item)
1679
1680        return self.expression(
1681            exp.MergeTreeTTL,
1682            expressions=expressions,
1683            where=where,
1684            group=group,
1685            aggregates=aggregates,
1686        )
1687
1688    def _parse_statement(self) -> t.Optional[exp.Expression]:
1689        if self._curr is None:
1690            return None
1691
1692        if self._match_set(self.STATEMENT_PARSERS):
1693            return self.STATEMENT_PARSERS[self._prev.token_type](self)
1694
1695        if self._match_set(self.dialect.tokenizer.COMMANDS):
1696            return self._parse_command()
1697
1698        expression = self._parse_expression()
1699        expression = self._parse_set_operations(expression) if expression else self._parse_select()
1700        return self._parse_query_modifiers(expression)
1701
1702    def _parse_drop(self, exists: bool = False) -> exp.Drop | exp.Command:
1703        start = self._prev
1704        temporary = self._match(TokenType.TEMPORARY)
1705        materialized = self._match_text_seq("MATERIALIZED")
1706
1707        kind = self._match_set(self.CREATABLES) and self._prev.text.upper()
1708        if not kind:
1709            return self._parse_as_command(start)
1710
1711        concurrently = self._match_text_seq("CONCURRENTLY")
1712        if_exists = exists or self._parse_exists()
1713        table = self._parse_table_parts(
1714            schema=True, is_db_reference=self._prev.token_type == TokenType.SCHEMA
1715        )
1716
1717        cluster = self._parse_on_property() if self._match(TokenType.ON) else None
1718
1719        if self._match(TokenType.L_PAREN, advance=False):
1720            expressions = self._parse_wrapped_csv(self._parse_types)
1721        else:
1722            expressions = None
1723
1724        return self.expression(
1725            exp.Drop,
1726            comments=start.comments,
1727            exists=if_exists,
1728            this=table,
1729            expressions=expressions,
1730            kind=self.dialect.CREATABLE_KIND_MAPPING.get(kind) or kind,
1731            temporary=temporary,
1732            materialized=materialized,
1733            cascade=self._match_text_seq("CASCADE"),
1734            constraints=self._match_text_seq("CONSTRAINTS"),
1735            purge=self._match_text_seq("PURGE"),
1736            cluster=cluster,
1737            concurrently=concurrently,
1738        )
1739
1740    def _parse_exists(self, not_: bool = False) -> t.Optional[bool]:
1741        return (
1742            self._match_text_seq("IF")
1743            and (not not_ or self._match(TokenType.NOT))
1744            and self._match(TokenType.EXISTS)
1745        )
1746
1747    def _parse_create(self) -> exp.Create | exp.Command:
1748        # Note: this can't be None because we've matched a statement parser
1749        start = self._prev
1750        comments = self._prev_comments
1751
1752        replace = (
1753            start.token_type == TokenType.REPLACE
1754            or self._match_pair(TokenType.OR, TokenType.REPLACE)
1755            or self._match_pair(TokenType.OR, TokenType.ALTER)
1756        )
1757        refresh = self._match_pair(TokenType.OR, TokenType.REFRESH)
1758
1759        unique = self._match(TokenType.UNIQUE)
1760
1761        if self._match_text_seq("CLUSTERED", "COLUMNSTORE"):
1762            clustered = True
1763        elif self._match_text_seq("NONCLUSTERED", "COLUMNSTORE") or self._match_text_seq(
1764            "COLUMNSTORE"
1765        ):
1766            clustered = False
1767        else:
1768            clustered = None
1769
1770        if self._match_pair(TokenType.TABLE, TokenType.FUNCTION, advance=False):
1771            self._advance()
1772
1773        properties = None
1774        create_token = self._match_set(self.CREATABLES) and self._prev
1775
1776        if not create_token:
1777            # exp.Properties.Location.POST_CREATE
1778            properties = self._parse_properties()
1779            create_token = self._match_set(self.CREATABLES) and self._prev
1780
1781            if not properties or not create_token:
1782                return self._parse_as_command(start)
1783
1784        concurrently = self._match_text_seq("CONCURRENTLY")
1785        exists = self._parse_exists(not_=True)
1786        this = None
1787        expression: t.Optional[exp.Expression] = None
1788        indexes = None
1789        no_schema_binding = None
1790        begin = None
1791        end = None
1792        clone = None
1793
1794        def extend_props(temp_props: t.Optional[exp.Properties]) -> None:
1795            nonlocal properties
1796            if properties and temp_props:
1797                properties.expressions.extend(temp_props.expressions)
1798            elif temp_props:
1799                properties = temp_props
1800
1801        if create_token.token_type in (TokenType.FUNCTION, TokenType.PROCEDURE):
1802            this = self._parse_user_defined_function(kind=create_token.token_type)
1803
1804            # exp.Properties.Location.POST_SCHEMA ("schema" here is the UDF's type signature)
1805            extend_props(self._parse_properties())
1806
1807            expression = self._match(TokenType.ALIAS) and self._parse_heredoc()
1808            extend_props(self._parse_properties())
1809
1810            if not expression:
1811                if self._match(TokenType.COMMAND):
1812                    expression = self._parse_as_command(self._prev)
1813                else:
1814                    begin = self._match(TokenType.BEGIN)
1815                    return_ = self._match_text_seq("RETURN")
1816
1817                    if self._match(TokenType.STRING, advance=False):
1818                        # Takes care of BigQuery's JavaScript UDF definitions that end in an OPTIONS property
1819                        # # https://cloud.google.com/bigquery/docs/reference/standard-sql/data-definition-language#create_function_statement
1820                        expression = self._parse_string()
1821                        extend_props(self._parse_properties())
1822                    else:
1823                        expression = self._parse_statement()
1824
1825                    end = self._match_text_seq("END")
1826
1827                    if return_:
1828                        expression = self.expression(exp.Return, this=expression)
1829        elif create_token.token_type == TokenType.INDEX:
1830            # Postgres allows anonymous indexes, eg. CREATE INDEX IF NOT EXISTS ON t(c)
1831            if not self._match(TokenType.ON):
1832                index = self._parse_id_var()
1833                anonymous = False
1834            else:
1835                index = None
1836                anonymous = True
1837
1838            this = self._parse_index(index=index, anonymous=anonymous)
1839        elif create_token.token_type in self.DB_CREATABLES:
1840            table_parts = self._parse_table_parts(
1841                schema=True, is_db_reference=create_token.token_type == TokenType.SCHEMA
1842            )
1843
1844            # exp.Properties.Location.POST_NAME
1845            self._match(TokenType.COMMA)
1846            extend_props(self._parse_properties(before=True))
1847
1848            this = self._parse_schema(this=table_parts)
1849
1850            # exp.Properties.Location.POST_SCHEMA and POST_WITH
1851            extend_props(self._parse_properties())
1852
1853            self._match(TokenType.ALIAS)
1854            if not self._match_set(self.DDL_SELECT_TOKENS, advance=False):
1855                # exp.Properties.Location.POST_ALIAS
1856                extend_props(self._parse_properties())
1857
1858            if create_token.token_type == TokenType.SEQUENCE:
1859                expression = self._parse_types()
1860                extend_props(self._parse_properties())
1861            else:
1862                expression = self._parse_ddl_select()
1863
1864            if create_token.token_type == TokenType.TABLE:
1865                # exp.Properties.Location.POST_EXPRESSION
1866                extend_props(self._parse_properties())
1867
1868                indexes = []
1869                while True:
1870                    index = self._parse_index()
1871
1872                    # exp.Properties.Location.POST_INDEX
1873                    extend_props(self._parse_properties())
1874                    if not index:
1875                        break
1876                    else:
1877                        self._match(TokenType.COMMA)
1878                        indexes.append(index)
1879            elif create_token.token_type == TokenType.VIEW:
1880                if self._match_text_seq("WITH", "NO", "SCHEMA", "BINDING"):
1881                    no_schema_binding = True
1882
1883            shallow = self._match_text_seq("SHALLOW")
1884
1885            if self._match_texts(self.CLONE_KEYWORDS):
1886                copy = self._prev.text.lower() == "copy"
1887                clone = self.expression(
1888                    exp.Clone, this=self._parse_table(schema=True), shallow=shallow, copy=copy
1889                )
1890
1891        if self._curr and not self._match_set((TokenType.R_PAREN, TokenType.COMMA), advance=False):
1892            return self._parse_as_command(start)
1893
1894        create_kind_text = create_token.text.upper()
1895        return self.expression(
1896            exp.Create,
1897            comments=comments,
1898            this=this,
1899            kind=self.dialect.CREATABLE_KIND_MAPPING.get(create_kind_text) or create_kind_text,
1900            replace=replace,
1901            refresh=refresh,
1902            unique=unique,
1903            expression=expression,
1904            exists=exists,
1905            properties=properties,
1906            indexes=indexes,
1907            no_schema_binding=no_schema_binding,
1908            begin=begin,
1909            end=end,
1910            clone=clone,
1911            concurrently=concurrently,
1912            clustered=clustered,
1913        )
1914
1915    def _parse_sequence_properties(self) -> t.Optional[exp.SequenceProperties]:
1916        seq = exp.SequenceProperties()
1917
1918        options = []
1919        index = self._index
1920
1921        while self._curr:
1922            self._match(TokenType.COMMA)
1923            if self._match_text_seq("INCREMENT"):
1924                self._match_text_seq("BY")
1925                self._match_text_seq("=")
1926                seq.set("increment", self._parse_term())
1927            elif self._match_text_seq("MINVALUE"):
1928                seq.set("minvalue", self._parse_term())
1929            elif self._match_text_seq("MAXVALUE"):
1930                seq.set("maxvalue", self._parse_term())
1931            elif self._match(TokenType.START_WITH) or self._match_text_seq("START"):
1932                self._match_text_seq("=")
1933                seq.set("start", self._parse_term())
1934            elif self._match_text_seq("CACHE"):
1935                # T-SQL allows empty CACHE which is initialized dynamically
1936                seq.set("cache", self._parse_number() or True)
1937            elif self._match_text_seq("OWNED", "BY"):
1938                # "OWNED BY NONE" is the default
1939                seq.set("owned", None if self._match_text_seq("NONE") else self._parse_column())
1940            else:
1941                opt = self._parse_var_from_options(self.CREATE_SEQUENCE, raise_unmatched=False)
1942                if opt:
1943                    options.append(opt)
1944                else:
1945                    break
1946
1947        seq.set("options", options if options else None)
1948        return None if self._index == index else seq
1949
1950    def _parse_property_before(self) -> t.Optional[exp.Expression]:
1951        # only used for teradata currently
1952        self._match(TokenType.COMMA)
1953
1954        kwargs = {
1955            "no": self._match_text_seq("NO"),
1956            "dual": self._match_text_seq("DUAL"),
1957            "before": self._match_text_seq("BEFORE"),
1958            "default": self._match_text_seq("DEFAULT"),
1959            "local": (self._match_text_seq("LOCAL") and "LOCAL")
1960            or (self._match_text_seq("NOT", "LOCAL") and "NOT LOCAL"),
1961            "after": self._match_text_seq("AFTER"),
1962            "minimum": self._match_texts(("MIN", "MINIMUM")),
1963            "maximum": self._match_texts(("MAX", "MAXIMUM")),
1964        }
1965
1966        if self._match_texts(self.PROPERTY_PARSERS):
1967            parser = self.PROPERTY_PARSERS[self._prev.text.upper()]
1968            try:
1969                return parser(self, **{k: v for k, v in kwargs.items() if v})
1970            except TypeError:
1971                self.raise_error(f"Cannot parse property '{self._prev.text}'")
1972
1973        return None
1974
1975    def _parse_wrapped_properties(self) -> t.List[exp.Expression]:
1976        return self._parse_wrapped_csv(self._parse_property)
1977
1978    def _parse_property(self) -> t.Optional[exp.Expression]:
1979        if self._match_texts(self.PROPERTY_PARSERS):
1980            return self.PROPERTY_PARSERS[self._prev.text.upper()](self)
1981
1982        if self._match(TokenType.DEFAULT) and self._match_texts(self.PROPERTY_PARSERS):
1983            return self.PROPERTY_PARSERS[self._prev.text.upper()](self, default=True)
1984
1985        if self._match_text_seq("COMPOUND", "SORTKEY"):
1986            return self._parse_sortkey(compound=True)
1987
1988        if self._match_text_seq("SQL", "SECURITY"):
1989            return self.expression(exp.SqlSecurityProperty, definer=self._match_text_seq("DEFINER"))
1990
1991        index = self._index
1992        key = self._parse_column()
1993
1994        if not self._match(TokenType.EQ):
1995            self._retreat(index)
1996            return self._parse_sequence_properties()
1997
1998        # Transform the key to exp.Dot if it's dotted identifiers wrapped in exp.Column or to exp.Var otherwise
1999        if isinstance(key, exp.Column):
2000            key = key.to_dot() if len(key.parts) > 1 else exp.var(key.name)
2001
2002        value = self._parse_bitwise() or self._parse_var(any_token=True)
2003
2004        # Transform the value to exp.Var if it was parsed as exp.Column(exp.Identifier())
2005        if isinstance(value, exp.Column):
2006            value = exp.var(value.name)
2007
2008        return self.expression(exp.Property, this=key, value=value)
2009
2010    def _parse_stored(self) -> exp.FileFormatProperty:
2011        self._match(TokenType.ALIAS)
2012
2013        input_format = self._parse_string() if self._match_text_seq("INPUTFORMAT") else None
2014        output_format = self._parse_string() if self._match_text_seq("OUTPUTFORMAT") else None
2015
2016        return self.expression(
2017            exp.FileFormatProperty,
2018            this=(
2019                self.expression(
2020                    exp.InputOutputFormat, input_format=input_format, output_format=output_format
2021                )
2022                if input_format or output_format
2023                else self._parse_var_or_string() or self._parse_number() or self._parse_id_var()
2024            ),
2025        )
2026
2027    def _parse_unquoted_field(self) -> t.Optional[exp.Expression]:
2028        field = self._parse_field()
2029        if isinstance(field, exp.Identifier) and not field.quoted:
2030            field = exp.var(field)
2031
2032        return field
2033
2034    def _parse_property_assignment(self, exp_class: t.Type[E], **kwargs: t.Any) -> E:
2035        self._match(TokenType.EQ)
2036        self._match(TokenType.ALIAS)
2037
2038        return self.expression(exp_class, this=self._parse_unquoted_field(), **kwargs)
2039
2040    def _parse_properties(self, before: t.Optional[bool] = None) -> t.Optional[exp.Properties]:
2041        properties = []
2042        while True:
2043            if before:
2044                prop = self._parse_property_before()
2045            else:
2046                prop = self._parse_property()
2047            if not prop:
2048                break
2049            for p in ensure_list(prop):
2050                properties.append(p)
2051
2052        if properties:
2053            return self.expression(exp.Properties, expressions=properties)
2054
2055        return None
2056
2057    def _parse_fallback(self, no: bool = False) -> exp.FallbackProperty:
2058        return self.expression(
2059            exp.FallbackProperty, no=no, protection=self._match_text_seq("PROTECTION")
2060        )
2061
2062    def _parse_security(self) -> t.Optional[exp.SecurityProperty]:
2063        if self._match_texts(("DEFINER", "INVOKER")):
2064            security_specifier = self._prev.text.upper()
2065            return self.expression(exp.SecurityProperty, this=security_specifier)
2066        return None
2067
2068    def _parse_settings_property(self) -> exp.SettingsProperty:
2069        return self.expression(
2070            exp.SettingsProperty, expressions=self._parse_csv(self._parse_assignment)
2071        )
2072
2073    def _parse_volatile_property(self) -> exp.VolatileProperty | exp.StabilityProperty:
2074        if self._index >= 2:
2075            pre_volatile_token = self._tokens[self._index - 2]
2076        else:
2077            pre_volatile_token = None
2078
2079        if pre_volatile_token and pre_volatile_token.token_type in self.PRE_VOLATILE_TOKENS:
2080            return exp.VolatileProperty()
2081
2082        return self.expression(exp.StabilityProperty, this=exp.Literal.string("VOLATILE"))
2083
2084    def _parse_retention_period(self) -> exp.Var:
2085        # Parse TSQL's HISTORY_RETENTION_PERIOD: {INFINITE | <number> DAY | DAYS | MONTH ...}
2086        number = self._parse_number()
2087        number_str = f"{number} " if number else ""
2088        unit = self._parse_var(any_token=True)
2089        return exp.var(f"{number_str}{unit}")
2090
2091    def _parse_system_versioning_property(
2092        self, with_: bool = False
2093    ) -> exp.WithSystemVersioningProperty:
2094        self._match(TokenType.EQ)
2095        prop = self.expression(
2096            exp.WithSystemVersioningProperty,
2097            **{  # type: ignore
2098                "on": True,
2099                "with": with_,
2100            },
2101        )
2102
2103        if self._match_text_seq("OFF"):
2104            prop.set("on", False)
2105            return prop
2106
2107        self._match(TokenType.ON)
2108        if self._match(TokenType.L_PAREN):
2109            while self._curr and not self._match(TokenType.R_PAREN):
2110                if self._match_text_seq("HISTORY_TABLE", "="):
2111                    prop.set("this", self._parse_table_parts())
2112                elif self._match_text_seq("DATA_CONSISTENCY_CHECK", "="):
2113                    prop.set("data_consistency", self._advance_any() and self._prev.text.upper())
2114                elif self._match_text_seq("HISTORY_RETENTION_PERIOD", "="):
2115                    prop.set("retention_period", self._parse_retention_period())
2116
2117                self._match(TokenType.COMMA)
2118
2119        return prop
2120
2121    def _parse_data_deletion_property(self) -> exp.DataDeletionProperty:
2122        self._match(TokenType.EQ)
2123        on = self._match_text_seq("ON") or not self._match_text_seq("OFF")
2124        prop = self.expression(exp.DataDeletionProperty, on=on)
2125
2126        if self._match(TokenType.L_PAREN):
2127            while self._curr and not self._match(TokenType.R_PAREN):
2128                if self._match_text_seq("FILTER_COLUMN", "="):
2129                    prop.set("filter_column", self._parse_column())
2130                elif self._match_text_seq("RETENTION_PERIOD", "="):
2131                    prop.set("retention_period", self._parse_retention_period())
2132
2133                self._match(TokenType.COMMA)
2134
2135        return prop
2136
2137    def _parse_distributed_property(self) -> exp.DistributedByProperty:
2138        kind = "HASH"
2139        expressions: t.Optional[t.List[exp.Expression]] = None
2140        if self._match_text_seq("BY", "HASH"):
2141            expressions = self._parse_wrapped_csv(self._parse_id_var)
2142        elif self._match_text_seq("BY", "RANDOM"):
2143            kind = "RANDOM"
2144
2145        # If the BUCKETS keyword is not present, the number of buckets is AUTO
2146        buckets: t.Optional[exp.Expression] = None
2147        if self._match_text_seq("BUCKETS") and not self._match_text_seq("AUTO"):
2148            buckets = self._parse_number()
2149
2150        return self.expression(
2151            exp.DistributedByProperty,
2152            expressions=expressions,
2153            kind=kind,
2154            buckets=buckets,
2155            order=self._parse_order(),
2156        )
2157
2158    def _parse_duplicate(self) -> exp.DuplicateKeyProperty:
2159        self._match_text_seq("KEY")
2160        expressions = self._parse_wrapped_csv(self._parse_id_var, optional=False)
2161        return self.expression(exp.DuplicateKeyProperty, expressions=expressions)
2162
2163    def _parse_with_property(self) -> t.Optional[exp.Expression] | t.List[exp.Expression]:
2164        if self._match_text_seq("(", "SYSTEM_VERSIONING"):
2165            prop = self._parse_system_versioning_property(with_=True)
2166            self._match_r_paren()
2167            return prop
2168
2169        if self._match(TokenType.L_PAREN, advance=False):
2170            return self._parse_wrapped_properties()
2171
2172        if self._match_text_seq("JOURNAL"):
2173            return self._parse_withjournaltable()
2174
2175        if self._match_texts(self.VIEW_ATTRIBUTES):
2176            return self.expression(exp.ViewAttributeProperty, this=self._prev.text.upper())
2177
2178        if self._match_text_seq("DATA"):
2179            return self._parse_withdata(no=False)
2180        elif self._match_text_seq("NO", "DATA"):
2181            return self._parse_withdata(no=True)
2182
2183        if self._match(TokenType.SERDE_PROPERTIES, advance=False):
2184            return self._parse_serde_properties(with_=True)
2185
2186        if self._match(TokenType.SCHEMA):
2187            return self.expression(
2188                exp.WithSchemaBindingProperty,
2189                this=self._parse_var_from_options(self.SCHEMA_BINDING_OPTIONS),
2190            )
2191
2192        if not self._next:
2193            return None
2194
2195        return self._parse_withisolatedloading()
2196
2197    # https://dev.mysql.com/doc/refman/8.0/en/create-view.html
2198    def _parse_definer(self) -> t.Optional[exp.DefinerProperty]:
2199        self._match(TokenType.EQ)
2200
2201        user = self._parse_id_var()
2202        self._match(TokenType.PARAMETER)
2203        host = self._parse_id_var() or (self._match(TokenType.MOD) and self._prev.text)
2204
2205        if not user or not host:
2206            return None
2207
2208        return exp.DefinerProperty(this=f"{user}@{host}")
2209
2210    def _parse_withjournaltable(self) -> exp.WithJournalTableProperty:
2211        self._match(TokenType.TABLE)
2212        self._match(TokenType.EQ)
2213        return self.expression(exp.WithJournalTableProperty, this=self._parse_table_parts())
2214
2215    def _parse_log(self, no: bool = False) -> exp.LogProperty:
2216        return self.expression(exp.LogProperty, no=no)
2217
2218    def _parse_journal(self, **kwargs) -> exp.JournalProperty:
2219        return self.expression(exp.JournalProperty, **kwargs)
2220
2221    def _parse_checksum(self) -> exp.ChecksumProperty:
2222        self._match(TokenType.EQ)
2223
2224        on = None
2225        if self._match(TokenType.ON):
2226            on = True
2227        elif self._match_text_seq("OFF"):
2228            on = False
2229
2230        return self.expression(exp.ChecksumProperty, on=on, default=self._match(TokenType.DEFAULT))
2231
2232    def _parse_cluster(self, wrapped: bool = False) -> exp.Cluster:
2233        return self.expression(
2234            exp.Cluster,
2235            expressions=(
2236                self._parse_wrapped_csv(self._parse_ordered)
2237                if wrapped
2238                else self._parse_csv(self._parse_ordered)
2239            ),
2240        )
2241
2242    def _parse_clustered_by(self) -> exp.ClusteredByProperty:
2243        self._match_text_seq("BY")
2244
2245        self._match_l_paren()
2246        expressions = self._parse_csv(self._parse_column)
2247        self._match_r_paren()
2248
2249        if self._match_text_seq("SORTED", "BY"):
2250            self._match_l_paren()
2251            sorted_by = self._parse_csv(self._parse_ordered)
2252            self._match_r_paren()
2253        else:
2254            sorted_by = None
2255
2256        self._match(TokenType.INTO)
2257        buckets = self._parse_number()
2258        self._match_text_seq("BUCKETS")
2259
2260        return self.expression(
2261            exp.ClusteredByProperty,
2262            expressions=expressions,
2263            sorted_by=sorted_by,
2264            buckets=buckets,
2265        )
2266
2267    def _parse_copy_property(self) -> t.Optional[exp.CopyGrantsProperty]:
2268        if not self._match_text_seq("GRANTS"):
2269            self._retreat(self._index - 1)
2270            return None
2271
2272        return self.expression(exp.CopyGrantsProperty)
2273
2274    def _parse_freespace(self) -> exp.FreespaceProperty:
2275        self._match(TokenType.EQ)
2276        return self.expression(
2277            exp.FreespaceProperty, this=self._parse_number(), percent=self._match(TokenType.PERCENT)
2278        )
2279
2280    def _parse_mergeblockratio(
2281        self, no: bool = False, default: bool = False
2282    ) -> exp.MergeBlockRatioProperty:
2283        if self._match(TokenType.EQ):
2284            return self.expression(
2285                exp.MergeBlockRatioProperty,
2286                this=self._parse_number(),
2287                percent=self._match(TokenType.PERCENT),
2288            )
2289
2290        return self.expression(exp.MergeBlockRatioProperty, no=no, default=default)
2291
2292    def _parse_datablocksize(
2293        self,
2294        default: t.Optional[bool] = None,
2295        minimum: t.Optional[bool] = None,
2296        maximum: t.Optional[bool] = None,
2297    ) -> exp.DataBlocksizeProperty:
2298        self._match(TokenType.EQ)
2299        size = self._parse_number()
2300
2301        units = None
2302        if self._match_texts(("BYTES", "KBYTES", "KILOBYTES")):
2303            units = self._prev.text
2304
2305        return self.expression(
2306            exp.DataBlocksizeProperty,
2307            size=size,
2308            units=units,
2309            default=default,
2310            minimum=minimum,
2311            maximum=maximum,
2312        )
2313
2314    def _parse_blockcompression(self) -> exp.BlockCompressionProperty:
2315        self._match(TokenType.EQ)
2316        always = self._match_text_seq("ALWAYS")
2317        manual = self._match_text_seq("MANUAL")
2318        never = self._match_text_seq("NEVER")
2319        default = self._match_text_seq("DEFAULT")
2320
2321        autotemp = None
2322        if self._match_text_seq("AUTOTEMP"):
2323            autotemp = self._parse_schema()
2324
2325        return self.expression(
2326            exp.BlockCompressionProperty,
2327            always=always,
2328            manual=manual,
2329            never=never,
2330            default=default,
2331            autotemp=autotemp,
2332        )
2333
2334    def _parse_withisolatedloading(self) -> t.Optional[exp.IsolatedLoadingProperty]:
2335        index = self._index
2336        no = self._match_text_seq("NO")
2337        concurrent = self._match_text_seq("CONCURRENT")
2338
2339        if not self._match_text_seq("ISOLATED", "LOADING"):
2340            self._retreat(index)
2341            return None
2342
2343        target = self._parse_var_from_options(self.ISOLATED_LOADING_OPTIONS, raise_unmatched=False)
2344        return self.expression(
2345            exp.IsolatedLoadingProperty, no=no, concurrent=concurrent, target=target
2346        )
2347
2348    def _parse_locking(self) -> exp.LockingProperty:
2349        if self._match(TokenType.TABLE):
2350            kind = "TABLE"
2351        elif self._match(TokenType.VIEW):
2352            kind = "VIEW"
2353        elif self._match(TokenType.ROW):
2354            kind = "ROW"
2355        elif self._match_text_seq("DATABASE"):
2356            kind = "DATABASE"
2357        else:
2358            kind = None
2359
2360        if kind in ("DATABASE", "TABLE", "VIEW"):
2361            this = self._parse_table_parts()
2362        else:
2363            this = None
2364
2365        if self._match(TokenType.FOR):
2366            for_or_in = "FOR"
2367        elif self._match(TokenType.IN):
2368            for_or_in = "IN"
2369        else:
2370            for_or_in = None
2371
2372        if self._match_text_seq("ACCESS"):
2373            lock_type = "ACCESS"
2374        elif self._match_texts(("EXCL", "EXCLUSIVE")):
2375            lock_type = "EXCLUSIVE"
2376        elif self._match_text_seq("SHARE"):
2377            lock_type = "SHARE"
2378        elif self._match_text_seq("READ"):
2379            lock_type = "READ"
2380        elif self._match_text_seq("WRITE"):
2381            lock_type = "WRITE"
2382        elif self._match_text_seq("CHECKSUM"):
2383            lock_type = "CHECKSUM"
2384        else:
2385            lock_type = None
2386
2387        override = self._match_text_seq("OVERRIDE")
2388
2389        return self.expression(
2390            exp.LockingProperty,
2391            this=this,
2392            kind=kind,
2393            for_or_in=for_or_in,
2394            lock_type=lock_type,
2395            override=override,
2396        )
2397
2398    def _parse_partition_by(self) -> t.List[exp.Expression]:
2399        if self._match(TokenType.PARTITION_BY):
2400            return self._parse_csv(self._parse_assignment)
2401        return []
2402
2403    def _parse_partition_bound_spec(self) -> exp.PartitionBoundSpec:
2404        def _parse_partition_bound_expr() -> t.Optional[exp.Expression]:
2405            if self._match_text_seq("MINVALUE"):
2406                return exp.var("MINVALUE")
2407            if self._match_text_seq("MAXVALUE"):
2408                return exp.var("MAXVALUE")
2409            return self._parse_bitwise()
2410
2411        this: t.Optional[exp.Expression | t.List[exp.Expression]] = None
2412        expression = None
2413        from_expressions = None
2414        to_expressions = None
2415
2416        if self._match(TokenType.IN):
2417            this = self._parse_wrapped_csv(self._parse_bitwise)
2418        elif self._match(TokenType.FROM):
2419            from_expressions = self._parse_wrapped_csv(_parse_partition_bound_expr)
2420            self._match_text_seq("TO")
2421            to_expressions = self._parse_wrapped_csv(_parse_partition_bound_expr)
2422        elif self._match_text_seq("WITH", "(", "MODULUS"):
2423            this = self._parse_number()
2424            self._match_text_seq(",", "REMAINDER")
2425            expression = self._parse_number()
2426            self._match_r_paren()
2427        else:
2428            self.raise_error("Failed to parse partition bound spec.")
2429
2430        return self.expression(
2431            exp.PartitionBoundSpec,
2432            this=this,
2433            expression=expression,
2434            from_expressions=from_expressions,
2435            to_expressions=to_expressions,
2436        )
2437
2438    # https://www.postgresql.org/docs/current/sql-createtable.html
2439    def _parse_partitioned_of(self) -> t.Optional[exp.PartitionedOfProperty]:
2440        if not self._match_text_seq("OF"):
2441            self._retreat(self._index - 1)
2442            return None
2443
2444        this = self._parse_table(schema=True)
2445
2446        if self._match(TokenType.DEFAULT):
2447            expression: exp.Var | exp.PartitionBoundSpec = exp.var("DEFAULT")
2448        elif self._match_text_seq("FOR", "VALUES"):
2449            expression = self._parse_partition_bound_spec()
2450        else:
2451            self.raise_error("Expecting either DEFAULT or FOR VALUES clause.")
2452
2453        return self.expression(exp.PartitionedOfProperty, this=this, expression=expression)
2454
2455    def _parse_partitioned_by(self) -> exp.PartitionedByProperty:
2456        self._match(TokenType.EQ)
2457        return self.expression(
2458            exp.PartitionedByProperty,
2459            this=self._parse_schema() or self._parse_bracket(self._parse_field()),
2460        )
2461
2462    def _parse_withdata(self, no: bool = False) -> exp.WithDataProperty:
2463        if self._match_text_seq("AND", "STATISTICS"):
2464            statistics = True
2465        elif self._match_text_seq("AND", "NO", "STATISTICS"):
2466            statistics = False
2467        else:
2468            statistics = None
2469
2470        return self.expression(exp.WithDataProperty, no=no, statistics=statistics)
2471
2472    def _parse_contains_property(self) -> t.Optional[exp.SqlReadWriteProperty]:
2473        if self._match_text_seq("SQL"):
2474            return self.expression(exp.SqlReadWriteProperty, this="CONTAINS SQL")
2475        return None
2476
2477    def _parse_modifies_property(self) -> t.Optional[exp.SqlReadWriteProperty]:
2478        if self._match_text_seq("SQL", "DATA"):
2479            return self.expression(exp.SqlReadWriteProperty, this="MODIFIES SQL DATA")
2480        return None
2481
2482    def _parse_no_property(self) -> t.Optional[exp.Expression]:
2483        if self._match_text_seq("PRIMARY", "INDEX"):
2484            return exp.NoPrimaryIndexProperty()
2485        if self._match_text_seq("SQL"):
2486            return self.expression(exp.SqlReadWriteProperty, this="NO SQL")
2487        return None
2488
2489    def _parse_on_property(self) -> t.Optional[exp.Expression]:
2490        if self._match_text_seq("COMMIT", "PRESERVE", "ROWS"):
2491            return exp.OnCommitProperty()
2492        if self._match_text_seq("COMMIT", "DELETE", "ROWS"):
2493            return exp.OnCommitProperty(delete=True)
2494        return self.expression(exp.OnProperty, this=self._parse_schema(self._parse_id_var()))
2495
2496    def _parse_reads_property(self) -> t.Optional[exp.SqlReadWriteProperty]:
2497        if self._match_text_seq("SQL", "DATA"):
2498            return self.expression(exp.SqlReadWriteProperty, this="READS SQL DATA")
2499        return None
2500
2501    def _parse_distkey(self) -> exp.DistKeyProperty:
2502        return self.expression(exp.DistKeyProperty, this=self._parse_wrapped(self._parse_id_var))
2503
2504    def _parse_create_like(self) -> t.Optional[exp.LikeProperty]:
2505        table = self._parse_table(schema=True)
2506
2507        options = []
2508        while self._match_texts(("INCLUDING", "EXCLUDING")):
2509            this = self._prev.text.upper()
2510
2511            id_var = self._parse_id_var()
2512            if not id_var:
2513                return None
2514
2515            options.append(
2516                self.expression(exp.Property, this=this, value=exp.var(id_var.this.upper()))
2517            )
2518
2519        return self.expression(exp.LikeProperty, this=table, expressions=options)
2520
2521    def _parse_sortkey(self, compound: bool = False) -> exp.SortKeyProperty:
2522        return self.expression(
2523            exp.SortKeyProperty, this=self._parse_wrapped_id_vars(), compound=compound
2524        )
2525
2526    def _parse_character_set(self, default: bool = False) -> exp.CharacterSetProperty:
2527        self._match(TokenType.EQ)
2528        return self.expression(
2529            exp.CharacterSetProperty, this=self._parse_var_or_string(), default=default
2530        )
2531
2532    def _parse_remote_with_connection(self) -> exp.RemoteWithConnectionModelProperty:
2533        self._match_text_seq("WITH", "CONNECTION")
2534        return self.expression(
2535            exp.RemoteWithConnectionModelProperty, this=self._parse_table_parts()
2536        )
2537
2538    def _parse_returns(self) -> exp.ReturnsProperty:
2539        value: t.Optional[exp.Expression]
2540        null = None
2541        is_table = self._match(TokenType.TABLE)
2542
2543        if is_table:
2544            if self._match(TokenType.LT):
2545                value = self.expression(
2546                    exp.Schema,
2547                    this="TABLE",
2548                    expressions=self._parse_csv(self._parse_struct_types),
2549                )
2550                if not self._match(TokenType.GT):
2551                    self.raise_error("Expecting >")
2552            else:
2553                value = self._parse_schema(exp.var("TABLE"))
2554        elif self._match_text_seq("NULL", "ON", "NULL", "INPUT"):
2555            null = True
2556            value = None
2557        else:
2558            value = self._parse_types()
2559
2560        return self.expression(exp.ReturnsProperty, this=value, is_table=is_table, null=null)
2561
2562    def _parse_describe(self) -> exp.Describe:
2563        kind = self._match_set(self.CREATABLES) and self._prev.text
2564        style = self._match_texts(("EXTENDED", "FORMATTED", "HISTORY")) and self._prev.text.upper()
2565        if self._match(TokenType.DOT):
2566            style = None
2567            self._retreat(self._index - 2)
2568        this = self._parse_table(schema=True)
2569        properties = self._parse_properties()
2570        expressions = properties.expressions if properties else None
2571        partition = self._parse_partition()
2572        return self.expression(
2573            exp.Describe,
2574            this=this,
2575            style=style,
2576            kind=kind,
2577            expressions=expressions,
2578            partition=partition,
2579        )
2580
2581    def _parse_multitable_inserts(self, comments: t.Optional[t.List[str]]) -> exp.MultitableInserts:
2582        kind = self._prev.text.upper()
2583        expressions = []
2584
2585        def parse_conditional_insert() -> t.Optional[exp.ConditionalInsert]:
2586            if self._match(TokenType.WHEN):
2587                expression = self._parse_disjunction()
2588                self._match(TokenType.THEN)
2589            else:
2590                expression = None
2591
2592            else_ = self._match(TokenType.ELSE)
2593
2594            if not self._match(TokenType.INTO):
2595                return None
2596
2597            return self.expression(
2598                exp.ConditionalInsert,
2599                this=self.expression(
2600                    exp.Insert,
2601                    this=self._parse_table(schema=True),
2602                    expression=self._parse_derived_table_values(),
2603                ),
2604                expression=expression,
2605                else_=else_,
2606            )
2607
2608        expression = parse_conditional_insert()
2609        while expression is not None:
2610            expressions.append(expression)
2611            expression = parse_conditional_insert()
2612
2613        return self.expression(
2614            exp.MultitableInserts,
2615            kind=kind,
2616            comments=comments,
2617            expressions=expressions,
2618            source=self._parse_table(),
2619        )
2620
2621    def _parse_insert(self) -> t.Union[exp.Insert, exp.MultitableInserts]:
2622        comments = ensure_list(self._prev_comments)
2623        hint = self._parse_hint()
2624        overwrite = self._match(TokenType.OVERWRITE)
2625        ignore = self._match(TokenType.IGNORE)
2626        local = self._match_text_seq("LOCAL")
2627        alternative = None
2628        is_function = None
2629
2630        if self._match_text_seq("DIRECTORY"):
2631            this: t.Optional[exp.Expression] = self.expression(
2632                exp.Directory,
2633                this=self._parse_var_or_string(),
2634                local=local,
2635                row_format=self._parse_row_format(match_row=True),
2636            )
2637        else:
2638            if self._match_set((TokenType.FIRST, TokenType.ALL)):
2639                comments += ensure_list(self._prev_comments)
2640                return self._parse_multitable_inserts(comments)
2641
2642            if self._match(TokenType.OR):
2643                alternative = self._match_texts(self.INSERT_ALTERNATIVES) and self._prev.text
2644
2645            self._match(TokenType.INTO)
2646            comments += ensure_list(self._prev_comments)
2647            self._match(TokenType.TABLE)
2648            is_function = self._match(TokenType.FUNCTION)
2649
2650            this = (
2651                self._parse_table(schema=True, parse_partition=True)
2652                if not is_function
2653                else self._parse_function()
2654            )
2655
2656        returning = self._parse_returning()
2657
2658        return self.expression(
2659            exp.Insert,
2660            comments=comments,
2661            hint=hint,
2662            is_function=is_function,
2663            this=this,
2664            stored=self._match_text_seq("STORED") and self._parse_stored(),
2665            by_name=self._match_text_seq("BY", "NAME"),
2666            exists=self._parse_exists(),
2667            where=self._match_pair(TokenType.REPLACE, TokenType.WHERE) and self._parse_assignment(),
2668            partition=self._match(TokenType.PARTITION_BY) and self._parse_partitioned_by(),
2669            settings=self._match_text_seq("SETTINGS") and self._parse_settings_property(),
2670            expression=self._parse_derived_table_values() or self._parse_ddl_select(),
2671            conflict=self._parse_on_conflict(),
2672            returning=returning or self._parse_returning(),
2673            overwrite=overwrite,
2674            alternative=alternative,
2675            ignore=ignore,
2676            source=self._match(TokenType.TABLE) and self._parse_table(),
2677        )
2678
2679    def _parse_kill(self) -> exp.Kill:
2680        kind = exp.var(self._prev.text) if self._match_texts(("CONNECTION", "QUERY")) else None
2681
2682        return self.expression(
2683            exp.Kill,
2684            this=self._parse_primary(),
2685            kind=kind,
2686        )
2687
2688    def _parse_on_conflict(self) -> t.Optional[exp.OnConflict]:
2689        conflict = self._match_text_seq("ON", "CONFLICT")
2690        duplicate = self._match_text_seq("ON", "DUPLICATE", "KEY")
2691
2692        if not conflict and not duplicate:
2693            return None
2694
2695        conflict_keys = None
2696        constraint = None
2697
2698        if conflict:
2699            if self._match_text_seq("ON", "CONSTRAINT"):
2700                constraint = self._parse_id_var()
2701            elif self._match(TokenType.L_PAREN):
2702                conflict_keys = self._parse_csv(self._parse_id_var)
2703                self._match_r_paren()
2704
2705        action = self._parse_var_from_options(self.CONFLICT_ACTIONS)
2706        if self._prev.token_type == TokenType.UPDATE:
2707            self._match(TokenType.SET)
2708            expressions = self._parse_csv(self._parse_equality)
2709        else:
2710            expressions = None
2711
2712        return self.expression(
2713            exp.OnConflict,
2714            duplicate=duplicate,
2715            expressions=expressions,
2716            action=action,
2717            conflict_keys=conflict_keys,
2718            constraint=constraint,
2719        )
2720
2721    def _parse_returning(self) -> t.Optional[exp.Returning]:
2722        if not self._match(TokenType.RETURNING):
2723            return None
2724        return self.expression(
2725            exp.Returning,
2726            expressions=self._parse_csv(self._parse_expression),
2727            into=self._match(TokenType.INTO) and self._parse_table_part(),
2728        )
2729
2730    def _parse_row(self) -> t.Optional[exp.RowFormatSerdeProperty | exp.RowFormatDelimitedProperty]:
2731        if not self._match(TokenType.FORMAT):
2732            return None
2733        return self._parse_row_format()
2734
2735    def _parse_serde_properties(self, with_: bool = False) -> t.Optional[exp.SerdeProperties]:
2736        index = self._index
2737        with_ = with_ or self._match_text_seq("WITH")
2738
2739        if not self._match(TokenType.SERDE_PROPERTIES):
2740            self._retreat(index)
2741            return None
2742        return self.expression(
2743            exp.SerdeProperties,
2744            **{  # type: ignore
2745                "expressions": self._parse_wrapped_properties(),
2746                "with": with_,
2747            },
2748        )
2749
2750    def _parse_row_format(
2751        self, match_row: bool = False
2752    ) -> t.Optional[exp.RowFormatSerdeProperty | exp.RowFormatDelimitedProperty]:
2753        if match_row and not self._match_pair(TokenType.ROW, TokenType.FORMAT):
2754            return None
2755
2756        if self._match_text_seq("SERDE"):
2757            this = self._parse_string()
2758
2759            serde_properties = self._parse_serde_properties()
2760
2761            return self.expression(
2762                exp.RowFormatSerdeProperty, this=this, serde_properties=serde_properties
2763            )
2764
2765        self._match_text_seq("DELIMITED")
2766
2767        kwargs = {}
2768
2769        if self._match_text_seq("FIELDS", "TERMINATED", "BY"):
2770            kwargs["fields"] = self._parse_string()
2771            if self._match_text_seq("ESCAPED", "BY"):
2772                kwargs["escaped"] = self._parse_string()
2773        if self._match_text_seq("COLLECTION", "ITEMS", "TERMINATED", "BY"):
2774            kwargs["collection_items"] = self._parse_string()
2775        if self._match_text_seq("MAP", "KEYS", "TERMINATED", "BY"):
2776            kwargs["map_keys"] = self._parse_string()
2777        if self._match_text_seq("LINES", "TERMINATED", "BY"):
2778            kwargs["lines"] = self._parse_string()
2779        if self._match_text_seq("NULL", "DEFINED", "AS"):
2780            kwargs["null"] = self._parse_string()
2781
2782        return self.expression(exp.RowFormatDelimitedProperty, **kwargs)  # type: ignore
2783
2784    def _parse_load(self) -> exp.LoadData | exp.Command:
2785        if self._match_text_seq("DATA"):
2786            local = self._match_text_seq("LOCAL")
2787            self._match_text_seq("INPATH")
2788            inpath = self._parse_string()
2789            overwrite = self._match(TokenType.OVERWRITE)
2790            self._match_pair(TokenType.INTO, TokenType.TABLE)
2791
2792            return self.expression(
2793                exp.LoadData,
2794                this=self._parse_table(schema=True),
2795                local=local,
2796                overwrite=overwrite,
2797                inpath=inpath,
2798                partition=self._parse_partition(),
2799                input_format=self._match_text_seq("INPUTFORMAT") and self._parse_string(),
2800                serde=self._match_text_seq("SERDE") and self._parse_string(),
2801            )
2802        return self._parse_as_command(self._prev)
2803
2804    def _parse_delete(self) -> exp.Delete:
2805        # This handles MySQL's "Multiple-Table Syntax"
2806        # https://dev.mysql.com/doc/refman/8.0/en/delete.html
2807        tables = None
2808        comments = self._prev_comments
2809        if not self._match(TokenType.FROM, advance=False):
2810            tables = self._parse_csv(self._parse_table) or None
2811
2812        returning = self._parse_returning()
2813
2814        return self.expression(
2815            exp.Delete,
2816            comments=comments,
2817            tables=tables,
2818            this=self._match(TokenType.FROM) and self._parse_table(joins=True),
2819            using=self._match(TokenType.USING) and self._parse_table(joins=True),
2820            where=self._parse_where(),
2821            returning=returning or self._parse_returning(),
2822            limit=self._parse_limit(),
2823        )
2824
2825    def _parse_update(self) -> exp.Update:
2826        comments = self._prev_comments
2827        this = self._parse_table(joins=True, alias_tokens=self.UPDATE_ALIAS_TOKENS)
2828        expressions = self._match(TokenType.SET) and self._parse_csv(self._parse_equality)
2829        returning = self._parse_returning()
2830        return self.expression(
2831            exp.Update,
2832            comments=comments,
2833            **{  # type: ignore
2834                "this": this,
2835                "expressions": expressions,
2836                "from": self._parse_from(joins=True),
2837                "where": self._parse_where(),
2838                "returning": returning or self._parse_returning(),
2839                "order": self._parse_order(),
2840                "limit": self._parse_limit(),
2841            },
2842        )
2843
2844    def _parse_uncache(self) -> exp.Uncache:
2845        if not self._match(TokenType.TABLE):
2846            self.raise_error("Expecting TABLE after UNCACHE")
2847
2848        return self.expression(
2849            exp.Uncache, exists=self._parse_exists(), this=self._parse_table(schema=True)
2850        )
2851
2852    def _parse_cache(self) -> exp.Cache:
2853        lazy = self._match_text_seq("LAZY")
2854        self._match(TokenType.TABLE)
2855        table = self._parse_table(schema=True)
2856
2857        options = []
2858        if self._match_text_seq("OPTIONS"):
2859            self._match_l_paren()
2860            k = self._parse_string()
2861            self._match(TokenType.EQ)
2862            v = self._parse_string()
2863            options = [k, v]
2864            self._match_r_paren()
2865
2866        self._match(TokenType.ALIAS)
2867        return self.expression(
2868            exp.Cache,
2869            this=table,
2870            lazy=lazy,
2871            options=options,
2872            expression=self._parse_select(nested=True),
2873        )
2874
2875    def _parse_partition(self) -> t.Optional[exp.Partition]:
2876        if not self._match(TokenType.PARTITION):
2877            return None
2878
2879        return self.expression(
2880            exp.Partition, expressions=self._parse_wrapped_csv(self._parse_assignment)
2881        )
2882
2883    def _parse_value(self) -> t.Optional[exp.Tuple]:
2884        if self._match(TokenType.L_PAREN):
2885            expressions = self._parse_csv(self._parse_expression)
2886            self._match_r_paren()
2887            return self.expression(exp.Tuple, expressions=expressions)
2888
2889        # In some dialects we can have VALUES 1, 2 which results in 1 column & 2 rows.
2890        expression = self._parse_expression()
2891        if expression:
2892            return self.expression(exp.Tuple, expressions=[expression])
2893        return None
2894
2895    def _parse_projections(self) -> t.List[exp.Expression]:
2896        return self._parse_expressions()
2897
2898    def _parse_select(
2899        self,
2900        nested: bool = False,
2901        table: bool = False,
2902        parse_subquery_alias: bool = True,
2903        parse_set_operation: bool = True,
2904    ) -> t.Optional[exp.Expression]:
2905        cte = self._parse_with()
2906
2907        if cte:
2908            this = self._parse_statement()
2909
2910            if not this:
2911                self.raise_error("Failed to parse any statement following CTE")
2912                return cte
2913
2914            if "with" in this.arg_types:
2915                this.set("with", cte)
2916            else:
2917                self.raise_error(f"{this.key} does not support CTE")
2918                this = cte
2919
2920            return this
2921
2922        # duckdb supports leading with FROM x
2923        from_ = self._parse_from() if self._match(TokenType.FROM, advance=False) else None
2924
2925        if self._match(TokenType.SELECT):
2926            comments = self._prev_comments
2927
2928            hint = self._parse_hint()
2929
2930            if self._next and not self._next.token_type == TokenType.DOT:
2931                all_ = self._match(TokenType.ALL)
2932                distinct = self._match_set(self.DISTINCT_TOKENS)
2933            else:
2934                all_, distinct = None, None
2935
2936            kind = (
2937                self._match(TokenType.ALIAS)
2938                and self._match_texts(("STRUCT", "VALUE"))
2939                and self._prev.text.upper()
2940            )
2941
2942            if distinct:
2943                distinct = self.expression(
2944                    exp.Distinct,
2945                    on=self._parse_value() if self._match(TokenType.ON) else None,
2946                )
2947
2948            if all_ and distinct:
2949                self.raise_error("Cannot specify both ALL and DISTINCT after SELECT")
2950
2951            limit = self._parse_limit(top=True)
2952            projections = self._parse_projections()
2953
2954            this = self.expression(
2955                exp.Select,
2956                kind=kind,
2957                hint=hint,
2958                distinct=distinct,
2959                expressions=projections,
2960                limit=limit,
2961            )
2962            this.comments = comments
2963
2964            into = self._parse_into()
2965            if into:
2966                this.set("into", into)
2967
2968            if not from_:
2969                from_ = self._parse_from()
2970
2971            if from_:
2972                this.set("from", from_)
2973
2974            this = self._parse_query_modifiers(this)
2975        elif (table or nested) and self._match(TokenType.L_PAREN):
2976            if self._match(TokenType.PIVOT):
2977                this = self._parse_simplified_pivot()
2978            elif self._match(TokenType.FROM):
2979                this = exp.select("*").from_(
2980                    t.cast(exp.From, self._parse_from(skip_from_token=True))
2981                )
2982            else:
2983                this = (
2984                    self._parse_table()
2985                    if table
2986                    else self._parse_select(nested=True, parse_set_operation=False)
2987                )
2988                this = self._parse_query_modifiers(self._parse_set_operations(this))
2989
2990            self._match_r_paren()
2991
2992            # We return early here so that the UNION isn't attached to the subquery by the
2993            # following call to _parse_set_operations, but instead becomes the parent node
2994            return self._parse_subquery(this, parse_alias=parse_subquery_alias)
2995        elif self._match(TokenType.VALUES, advance=False):
2996            this = self._parse_derived_table_values()
2997        elif from_:
2998            this = exp.select("*").from_(from_.this, copy=False)
2999        elif self._match(TokenType.SUMMARIZE):
3000            table = self._match(TokenType.TABLE)
3001            this = self._parse_select() or self._parse_string() or self._parse_table()
3002            return self.expression(exp.Summarize, this=this, table=table)
3003        elif self._match(TokenType.DESCRIBE):
3004            this = self._parse_describe()
3005        elif self._match_text_seq("STREAM"):
3006            this = self.expression(exp.Stream, this=self._parse_function())
3007        else:
3008            this = None
3009
3010        return self._parse_set_operations(this) if parse_set_operation else this
3011
3012    def _parse_with(self, skip_with_token: bool = False) -> t.Optional[exp.With]:
3013        if not skip_with_token and not self._match(TokenType.WITH):
3014            return None
3015
3016        comments = self._prev_comments
3017        recursive = self._match(TokenType.RECURSIVE)
3018
3019        expressions = []
3020        while True:
3021            expressions.append(self._parse_cte())
3022
3023            if not self._match(TokenType.COMMA) and not self._match(TokenType.WITH):
3024                break
3025            else:
3026                self._match(TokenType.WITH)
3027
3028        return self.expression(
3029            exp.With, comments=comments, expressions=expressions, recursive=recursive
3030        )
3031
3032    def _parse_cte(self) -> exp.CTE:
3033        alias = self._parse_table_alias(self.ID_VAR_TOKENS)
3034        if not alias or not alias.this:
3035            self.raise_error("Expected CTE to have alias")
3036
3037        self._match(TokenType.ALIAS)
3038        comments = self._prev_comments
3039
3040        if self._match_text_seq("NOT", "MATERIALIZED"):
3041            materialized = False
3042        elif self._match_text_seq("MATERIALIZED"):
3043            materialized = True
3044        else:
3045            materialized = None
3046
3047        return self.expression(
3048            exp.CTE,
3049            this=self._parse_wrapped(self._parse_statement),
3050            alias=alias,
3051            materialized=materialized,
3052            comments=comments,
3053        )
3054
3055    def _parse_table_alias(
3056        self, alias_tokens: t.Optional[t.Collection[TokenType]] = None
3057    ) -> t.Optional[exp.TableAlias]:
3058        any_token = self._match(TokenType.ALIAS)
3059        alias = (
3060            self._parse_id_var(any_token=any_token, tokens=alias_tokens or self.TABLE_ALIAS_TOKENS)
3061            or self._parse_string_as_identifier()
3062        )
3063
3064        index = self._index
3065        if self._match(TokenType.L_PAREN):
3066            columns = self._parse_csv(self._parse_function_parameter)
3067            self._match_r_paren() if columns else self._retreat(index)
3068        else:
3069            columns = None
3070
3071        if not alias and not columns:
3072            return None
3073
3074        table_alias = self.expression(exp.TableAlias, this=alias, columns=columns)
3075
3076        # We bubble up comments from the Identifier to the TableAlias
3077        if isinstance(alias, exp.Identifier):
3078            table_alias.add_comments(alias.pop_comments())
3079
3080        return table_alias
3081
3082    def _parse_subquery(
3083        self, this: t.Optional[exp.Expression], parse_alias: bool = True
3084    ) -> t.Optional[exp.Subquery]:
3085        if not this:
3086            return None
3087
3088        return self.expression(
3089            exp.Subquery,
3090            this=this,
3091            pivots=self._parse_pivots(),
3092            alias=self._parse_table_alias() if parse_alias else None,
3093            sample=self._parse_table_sample(),
3094        )
3095
3096    def _implicit_unnests_to_explicit(self, this: E) -> E:
3097        from sqlglot.optimizer.normalize_identifiers import normalize_identifiers as _norm
3098
3099        refs = {_norm(this.args["from"].this.copy(), dialect=self.dialect).alias_or_name}
3100        for i, join in enumerate(this.args.get("joins") or []):
3101            table = join.this
3102            normalized_table = table.copy()
3103            normalized_table.meta["maybe_column"] = True
3104            normalized_table = _norm(normalized_table, dialect=self.dialect)
3105
3106            if isinstance(table, exp.Table) and not join.args.get("on"):
3107                if normalized_table.parts[0].name in refs:
3108                    table_as_column = table.to_column()
3109                    unnest = exp.Unnest(expressions=[table_as_column])
3110
3111                    # Table.to_column creates a parent Alias node that we want to convert to
3112                    # a TableAlias and attach to the Unnest, so it matches the parser's output
3113                    if isinstance(table.args.get("alias"), exp.TableAlias):
3114                        table_as_column.replace(table_as_column.this)
3115                        exp.alias_(unnest, None, table=[table.args["alias"].this], copy=False)
3116
3117                    table.replace(unnest)
3118
3119            refs.add(normalized_table.alias_or_name)
3120
3121        return this
3122
3123    def _parse_query_modifiers(
3124        self, this: t.Optional[exp.Expression]
3125    ) -> t.Optional[exp.Expression]:
3126        if isinstance(this, (exp.Query, exp.Table)):
3127            for join in self._parse_joins():
3128                this.append("joins", join)
3129            for lateral in iter(self._parse_lateral, None):
3130                this.append("laterals", lateral)
3131
3132            while True:
3133                if self._match_set(self.QUERY_MODIFIER_PARSERS, advance=False):
3134                    parser = self.QUERY_MODIFIER_PARSERS[self._curr.token_type]
3135                    key, expression = parser(self)
3136
3137                    if expression:
3138                        this.set(key, expression)
3139                        if key == "limit":
3140                            offset = expression.args.pop("offset", None)
3141
3142                            if offset:
3143                                offset = exp.Offset(expression=offset)
3144                                this.set("offset", offset)
3145
3146                                limit_by_expressions = expression.expressions
3147                                expression.set("expressions", None)
3148                                offset.set("expressions", limit_by_expressions)
3149                        continue
3150                break
3151
3152        if self.SUPPORTS_IMPLICIT_UNNEST and this and this.args.get("from"):
3153            this = self._implicit_unnests_to_explicit(this)
3154
3155        return this
3156
3157    def _parse_hint(self) -> t.Optional[exp.Hint]:
3158        if self._match(TokenType.HINT):
3159            hints = []
3160            for hint in iter(
3161                lambda: self._parse_csv(
3162                    lambda: self._parse_function() or self._parse_var(upper=True)
3163                ),
3164                [],
3165            ):
3166                hints.extend(hint)
3167
3168            if not self._match_pair(TokenType.STAR, TokenType.SLASH):
3169                self.raise_error("Expected */ after HINT")
3170
3171            return self.expression(exp.Hint, expressions=hints)
3172
3173        return None
3174
3175    def _parse_into(self) -> t.Optional[exp.Into]:
3176        if not self._match(TokenType.INTO):
3177            return None
3178
3179        temp = self._match(TokenType.TEMPORARY)
3180        unlogged = self._match_text_seq("UNLOGGED")
3181        self._match(TokenType.TABLE)
3182
3183        return self.expression(
3184            exp.Into, this=self._parse_table(schema=True), temporary=temp, unlogged=unlogged
3185        )
3186
3187    def _parse_from(
3188        self, joins: bool = False, skip_from_token: bool = False
3189    ) -> t.Optional[exp.From]:
3190        if not skip_from_token and not self._match(TokenType.FROM):
3191            return None
3192
3193        return self.expression(
3194            exp.From, comments=self._prev_comments, this=self._parse_table(joins=joins)
3195        )
3196
3197    def _parse_match_recognize_measure(self) -> exp.MatchRecognizeMeasure:
3198        return self.expression(
3199            exp.MatchRecognizeMeasure,
3200            window_frame=self._match_texts(("FINAL", "RUNNING")) and self._prev.text.upper(),
3201            this=self._parse_expression(),
3202        )
3203
3204    def _parse_match_recognize(self) -> t.Optional[exp.MatchRecognize]:
3205        if not self._match(TokenType.MATCH_RECOGNIZE):
3206            return None
3207
3208        self._match_l_paren()
3209
3210        partition = self._parse_partition_by()
3211        order = self._parse_order()
3212
3213        measures = (
3214            self._parse_csv(self._parse_match_recognize_measure)
3215            if self._match_text_seq("MEASURES")
3216            else None
3217        )
3218
3219        if self._match_text_seq("ONE", "ROW", "PER", "MATCH"):
3220            rows = exp.var("ONE ROW PER MATCH")
3221        elif self._match_text_seq("ALL", "ROWS", "PER", "MATCH"):
3222            text = "ALL ROWS PER MATCH"
3223            if self._match_text_seq("SHOW", "EMPTY", "MATCHES"):
3224                text += " SHOW EMPTY MATCHES"
3225            elif self._match_text_seq("OMIT", "EMPTY", "MATCHES"):
3226                text += " OMIT EMPTY MATCHES"
3227            elif self._match_text_seq("WITH", "UNMATCHED", "ROWS"):
3228                text += " WITH UNMATCHED ROWS"
3229            rows = exp.var(text)
3230        else:
3231            rows = None
3232
3233        if self._match_text_seq("AFTER", "MATCH", "SKIP"):
3234            text = "AFTER MATCH SKIP"
3235            if self._match_text_seq("PAST", "LAST", "ROW"):
3236                text += " PAST LAST ROW"
3237            elif self._match_text_seq("TO", "NEXT", "ROW"):
3238                text += " TO NEXT ROW"
3239            elif self._match_text_seq("TO", "FIRST"):
3240                text += f" TO FIRST {self._advance_any().text}"  # type: ignore
3241            elif self._match_text_seq("TO", "LAST"):
3242                text += f" TO LAST {self._advance_any().text}"  # type: ignore
3243            after = exp.var(text)
3244        else:
3245            after = None
3246
3247        if self._match_text_seq("PATTERN"):
3248            self._match_l_paren()
3249
3250            if not self._curr:
3251                self.raise_error("Expecting )", self._curr)
3252
3253            paren = 1
3254            start = self._curr
3255
3256            while self._curr and paren > 0:
3257                if self._curr.token_type == TokenType.L_PAREN:
3258                    paren += 1
3259                if self._curr.token_type == TokenType.R_PAREN:
3260                    paren -= 1
3261
3262                end = self._prev
3263                self._advance()
3264
3265            if paren > 0:
3266                self.raise_error("Expecting )", self._curr)
3267
3268            pattern = exp.var(self._find_sql(start, end))
3269        else:
3270            pattern = None
3271
3272        define = (
3273            self._parse_csv(self._parse_name_as_expression)
3274            if self._match_text_seq("DEFINE")
3275            else None
3276        )
3277
3278        self._match_r_paren()
3279
3280        return self.expression(
3281            exp.MatchRecognize,
3282            partition_by=partition,
3283            order=order,
3284            measures=measures,
3285            rows=rows,
3286            after=after,
3287            pattern=pattern,
3288            define=define,
3289            alias=self._parse_table_alias(),
3290        )
3291
3292    def _parse_lateral(self) -> t.Optional[exp.Lateral]:
3293        cross_apply = self._match_pair(TokenType.CROSS, TokenType.APPLY)
3294        if not cross_apply and self._match_pair(TokenType.OUTER, TokenType.APPLY):
3295            cross_apply = False
3296
3297        if cross_apply is not None:
3298            this = self._parse_select(table=True)
3299            view = None
3300            outer = None
3301        elif self._match(TokenType.LATERAL):
3302            this = self._parse_select(table=True)
3303            view = self._match(TokenType.VIEW)
3304            outer = self._match(TokenType.OUTER)
3305        else:
3306            return None
3307
3308        if not this:
3309            this = (
3310                self._parse_unnest()
3311                or self._parse_function()
3312                or self._parse_id_var(any_token=False)
3313            )
3314
3315            while self._match(TokenType.DOT):
3316                this = exp.Dot(
3317                    this=this,
3318                    expression=self._parse_function() or self._parse_id_var(any_token=False),
3319                )
3320
3321        if view:
3322            table = self._parse_id_var(any_token=False)
3323            columns = self._parse_csv(self._parse_id_var) if self._match(TokenType.ALIAS) else []
3324            table_alias: t.Optional[exp.TableAlias] = self.expression(
3325                exp.TableAlias, this=table, columns=columns
3326            )
3327        elif isinstance(this, (exp.Subquery, exp.Unnest)) and this.alias:
3328            # We move the alias from the lateral's child node to the lateral itself
3329            table_alias = this.args["alias"].pop()
3330        else:
3331            table_alias = self._parse_table_alias()
3332
3333        return self.expression(
3334            exp.Lateral,
3335            this=this,
3336            view=view,
3337            outer=outer,
3338            alias=table_alias,
3339            cross_apply=cross_apply,
3340        )
3341
3342    def _parse_join_parts(
3343        self,
3344    ) -> t.Tuple[t.Optional[Token], t.Optional[Token], t.Optional[Token]]:
3345        return (
3346            self._match_set(self.JOIN_METHODS) and self._prev,
3347            self._match_set(self.JOIN_SIDES) and self._prev,
3348            self._match_set(self.JOIN_KINDS) and self._prev,
3349        )
3350
3351    def _parse_using_identifiers(self) -> t.List[exp.Expression]:
3352        def _parse_column_as_identifier() -> t.Optional[exp.Expression]:
3353            this = self._parse_column()
3354            if isinstance(this, exp.Column):
3355                return this.this
3356            return this
3357
3358        return self._parse_wrapped_csv(_parse_column_as_identifier, optional=True)
3359
3360    def _parse_join(
3361        self, skip_join_token: bool = False, parse_bracket: bool = False
3362    ) -> t.Optional[exp.Join]:
3363        if self._match(TokenType.COMMA):
3364            return self.expression(exp.Join, this=self._parse_table())
3365
3366        index = self._index
3367        method, side, kind = self._parse_join_parts()
3368        hint = self._prev.text if self._match_texts(self.JOIN_HINTS) else None
3369        join = self._match(TokenType.JOIN) or (kind and kind.token_type == TokenType.STRAIGHT_JOIN)
3370
3371        if not skip_join_token and not join:
3372            self._retreat(index)
3373            kind = None
3374            method = None
3375            side = None
3376
3377        outer_apply = self._match_pair(TokenType.OUTER, TokenType.APPLY, False)
3378        cross_apply = self._match_pair(TokenType.CROSS, TokenType.APPLY, False)
3379
3380        if not skip_join_token and not join and not outer_apply and not cross_apply:
3381            return None
3382
3383        kwargs: t.Dict[str, t.Any] = {"this": self._parse_table(parse_bracket=parse_bracket)}
3384
3385        if method:
3386            kwargs["method"] = method.text
3387        if side:
3388            kwargs["side"] = side.text
3389        if kind:
3390            kwargs["kind"] = kind.text
3391        if hint:
3392            kwargs["hint"] = hint
3393
3394        if self._match(TokenType.MATCH_CONDITION):
3395            kwargs["match_condition"] = self._parse_wrapped(self._parse_comparison)
3396
3397        if self._match(TokenType.ON):
3398            kwargs["on"] = self._parse_assignment()
3399        elif self._match(TokenType.USING):
3400            kwargs["using"] = self._parse_using_identifiers()
3401        elif (
3402            not (outer_apply or cross_apply)
3403            and not isinstance(kwargs["this"], exp.Unnest)
3404            and not (kind and kind.token_type == TokenType.CROSS)
3405        ):
3406            index = self._index
3407            joins: t.Optional[list] = list(self._parse_joins())
3408
3409            if joins and self._match(TokenType.ON):
3410                kwargs["on"] = self._parse_assignment()
3411            elif joins and self._match(TokenType.USING):
3412                kwargs["using"] = self._parse_using_identifiers()
3413            else:
3414                joins = None
3415                self._retreat(index)
3416
3417            kwargs["this"].set("joins", joins if joins else None)
3418
3419        comments = [c for token in (method, side, kind) if token for c in token.comments]
3420        return self.expression(exp.Join, comments=comments, **kwargs)
3421
3422    def _parse_opclass(self) -> t.Optional[exp.Expression]:
3423        this = self._parse_assignment()
3424
3425        if self._match_texts(self.OPCLASS_FOLLOW_KEYWORDS, advance=False):
3426            return this
3427
3428        if not self._match_set(self.OPTYPE_FOLLOW_TOKENS, advance=False):
3429            return self.expression(exp.Opclass, this=this, expression=self._parse_table_parts())
3430
3431        return this
3432
3433    def _parse_index_params(self) -> exp.IndexParameters:
3434        using = self._parse_var(any_token=True) if self._match(TokenType.USING) else None
3435
3436        if self._match(TokenType.L_PAREN, advance=False):
3437            columns = self._parse_wrapped_csv(self._parse_with_operator)
3438        else:
3439            columns = None
3440
3441        include = self._parse_wrapped_id_vars() if self._match_text_seq("INCLUDE") else None
3442        partition_by = self._parse_partition_by()
3443        with_storage = self._match(TokenType.WITH) and self._parse_wrapped_properties()
3444        tablespace = (
3445            self._parse_var(any_token=True)
3446            if self._match_text_seq("USING", "INDEX", "TABLESPACE")
3447            else None
3448        )
3449        where = self._parse_where()
3450
3451        on = self._parse_field() if self._match(TokenType.ON) else None
3452
3453        return self.expression(
3454            exp.IndexParameters,
3455            using=using,
3456            columns=columns,
3457            include=include,
3458            partition_by=partition_by,
3459            where=where,
3460            with_storage=with_storage,
3461            tablespace=tablespace,
3462            on=on,
3463        )
3464
3465    def _parse_index(
3466        self, index: t.Optional[exp.Expression] = None, anonymous: bool = False
3467    ) -> t.Optional[exp.Index]:
3468        if index or anonymous:
3469            unique = None
3470            primary = None
3471            amp = None
3472
3473            self._match(TokenType.ON)
3474            self._match(TokenType.TABLE)  # hive
3475            table = self._parse_table_parts(schema=True)
3476        else:
3477            unique = self._match(TokenType.UNIQUE)
3478            primary = self._match_text_seq("PRIMARY")
3479            amp = self._match_text_seq("AMP")
3480
3481            if not self._match(TokenType.INDEX):
3482                return None
3483
3484            index = self._parse_id_var()
3485            table = None
3486
3487        params = self._parse_index_params()
3488
3489        return self.expression(
3490            exp.Index,
3491            this=index,
3492            table=table,
3493            unique=unique,
3494            primary=primary,
3495            amp=amp,
3496            params=params,
3497        )
3498
3499    def _parse_table_hints(self) -> t.Optional[t.List[exp.Expression]]:
3500        hints: t.List[exp.Expression] = []
3501        if self._match_pair(TokenType.WITH, TokenType.L_PAREN):
3502            # https://learn.microsoft.com/en-us/sql/t-sql/queries/hints-transact-sql-table?view=sql-server-ver16
3503            hints.append(
3504                self.expression(
3505                    exp.WithTableHint,
3506                    expressions=self._parse_csv(
3507                        lambda: self._parse_function() or self._parse_var(any_token=True)
3508                    ),
3509                )
3510            )
3511            self._match_r_paren()
3512        else:
3513            # https://dev.mysql.com/doc/refman/8.0/en/index-hints.html
3514            while self._match_set(self.TABLE_INDEX_HINT_TOKENS):
3515                hint = exp.IndexTableHint(this=self._prev.text.upper())
3516
3517                self._match_set((TokenType.INDEX, TokenType.KEY))
3518                if self._match(TokenType.FOR):
3519                    hint.set("target", self._advance_any() and self._prev.text.upper())
3520
3521                hint.set("expressions", self._parse_wrapped_id_vars())
3522                hints.append(hint)
3523
3524        return hints or None
3525
3526    def _parse_table_part(self, schema: bool = False) -> t.Optional[exp.Expression]:
3527        return (
3528            (not schema and self._parse_function(optional_parens=False))
3529            or self._parse_id_var(any_token=False)
3530            or self._parse_string_as_identifier()
3531            or self._parse_placeholder()
3532        )
3533
3534    def _parse_table_parts(
3535        self, schema: bool = False, is_db_reference: bool = False, wildcard: bool = False
3536    ) -> exp.Table:
3537        catalog = None
3538        db = None
3539        table: t.Optional[exp.Expression | str] = self._parse_table_part(schema=schema)
3540
3541        while self._match(TokenType.DOT):
3542            if catalog:
3543                # This allows nesting the table in arbitrarily many dot expressions if needed
3544                table = self.expression(
3545                    exp.Dot, this=table, expression=self._parse_table_part(schema=schema)
3546                )
3547            else:
3548                catalog = db
3549                db = table
3550                # "" used for tsql FROM a..b case
3551                table = self._parse_table_part(schema=schema) or ""
3552
3553        if (
3554            wildcard
3555            and self._is_connected()
3556            and (isinstance(table, exp.Identifier) or not table)
3557            and self._match(TokenType.STAR)
3558        ):
3559            if isinstance(table, exp.Identifier):
3560                table.args["this"] += "*"
3561            else:
3562                table = exp.Identifier(this="*")
3563
3564        # We bubble up comments from the Identifier to the Table
3565        comments = table.pop_comments() if isinstance(table, exp.Expression) else None
3566
3567        if is_db_reference:
3568            catalog = db
3569            db = table
3570            table = None
3571
3572        if not table and not is_db_reference:
3573            self.raise_error(f"Expected table name but got {self._curr}")
3574        if not db and is_db_reference:
3575            self.raise_error(f"Expected database name but got {self._curr}")
3576
3577        table = self.expression(
3578            exp.Table,
3579            comments=comments,
3580            this=table,
3581            db=db,
3582            catalog=catalog,
3583        )
3584
3585        changes = self._parse_changes()
3586        if changes:
3587            table.set("changes", changes)
3588
3589        at_before = self._parse_historical_data()
3590        if at_before:
3591            table.set("when", at_before)
3592
3593        pivots = self._parse_pivots()
3594        if pivots:
3595            table.set("pivots", pivots)
3596
3597        return table
3598
3599    def _parse_table(
3600        self,
3601        schema: bool = False,
3602        joins: bool = False,
3603        alias_tokens: t.Optional[t.Collection[TokenType]] = None,
3604        parse_bracket: bool = False,
3605        is_db_reference: bool = False,
3606        parse_partition: bool = False,
3607    ) -> t.Optional[exp.Expression]:
3608        lateral = self._parse_lateral()
3609        if lateral:
3610            return lateral
3611
3612        unnest = self._parse_unnest()
3613        if unnest:
3614            return unnest
3615
3616        values = self._parse_derived_table_values()
3617        if values:
3618            return values
3619
3620        subquery = self._parse_select(table=True)
3621        if subquery:
3622            if not subquery.args.get("pivots"):
3623                subquery.set("pivots", self._parse_pivots())
3624            return subquery
3625
3626        bracket = parse_bracket and self._parse_bracket(None)
3627        bracket = self.expression(exp.Table, this=bracket) if bracket else None
3628
3629        rows_from = self._match_text_seq("ROWS", "FROM") and self._parse_wrapped_csv(
3630            self._parse_table
3631        )
3632        rows_from = self.expression(exp.Table, rows_from=rows_from) if rows_from else None
3633
3634        only = self._match(TokenType.ONLY)
3635
3636        this = t.cast(
3637            exp.Expression,
3638            bracket
3639            or rows_from
3640            or self._parse_bracket(
3641                self._parse_table_parts(schema=schema, is_db_reference=is_db_reference)
3642            ),
3643        )
3644
3645        if only:
3646            this.set("only", only)
3647
3648        # Postgres supports a wildcard (table) suffix operator, which is a no-op in this context
3649        self._match_text_seq("*")
3650
3651        parse_partition = parse_partition or self.SUPPORTS_PARTITION_SELECTION
3652        if parse_partition and self._match(TokenType.PARTITION, advance=False):
3653            this.set("partition", self._parse_partition())
3654
3655        if schema:
3656            return self._parse_schema(this=this)
3657
3658        version = self._parse_version()
3659
3660        if version:
3661            this.set("version", version)
3662
3663        if self.dialect.ALIAS_POST_TABLESAMPLE:
3664            this.set("sample", self._parse_table_sample())
3665
3666        alias = self._parse_table_alias(alias_tokens=alias_tokens or self.TABLE_ALIAS_TOKENS)
3667        if alias:
3668            this.set("alias", alias)
3669
3670        if isinstance(this, exp.Table) and self._match_text_seq("AT"):
3671            return self.expression(
3672                exp.AtIndex, this=this.to_column(copy=False), expression=self._parse_id_var()
3673            )
3674
3675        this.set("hints", self._parse_table_hints())
3676
3677        if not this.args.get("pivots"):
3678            this.set("pivots", self._parse_pivots())
3679
3680        if not self.dialect.ALIAS_POST_TABLESAMPLE:
3681            this.set("sample", self._parse_table_sample())
3682
3683        if joins:
3684            for join in self._parse_joins():
3685                this.append("joins", join)
3686
3687        if self._match_pair(TokenType.WITH, TokenType.ORDINALITY):
3688            this.set("ordinality", True)
3689            this.set("alias", self._parse_table_alias())
3690
3691        return this
3692
3693    def _parse_version(self) -> t.Optional[exp.Version]:
3694        if self._match(TokenType.TIMESTAMP_SNAPSHOT):
3695            this = "TIMESTAMP"
3696        elif self._match(TokenType.VERSION_SNAPSHOT):
3697            this = "VERSION"
3698        else:
3699            return None
3700
3701        if self._match_set((TokenType.FROM, TokenType.BETWEEN)):
3702            kind = self._prev.text.upper()
3703            start = self._parse_bitwise()
3704            self._match_texts(("TO", "AND"))
3705            end = self._parse_bitwise()
3706            expression: t.Optional[exp.Expression] = self.expression(
3707                exp.Tuple, expressions=[start, end]
3708            )
3709        elif self._match_text_seq("CONTAINED", "IN"):
3710            kind = "CONTAINED IN"
3711            expression = self.expression(
3712                exp.Tuple, expressions=self._parse_wrapped_csv(self._parse_bitwise)
3713            )
3714        elif self._match(TokenType.ALL):
3715            kind = "ALL"
3716            expression = None
3717        else:
3718            self._match_text_seq("AS", "OF")
3719            kind = "AS OF"
3720            expression = self._parse_type()
3721
3722        return self.expression(exp.Version, this=this, expression=expression, kind=kind)
3723
3724    def _parse_historical_data(self) -> t.Optional[exp.HistoricalData]:
3725        # https://docs.snowflake.com/en/sql-reference/constructs/at-before
3726        index = self._index
3727        historical_data = None
3728        if self._match_texts(self.HISTORICAL_DATA_PREFIX):
3729            this = self._prev.text.upper()
3730            kind = (
3731                self._match(TokenType.L_PAREN)
3732                and self._match_texts(self.HISTORICAL_DATA_KIND)
3733                and self._prev.text.upper()
3734            )
3735            expression = self._match(TokenType.FARROW) and self._parse_bitwise()
3736
3737            if expression:
3738                self._match_r_paren()
3739                historical_data = self.expression(
3740                    exp.HistoricalData, this=this, kind=kind, expression=expression
3741                )
3742            else:
3743                self._retreat(index)
3744
3745        return historical_data
3746
3747    def _parse_changes(self) -> t.Optional[exp.Changes]:
3748        if not self._match_text_seq("CHANGES", "(", "INFORMATION", "=>"):
3749            return None
3750
3751        information = self._parse_var(any_token=True)
3752        self._match_r_paren()
3753
3754        return self.expression(
3755            exp.Changes,
3756            information=information,
3757            at_before=self._parse_historical_data(),
3758            end=self._parse_historical_data(),
3759        )
3760
3761    def _parse_unnest(self, with_alias: bool = True) -> t.Optional[exp.Unnest]:
3762        if not self._match(TokenType.UNNEST):
3763            return None
3764
3765        expressions = self._parse_wrapped_csv(self._parse_equality)
3766        offset = self._match_pair(TokenType.WITH, TokenType.ORDINALITY)
3767
3768        alias = self._parse_table_alias() if with_alias else None
3769
3770        if alias:
3771            if self.dialect.UNNEST_COLUMN_ONLY:
3772                if alias.args.get("columns"):
3773                    self.raise_error("Unexpected extra column alias in unnest.")
3774
3775                alias.set("columns", [alias.this])
3776                alias.set("this", None)
3777
3778            columns = alias.args.get("columns") or []
3779            if offset and len(expressions) < len(columns):
3780                offset = columns.pop()
3781
3782        if not offset and self._match_pair(TokenType.WITH, TokenType.OFFSET):
3783            self._match(TokenType.ALIAS)
3784            offset = self._parse_id_var(
3785                any_token=False, tokens=self.UNNEST_OFFSET_ALIAS_TOKENS
3786            ) or exp.to_identifier("offset")
3787
3788        return self.expression(exp.Unnest, expressions=expressions, alias=alias, offset=offset)
3789
3790    def _parse_derived_table_values(self) -> t.Optional[exp.Values]:
3791        is_derived = self._match_pair(TokenType.L_PAREN, TokenType.VALUES)
3792        if not is_derived and not (
3793            # ClickHouse's `FORMAT Values` is equivalent to `VALUES`
3794            self._match_text_seq("VALUES") or self._match_text_seq("FORMAT", "VALUES")
3795        ):
3796            return None
3797
3798        expressions = self._parse_csv(self._parse_value)
3799        alias = self._parse_table_alias()
3800
3801        if is_derived:
3802            self._match_r_paren()
3803
3804        return self.expression(
3805            exp.Values, expressions=expressions, alias=alias or self._parse_table_alias()
3806        )
3807
3808    def _parse_table_sample(self, as_modifier: bool = False) -> t.Optional[exp.TableSample]:
3809        if not self._match(TokenType.TABLE_SAMPLE) and not (
3810            as_modifier and self._match_text_seq("USING", "SAMPLE")
3811        ):
3812            return None
3813
3814        bucket_numerator = None
3815        bucket_denominator = None
3816        bucket_field = None
3817        percent = None
3818        size = None
3819        seed = None
3820
3821        method = self._parse_var(tokens=(TokenType.ROW,), upper=True)
3822        matched_l_paren = self._match(TokenType.L_PAREN)
3823
3824        if self.TABLESAMPLE_CSV:
3825            num = None
3826            expressions = self._parse_csv(self._parse_primary)
3827        else:
3828            expressions = None
3829            num = (
3830                self._parse_factor()
3831                if self._match(TokenType.NUMBER, advance=False)
3832                else self._parse_primary() or self._parse_placeholder()
3833            )
3834
3835        if self._match_text_seq("BUCKET"):
3836            bucket_numerator = self._parse_number()
3837            self._match_text_seq("OUT", "OF")
3838            bucket_denominator = bucket_denominator = self._parse_number()
3839            self._match(TokenType.ON)
3840            bucket_field = self._parse_field()
3841        elif self._match_set((TokenType.PERCENT, TokenType.MOD)):
3842            percent = num
3843        elif self._match(TokenType.ROWS) or not self.dialect.TABLESAMPLE_SIZE_IS_PERCENT:
3844            size = num
3845        else:
3846            percent = num
3847
3848        if matched_l_paren:
3849            self._match_r_paren()
3850
3851        if self._match(TokenType.L_PAREN):
3852            method = self._parse_var(upper=True)
3853            seed = self._match(TokenType.COMMA) and self._parse_number()
3854            self._match_r_paren()
3855        elif self._match_texts(("SEED", "REPEATABLE")):
3856            seed = self._parse_wrapped(self._parse_number)
3857
3858        if not method and self.DEFAULT_SAMPLING_METHOD:
3859            method = exp.var(self.DEFAULT_SAMPLING_METHOD)
3860
3861        return self.expression(
3862            exp.TableSample,
3863            expressions=expressions,
3864            method=method,
3865            bucket_numerator=bucket_numerator,
3866            bucket_denominator=bucket_denominator,
3867            bucket_field=bucket_field,
3868            percent=percent,
3869            size=size,
3870            seed=seed,
3871        )
3872
3873    def _parse_pivots(self) -> t.Optional[t.List[exp.Pivot]]:
3874        return list(iter(self._parse_pivot, None)) or None
3875
3876    def _parse_joins(self) -> t.Iterator[exp.Join]:
3877        return iter(self._parse_join, None)
3878
3879    # https://duckdb.org/docs/sql/statements/pivot
3880    def _parse_simplified_pivot(self) -> exp.Pivot:
3881        def _parse_on() -> t.Optional[exp.Expression]:
3882            this = self._parse_bitwise()
3883            return self._parse_in(this) if self._match(TokenType.IN) else this
3884
3885        this = self._parse_table()
3886        expressions = self._match(TokenType.ON) and self._parse_csv(_parse_on)
3887        using = self._match(TokenType.USING) and self._parse_csv(
3888            lambda: self._parse_alias(self._parse_function())
3889        )
3890        group = self._parse_group()
3891        return self.expression(
3892            exp.Pivot, this=this, expressions=expressions, using=using, group=group
3893        )
3894
3895    def _parse_pivot_in(self) -> exp.In | exp.PivotAny:
3896        def _parse_aliased_expression() -> t.Optional[exp.Expression]:
3897            this = self._parse_select_or_expression()
3898
3899            self._match(TokenType.ALIAS)
3900            alias = self._parse_bitwise()
3901            if alias:
3902                if isinstance(alias, exp.Column) and not alias.db:
3903                    alias = alias.this
3904                return self.expression(exp.PivotAlias, this=this, alias=alias)
3905
3906            return this
3907
3908        value = self._parse_column()
3909
3910        if not self._match_pair(TokenType.IN, TokenType.L_PAREN):
3911            self.raise_error("Expecting IN (")
3912
3913        if self._match(TokenType.ANY):
3914            expr: exp.PivotAny | exp.In = self.expression(exp.PivotAny, this=self._parse_order())
3915        else:
3916            aliased_expressions = self._parse_csv(_parse_aliased_expression)
3917            expr = self.expression(exp.In, this=value, expressions=aliased_expressions)
3918
3919        self._match_r_paren()
3920        return expr
3921
3922    def _parse_pivot(self) -> t.Optional[exp.Pivot]:
3923        index = self._index
3924        include_nulls = None
3925
3926        if self._match(TokenType.PIVOT):
3927            unpivot = False
3928        elif self._match(TokenType.UNPIVOT):
3929            unpivot = True
3930
3931            # https://docs.databricks.com/en/sql/language-manual/sql-ref-syntax-qry-select-unpivot.html#syntax
3932            if self._match_text_seq("INCLUDE", "NULLS"):
3933                include_nulls = True
3934            elif self._match_text_seq("EXCLUDE", "NULLS"):
3935                include_nulls = False
3936        else:
3937            return None
3938
3939        expressions = []
3940
3941        if not self._match(TokenType.L_PAREN):
3942            self._retreat(index)
3943            return None
3944
3945        if unpivot:
3946            expressions = self._parse_csv(self._parse_column)
3947        else:
3948            expressions = self._parse_csv(lambda: self._parse_alias(self._parse_function()))
3949
3950        if not expressions:
3951            self.raise_error("Failed to parse PIVOT's aggregation list")
3952
3953        if not self._match(TokenType.FOR):
3954            self.raise_error("Expecting FOR")
3955
3956        field = self._parse_pivot_in()
3957        default_on_null = self._match_text_seq("DEFAULT", "ON", "NULL") and self._parse_wrapped(
3958            self._parse_bitwise
3959        )
3960
3961        self._match_r_paren()
3962
3963        pivot = self.expression(
3964            exp.Pivot,
3965            expressions=expressions,
3966            field=field,
3967            unpivot=unpivot,
3968            include_nulls=include_nulls,
3969            default_on_null=default_on_null,
3970        )
3971
3972        if not self._match_set((TokenType.PIVOT, TokenType.UNPIVOT), advance=False):
3973            pivot.set("alias", self._parse_table_alias())
3974
3975        if not unpivot:
3976            names = self._pivot_column_names(t.cast(t.List[exp.Expression], expressions))
3977
3978            columns: t.List[exp.Expression] = []
3979            for fld in pivot.args["field"].expressions:
3980                field_name = fld.sql() if self.IDENTIFY_PIVOT_STRINGS else fld.alias_or_name
3981                for name in names:
3982                    if self.PREFIXED_PIVOT_COLUMNS:
3983                        name = f"{name}_{field_name}" if name else field_name
3984                    else:
3985                        name = f"{field_name}_{name}" if name else field_name
3986
3987                    columns.append(exp.to_identifier(name))
3988
3989            pivot.set("columns", columns)
3990
3991        return pivot
3992
3993    def _pivot_column_names(self, aggregations: t.List[exp.Expression]) -> t.List[str]:
3994        return [agg.alias for agg in aggregations]
3995
3996    def _parse_prewhere(self, skip_where_token: bool = False) -> t.Optional[exp.PreWhere]:
3997        if not skip_where_token and not self._match(TokenType.PREWHERE):
3998            return None
3999
4000        return self.expression(
4001            exp.PreWhere, comments=self._prev_comments, this=self._parse_assignment()
4002        )
4003
4004    def _parse_where(self, skip_where_token: bool = False) -> t.Optional[exp.Where]:
4005        if not skip_where_token and not self._match(TokenType.WHERE):
4006            return None
4007
4008        return self.expression(
4009            exp.Where, comments=self._prev_comments, this=self._parse_assignment()
4010        )
4011
4012    def _parse_group(self, skip_group_by_token: bool = False) -> t.Optional[exp.Group]:
4013        if not skip_group_by_token and not self._match(TokenType.GROUP_BY):
4014            return None
4015
4016        elements: t.Dict[str, t.Any] = defaultdict(list)
4017
4018        if self._match(TokenType.ALL):
4019            elements["all"] = True
4020        elif self._match(TokenType.DISTINCT):
4021            elements["all"] = False
4022
4023        while True:
4024            index = self._index
4025
4026            elements["expressions"].extend(
4027                self._parse_csv(
4028                    lambda: None
4029                    if self._match_set((TokenType.CUBE, TokenType.ROLLUP), advance=False)
4030                    else self._parse_assignment()
4031                )
4032            )
4033
4034            before_with_index = self._index
4035            with_prefix = self._match(TokenType.WITH)
4036
4037            if self._match(TokenType.ROLLUP):
4038                elements["rollup"].append(
4039                    self._parse_cube_or_rollup(exp.Rollup, with_prefix=with_prefix)
4040                )
4041            elif self._match(TokenType.CUBE):
4042                elements["cube"].append(
4043                    self._parse_cube_or_rollup(exp.Cube, with_prefix=with_prefix)
4044                )
4045            elif self._match(TokenType.GROUPING_SETS):
4046                elements["grouping_sets"].append(
4047                    self.expression(
4048                        exp.GroupingSets,
4049                        expressions=self._parse_wrapped_csv(self._parse_grouping_set),
4050                    )
4051                )
4052            elif self._match_text_seq("TOTALS"):
4053                elements["totals"] = True  # type: ignore
4054
4055            if before_with_index <= self._index <= before_with_index + 1:
4056                self._retreat(before_with_index)
4057                break
4058
4059            if index == self._index:
4060                break
4061
4062        return self.expression(exp.Group, **elements)  # type: ignore
4063
4064    def _parse_cube_or_rollup(self, kind: t.Type[E], with_prefix: bool = False) -> E:
4065        return self.expression(
4066            kind, expressions=[] if with_prefix else self._parse_wrapped_csv(self._parse_column)
4067        )
4068
4069    def _parse_grouping_set(self) -> t.Optional[exp.Expression]:
4070        if self._match(TokenType.L_PAREN):
4071            grouping_set = self._parse_csv(self._parse_column)
4072            self._match_r_paren()
4073            return self.expression(exp.Tuple, expressions=grouping_set)
4074
4075        return self._parse_column()
4076
4077    def _parse_having(self, skip_having_token: bool = False) -> t.Optional[exp.Having]:
4078        if not skip_having_token and not self._match(TokenType.HAVING):
4079            return None
4080        return self.expression(exp.Having, this=self._parse_assignment())
4081
4082    def _parse_qualify(self) -> t.Optional[exp.Qualify]:
4083        if not self._match(TokenType.QUALIFY):
4084            return None
4085        return self.expression(exp.Qualify, this=self._parse_assignment())
4086
4087    def _parse_connect(self, skip_start_token: bool = False) -> t.Optional[exp.Connect]:
4088        if skip_start_token:
4089            start = None
4090        elif self._match(TokenType.START_WITH):
4091            start = self._parse_assignment()
4092        else:
4093            return None
4094
4095        self._match(TokenType.CONNECT_BY)
4096        nocycle = self._match_text_seq("NOCYCLE")
4097        self.NO_PAREN_FUNCTION_PARSERS["PRIOR"] = lambda self: self.expression(
4098            exp.Prior, this=self._parse_bitwise()
4099        )
4100        connect = self._parse_assignment()
4101        self.NO_PAREN_FUNCTION_PARSERS.pop("PRIOR")
4102
4103        if not start and self._match(TokenType.START_WITH):
4104            start = self._parse_assignment()
4105
4106        return self.expression(exp.Connect, start=start, connect=connect, nocycle=nocycle)
4107
4108    def _parse_name_as_expression(self) -> exp.Alias:
4109        return self.expression(
4110            exp.Alias,
4111            alias=self._parse_id_var(any_token=True),
4112            this=self._match(TokenType.ALIAS) and self._parse_assignment(),
4113        )
4114
4115    def _parse_interpolate(self) -> t.Optional[t.List[exp.Expression]]:
4116        if self._match_text_seq("INTERPOLATE"):
4117            return self._parse_wrapped_csv(self._parse_name_as_expression)
4118        return None
4119
4120    def _parse_order(
4121        self, this: t.Optional[exp.Expression] = None, skip_order_token: bool = False
4122    ) -> t.Optional[exp.Expression]:
4123        siblings = None
4124        if not skip_order_token and not self._match(TokenType.ORDER_BY):
4125            if not self._match(TokenType.ORDER_SIBLINGS_BY):
4126                return this
4127
4128            siblings = True
4129
4130        return self.expression(
4131            exp.Order,
4132            this=this,
4133            expressions=self._parse_csv(self._parse_ordered),
4134            siblings=siblings,
4135        )
4136
4137    def _parse_sort(self, exp_class: t.Type[E], token: TokenType) -> t.Optional[E]:
4138        if not self._match(token):
4139            return None
4140        return self.expression(exp_class, expressions=self._parse_csv(self._parse_ordered))
4141
4142    def _parse_ordered(
4143        self, parse_method: t.Optional[t.Callable] = None
4144    ) -> t.Optional[exp.Ordered]:
4145        this = parse_method() if parse_method else self._parse_assignment()
4146        if not this:
4147            return None
4148
4149        if this.name.upper() == "ALL" and self.dialect.SUPPORTS_ORDER_BY_ALL:
4150            this = exp.var("ALL")
4151
4152        asc = self._match(TokenType.ASC)
4153        desc = self._match(TokenType.DESC) or (asc and False)
4154
4155        is_nulls_first = self._match_text_seq("NULLS", "FIRST")
4156        is_nulls_last = self._match_text_seq("NULLS", "LAST")
4157
4158        nulls_first = is_nulls_first or False
4159        explicitly_null_ordered = is_nulls_first or is_nulls_last
4160
4161        if (
4162            not explicitly_null_ordered
4163            and (
4164                (not desc and self.dialect.NULL_ORDERING == "nulls_are_small")
4165                or (desc and self.dialect.NULL_ORDERING != "nulls_are_small")
4166            )
4167            and self.dialect.NULL_ORDERING != "nulls_are_last"
4168        ):
4169            nulls_first = True
4170
4171        if self._match_text_seq("WITH", "FILL"):
4172            with_fill = self.expression(
4173                exp.WithFill,
4174                **{  # type: ignore
4175                    "from": self._match(TokenType.FROM) and self._parse_bitwise(),
4176                    "to": self._match_text_seq("TO") and self._parse_bitwise(),
4177                    "step": self._match_text_seq("STEP") and self._parse_bitwise(),
4178                    "interpolate": self._parse_interpolate(),
4179                },
4180            )
4181        else:
4182            with_fill = None
4183
4184        return self.expression(
4185            exp.Ordered, this=this, desc=desc, nulls_first=nulls_first, with_fill=with_fill
4186        )
4187
4188    def _parse_limit(
4189        self,
4190        this: t.Optional[exp.Expression] = None,
4191        top: bool = False,
4192        skip_limit_token: bool = False,
4193    ) -> t.Optional[exp.Expression]:
4194        if skip_limit_token or self._match(TokenType.TOP if top else TokenType.LIMIT):
4195            comments = self._prev_comments
4196            if top:
4197                limit_paren = self._match(TokenType.L_PAREN)
4198                expression = self._parse_term() if limit_paren else self._parse_number()
4199
4200                if limit_paren:
4201                    self._match_r_paren()
4202            else:
4203                expression = self._parse_term()
4204
4205            if self._match(TokenType.COMMA):
4206                offset = expression
4207                expression = self._parse_term()
4208            else:
4209                offset = None
4210
4211            limit_exp = self.expression(
4212                exp.Limit,
4213                this=this,
4214                expression=expression,
4215                offset=offset,
4216                comments=comments,
4217                expressions=self._parse_limit_by(),
4218            )
4219
4220            return limit_exp
4221
4222        if self._match(TokenType.FETCH):
4223            direction = self._match_set((TokenType.FIRST, TokenType.NEXT))
4224            direction = self._prev.text.upper() if direction else "FIRST"
4225
4226            count = self._parse_field(tokens=self.FETCH_TOKENS)
4227            percent = self._match(TokenType.PERCENT)
4228
4229            self._match_set((TokenType.ROW, TokenType.ROWS))
4230
4231            only = self._match_text_seq("ONLY")
4232            with_ties = self._match_text_seq("WITH", "TIES")
4233
4234            if only and with_ties:
4235                self.raise_error("Cannot specify both ONLY and WITH TIES in FETCH clause")
4236
4237            return self.expression(
4238                exp.Fetch,
4239                direction=direction,
4240                count=count,
4241                percent=percent,
4242                with_ties=with_ties,
4243            )
4244
4245        return this
4246
4247    def _parse_offset(self, this: t.Optional[exp.Expression] = None) -> t.Optional[exp.Expression]:
4248        if not self._match(TokenType.OFFSET):
4249            return this
4250
4251        count = self._parse_term()
4252        self._match_set((TokenType.ROW, TokenType.ROWS))
4253
4254        return self.expression(
4255            exp.Offset, this=this, expression=count, expressions=self._parse_limit_by()
4256        )
4257
4258    def _parse_limit_by(self) -> t.Optional[t.List[exp.Expression]]:
4259        return self._match_text_seq("BY") and self._parse_csv(self._parse_bitwise)
4260
4261    def _parse_locks(self) -> t.List[exp.Lock]:
4262        locks = []
4263        while True:
4264            if self._match_text_seq("FOR", "UPDATE"):
4265                update = True
4266            elif self._match_text_seq("FOR", "SHARE") or self._match_text_seq(
4267                "LOCK", "IN", "SHARE", "MODE"
4268            ):
4269                update = False
4270            else:
4271                break
4272
4273            expressions = None
4274            if self._match_text_seq("OF"):
4275                expressions = self._parse_csv(lambda: self._parse_table(schema=True))
4276
4277            wait: t.Optional[bool | exp.Expression] = None
4278            if self._match_text_seq("NOWAIT"):
4279                wait = True
4280            elif self._match_text_seq("WAIT"):
4281                wait = self._parse_primary()
4282            elif self._match_text_seq("SKIP", "LOCKED"):
4283                wait = False
4284
4285            locks.append(
4286                self.expression(exp.Lock, update=update, expressions=expressions, wait=wait)
4287            )
4288
4289        return locks
4290
4291    def _parse_set_operations(self, this: t.Optional[exp.Expression]) -> t.Optional[exp.Expression]:
4292        while this and self._match_set(self.SET_OPERATIONS):
4293            token_type = self._prev.token_type
4294
4295            if token_type == TokenType.UNION:
4296                operation: t.Type[exp.SetOperation] = exp.Union
4297            elif token_type == TokenType.EXCEPT:
4298                operation = exp.Except
4299            else:
4300                operation = exp.Intersect
4301
4302            comments = self._prev.comments
4303
4304            if self._match(TokenType.DISTINCT):
4305                distinct: t.Optional[bool] = True
4306            elif self._match(TokenType.ALL):
4307                distinct = False
4308            else:
4309                distinct = self.dialect.SET_OP_DISTINCT_BY_DEFAULT[operation]
4310                if distinct is None:
4311                    self.raise_error(f"Expected DISTINCT or ALL for {operation.__name__}")
4312
4313            by_name = self._match_text_seq("BY", "NAME")
4314            expression = self._parse_select(nested=True, parse_set_operation=False)
4315
4316            this = self.expression(
4317                operation,
4318                comments=comments,
4319                this=this,
4320                distinct=distinct,
4321                by_name=by_name,
4322                expression=expression,
4323            )
4324
4325        if isinstance(this, exp.SetOperation) and self.MODIFIERS_ATTACHED_TO_SET_OP:
4326            expression = this.expression
4327
4328            if expression:
4329                for arg in self.SET_OP_MODIFIERS:
4330                    expr = expression.args.get(arg)
4331                    if expr:
4332                        this.set(arg, expr.pop())
4333
4334        return this
4335
4336    def _parse_expression(self) -> t.Optional[exp.Expression]:
4337        return self._parse_alias(self._parse_assignment())
4338
4339    def _parse_assignment(self) -> t.Optional[exp.Expression]:
4340        this = self._parse_disjunction()
4341        if not this and self._next and self._next.token_type in self.ASSIGNMENT:
4342            # This allows us to parse <non-identifier token> := <expr>
4343            this = exp.column(
4344                t.cast(str, self._advance_any(ignore_reserved=True) and self._prev.text)
4345            )
4346
4347        while self._match_set(self.ASSIGNMENT):
4348            this = self.expression(
4349                self.ASSIGNMENT[self._prev.token_type],
4350                this=this,
4351                comments=self._prev_comments,
4352                expression=self._parse_assignment(),
4353            )
4354
4355        return this
4356
4357    def _parse_disjunction(self) -> t.Optional[exp.Expression]:
4358        return self._parse_tokens(self._parse_conjunction, self.DISJUNCTION)
4359
4360    def _parse_conjunction(self) -> t.Optional[exp.Expression]:
4361        return self._parse_tokens(self._parse_equality, self.CONJUNCTION)
4362
4363    def _parse_equality(self) -> t.Optional[exp.Expression]:
4364        return self._parse_tokens(self._parse_comparison, self.EQUALITY)
4365
4366    def _parse_comparison(self) -> t.Optional[exp.Expression]:
4367        return self._parse_tokens(self._parse_range, self.COMPARISON)
4368
4369    def _parse_range(self, this: t.Optional[exp.Expression] = None) -> t.Optional[exp.Expression]:
4370        this = this or self._parse_bitwise()
4371        negate = self._match(TokenType.NOT)
4372
4373        if self._match_set(self.RANGE_PARSERS):
4374            expression = self.RANGE_PARSERS[self._prev.token_type](self, this)
4375            if not expression:
4376                return this
4377
4378            this = expression
4379        elif self._match(TokenType.ISNULL):
4380            this = self.expression(exp.Is, this=this, expression=exp.Null())
4381
4382        # Postgres supports ISNULL and NOTNULL for conditions.
4383        # https://blog.andreiavram.ro/postgresql-null-composite-type/
4384        if self._match(TokenType.NOTNULL):
4385            this = self.expression(exp.Is, this=this, expression=exp.Null())
4386            this = self.expression(exp.Not, this=this)
4387
4388        if negate:
4389            this = self._negate_range(this)
4390
4391        if self._match(TokenType.IS):
4392            this = self._parse_is(this)
4393
4394        return this
4395
4396    def _negate_range(self, this: t.Optional[exp.Expression] = None) -> t.Optional[exp.Expression]:
4397        if not this:
4398            return this
4399
4400        return self.expression(exp.Not, this=this)
4401
4402    def _parse_is(self, this: t.Optional[exp.Expression]) -> t.Optional[exp.Expression]:
4403        index = self._index - 1
4404        negate = self._match(TokenType.NOT)
4405
4406        if self._match_text_seq("DISTINCT", "FROM"):
4407            klass = exp.NullSafeEQ if negate else exp.NullSafeNEQ
4408            return self.expression(klass, this=this, expression=self._parse_bitwise())
4409
4410        if self._match(TokenType.JSON):
4411            kind = self._match_texts(self.IS_JSON_PREDICATE_KIND) and self._prev.text.upper()
4412
4413            if self._match_text_seq("WITH"):
4414                _with = True
4415            elif self._match_text_seq("WITHOUT"):
4416                _with = False
4417            else:
4418                _with = None
4419
4420            unique = self._match(TokenType.UNIQUE)
4421            self._match_text_seq("KEYS")
4422            expression: t.Optional[exp.Expression] = self.expression(
4423                exp.JSON, **{"this": kind, "with": _with, "unique": unique}
4424            )
4425        else:
4426            expression = self._parse_primary() or self._parse_null()
4427            if not expression:
4428                self._retreat(index)
4429                return None
4430
4431        this = self.expression(exp.Is, this=this, expression=expression)
4432        return self.expression(exp.Not, this=this) if negate else this
4433
4434    def _parse_in(self, this: t.Optional[exp.Expression], alias: bool = False) -> exp.In:
4435        unnest = self._parse_unnest(with_alias=False)
4436        if unnest:
4437            this = self.expression(exp.In, this=this, unnest=unnest)
4438        elif self._match_set((TokenType.L_PAREN, TokenType.L_BRACKET)):
4439            matched_l_paren = self._prev.token_type == TokenType.L_PAREN
4440            expressions = self._parse_csv(lambda: self._parse_select_or_expression(alias=alias))
4441
4442            if len(expressions) == 1 and isinstance(expressions[0], exp.Query):
4443                this = self.expression(exp.In, this=this, query=expressions[0].subquery(copy=False))
4444            else:
4445                this = self.expression(exp.In, this=this, expressions=expressions)
4446
4447            if matched_l_paren:
4448                self._match_r_paren(this)
4449            elif not self._match(TokenType.R_BRACKET, expression=this):
4450                self.raise_error("Expecting ]")
4451        else:
4452            this = self.expression(exp.In, this=this, field=self._parse_field())
4453
4454        return this
4455
4456    def _parse_between(self, this: t.Optional[exp.Expression]) -> exp.Between:
4457        low = self._parse_bitwise()
4458        self._match(TokenType.AND)
4459        high = self._parse_bitwise()
4460        return self.expression(exp.Between, this=this, low=low, high=high)
4461
4462    def _parse_escape(self, this: t.Optional[exp.Expression]) -> t.Optional[exp.Expression]:
4463        if not self._match(TokenType.ESCAPE):
4464            return this
4465        return self.expression(exp.Escape, this=this, expression=self._parse_string())
4466
4467    def _parse_interval(self, match_interval: bool = True) -> t.Optional[exp.Add | exp.Interval]:
4468        index = self._index
4469
4470        if not self._match(TokenType.INTERVAL) and match_interval:
4471            return None
4472
4473        if self._match(TokenType.STRING, advance=False):
4474            this = self._parse_primary()
4475        else:
4476            this = self._parse_term()
4477
4478        if not this or (
4479            isinstance(this, exp.Column)
4480            and not this.table
4481            and not this.this.quoted
4482            and this.name.upper() == "IS"
4483        ):
4484            self._retreat(index)
4485            return None
4486
4487        unit = self._parse_function() or (
4488            not self._match(TokenType.ALIAS, advance=False)
4489            and self._parse_var(any_token=True, upper=True)
4490        )
4491
4492        # Most dialects support, e.g., the form INTERVAL '5' day, thus we try to parse
4493        # each INTERVAL expression into this canonical form so it's easy to transpile
4494        if this and this.is_number:
4495            this = exp.Literal.string(this.to_py())
4496        elif this and this.is_string:
4497            parts = exp.INTERVAL_STRING_RE.findall(this.name)
4498            if len(parts) == 1:
4499                if unit:
4500                    # Unconsume the eagerly-parsed unit, since the real unit was part of the string
4501                    self._retreat(self._index - 1)
4502
4503                this = exp.Literal.string(parts[0][0])
4504                unit = self.expression(exp.Var, this=parts[0][1].upper())
4505
4506        if self.INTERVAL_SPANS and self._match_text_seq("TO"):
4507            unit = self.expression(
4508                exp.IntervalSpan, this=unit, expression=self._parse_var(any_token=True, upper=True)
4509            )
4510
4511        interval = self.expression(exp.Interval, this=this, unit=unit)
4512
4513        index = self._index
4514        self._match(TokenType.PLUS)
4515
4516        # Convert INTERVAL 'val_1' unit_1 [+] ... [+] 'val_n' unit_n into a sum of intervals
4517        if self._match_set((TokenType.STRING, TokenType.NUMBER), advance=False):
4518            return self.expression(
4519                exp.Add, this=interval, expression=self._parse_interval(match_interval=False)
4520            )
4521
4522        self._retreat(index)
4523        return interval
4524
4525    def _parse_bitwise(self) -> t.Optional[exp.Expression]:
4526        this = self._parse_term()
4527
4528        while True:
4529            if self._match_set(self.BITWISE):
4530                this = self.expression(
4531                    self.BITWISE[self._prev.token_type],
4532                    this=this,
4533                    expression=self._parse_term(),
4534                )
4535            elif self.dialect.DPIPE_IS_STRING_CONCAT and self._match(TokenType.DPIPE):
4536                this = self.expression(
4537                    exp.DPipe,
4538                    this=this,
4539                    expression=self._parse_term(),
4540                    safe=not self.dialect.STRICT_STRING_CONCAT,
4541                )
4542            elif self._match(TokenType.DQMARK):
4543                this = self.expression(
4544                    exp.Coalesce, this=this, expressions=ensure_list(self._parse_term())
4545                )
4546            elif self._match_pair(TokenType.LT, TokenType.LT):
4547                this = self.expression(
4548                    exp.BitwiseLeftShift, this=this, expression=self._parse_term()
4549                )
4550            elif self._match_pair(TokenType.GT, TokenType.GT):
4551                this = self.expression(
4552                    exp.BitwiseRightShift, this=this, expression=self._parse_term()
4553                )
4554            else:
4555                break
4556
4557        return this
4558
4559    def _parse_term(self) -> t.Optional[exp.Expression]:
4560        this = self._parse_factor()
4561
4562        while self._match_set(self.TERM):
4563            klass = self.TERM[self._prev.token_type]
4564            comments = self._prev_comments
4565            expression = self._parse_factor()
4566
4567            this = self.expression(klass, this=this, comments=comments, expression=expression)
4568
4569            if isinstance(this, exp.Collate):
4570                expr = this.expression
4571
4572                # Preserve collations such as pg_catalog."default" (Postgres) as columns, otherwise
4573                # fallback to Identifier / Var
4574                if isinstance(expr, exp.Column) and len(expr.parts) == 1:
4575                    ident = expr.this
4576                    if isinstance(ident, exp.Identifier):
4577                        this.set("expression", ident if ident.quoted else exp.var(ident.name))
4578
4579        return this
4580
4581    def _parse_factor(self) -> t.Optional[exp.Expression]:
4582        parse_method = self._parse_exponent if self.EXPONENT else self._parse_unary
4583        this = parse_method()
4584
4585        while self._match_set(self.FACTOR):
4586            klass = self.FACTOR[self._prev.token_type]
4587            comments = self._prev_comments
4588            expression = parse_method()
4589
4590            if not expression and klass is exp.IntDiv and self._prev.text.isalpha():
4591                self._retreat(self._index - 1)
4592                return this
4593
4594            this = self.expression(klass, this=this, comments=comments, expression=expression)
4595
4596            if isinstance(this, exp.Div):
4597                this.args["typed"] = self.dialect.TYPED_DIVISION
4598                this.args["safe"] = self.dialect.SAFE_DIVISION
4599
4600        return this
4601
4602    def _parse_exponent(self) -> t.Optional[exp.Expression]:
4603        return self._parse_tokens(self._parse_unary, self.EXPONENT)
4604
4605    def _parse_unary(self) -> t.Optional[exp.Expression]:
4606        if self._match_set(self.UNARY_PARSERS):
4607            return self.UNARY_PARSERS[self._prev.token_type](self)
4608        return self._parse_at_time_zone(self._parse_type())
4609
4610    def _parse_type(
4611        self, parse_interval: bool = True, fallback_to_identifier: bool = False
4612    ) -> t.Optional[exp.Expression]:
4613        interval = parse_interval and self._parse_interval()
4614        if interval:
4615            return interval
4616
4617        index = self._index
4618        data_type = self._parse_types(check_func=True, allow_identifiers=False)
4619
4620        # parse_types() returns a Cast if we parsed BQ's inline constructor <type>(<values>) e.g.
4621        # STRUCT<a INT, b STRING>(1, 'foo'), which is canonicalized to CAST(<values> AS <type>)
4622        if isinstance(data_type, exp.Cast):
4623            # This constructor can contain ops directly after it, for instance struct unnesting:
4624            # STRUCT<a INT, b STRING>(1, 'foo').* --> CAST(STRUCT(1, 'foo') AS STRUCT<a iNT, b STRING).*
4625            return self._parse_column_ops(data_type)
4626
4627        if data_type:
4628            index2 = self._index
4629            this = self._parse_primary()
4630
4631            if isinstance(this, exp.Literal):
4632                parser = self.TYPE_LITERAL_PARSERS.get(data_type.this)
4633                if parser:
4634                    return parser(self, this, data_type)
4635
4636                return self.expression(exp.Cast, this=this, to=data_type)
4637
4638            # The expressions arg gets set by the parser when we have something like DECIMAL(38, 0)
4639            # in the input SQL. In that case, we'll produce these tokens: DECIMAL ( 38 , 0 )
4640            #
4641            # If the index difference here is greater than 1, that means the parser itself must have
4642            # consumed additional tokens such as the DECIMAL scale and precision in the above example.
4643            #
4644            # If it's not greater than 1, then it must be 1, because we've consumed at least the type
4645            # keyword, meaning that the expressions arg of the DataType must have gotten set by a
4646            # callable in the TYPE_CONVERTERS mapping. For example, Snowflake converts DECIMAL to
4647            # DECIMAL(38, 0)) in order to facilitate the data type's transpilation.
4648            #
4649            # In these cases, we don't really want to return the converted type, but instead retreat
4650            # and try to parse a Column or Identifier in the section below.
4651            if data_type.expressions and index2 - index > 1:
4652                self._retreat(index2)
4653                return self._parse_column_ops(data_type)
4654
4655            self._retreat(index)
4656
4657        if fallback_to_identifier:
4658            return self._parse_id_var()
4659
4660        this = self._parse_column()
4661        return this and self._parse_column_ops(this)
4662
4663    def _parse_type_size(self) -> t.Optional[exp.DataTypeParam]:
4664        this = self._parse_type()
4665        if not this:
4666            return None
4667
4668        if isinstance(this, exp.Column) and not this.table:
4669            this = exp.var(this.name.upper())
4670
4671        return self.expression(
4672            exp.DataTypeParam, this=this, expression=self._parse_var(any_token=True)
4673        )
4674
4675    def _parse_types(
4676        self, check_func: bool = False, schema: bool = False, allow_identifiers: bool = True
4677    ) -> t.Optional[exp.Expression]:
4678        index = self._index
4679
4680        this: t.Optional[exp.Expression] = None
4681        prefix = self._match_text_seq("SYSUDTLIB", ".")
4682
4683        if not self._match_set(self.TYPE_TOKENS):
4684            identifier = allow_identifiers and self._parse_id_var(
4685                any_token=False, tokens=(TokenType.VAR,)
4686            )
4687            if isinstance(identifier, exp.Identifier):
4688                tokens = self.dialect.tokenize(identifier.sql(dialect=self.dialect))
4689
4690                if len(tokens) != 1:
4691                    self.raise_error("Unexpected identifier", self._prev)
4692
4693                if tokens[0].token_type in self.TYPE_TOKENS:
4694                    self._prev = tokens[0]
4695                elif self.dialect.SUPPORTS_USER_DEFINED_TYPES:
4696                    type_name = identifier.name
4697
4698                    while self._match(TokenType.DOT):
4699                        type_name = f"{type_name}.{self._advance_any() and self._prev.text}"
4700
4701                    this = exp.DataType.build(type_name, udt=True)
4702                else:
4703                    self._retreat(self._index - 1)
4704                    return None
4705            else:
4706                return None
4707
4708        type_token = self._prev.token_type
4709
4710        if type_token == TokenType.PSEUDO_TYPE:
4711            return self.expression(exp.PseudoType, this=self._prev.text.upper())
4712
4713        if type_token == TokenType.OBJECT_IDENTIFIER:
4714            return self.expression(exp.ObjectIdentifier, this=self._prev.text.upper())
4715
4716        # https://materialize.com/docs/sql/types/map/
4717        if type_token == TokenType.MAP and self._match(TokenType.L_BRACKET):
4718            key_type = self._parse_types(
4719                check_func=check_func, schema=schema, allow_identifiers=allow_identifiers
4720            )
4721            if not self._match(TokenType.FARROW):
4722                self._retreat(index)
4723                return None
4724
4725            value_type = self._parse_types(
4726                check_func=check_func, schema=schema, allow_identifiers=allow_identifiers
4727            )
4728            if not self._match(TokenType.R_BRACKET):
4729                self._retreat(index)
4730                return None
4731
4732            return exp.DataType(
4733                this=exp.DataType.Type.MAP,
4734                expressions=[key_type, value_type],
4735                nested=True,
4736                prefix=prefix,
4737            )
4738
4739        nested = type_token in self.NESTED_TYPE_TOKENS
4740        is_struct = type_token in self.STRUCT_TYPE_TOKENS
4741        is_aggregate = type_token in self.AGGREGATE_TYPE_TOKENS
4742        expressions = None
4743        maybe_func = False
4744
4745        if self._match(TokenType.L_PAREN):
4746            if is_struct:
4747                expressions = self._parse_csv(lambda: self._parse_struct_types(type_required=True))
4748            elif nested:
4749                expressions = self._parse_csv(
4750                    lambda: self._parse_types(
4751                        check_func=check_func, schema=schema, allow_identifiers=allow_identifiers
4752                    )
4753                )
4754            elif type_token in self.ENUM_TYPE_TOKENS:
4755                expressions = self._parse_csv(self._parse_equality)
4756            elif is_aggregate:
4757                func_or_ident = self._parse_function(anonymous=True) or self._parse_id_var(
4758                    any_token=False, tokens=(TokenType.VAR,)
4759                )
4760                if not func_or_ident or not self._match(TokenType.COMMA):
4761                    return None
4762                expressions = self._parse_csv(
4763                    lambda: self._parse_types(
4764                        check_func=check_func, schema=schema, allow_identifiers=allow_identifiers
4765                    )
4766                )
4767                expressions.insert(0, func_or_ident)
4768            else:
4769                expressions = self._parse_csv(self._parse_type_size)
4770
4771                # https://docs.snowflake.com/en/sql-reference/data-types-vector
4772                if type_token == TokenType.VECTOR and len(expressions) == 2:
4773                    expressions[0] = exp.DataType.build(expressions[0].name, dialect=self.dialect)
4774
4775            if not expressions or not self._match(TokenType.R_PAREN):
4776                self._retreat(index)
4777                return None
4778
4779            maybe_func = True
4780
4781        values: t.Optional[t.List[exp.Expression]] = None
4782
4783        if nested and self._match(TokenType.LT):
4784            if is_struct:
4785                expressions = self._parse_csv(lambda: self._parse_struct_types(type_required=True))
4786            else:
4787                expressions = self._parse_csv(
4788                    lambda: self._parse_types(
4789                        check_func=check_func, schema=schema, allow_identifiers=allow_identifiers
4790                    )
4791                )
4792
4793            if not self._match(TokenType.GT):
4794                self.raise_error("Expecting >")
4795
4796            if self._match_set((TokenType.L_BRACKET, TokenType.L_PAREN)):
4797                values = self._parse_csv(self._parse_assignment)
4798                self._match_set((TokenType.R_BRACKET, TokenType.R_PAREN))
4799
4800        if type_token in self.TIMESTAMPS:
4801            if self._match_text_seq("WITH", "TIME", "ZONE"):
4802                maybe_func = False
4803                tz_type = (
4804                    exp.DataType.Type.TIMETZ
4805                    if type_token in self.TIMES
4806                    else exp.DataType.Type.TIMESTAMPTZ
4807                )
4808                this = exp.DataType(this=tz_type, expressions=expressions)
4809            elif self._match_text_seq("WITH", "LOCAL", "TIME", "ZONE"):
4810                maybe_func = False
4811                this = exp.DataType(this=exp.DataType.Type.TIMESTAMPLTZ, expressions=expressions)
4812            elif self._match_text_seq("WITHOUT", "TIME", "ZONE"):
4813                maybe_func = False
4814        elif type_token == TokenType.INTERVAL:
4815            unit = self._parse_var(upper=True)
4816            if unit:
4817                if self._match_text_seq("TO"):
4818                    unit = exp.IntervalSpan(this=unit, expression=self._parse_var(upper=True))
4819
4820                this = self.expression(exp.DataType, this=self.expression(exp.Interval, unit=unit))
4821            else:
4822                this = self.expression(exp.DataType, this=exp.DataType.Type.INTERVAL)
4823
4824        if maybe_func and check_func:
4825            index2 = self._index
4826            peek = self._parse_string()
4827
4828            if not peek:
4829                self._retreat(index)
4830                return None
4831
4832            self._retreat(index2)
4833
4834        if not this:
4835            if self._match_text_seq("UNSIGNED"):
4836                unsigned_type_token = self.SIGNED_TO_UNSIGNED_TYPE_TOKEN.get(type_token)
4837                if not unsigned_type_token:
4838                    self.raise_error(f"Cannot convert {type_token.value} to unsigned.")
4839
4840                type_token = unsigned_type_token or type_token
4841
4842            this = exp.DataType(
4843                this=exp.DataType.Type[type_token.value],
4844                expressions=expressions,
4845                nested=nested,
4846                prefix=prefix,
4847            )
4848
4849            # Empty arrays/structs are allowed
4850            if values is not None:
4851                cls = exp.Struct if is_struct else exp.Array
4852                this = exp.cast(cls(expressions=values), this, copy=False)
4853
4854        elif expressions:
4855            this.set("expressions", expressions)
4856
4857        # https://materialize.com/docs/sql/types/list/#type-name
4858        while self._match(TokenType.LIST):
4859            this = exp.DataType(this=exp.DataType.Type.LIST, expressions=[this], nested=True)
4860
4861        index = self._index
4862
4863        # Postgres supports the INT ARRAY[3] syntax as a synonym for INT[3]
4864        matched_array = self._match(TokenType.ARRAY)
4865
4866        while self._curr:
4867            datatype_token = self._prev.token_type
4868            matched_l_bracket = self._match(TokenType.L_BRACKET)
4869            if not matched_l_bracket and not matched_array:
4870                break
4871
4872            matched_array = False
4873            values = self._parse_csv(self._parse_assignment) or None
4874            if (
4875                values
4876                and not schema
4877                and (
4878                    not self.dialect.SUPPORTS_FIXED_SIZE_ARRAYS or datatype_token == TokenType.ARRAY
4879                )
4880            ):
4881                # Retreating here means that we should not parse the following values as part of the data type, e.g. in DuckDB
4882                # ARRAY[1] should retreat and instead be parsed into exp.Array in contrast to INT[x][y] which denotes a fixed-size array data type
4883                self._retreat(index)
4884                break
4885
4886            this = exp.DataType(
4887                this=exp.DataType.Type.ARRAY, expressions=[this], values=values, nested=True
4888            )
4889            self._match(TokenType.R_BRACKET)
4890
4891        if self.TYPE_CONVERTERS and isinstance(this.this, exp.DataType.Type):
4892            converter = self.TYPE_CONVERTERS.get(this.this)
4893            if converter:
4894                this = converter(t.cast(exp.DataType, this))
4895
4896        return this
4897
4898    def _parse_struct_types(self, type_required: bool = False) -> t.Optional[exp.Expression]:
4899        index = self._index
4900
4901        if (
4902            self._curr
4903            and self._next
4904            and self._curr.token_type in self.TYPE_TOKENS
4905            and self._next.token_type in self.TYPE_TOKENS
4906        ):
4907            # Takes care of special cases like `STRUCT<list ARRAY<...>>` where the identifier is also a
4908            # type token. Without this, the list will be parsed as a type and we'll eventually crash
4909            this = self._parse_id_var()
4910        else:
4911            this = (
4912                self._parse_type(parse_interval=False, fallback_to_identifier=True)
4913                or self._parse_id_var()
4914            )
4915
4916        self._match(TokenType.COLON)
4917
4918        if (
4919            type_required
4920            and not isinstance(this, exp.DataType)
4921            and not self._match_set(self.TYPE_TOKENS, advance=False)
4922        ):
4923            self._retreat(index)
4924            return self._parse_types()
4925
4926        return self._parse_column_def(this)
4927
4928    def _parse_at_time_zone(self, this: t.Optional[exp.Expression]) -> t.Optional[exp.Expression]:
4929        if not self._match_text_seq("AT", "TIME", "ZONE"):
4930            return this
4931        return self.expression(exp.AtTimeZone, this=this, zone=self._parse_unary())
4932
4933    def _parse_column(self) -> t.Optional[exp.Expression]:
4934        this = self._parse_column_reference()
4935        column = self._parse_column_ops(this) if this else self._parse_bracket(this)
4936
4937        if self.dialect.SUPPORTS_COLUMN_JOIN_MARKS and column:
4938            column.set("join_mark", self._match(TokenType.JOIN_MARKER))
4939
4940        return column
4941
4942    def _parse_column_reference(self) -> t.Optional[exp.Expression]:
4943        this = self._parse_field()
4944        if (
4945            not this
4946            and self._match(TokenType.VALUES, advance=False)
4947            and self.VALUES_FOLLOWED_BY_PAREN
4948            and (not self._next or self._next.token_type != TokenType.L_PAREN)
4949        ):
4950            this = self._parse_id_var()
4951
4952        if isinstance(this, exp.Identifier):
4953            # We bubble up comments from the Identifier to the Column
4954            this = self.expression(exp.Column, comments=this.pop_comments(), this=this)
4955
4956        return this
4957
4958    def _parse_colon_as_variant_extract(
4959        self, this: t.Optional[exp.Expression]
4960    ) -> t.Optional[exp.Expression]:
4961        casts = []
4962        json_path = []
4963
4964        while self._match(TokenType.COLON):
4965            start_index = self._index
4966
4967            # Snowflake allows reserved keywords as json keys but advance_any() excludes TokenType.SELECT from any_tokens=True
4968            path = self._parse_column_ops(
4969                self._parse_field(any_token=True, tokens=(TokenType.SELECT,))
4970            )
4971
4972            # The cast :: operator has a lower precedence than the extraction operator :, so
4973            # we rearrange the AST appropriately to avoid casting the JSON path
4974            while isinstance(path, exp.Cast):
4975                casts.append(path.to)
4976                path = path.this
4977
4978            if casts:
4979                dcolon_offset = next(
4980                    i
4981                    for i, t in enumerate(self._tokens[start_index:])
4982                    if t.token_type == TokenType.DCOLON
4983                )
4984                end_token = self._tokens[start_index + dcolon_offset - 1]
4985            else:
4986                end_token = self._prev
4987
4988            if path:
4989                json_path.append(self._find_sql(self._tokens[start_index], end_token))
4990
4991        # The VARIANT extract in Snowflake/Databricks is parsed as a JSONExtract; Snowflake uses the json_path in GET_PATH() while
4992        # Databricks transforms it back to the colon/dot notation
4993        if json_path:
4994            this = self.expression(
4995                exp.JSONExtract,
4996                this=this,
4997                expression=self.dialect.to_json_path(exp.Literal.string(".".join(json_path))),
4998                variant_extract=True,
4999            )
5000
5001            while casts:
5002                this = self.expression(exp.Cast, this=this, to=casts.pop())
5003
5004        return this
5005
5006    def _parse_dcolon(self) -> t.Optional[exp.Expression]:
5007        return self._parse_types()
5008
5009    def _parse_column_ops(self, this: t.Optional[exp.Expression]) -> t.Optional[exp.Expression]:
5010        this = self._parse_bracket(this)
5011
5012        while self._match_set(self.COLUMN_OPERATORS):
5013            op_token = self._prev.token_type
5014            op = self.COLUMN_OPERATORS.get(op_token)
5015
5016            if op_token == TokenType.DCOLON:
5017                field = self._parse_dcolon()
5018                if not field:
5019                    self.raise_error("Expected type")
5020            elif op and self._curr:
5021                field = self._parse_column_reference()
5022            else:
5023                field = self._parse_field(any_token=True, anonymous_func=True)
5024
5025            if isinstance(field, exp.Func) and this:
5026                # bigquery allows function calls like x.y.count(...)
5027                # SAFE.SUBSTR(...)
5028                # https://cloud.google.com/bigquery/docs/reference/standard-sql/functions-reference#function_call_rules
5029                this = exp.replace_tree(
5030                    this,
5031                    lambda n: (
5032                        self.expression(exp.Dot, this=n.args.get("table"), expression=n.this)
5033                        if n.table
5034                        else n.this
5035                    )
5036                    if isinstance(n, exp.Column)
5037                    else n,
5038                )
5039
5040            if op:
5041                this = op(self, this, field)
5042            elif isinstance(this, exp.Column) and not this.args.get("catalog"):
5043                this = self.expression(
5044                    exp.Column,
5045                    this=field,
5046                    table=this.this,
5047                    db=this.args.get("table"),
5048                    catalog=this.args.get("db"),
5049                )
5050            else:
5051                this = self.expression(exp.Dot, this=this, expression=field)
5052
5053            this = self._parse_bracket(this)
5054
5055        return self._parse_colon_as_variant_extract(this) if self.COLON_IS_VARIANT_EXTRACT else this
5056
5057    def _parse_primary(self) -> t.Optional[exp.Expression]:
5058        if self._match_set(self.PRIMARY_PARSERS):
5059            token_type = self._prev.token_type
5060            primary = self.PRIMARY_PARSERS[token_type](self, self._prev)
5061
5062            if token_type == TokenType.STRING:
5063                expressions = [primary]
5064                while self._match(TokenType.STRING):
5065                    expressions.append(exp.Literal.string(self._prev.text))
5066
5067                if len(expressions) > 1:
5068                    return self.expression(exp.Concat, expressions=expressions)
5069
5070            return primary
5071
5072        if self._match_pair(TokenType.DOT, TokenType.NUMBER):
5073            return exp.Literal.number(f"0.{self._prev.text}")
5074
5075        if self._match(TokenType.L_PAREN):
5076            comments = self._prev_comments
5077            query = self._parse_select()
5078
5079            if query:
5080                expressions = [query]
5081            else:
5082                expressions = self._parse_expressions()
5083
5084            this = self._parse_query_modifiers(seq_get(expressions, 0))
5085
5086            if not this and self._match(TokenType.R_PAREN, advance=False):
5087                this = self.expression(exp.Tuple)
5088            elif isinstance(this, exp.UNWRAPPED_QUERIES):
5089                this = self._parse_subquery(this=this, parse_alias=False)
5090            elif isinstance(this, exp.Subquery):
5091                this = self._parse_subquery(
5092                    this=self._parse_set_operations(this), parse_alias=False
5093                )
5094            elif len(expressions) > 1 or self._prev.token_type == TokenType.COMMA:
5095                this = self.expression(exp.Tuple, expressions=expressions)
5096            else:
5097                this = self.expression(exp.Paren, this=this)
5098
5099            if this:
5100                this.add_comments(comments)
5101
5102            self._match_r_paren(expression=this)
5103            return this
5104
5105        return None
5106
5107    def _parse_field(
5108        self,
5109        any_token: bool = False,
5110        tokens: t.Optional[t.Collection[TokenType]] = None,
5111        anonymous_func: bool = False,
5112    ) -> t.Optional[exp.Expression]:
5113        if anonymous_func:
5114            field = (
5115                self._parse_function(anonymous=anonymous_func, any_token=any_token)
5116                or self._parse_primary()
5117            )
5118        else:
5119            field = self._parse_primary() or self._parse_function(
5120                anonymous=anonymous_func, any_token=any_token
5121            )
5122        return field or self._parse_id_var(any_token=any_token, tokens=tokens)
5123
5124    def _parse_function(
5125        self,
5126        functions: t.Optional[t.Dict[str, t.Callable]] = None,
5127        anonymous: bool = False,
5128        optional_parens: bool = True,
5129        any_token: bool = False,
5130    ) -> t.Optional[exp.Expression]:
5131        # This allows us to also parse {fn <function>} syntax (Snowflake, MySQL support this)
5132        # See: https://community.snowflake.com/s/article/SQL-Escape-Sequences
5133        fn_syntax = False
5134        if (
5135            self._match(TokenType.L_BRACE, advance=False)
5136            and self._next
5137            and self._next.text.upper() == "FN"
5138        ):
5139            self._advance(2)
5140            fn_syntax = True
5141
5142        func = self._parse_function_call(
5143            functions=functions,
5144            anonymous=anonymous,
5145            optional_parens=optional_parens,
5146            any_token=any_token,
5147        )
5148
5149        if fn_syntax:
5150            self._match(TokenType.R_BRACE)
5151
5152        return func
5153
5154    def _parse_function_call(
5155        self,
5156        functions: t.Optional[t.Dict[str, t.Callable]] = None,
5157        anonymous: bool = False,
5158        optional_parens: bool = True,
5159        any_token: bool = False,
5160    ) -> t.Optional[exp.Expression]:
5161        if not self._curr:
5162            return None
5163
5164        comments = self._curr.comments
5165        token_type = self._curr.token_type
5166        this = self._curr.text
5167        upper = this.upper()
5168
5169        parser = self.NO_PAREN_FUNCTION_PARSERS.get(upper)
5170        if optional_parens and parser and token_type not in self.INVALID_FUNC_NAME_TOKENS:
5171            self._advance()
5172            return self._parse_window(parser(self))
5173
5174        if not self._next or self._next.token_type != TokenType.L_PAREN:
5175            if optional_parens and token_type in self.NO_PAREN_FUNCTIONS:
5176                self._advance()
5177                return self.expression(self.NO_PAREN_FUNCTIONS[token_type])
5178
5179            return None
5180
5181        if any_token:
5182            if token_type in self.RESERVED_TOKENS:
5183                return None
5184        elif token_type not in self.FUNC_TOKENS:
5185            return None
5186
5187        self._advance(2)
5188
5189        parser = self.FUNCTION_PARSERS.get(upper)
5190        if parser and not anonymous:
5191            this = parser(self)
5192        else:
5193            subquery_predicate = self.SUBQUERY_PREDICATES.get(token_type)
5194
5195            if subquery_predicate and self._curr.token_type in (TokenType.SELECT, TokenType.WITH):
5196                this = self.expression(subquery_predicate, this=self._parse_select())
5197                self._match_r_paren()
5198                return this
5199
5200            if functions is None:
5201                functions = self.FUNCTIONS
5202
5203            function = functions.get(upper)
5204
5205            alias = upper in self.FUNCTIONS_WITH_ALIASED_ARGS
5206            args = self._parse_csv(lambda: self._parse_lambda(alias=alias))
5207
5208            if alias:
5209                args = self._kv_to_prop_eq(args)
5210
5211            if function and not anonymous:
5212                if "dialect" in function.__code__.co_varnames:
5213                    func = function(args, dialect=self.dialect)
5214                else:
5215                    func = function(args)
5216
5217                func = self.validate_expression(func, args)
5218                if not self.dialect.NORMALIZE_FUNCTIONS:
5219                    func.meta["name"] = this
5220
5221                this = func
5222            else:
5223                if token_type == TokenType.IDENTIFIER:
5224                    this = exp.Identifier(this=this, quoted=True)
5225                this = self.expression(exp.Anonymous, this=this, expressions=args)
5226
5227        if isinstance(this, exp.Expression):
5228            this.add_comments(comments)
5229
5230        self._match_r_paren(this)
5231        return self._parse_window(this)
5232
5233    def _to_prop_eq(self, expression: exp.Expression, index: int) -> exp.Expression:
5234        return expression
5235
5236    def _kv_to_prop_eq(self, expressions: t.List[exp.Expression]) -> t.List[exp.Expression]:
5237        transformed = []
5238
5239        for index, e in enumerate(expressions):
5240            if isinstance(e, self.KEY_VALUE_DEFINITIONS):
5241                if isinstance(e, exp.Alias):
5242                    e = self.expression(exp.PropertyEQ, this=e.args.get("alias"), expression=e.this)
5243
5244                if not isinstance(e, exp.PropertyEQ):
5245                    e = self.expression(
5246                        exp.PropertyEQ, this=exp.to_identifier(e.this.name), expression=e.expression
5247                    )
5248
5249                if isinstance(e.this, exp.Column):
5250                    e.this.replace(e.this.this)
5251            else:
5252                e = self._to_prop_eq(e, index)
5253
5254            transformed.append(e)
5255
5256        return transformed
5257
5258    def _parse_function_parameter(self) -> t.Optional[exp.Expression]:
5259        return self._parse_column_def(self._parse_id_var())
5260
5261    def _parse_user_defined_function(
5262        self, kind: t.Optional[TokenType] = None
5263    ) -> t.Optional[exp.Expression]:
5264        this = self._parse_id_var()
5265
5266        while self._match(TokenType.DOT):
5267            this = self.expression(exp.Dot, this=this, expression=self._parse_id_var())
5268
5269        if not self._match(TokenType.L_PAREN):
5270            return this
5271
5272        expressions = self._parse_csv(self._parse_function_parameter)
5273        self._match_r_paren()
5274        return self.expression(
5275            exp.UserDefinedFunction, this=this, expressions=expressions, wrapped=True
5276        )
5277
5278    def _parse_introducer(self, token: Token) -> exp.Introducer | exp.Identifier:
5279        literal = self._parse_primary()
5280        if literal:
5281            return self.expression(exp.Introducer, this=token.text, expression=literal)
5282
5283        return self.expression(exp.Identifier, this=token.text)
5284
5285    def _parse_session_parameter(self) -> exp.SessionParameter:
5286        kind = None
5287        this = self._parse_id_var() or self._parse_primary()
5288
5289        if this and self._match(TokenType.DOT):
5290            kind = this.name
5291            this = self._parse_var() or self._parse_primary()
5292
5293        return self.expression(exp.SessionParameter, this=this, kind=kind)
5294
5295    def _parse_lambda_arg(self) -> t.Optional[exp.Expression]:
5296        return self._parse_id_var()
5297
5298    def _parse_lambda(self, alias: bool = False) -> t.Optional[exp.Expression]:
5299        index = self._index
5300
5301        if self._match(TokenType.L_PAREN):
5302            expressions = t.cast(
5303                t.List[t.Optional[exp.Expression]], self._parse_csv(self._parse_lambda_arg)
5304            )
5305
5306            if not self._match(TokenType.R_PAREN):
5307                self._retreat(index)
5308        else:
5309            expressions = [self._parse_lambda_arg()]
5310
5311        if self._match_set(self.LAMBDAS):
5312            return self.LAMBDAS[self._prev.token_type](self, expressions)
5313
5314        self._retreat(index)
5315
5316        this: t.Optional[exp.Expression]
5317
5318        if self._match(TokenType.DISTINCT):
5319            this = self.expression(
5320                exp.Distinct, expressions=self._parse_csv(self._parse_assignment)
5321            )
5322        else:
5323            this = self._parse_select_or_expression(alias=alias)
5324
5325        return self._parse_limit(
5326            self._parse_order(self._parse_having_max(self._parse_respect_or_ignore_nulls(this)))
5327        )
5328
5329    def _parse_schema(self, this: t.Optional[exp.Expression] = None) -> t.Optional[exp.Expression]:
5330        index = self._index
5331        if not self._match(TokenType.L_PAREN):
5332            return this
5333
5334        # Disambiguate between schema and subquery/CTE, e.g. in INSERT INTO table (<expr>),
5335        # expr can be of both types
5336        if self._match_set(self.SELECT_START_TOKENS):
5337            self._retreat(index)
5338            return this
5339        args = self._parse_csv(lambda: self._parse_constraint() or self._parse_field_def())
5340        self._match_r_paren()
5341        return self.expression(exp.Schema, this=this, expressions=args)
5342
5343    def _parse_field_def(self) -> t.Optional[exp.Expression]:
5344        return self._parse_column_def(self._parse_field(any_token=True))
5345
5346    def _parse_column_def(self, this: t.Optional[exp.Expression]) -> t.Optional[exp.Expression]:
5347        # column defs are not really columns, they're identifiers
5348        if isinstance(this, exp.Column):
5349            this = this.this
5350
5351        kind = self._parse_types(schema=True)
5352
5353        if self._match_text_seq("FOR", "ORDINALITY"):
5354            return self.expression(exp.ColumnDef, this=this, ordinality=True)
5355
5356        constraints: t.List[exp.Expression] = []
5357
5358        if (not kind and self._match(TokenType.ALIAS)) or self._match_texts(
5359            ("ALIAS", "MATERIALIZED")
5360        ):
5361            persisted = self._prev.text.upper() == "MATERIALIZED"
5362            constraint_kind = exp.ComputedColumnConstraint(
5363                this=self._parse_assignment(),
5364                persisted=persisted or self._match_text_seq("PERSISTED"),
5365                not_null=self._match_pair(TokenType.NOT, TokenType.NULL),
5366            )
5367            constraints.append(self.expression(exp.ColumnConstraint, kind=constraint_kind))
5368        elif kind and self._match_pair(TokenType.ALIAS, TokenType.L_PAREN, advance=False):
5369            self._match(TokenType.ALIAS)
5370            constraints.append(
5371                self.expression(
5372                    exp.ColumnConstraint,
5373                    kind=exp.TransformColumnConstraint(this=self._parse_field()),
5374                )
5375            )
5376
5377        while True:
5378            constraint = self._parse_column_constraint()
5379            if not constraint:
5380                break
5381            constraints.append(constraint)
5382
5383        if not kind and not constraints:
5384            return this
5385
5386        return self.expression(exp.ColumnDef, this=this, kind=kind, constraints=constraints)
5387
5388    def _parse_auto_increment(
5389        self,
5390    ) -> exp.GeneratedAsIdentityColumnConstraint | exp.AutoIncrementColumnConstraint:
5391        start = None
5392        increment = None
5393
5394        if self._match(TokenType.L_PAREN, advance=False):
5395            args = self._parse_wrapped_csv(self._parse_bitwise)
5396            start = seq_get(args, 0)
5397            increment = seq_get(args, 1)
5398        elif self._match_text_seq("START"):
5399            start = self._parse_bitwise()
5400            self._match_text_seq("INCREMENT")
5401            increment = self._parse_bitwise()
5402
5403        if start and increment:
5404            return exp.GeneratedAsIdentityColumnConstraint(start=start, increment=increment)
5405
5406        return exp.AutoIncrementColumnConstraint()
5407
5408    def _parse_auto_property(self) -> t.Optional[exp.AutoRefreshProperty]:
5409        if not self._match_text_seq("REFRESH"):
5410            self._retreat(self._index - 1)
5411            return None
5412        return self.expression(exp.AutoRefreshProperty, this=self._parse_var(upper=True))
5413
5414    def _parse_compress(self) -> exp.CompressColumnConstraint:
5415        if self._match(TokenType.L_PAREN, advance=False):
5416            return self.expression(
5417                exp.CompressColumnConstraint, this=self._parse_wrapped_csv(self._parse_bitwise)
5418            )
5419
5420        return self.expression(exp.CompressColumnConstraint, this=self._parse_bitwise())
5421
5422    def _parse_generated_as_identity(
5423        self,
5424    ) -> (
5425        exp.GeneratedAsIdentityColumnConstraint
5426        | exp.ComputedColumnConstraint
5427        | exp.GeneratedAsRowColumnConstraint
5428    ):
5429        if self._match_text_seq("BY", "DEFAULT"):
5430            on_null = self._match_pair(TokenType.ON, TokenType.NULL)
5431            this = self.expression(
5432                exp.GeneratedAsIdentityColumnConstraint, this=False, on_null=on_null
5433            )
5434        else:
5435            self._match_text_seq("ALWAYS")
5436            this = self.expression(exp.GeneratedAsIdentityColumnConstraint, this=True)
5437
5438        self._match(TokenType.ALIAS)
5439
5440        if self._match_text_seq("ROW"):
5441            start = self._match_text_seq("START")
5442            if not start:
5443                self._match(TokenType.END)
5444            hidden = self._match_text_seq("HIDDEN")
5445            return self.expression(exp.GeneratedAsRowColumnConstraint, start=start, hidden=hidden)
5446
5447        identity = self._match_text_seq("IDENTITY")
5448
5449        if self._match(TokenType.L_PAREN):
5450            if self._match(TokenType.START_WITH):
5451                this.set("start", self._parse_bitwise())
5452            if self._match_text_seq("INCREMENT", "BY"):
5453                this.set("increment", self._parse_bitwise())
5454            if self._match_text_seq("MINVALUE"):
5455                this.set("minvalue", self._parse_bitwise())
5456            if self._match_text_seq("MAXVALUE"):
5457                this.set("maxvalue", self._parse_bitwise())
5458
5459            if self._match_text_seq("CYCLE"):
5460                this.set("cycle", True)
5461            elif self._match_text_seq("NO", "CYCLE"):
5462                this.set("cycle", False)
5463
5464            if not identity:
5465                this.set("expression", self._parse_range())
5466            elif not this.args.get("start") and self._match(TokenType.NUMBER, advance=False):
5467                args = self._parse_csv(self._parse_bitwise)
5468                this.set("start", seq_get(args, 0))
5469                this.set("increment", seq_get(args, 1))
5470
5471            self._match_r_paren()
5472
5473        return this
5474
5475    def _parse_inline(self) -> exp.InlineLengthColumnConstraint:
5476        self._match_text_seq("LENGTH")
5477        return self.expression(exp.InlineLengthColumnConstraint, this=self._parse_bitwise())
5478
5479    def _parse_not_constraint(self) -> t.Optional[exp.Expression]:
5480        if self._match_text_seq("NULL"):
5481            return self.expression(exp.NotNullColumnConstraint)
5482        if self._match_text_seq("CASESPECIFIC"):
5483            return self.expression(exp.CaseSpecificColumnConstraint, not_=True)
5484        if self._match_text_seq("FOR", "REPLICATION"):
5485            return self.expression(exp.NotForReplicationColumnConstraint)
5486
5487        # Unconsume the `NOT` token
5488        self._retreat(self._index - 1)
5489        return None
5490
5491    def _parse_column_constraint(self) -> t.Optional[exp.Expression]:
5492        if self._match(TokenType.CONSTRAINT):
5493            this = self._parse_id_var()
5494        else:
5495            this = None
5496
5497        if self._match_texts(self.CONSTRAINT_PARSERS):
5498            return self.expression(
5499                exp.ColumnConstraint,
5500                this=this,
5501                kind=self.CONSTRAINT_PARSERS[self._prev.text.upper()](self),
5502            )
5503
5504        return this
5505
5506    def _parse_constraint(self) -> t.Optional[exp.Expression]:
5507        if not self._match(TokenType.CONSTRAINT):
5508            return self._parse_unnamed_constraint(constraints=self.SCHEMA_UNNAMED_CONSTRAINTS)
5509
5510        return self.expression(
5511            exp.Constraint,
5512            this=self._parse_id_var(),
5513            expressions=self._parse_unnamed_constraints(),
5514        )
5515
5516    def _parse_unnamed_constraints(self) -> t.List[exp.Expression]:
5517        constraints = []
5518        while True:
5519            constraint = self._parse_unnamed_constraint() or self._parse_function()
5520            if not constraint:
5521                break
5522            constraints.append(constraint)
5523
5524        return constraints
5525
5526    def _parse_unnamed_constraint(
5527        self, constraints: t.Optional[t.Collection[str]] = None
5528    ) -> t.Optional[exp.Expression]:
5529        if self._match(TokenType.IDENTIFIER, advance=False) or not self._match_texts(
5530            constraints or self.CONSTRAINT_PARSERS
5531        ):
5532            return None
5533
5534        constraint = self._prev.text.upper()
5535        if constraint not in self.CONSTRAINT_PARSERS:
5536            self.raise_error(f"No parser found for schema constraint {constraint}.")
5537
5538        return self.CONSTRAINT_PARSERS[constraint](self)
5539
5540    def _parse_unique_key(self) -> t.Optional[exp.Expression]:
5541        return self._parse_id_var(any_token=False)
5542
5543    def _parse_unique(self) -> exp.UniqueColumnConstraint:
5544        self._match_text_seq("KEY")
5545        return self.expression(
5546            exp.UniqueColumnConstraint,
5547            nulls=self._match_text_seq("NULLS", "NOT", "DISTINCT"),
5548            this=self._parse_schema(self._parse_unique_key()),
5549            index_type=self._match(TokenType.USING) and self._advance_any() and self._prev.text,
5550            on_conflict=self._parse_on_conflict(),
5551        )
5552
5553    def _parse_key_constraint_options(self) -> t.List[str]:
5554        options = []
5555        while True:
5556            if not self._curr:
5557                break
5558
5559            if self._match(TokenType.ON):
5560                action = None
5561                on = self._advance_any() and self._prev.text
5562
5563                if self._match_text_seq("NO", "ACTION"):
5564                    action = "NO ACTION"
5565                elif self._match_text_seq("CASCADE"):
5566                    action = "CASCADE"
5567                elif self._match_text_seq("RESTRICT"):
5568                    action = "RESTRICT"
5569                elif self._match_pair(TokenType.SET, TokenType.NULL):
5570                    action = "SET NULL"
5571                elif self._match_pair(TokenType.SET, TokenType.DEFAULT):
5572                    action = "SET DEFAULT"
5573                else:
5574                    self.raise_error("Invalid key constraint")
5575
5576                options.append(f"ON {on} {action}")
5577            else:
5578                var = self._parse_var_from_options(
5579                    self.KEY_CONSTRAINT_OPTIONS, raise_unmatched=False
5580                )
5581                if not var:
5582                    break
5583                options.append(var.name)
5584
5585        return options
5586
5587    def _parse_references(self, match: bool = True) -> t.Optional[exp.Reference]:
5588        if match and not self._match(TokenType.REFERENCES):
5589            return None
5590
5591        expressions = None
5592        this = self._parse_table(schema=True)
5593        options = self._parse_key_constraint_options()
5594        return self.expression(exp.Reference, this=this, expressions=expressions, options=options)
5595
5596    def _parse_foreign_key(self) -> exp.ForeignKey:
5597        expressions = self._parse_wrapped_id_vars()
5598        reference = self._parse_references()
5599        options = {}
5600
5601        while self._match(TokenType.ON):
5602            if not self._match_set((TokenType.DELETE, TokenType.UPDATE)):
5603                self.raise_error("Expected DELETE or UPDATE")
5604
5605            kind = self._prev.text.lower()
5606
5607            if self._match_text_seq("NO", "ACTION"):
5608                action = "NO ACTION"
5609            elif self._match(TokenType.SET):
5610                self._match_set((TokenType.NULL, TokenType.DEFAULT))
5611                action = "SET " + self._prev.text.upper()
5612            else:
5613                self._advance()
5614                action = self._prev.text.upper()
5615
5616            options[kind] = action
5617
5618        return self.expression(
5619            exp.ForeignKey,
5620            expressions=expressions,
5621            reference=reference,
5622            **options,  # type: ignore
5623        )
5624
5625    def _parse_primary_key_part(self) -> t.Optional[exp.Expression]:
5626        return self._parse_field()
5627
5628    def _parse_period_for_system_time(self) -> t.Optional[exp.PeriodForSystemTimeConstraint]:
5629        if not self._match(TokenType.TIMESTAMP_SNAPSHOT):
5630            self._retreat(self._index - 1)
5631            return None
5632
5633        id_vars = self._parse_wrapped_id_vars()
5634        return self.expression(
5635            exp.PeriodForSystemTimeConstraint,
5636            this=seq_get(id_vars, 0),
5637            expression=seq_get(id_vars, 1),
5638        )
5639
5640    def _parse_primary_key(
5641        self, wrapped_optional: bool = False, in_props: bool = False
5642    ) -> exp.PrimaryKeyColumnConstraint | exp.PrimaryKey:
5643        desc = (
5644            self._match_set((TokenType.ASC, TokenType.DESC))
5645            and self._prev.token_type == TokenType.DESC
5646        )
5647
5648        if not in_props and not self._match(TokenType.L_PAREN, advance=False):
5649            return self.expression(exp.PrimaryKeyColumnConstraint, desc=desc)
5650
5651        expressions = self._parse_wrapped_csv(
5652            self._parse_primary_key_part, optional=wrapped_optional
5653        )
5654        options = self._parse_key_constraint_options()
5655        return self.expression(exp.PrimaryKey, expressions=expressions, options=options)
5656
5657    def _parse_bracket_key_value(self, is_map: bool = False) -> t.Optional[exp.Expression]:
5658        return self._parse_slice(self._parse_alias(self._parse_assignment(), explicit=True))
5659
5660    def _parse_odbc_datetime_literal(self) -> exp.Expression:
5661        """
5662        Parses a datetime column in ODBC format. We parse the column into the corresponding
5663        types, for example `{d'yyyy-mm-dd'}` will be parsed as a `Date` column, exactly the
5664        same as we did for `DATE('yyyy-mm-dd')`.
5665
5666        Reference:
5667        https://learn.microsoft.com/en-us/sql/odbc/reference/develop-app/date-time-and-timestamp-literals
5668        """
5669        self._match(TokenType.VAR)
5670        exp_class = self.ODBC_DATETIME_LITERALS[self._prev.text.lower()]
5671        expression = self.expression(exp_class=exp_class, this=self._parse_string())
5672        if not self._match(TokenType.R_BRACE):
5673            self.raise_error("Expected }")
5674        return expression
5675
5676    def _parse_bracket(self, this: t.Optional[exp.Expression] = None) -> t.Optional[exp.Expression]:
5677        if not self._match_set((TokenType.L_BRACKET, TokenType.L_BRACE)):
5678            return this
5679
5680        bracket_kind = self._prev.token_type
5681        if (
5682            bracket_kind == TokenType.L_BRACE
5683            and self._curr
5684            and self._curr.token_type == TokenType.VAR
5685            and self._curr.text.lower() in self.ODBC_DATETIME_LITERALS
5686        ):
5687            return self._parse_odbc_datetime_literal()
5688
5689        expressions = self._parse_csv(
5690            lambda: self._parse_bracket_key_value(is_map=bracket_kind == TokenType.L_BRACE)
5691        )
5692
5693        if bracket_kind == TokenType.L_BRACKET and not self._match(TokenType.R_BRACKET):
5694            self.raise_error("Expected ]")
5695        elif bracket_kind == TokenType.L_BRACE and not self._match(TokenType.R_BRACE):
5696            self.raise_error("Expected }")
5697
5698        # https://duckdb.org/docs/sql/data_types/struct.html#creating-structs
5699        if bracket_kind == TokenType.L_BRACE:
5700            this = self.expression(exp.Struct, expressions=self._kv_to_prop_eq(expressions))
5701        elif not this:
5702            this = build_array_constructor(
5703                exp.Array, args=expressions, bracket_kind=bracket_kind, dialect=self.dialect
5704            )
5705        else:
5706            constructor_type = self.ARRAY_CONSTRUCTORS.get(this.name.upper())
5707            if constructor_type:
5708                return build_array_constructor(
5709                    constructor_type,
5710                    args=expressions,
5711                    bracket_kind=bracket_kind,
5712                    dialect=self.dialect,
5713                )
5714
5715            expressions = apply_index_offset(this, expressions, -self.dialect.INDEX_OFFSET)
5716            this = self.expression(exp.Bracket, this=this, expressions=expressions)
5717
5718        self._add_comments(this)
5719        return self._parse_bracket(this)
5720
5721    def _parse_slice(self, this: t.Optional[exp.Expression]) -> t.Optional[exp.Expression]:
5722        if self._match(TokenType.COLON):
5723            return self.expression(exp.Slice, this=this, expression=self._parse_assignment())
5724        return this
5725
5726    def _parse_case(self) -> t.Optional[exp.Expression]:
5727        ifs = []
5728        default = None
5729
5730        comments = self._prev_comments
5731        expression = self._parse_assignment()
5732
5733        while self._match(TokenType.WHEN):
5734            this = self._parse_assignment()
5735            self._match(TokenType.THEN)
5736            then = self._parse_assignment()
5737            ifs.append(self.expression(exp.If, this=this, true=then))
5738
5739        if self._match(TokenType.ELSE):
5740            default = self._parse_assignment()
5741
5742        if not self._match(TokenType.END):
5743            if isinstance(default, exp.Interval) and default.this.sql().upper() == "END":
5744                default = exp.column("interval")
5745            else:
5746                self.raise_error("Expected END after CASE", self._prev)
5747
5748        return self.expression(
5749            exp.Case, comments=comments, this=expression, ifs=ifs, default=default
5750        )
5751
5752    def _parse_if(self) -> t.Optional[exp.Expression]:
5753        if self._match(TokenType.L_PAREN):
5754            args = self._parse_csv(self._parse_assignment)
5755            this = self.validate_expression(exp.If.from_arg_list(args), args)
5756            self._match_r_paren()
5757        else:
5758            index = self._index - 1
5759
5760            if self.NO_PAREN_IF_COMMANDS and index == 0:
5761                return self._parse_as_command(self._prev)
5762
5763            condition = self._parse_assignment()
5764
5765            if not condition:
5766                self._retreat(index)
5767                return None
5768
5769            self._match(TokenType.THEN)
5770            true = self._parse_assignment()
5771            false = self._parse_assignment() if self._match(TokenType.ELSE) else None
5772            self._match(TokenType.END)
5773            this = self.expression(exp.If, this=condition, true=true, false=false)
5774
5775        return this
5776
5777    def _parse_next_value_for(self) -> t.Optional[exp.Expression]:
5778        if not self._match_text_seq("VALUE", "FOR"):
5779            self._retreat(self._index - 1)
5780            return None
5781
5782        return self.expression(
5783            exp.NextValueFor,
5784            this=self._parse_column(),
5785            order=self._match(TokenType.OVER) and self._parse_wrapped(self._parse_order),
5786        )
5787
5788    def _parse_extract(self) -> exp.Extract | exp.Anonymous:
5789        this = self._parse_function() or self._parse_var_or_string(upper=True)
5790
5791        if self._match(TokenType.FROM):
5792            return self.expression(exp.Extract, this=this, expression=self._parse_bitwise())
5793
5794        if not self._match(TokenType.COMMA):
5795            self.raise_error("Expected FROM or comma after EXTRACT", self._prev)
5796
5797        return self.expression(exp.Extract, this=this, expression=self._parse_bitwise())
5798
5799    def _parse_gap_fill(self) -> exp.GapFill:
5800        self._match(TokenType.TABLE)
5801        this = self._parse_table()
5802
5803        self._match(TokenType.COMMA)
5804        args = [this, *self._parse_csv(self._parse_lambda)]
5805
5806        gap_fill = exp.GapFill.from_arg_list(args)
5807        return self.validate_expression(gap_fill, args)
5808
5809    def _parse_cast(self, strict: bool, safe: t.Optional[bool] = None) -> exp.Expression:
5810        this = self._parse_assignment()
5811
5812        if not self._match(TokenType.ALIAS):
5813            if self._match(TokenType.COMMA):
5814                return self.expression(exp.CastToStrType, this=this, to=self._parse_string())
5815
5816            self.raise_error("Expected AS after CAST")
5817
5818        fmt = None
5819        to = self._parse_types()
5820
5821        if self._match(TokenType.FORMAT):
5822            fmt_string = self._parse_string()
5823            fmt = self._parse_at_time_zone(fmt_string)
5824
5825            if not to:
5826                to = exp.DataType.build(exp.DataType.Type.UNKNOWN)
5827            if to.this in exp.DataType.TEMPORAL_TYPES:
5828                this = self.expression(
5829                    exp.StrToDate if to.this == exp.DataType.Type.DATE else exp.StrToTime,
5830                    this=this,
5831                    format=exp.Literal.string(
5832                        format_time(
5833                            fmt_string.this if fmt_string else "",
5834                            self.dialect.FORMAT_MAPPING or self.dialect.TIME_MAPPING,
5835                            self.dialect.FORMAT_TRIE or self.dialect.TIME_TRIE,
5836                        )
5837                    ),
5838                    safe=safe,
5839                )
5840
5841                if isinstance(fmt, exp.AtTimeZone) and isinstance(this, exp.StrToTime):
5842                    this.set("zone", fmt.args["zone"])
5843                return this
5844        elif not to:
5845            self.raise_error("Expected TYPE after CAST")
5846        elif isinstance(to, exp.Identifier):
5847            to = exp.DataType.build(to.name, udt=True)
5848        elif to.this == exp.DataType.Type.CHAR:
5849            if self._match(TokenType.CHARACTER_SET):
5850                to = self.expression(exp.CharacterSet, this=self._parse_var_or_string())
5851
5852        return self.expression(
5853            exp.Cast if strict else exp.TryCast,
5854            this=this,
5855            to=to,
5856            format=fmt,
5857            safe=safe,
5858            action=self._parse_var_from_options(self.CAST_ACTIONS, raise_unmatched=False),
5859        )
5860
5861    def _parse_string_agg(self) -> exp.Expression:
5862        if self._match(TokenType.DISTINCT):
5863            args: t.List[t.Optional[exp.Expression]] = [
5864                self.expression(exp.Distinct, expressions=[self._parse_assignment()])
5865            ]
5866            if self._match(TokenType.COMMA):
5867                args.extend(self._parse_csv(self._parse_assignment))
5868        else:
5869            args = self._parse_csv(self._parse_assignment)  # type: ignore
5870
5871        index = self._index
5872        if not self._match(TokenType.R_PAREN) and args:
5873            # postgres: STRING_AGG([DISTINCT] expression, separator [ORDER BY expression1 {ASC | DESC} [, ...]])
5874            # bigquery: STRING_AGG([DISTINCT] expression [, separator] [ORDER BY key [{ASC | DESC}] [, ... ]] [LIMIT n])
5875            args[-1] = self._parse_limit(this=self._parse_order(this=args[-1]))
5876            return self.expression(exp.GroupConcat, this=args[0], separator=seq_get(args, 1))
5877
5878        # Checks if we can parse an order clause: WITHIN GROUP (ORDER BY <order_by_expression_list> [ASC | DESC]).
5879        # This is done "manually", instead of letting _parse_window parse it into an exp.WithinGroup node, so that
5880        # the STRING_AGG call is parsed like in MySQL / SQLite and can thus be transpiled more easily to them.
5881        if not self._match_text_seq("WITHIN", "GROUP"):
5882            self._retreat(index)
5883            return self.validate_expression(exp.GroupConcat.from_arg_list(args), args)
5884
5885        self._match_l_paren()  # The corresponding match_r_paren will be called in parse_function (caller)
5886        order = self._parse_order(this=seq_get(args, 0))
5887        return self.expression(exp.GroupConcat, this=order, separator=seq_get(args, 1))
5888
5889    def _parse_convert(
5890        self, strict: bool, safe: t.Optional[bool] = None
5891    ) -> t.Optional[exp.Expression]:
5892        this = self._parse_bitwise()
5893
5894        if self._match(TokenType.USING):
5895            to: t.Optional[exp.Expression] = self.expression(
5896                exp.CharacterSet, this=self._parse_var()
5897            )
5898        elif self._match(TokenType.COMMA):
5899            to = self._parse_types()
5900        else:
5901            to = None
5902
5903        return self.expression(exp.Cast if strict else exp.TryCast, this=this, to=to, safe=safe)
5904
5905    def _parse_decode(self) -> t.Optional[exp.Decode | exp.Case]:
5906        """
5907        There are generally two variants of the DECODE function:
5908
5909        - DECODE(bin, charset)
5910        - DECODE(expression, search, result [, search, result] ... [, default])
5911
5912        The second variant will always be parsed into a CASE expression. Note that NULL
5913        needs special treatment, since we need to explicitly check for it with `IS NULL`,
5914        instead of relying on pattern matching.
5915        """
5916        args = self._parse_csv(self._parse_assignment)
5917
5918        if len(args) < 3:
5919            return self.expression(exp.Decode, this=seq_get(args, 0), charset=seq_get(args, 1))
5920
5921        expression, *expressions = args
5922        if not expression:
5923            return None
5924
5925        ifs = []
5926        for search, result in zip(expressions[::2], expressions[1::2]):
5927            if not search or not result:
5928                return None
5929
5930            if isinstance(search, exp.Literal):
5931                ifs.append(
5932                    exp.If(this=exp.EQ(this=expression.copy(), expression=search), true=result)
5933                )
5934            elif isinstance(search, exp.Null):
5935                ifs.append(
5936                    exp.If(this=exp.Is(this=expression.copy(), expression=exp.Null()), true=result)
5937                )
5938            else:
5939                cond = exp.or_(
5940                    exp.EQ(this=expression.copy(), expression=search),
5941                    exp.and_(
5942                        exp.Is(this=expression.copy(), expression=exp.Null()),
5943                        exp.Is(this=search.copy(), expression=exp.Null()),
5944                        copy=False,
5945                    ),
5946                    copy=False,
5947                )
5948                ifs.append(exp.If(this=cond, true=result))
5949
5950        return exp.Case(ifs=ifs, default=expressions[-1] if len(expressions) % 2 == 1 else None)
5951
5952    def _parse_json_key_value(self) -> t.Optional[exp.JSONKeyValue]:
5953        self._match_text_seq("KEY")
5954        key = self._parse_column()
5955        self._match_set(self.JSON_KEY_VALUE_SEPARATOR_TOKENS)
5956        self._match_text_seq("VALUE")
5957        value = self._parse_bitwise()
5958
5959        if not key and not value:
5960            return None
5961        return self.expression(exp.JSONKeyValue, this=key, expression=value)
5962
5963    def _parse_format_json(self, this: t.Optional[exp.Expression]) -> t.Optional[exp.Expression]:
5964        if not this or not self._match_text_seq("FORMAT", "JSON"):
5965            return this
5966
5967        return self.expression(exp.FormatJson, this=this)
5968
5969    def _parse_on_condition(self) -> t.Optional[exp.OnCondition]:
5970        # MySQL uses "X ON EMPTY Y ON ERROR" (e.g. JSON_VALUE) while Oracle uses the opposite (e.g. JSON_EXISTS)
5971        if self.dialect.ON_CONDITION_EMPTY_BEFORE_ERROR:
5972            empty = self._parse_on_handling("EMPTY", *self.ON_CONDITION_TOKENS)
5973            error = self._parse_on_handling("ERROR", *self.ON_CONDITION_TOKENS)
5974        else:
5975            error = self._parse_on_handling("ERROR", *self.ON_CONDITION_TOKENS)
5976            empty = self._parse_on_handling("EMPTY", *self.ON_CONDITION_TOKENS)
5977
5978        null = self._parse_on_handling("NULL", *self.ON_CONDITION_TOKENS)
5979
5980        if not empty and not error and not null:
5981            return None
5982
5983        return self.expression(
5984            exp.OnCondition,
5985            empty=empty,
5986            error=error,
5987            null=null,
5988        )
5989
5990    def _parse_on_handling(
5991        self, on: str, *values: str
5992    ) -> t.Optional[str] | t.Optional[exp.Expression]:
5993        # Parses the "X ON Y" or "DEFAULT <expr> ON Y syntax, e.g. NULL ON NULL (Oracle, T-SQL, MySQL)
5994        for value in values:
5995            if self._match_text_seq(value, "ON", on):
5996                return f"{value} ON {on}"
5997
5998        index = self._index
5999        if self._match(TokenType.DEFAULT):
6000            default_value = self._parse_bitwise()
6001            if self._match_text_seq("ON", on):
6002                return default_value
6003
6004            self._retreat(index)
6005
6006        return None
6007
6008    @t.overload
6009    def _parse_json_object(self, agg: Lit[False]) -> exp.JSONObject: ...
6010
6011    @t.overload
6012    def _parse_json_object(self, agg: Lit[True]) -> exp.JSONObjectAgg: ...
6013
6014    def _parse_json_object(self, agg=False):
6015        star = self._parse_star()
6016        expressions = (
6017            [star]
6018            if star
6019            else self._parse_csv(lambda: self._parse_format_json(self._parse_json_key_value()))
6020        )
6021        null_handling = self._parse_on_handling("NULL", "NULL", "ABSENT")
6022
6023        unique_keys = None
6024        if self._match_text_seq("WITH", "UNIQUE"):
6025            unique_keys = True
6026        elif self._match_text_seq("WITHOUT", "UNIQUE"):
6027            unique_keys = False
6028
6029        self._match_text_seq("KEYS")
6030
6031        return_type = self._match_text_seq("RETURNING") and self._parse_format_json(
6032            self._parse_type()
6033        )
6034        encoding = self._match_text_seq("ENCODING") and self._parse_var()
6035
6036        return self.expression(
6037            exp.JSONObjectAgg if agg else exp.JSONObject,
6038            expressions=expressions,
6039            null_handling=null_handling,
6040            unique_keys=unique_keys,
6041            return_type=return_type,
6042            encoding=encoding,
6043        )
6044
6045    # Note: this is currently incomplete; it only implements the "JSON_value_column" part
6046    def _parse_json_column_def(self) -> exp.JSONColumnDef:
6047        if not self._match_text_seq("NESTED"):
6048            this = self._parse_id_var()
6049            kind = self._parse_types(allow_identifiers=False)
6050            nested = None
6051        else:
6052            this = None
6053            kind = None
6054            nested = True
6055
6056        path = self._match_text_seq("PATH") and self._parse_string()
6057        nested_schema = nested and self._parse_json_schema()
6058
6059        return self.expression(
6060            exp.JSONColumnDef,
6061            this=this,
6062            kind=kind,
6063            path=path,
6064            nested_schema=nested_schema,
6065        )
6066
6067    def _parse_json_schema(self) -> exp.JSONSchema:
6068        self._match_text_seq("COLUMNS")
6069        return self.expression(
6070            exp.JSONSchema,
6071            expressions=self._parse_wrapped_csv(self._parse_json_column_def, optional=True),
6072        )
6073
6074    def _parse_json_table(self) -> exp.JSONTable:
6075        this = self._parse_format_json(self._parse_bitwise())
6076        path = self._match(TokenType.COMMA) and self._parse_string()
6077        error_handling = self._parse_on_handling("ERROR", "ERROR", "NULL")
6078        empty_handling = self._parse_on_handling("EMPTY", "ERROR", "NULL")
6079        schema = self._parse_json_schema()
6080
6081        return exp.JSONTable(
6082            this=this,
6083            schema=schema,
6084            path=path,
6085            error_handling=error_handling,
6086            empty_handling=empty_handling,
6087        )
6088
6089    def _parse_match_against(self) -> exp.MatchAgainst:
6090        expressions = self._parse_csv(self._parse_column)
6091
6092        self._match_text_seq(")", "AGAINST", "(")
6093
6094        this = self._parse_string()
6095
6096        if self._match_text_seq("IN", "NATURAL", "LANGUAGE", "MODE"):
6097            modifier = "IN NATURAL LANGUAGE MODE"
6098            if self._match_text_seq("WITH", "QUERY", "EXPANSION"):
6099                modifier = f"{modifier} WITH QUERY EXPANSION"
6100        elif self._match_text_seq("IN", "BOOLEAN", "MODE"):
6101            modifier = "IN BOOLEAN MODE"
6102        elif self._match_text_seq("WITH", "QUERY", "EXPANSION"):
6103            modifier = "WITH QUERY EXPANSION"
6104        else:
6105            modifier = None
6106
6107        return self.expression(
6108            exp.MatchAgainst, this=this, expressions=expressions, modifier=modifier
6109        )
6110
6111    # https://learn.microsoft.com/en-us/sql/t-sql/functions/openjson-transact-sql?view=sql-server-ver16
6112    def _parse_open_json(self) -> exp.OpenJSON:
6113        this = self._parse_bitwise()
6114        path = self._match(TokenType.COMMA) and self._parse_string()
6115
6116        def _parse_open_json_column_def() -> exp.OpenJSONColumnDef:
6117            this = self._parse_field(any_token=True)
6118            kind = self._parse_types()
6119            path = self._parse_string()
6120            as_json = self._match_pair(TokenType.ALIAS, TokenType.JSON)
6121
6122            return self.expression(
6123                exp.OpenJSONColumnDef, this=this, kind=kind, path=path, as_json=as_json
6124            )
6125
6126        expressions = None
6127        if self._match_pair(TokenType.R_PAREN, TokenType.WITH):
6128            self._match_l_paren()
6129            expressions = self._parse_csv(_parse_open_json_column_def)
6130
6131        return self.expression(exp.OpenJSON, this=this, path=path, expressions=expressions)
6132
6133    def _parse_position(self, haystack_first: bool = False) -> exp.StrPosition:
6134        args = self._parse_csv(self._parse_bitwise)
6135
6136        if self._match(TokenType.IN):
6137            return self.expression(
6138                exp.StrPosition, this=self._parse_bitwise(), substr=seq_get(args, 0)
6139            )
6140
6141        if haystack_first:
6142            haystack = seq_get(args, 0)
6143            needle = seq_get(args, 1)
6144        else:
6145            needle = seq_get(args, 0)
6146            haystack = seq_get(args, 1)
6147
6148        return self.expression(
6149            exp.StrPosition, this=haystack, substr=needle, position=seq_get(args, 2)
6150        )
6151
6152    def _parse_predict(self) -> exp.Predict:
6153        self._match_text_seq("MODEL")
6154        this = self._parse_table()
6155
6156        self._match(TokenType.COMMA)
6157        self._match_text_seq("TABLE")
6158
6159        return self.expression(
6160            exp.Predict,
6161            this=this,
6162            expression=self._parse_table(),
6163            params_struct=self._match(TokenType.COMMA) and self._parse_bitwise(),
6164        )
6165
6166    def _parse_join_hint(self, func_name: str) -> exp.JoinHint:
6167        args = self._parse_csv(self._parse_table)
6168        return exp.JoinHint(this=func_name.upper(), expressions=args)
6169
6170    def _parse_substring(self) -> exp.Substring:
6171        # Postgres supports the form: substring(string [from int] [for int])
6172        # https://www.postgresql.org/docs/9.1/functions-string.html @ Table 9-6
6173
6174        args = t.cast(t.List[t.Optional[exp.Expression]], self._parse_csv(self._parse_bitwise))
6175
6176        if self._match(TokenType.FROM):
6177            args.append(self._parse_bitwise())
6178        if self._match(TokenType.FOR):
6179            if len(args) == 1:
6180                args.append(exp.Literal.number(1))
6181            args.append(self._parse_bitwise())
6182
6183        return self.validate_expression(exp.Substring.from_arg_list(args), args)
6184
6185    def _parse_trim(self) -> exp.Trim:
6186        # https://www.w3resource.com/sql/character-functions/trim.php
6187        # https://docs.oracle.com/javadb/10.8.3.0/ref/rreftrimfunc.html
6188
6189        position = None
6190        collation = None
6191        expression = None
6192
6193        if self._match_texts(self.TRIM_TYPES):
6194            position = self._prev.text.upper()
6195
6196        this = self._parse_bitwise()
6197        if self._match_set((TokenType.FROM, TokenType.COMMA)):
6198            invert_order = self._prev.token_type == TokenType.FROM or self.TRIM_PATTERN_FIRST
6199            expression = self._parse_bitwise()
6200
6201            if invert_order:
6202                this, expression = expression, this
6203
6204        if self._match(TokenType.COLLATE):
6205            collation = self._parse_bitwise()
6206
6207        return self.expression(
6208            exp.Trim, this=this, position=position, expression=expression, collation=collation
6209        )
6210
6211    def _parse_window_clause(self) -> t.Optional[t.List[exp.Expression]]:
6212        return self._match(TokenType.WINDOW) and self._parse_csv(self._parse_named_window)
6213
6214    def _parse_named_window(self) -> t.Optional[exp.Expression]:
6215        return self._parse_window(self._parse_id_var(), alias=True)
6216
6217    def _parse_respect_or_ignore_nulls(
6218        self, this: t.Optional[exp.Expression]
6219    ) -> t.Optional[exp.Expression]:
6220        if self._match_text_seq("IGNORE", "NULLS"):
6221            return self.expression(exp.IgnoreNulls, this=this)
6222        if self._match_text_seq("RESPECT", "NULLS"):
6223            return self.expression(exp.RespectNulls, this=this)
6224        return this
6225
6226    def _parse_having_max(self, this: t.Optional[exp.Expression]) -> t.Optional[exp.Expression]:
6227        if self._match(TokenType.HAVING):
6228            self._match_texts(("MAX", "MIN"))
6229            max = self._prev.text.upper() != "MIN"
6230            return self.expression(
6231                exp.HavingMax, this=this, expression=self._parse_column(), max=max
6232            )
6233
6234        return this
6235
6236    def _parse_window(
6237        self, this: t.Optional[exp.Expression], alias: bool = False
6238    ) -> t.Optional[exp.Expression]:
6239        func = this
6240        comments = func.comments if isinstance(func, exp.Expression) else None
6241
6242        if self._match_pair(TokenType.FILTER, TokenType.L_PAREN):
6243            self._match(TokenType.WHERE)
6244            this = self.expression(
6245                exp.Filter, this=this, expression=self._parse_where(skip_where_token=True)
6246            )
6247            self._match_r_paren()
6248
6249        # T-SQL allows the OVER (...) syntax after WITHIN GROUP.
6250        # https://learn.microsoft.com/en-us/sql/t-sql/functions/percentile-disc-transact-sql?view=sql-server-ver16
6251        if self._match_text_seq("WITHIN", "GROUP"):
6252            order = self._parse_wrapped(self._parse_order)
6253            this = self.expression(exp.WithinGroup, this=this, expression=order)
6254
6255        # SQL spec defines an optional [ { IGNORE | RESPECT } NULLS ] OVER
6256        # Some dialects choose to implement and some do not.
6257        # https://dev.mysql.com/doc/refman/8.0/en/window-function-descriptions.html
6258
6259        # There is some code above in _parse_lambda that handles
6260        #   SELECT FIRST_VALUE(TABLE.COLUMN IGNORE|RESPECT NULLS) OVER ...
6261
6262        # The below changes handle
6263        #   SELECT FIRST_VALUE(TABLE.COLUMN) IGNORE|RESPECT NULLS OVER ...
6264
6265        # Oracle allows both formats
6266        #   (https://docs.oracle.com/en/database/oracle/oracle-database/19/sqlrf/img_text/first_value.html)
6267        #   and Snowflake chose to do the same for familiarity
6268        #   https://docs.snowflake.com/en/sql-reference/functions/first_value.html#usage-notes
6269        if isinstance(this, exp.AggFunc):
6270            ignore_respect = this.find(exp.IgnoreNulls, exp.RespectNulls)
6271
6272            if ignore_respect and ignore_respect is not this:
6273                ignore_respect.replace(ignore_respect.this)
6274                this = self.expression(ignore_respect.__class__, this=this)
6275
6276        this = self._parse_respect_or_ignore_nulls(this)
6277
6278        # bigquery select from window x AS (partition by ...)
6279        if alias:
6280            over = None
6281            self._match(TokenType.ALIAS)
6282        elif not self._match_set(self.WINDOW_BEFORE_PAREN_TOKENS):
6283            return this
6284        else:
6285            over = self._prev.text.upper()
6286
6287        if comments and isinstance(func, exp.Expression):
6288            func.pop_comments()
6289
6290        if not self._match(TokenType.L_PAREN):
6291            return self.expression(
6292                exp.Window,
6293                comments=comments,
6294                this=this,
6295                alias=self._parse_id_var(False),
6296                over=over,
6297            )
6298
6299        window_alias = self._parse_id_var(any_token=False, tokens=self.WINDOW_ALIAS_TOKENS)
6300
6301        first = self._match(TokenType.FIRST)
6302        if self._match_text_seq("LAST"):
6303            first = False
6304
6305        partition, order = self._parse_partition_and_order()
6306        kind = self._match_set((TokenType.ROWS, TokenType.RANGE)) and self._prev.text
6307
6308        if kind:
6309            self._match(TokenType.BETWEEN)
6310            start = self._parse_window_spec()
6311            self._match(TokenType.AND)
6312            end = self._parse_window_spec()
6313
6314            spec = self.expression(
6315                exp.WindowSpec,
6316                kind=kind,
6317                start=start["value"],
6318                start_side=start["side"],
6319                end=end["value"],
6320                end_side=end["side"],
6321            )
6322        else:
6323            spec = None
6324
6325        self._match_r_paren()
6326
6327        window = self.expression(
6328            exp.Window,
6329            comments=comments,
6330            this=this,
6331            partition_by=partition,
6332            order=order,
6333            spec=spec,
6334            alias=window_alias,
6335            over=over,
6336            first=first,
6337        )
6338
6339        # This covers Oracle's FIRST/LAST syntax: aggregate KEEP (...) OVER (...)
6340        if self._match_set(self.WINDOW_BEFORE_PAREN_TOKENS, advance=False):
6341            return self._parse_window(window, alias=alias)
6342
6343        return window
6344
6345    def _parse_partition_and_order(
6346        self,
6347    ) -> t.Tuple[t.List[exp.Expression], t.Optional[exp.Expression]]:
6348        return self._parse_partition_by(), self._parse_order()
6349
6350    def _parse_window_spec(self) -> t.Dict[str, t.Optional[str | exp.Expression]]:
6351        self._match(TokenType.BETWEEN)
6352
6353        return {
6354            "value": (
6355                (self._match_text_seq("UNBOUNDED") and "UNBOUNDED")
6356                or (self._match_text_seq("CURRENT", "ROW") and "CURRENT ROW")
6357                or self._parse_bitwise()
6358            ),
6359            "side": self._match_texts(self.WINDOW_SIDES) and self._prev.text,
6360        }
6361
6362    def _parse_alias(
6363        self, this: t.Optional[exp.Expression], explicit: bool = False
6364    ) -> t.Optional[exp.Expression]:
6365        any_token = self._match(TokenType.ALIAS)
6366        comments = self._prev_comments or []
6367
6368        if explicit and not any_token:
6369            return this
6370
6371        if self._match(TokenType.L_PAREN):
6372            aliases = self.expression(
6373                exp.Aliases,
6374                comments=comments,
6375                this=this,
6376                expressions=self._parse_csv(lambda: self._parse_id_var(any_token)),
6377            )
6378            self._match_r_paren(aliases)
6379            return aliases
6380
6381        alias = self._parse_id_var(any_token, tokens=self.ALIAS_TOKENS) or (
6382            self.STRING_ALIASES and self._parse_string_as_identifier()
6383        )
6384
6385        if alias:
6386            comments.extend(alias.pop_comments())
6387            this = self.expression(exp.Alias, comments=comments, this=this, alias=alias)
6388            column = this.this
6389
6390            # Moves the comment next to the alias in `expr /* comment */ AS alias`
6391            if not this.comments and column and column.comments:
6392                this.comments = column.pop_comments()
6393
6394        return this
6395
6396    def _parse_id_var(
6397        self,
6398        any_token: bool = True,
6399        tokens: t.Optional[t.Collection[TokenType]] = None,
6400    ) -> t.Optional[exp.Expression]:
6401        expression = self._parse_identifier()
6402        if not expression and (
6403            (any_token and self._advance_any()) or self._match_set(tokens or self.ID_VAR_TOKENS)
6404        ):
6405            quoted = self._prev.token_type == TokenType.STRING
6406            expression = self.expression(exp.Identifier, this=self._prev.text, quoted=quoted)
6407
6408        return expression
6409
6410    def _parse_string(self) -> t.Optional[exp.Expression]:
6411        if self._match_set(self.STRING_PARSERS):
6412            return self.STRING_PARSERS[self._prev.token_type](self, self._prev)
6413        return self._parse_placeholder()
6414
6415    def _parse_string_as_identifier(self) -> t.Optional[exp.Identifier]:
6416        return exp.to_identifier(self._match(TokenType.STRING) and self._prev.text, quoted=True)
6417
6418    def _parse_number(self) -> t.Optional[exp.Expression]:
6419        if self._match_set(self.NUMERIC_PARSERS):
6420            return self.NUMERIC_PARSERS[self._prev.token_type](self, self._prev)
6421        return self._parse_placeholder()
6422
6423    def _parse_identifier(self) -> t.Optional[exp.Expression]:
6424        if self._match(TokenType.IDENTIFIER):
6425            return self.expression(exp.Identifier, this=self._prev.text, quoted=True)
6426        return self._parse_placeholder()
6427
6428    def _parse_var(
6429        self,
6430        any_token: bool = False,
6431        tokens: t.Optional[t.Collection[TokenType]] = None,
6432        upper: bool = False,
6433    ) -> t.Optional[exp.Expression]:
6434        if (
6435            (any_token and self._advance_any())
6436            or self._match(TokenType.VAR)
6437            or (self._match_set(tokens) if tokens else False)
6438        ):
6439            return self.expression(
6440                exp.Var, this=self._prev.text.upper() if upper else self._prev.text
6441            )
6442        return self._parse_placeholder()
6443
6444    def _advance_any(self, ignore_reserved: bool = False) -> t.Optional[Token]:
6445        if self._curr and (ignore_reserved or self._curr.token_type not in self.RESERVED_TOKENS):
6446            self._advance()
6447            return self._prev
6448        return None
6449
6450    def _parse_var_or_string(self, upper: bool = False) -> t.Optional[exp.Expression]:
6451        return self._parse_string() or self._parse_var(any_token=True, upper=upper)
6452
6453    def _parse_primary_or_var(self) -> t.Optional[exp.Expression]:
6454        return self._parse_primary() or self._parse_var(any_token=True)
6455
6456    def _parse_null(self) -> t.Optional[exp.Expression]:
6457        if self._match_set(self.NULL_TOKENS):
6458            return self.PRIMARY_PARSERS[TokenType.NULL](self, self._prev)
6459        return self._parse_placeholder()
6460
6461    def _parse_boolean(self) -> t.Optional[exp.Expression]:
6462        if self._match(TokenType.TRUE):
6463            return self.PRIMARY_PARSERS[TokenType.TRUE](self, self._prev)
6464        if self._match(TokenType.FALSE):
6465            return self.PRIMARY_PARSERS[TokenType.FALSE](self, self._prev)
6466        return self._parse_placeholder()
6467
6468    def _parse_star(self) -> t.Optional[exp.Expression]:
6469        if self._match(TokenType.STAR):
6470            return self.PRIMARY_PARSERS[TokenType.STAR](self, self._prev)
6471        return self._parse_placeholder()
6472
6473    def _parse_parameter(self) -> exp.Parameter:
6474        this = self._parse_identifier() or self._parse_primary_or_var()
6475        return self.expression(exp.Parameter, this=this)
6476
6477    def _parse_placeholder(self) -> t.Optional[exp.Expression]:
6478        if self._match_set(self.PLACEHOLDER_PARSERS):
6479            placeholder = self.PLACEHOLDER_PARSERS[self._prev.token_type](self)
6480            if placeholder:
6481                return placeholder
6482            self._advance(-1)
6483        return None
6484
6485    def _parse_star_op(self, *keywords: str) -> t.Optional[t.List[exp.Expression]]:
6486        if not self._match_texts(keywords):
6487            return None
6488        if self._match(TokenType.L_PAREN, advance=False):
6489            return self._parse_wrapped_csv(self._parse_expression)
6490
6491        expression = self._parse_expression()
6492        return [expression] if expression else None
6493
6494    def _parse_csv(
6495        self, parse_method: t.Callable, sep: TokenType = TokenType.COMMA
6496    ) -> t.List[exp.Expression]:
6497        parse_result = parse_method()
6498        items = [parse_result] if parse_result is not None else []
6499
6500        while self._match(sep):
6501            self._add_comments(parse_result)
6502            parse_result = parse_method()
6503            if parse_result is not None:
6504                items.append(parse_result)
6505
6506        return items
6507
6508    def _parse_tokens(
6509        self, parse_method: t.Callable, expressions: t.Dict
6510    ) -> t.Optional[exp.Expression]:
6511        this = parse_method()
6512
6513        while self._match_set(expressions):
6514            this = self.expression(
6515                expressions[self._prev.token_type],
6516                this=this,
6517                comments=self._prev_comments,
6518                expression=parse_method(),
6519            )
6520
6521        return this
6522
6523    def _parse_wrapped_id_vars(self, optional: bool = False) -> t.List[exp.Expression]:
6524        return self._parse_wrapped_csv(self._parse_id_var, optional=optional)
6525
6526    def _parse_wrapped_csv(
6527        self, parse_method: t.Callable, sep: TokenType = TokenType.COMMA, optional: bool = False
6528    ) -> t.List[exp.Expression]:
6529        return self._parse_wrapped(
6530            lambda: self._parse_csv(parse_method, sep=sep), optional=optional
6531        )
6532
6533    def _parse_wrapped(self, parse_method: t.Callable, optional: bool = False) -> t.Any:
6534        wrapped = self._match(TokenType.L_PAREN)
6535        if not wrapped and not optional:
6536            self.raise_error("Expecting (")
6537        parse_result = parse_method()
6538        if wrapped:
6539            self._match_r_paren()
6540        return parse_result
6541
6542    def _parse_expressions(self) -> t.List[exp.Expression]:
6543        return self._parse_csv(self._parse_expression)
6544
6545    def _parse_select_or_expression(self, alias: bool = False) -> t.Optional[exp.Expression]:
6546        return self._parse_select() or self._parse_set_operations(
6547            self._parse_expression() if alias else self._parse_assignment()
6548        )
6549
6550    def _parse_ddl_select(self) -> t.Optional[exp.Expression]:
6551        return self._parse_query_modifiers(
6552            self._parse_set_operations(self._parse_select(nested=True, parse_subquery_alias=False))
6553        )
6554
6555    def _parse_transaction(self) -> exp.Transaction | exp.Command:
6556        this = None
6557        if self._match_texts(self.TRANSACTION_KIND):
6558            this = self._prev.text
6559
6560        self._match_texts(("TRANSACTION", "WORK"))
6561
6562        modes = []
6563        while True:
6564            mode = []
6565            while self._match(TokenType.VAR):
6566                mode.append(self._prev.text)
6567
6568            if mode:
6569                modes.append(" ".join(mode))
6570            if not self._match(TokenType.COMMA):
6571                break
6572
6573        return self.expression(exp.Transaction, this=this, modes=modes)
6574
6575    def _parse_commit_or_rollback(self) -> exp.Commit | exp.Rollback:
6576        chain = None
6577        savepoint = None
6578        is_rollback = self._prev.token_type == TokenType.ROLLBACK
6579
6580        self._match_texts(("TRANSACTION", "WORK"))
6581
6582        if self._match_text_seq("TO"):
6583            self._match_text_seq("SAVEPOINT")
6584            savepoint = self._parse_id_var()
6585
6586        if self._match(TokenType.AND):
6587            chain = not self._match_text_seq("NO")
6588            self._match_text_seq("CHAIN")
6589
6590        if is_rollback:
6591            return self.expression(exp.Rollback, savepoint=savepoint)
6592
6593        return self.expression(exp.Commit, chain=chain)
6594
6595    def _parse_refresh(self) -> exp.Refresh:
6596        self._match(TokenType.TABLE)
6597        return self.expression(exp.Refresh, this=self._parse_string() or self._parse_table())
6598
6599    def _parse_add_column(self) -> t.Optional[exp.Expression]:
6600        if not self._match_text_seq("ADD"):
6601            return None
6602
6603        self._match(TokenType.COLUMN)
6604        exists_column = self._parse_exists(not_=True)
6605        expression = self._parse_field_def()
6606
6607        if expression:
6608            expression.set("exists", exists_column)
6609
6610            # https://docs.databricks.com/delta/update-schema.html#explicitly-update-schema-to-add-columns
6611            if self._match_texts(("FIRST", "AFTER")):
6612                position = self._prev.text
6613                column_position = self.expression(
6614                    exp.ColumnPosition, this=self._parse_column(), position=position
6615                )
6616                expression.set("position", column_position)
6617
6618        return expression
6619
6620    def _parse_drop_column(self) -> t.Optional[exp.Drop | exp.Command]:
6621        drop = self._match(TokenType.DROP) and self._parse_drop()
6622        if drop and not isinstance(drop, exp.Command):
6623            drop.set("kind", drop.args.get("kind", "COLUMN"))
6624        return drop
6625
6626    # https://docs.aws.amazon.com/athena/latest/ug/alter-table-drop-partition.html
6627    def _parse_drop_partition(self, exists: t.Optional[bool] = None) -> exp.DropPartition:
6628        return self.expression(
6629            exp.DropPartition, expressions=self._parse_csv(self._parse_partition), exists=exists
6630        )
6631
6632    def _parse_alter_table_add(self) -> t.List[exp.Expression]:
6633        index = self._index - 1
6634
6635        if self._match_set(self.ADD_CONSTRAINT_TOKENS, advance=False):
6636            return self._parse_csv(
6637                lambda: self.expression(
6638                    exp.AddConstraint, expressions=self._parse_csv(self._parse_constraint)
6639                )
6640            )
6641
6642        self._retreat(index)
6643        if not self.ALTER_TABLE_ADD_REQUIRED_FOR_EACH_COLUMN and self._match_text_seq("ADD"):
6644            return self._parse_wrapped_csv(self._parse_field_def, optional=True)
6645
6646        if self._match_text_seq("ADD", "COLUMNS"):
6647            schema = self._parse_schema()
6648            if schema:
6649                return [schema]
6650            return []
6651
6652        return self._parse_wrapped_csv(self._parse_add_column, optional=True)
6653
6654    def _parse_alter_table_alter(self) -> t.Optional[exp.Expression]:
6655        if self._match_texts(self.ALTER_ALTER_PARSERS):
6656            return self.ALTER_ALTER_PARSERS[self._prev.text.upper()](self)
6657
6658        # Many dialects support the ALTER [COLUMN] syntax, so if there is no
6659        # keyword after ALTER we default to parsing this statement
6660        self._match(TokenType.COLUMN)
6661        column = self._parse_field(any_token=True)
6662
6663        if self._match_pair(TokenType.DROP, TokenType.DEFAULT):
6664            return self.expression(exp.AlterColumn, this=column, drop=True)
6665        if self._match_pair(TokenType.SET, TokenType.DEFAULT):
6666            return self.expression(exp.AlterColumn, this=column, default=self._parse_assignment())
6667        if self._match(TokenType.COMMENT):
6668            return self.expression(exp.AlterColumn, this=column, comment=self._parse_string())
6669        if self._match_text_seq("DROP", "NOT", "NULL"):
6670            return self.expression(
6671                exp.AlterColumn,
6672                this=column,
6673                drop=True,
6674                allow_null=True,
6675            )
6676        if self._match_text_seq("SET", "NOT", "NULL"):
6677            return self.expression(
6678                exp.AlterColumn,
6679                this=column,
6680                allow_null=False,
6681            )
6682        self._match_text_seq("SET", "DATA")
6683        self._match_text_seq("TYPE")
6684        return self.expression(
6685            exp.AlterColumn,
6686            this=column,
6687            dtype=self._parse_types(),
6688            collate=self._match(TokenType.COLLATE) and self._parse_term(),
6689            using=self._match(TokenType.USING) and self._parse_assignment(),
6690        )
6691
6692    def _parse_alter_diststyle(self) -> exp.AlterDistStyle:
6693        if self._match_texts(("ALL", "EVEN", "AUTO")):
6694            return self.expression(exp.AlterDistStyle, this=exp.var(self._prev.text.upper()))
6695
6696        self._match_text_seq("KEY", "DISTKEY")
6697        return self.expression(exp.AlterDistStyle, this=self._parse_column())
6698
6699    def _parse_alter_sortkey(self, compound: t.Optional[bool] = None) -> exp.AlterSortKey:
6700        if compound:
6701            self._match_text_seq("SORTKEY")
6702
6703        if self._match(TokenType.L_PAREN, advance=False):
6704            return self.expression(
6705                exp.AlterSortKey, expressions=self._parse_wrapped_id_vars(), compound=compound
6706            )
6707
6708        self._match_texts(("AUTO", "NONE"))
6709        return self.expression(
6710            exp.AlterSortKey, this=exp.var(self._prev.text.upper()), compound=compound
6711        )
6712
6713    def _parse_alter_table_drop(self) -> t.List[exp.Expression]:
6714        index = self._index - 1
6715
6716        partition_exists = self._parse_exists()
6717        if self._match(TokenType.PARTITION, advance=False):
6718            return self._parse_csv(lambda: self._parse_drop_partition(exists=partition_exists))
6719
6720        self._retreat(index)
6721        return self._parse_csv(self._parse_drop_column)
6722
6723    def _parse_alter_table_rename(self) -> t.Optional[exp.RenameTable | exp.RenameColumn]:
6724        if self._match(TokenType.COLUMN):
6725            exists = self._parse_exists()
6726            old_column = self._parse_column()
6727            to = self._match_text_seq("TO")
6728            new_column = self._parse_column()
6729
6730            if old_column is None or to is None or new_column is None:
6731                return None
6732
6733            return self.expression(exp.RenameColumn, this=old_column, to=new_column, exists=exists)
6734
6735        self._match_text_seq("TO")
6736        return self.expression(exp.RenameTable, this=self._parse_table(schema=True))
6737
6738    def _parse_alter_table_set(self) -> exp.AlterSet:
6739        alter_set = self.expression(exp.AlterSet)
6740
6741        if self._match(TokenType.L_PAREN, advance=False) or self._match_text_seq(
6742            "TABLE", "PROPERTIES"
6743        ):
6744            alter_set.set("expressions", self._parse_wrapped_csv(self._parse_assignment))
6745        elif self._match_text_seq("FILESTREAM_ON", advance=False):
6746            alter_set.set("expressions", [self._parse_assignment()])
6747        elif self._match_texts(("LOGGED", "UNLOGGED")):
6748            alter_set.set("option", exp.var(self._prev.text.upper()))
6749        elif self._match_text_seq("WITHOUT") and self._match_texts(("CLUSTER", "OIDS")):
6750            alter_set.set("option", exp.var(f"WITHOUT {self._prev.text.upper()}"))
6751        elif self._match_text_seq("LOCATION"):
6752            alter_set.set("location", self._parse_field())
6753        elif self._match_text_seq("ACCESS", "METHOD"):
6754            alter_set.set("access_method", self._parse_field())
6755        elif self._match_text_seq("TABLESPACE"):
6756            alter_set.set("tablespace", self._parse_field())
6757        elif self._match_text_seq("FILE", "FORMAT") or self._match_text_seq("FILEFORMAT"):
6758            alter_set.set("file_format", [self._parse_field()])
6759        elif self._match_text_seq("STAGE_FILE_FORMAT"):
6760            alter_set.set("file_format", self._parse_wrapped_options())
6761        elif self._match_text_seq("STAGE_COPY_OPTIONS"):
6762            alter_set.set("copy_options", self._parse_wrapped_options())
6763        elif self._match_text_seq("TAG") or self._match_text_seq("TAGS"):
6764            alter_set.set("tag", self._parse_csv(self._parse_assignment))
6765        else:
6766            if self._match_text_seq("SERDE"):
6767                alter_set.set("serde", self._parse_field())
6768
6769            alter_set.set("expressions", [self._parse_properties()])
6770
6771        return alter_set
6772
6773    def _parse_alter(self) -> exp.Alter | exp.Command:
6774        start = self._prev
6775
6776        alter_token = self._match_set(self.ALTERABLES) and self._prev
6777        if not alter_token:
6778            return self._parse_as_command(start)
6779
6780        exists = self._parse_exists()
6781        only = self._match_text_seq("ONLY")
6782        this = self._parse_table(schema=True)
6783        cluster = self._parse_on_property() if self._match(TokenType.ON) else None
6784
6785        if self._next:
6786            self._advance()
6787
6788        parser = self.ALTER_PARSERS.get(self._prev.text.upper()) if self._prev else None
6789        if parser:
6790            actions = ensure_list(parser(self))
6791            not_valid = self._match_text_seq("NOT", "VALID")
6792            options = self._parse_csv(self._parse_property)
6793
6794            if not self._curr and actions:
6795                return self.expression(
6796                    exp.Alter,
6797                    this=this,
6798                    kind=alter_token.text.upper(),
6799                    exists=exists,
6800                    actions=actions,
6801                    only=only,
6802                    options=options,
6803                    cluster=cluster,
6804                    not_valid=not_valid,
6805                )
6806
6807        return self._parse_as_command(start)
6808
6809    def _parse_merge(self) -> exp.Merge:
6810        self._match(TokenType.INTO)
6811        target = self._parse_table()
6812
6813        if target and self._match(TokenType.ALIAS, advance=False):
6814            target.set("alias", self._parse_table_alias())
6815
6816        self._match(TokenType.USING)
6817        using = self._parse_table()
6818
6819        self._match(TokenType.ON)
6820        on = self._parse_assignment()
6821
6822        return self.expression(
6823            exp.Merge,
6824            this=target,
6825            using=using,
6826            on=on,
6827            expressions=self._parse_when_matched(),
6828        )
6829
6830    def _parse_when_matched(self) -> t.List[exp.When]:
6831        whens = []
6832
6833        while self._match(TokenType.WHEN):
6834            matched = not self._match(TokenType.NOT)
6835            self._match_text_seq("MATCHED")
6836            source = (
6837                False
6838                if self._match_text_seq("BY", "TARGET")
6839                else self._match_text_seq("BY", "SOURCE")
6840            )
6841            condition = self._parse_assignment() if self._match(TokenType.AND) else None
6842
6843            self._match(TokenType.THEN)
6844
6845            if self._match(TokenType.INSERT):
6846                _this = self._parse_star()
6847                if _this:
6848                    then: t.Optional[exp.Expression] = self.expression(exp.Insert, this=_this)
6849                else:
6850                    then = self.expression(
6851                        exp.Insert,
6852                        this=self._parse_value(),
6853                        expression=self._match_text_seq("VALUES") and self._parse_value(),
6854                    )
6855            elif self._match(TokenType.UPDATE):
6856                expressions = self._parse_star()
6857                if expressions:
6858                    then = self.expression(exp.Update, expressions=expressions)
6859                else:
6860                    then = self.expression(
6861                        exp.Update,
6862                        expressions=self._match(TokenType.SET)
6863                        and self._parse_csv(self._parse_equality),
6864                    )
6865            elif self._match(TokenType.DELETE):
6866                then = self.expression(exp.Var, this=self._prev.text)
6867            else:
6868                then = None
6869
6870            whens.append(
6871                self.expression(
6872                    exp.When,
6873                    matched=matched,
6874                    source=source,
6875                    condition=condition,
6876                    then=then,
6877                )
6878            )
6879        return whens
6880
6881    def _parse_show(self) -> t.Optional[exp.Expression]:
6882        parser = self._find_parser(self.SHOW_PARSERS, self.SHOW_TRIE)
6883        if parser:
6884            return parser(self)
6885        return self._parse_as_command(self._prev)
6886
6887    def _parse_set_item_assignment(
6888        self, kind: t.Optional[str] = None
6889    ) -> t.Optional[exp.Expression]:
6890        index = self._index
6891
6892        if kind in ("GLOBAL", "SESSION") and self._match_text_seq("TRANSACTION"):
6893            return self._parse_set_transaction(global_=kind == "GLOBAL")
6894
6895        left = self._parse_primary() or self._parse_column()
6896        assignment_delimiter = self._match_texts(("=", "TO"))
6897
6898        if not left or (self.SET_REQUIRES_ASSIGNMENT_DELIMITER and not assignment_delimiter):
6899            self._retreat(index)
6900            return None
6901
6902        right = self._parse_statement() or self._parse_id_var()
6903        if isinstance(right, (exp.Column, exp.Identifier)):
6904            right = exp.var(right.name)
6905
6906        this = self.expression(exp.EQ, this=left, expression=right)
6907        return self.expression(exp.SetItem, this=this, kind=kind)
6908
6909    def _parse_set_transaction(self, global_: bool = False) -> exp.Expression:
6910        self._match_text_seq("TRANSACTION")
6911        characteristics = self._parse_csv(
6912            lambda: self._parse_var_from_options(self.TRANSACTION_CHARACTERISTICS)
6913        )
6914        return self.expression(
6915            exp.SetItem,
6916            expressions=characteristics,
6917            kind="TRANSACTION",
6918            **{"global": global_},  # type: ignore
6919        )
6920
6921    def _parse_set_item(self) -> t.Optional[exp.Expression]:
6922        parser = self._find_parser(self.SET_PARSERS, self.SET_TRIE)
6923        return parser(self) if parser else self._parse_set_item_assignment(kind=None)
6924
6925    def _parse_set(self, unset: bool = False, tag: bool = False) -> exp.Set | exp.Command:
6926        index = self._index
6927        set_ = self.expression(
6928            exp.Set, expressions=self._parse_csv(self._parse_set_item), unset=unset, tag=tag
6929        )
6930
6931        if self._curr:
6932            self._retreat(index)
6933            return self._parse_as_command(self._prev)
6934
6935        return set_
6936
6937    def _parse_var_from_options(
6938        self, options: OPTIONS_TYPE, raise_unmatched: bool = True
6939    ) -> t.Optional[exp.Var]:
6940        start = self._curr
6941        if not start:
6942            return None
6943
6944        option = start.text.upper()
6945        continuations = options.get(option)
6946
6947        index = self._index
6948        self._advance()
6949        for keywords in continuations or []:
6950            if isinstance(keywords, str):
6951                keywords = (keywords,)
6952
6953            if self._match_text_seq(*keywords):
6954                option = f"{option} {' '.join(keywords)}"
6955                break
6956        else:
6957            if continuations or continuations is None:
6958                if raise_unmatched:
6959                    self.raise_error(f"Unknown option {option}")
6960
6961                self._retreat(index)
6962                return None
6963
6964        return exp.var(option)
6965
6966    def _parse_as_command(self, start: Token) -> exp.Command:
6967        while self._curr:
6968            self._advance()
6969        text = self._find_sql(start, self._prev)
6970        size = len(start.text)
6971        self._warn_unsupported()
6972        return exp.Command(this=text[:size], expression=text[size:])
6973
6974    def _parse_dict_property(self, this: str) -> exp.DictProperty:
6975        settings = []
6976
6977        self._match_l_paren()
6978        kind = self._parse_id_var()
6979
6980        if self._match(TokenType.L_PAREN):
6981            while True:
6982                key = self._parse_id_var()
6983                value = self._parse_primary()
6984
6985                if not key and value is None:
6986                    break
6987                settings.append(self.expression(exp.DictSubProperty, this=key, value=value))
6988            self._match(TokenType.R_PAREN)
6989
6990        self._match_r_paren()
6991
6992        return self.expression(
6993            exp.DictProperty,
6994            this=this,
6995            kind=kind.this if kind else None,
6996            settings=settings,
6997        )
6998
6999    def _parse_dict_range(self, this: str) -> exp.DictRange:
7000        self._match_l_paren()
7001        has_min = self._match_text_seq("MIN")
7002        if has_min:
7003            min = self._parse_var() or self._parse_primary()
7004            self._match_text_seq("MAX")
7005            max = self._parse_var() or self._parse_primary()
7006        else:
7007            max = self._parse_var() or self._parse_primary()
7008            min = exp.Literal.number(0)
7009        self._match_r_paren()
7010        return self.expression(exp.DictRange, this=this, min=min, max=max)
7011
7012    def _parse_comprehension(
7013        self, this: t.Optional[exp.Expression]
7014    ) -> t.Optional[exp.Comprehension]:
7015        index = self._index
7016        expression = self._parse_column()
7017        if not self._match(TokenType.IN):
7018            self._retreat(index - 1)
7019            return None
7020        iterator = self._parse_column()
7021        condition = self._parse_assignment() if self._match_text_seq("IF") else None
7022        return self.expression(
7023            exp.Comprehension,
7024            this=this,
7025            expression=expression,
7026            iterator=iterator,
7027            condition=condition,
7028        )
7029
7030    def _parse_heredoc(self) -> t.Optional[exp.Heredoc]:
7031        if self._match(TokenType.HEREDOC_STRING):
7032            return self.expression(exp.Heredoc, this=self._prev.text)
7033
7034        if not self._match_text_seq("$"):
7035            return None
7036
7037        tags = ["$"]
7038        tag_text = None
7039
7040        if self._is_connected():
7041            self._advance()
7042            tags.append(self._prev.text.upper())
7043        else:
7044            self.raise_error("No closing $ found")
7045
7046        if tags[-1] != "$":
7047            if self._is_connected() and self._match_text_seq("$"):
7048                tag_text = tags[-1]
7049                tags.append("$")
7050            else:
7051                self.raise_error("No closing $ found")
7052
7053        heredoc_start = self._curr
7054
7055        while self._curr:
7056            if self._match_text_seq(*tags, advance=False):
7057                this = self._find_sql(heredoc_start, self._prev)
7058                self._advance(len(tags))
7059                return self.expression(exp.Heredoc, this=this, tag=tag_text)
7060
7061            self._advance()
7062
7063        self.raise_error(f"No closing {''.join(tags)} found")
7064        return None
7065
7066    def _find_parser(
7067        self, parsers: t.Dict[str, t.Callable], trie: t.Dict
7068    ) -> t.Optional[t.Callable]:
7069        if not self._curr:
7070            return None
7071
7072        index = self._index
7073        this = []
7074        while True:
7075            # The current token might be multiple words
7076            curr = self._curr.text.upper()
7077            key = curr.split(" ")
7078            this.append(curr)
7079
7080            self._advance()
7081            result, trie = in_trie(trie, key)
7082            if result == TrieResult.FAILED:
7083                break
7084
7085            if result == TrieResult.EXISTS:
7086                subparser = parsers[" ".join(this)]
7087                return subparser
7088
7089        self._retreat(index)
7090        return None
7091
7092    def _match(self, token_type, advance=True, expression=None):
7093        if not self._curr:
7094            return None
7095
7096        if self._curr.token_type == token_type:
7097            if advance:
7098                self._advance()
7099            self._add_comments(expression)
7100            return True
7101
7102        return None
7103
7104    def _match_set(self, types, advance=True):
7105        if not self._curr:
7106            return None
7107
7108        if self._curr.token_type in types:
7109            if advance:
7110                self._advance()
7111            return True
7112
7113        return None
7114
7115    def _match_pair(self, token_type_a, token_type_b, advance=True):
7116        if not self._curr or not self._next:
7117            return None
7118
7119        if self._curr.token_type == token_type_a and self._next.token_type == token_type_b:
7120            if advance:
7121                self._advance(2)
7122            return True
7123
7124        return None
7125
7126    def _match_l_paren(self, expression: t.Optional[exp.Expression] = None) -> None:
7127        if not self._match(TokenType.L_PAREN, expression=expression):
7128            self.raise_error("Expecting (")
7129
7130    def _match_r_paren(self, expression: t.Optional[exp.Expression] = None) -> None:
7131        if not self._match(TokenType.R_PAREN, expression=expression):
7132            self.raise_error("Expecting )")
7133
7134    def _match_texts(self, texts, advance=True):
7135        if (
7136            self._curr
7137            and self._curr.token_type != TokenType.STRING
7138            and self._curr.text.upper() in texts
7139        ):
7140            if advance:
7141                self._advance()
7142            return True
7143        return None
7144
7145    def _match_text_seq(self, *texts, advance=True):
7146        index = self._index
7147        for text in texts:
7148            if (
7149                self._curr
7150                and self._curr.token_type != TokenType.STRING
7151                and self._curr.text.upper() == text
7152            ):
7153                self._advance()
7154            else:
7155                self._retreat(index)
7156                return None
7157
7158        if not advance:
7159            self._retreat(index)
7160
7161        return True
7162
7163    def _replace_lambda(
7164        self, node: t.Optional[exp.Expression], expressions: t.List[exp.Expression]
7165    ) -> t.Optional[exp.Expression]:
7166        if not node:
7167            return node
7168
7169        lambda_types = {e.name: e.args.get("to") or False for e in expressions}
7170
7171        for column in node.find_all(exp.Column):
7172            typ = lambda_types.get(column.parts[0].name)
7173            if typ is not None:
7174                dot_or_id = column.to_dot() if column.table else column.this
7175
7176                if typ:
7177                    dot_or_id = self.expression(
7178                        exp.Cast,
7179                        this=dot_or_id,
7180                        to=typ,
7181                    )
7182
7183                parent = column.parent
7184
7185                while isinstance(parent, exp.Dot):
7186                    if not isinstance(parent.parent, exp.Dot):
7187                        parent.replace(dot_or_id)
7188                        break
7189                    parent = parent.parent
7190                else:
7191                    if column is node:
7192                        node = dot_or_id
7193                    else:
7194                        column.replace(dot_or_id)
7195        return node
7196
7197    def _parse_truncate_table(self) -> t.Optional[exp.TruncateTable] | exp.Expression:
7198        start = self._prev
7199
7200        # Not to be confused with TRUNCATE(number, decimals) function call
7201        if self._match(TokenType.L_PAREN):
7202            self._retreat(self._index - 2)
7203            return self._parse_function()
7204
7205        # Clickhouse supports TRUNCATE DATABASE as well
7206        is_database = self._match(TokenType.DATABASE)
7207
7208        self._match(TokenType.TABLE)
7209
7210        exists = self._parse_exists(not_=False)
7211
7212        expressions = self._parse_csv(
7213            lambda: self._parse_table(schema=True, is_db_reference=is_database)
7214        )
7215
7216        cluster = self._parse_on_property() if self._match(TokenType.ON) else None
7217
7218        if self._match_text_seq("RESTART", "IDENTITY"):
7219            identity = "RESTART"
7220        elif self._match_text_seq("CONTINUE", "IDENTITY"):
7221            identity = "CONTINUE"
7222        else:
7223            identity = None
7224
7225        if self._match_text_seq("CASCADE") or self._match_text_seq("RESTRICT"):
7226            option = self._prev.text
7227        else:
7228            option = None
7229
7230        partition = self._parse_partition()
7231
7232        # Fallback case
7233        if self._curr:
7234            return self._parse_as_command(start)
7235
7236        return self.expression(
7237            exp.TruncateTable,
7238            expressions=expressions,
7239            is_database=is_database,
7240            exists=exists,
7241            cluster=cluster,
7242            identity=identity,
7243            option=option,
7244            partition=partition,
7245        )
7246
7247    def _parse_with_operator(self) -> t.Optional[exp.Expression]:
7248        this = self._parse_ordered(self._parse_opclass)
7249
7250        if not self._match(TokenType.WITH):
7251            return this
7252
7253        op = self._parse_var(any_token=True)
7254
7255        return self.expression(exp.WithOperator, this=this, op=op)
7256
7257    def _parse_wrapped_options(self) -> t.List[t.Optional[exp.Expression]]:
7258        self._match(TokenType.EQ)
7259        self._match(TokenType.L_PAREN)
7260
7261        opts: t.List[t.Optional[exp.Expression]] = []
7262        while self._curr and not self._match(TokenType.R_PAREN):
7263            if self._match_text_seq("FORMAT_NAME", "="):
7264                # The FORMAT_NAME can be set to an identifier for Snowflake and T-SQL,
7265                # so we parse it separately to use _parse_field()
7266                prop = self.expression(
7267                    exp.Property, this=exp.var("FORMAT_NAME"), value=self._parse_field()
7268                )
7269                opts.append(prop)
7270            else:
7271                opts.append(self._parse_property())
7272
7273            self._match(TokenType.COMMA)
7274
7275        return opts
7276
7277    def _parse_copy_parameters(self) -> t.List[exp.CopyParameter]:
7278        sep = TokenType.COMMA if self.dialect.COPY_PARAMS_ARE_CSV else None
7279
7280        options = []
7281        while self._curr and not self._match(TokenType.R_PAREN, advance=False):
7282            option = self._parse_var(any_token=True)
7283            prev = self._prev.text.upper()
7284
7285            # Different dialects might separate options and values by white space, "=" and "AS"
7286            self._match(TokenType.EQ)
7287            self._match(TokenType.ALIAS)
7288
7289            param = self.expression(exp.CopyParameter, this=option)
7290
7291            if prev in self.COPY_INTO_VARLEN_OPTIONS and self._match(
7292                TokenType.L_PAREN, advance=False
7293            ):
7294                # Snowflake FILE_FORMAT case, Databricks COPY & FORMAT options
7295                param.set("expressions", self._parse_wrapped_options())
7296            elif prev == "FILE_FORMAT":
7297                # T-SQL's external file format case
7298                param.set("expression", self._parse_field())
7299            else:
7300                param.set("expression", self._parse_unquoted_field())
7301
7302            options.append(param)
7303            self._match(sep)
7304
7305        return options
7306
7307    def _parse_credentials(self) -> t.Optional[exp.Credentials]:
7308        expr = self.expression(exp.Credentials)
7309
7310        if self._match_text_seq("STORAGE_INTEGRATION", "="):
7311            expr.set("storage", self._parse_field())
7312        if self._match_text_seq("CREDENTIALS"):
7313            # Snowflake case: CREDENTIALS = (...), Redshift case: CREDENTIALS <string>
7314            creds = (
7315                self._parse_wrapped_options() if self._match(TokenType.EQ) else self._parse_field()
7316            )
7317            expr.set("credentials", creds)
7318        if self._match_text_seq("ENCRYPTION"):
7319            expr.set("encryption", self._parse_wrapped_options())
7320        if self._match_text_seq("IAM_ROLE"):
7321            expr.set("iam_role", self._parse_field())
7322        if self._match_text_seq("REGION"):
7323            expr.set("region", self._parse_field())
7324
7325        return expr
7326
7327    def _parse_file_location(self) -> t.Optional[exp.Expression]:
7328        return self._parse_field()
7329
7330    def _parse_copy(self) -> exp.Copy | exp.Command:
7331        start = self._prev
7332
7333        self._match(TokenType.INTO)
7334
7335        this = (
7336            self._parse_select(nested=True, parse_subquery_alias=False)
7337            if self._match(TokenType.L_PAREN, advance=False)
7338            else self._parse_table(schema=True)
7339        )
7340
7341        kind = self._match(TokenType.FROM) or not self._match_text_seq("TO")
7342
7343        files = self._parse_csv(self._parse_file_location)
7344        credentials = self._parse_credentials()
7345
7346        self._match_text_seq("WITH")
7347
7348        params = self._parse_wrapped(self._parse_copy_parameters, optional=True)
7349
7350        # Fallback case
7351        if self._curr:
7352            return self._parse_as_command(start)
7353
7354        return self.expression(
7355            exp.Copy,
7356            this=this,
7357            kind=kind,
7358            credentials=credentials,
7359            files=files,
7360            params=params,
7361        )
7362
7363    def _parse_normalize(self) -> exp.Normalize:
7364        return self.expression(
7365            exp.Normalize,
7366            this=self._parse_bitwise(),
7367            form=self._match(TokenType.COMMA) and self._parse_var(),
7368        )

logger = <Logger sqlglot (WARNING)>

OPTIONS_TYPE = typing.Dict[str, typing.Sequence[typing.Union[typing.Sequence[str], str]]]

def build_var_map(args: List) -> sqlglot.expressions.StarMap | sqlglot.expressions.VarMap: View Source

26def build_var_map(args: t.List) -> exp.StarMap | exp.VarMap:
27    if len(args) == 1 and args[0].is_star:
28        return exp.StarMap(this=args[0])
29
30    keys = []
31    values = []
32    for i in range(0, len(args), 2):
33        keys.append(args[i])
34        values.append(args[i + 1])
35
36    return exp.VarMap(keys=exp.array(*keys, copy=False), values=exp.array(*values, copy=False))

def build_like(args: List) -> sqlglot.expressions.Escape | sqlglot.expressions.Like: View Source

39def build_like(args: t.List) -> exp.Escape | exp.Like:
40    like = exp.Like(this=seq_get(args, 1), expression=seq_get(args, 0))
41    return exp.Escape(this=like, expression=seq_get(args, 2)) if len(args) > 2 else like

def binary_range_parser( expr_type: Type[sqlglot.expressions.Expression], reverse_args: bool = False) -> Callable[[Parser, Optional[sqlglot.expressions.Expression]], Optional[sqlglot.expressions.Expression]]: View Source

44def binary_range_parser(
45    expr_type: t.Type[exp.Expression], reverse_args: bool = False
46) -> t.Callable[[Parser, t.Optional[exp.Expression]], t.Optional[exp.Expression]]:
47    def _parse_binary_range(
48        self: Parser, this: t.Optional[exp.Expression]
49    ) -> t.Optional[exp.Expression]:
50        expression = self._parse_bitwise()
51        if reverse_args:
52            this, expression = expression, this
53        return self._parse_escape(self.expression(expr_type, this=this, expression=expression))
54
55    return _parse_binary_range

def build_logarithm( args: List, dialect: sqlglot.dialects.dialect.Dialect) -> sqlglot.expressions.Func: View Source

58def build_logarithm(args: t.List, dialect: Dialect) -> exp.Func:
59    # Default argument order is base, expression
60    this = seq_get(args, 0)
61    expression = seq_get(args, 1)
62
63    if expression:
64        if not dialect.LOG_BASE_FIRST:
65            this, expression = expression, this
66        return exp.Log(this=this, expression=expression)
67
68    return (exp.Ln if dialect.parser_class.LOG_DEFAULTS_TO_LN else exp.Log)(this=this)

def build_hex( args: List, dialect: sqlglot.dialects.dialect.Dialect) -> sqlglot.expressions.Hex | sqlglot.expressions.LowerHex: View Source

71def build_hex(args: t.List, dialect: Dialect) -> exp.Hex | exp.LowerHex:
72    arg = seq_get(args, 0)
73    return exp.LowerHex(this=arg) if dialect.HEX_LOWERCASE else exp.Hex(this=arg)

def build_lower(args: List) -> sqlglot.expressions.Lower | sqlglot.expressions.Hex: View Source

76def build_lower(args: t.List) -> exp.Lower | exp.Hex:
77    # LOWER(HEX(..)) can be simplified to LowerHex to simplify its transpilation
78    arg = seq_get(args, 0)
79    return exp.LowerHex(this=arg.this) if isinstance(arg, exp.Hex) else exp.Lower(this=arg)

def build_upper(args: List) -> sqlglot.expressions.Upper | sqlglot.expressions.Hex: View Source

82def build_upper(args: t.List) -> exp.Upper | exp.Hex:
83    # UPPER(HEX(..)) can be simplified to Hex to simplify its transpilation
84    arg = seq_get(args, 0)
85    return exp.Hex(this=arg.this) if isinstance(arg, exp.Hex) else exp.Upper(this=arg)

def build_extract_json_with_path( expr_type: Type[~E]) -> Callable[[List, sqlglot.dialects.dialect.Dialect], ~E]: View Source

88def build_extract_json_with_path(expr_type: t.Type[E]) -> t.Callable[[t.List, Dialect], E]:
89    def _builder(args: t.List, dialect: Dialect) -> E:
90        expression = expr_type(
91            this=seq_get(args, 0), expression=dialect.to_json_path(seq_get(args, 1))
92        )
93        if len(args) > 2 and expr_type is exp.JSONExtract:
94            expression.set("expressions", args[2:])
95
96        return expression
97
98    return _builder

def build_mod(args: List) -> sqlglot.expressions.Mod: View Source

101def build_mod(args: t.List) -> exp.Mod:
102    this = seq_get(args, 0)
103    expression = seq_get(args, 1)
104
105    # Wrap the operands if they are binary nodes, e.g. MOD(a + 1, 7) -> (a + 1) % 7
106    this = exp.Paren(this=this) if isinstance(this, exp.Binary) else this
107    expression = exp.Paren(this=expression) if isinstance(expression, exp.Binary) else expression
108
109    return exp.Mod(this=this, expression=expression)

def build_pad(args: List, is_left: bool = True): View Source

112def build_pad(args: t.List, is_left: bool = True):
113    return exp.Pad(
114        this=seq_get(args, 0),
115        expression=seq_get(args, 1),
116        fill_pattern=seq_get(args, 2),
117        is_left=is_left,
118    )

def build_array_constructor( exp_class: Type[~E], args: List, bracket_kind: sqlglot.tokens.TokenType, dialect: sqlglot.dialects.dialect.Dialect) -> sqlglot.expressions.Expression: View Source

121def build_array_constructor(
122    exp_class: t.Type[E], args: t.List, bracket_kind: TokenType, dialect: Dialect
123) -> exp.Expression:
124    array_exp = exp_class(expressions=args)
125
126    if exp_class == exp.Array and dialect.HAS_DISTINCT_ARRAY_CONSTRUCTORS:
127        array_exp.set("bracket_notation", bracket_kind == TokenType.L_BRACKET)
128
129    return array_exp

def build_convert_timezone( args: List, default_source_tz: Optional[str] = None) -> Union[sqlglot.expressions.ConvertTimezone, sqlglot.expressions.Anonymous]: View Source

132def build_convert_timezone(
133    args: t.List, default_source_tz: t.Optional[str] = None
134) -> t.Union[exp.ConvertTimezone, exp.Anonymous]:
135    if len(args) == 2:
136        source_tz = exp.Literal.string(default_source_tz) if default_source_tz else None
137        return exp.ConvertTimezone(
138            source_tz=source_tz, target_tz=seq_get(args, 0), timestamp=seq_get(args, 1)
139        )
140
141    return exp.ConvertTimezone.from_arg_list(args)

def build_trim(args: List, is_left: bool = True): View Source

144def build_trim(args: t.List, is_left: bool = True):
145    return exp.Trim(
146        this=seq_get(args, 0),
147        expression=seq_get(args, 1),
148        position="LEADING" if is_left else "TRAILING",
149    )

def build_coalesce( args: List, is_nvl: Optional[bool] = None) -> sqlglot.expressions.Coalesce: View Source

152def build_coalesce(args: t.List, is_nvl: t.Optional[bool] = None) -> exp.Coalesce:
153    return exp.Coalesce(this=seq_get(args, 0), expressions=args[1:], is_nvl=is_nvl)

sqlglot.parser

Arguments:

Arguments:

Returns:

Arguments:

Returns:

Arguments:

Returns:

Arguments:

Returns: