Merging upstream version 20.9.0.

Signed-off-by: Daniel Baumann <daniel@debian.org>
2025-02-13 21:19:14 +01:00 · 2025-02-13 21:19:14 +01:00 · 37a231f554
commit 37a231f554
parent 9421b254ec
144 changed files with 78309 additions and 59609 deletions
--- a/sqlglot/parser.py
+++ b/sqlglot/parser.py
@ -12,6 +12,8 @@ from sqlglot.tokens import Token, Tokenizer, TokenType
 from sqlglot.trie import TrieResult, in_trie, new_trie

 if t.TYPE_CHECKING:
+    from typing_extensions import Literal
+
    from sqlglot._typing import E
    from sqlglot.dialects.dialect import Dialect, DialectType

@ -193,6 +195,7 @@ class Parser(metaclass=_Parser):
        TokenType.DATETIME,
        TokenType.DATETIME64,
        TokenType.DATE,
+        TokenType.DATE32,
        TokenType.INT4RANGE,
        TokenType.INT4MULTIRANGE,
        TokenType.INT8RANGE,
@ -232,6 +235,8 @@ class Parser(metaclass=_Parser):
        TokenType.INET,
        TokenType.IPADDRESS,
        TokenType.IPPREFIX,
+        TokenType.IPV4,
+        TokenType.IPV6,
        TokenType.UNKNOWN,
        TokenType.NULL,
        *ENUM_TYPE_TOKENS,
@ -669,6 +674,7 @@ class Parser(metaclass=_Parser):

    PROPERTY_PARSERS: t.Dict[str, t.Callable] = {
        "ALGORITHM": lambda self: self._parse_property_assignment(exp.AlgorithmProperty),
+        "AUTO": lambda self: self._parse_auto_property(),
        "AUTO_INCREMENT": lambda self: self._parse_property_assignment(exp.AutoIncrementProperty),
        "BLOCKCOMPRESSION": lambda self: self._parse_blockcompression(),
        "CHARSET": lambda self, **kwargs: self._parse_character_set(**kwargs),
@ -680,6 +686,7 @@ class Parser(metaclass=_Parser):
            exp.CollateProperty, **kwargs
        ),
        "COMMENT": lambda self: self._parse_property_assignment(exp.SchemaCommentProperty),
+        "CONTAINS": lambda self: self._parse_contains_property(),
        "COPY": lambda self: self._parse_copy_property(),
        "DATABLOCKSIZE": lambda self, **kwargs: self._parse_datablocksize(**kwargs),
        "DEFINER": lambda self: self._parse_definer(),
@ -710,6 +717,7 @@ class Parser(metaclass=_Parser):
        "LOG": lambda self, **kwargs: self._parse_log(**kwargs),
        "MATERIALIZED": lambda self: self.expression(exp.MaterializedProperty),
        "MERGEBLOCKRATIO": lambda self, **kwargs: self._parse_mergeblockratio(**kwargs),
+        "MODIFIES": lambda self: self._parse_modifies_property(),
        "MULTISET": lambda self: self.expression(exp.SetProperty, multi=True),
        "NO": lambda self: self._parse_no_property(),
        "ON": lambda self: self._parse_on_property(),
@ -721,6 +729,7 @@ class Parser(metaclass=_Parser):
        "PARTITIONED_BY": lambda self: self._parse_partitioned_by(),
        "PRIMARY KEY": lambda self: self._parse_primary_key(in_props=True),
        "RANGE": lambda self: self._parse_dict_range(this="RANGE"),
+        "READS": lambda self: self._parse_reads_property(),
        "REMOTE": lambda self: self._parse_remote_with_connection(),
        "RETURNS": lambda self: self._parse_returns(),
        "ROW": lambda self: self._parse_row(),
@ -841,6 +850,7 @@ class Parser(metaclass=_Parser):
        "DECODE": lambda self: self._parse_decode(),
        "EXTRACT": lambda self: self._parse_extract(),
        "JSON_OBJECT": lambda self: self._parse_json_object(),
+        "JSON_OBJECTAGG": lambda self: self._parse_json_object(agg=True),
        "JSON_TABLE": lambda self: self._parse_json_table(),
        "MATCH": lambda self: self._parse_match_against(),
        "OPENJSON": lambda self: self._parse_open_json(),
@ -925,6 +935,8 @@ class Parser(metaclass=_Parser):
    WINDOW_BEFORE_PAREN_TOKENS = {TokenType.OVER}
    WINDOW_SIDES = {"FOLLOWING", "PRECEDING"}

+    JSON_KEY_VALUE_SEPARATOR_TOKENS = {TokenType.COLON, TokenType.COMMA, TokenType.IS}
+
    FETCH_TOKENS = ID_VAR_TOKENS - {TokenType.ROW, TokenType.ROWS, TokenType.PERCENT}

    ADD_CONSTRAINT_TOKENS = {TokenType.CONSTRAINT, TokenType.PRIMARY_KEY, TokenType.FOREIGN_KEY}
@ -954,6 +966,9 @@ class Parser(metaclass=_Parser):
    # Whether the TRIM function expects the characters to trim as its first argument
    TRIM_PATTERN_FIRST = False

+    # Whether or not string aliases are supported `SELECT COUNT(*) 'count'`
+    STRING_ALIASES = False
+
    # Whether query modifiers such as LIMIT are attached to the UNION node (vs its right operand)
    MODIFIERS_ATTACHED_TO_UNION = True
    UNION_MODIFIERS = {"order", "limit", "offset"}
@ -1193,7 +1208,9 @@ class Parser(metaclass=_Parser):
            self._advance(index - self._index)

    def _parse_command(self) -> exp.Command:
-        return self.expression(exp.Command, this=self._prev.text, expression=self._parse_string())
+        return self.expression(
+            exp.Command, this=self._prev.text.upper(), expression=self._parse_string()
+        )

    def _parse_comment(self, allow_exists: bool = True) -> exp.Expression:
        start = self._prev
@ -1353,26 +1370,27 @@ class Parser(metaclass=_Parser):
            # exp.Properties.Location.POST_SCHEMA ("schema" here is the UDF's type signature)
            extend_props(self._parse_properties())

-            self._match(TokenType.ALIAS)
+            expression = self._match(TokenType.ALIAS) and self._parse_heredoc()

-            if self._match(TokenType.COMMAND):
-                expression = self._parse_as_command(self._prev)
-            else:
-                begin = self._match(TokenType.BEGIN)
-                return_ = self._match_text_seq("RETURN")
-
-                if self._match(TokenType.STRING, advance=False):
-                    # Takes care of BigQuery's JavaScript UDF definitions that end in an OPTIONS property
-                    # # https://cloud.google.com/bigquery/docs/reference/standard-sql/data-definition-language#create_function_statement
-                    expression = self._parse_string()
-                    extend_props(self._parse_properties())
+            if not expression:
+                if self._match(TokenType.COMMAND):
+                    expression = self._parse_as_command(self._prev)
                else:
-                    expression = self._parse_statement()
+                    begin = self._match(TokenType.BEGIN)
+                    return_ = self._match_text_seq("RETURN")

-                end = self._match_text_seq("END")
+                    if self._match(TokenType.STRING, advance=False):
+                        # Takes care of BigQuery's JavaScript UDF definitions that end in an OPTIONS property
+                        # # https://cloud.google.com/bigquery/docs/reference/standard-sql/data-definition-language#create_function_statement
+                        expression = self._parse_string()
+                        extend_props(self._parse_properties())
+                    else:
+                        expression = self._parse_statement()

-                if return_:
-                    expression = self.expression(exp.Return, this=expression)
+                    end = self._match_text_seq("END")
+
+                    if return_:
+                        expression = self.expression(exp.Return, this=expression)
        elif create_token.token_type == TokenType.INDEX:
            this = self._parse_index(index=self._parse_id_var())
        elif create_token.token_type in self.DB_CREATABLES:
@ -1426,7 +1444,7 @@ class Parser(metaclass=_Parser):
            exp.Create,
            comments=comments,
            this=this,
-            kind=create_token.text,
+            kind=create_token.text.upper(),
            replace=replace,
            unique=unique,
            expression=expression,
@ -1849,9 +1867,21 @@ class Parser(metaclass=_Parser):

        return self.expression(exp.WithDataProperty, no=no, statistics=statistics)

-    def _parse_no_property(self) -> t.Optional[exp.NoPrimaryIndexProperty]:
+    def _parse_contains_property(self) -> t.Optional[exp.SqlReadWriteProperty]:
+        if self._match_text_seq("SQL"):
+            return self.expression(exp.SqlReadWriteProperty, this="CONTAINS SQL")
+        return None
+
+    def _parse_modifies_property(self) -> t.Optional[exp.SqlReadWriteProperty]:
+        if self._match_text_seq("SQL", "DATA"):
+            return self.expression(exp.SqlReadWriteProperty, this="MODIFIES SQL DATA")
+        return None
+
+    def _parse_no_property(self) -> t.Optional[exp.Expression]:
        if self._match_text_seq("PRIMARY", "INDEX"):
            return exp.NoPrimaryIndexProperty()
+        if self._match_text_seq("SQL"):
+            return self.expression(exp.SqlReadWriteProperty, this="NO SQL")
        return None

    def _parse_on_property(self) -> t.Optional[exp.Expression]:
@ -1861,6 +1891,11 @@ class Parser(metaclass=_Parser):
            return exp.OnCommitProperty(delete=True)
        return self.expression(exp.OnProperty, this=self._parse_schema(self._parse_id_var()))

+    def _parse_reads_property(self) -> t.Optional[exp.SqlReadWriteProperty]:
+        if self._match_text_seq("SQL", "DATA"):
+            return self.expression(exp.SqlReadWriteProperty, this="READS SQL DATA")
+        return None
+
    def _parse_distkey(self) -> exp.DistKeyProperty:
        return self.expression(exp.DistKeyProperty, this=self._parse_wrapped(self._parse_id_var))

@ -1920,10 +1955,13 @@ class Parser(metaclass=_Parser):

    def _parse_describe(self) -> exp.Describe:
        kind = self._match_set(self.CREATABLES) and self._prev.text
+        extended = self._match_text_seq("EXTENDED")
        this = self._parse_table(schema=True)
        properties = self._parse_properties()
        expressions = properties.expressions if properties else None
-        return self.expression(exp.Describe, this=this, kind=kind, expressions=expressions)
+        return self.expression(
+            exp.Describe, this=this, extended=extended, kind=kind, expressions=expressions
+        )

    def _parse_insert(self) -> exp.Insert:
        comments = ensure_list(self._prev_comments)
@ -2164,13 +2202,13 @@ class Parser(metaclass=_Parser):

    def _parse_value(self) -> exp.Tuple:
        if self._match(TokenType.L_PAREN):
-            expressions = self._parse_csv(self._parse_conjunction)
+            expressions = self._parse_csv(self._parse_expression)
            self._match_r_paren()
            return self.expression(exp.Tuple, expressions=expressions)

        # In presto we can have VALUES 1, 2 which results in 1 column & 2 rows.
        # https://prestodb.io/docs/current/sql/values.html
-        return self.expression(exp.Tuple, expressions=[self._parse_conjunction()])
+        return self.expression(exp.Tuple, expressions=[self._parse_expression()])

    def _parse_projections(self) -> t.List[exp.Expression]:
        return self._parse_expressions()
@ -2212,7 +2250,7 @@ class Parser(metaclass=_Parser):
            kind = (
                self._match(TokenType.ALIAS)
                and self._match_texts(("STRUCT", "VALUE"))
-                and self._prev.text
+                and self._prev.text.upper()
            )

            if distinct:
@ -2261,7 +2299,7 @@ class Parser(metaclass=_Parser):
                    if table
                    else self._parse_select(nested=True, parse_set_operation=False)
                )
-                this = self._parse_set_operations(self._parse_query_modifiers(this))
+                this = self._parse_query_modifiers(self._parse_set_operations(this))

            self._match_r_paren()

@ -2304,7 +2342,7 @@ class Parser(metaclass=_Parser):
        )

    def _parse_cte(self) -> exp.CTE:
-        alias = self._parse_table_alias()
+        alias = self._parse_table_alias(self.ID_VAR_TOKENS)
        if not alias or not alias.this:
            self.raise_error("Expected CTE to have alias")

@ -2490,13 +2528,14 @@ class Parser(metaclass=_Parser):
        )

    def _parse_lateral(self) -> t.Optional[exp.Lateral]:
-        outer_apply = self._match_pair(TokenType.OUTER, TokenType.APPLY)
        cross_apply = self._match_pair(TokenType.CROSS, TokenType.APPLY)
+        if not cross_apply and self._match_pair(TokenType.OUTER, TokenType.APPLY):
+            cross_apply = False

-        if outer_apply or cross_apply:
+        if cross_apply is not None:
            this = self._parse_select(table=True)
            view = None
-            outer = not cross_apply
+            outer = None
        elif self._match(TokenType.LATERAL):
            this = self._parse_select(table=True)
            view = self._match(TokenType.VIEW)
@ -2529,7 +2568,14 @@ class Parser(metaclass=_Parser):
        else:
            table_alias = self._parse_table_alias()

-        return self.expression(exp.Lateral, this=this, view=view, outer=outer, alias=table_alias)
+        return self.expression(
+            exp.Lateral,
+            this=this,
+            view=view,
+            outer=outer,
+            alias=table_alias,
+            cross_apply=cross_apply,
+        )

    def _parse_join_parts(
        self,
@ -2563,9 +2609,6 @@ class Parser(metaclass=_Parser):
        if not skip_join_token and not join and not outer_apply and not cross_apply:
            return None

-        if outer_apply:
-            side = Token(TokenType.LEFT, "LEFT")
-
        kwargs: t.Dict[str, t.Any] = {"this": self._parse_table(parse_bracket=parse_bracket)}

        if method:
@ -2755,8 +2798,10 @@ class Parser(metaclass=_Parser):
        if alias:
            this.set("alias", alias)

-        if self._match_text_seq("AT"):
-            this.set("index", self._parse_id_var())
+        if isinstance(this, exp.Table) and self._match_text_seq("AT"):
+            return self.expression(
+                exp.AtIndex, this=this.to_column(copy=False), expression=self._parse_id_var()
+            )

        this.set("hints", self._parse_table_hints())

@ -2865,15 +2910,10 @@ class Parser(metaclass=_Parser):
        bucket_denominator = None
        bucket_field = None
        percent = None
-        rows = None
        size = None
        seed = None

-        kind = (
-            self._prev.text if self._prev.token_type == TokenType.TABLE_SAMPLE else "USING SAMPLE"
-        )
-        method = self._parse_var(tokens=(TokenType.ROW,))
-
+        method = self._parse_var(tokens=(TokenType.ROW,), upper=True)
        matched_l_paren = self._match(TokenType.L_PAREN)

        if self.TABLESAMPLE_CSV:
@ -2895,16 +2935,16 @@ class Parser(metaclass=_Parser):
            bucket_field = self._parse_field()
        elif self._match_set((TokenType.PERCENT, TokenType.MOD)):
            percent = num
-        elif self._match(TokenType.ROWS):
-            rows = num
-        elif num:
+        elif self._match(TokenType.ROWS) or not self.dialect.TABLESAMPLE_SIZE_IS_PERCENT:
            size = num
+        else:
+            percent = num

        if matched_l_paren:
            self._match_r_paren()

        if self._match(TokenType.L_PAREN):
-            method = self._parse_var()
+            method = self._parse_var(upper=True)
            seed = self._match(TokenType.COMMA) and self._parse_number()
            self._match_r_paren()
        elif self._match_texts(("SEED", "REPEATABLE")):
@ -2918,10 +2958,8 @@ class Parser(metaclass=_Parser):
            bucket_denominator=bucket_denominator,
            bucket_field=bucket_field,
            percent=percent,
-            rows=rows,
            size=size,
            seed=seed,
-            kind=kind,
        )

    def _parse_pivots(self) -> t.Optional[t.List[exp.Pivot]]:
@ -2946,6 +2984,27 @@ class Parser(metaclass=_Parser):
            exp.Pivot, this=this, expressions=expressions, using=using, group=group
        )

+    def _parse_pivot_in(self) -> exp.In:
+        def _parse_aliased_expression() -> t.Optional[exp.Expression]:
+            this = self._parse_conjunction()
+
+            self._match(TokenType.ALIAS)
+            alias = self._parse_field()
+            if alias:
+                return self.expression(exp.PivotAlias, this=this, alias=alias)
+
+            return this
+
+        value = self._parse_column()
+
+        if not self._match_pair(TokenType.IN, TokenType.L_PAREN):
+            self.raise_error("Expecting IN (")
+
+        aliased_expressions = self._parse_csv(_parse_aliased_expression)
+
+        self._match_r_paren()
+        return self.expression(exp.In, this=value, expressions=aliased_expressions)
+
    def _parse_pivot(self) -> t.Optional[exp.Pivot]:
        index = self._index
        include_nulls = None
@ -2964,7 +3023,6 @@ class Parser(metaclass=_Parser):
            return None

        expressions = []
-        field = None

        if not self._match(TokenType.L_PAREN):
            self._retreat(index)
@ -2981,12 +3039,7 @@ class Parser(metaclass=_Parser):
        if not self._match(TokenType.FOR):
            self.raise_error("Expecting FOR")

-        value = self._parse_column()
-
-        if not self._match(TokenType.IN):
-            self.raise_error("Expecting IN")
-
-        field = self._parse_in(value, alias=True)
+        field = self._parse_pivot_in()

        self._match_r_paren()

@ -3132,14 +3185,19 @@ class Parser(metaclass=_Parser):
    def _parse_order(
        self, this: t.Optional[exp.Expression] = None, skip_order_token: bool = False
    ) -> t.Optional[exp.Expression]:
+        siblings = None
        if not skip_order_token and not self._match(TokenType.ORDER_BY):
-            return this
+            if not self._match(TokenType.ORDER_SIBLINGS_BY):
+                return this
+
+            siblings = True

        return self.expression(
            exp.Order,
            this=this,
            expressions=self._parse_csv(self._parse_ordered),
            interpolate=self._parse_interpolate(),
+            siblings=siblings,
        )

    def _parse_sort(self, exp_class: t.Type[E], token: TokenType) -> t.Optional[E]:
@ -3213,7 +3271,7 @@ class Parser(metaclass=_Parser):

        if self._match(TokenType.FETCH):
            direction = self._match_set((TokenType.FIRST, TokenType.NEXT))
-            direction = self._prev.text if direction else "FIRST"
+            direction = self._prev.text.upper() if direction else "FIRST"

            count = self._parse_field(tokens=self.FETCH_TOKENS)
            percent = self._match(TokenType.PERCENT)
@ -3398,10 +3456,10 @@ class Parser(metaclass=_Parser):
            return this
        return self.expression(exp.Escape, this=this, expression=self._parse_string())

-    def _parse_interval(self) -> t.Optional[exp.Interval]:
+    def _parse_interval(self, match_interval: bool = True) -> t.Optional[exp.Interval]:
        index = self._index

-        if not self._match(TokenType.INTERVAL):
+        if not self._match(TokenType.INTERVAL) and match_interval:
            return None

        if self._match(TokenType.STRING, advance=False):
@ -3409,11 +3467,19 @@ class Parser(metaclass=_Parser):
        else:
            this = self._parse_term()

-        if not this:
+        if not this or (
+            isinstance(this, exp.Column)
+            and not this.table
+            and not this.this.quoted
+            and this.name.upper() == "IS"
+        ):
            self._retreat(index)
            return None

-        unit = self._parse_function() or self._parse_var(any_token=True)
+        unit = self._parse_function() or (
+            not self._match(TokenType.ALIAS, advance=False)
+            and self._parse_var(any_token=True, upper=True)
+        )

        # Most dialects support, e.g., the form INTERVAL '5' day, thus we try to parse
        # each INTERVAL expression into this canonical form so it's easy to transpile
@ -3429,7 +3495,7 @@ class Parser(metaclass=_Parser):
                    self._retreat(self._index - 1)

                this = exp.Literal.string(parts[0])
-                unit = self.expression(exp.Var, this=parts[1])
+                unit = self.expression(exp.Var, this=parts[1].upper())

        return self.expression(exp.Interval, this=this, unit=unit)

@ -3489,6 +3555,12 @@ class Parser(metaclass=_Parser):
    def _parse_type(self, parse_interval: bool = True) -> t.Optional[exp.Expression]:
        interval = parse_interval and self._parse_interval()
        if interval:
+            # Convert INTERVAL 'val_1' unit_1 ... 'val_n' unit_n into a sum of intervals
+            while self._match_set((TokenType.STRING, TokenType.NUMBER), advance=False):
+                interval = self.expression(  # type: ignore
+                    exp.Add, this=interval, expression=self._parse_interval(match_interval=False)
+                )
+
            return interval

        index = self._index
@ -3552,10 +3624,10 @@ class Parser(metaclass=_Parser):
        type_token = self._prev.token_type

        if type_token == TokenType.PSEUDO_TYPE:
-            return self.expression(exp.PseudoType, this=self._prev.text)
+            return self.expression(exp.PseudoType, this=self._prev.text.upper())

        if type_token == TokenType.OBJECT_IDENTIFIER:
-            return self.expression(exp.ObjectIdentifier, this=self._prev.text)
+            return self.expression(exp.ObjectIdentifier, this=self._prev.text.upper())

        nested = type_token in self.NESTED_TYPE_TOKENS
        is_struct = type_token in self.STRUCT_TYPE_TOKENS
@ -3587,7 +3659,7 @@ class Parser(metaclass=_Parser):

        if nested and self._match(TokenType.LT):
            if is_struct:
-                expressions = self._parse_csv(self._parse_struct_types)
+                expressions = self._parse_csv(lambda: self._parse_struct_types(type_required=True))
            else:
                expressions = self._parse_csv(
                    lambda: self._parse_types(
@ -3662,10 +3734,19 @@ class Parser(metaclass=_Parser):

        return this

-    def _parse_struct_types(self) -> t.Optional[exp.Expression]:
+    def _parse_struct_types(self, type_required: bool = False) -> t.Optional[exp.Expression]:
+        index = self._index
        this = self._parse_type(parse_interval=False) or self._parse_id_var()
        self._match(TokenType.COLON)
-        return self._parse_column_def(this)
+        column_def = self._parse_column_def(this)
+
+        if type_required and (
+            (isinstance(this, exp.Column) and this.this is column_def) or this is column_def
+        ):
+            self._retreat(index)
+            return self._parse_types()
+
+        return column_def

    def _parse_at_time_zone(self, this: t.Optional[exp.Expression]) -> t.Optional[exp.Expression]:
        if not self._match_text_seq("AT", "TIME", "ZONE"):
@ -4025,6 +4106,12 @@ class Parser(metaclass=_Parser):

        return exp.AutoIncrementColumnConstraint()

+    def _parse_auto_property(self) -> t.Optional[exp.AutoRefreshProperty]:
+        if not self._match_text_seq("REFRESH"):
+            self._retreat(self._index - 1)
+            return None
+        return self.expression(exp.AutoRefreshProperty, this=self._parse_var(upper=True))
+
    def _parse_compress(self) -> exp.CompressColumnConstraint:
        if self._match(TokenType.L_PAREN, advance=False):
            return self.expression(
@ -4230,8 +4317,10 @@ class Parser(metaclass=_Parser):
    def _parse_primary_key_part(self) -> t.Optional[exp.Expression]:
        return self._parse_field()

-    def _parse_period_for_system_time(self) -> exp.PeriodForSystemTimeConstraint:
-        self._match(TokenType.TIMESTAMP_SNAPSHOT)
+    def _parse_period_for_system_time(self) -> t.Optional[exp.PeriodForSystemTimeConstraint]:
+        if not self._match(TokenType.TIMESTAMP_SNAPSHOT):
+            self._retreat(self._index - 1)
+            return None

        id_vars = self._parse_wrapped_id_vars()
        return self.expression(
@ -4257,22 +4346,17 @@ class Parser(metaclass=_Parser):
        options = self._parse_key_constraint_options()
        return self.expression(exp.PrimaryKey, expressions=expressions, options=options)

+    def _parse_bracket_key_value(self, is_map: bool = False) -> t.Optional[exp.Expression]:
+        return self._parse_slice(self._parse_alias(self._parse_conjunction(), explicit=True))
+
    def _parse_bracket(self, this: t.Optional[exp.Expression]) -> t.Optional[exp.Expression]:
        if not self._match_set((TokenType.L_BRACKET, TokenType.L_BRACE)):
            return this

        bracket_kind = self._prev.token_type
-
-        if self._match(TokenType.COLON):
-            expressions: t.List[exp.Expression] = [
-                self.expression(exp.Slice, expression=self._parse_conjunction())
-            ]
-        else:
-            expressions = self._parse_csv(
-                lambda: self._parse_slice(
-                    self._parse_alias(self._parse_conjunction(), explicit=True)
-                )
-            )
+        expressions = self._parse_csv(
+            lambda: self._parse_bracket_key_value(is_map=bracket_kind == TokenType.L_BRACE)
+        )

        if not self._match(TokenType.R_BRACKET) and bracket_kind == TokenType.L_BRACKET:
            self.raise_error("Expected ]")
@ -4313,7 +4397,10 @@ class Parser(metaclass=_Parser):
            default = self._parse_conjunction()

        if not self._match(TokenType.END):
-            self.raise_error("Expected END after CASE", self._prev)
+            if isinstance(default, exp.Interval) and default.this.sql().upper() == "END":
+                default = exp.column("interval")
+            else:
+                self.raise_error("Expected END after CASE", self._prev)

        return self._parse_window(
            self.expression(exp.Case, comments=comments, this=expression, ifs=ifs, default=default)
@ -4514,7 +4601,7 @@ class Parser(metaclass=_Parser):
    def _parse_json_key_value(self) -> t.Optional[exp.JSONKeyValue]:
        self._match_text_seq("KEY")
        key = self._parse_column()
-        self._match_set((TokenType.COLON, TokenType.COMMA))
+        self._match_set(self.JSON_KEY_VALUE_SEPARATOR_TOKENS)
        self._match_text_seq("VALUE")
        value = self._parse_bitwise()

@ -4536,7 +4623,15 @@ class Parser(metaclass=_Parser):

        return None

-    def _parse_json_object(self) -> exp.JSONObject:
+    @t.overload
+    def _parse_json_object(self, agg: Literal[False]) -> exp.JSONObject:
+        ...
+
+    @t.overload
+    def _parse_json_object(self, agg: Literal[True]) -> exp.JSONObjectAgg:
+        ...
+
+    def _parse_json_object(self, agg=False):
        star = self._parse_star()
        expressions = (
            [star]
@ -4559,7 +4654,7 @@ class Parser(metaclass=_Parser):
        encoding = self._match_text_seq("ENCODING") and self._parse_var()

        return self.expression(
-            exp.JSONObject,
+            exp.JSONObjectAgg if agg else exp.JSONObject,
            expressions=expressions,
            null_handling=null_handling,
            unique_keys=unique_keys,
@ -4873,10 +4968,17 @@ class Parser(metaclass=_Parser):
            self._match_r_paren(aliases)
            return aliases

-        alias = self._parse_id_var(any_token)
+        alias = self._parse_id_var(any_token) or (
+            self.STRING_ALIASES and self._parse_string_as_identifier()
+        )

        if alias:
-            return self.expression(exp.Alias, comments=comments, this=this, alias=alias)
+            this = self.expression(exp.Alias, comments=comments, this=this, alias=alias)
+
+            # Moves the comment next to the alias in `expr /* comment */ AS alias`
+            if not this.comments and this.this.comments:
+                this.comments = this.this.comments
+                this.this.comments = None

        return this

@ -4915,14 +5017,19 @@ class Parser(metaclass=_Parser):
        return self._parse_placeholder()

    def _parse_var(
-        self, any_token: bool = False, tokens: t.Optional[t.Collection[TokenType]] = None
+        self,
+        any_token: bool = False,
+        tokens: t.Optional[t.Collection[TokenType]] = None,
+        upper: bool = False,
    ) -> t.Optional[exp.Expression]:
        if (
            (any_token and self._advance_any())
            or self._match(TokenType.VAR)
            or (self._match_set(tokens) if tokens else False)
        ):
-            return self.expression(exp.Var, this=self._prev.text)
+            return self.expression(
+                exp.Var, this=self._prev.text.upper() if upper else self._prev.text
+            )
        return self._parse_placeholder()

    def _advance_any(self, ignore_reserved: bool = False) -> t.Optional[Token]:
@ -5418,6 +5525,42 @@ class Parser(metaclass=_Parser):
            condition=condition,
        )

+    def _parse_heredoc(self) -> t.Optional[exp.Heredoc]:
+        if self._match(TokenType.HEREDOC_STRING):
+            return self.expression(exp.Heredoc, this=self._prev.text)
+
+        if not self._match_text_seq("$"):
+            return None
+
+        tags = ["$"]
+        tag_text = None
+
+        if self._is_connected():
+            self._advance()
+            tags.append(self._prev.text.upper())
+        else:
+            self.raise_error("No closing $ found")
+
+        if tags[-1] != "$":
+            if self._is_connected() and self._match_text_seq("$"):
+                tag_text = tags[-1]
+                tags.append("$")
+            else:
+                self.raise_error("No closing $ found")
+
+        heredoc_start = self._curr
+
+        while self._curr:
+            if self._match_text_seq(*tags, advance=False):
+                this = self._find_sql(heredoc_start, self._prev)
+                self._advance(len(tags))
+                return self.expression(exp.Heredoc, this=this, tag=tag_text)
+
+            self._advance()
+
+        self.raise_error(f"No closing {''.join(tags)} found")
+        return None
+
    def _find_parser(
        self, parsers: t.Dict[str, t.Callable], trie: t.Dict
    ) -> t.Optional[t.Callable]: