sqlglot/tests/dialects/test_duckdb.py

from sqlglot import ErrorLevel, UnsupportedError, transpile
from tests.dialects.test_dialect import Validator


class TestDuckDB(Validator):
    dialect = "duckdb"

    def test_time(self):
        self.validate_all(
            "EPOCH(x)",
            read={
                "presto": "TO_UNIXTIME(x)",
            },
            write={
                "bigquery": "TIME_TO_UNIX(x)",
                "duckdb": "EPOCH(x)",
                "presto": "TO_UNIXTIME(x)",
                "spark": "UNIX_TIMESTAMP(x)",
            },
        )
        self.validate_all(
            "EPOCH_MS(x)",
            write={
                "bigquery": "UNIX_TO_TIME(x / 1000)",
                "duckdb": "TO_TIMESTAMP(x / 1000)",
                "presto": "FROM_UNIXTIME(x / 1000)",
                "spark": "FROM_UNIXTIME(x / 1000)",
            },
        )
        self.validate_all(
            "STRFTIME(x, '%y-%-m-%S')",
            write={
                "bigquery": "TIME_TO_STR(x, '%y-%-m-%S')",
                "duckdb": "STRFTIME(x, '%y-%-m-%S')",
                "postgres": "TO_CHAR(x, 'YY-FMMM-SS')",
                "presto": "DATE_FORMAT(x, '%y-%c-%S')",
                "spark": "DATE_FORMAT(x, 'yy-M-ss')",
            },
        )
        self.validate_all(
            "STRFTIME(x, '%Y-%m-%d %H:%M:%S')",
            write={
                "duckdb": "STRFTIME(x, '%Y-%m-%d %H:%M:%S')",
                "presto": "DATE_FORMAT(x, '%Y-%m-%d %T')",
                "hive": "DATE_FORMAT(x, 'yyyy-MM-dd HH:mm:ss')",
            },
        )
        self.validate_all(
            "STRPTIME(x, '%y-%-m')",
            write={
                "bigquery": "PARSE_TIMESTAMP('%y-%m', x)",
                "duckdb": "STRPTIME(x, '%y-%-m')",
                "presto": "DATE_PARSE(x, '%y-%c')",
                "hive": "CAST(FROM_UNIXTIME(UNIX_TIMESTAMP(x, 'yy-M')) AS TIMESTAMP)",
                "spark": "TO_TIMESTAMP(x, 'yy-M')",
            },
        )
        self.validate_all(
            "TO_TIMESTAMP(x)",
            write={
                "bigquery": "UNIX_TO_TIME(x)",
                "duckdb": "TO_TIMESTAMP(x)",
                "presto": "FROM_UNIXTIME(x)",
                "hive": "FROM_UNIXTIME(x)",
            },
        )
        self.validate_all(
            "STRPTIME(x, '%-m/%-d/%y %-I:%M %p')",
            write={
                "bigquery": "PARSE_TIMESTAMP('%m/%d/%y %I:%M %p', x)",
                "duckdb": "STRPTIME(x, '%-m/%-d/%y %-I:%M %p')",
                "presto": "DATE_PARSE(x, '%c/%e/%y %l:%i %p')",
                "hive": "CAST(FROM_UNIXTIME(UNIX_TIMESTAMP(x, 'M/d/yy h:mm a')) AS TIMESTAMP)",
                "spark": "TO_TIMESTAMP(x, 'M/d/yy h:mm a')",
            },
        )

    def test_duckdb(self):
        self.validate_identity("SELECT {'a': 1} AS x")
        self.validate_identity("SELECT {'a': {'b': {'c': 1}}, 'd': {'e': 2}} AS x")
        self.validate_identity("SELECT {'x': 1, 'y': 2, 'z': 3}")
        self.validate_identity(
            "SELECT {'yes': 'duck', 'maybe': 'goose', 'huh': NULL, 'no': 'heron'}"
        )
        self.validate_identity("SELECT {'key1': 'string', 'key2': 1, 'key3': 12.345}")
        self.validate_identity("SELECT ROW(x, x + 1, y) FROM (SELECT 1 AS x, 'a' AS y)")
        self.validate_identity("SELECT (x, x + 1, y) FROM (SELECT 1 AS x, 'a' AS y)")
        self.validate_identity("SELECT a.x FROM (SELECT {'x': 1, 'y': 2, 'z': 3} AS a)")
        self.validate_identity(
            "SELECT a['x space'] FROM (SELECT {'x space': 1, 'y': 2, 'z': 3} AS a)"
        )
        self.validate_all(
            "CREATE TABLE IF NOT EXISTS table (cola INT, colb STRING) USING ICEBERG PARTITIONED BY (colb)",
            write={
                "duckdb": "CREATE TABLE IF NOT EXISTS table (cola INT, colb TEXT)",
            },
        )

        self.validate_all(
            "COL::BIGINT[]",
            write={
                "duckdb": "CAST(COL AS BIGINT[])",
                "presto": "CAST(COL AS ARRAY(BIGINT))",
                "hive": "CAST(COL AS ARRAY<BIGINT>)",
                "spark": "CAST(COL AS ARRAY<LONG>)",
                "postgres": "CAST(COL AS BIGINT[])",
                "snowflake": "CAST(COL AS ARRAY)",
            },
        )

        self.validate_all(
            "LIST_VALUE(0, 1, 2)",
            read={
                "spark": "ARRAY(0, 1, 2)",
            },
            write={
                "bigquery": "[0, 1, 2]",
                "duckdb": "LIST_VALUE(0, 1, 2)",
                "presto": "ARRAY[0, 1, 2]",
                "spark": "ARRAY(0, 1, 2)",
            },
        )
        self.validate_all(
            "SELECT ARRAY_LENGTH([0], 1) AS x",
            write={"duckdb": "SELECT ARRAY_LENGTH(LIST_VALUE(0), 1) AS x"},
        )
        self.validate_all(
            "REGEXP_MATCHES(x, y)",
            write={
                "duckdb": "REGEXP_MATCHES(x, y)",
                "presto": "REGEXP_LIKE(x, y)",
                "hive": "x RLIKE y",
                "spark": "x RLIKE y",
            },
        )
        self.validate_all(
            "STR_SPLIT(x, 'a')",
            write={
                "duckdb": "STR_SPLIT(x, 'a')",
                "presto": "SPLIT(x, 'a')",
                "hive": "SPLIT(x, CONCAT('\\\\Q', 'a'))",
                "spark": "SPLIT(x, CONCAT('\\\\Q', 'a'))",
            },
        )
        self.validate_all(
            "STRING_TO_ARRAY(x, 'a')",
            write={
                "duckdb": "STR_SPLIT(x, 'a')",
                "presto": "SPLIT(x, 'a')",
                "hive": "SPLIT(x, CONCAT('\\\\Q', 'a'))",
                "spark": "SPLIT(x, CONCAT('\\\\Q', 'a'))",
            },
        )
        self.validate_all(
            "STR_SPLIT_REGEX(x, 'a')",
            write={
                "duckdb": "STR_SPLIT_REGEX(x, 'a')",
                "presto": "REGEXP_SPLIT(x, 'a')",
                "hive": "SPLIT(x, 'a')",
                "spark": "SPLIT(x, 'a')",
            },
        )
        self.validate_all(
            "STRUCT_EXTRACT(x, 'abc')",
            write={
                "duckdb": "STRUCT_EXTRACT(x, 'abc')",
                "presto": 'x."abc"',
                "hive": "x.`abc`",
                "spark": "x.`abc`",
            },
        )
        self.validate_all(
            "STRUCT_EXTRACT(STRUCT_EXTRACT(x, 'y'), 'abc')",
            write={
                "duckdb": "STRUCT_EXTRACT(STRUCT_EXTRACT(x, 'y'), 'abc')",
                "presto": 'x."y"."abc"',
                "hive": "x.`y`.`abc`",
                "spark": "x.`y`.`abc`",
            },
        )

        self.validate_all(
            "QUANTILE(x, 0.5)",
            write={
                "duckdb": "QUANTILE(x, 0.5)",
                "presto": "APPROX_PERCENTILE(x, 0.5)",
                "hive": "PERCENTILE(x, 0.5)",
                "spark": "PERCENTILE(x, 0.5)",
            },
        )

        self.validate_all(
            "CAST(x AS DATE)",
            write={
                "duckdb": "CAST(x AS DATE)",
                "": "CAST(x AS DATE)",
            },
        )
        self.validate_all(
            "UNNEST(x)",
            read={
                "spark": "EXPLODE(x)",
            },
            write={
                "duckdb": "UNNEST(x)",
                "spark": "EXPLODE(x)",
            },
        )

        self.validate_all(
            "1d",
            write={
                "duckdb": "1 AS d",
                "spark": "1 AS d",
            },
        )
        self.validate_all(
            "CAST(1 AS DOUBLE)",
            read={
                "hive": "1d",
                "spark": "1d",
            },
        )
        self.validate_all(
            "POWER(CAST(2 AS SMALLINT), 3)",
            read={
                "hive": "POW(2S, 3)",
                "spark": "POW(2S, 3)",
            },
        )
        self.validate_all(
            "LIST_SUM(LIST_VALUE(1, 2))",
            read={
                "spark": "ARRAY_SUM(ARRAY(1, 2))",
            },
        )
        self.validate_all(
            "IF(y <> 0, x / y, NULL)",
            read={
                "bigquery": "SAFE_DIVIDE(x, y)",
            },
        )
        self.validate_all(
            "STRUCT_PACK(x := 1, y := '2')",
            write={
                "duckdb": "{'x': 1, 'y': '2'}",
                "spark": "STRUCT(x = 1, y = '2')",
            },
        )
        self.validate_all(
            "STRUCT_PACK(key1 := 'value1', key2 := 42)",
            write={
                "duckdb": "{'key1': 'value1', 'key2': 42}",
                "spark": "STRUCT(key1 = 'value1', key2 = 42)",
            },
        )
        self.validate_all(
            "ARRAY_SORT(x)",
            write={
                "duckdb": "ARRAY_SORT(x)",
                "presto": "ARRAY_SORT(x)",
                "hive": "SORT_ARRAY(x)",
                "spark": "SORT_ARRAY(x)",
            },
        )
        self.validate_all(
            "ARRAY_REVERSE_SORT(x)",
            write={
                "duckdb": "ARRAY_REVERSE_SORT(x)",
                "presto": "ARRAY_SORT(x, (a, b) -> CASE WHEN a < b THEN 1 WHEN a > b THEN -1 ELSE 0 END)",
                "hive": "SORT_ARRAY(x, FALSE)",
                "spark": "SORT_ARRAY(x, FALSE)",
            },
        )
        self.validate_all(
            "LIST_REVERSE_SORT(x)",
            write={
                "duckdb": "ARRAY_REVERSE_SORT(x)",
                "presto": "ARRAY_SORT(x, (a, b) -> CASE WHEN a < b THEN 1 WHEN a > b THEN -1 ELSE 0 END)",
                "hive": "SORT_ARRAY(x, FALSE)",
                "spark": "SORT_ARRAY(x, FALSE)",
            },
        )
        self.validate_all(
            "LIST_SORT(x)",
            write={
                "duckdb": "ARRAY_SORT(x)",
                "presto": "ARRAY_SORT(x)",
                "hive": "SORT_ARRAY(x)",
                "spark": "SORT_ARRAY(x)",
            },
        )
        self.validate_all(
            "SELECT fname, lname, age FROM person ORDER BY age DESC NULLS FIRST, fname ASC NULLS LAST, lname",
            write={
                "duckdb": "SELECT fname, lname, age FROM person ORDER BY age DESC NULLS FIRST, fname NULLS LAST, lname",
            },
        )
        self.validate_all(
            "MONTH('2021-03-01')",
            write={
                "duckdb": "MONTH('2021-03-01')",
                "presto": "MONTH('2021-03-01')",
                "hive": "MONTH('2021-03-01')",
                "spark": "MONTH('2021-03-01')",
            },
        )
        self.validate_all(
            "ARRAY_CONCAT(LIST_VALUE(1, 2), LIST_VALUE(3, 4))",
            write={
                "duckdb": "ARRAY_CONCAT(LIST_VALUE(1, 2), LIST_VALUE(3, 4))",
                "presto": "CONCAT(ARRAY[1, 2], ARRAY[3, 4])",
                "hive": "CONCAT(ARRAY(1, 2), ARRAY(3, 4))",
                "spark": "CONCAT(ARRAY(1, 2), ARRAY(3, 4))",
                "snowflake": "ARRAY_CAT([1, 2], [3, 4])",
                "bigquery": "ARRAY_CONCAT([1, 2], [3, 4])",
            },
        )

        self.validate_identity("ATTACH DATABASE ':memory:' AS new_database")

        with self.assertRaises(UnsupportedError):
            transpile(
                "SELECT a FROM b PIVOT(SUM(x) FOR y IN ('z', 'q'))",
                read="duckdb",
                unsupported_level=ErrorLevel.IMMEDIATE,
            )

        with self.assertRaises(UnsupportedError):
            transpile(
                "SELECT REGEXP_EXTRACT(a, 'pattern', 1) from table",
                read="bigquery",
                write="duckdb",
                unsupported_level=ErrorLevel.IMMEDIATE,
            )

    def test_array(self):
        self.validate_identity("ARRAY(SELECT id FROM t)")

    def test_cast(self):
        self.validate_all(
            "123::CHARACTER VARYING",
            write={
                "duckdb": "CAST(123 AS TEXT)",
            },
        )

        self.validate_all(
            "cast([[1]] as int[][])",
            write={
                "duckdb": "CAST(LIST_VALUE(LIST_VALUE(1)) AS INT[][])",
                "spark": "CAST(ARRAY(ARRAY(1)) AS ARRAY<ARRAY<INT>>)",
            },
        )

        self.validate_all(
            "CAST(x AS DATE) + INTERVAL (7 * -1) DAY", read={"spark": "DATE_SUB(x, 7)"}
        )

    def test_bool_or(self):
        self.validate_all(
            "SELECT a, LOGICAL_OR(b) FROM table GROUP BY a",
            write={"duckdb": "SELECT a, BOOL_OR(b) FROM table GROUP BY a"},
        )
Adding upstream version 6.2.6. Signed-off-by: Daniel Baumann <daniel@debian.org> 2025-02-13 14:37:25 +01:00			`from sqlglot import ErrorLevel, UnsupportedError, transpile`
Adding upstream version 6.0.4. Signed-off-by: Daniel Baumann <daniel@debian.org> 2025-02-13 06:15:54 +01:00			`from tests.dialects.test_dialect import Validator`


			`class TestDuckDB(Validator):`
			`dialect = "duckdb"`

			`def test_time(self):`
			`self.validate_all(`
			`"EPOCH(x)",`
			`read={`
			`"presto": "TO_UNIXTIME(x)",`
			`},`
			`write={`
			`"bigquery": "TIME_TO_UNIX(x)",`
			`"duckdb": "EPOCH(x)",`
			`"presto": "TO_UNIXTIME(x)",`
			`"spark": "UNIX_TIMESTAMP(x)",`
			`},`
			`)`
			`self.validate_all(`
			`"EPOCH_MS(x)",`
			`write={`
			`"bigquery": "UNIX_TO_TIME(x / 1000)",`
Adding upstream version 10.6.3. Signed-off-by: Daniel Baumann <daniel@debian.org> 2025-02-13 15:09:11 +01:00			`"duckdb": "TO_TIMESTAMP(x / 1000)",`
Adding upstream version 6.0.4. Signed-off-by: Daniel Baumann <daniel@debian.org> 2025-02-13 06:15:54 +01:00			`"presto": "FROM_UNIXTIME(x / 1000)",`
			`"spark": "FROM_UNIXTIME(x / 1000)",`
			`},`
			`)`
			`self.validate_all(`
			`"STRFTIME(x, '%y-%-m-%S')",`
			`write={`
			`"bigquery": "TIME_TO_STR(x, '%y-%-m-%S')",`
			`"duckdb": "STRFTIME(x, '%y-%-m-%S')",`
			`"postgres": "TO_CHAR(x, 'YY-FMMM-SS')",`
			`"presto": "DATE_FORMAT(x, '%y-%c-%S')",`
			`"spark": "DATE_FORMAT(x, 'yy-M-ss')",`
			`},`
			`)`
			`self.validate_all(`
			`"STRFTIME(x, '%Y-%m-%d %H:%M:%S')",`
			`write={`
			`"duckdb": "STRFTIME(x, '%Y-%m-%d %H:%M:%S')",`
Adding upstream version 10.6.3. Signed-off-by: Daniel Baumann <daniel@debian.org> 2025-02-13 15:09:11 +01:00			`"presto": "DATE_FORMAT(x, '%Y-%m-%d %T')",`
Adding upstream version 6.0.4. Signed-off-by: Daniel Baumann <daniel@debian.org> 2025-02-13 06:15:54 +01:00			`"hive": "DATE_FORMAT(x, 'yyyy-MM-dd HH:mm:ss')",`
			`},`
			`)`
			`self.validate_all(`
			`"STRPTIME(x, '%y-%-m')",`
			`write={`
Adding upstream version 9.0.1. Signed-off-by: Daniel Baumann <daniel@debian.org> 2025-02-13 14:47:39 +01:00			`"bigquery": "PARSE_TIMESTAMP('%y-%m', x)",`
Adding upstream version 6.0.4. Signed-off-by: Daniel Baumann <daniel@debian.org> 2025-02-13 06:15:54 +01:00			`"duckdb": "STRPTIME(x, '%y-%-m')",`
			`"presto": "DATE_PARSE(x, '%y-%c')",`
			`"hive": "CAST(FROM_UNIXTIME(UNIX_TIMESTAMP(x, 'yy-M')) AS TIMESTAMP)",`
			`"spark": "TO_TIMESTAMP(x, 'yy-M')",`
			`},`
			`)`
			`self.validate_all(`
			`"TO_TIMESTAMP(x)",`
			`write={`
Adding upstream version 10.6.3. Signed-off-by: Daniel Baumann <daniel@debian.org> 2025-02-13 15:09:11 +01:00			`"bigquery": "UNIX_TO_TIME(x)",`
			`"duckdb": "TO_TIMESTAMP(x)",`
			`"presto": "FROM_UNIXTIME(x)",`
			`"hive": "FROM_UNIXTIME(x)",`
Adding upstream version 6.0.4. Signed-off-by: Daniel Baumann <daniel@debian.org> 2025-02-13 06:15:54 +01:00			`},`
			`)`
Adding upstream version 9.0.1. Signed-off-by: Daniel Baumann <daniel@debian.org> 2025-02-13 14:47:39 +01:00			`self.validate_all(`
			`"STRPTIME(x, '%-m/%-d/%y %-I:%M %p')",`
			`write={`
			`"bigquery": "PARSE_TIMESTAMP('%m/%d/%y %I:%M %p', x)",`
			`"duckdb": "STRPTIME(x, '%-m/%-d/%y %-I:%M %p')",`
			`"presto": "DATE_PARSE(x, '%c/%e/%y %l:%i %p')",`
			`"hive": "CAST(FROM_UNIXTIME(UNIX_TIMESTAMP(x, 'M/d/yy h:mm a')) AS TIMESTAMP)",`
			`"spark": "TO_TIMESTAMP(x, 'M/d/yy h:mm a')",`
			`},`
			`)`
Adding upstream version 6.0.4. Signed-off-by: Daniel Baumann <daniel@debian.org> 2025-02-13 06:15:54 +01:00
			`def test_duckdb(self):`
Adding upstream version 10.6.0. Signed-off-by: Daniel Baumann <daniel@debian.org> 2025-02-13 15:07:44 +01:00			`self.validate_identity("SELECT {'a': 1} AS x")`
			`self.validate_identity("SELECT {'a': {'b': {'c': 1}}, 'd': {'e': 2}} AS x")`
			`self.validate_identity("SELECT {'x': 1, 'y': 2, 'z': 3}")`
			`self.validate_identity(`
			`"SELECT {'yes': 'duck', 'maybe': 'goose', 'huh': NULL, 'no': 'heron'}"`
			`)`
			`self.validate_identity("SELECT {'key1': 'string', 'key2': 1, 'key3': 12.345}")`
			`self.validate_identity("SELECT ROW(x, x + 1, y) FROM (SELECT 1 AS x, 'a' AS y)")`
			`self.validate_identity("SELECT (x, x + 1, y) FROM (SELECT 1 AS x, 'a' AS y)")`
			`self.validate_identity("SELECT a.x FROM (SELECT {'x': 1, 'y': 2, 'z': 3} AS a)")`
			`self.validate_identity(`
			`"SELECT a['x space'] FROM (SELECT {'x space': 1, 'y': 2, 'z': 3} AS a)"`
			`)`
Adding upstream version 7.1.3. Signed-off-by: Daniel Baumann <daniel@debian.org> 2025-02-13 14:46:14 +01:00			`self.validate_all(`
			`"CREATE TABLE IF NOT EXISTS table (cola INT, colb STRING) USING ICEBERG PARTITIONED BY (colb)",`
			`write={`
			`"duckdb": "CREATE TABLE IF NOT EXISTS table (cola INT, colb TEXT)",`
			`},`
			`)`

			`self.validate_all(`
			`"COL::BIGINT[]",`
			`write={`
			`"duckdb": "CAST(COL AS BIGINT[])",`
			`"presto": "CAST(COL AS ARRAY(BIGINT))",`
			`"hive": "CAST(COL AS ARRAY<BIGINT>)",`
			`"spark": "CAST(COL AS ARRAY<LONG>)",`
Adding upstream version 10.1.3. Signed-off-by: Daniel Baumann <daniel@debian.org> 2025-02-13 14:55:11 +01:00			`"postgres": "CAST(COL AS BIGINT[])",`
			`"snowflake": "CAST(COL AS ARRAY)",`
Adding upstream version 7.1.3. Signed-off-by: Daniel Baumann <daniel@debian.org> 2025-02-13 14:46:14 +01:00			`},`
			`)`

Adding upstream version 6.0.4. Signed-off-by: Daniel Baumann <daniel@debian.org> 2025-02-13 06:15:54 +01:00			`self.validate_all(`
			`"LIST_VALUE(0, 1, 2)",`
Adding upstream version 6.2.0. Signed-off-by: Daniel Baumann <daniel@debian.org> 2025-02-13 14:30:50 +01:00			`read={`
			`"spark": "ARRAY(0, 1, 2)",`
			`},`
Adding upstream version 6.0.4. Signed-off-by: Daniel Baumann <daniel@debian.org> 2025-02-13 06:15:54 +01:00			`write={`
			`"bigquery": "[0, 1, 2]",`
			`"duckdb": "LIST_VALUE(0, 1, 2)",`
			`"presto": "ARRAY[0, 1, 2]",`
			`"spark": "ARRAY(0, 1, 2)",`
			`},`
			`)`
Adding upstream version 10.1.3. Signed-off-by: Daniel Baumann <daniel@debian.org> 2025-02-13 14:55:11 +01:00			`self.validate_all(`
			`"SELECT ARRAY_LENGTH([0], 1) AS x",`
			`write={"duckdb": "SELECT ARRAY_LENGTH(LIST_VALUE(0), 1) AS x"},`
			`)`
Adding upstream version 6.0.4. Signed-off-by: Daniel Baumann <daniel@debian.org> 2025-02-13 06:15:54 +01:00			`self.validate_all(`
			`"REGEXP_MATCHES(x, y)",`
			`write={`
			`"duckdb": "REGEXP_MATCHES(x, y)",`
			`"presto": "REGEXP_LIKE(x, y)",`
			`"hive": "x RLIKE y",`
			`"spark": "x RLIKE y",`
			`},`
			`)`
			`self.validate_all(`
			`"STR_SPLIT(x, 'a')",`
			`write={`
			`"duckdb": "STR_SPLIT(x, 'a')",`
			`"presto": "SPLIT(x, 'a')",`
			`"hive": "SPLIT(x, CONCAT('\\\\Q', 'a'))",`
			`"spark": "SPLIT(x, CONCAT('\\\\Q', 'a'))",`
			`},`
			`)`
			`self.validate_all(`
			`"STRING_TO_ARRAY(x, 'a')",`
			`write={`
			`"duckdb": "STR_SPLIT(x, 'a')",`
			`"presto": "SPLIT(x, 'a')",`
			`"hive": "SPLIT(x, CONCAT('\\\\Q', 'a'))",`
			`"spark": "SPLIT(x, CONCAT('\\\\Q', 'a'))",`
			`},`
			`)`
			`self.validate_all(`
			`"STR_SPLIT_REGEX(x, 'a')",`
			`write={`
			`"duckdb": "STR_SPLIT_REGEX(x, 'a')",`
			`"presto": "REGEXP_SPLIT(x, 'a')",`
			`"hive": "SPLIT(x, 'a')",`
			`"spark": "SPLIT(x, 'a')",`
			`},`
			`)`
			`self.validate_all(`
			`"STRUCT_EXTRACT(x, 'abc')",`
			`write={`
			`"duckdb": "STRUCT_EXTRACT(x, 'abc')",`
			`"presto": 'x."abc"',`
			"hive": "x.`abc`",
			"spark": "x.`abc`",
			`},`
			`)`
			`self.validate_all(`
			`"STRUCT_EXTRACT(STRUCT_EXTRACT(x, 'y'), 'abc')",`
			`write={`
			`"duckdb": "STRUCT_EXTRACT(STRUCT_EXTRACT(x, 'y'), 'abc')",`
			`"presto": 'x."y"."abc"',`
			"hive": "x.`y`.`abc`",
			"spark": "x.`y`.`abc`",
			`},`
			`)`

			`self.validate_all(`
			`"QUANTILE(x, 0.5)",`
			`write={`
			`"duckdb": "QUANTILE(x, 0.5)",`
			`"presto": "APPROX_PERCENTILE(x, 0.5)",`
			`"hive": "PERCENTILE(x, 0.5)",`
			`"spark": "PERCENTILE(x, 0.5)",`
			`},`
			`)`

			`self.validate_all(`
			`"CAST(x AS DATE)",`
			`write={`
			`"duckdb": "CAST(x AS DATE)",`
			`"": "CAST(x AS DATE)",`
			`},`
			`)`
			`self.validate_all(`
			`"UNNEST(x)",`
			`read={`
			`"spark": "EXPLODE(x)",`
			`},`
			`write={`
			`"duckdb": "UNNEST(x)",`
			`"spark": "EXPLODE(x)",`
			`},`
			`)`

			`self.validate_all(`
			`"1d",`
			`write={`
			`"duckdb": "1 AS d",`
			`"spark": "1 AS d",`
			`},`
			`)`
			`self.validate_all(`
			`"CAST(1 AS DOUBLE)",`
			`read={`
			`"hive": "1d",`
			`"spark": "1d",`
			`},`
			`)`
			`self.validate_all(`
			`"POWER(CAST(2 AS SMALLINT), 3)",`
			`read={`
			`"hive": "POW(2S, 3)",`
			`"spark": "POW(2S, 3)",`
			`},`
			`)`
			`self.validate_all(`
			`"LIST_SUM(LIST_VALUE(1, 2))",`
			`read={`
			`"spark": "ARRAY_SUM(ARRAY(1, 2))",`
			`},`
			`)`
			`self.validate_all(`
			`"IF(y <> 0, x / y, NULL)",`
			`read={`
			`"bigquery": "SAFE_DIVIDE(x, y)",`
			`},`
			`)`
			`self.validate_all(`
			`"STRUCT_PACK(x := 1, y := '2')",`
			`write={`
Adding upstream version 10.6.0. Signed-off-by: Daniel Baumann <daniel@debian.org> 2025-02-13 15:07:44 +01:00			`"duckdb": "{'x': 1, 'y': '2'}",`
Adding upstream version 6.0.4. Signed-off-by: Daniel Baumann <daniel@debian.org> 2025-02-13 06:15:54 +01:00			`"spark": "STRUCT(x = 1, y = '2')",`
			`},`
			`)`
Adding upstream version 10.6.0. Signed-off-by: Daniel Baumann <daniel@debian.org> 2025-02-13 15:07:44 +01:00			`self.validate_all(`
			`"STRUCT_PACK(key1 := 'value1', key2 := 42)",`
			`write={`
			`"duckdb": "{'key1': 'value1', 'key2': 42}",`
			`"spark": "STRUCT(key1 = 'value1', key2 = 42)",`
			`},`
			`)`
Adding upstream version 6.0.4. Signed-off-by: Daniel Baumann <daniel@debian.org> 2025-02-13 06:15:54 +01:00			`self.validate_all(`
			`"ARRAY_SORT(x)",`
			`write={`
			`"duckdb": "ARRAY_SORT(x)",`
			`"presto": "ARRAY_SORT(x)",`
			`"hive": "SORT_ARRAY(x)",`
			`"spark": "SORT_ARRAY(x)",`
			`},`
			`)`
			`self.validate_all(`
			`"ARRAY_REVERSE_SORT(x)",`
			`write={`
			`"duckdb": "ARRAY_REVERSE_SORT(x)",`
			`"presto": "ARRAY_SORT(x, (a, b) -> CASE WHEN a < b THEN 1 WHEN a > b THEN -1 ELSE 0 END)",`
			`"hive": "SORT_ARRAY(x, FALSE)",`
			`"spark": "SORT_ARRAY(x, FALSE)",`
			`},`
			`)`
			`self.validate_all(`
			`"LIST_REVERSE_SORT(x)",`
			`write={`
			`"duckdb": "ARRAY_REVERSE_SORT(x)",`
			`"presto": "ARRAY_SORT(x, (a, b) -> CASE WHEN a < b THEN 1 WHEN a > b THEN -1 ELSE 0 END)",`
			`"hive": "SORT_ARRAY(x, FALSE)",`
			`"spark": "SORT_ARRAY(x, FALSE)",`
			`},`
			`)`
			`self.validate_all(`
			`"LIST_SORT(x)",`
			`write={`
			`"duckdb": "ARRAY_SORT(x)",`
			`"presto": "ARRAY_SORT(x)",`
			`"hive": "SORT_ARRAY(x)",`
			`"spark": "SORT_ARRAY(x)",`
			`},`
			`)`
			`self.validate_all(`
			`"SELECT fname, lname, age FROM person ORDER BY age DESC NULLS FIRST, fname ASC NULLS LAST, lname",`
			`write={`
			`"duckdb": "SELECT fname, lname, age FROM person ORDER BY age DESC NULLS FIRST, fname NULLS LAST, lname",`
			`},`
			`)`
			`self.validate_all(`
			`"MONTH('2021-03-01')",`
			`write={`
			`"duckdb": "MONTH('2021-03-01')",`
			`"presto": "MONTH('2021-03-01')",`
			`"hive": "MONTH('2021-03-01')",`
			`"spark": "MONTH('2021-03-01')",`
			`},`
			`)`
Adding upstream version 9.0.1. Signed-off-by: Daniel Baumann <daniel@debian.org> 2025-02-13 14:47:39 +01:00			`self.validate_all(`
			`"ARRAY_CONCAT(LIST_VALUE(1, 2), LIST_VALUE(3, 4))",`
			`write={`
			`"duckdb": "ARRAY_CONCAT(LIST_VALUE(1, 2), LIST_VALUE(3, 4))",`
			`"presto": "CONCAT(ARRAY[1, 2], ARRAY[3, 4])",`
			`"hive": "CONCAT(ARRAY(1, 2), ARRAY(3, 4))",`
			`"spark": "CONCAT(ARRAY(1, 2), ARRAY(3, 4))",`
			`"snowflake": "ARRAY_CAT([1, 2], [3, 4])",`
			`"bigquery": "ARRAY_CONCAT([1, 2], [3, 4])",`
			`},`
			`)`
Adding upstream version 6.2.6. Signed-off-by: Daniel Baumann <daniel@debian.org> 2025-02-13 14:37:25 +01:00
Adding upstream version 11.1.3. Signed-off-by: Daniel Baumann <daniel@debian.org> 2025-02-13 15:24:45 +01:00			`self.validate_identity("ATTACH DATABASE ':memory:' AS new_database")`

Adding upstream version 6.2.6. Signed-off-by: Daniel Baumann <daniel@debian.org> 2025-02-13 14:37:25 +01:00			`with self.assertRaises(UnsupportedError):`
			`transpile(`
			`"SELECT a FROM b PIVOT(SUM(x) FOR y IN ('z', 'q'))",`
			`read="duckdb",`
			`unsupported_level=ErrorLevel.IMMEDIATE,`
			`)`
Adding upstream version 10.4.2. Signed-off-by: Daniel Baumann <daniel@debian.org> 2025-02-13 15:01:11 +01:00
Adding upstream version 11.1.3. Signed-off-by: Daniel Baumann <daniel@debian.org> 2025-02-13 15:24:45 +01:00			`with self.assertRaises(UnsupportedError):`
			`transpile(`
			`"SELECT REGEXP_EXTRACT(a, 'pattern', 1) from table",`
			`read="bigquery",`
			`write="duckdb",`
			`unsupported_level=ErrorLevel.IMMEDIATE,`
			`)`

Adding upstream version 10.4.2. Signed-off-by: Daniel Baumann <daniel@debian.org> 2025-02-13 15:01:11 +01:00			`def test_array(self):`
			`self.validate_identity("ARRAY(SELECT id FROM t)")`

			`def test_cast(self):`
			`self.validate_all(`
			`"123::CHARACTER VARYING",`
			`write={`
			`"duckdb": "CAST(123 AS TEXT)",`
			`},`
			`)`

Adding upstream version 10.6.3. Signed-off-by: Daniel Baumann <daniel@debian.org> 2025-02-13 15:09:11 +01:00			`self.validate_all(`
			`"cast([[1]] as int[][])",`
			`write={`
			`"duckdb": "CAST(LIST_VALUE(LIST_VALUE(1)) AS INT[][])",`
			`"spark": "CAST(ARRAY(ARRAY(1)) AS ARRAY<ARRAY<INT>>)",`
			`},`
			`)`

Adding upstream version 11.0.1. Signed-off-by: Daniel Baumann <daniel@debian.org> 2025-02-13 15:22:50 +01:00			`self.validate_all(`
			`"CAST(x AS DATE) + INTERVAL (7 * -1) DAY", read={"spark": "DATE_SUB(x, 7)"}`
			`)`

Adding upstream version 10.4.2. Signed-off-by: Daniel Baumann <daniel@debian.org> 2025-02-13 15:01:11 +01:00			`def test_bool_or(self):`
			`self.validate_all(`
			`"SELECT a, LOGICAL_OR(b) FROM table GROUP BY a",`
			`write={"duckdb": "SELECT a, BOOL_OR(b) FROM table GROUP BY a"},`
			`)`