sqlglot/tests/dataframe/unit/dataframe_sql_validator.py

import typing as t
import unittest

from sqlglot.dataframe.sql import types
from sqlglot.dataframe.sql.dataframe import DataFrame
from sqlglot.dataframe.sql.session import SparkSession


class DataFrameSQLValidator(unittest.TestCase):
    def setUp(self) -> None:
        self.spark = SparkSession()
        self.employee_schema = types.StructType(
            [
                types.StructField("employee_id", types.IntegerType(), False),
                types.StructField("fname", types.StringType(), False),
                types.StructField("lname", types.StringType(), False),
                types.StructField("age", types.IntegerType(), False),
                types.StructField("store_id", types.IntegerType(), False),
            ]
        )
        employee_data = [
            (1, "Jack", "Shephard", 37, 1),
            (2, "John", "Locke", 65, 1),
            (3, "Kate", "Austen", 37, 2),
            (4, "Claire", "Littleton", 27, 2),
            (5, "Hugo", "Reyes", 29, 100),
        ]
        self.df_employee = self.spark.createDataFrame(
            data=employee_data, schema=self.employee_schema
        )

    def compare_sql(
        self, df: DataFrame, expected_statements: t.Union[str, t.List[str]], pretty=False
    ):
        actual_sqls = df.sql(pretty=pretty)
        expected_statements = (
            [expected_statements] if isinstance(expected_statements, str) else expected_statements
        )
        self.assertEqual(len(expected_statements), len(actual_sqls))
        for expected, actual in zip(expected_statements, actual_sqls):
            self.assertEqual(expected, actual)
Merging upstream version 9.0.1. Signed-off-by: Daniel Baumann <daniel@debian.org> 2025-02-13 14:48:46 +01:00			`import typing as t`
			`import unittest`

			`from sqlglot.dataframe.sql import types`
			`from sqlglot.dataframe.sql.dataframe import DataFrame`
			`from sqlglot.dataframe.sql.session import SparkSession`


			`class DataFrameSQLValidator(unittest.TestCase):`
			`def setUp(self) -> None:`
			`self.spark = SparkSession()`
			`self.employee_schema = types.StructType(`
			`[`
			`types.StructField("employee_id", types.IntegerType(), False),`
			`types.StructField("fname", types.StringType(), False),`
			`types.StructField("lname", types.StringType(), False),`
			`types.StructField("age", types.IntegerType(), False),`
			`types.StructField("store_id", types.IntegerType(), False),`
			`]`
			`)`
			`employee_data = [`
			`(1, "Jack", "Shephard", 37, 1),`
			`(2, "John", "Locke", 65, 1),`
			`(3, "Kate", "Austen", 37, 2),`
			`(4, "Claire", "Littleton", 27, 2),`
			`(5, "Hugo", "Reyes", 29, 100),`
			`]`
Merging upstream version 10.0.1. Signed-off-by: Daniel Baumann <daniel@debian.org> 2025-02-13 14:53:05 +01:00			`self.df_employee = self.spark.createDataFrame(`
			`data=employee_data, schema=self.employee_schema`
			`)`
Merging upstream version 9.0.1. Signed-off-by: Daniel Baumann <daniel@debian.org> 2025-02-13 14:48:46 +01:00
Merging upstream version 10.0.1. Signed-off-by: Daniel Baumann <daniel@debian.org> 2025-02-13 14:53:05 +01:00			`def compare_sql(`
			`self, df: DataFrame, expected_statements: t.Union[str, t.List[str]], pretty=False`
			`):`
Merging upstream version 9.0.1. Signed-off-by: Daniel Baumann <daniel@debian.org> 2025-02-13 14:48:46 +01:00			`actual_sqls = df.sql(pretty=pretty)`
Merging upstream version 10.0.1. Signed-off-by: Daniel Baumann <daniel@debian.org> 2025-02-13 14:53:05 +01:00			`expected_statements = (`
			`[expected_statements] if isinstance(expected_statements, str) else expected_statements`
			`)`
Merging upstream version 9.0.1. Signed-off-by: Daniel Baumann <daniel@debian.org> 2025-02-13 14:48:46 +01:00			`self.assertEqual(len(expected_statements), len(actual_sqls))`
			`for expected, actual in zip(expected_statements, actual_sqls):`
			`self.assertEqual(expected, actual)`