Partition#

Bases: SsasRefreshRecord
Partitions are a child of Tables. They contain the Power Query code.
These are the physical segments of the table that contain the data. They cannot be edited within the Power BI Desktop UI, but can be edited in the Tabular Editor or other tools (like this one!). Data refreshes occur on the Partition-level.
SSAS spec: Microsoft
Source code in pbi_core/ssas/model_tables/partition/partition.py
@define()
class Partition(SsasRefreshRecord):
    """Partitions are a child of Tables. They contain the Power Query code.

    These are the physical segments of the table that contain the data.
    They cannot be edited within the Power BI Desktop UI, but can be edited in the
    Tabular Editor or other tools (like this one!). Data refreshes occur on the Partition-level.

    SSAS spec: [Microsoft](https://learn.microsoft.com/en-us/openspecs/sql_server_protocols/ms-ssas-t/81badb81-31a8-482b-ae16-5fc9d8291d9e)
    """

    _default_refresh_type: RefreshType = field(default=RefreshType.FULL, init=False, repr=False, eq=False)

    data_view: DataView = field(eq=True)
    data_source_id: int | None = field(default=None, eq=True)
    description: str | None = field(default=None, eq=True)
    error_message: Final[str | None] = field(default=None, eq=False, on_setattr=setters.frozen)
    expression_source_id: int | None = field(default=None, eq=True)
    m_attributes: str | None = field(default=None, eq=True)
    mode: PartitionMode = field(eq=True)
    name: str = field(eq=True)
    partition_storage_id: int = field(eq=True)
    query_definition: str = field(eq=True)
    query_group_id: int | None = field(default=None, eq=True)
    range_granularity: int = field(eq=True)
    retain_data_till_force_calculate: bool = field(eq=True)
    state: Final[DataState] = field(eq=False, on_setattr=setters.frozen, default=DataState.READY)
    system_flags: int = field(eq=True)
    table_id: int = field(eq=True)
    type: PartitionType = field(eq=True)

    modified_time: Final[datetime.datetime] = field(eq=False, on_setattr=setters.frozen, repr=False)
    refreshed_time: Final[datetime.datetime] = field(eq=False, on_setattr=setters.frozen, repr=False)

    _commands: RefreshCommands = field(default=SsasCommands.partition, init=False, repr=False, eq=False)

    def expression_ast(self) -> "dax.Expression | pq.Expression | None":
        from pbi_parsers import dax, pq  # noqa: PLC0415

        if self.type == PartitionType.CALCULATED:
            ret = pq.to_ast(self.query_definition)
            if ret is None:
                msg = "Failed to parse DAX expression from partition query definition"
                raise ValueError(msg)
        elif self.type == PartitionType.M:
            ret = dax.to_ast(self.query_definition)
            if ret is None:
                msg = "Failed to parse M expression from partition query definition"
                raise ValueError(msg)
        else:
            logger.warning("Attempted to get AST of non-M/DAX partition", partition=self.name, type=self.type)
            return None

    def is_system_table(self) -> bool:
        return bool(self.system_flags >> 1 % 2)

    def is_from_calculated_table(self) -> bool:
        return bool(self.system_flags % 2)

    def data_source(self) -> "DataSource | None":
        if self.data_source_id is None:
            return None
        return self._tabular_model.data_sources.find(self.data_source_id)

    def expression_source(self) -> "Expression | None":
        if self.expression_source_id is None:
            return None
        return self._tabular_model.expressions.find(self.expression_source_id)

    def query_group(self) -> "QueryGroup | None":
        try:
            return self._tabular_model.query_groups.find({"id": self.table_id})
        except RowNotFoundError:
            return None

    def table(self) -> "Table":
        return self._tabular_model.tables.find({"id": self.table_id})

    def children_base(self) -> frozenset[LinkedEntity]:
        return LinkedEntity.from_iter(self.annotations(), by="annotation")

    def parents_base(self) -> frozenset["LinkedEntity"]:
        return (
            LinkedEntity.from_iter({self.table()}, by="table")
            | LinkedEntity.from_iter({self.query_group()}, by="query_group")
            | LinkedEntity.from_iter(
                {self.expression_source()},
                by="expression_source",
            )
            | LinkedEntity.from_iter(
                {self.data_source()},
                by="data_source",
            )
        )

    def remove_columns(self, dropped_columns: "Iterable[Column | str | None]") -> BeautifulSoup:
        def pq_escape(x: str) -> str:
            """Beginning of column escaping for power query."""
            return x.replace('"', '""')

        """Adds a Table.RemoveColumns statement to the end of the Partition's PowerQuery.

        This means the upon refresh, the columns will not be included in the table
        """
        from pbi_core.ssas.model_tables.column import Column  # noqa: PLC0415

        new_dropped_columns: list[str] = []
        for col in dropped_columns:
            if isinstance(col, Column):
                # Tables have a column named "RowNumber-<UUID>" that cannot be removed in the PowerQuery
                if col._column_type() != "CALC_COLUMN" and not col.is_key:
                    new_dropped_columns.append(col.name())
            elif isinstance(col, str):
                new_dropped_columns.append(col)

        # TODO: create a powerquery parser to do this robustly
        new_dropped_columns = [pq_escape(x) for x in new_dropped_columns]
        logger.info("Updating partition to drop columns", table=self.table().name, columns=new_dropped_columns)
        lines = self.query_definition.split("\n")
        final_table_name = lines[-1].strip()
        setup = "\n".join(lines[:-2])

        prior_updates = setup.count("pbi_update")  # used to keep statement variables unique when applied multiple times
        new_final_table_name = f"pbi_update{prior_updates}"

        cols = ", ".join(f'"{x}"' for x in new_dropped_columns)
        setup += f",\n    {new_final_table_name} = Table.RemoveColumns({final_table_name}, {{{cols}}})"
        setup += f"\nin\n    {new_final_table_name}"
        self.query_definition = setup
        return self.alter()

    def external_sources(self) -> "list[BaseExternalSource]":
        from pbi_parsers.pq.misc.external_sources import get_external_sources  # noqa: PLC0415

        if self.type != PartitionType.M:
            return []
        return get_external_sources(self.query_definition)