Source code for diffengine.engine.hooks.peft_save_hook

import os.path as osp
from collections import OrderedDict

from mmengine.hooks import Hook
from mmengine.model import is_model_wrapper
from mmengine.registry import HOOKS
from mmengine.runner import Runner
from peft import get_peft_model_state_dict

from diffengine.models.editors import StableDiffusionXL


@HOOKS.register_module()
[docs]class PeftSaveHook(Hook):
    """Peft Save Hook.

    Save LoRA weights with diffusers format and pick up LoRA weights from
    checkpoint.
    """

[docs]    priority = "VERY_LOW"

[docs]    def before_save_checkpoint(self, runner: Runner, checkpoint: dict) -> None:
        """Before save checkpoint hook.

        Args:
        ----
            runner (Runner): The runner of the training, validation or testing
                process.
            checkpoint (dict): Model's checkpoint.
        """
        model = runner.model
        if is_model_wrapper(model):
            model = model.module

        ckpt_path = osp.join(runner.work_dir, f"step{runner.iter}")
        if hasattr(model, "unet"):
            model.unet.save_pretrained(osp.join(ckpt_path, "unet"))
            model_keys = ["unet"]
        elif hasattr(model, "prior"):
            # TODO(takuoko): Delete if bug is fixed in diffusers.  # noqa
            model.prior._internal_dict["_name_or_path"] = "prior"  # noqa
            model.prior.save_pretrained(osp.join(ckpt_path, "prior"))
            model_keys = ["prior"]
        elif hasattr(model, "transformer"):
            model.transformer.save_pretrained(
                osp.join(ckpt_path, "transformer"))
            model_keys = ["transformer"]

        if hasattr(model,
                   "finetune_text_encoder") and model.finetune_text_encoder:
            if isinstance(model, StableDiffusionXL):
                model.text_encoder_one.save_pretrained(
                    osp.join(ckpt_path, "text_encoder_one"))
                model.text_encoder_two.save_pretrained(
                    osp.join(ckpt_path, "text_encoder_two"))
                model_keys.extend(["text_encoder_one", "text_encoder_two"])
            else:
                model.text_encoder.save_pretrained(
                    osp.join(ckpt_path, "text_encoder"))
                model_keys.append("text_encoder")

        # not save no grad key
        new_ckpt = OrderedDict()
        for model_key in model_keys:
            state_dict = get_peft_model_state_dict(getattr(model, model_key))
            for k in state_dict:
                # add adapter name
                new_k = ".".join(
                    k.split(".")[:-1] + ["default", k.split(".")[-1]])
                new_ckpt[f"{model_key}.{new_k}"] = state_dict[k]
        checkpoint["state_dict"] = new_ckpt