Source code for stable_diffusion_xl_pokemon_blip_colossal

from mmengine._strategy import ColossalAIStrategy
from mmengine.config import read_base
from mmengine.runner import FlexibleRunner

from diffengine.engine.hooks import (
    CompileHook,
    FastNormHook,
    SDCheckpointHook,
    VisualizationHook,
)

with read_base():
    from .._base_.datasets.pokemon_blip_xl import *
    from .._base_.default_runtime import *
    from .._base_.models.stable_diffusion_xl import *
    from .._base_.schedules.stable_diffusion_xl_50e import *


model.update(
    gradient_checkpointing=False)

train_dataloader.update(batch_size=8, num_workers=8)

optim_wrapper.update(
    _delete_=True,
    optimizer=dict(
        type="HybridAdam",
        lr=1e-5,
        weight_decay=1e-2),
    accumulative_counts=4)

env_cfg.update(
    cudnn_benchmark=True,
)

[docs]custom_hooks = [
    dict(
        type=VisualizationHook,
        prompt=["yoda pokemon"] * 4,
        height=1024,
        width=1024),
    dict(type=SDCheckpointHook),
    dict(type=FastNormHook, fuse_main_ln=False, fuse_gn=False),
    dict(type=CompileHook, compile_main=True),
]

default_hooks.update(
    checkpoint=dict(save_param_scheduler=False))  # no scheduler in this config

[docs]runner_type = FlexibleRunner
[docs]strategy = dict(type=ColossalAIStrategy,
                mixed_precision="fp16",
                plugin=dict(type="LowLevelZeroPlugin",
                            stage=2,
                            max_norm=1.0))