`diffengine.models.editors.ip_adapter.ip_adapter_xl_timm`¶

Module Contents¶

Classes¶

TimmIPAdapterXLPlus

Stable Diffusion XL IP-Adapter Plus.

class diffengine.models.editors.ip_adapter.ip_adapter_xl_timm.TimmIPAdapterXLPlus(*args, image_encoder, image_projection, feature_extractor, pretrained_adapter=None, pretrained_adapter_subfolder='', pretrained_adapter_weights_name='', unet_lora_config=None, text_encoder_lora_config=None, finetune_text_encoder=False, zeros_image_embeddings_prob=0.1, data_preprocessor=None, hidden_states_idx=-2, **kwargs)[source]¶

Bases: diffengine.models.editors.ip_adapter.ip_adapter_xl.IPAdapterXLPlus

Stable Diffusion XL IP-Adapter Plus.

Parameters:

image_encoder (dict) –
image_projection (dict) –
feature_extractor (dict) –
pretrained_adapter (str | None) –
pretrained_adapter_subfolder (str) –
pretrained_adapter_weights_name (str) –
unet_lora_config (dict | None) –
text_encoder_lora_config (dict | None) –
finetune_text_encoder (bool) –
zeros_image_embeddings_prob (float) –
data_preprocessor (dict | torch.nn.Module | None) –
hidden_states_idx (int) –

prepare_model()[source]¶

Prepare model for training.

Disable gradient for some models.

Return type:: None

infer(prompt, example_image, negative_prompt=None, height=None, width=None, num_inference_steps=50, output_type='pil', **kwargs)[source]¶

Inference function.

Args:¶

prompt (List[str]):
The prompt or prompts to guide the image generation.

example_image (List[Union[str, Image.Image]]):
The image prompt or prompts to guide the image generation.

negative_prompt (Optional[str]):
The prompt or prompts to guide the image generation. Defaults to None.

height (int, optional):
The height in pixels of the generated image. Defaults to None.

width (int, optional):
The width in pixels of the generated image. Defaults to None.

num_inference_steps (int): Number of inference steps.
Defaults to 50.

output_type (str): The output format of the generate image.
Choose between ‘pil’ and ‘latent’. Defaults to ‘pil’.

**kwargs: Other arguments.

Parameters:

prompt (list[str]) –
example_image (list[str | PIL.Image.Image]) –
negative_prompt (str | None) –
height (int | None) –
width (int | None) –
num_inference_steps (int) –
output_type (str) –

Return type:

list[numpy.ndarray]

forward(inputs, data_samples=None, mode='loss')[source]¶

Forward function.

Args:¶

inputs (dict): The input dict. data_samples (Optional[list], optional): The data samples.

Defaults to None.

mode (str, optional): The mode. Defaults to “loss”.

Returns:¶

dict: The loss dict.

Parameters:

inputs (dict) –
data_samples (list | None) –
mode (str) –

Return type:

dict

diffengine.models.editors.ip_adapter.ip_adapter_xl_timm¶

Module Contents¶

Classes¶

Args:¶

Args:¶

Returns:¶

`diffengine.models.editors.ip_adapter.ip_adapter_xl_timm`¶