diff-storyboard / examples /wanvideo /model_training /lora /Wan2.2-Fun-A14B-Control.sh

jiaxi2002

Upload folder using huggingface_hub

feb33a0 verified 8 days ago

1.9 kB

	accelerate launch examples/wanvideo/model_training/train.py \
	--dataset_base_path data/example_video_dataset \
	--dataset_metadata_path data/example_video_dataset/metadata_reference_control.csv \
	--data_file_keys "video,control_video,reference_image" \
	--height 480 \
	--width 832 \
	--dataset_repeat 100 \
	--model_id_with_origin_paths "PAI/Wan2.2-Fun-A14B-Control:high_noise_model/diffusion_pytorch_model*.safetensors,PAI/Wan2.2-Fun-A14B-Control:models_t5_umt5-xxl-enc-bf16.pth,PAI/Wan2.2-Fun-A14B-Control:Wan2.1_VAE.pth" \
	--learning_rate 1e-4 \
	--num_epochs 5 \
	--remove_prefix_in_ckpt "pipe.dit." \
	--output_path "./models/train/Wan2.2-Fun-A14B-Control_high_niose_lora" \
	--lora_base_model "dit" \
	--lora_target_modules "q,k,v,o,ffn.0,ffn.2" \
	--lora_rank 32 \
	--extra_inputs "control_video,reference_image" \
	--max_timestep_boundary 0.358 \
	--min_timestep_boundary 0
	# boundary corresponds to timesteps [900, 1000]

	accelerate launch examples/wanvideo/model_training/train.py \
	--dataset_base_path data/example_video_dataset \
	--dataset_metadata_path data/example_video_dataset/metadata_reference_control.csv \
	--data_file_keys "video,control_video,reference_image" \
	--height 480 \
	--width 832 \
	--dataset_repeat 100 \
	--model_id_with_origin_paths "PAI/Wan2.2-Fun-A14B-Control:low_noise_model/diffusion_pytorch_model*.safetensors,PAI/Wan2.2-Fun-A14B-Control:models_t5_umt5-xxl-enc-bf16.pth,PAI/Wan2.2-Fun-A14B-Control:Wan2.1_VAE.pth" \
	--learning_rate 1e-4 \
	--num_epochs 5 \
	--remove_prefix_in_ckpt "pipe.dit." \
	--output_path "./models/train/Wan2.2-Fun-A14B-Control_low_noise_lora" \
	--lora_base_model "dit" \
	--lora_target_modules "q,k,v,o,ffn.0,ffn.2" \
	--lora_rank 32 \
	--extra_inputs "control_video,reference_image" \
	--max_timestep_boundary 1 \
	--min_timestep_boundary 0.358
	# boundary corresponds to timesteps [0, 900]