Texte vers vidéo facile avec AnimateDiff

AnimateDiff vous permet de créer facilement des vidéos avec Stable Diffusion. Écrivez simplement un prompt, sélectionnez un modèle et activez AnimateDiff !

4.9/5par plus de 50K utilisateurs|
10M+vidéos générées|
500+créateurs lui font confiance
Texte vers vidéoImage vers vidéoPrompt TravelMotion LoRAControlNetBouclage

AnimateDiff est une ressource éducative et une démo en ligne du module de mouvement open source AnimateDiff. Il n'est pas affilié aux auteurs de l'article original AnimateDiff ni à Stability AI.

Découvrez ce qu'AnimateDiff crée

Comment le générateur crée de courts clips

Génération texte vers vidéo

Avec AnimateDiff, vous pouvez fournir un prompt texte décrivant une scène, un personnage ou un concept, et il générera un court clip animant cette description. Cela permet de créer des animations conceptuelles ou des visualisations d'histoires directement à partir de texte.

Génération image vers vidéo

AnimateDiff prend en charge la génération image vers vidéo où vous fournissez une image statique, et il l'anime en ajoutant du mouvement basé sur les priors de mouvement appris. Cela peut donner vie à des images fixes ou des œuvres d'art.

Animations en boucle

En plus des courts clips, AnimateDiff peut générer des animations en boucle transparentes à partir d'entrées texte ou image. Elles peuvent être utilisées comme arrière-plans animés, économiseurs d'écran ou œuvres d'art animées créatives.

Édition/manipulation vidéo

L'implémentation video2video d'AnimateDiff utilise ControlNet pour permettre l'édition de vidéos existantes via des prompts texte. Vous pourriez potentiellement supprimer, ajouter ou manipuler des éléments dans une vidéo guidés par vos descriptions textuelles.

Animations personnalisées

Combiné à des techniques comme DreamBooth ou LoRA, AnimateDiff permet d'animer des sujets, personnages ou objets personnalisés entraînés sur des images/jeux de données spécifiques.

Workflows créatifs

Les artistes et créateurs peuvent intégrer AnimateDiff dans leurs workflows créatifs, l'utilisant pour visualiser rapidement des concepts animés, des storyboards ou des animatiques à partir d'entrées texte et image lors de la phase d'idéation.

Bien qu'il ne soit pas un outil d'édition vidéo complet, AnimateDiff offre une manière unique de générer du nouveau contenu vidéo à partir d'entrées texte et image en exploitant la puissance des modèles de diffusion et des priors de mouvement appris. Ses sorties peuvent servir de point de départ pour une édition vidéo et un post-traitement supplémentaires.

AnimateDiff : un créateur texte vers vidéo qui apporte du mouvement aux modèles de diffusion

AnimateDiff permet la génération texte vers vidéo, vous permettant de créer de courts clips ou animations directement à partir de prompts texte. Voici comment fonctionne le processus :

Prompt texte : Vous fournissez une description textuelle de la scène, des personnages, des actions ou des concepts que vous voulez voir animés.

Modèle de base texte vers image : AnimateDiff utilise un modèle de diffusion texte vers image pré-entraîné comme Stable Diffusion comme backbone pour générer les images initiales selon votre prompt texte. Le modèle de base contrôle le style, l'identité du personnage et le détail du sujet ; utilisez des modèles checkpoint comme ToonYou ou Realistic Vision avant d'appliquer le module.

Module de mouvement : Au cœur d'AnimateDiff se trouve un module de mouvement entraîné sur des vidéos réelles pour apprendre les schémas de mouvement et la dynamique généraux. Ce module est indépendant du modèle de diffusion de base.

Animation des images : AnimateDiff combine le modèle de diffusion de base et le module de mouvement. Il génère d'abord des images clés à partir de votre prompt texte avec le modèle de diffusion. Puis le module interpole des images intermédiaires entre ces clés, appliquant les priors de mouvement appris pour animer la scène.

Sortie vidéo : La sortie résultante est un court clip dépeignant les concepts décrits dans votre prompt texte, avec les éléments animés présentant un mouvement naturel appris à partir de vidéos réelles.

Quelques avantages clés d'AnimateDiff pour la génération texte vers vidéo sont

Plug-and-Play

Il peut animer n'importe quel modèle texte vers image sans réentraînement ou ajustement extensif spécifique à la vidéo.

Contrôlable

Vous pouvez guider l'animation via le prompt texte décrivant actions, mouvements de caméra, etc.

Efficace

Plus rapide que l'entraînement de modèles texte vers vidéo monolithiques à partir de zéro.

Cependant, les animations ne sont pas toujours parfaites et peuvent présenter des artefacts, surtout pour les mouvements complexes. Mais AnimateDiff offre un moyen puissant de visualiser directement des descriptions textuelles sous forme d'animations en exploitant des modèles de diffusion pré-entraînés.

AnimateDiff : un créateur image vers vidéo qui insuffle la vie aux visuels statiques

AnimateDiff peut aussi être utilisé pour la génération image vers vidéo, vous permettant d'animer des images statiques existantes en ajoutant du mouvement et de la dynamique. Voici comment cela fonctionne :

Image d'entrée : Vous fournissez une image statique que vous voulez animer. Cela peut être une photographie, une œuvre d'art numérique ou une sortie de modèle de diffusion.

Modèle de base image vers image : AnimateDiff utilise un modèle de diffusion image vers image pré-entraîné comme la capacité img2img de Stable Diffusion comme backbone.

Module de mouvement : Le même module de mouvement entraîné sur des vidéos réelles pour apprendre les schémas de mouvement généraux est utilisé.

Animation à partir de l'entrée : AnimateDiff prend l'image d'entrée et utilise le modèle de diffusion image vers image pour générer de légères variations qui servent d'images clés.

Application du mouvement : Le module de mouvement interpole ensuite des images intermédiaires entre ces images clés, appliquant la dynamique d'animation apprise pour animer les éléments de l'image d'entrée.

Sortie vidéo : Le résultat final est un clip vidéo où l'image statique d'origine a été ramenée à la vie avec un mouvement et une animation naturels.

Quelques avantages clés d'AnimateDiff pour la génération image vers vidéo sont :

Il peut animer n'importe quelle image d'entrée, y compris des modèles personnalisés ou des œuvres d'art.
1
Le mouvement est déduit automatiquement de l'entrée sans guidage supplémentaire.
2
Le niveau de mouvement peut être contrôlé en ajustant les paramètres.
3
Les instances simples fonctionnent mieux que les scènes très complexes.
4

Bien que moins contrôlable que le cas texte vers vidéo, l'image vers vidéo avec AnimateDiff offre un moyen facile d'ajouter de la dynamique aux images fixes existantes en exploitant la puissance des modèles de diffusion et des priors de mouvement appris.

Fonctionne avec vos styles préférés

Ce ne sont que des exemples de styles — AnimateDiff n'est pas un outil à apparence unique. Il apporte du mouvement aux esthétiques distinctives de vos modèles Stable Diffusion préférés.

Anime
Réaliste
Cartoon 3D
Ghibli
Encre
Film
Portrait
Cinématique

qu'est-ce qu'AnimateDiff

AnimateDiff est un outil d'IA qui peut transformer une image statique ou un prompt texte en vidéo animée en générant une séquence d'images qui se transforment en douceur. Il fonctionne en utilisant des modèles Stable Diffusion avec des modules de mouvement séparés pour prédire le mouvement entre les images. AnimateDiff permet aux utilisateurs de créer facilement de courts clips animés sans avoir à créer manuellement chaque image.

Exemple AnimateDiff

Comment créer une vidéo avec AnimateDiff en 4 étapes

1

Choisissez un modèle / style de base

Choisissez l'apparence souhaitée — anime, réaliste, cartoon, encre — parmi les modèles Stable Diffusion pris en charge.

2

Écrivez votre prompt

Décrivez la scène, le sujet, l'action et le mouvement de caméra que vous voulez animer.

3

Définissez la longueur et le FPS

Choisissez le nombre d'images et la fréquence d'images pour contrôler la durée et la fluidité du clip.

4

Générez et téléchargez

Lancez AnimateDiff, prévisualisez le résultat en boucle et exportez votre animation.

Les capacités d'AnimateDiff en un coup d'œil

FonctionnalitéCe qu'elle faitQuand l'utiliser
Modules de mouvement v1/v2/v3/SDXLDifférents priors de mouvement entraînés pour des qualités et résolutions variéesAdaptez le module à votre modèle de base et à la résolution cible
Prompt TravelTransition fluide entre prompts à travers les imagesCréez des scènes évolutives ou des sujets en transformation
Motion LoRAAjoutez des mouvements de caméra spécifiques comme zoom/pan/roulisDirigez un mouvement de caméra cinématique
ControlNetGuidez le mouvement et la structure avec des entrées de référenceConservez une pose/composition cohérente
Boucle ferméeFaites boucler l'animation de manière transparenteClips en boucle parfaits de style GIF
Interpolation d'imagesInsérez des images intermédiaires pour un mouvement plus fluideAugmentez le FPS perçu sans régénérer
Correction Hi-ResMettez à l'échelle tout en préservant le détail du mouvementSortie plus nette et de plus haute résolution
Accélération LCM / SDXL TurboMoins d'étapes pour une génération plus rapideItération rapide et aperçus

Prêt à animer votre idée ?

Commencez dès aujourd'hui à transformer vos textes et images en vidéos captivantes avec AnimateDiff.

Essayer AnimateDiff gratuitement