Texte vers vidéo facile avec AnimateDiff

AnimateDiff vous permet de créer facilement des vidéos avec Stable Diffusion. Écrivez simplement un prompt, sélectionnez un modèle et activez AnimateDiff !

4.9/5par plus de 50K utilisateurs|

10M+vidéos générées|

500+créateurs lui font confiance

Texte vers vidéoImage vers vidéoPrompt TravelMotion LoRAControlNetBouclage

AnimateDiff est une ressource éducative et une démo en ligne du module de mouvement open source AnimateDiff. Il n'est pas affilié aux auteurs de l'article original AnimateDiff ni à Stability AI.

Découvrez ce qu'AnimateDiff crée

Généré avec le modèle ToonYou

Généré avec le modèle Realistic Vision

Généré avec le modèle Counterfeit V3.0

Généré avec le modèle majicMIX Realistic

Généré avec le modèle RCNZ Cartoon 3D

Généré avec le modèle GHIBLI Background

Exemple de style anime AnimateDiff

Exemple de style réaliste AnimateDiff

Exemple de style cartoon 3D AnimateDiff

Exemple de style Ghibli AnimateDiff

Exemple de style lavis d'encre AnimateDiff

Exemple de style cinématique AnimateDiff

Comment le générateur crée de courts clips

Génération texte vers vidéo

Avec AnimateDiff, vous pouvez fournir un prompt texte décrivant une scène, un personnage ou un concept, et il générera un court clip animant cette description. Cela permet de créer des animations conceptuelles ou des visualisations d'histoires directement à partir de texte.

Génération image vers vidéo

AnimateDiff prend en charge la génération image vers vidéo où vous fournissez une image statique, et il l'anime en ajoutant du mouvement basé sur les priors de mouvement appris. Cela peut donner vie à des images fixes ou des œuvres d'art.

Animations en boucle

En plus des courts clips, AnimateDiff peut générer des animations en boucle transparentes à partir d'entrées texte ou image. Elles peuvent être utilisées comme arrière-plans animés, économiseurs d'écran ou œuvres d'art animées créatives.

Édition/manipulation vidéo

L'implémentation video2video d'AnimateDiff utilise ControlNet pour permettre l'édition de vidéos existantes via des prompts texte. Vous pourriez potentiellement supprimer, ajouter ou manipuler des éléments dans une vidéo guidés par vos descriptions textuelles.

Animations personnalisées

Combiné à des techniques comme DreamBooth ou LoRA, AnimateDiff permet d'animer des sujets, personnages ou objets personnalisés entraînés sur des images/jeux de données spécifiques.

Workflows créatifs

Les artistes et créateurs peuvent intégrer AnimateDiff dans leurs workflows créatifs, l'utilisant pour visualiser rapidement des concepts animés, des storyboards ou des animatiques à partir d'entrées texte et image lors de la phase d'idéation.

Bien qu'il ne soit pas un outil d'édition vidéo complet, AnimateDiff offre une manière unique de générer du nouveau contenu vidéo à partir d'entrées texte et image en exploitant la puissance des modèles de diffusion et des priors de mouvement appris. Ses sorties peuvent servir de point de départ pour une édition vidéo et un post-traitement supplémentaires.

AnimateDiff : un créateur texte vers vidéo qui apporte du mouvement aux modèles de diffusion

AnimateDiff permet la génération texte vers vidéo, vous permettant de créer de courts clips ou animations directement à partir de prompts texte. Voici comment fonctionne le processus :

Prompt texte : Vous fournissez une description textuelle de la scène, des personnages, des actions ou des concepts que vous voulez voir animés.

Modèle de base texte vers image : AnimateDiff utilise un modèle de diffusion texte vers image pré-entraîné comme Stable Diffusion comme backbone pour générer les images initiales selon votre prompt texte. Le modèle de base contrôle le style, l'identité du personnage et le détail du sujet ; utilisez des modèles checkpoint comme ToonYou ou Realistic Vision avant d'appliquer le module.

Module de mouvement : Au cœur d'AnimateDiff se trouve un module de mouvement entraîné sur des vidéos réelles pour apprendre les schémas de mouvement et la dynamique généraux. Ce module est indépendant du modèle de diffusion de base.

Animation des images : AnimateDiff combine le modèle de diffusion de base et le module de mouvement. Il génère d'abord des images clés à partir de votre prompt texte avec le modèle de diffusion. Puis le module interpole des images intermédiaires entre ces clés, appliquant les priors de mouvement appris pour animer la scène.

Sortie vidéo : La sortie résultante est un court clip dépeignant les concepts décrits dans votre prompt texte, avec les éléments animés présentant un mouvement naturel appris à partir de vidéos réelles.

Quelques avantages clés d'AnimateDiff pour la génération texte vers vidéo sont

Plug-and-Play

Il peut animer n'importe quel modèle texte vers image sans réentraînement ou ajustement extensif spécifique à la vidéo.

Contrôlable

Vous pouvez guider l'animation via le prompt texte décrivant actions, mouvements de caméra, etc.

Efficace

Plus rapide que l'entraînement de modèles texte vers vidéo monolithiques à partir de zéro.

Cependant, les animations ne sont pas toujours parfaites et peuvent présenter des artefacts, surtout pour les mouvements complexes. Mais AnimateDiff offre un moyen puissant de visualiser directement des descriptions textuelles sous forme d'animations en exploitant des modèles de diffusion pré-entraînés.

AnimateDiff : un créateur image vers vidéo qui insuffle la vie aux visuels statiques

AnimateDiff peut aussi être utilisé pour la génération image vers vidéo, vous permettant d'animer des images statiques existantes en ajoutant du mouvement et de la dynamique. Voici comment cela fonctionne :

Image d'entrée : Vous fournissez une image statique que vous voulez animer. Cela peut être une photographie, une œuvre d'art numérique ou une sortie de modèle de diffusion.

Modèle de base image vers image : AnimateDiff utilise un modèle de diffusion image vers image pré-entraîné comme la capacité img2img de Stable Diffusion comme backbone.

Module de mouvement : Le même module de mouvement entraîné sur des vidéos réelles pour apprendre les schémas de mouvement généraux est utilisé.

Animation à partir de l'entrée : AnimateDiff prend l'image d'entrée et utilise le modèle de diffusion image vers image pour générer de légères variations qui servent d'images clés.

Application du mouvement : Le module de mouvement interpole ensuite des images intermédiaires entre ces images clés, appliquant la dynamique d'animation apprise pour animer les éléments de l'image d'entrée.

Sortie vidéo : Le résultat final est un clip vidéo où l'image statique d'origine a été ramenée à la vie avec un mouvement et une animation naturels.

Quelques avantages clés d'AnimateDiff pour la génération image vers vidéo sont :

Il peut animer n'importe quelle image d'entrée, y compris des modèles personnalisés ou des œuvres d'art.

Le mouvement est déduit automatiquement de l'entrée sans guidage supplémentaire.

Le niveau de mouvement peut être contrôlé en ajustant les paramètres.

Les instances simples fonctionnent mieux que les scènes très complexes.

Bien que moins contrôlable que le cas texte vers vidéo, l'image vers vidéo avec AnimateDiff offre un moyen facile d'ajouter de la dynamique aux images fixes existantes en exploitant la puissance des modèles de diffusion et des priors de mouvement appris.

Fonctionne avec vos styles préférés

Ce ne sont que des exemples de styles — AnimateDiff n'est pas un outil à apparence unique. Il apporte du mouvement aux esthétiques distinctives de vos modèles Stable Diffusion préférés.

Anime

Réaliste

Cartoon 3D

Ghibli

Encre

Film

Portrait

Cinématique

qu'est-ce qu'AnimateDiff

AnimateDiff est un outil d'IA qui peut transformer une image statique ou un prompt texte en vidéo animée en générant une séquence d'images qui se transforment en douceur. Il fonctionne en utilisant des modèles Stable Diffusion avec des modules de mouvement séparés pour prédire le mouvement entre les images. AnimateDiff permet aux utilisateurs de créer facilement de courts clips animés sans avoir à créer manuellement chaque image.

Comment créer une vidéo avec AnimateDiff en 4 étapes

Choisissez un modèle / style de base

Choisissez l'apparence souhaitée — anime, réaliste, cartoon, encre — parmi les modèles Stable Diffusion pris en charge.

Écrivez votre prompt

Décrivez la scène, le sujet, l'action et le mouvement de caméra que vous voulez animer.

Définissez la longueur et le FPS

Choisissez le nombre d'images et la fréquence d'images pour contrôler la durée et la fluidité du clip.

Générez et téléchargez

Lancez AnimateDiff, prévisualisez le résultat en boucle et exportez votre animation.

Les capacités d'AnimateDiff en un coup d'œil

Fonctionnalité	Ce qu'elle fait	Quand l'utiliser
Modules de mouvement v1/v2/v3/SDXL	Différents priors de mouvement entraînés pour des qualités et résolutions variées	Adaptez le module à votre modèle de base et à la résolution cible
Prompt Travel	Transition fluide entre prompts à travers les images	Créez des scènes évolutives ou des sujets en transformation
Motion LoRA	Ajoutez des mouvements de caméra spécifiques comme zoom/pan/roulis	Dirigez un mouvement de caméra cinématique
ControlNet	Guidez le mouvement et la structure avec des entrées de référence	Conservez une pose/composition cohérente
Boucle fermée	Faites boucler l'animation de manière transparente	Clips en boucle parfaits de style GIF
Interpolation d'images	Insérez des images intermédiaires pour un mouvement plus fluide	Augmentez le FPS perçu sans régénérer
Correction Hi-Res	Mettez à l'échelle tout en préservant le détail du mouvement	Sortie plus nette et de plus haute résolution
Accélération LCM / SDXL Turbo	Moins d'étapes pour une génération plus rapide	Itération rapide et aperçus

Prêt à animer votre idée ?

Commencez dès aujourd'hui à transformer vos textes et images en vidéos captivantes avec AnimateDiff.

Essayer AnimateDiff gratuitement