Aller au contenu

ComfyUI

Dans cet article

Information

ComfyUI est une interface utilisateur conçue pour créer des flux de travail de génération d'images à l'aide de modèles d'apprentissage automatique. Il fournit un environnement de programmation visuelle basé sur des nœuds, permettant aux utilisateurs de construire des pipelines de traitement d'images complexes sans avoir besoin d'écrire du code.

ComfyUI : Fonctionnalités clés

  • Programmation visuelle : Une interface intuitive basée sur des nœuds pour construire des flux de travail de génération d'images complexes.
  • Prise en charge des modèles : Compatibilité avec une large gamme de modèles de génération d'images, y compris diverses versions de Stable Diffusion.
  • Extensibilité : Possibilité d'ajouter des nœuds personnalisés et d'intégrer vos propres modèles ou algorithmes.
  • Contrôle des paramètres : Contrôle précis des paramètres de génération, y compris la taille de l'image, le nombre d'étapes, les méthodes d'échantillonnage, etc.
  • Prise en charge de img2img et de l'inpainting : Utilisez des images existantes comme base ou masque pour la génération d'images.
  • Intégration CUDA : Utilisation optimisée du GPU pour une génération accélérée.
  • Sauvegarde et chargement des flux de travail : Sauvegardez des configurations complexes pour les réutiliser ou les partager.
  • Intégration Flux : Automatisez la gestion des flux de travail et l'orchestration des tâches via Flux.
  • Communauté active : Mises à jour régulières, une large sélection de nœuds créés par la communauté et d'extensions.
  • Exécution locale : Tous les calculs sont effectués localement, garantissant la confidentialité et le contrôle des données.

Un serveur privé avec ComfyUI offre des performances élevées, un contrôle total sur le processus de génération et la confidentialité des données.

Fonctionnalités de déploiement

ID Nom du logiciel Système d'exploitation compatible VM BM VGPU GPU Min CPU (Cœurs) Min RAM (GB) Min HDD/SSD (GB) Domaine personnalisé Actif
213 ComfyUI Ubuntu 22.04 - - + + 4 16 240 Non COMMANDER
  • Temps d'installation : 20 à 40 minutes, configuration du système d'exploitation incluse ;
  • Installe Python, ComfyUI, CUDA, les pilotes NVIDIA et Flux ;
  • Configuration système requise : Une carte graphique professionnelle (NVIDIA RTX A4000/A5000, NVIDIA A100), au moins 16 Go de RAM.
  • Tous les modèles sont stockés dans le répertoire /root/ComfyUI/models/ dans des sous-répertoires spécifiques :

    • checkpoints/ : Modèles principaux de Stable Diffusion ;
    • loras/ : Modèles LoRA ;
    • vae/ : Modèles VAE ;
    • controlnet/ : Modèles ControlNet ;
    • upscale_models/ : Modèles pour l'augmentation de la résolution des images ;
    • embeddings/ : Embeddings Textual Inversion ;
    • hypernetworks/ : Hypernetworks.
  • Pour ajouter un nouveau modèle, copiez les fichiers du modèle dans le répertoire correspondant et redémarrez ComfyUI.

Remarque

Sauf indication contraire, nous installons par défaut la dernière version stable du logiciel depuis le site Web du développeur ou les dépôts du système d'exploitation.

Premiers pas après le déploiement de ComfyUI

Une fois votre commande payée, vous recevrez une notification à l'adresse e-mail fournie lors de l'inscription, vous informant que votre serveur est prêt. Cette notification inclura l'adresse IP du VPS, ainsi que les identifiants de connexion. Les clients de notre entreprise gèrent leur équipement via le panneau de gestion des serveurs et l'APIInvapi.

Les données d'authentification, que l'on peut trouver dans l'onglet Configuration >> Tags du panneau de gestion des serveurs ou dans l'e-mail reçu, incluent :

  • Link to access the ComfyUI web interface : dans la balise webpanel ;
  • Login : root - pour l'administrateur ;
  • Password : envoyé à votre adresse e-mail lors de la livraison du serveur.

Connexion et configuration initiale

Après avoir cliqué sur le lien de la balise webpanel, vous serez redirigé vers l'espace de travail ComfyUI :

L'espace de travail est une interface graphique où les éléments de contrôle principaux sont affichés sous forme de nœuds interconnectés. La section supérieure présente la barre d'outils avec le menu déroulant "Unsaved Workflow" et le bouton "Queue" à droite.

Les éléments de travail clés incluent :

  • Le nœud Load Checkpoint pour charger le point de contrôle du modèle ;
  • Deux nœuds CLIP Text Encode pour saisir les prompts de texte, où vous pouvez spécifier la description d'image souhaitée et les éléments indésirables ;
  • Le nœud KSampler avec les paramètres de génération, y compris :
    • seed ;
    • steps ;
    • cfg ;
    • sampler (euler) ;
    • scheduler ;
    • denoise ;
  • Le nœud Empty Latent Image pour définir la résolution de l'image de sortie (512x512 pixels) ;
  • Les nœuds VAE Decode et Save Image pour le traitement final et la sauvegarde du résultat.

Tous les nœuds sont connectés par des lignes colorées, indiquant le chemin du flux de données pendant la génération d'images. Chaque nœud peut être configuré en modifiant ses paramètres d'interface. Cette interface vous permet de construire et de configurer visuellement le processus de génération d'images en connectant différents blocs fonctionnels et en définissant les paramètres pour chaque étape du traitement.

Pour ajouter un nouveau nœud à l'espace de travail, faites un clic droit n'importe où et sélectionnez le nœud souhaité dans le menu contextuel. Les nœuds sont organisés par catégories pour faciliter la recherche :

Le bouton (Gear) en bas à gauche de l'interface ComfyUI ouvre la fenêtre Settings, contenant tous les paramètres principaux de l'application.

Génération d'images

Sélection d'un flux de travail

Après avoir accédé à l'interface Web ComfyUI, dans le coin supérieur gauche du menu Workflow, sélectionnez la configuration pour le modèle Flux (flux1-dev-fp8) dans la liste déroulante :

Le flux de travail chargé configurera automatiquement tous les nœuds et paramètres nécessaires.

Pour générer une image, saisissez une invite dans le champ CLIP Text Encode (Positive Prompt) et cliquez sur le bouton Queue :

Si tout est correctement configuré, vous verrez l'image générée dans l'interface ComfyUI :

Remarque

Des informations détaillées sur l'utilisation de ComfyUI peuvent être trouvées dans la documentation officielle du projet.

Installation du modèle Stable Diffusion 3.5 Medium

Le modèle SD 3.5 Medium peut être exécuté sur tout vGPU Nvidia avec RTX et 16+ Go de mémoire vidéo (A4000, A5000, A6000, A100, H100, 4090).

Voici comment procéder :

  1. Connectez-vous en tant que root via SSH à votre serveur avec ComfyUI et accédez au répertoire /root/ComfyUI/models/checkpoints en utilisant la commande :

    cd ComfyUI/models/checkpoints
    
  2. Téléchargez le modèle SD 3.5 Medium avec encodeurs intégrés :

    wget https://huggingface.co/Comfy-Org/stable-diffusion-3.5-fp8/resolve/main/sd3.5_medium_incl_clips_t5xxlfp8scaled.safetensors
    
  3. Connectez-vous à l'interface Web ComfyUI et utilisez le même flux de travail que celui proposé par défaut pour le modèle Flux, en sélectionnant le modèle sd3.5_medium_incl_clips_t5xxlfp8scaled.safetensors dans le bloc Load Checkpoint et en modifiant les valeurs dans le bloc KSampler comme suit :

    • cfg = 4.5
    • scheduler = sgm_uniform
    • denoise = 0.95

Remarque

Vous pouvez télécharger le flux de travail vous-même lien et "glisser-déposer" son fichier JSON dans ComfyUI ouvert dans votre navigateur.

Après cela, vous pouvez générer des images en utilisant le nouveau modèle.

Commande d'un serveur avec ComfyUI via l'API