Vue d’ensemble
LoRA (Low-Rank Adaptation) est une technique de fine-tuning qui apprend à un modèle d’IA un nouveau style visuel à partir d’un petit ensemble d’images d’exemple. Elle fonctionne en injectant de nouveaux « poids de style » dans un modèle existant, ce qui rend l’entraînement à la fois rapide et efficace. Ce guide vous accompagne tout au long du workflow complet :Préparer les images d'entraînement
Sélectionnez et téléversez des images de haute qualité qui représentent le style souhaité
Soumettre le job d'entraînement
Envoyez une requête POST à
/styles/train avec les URL de vos images et votre configurationPréparer les images d’entraînement
Constituer votre jeu de données
La qualité de vos images d’entraînement a un impact direct sur les résultats. Les différents types d’entraînement ont des exigences différentes :| Type | Cas d’usage | Conseils |
|---|---|---|
| Style | Styles artistiques, esthétiques visuelles | Style cohérent sur des sujets variés |
| Character | Ressemblance personnelle, personnages cohérents | Poses, expressions et éclairages variés |
| Object | Éléments spécifiques, produits | Angles multiples, objet cohérent |
Combien d’images ?
La qualité importe bien plus que la quantité. Un petit ensemble d’excellentes images surpassera un grand ensemble d’images médiocres.| Taille du jeu de données | Recommandation |
|---|---|
| 5 images | Minimum viable. Peut convenir pour des styles simples et cohérents |
| 10-30 images | Recommandé. Meilleur équilibre entre qualité et couverture |
| 50+ images | Rendements décroissants sauf si le style présente une forte variation |
Exemples de jeux de données
- Entraînement de personnage : photos d’une personne avec des poses, expressions et conditions d’éclairage variées. Évitez d’inclure d’autres personnes dans les images.
- Entraînement de style : une collection d’œuvres dans un style cohérent. Par exemple, le jeu de données Ukiyo-E du Metropolitan Museum of Art propose des estampes japonaises idéales pour entraîner un style artistique.
Téléverser les images
Avant l’entraînement, téléversez vos images pour obtenir des URL hébergées. Utilisez le point de terminaison/assets :
Entraîner votre style
Exemple d’entraînement de base
Soumettez les URL de vos images pour démarrer l’entraînement :Types d’entraînement
Le paramètretype définit des valeurs par défaut intelligentes optimisées pour votre cas d’usage :
| Type | Idéal pour |
|---|---|
Style | Styles artistiques, esthétiques visuelles |
Character | Ressemblance personnelle, personnages cohérents |
Object | Éléments spécifiques, produits |
Default | Entraînement générique |
Paramètres
Paramètres requis
Un nom descriptif pour votre style personnalisé.Exemple :
"Ukiyo-E Style", "Product Photos"Tableau d’URL d’images sur lesquelles s’entraîner. Ajoutez plus d’images pour de meilleurs résultats.
Paramètres optionnels
Modèle de base pour l’entraînement :Modèles d’image :
flux_dev- Haute qualité, polyvalentflux_schnell- Modèle temps réel de BFLqwen- Modèle d’Alibabaz-image- Modèle d’image efficace d’Alibabawan22- Génération d’images uniquement
wan- Modèle vidéo d’Alibaba
Catégorie d’entraînement :
Style, Object, Character ou DefaultMot personnalisé pour activer ce style dans les prompts. Lorsqu’il n’est pas spécifié, utilise le nom du style.
Paramètres avancés
Paramètres avancés
Contrôle l’intensité de l’entraînement. Des valeurs plus élevées entraînent plus vite mais peuvent conduire au surapprentissage.Plage recommandée : 0,0001 - 0,001
Nombre maximal d’itérations d’entraînement. Plage : 1-2000
Images traitées simultanément. Des lots plus grands = entraînement plus rapide mais plus de mémoire.
Ajuster les paramètres avancés
Commencez avec les valeurs par défaut définies par le champtype — elles fonctionnent bien dans la plupart des cas. Ne les ajustez que si vous rencontrez des problèmes spécifiques :
Learning Rate
Learning Rate
Contrôle l’agressivité avec laquelle le modèle s’adapte à vos images d’entraînement.
Signes qu’il faut ajuster :
| Valeur | Quand l’utiliser |
|---|---|
| 0,0001 (plus faible) | Problèmes de surapprentissage, styles complexes, petits jeux de données |
| 0,0003 (par défaut) | La plupart des cas d’usage |
| 0,0005-0,001 (plus élevé) | Entraînement plus rapide |
- Les résultats sont identiques aux images d’entraînement → réduisez le taux
- L’influence du style est faible après l’entraînement → augmentez légèrement le taux
Étapes d'entraînement
Étapes d'entraînement
Durée pendant laquelle le modèle s’entraîne sur vos images.
Signes qu’il faut ajuster :
| Taille du jeu de données | Étapes recommandées |
|---|---|
| 5-10 images | 300-500 étapes |
| 15-30 images | 500-800 étapes |
| 50+ images | 800-1500 étapes |
- Les résultats sont trop rigides et ignorent les prompts → réduisez les étapes
- L’influence du style est faible → augmentez les étapes
- Les images générées ressemblent exactement aux données d’entraînement → réduisez les étapes (surapprentissage)
Format de réponse
Suivre la progression de l’entraînement
L’entraînement prend généralement de 5 à 15 minutes. Interrogez l’API Jobs pour vérifier l’état :Valeurs d'état des jobs
Valeurs d'état des jobs
Les jobs d’entraînement passent par ces états :
- queued - En attente dans la file
- processing - Entraînement en cours
- completed - Entraînement terminé avec succès
- failed - L’entraînement a rencontré une erreur
- cancelled - Job annulé manuellement
Utiliser votre style entraîné
Une fois l’entraînement terminé, appliquez votre style à la génération d’images à l’aide du paramètrestyles :
Intensité du style
Le paramètrestrength (0,0-1,0) contrôle avec quelle force votre style est appliqué :
| Intensité | Effet |
|---|---|
| 0,5-0,7 | Influence subtile, préserve la flexibilité du prompt |
| 0,8-0,9 | Application marquée du style, point de départ recommandé |
| 0,95-1,0 | Adhérence maximale au style, peut réduire la réactivité au prompt |
Combiner plusieurs styles
Appliquez plusieurs styles en les ajoutant au tableaustyles :
Bonnes pratiques
Sélection des images
Sélection des images
- Utilisez autant d’images de haute qualité que possible pour des résultats optimaux
- Assurez-vous d’un style cohérent sur toutes les images d’entraînement
- Incluez une variété de sujets tout en maintenant la cohérence stylistique
- Évitez les filigranes, superpositions de texte ou artefacts
- Utilisez des images d’au moins 1024x1024 de résolution
Configuration de l'entraînement
Configuration de l'entraînement
- Commencez avec les paramètres par défaut en utilisant le champ
type - Pour les styles : 500-1000 étapes suffisent généralement
- Des taux d’apprentissage plus faibles (0,0001-0,0003) préviennent le surapprentissage
- Augmentez les étapes si le style n’est pas assez marqué
- Diminuez les étapes si le résultat est trop rigide
Mots déclencheurs
Mots déclencheurs
- Utilisez le même mot déclencheur si vous prévoyez de combiner plusieurs styles
- Les mots déclencheurs sont automatiquement injectés dans le prompt lorsque vous incluez le style
- Évitez les mots courants qui apparaissent dans des prompts typiques
- Utilisez des underscores pour les déclencheurs à plusieurs mots :
my_custom_style