Panoramica
LoRA (Low-Rank Adaptation) è una tecnica di fine-tuning che insegna a un modello di IA un nuovo stile visivo utilizzando un piccolo insieme di immagini di esempio. Funziona iniettando nuovi “style weights” in un modello esistente, rendendo l’addestramento veloce ed efficiente. Questa guida illustra il flusso completo:Prepara le immagini di addestramento
Cura e carica immagini di alta qualità che rappresentino lo stile desiderato
Invia il job di addestramento
Invia una richiesta POST a
/styles/train con gli URL delle tue immagini e la configurazionePrepara le immagini di addestramento
Curare il tuo dataset
La qualità delle immagini di addestramento influisce direttamente sui risultati. Tipi di addestramento diversi hanno requisiti diversi:| Tipo | Caso d’uso | Suggerimenti |
|---|---|---|
| Style | Stili artistici, estetiche visive | Stile coerente su soggetti vari |
| Character | Somiglianza personale, personaggi coerenti | Pose, espressioni, illuminazione variate |
| Object | Oggetti specifici, prodotti | Più angolazioni, oggetto coerente |
Quante immagini?
La qualità conta molto più della quantità. Un piccolo insieme di immagini eccellenti supererà un ampio insieme di immagini mediocri.| Dimensione del dataset | Indicazioni |
|---|---|
| 5 immagini | Minimo praticabile. Può funzionare per stili semplici e coerenti |
| 10-30 immagini | Consigliato. Miglior equilibrio tra qualità e copertura |
| 50+ immagini | Ritorni decrescenti a meno che lo stile non abbia grande variazione |
Dataset di esempio
- Addestramento di personaggi: foto di una persona con pose, espressioni e condizioni di illuminazione variate. Evita di includere altre persone nelle immagini.
- Addestramento di stile: una collezione di opere d’arte in uno stile coerente. Ad esempio, The Metropolitan Museum of Art Ukiyo-E Dataset fornisce stampe xilografiche giapponesi ideali per addestrare uno stile artistico.
Carica le immagini
Prima dell’addestramento, carica le tue immagini per ottenere URL ospitati. Usa l’endpoint/assets:
Addestra il tuo stile
Esempio di addestramento base
Invia gli URL delle tue immagini per iniziare l’addestramento:Tipi di addestramento
Il parametrotype imposta valori predefiniti intelligenti ottimizzati per il tuo caso d’uso:
| Tipo | Ideale per |
|---|---|
Style | Stili artistici, estetiche visive |
Character | Somiglianza personale, personaggi coerenti |
Object | Oggetti specifici, prodotti |
Default | Addestramento generico |
Parametri
Parametri obbligatori
Un nome descrittivo per il tuo stile personalizzato.Esempio:
"Ukiyo-E Style", "Product Photos"Array di URL di immagini su cui addestrare. Includi più immagini per risultati migliori.
Parametri opzionali
Modello di base per l’addestramento:Modelli di immagini:
flux_dev- Alta qualità, versatileflux_schnell- Modello realtime di BFLqwen- Modello di Alibabaz-image- Modello di immagini efficiente di Alibabawan22- Solo generazione di immagini
wan- Modello video di Alibaba
Categoria di addestramento:
Style, Object, Character o DefaultParola personalizzata per attivare questo stile nei prompt. Se non specificata, viene utilizzato il nome dello stile.
Parametri avanzati
Parametri avanzati
Controlla l’intensità dell’addestramento. Valori più alti addestrano più velocemente ma possono causare overfitting.Intervallo consigliato: 0.0001 - 0.001
Iterazioni massime di addestramento. Intervallo: 1-2000
Immagini elaborate simultaneamente. Batch più grandi = addestramento più veloce ma più memoria.
Ottimizzare i parametri avanzati
Inizia con i valori predefiniti impostati dal campotype: funzionano bene per la maggior parte dei casi. Modificali solo se noti problemi specifici:
Learning Rate
Learning Rate
Controlla con quanta aggressività il modello si adatta alle tue immagini di addestramento.
Segnali che indicano di regolare:
| Valore | Quando usarlo |
|---|---|
| 0.0001 (più basso) | Problemi di overfitting, stili complessi, dataset piccoli |
| 0.0003 (predefinito) | La maggior parte dei casi d’uso |
| 0.0005-0.001 (più alto) | Addestramento più rapido |
- Gli output sembrano identici alle immagini di addestramento → abbassa il valore
- L’influenza dello stile è debole dopo l’addestramento → aumenta leggermente il valore
Training Steps
Training Steps
Per quanto tempo il modello viene addestrato sulle tue immagini.
Segnali che indicano di regolare:
| Dimensione del dataset | Step consigliati |
|---|---|
| 5-10 immagini | 300-500 step |
| 15-30 immagini | 500-800 step |
| 50+ immagini | 800-1500 step |
- Gli output sono troppo rigidi, ignorano i prompt → riduci gli step
- L’influenza dello stile è debole → aumenta gli step
- Le immagini generate somigliano esattamente ai dati di addestramento → riduci gli step (overfitting)
Formato della risposta
Monitora i progressi dell’addestramento
L’addestramento richiede tipicamente 5-15 minuti. Effettua polling sull’API Jobs per verificare lo stato:Valori di stato del job
Valori di stato del job
I job di addestramento attraversano questi stati:
- queued - In attesa in coda
- processing - Addestramento attivo
- completed - Addestramento terminato con successo
- failed - L’addestramento ha riscontrato un errore
- cancelled - Job cancellato manualmente
Usa il tuo stile addestrato
Una volta completato l’addestramento, applica il tuo stile alla generazione di immagini usando il parametrostyles:
Intensità dello stile
Il parametrostrength (0.0-1.0) controlla quanto fortemente viene applicato il tuo stile:
| Intensità | Effetto |
|---|---|
| 0.5-0.7 | Influenza sottile, mantiene flessibilità del prompt |
| 0.8-0.9 | Applicazione forte dello stile, punto di partenza consigliato |
| 0.95-1.0 | Massima aderenza allo stile, può ridurre la reattività al prompt |
Combinare più stili
Applica più stili aggiungendoli all’arraystyles:
Buone pratiche
Selezione delle immagini
Selezione delle immagini
- Usa quante più immagini di alta qualità hai per risultati ottimali
- Assicura uno stile coerente in tutte le immagini di addestramento
- Includi varietà nei soggetti mantenendo coerenza stilistica
- Evita watermark, sovrapposizioni di testo o artefatti
- Usa immagini di almeno 1024x1024 di risoluzione
Configurazione dell’addestramento
Configurazione dell’addestramento
- Inizia con i parametri predefiniti usando il campo
type - Per gli stili: 500-1000 step sono di solito sufficienti
- Learning rate più bassi (0.0001-0.0003) prevengono l’overfitting
- Aumenta gli step se lo stile non è abbastanza forte
- Riduci gli step se l’output è troppo rigido
Trigger word
Trigger word
- Usa la stessa trigger word se prevedi di combinare più stili
- Le trigger word vengono iniettate automaticamente nel prompt se includi lo stile
- Evita parole comuni che compaiono nei prompt tipici
- Usa underscore per trigger di più parole:
my_custom_style