Visão geral
LoRA (Low-Rank Adaptation) é uma técnica de afinamento que ensina um modelo de IA um novo estilo visual usando um pequeno conjunto de imagens de exemplo. Funciona injetando novos “pesos de estilo” num modelo existente, tornando o treino rápido e eficiente. Este guia percorre o fluxo de trabalho completo:Preparar imagens de treino
Fazer curadoria e carregar imagens de alta qualidade que representem o estilo pretendido
Submeter tarefa de treino
Enviar um pedido POST para
/styles/train com os URLs das imagens e a configuraçãoPreparar imagens de treino
Curar o seu conjunto de dados
A qualidade das suas imagens de treino tem impacto direto nos resultados. Diferentes tipos de treino têm requisitos diferentes:| Tipo | Caso de uso | Dicas |
|---|---|---|
| Style | Estilos artísticos, estéticas visuais | Estilo consistente em diversos temas |
| Character | Semelhança pessoal, personagens consistentes | Poses, expressões e iluminação variadas |
| Object | Itens específicos, produtos | Vários ângulos, objeto consistente |
Quantas imagens?
A qualidade importa muito mais do que a quantidade. Um pequeno conjunto de imagens excelentes irá superar um grande conjunto de imagens medianas.| Tamanho do conjunto | Orientação |
|---|---|
| 5 imagens | Mínimo viável. Pode funcionar para estilos simples e consistentes |
| 10-30 imagens | Recomendado. Melhor equilíbrio entre qualidade e cobertura |
| 50+ imagens | Retornos decrescentes, a não ser que o estilo tenha muita variação |
Exemplos de conjuntos de dados
- Treino de personagem: fotografias de uma pessoa com poses, expressões e iluminação variadas. Evite incluir outras pessoas nas imagens.
- Treino de estilo: uma coleção de obras num estilo consistente. Por exemplo, The Metropolitan Museum of Art Ukiyo-E Dataset fornece xilogravuras japonesas ideais para treinar um estilo artístico.
Carregar imagens
Antes de treinar, carregue as suas imagens para obter URLs alojados. Use o endpoint/assets:
Treinar o seu estilo
Exemplo básico de treino
Submeta os seus URLs de imagens para começar o treino:Tipos de treino
O parâmetrotype define predefinições inteligentes otimizadas para o seu caso de uso:
| Tipo | Ideal para |
|---|---|
Style | Estilos artísticos, estéticas visuais |
Character | Semelhança pessoal, personagens consistentes |
Object | Itens específicos, produtos |
Default | Treino genérico |
Parâmetros
Parâmetros obrigatórios
Um nome descritivo para o seu estilo personalizado.Exemplo:
"Ukiyo-E Style", "Product Photos"Array de URLs de imagens a usar para o treino. Inclua mais imagens para melhores resultados.
Parâmetros opcionais
Modelo base para treino:Modelos de imagem:
flux_dev- Alta qualidade, versátilflux_schnell- Modelo em tempo real da BFLqwen- Modelo da Alibabaz-image- Modelo de imagem eficiente da Alibabawan22- Apenas geração de imagem
wan- Modelo de vídeo da Alibaba
Categoria de treino:
Style, Object, Character ou DefaultPalavra personalizada para ativar este estilo nos prompts. Quando não especificada, é usado o nome do estilo.
Parâmetros avançados
Parâmetros avançados
Controla a intensidade do treino. Valores mais altos treinam mais depressa, mas podem levar a overfitting.Intervalo recomendado: 0.0001 - 0.001
Iterações máximas de treino. Intervalo: 1-2000
Imagens processadas em simultâneo. Lotes maiores = treino mais rápido, mas mais memória.
Ajustar parâmetros avançados
Comece com as predefinições do campotype — funcionam bem na maioria dos casos. Só ajuste estes valores se estiver a ver problemas específicos:
Taxa de aprendizagem
Taxa de aprendizagem
Controla o quão agressivamente o modelo se adapta às suas imagens de treino.
Sinais de que precisa de ajustar:
| Valor | Quando usar |
|---|---|
| 0.0001 (mais baixo) | Problemas de overfitting, estilos complexos, conjuntos pequenos |
| 0.0003 (predefinição) | A maioria dos casos |
| 0.0005-0.001 (mais alto) | Treino mais rápido |
- Os resultados parecem idênticos às imagens de treino → baixe a taxa
- A influência do estilo é fraca após o treino → aumente ligeiramente a taxa
Passos de treino
Passos de treino
Quanto tempo o modelo treina com as suas imagens.
Sinais de que precisa de ajustar:
| Tamanho do conjunto | Passos recomendados |
|---|---|
| 5-10 imagens | 300-500 passos |
| 15-30 imagens | 500-800 passos |
| 50+ imagens | 800-1500 passos |
- Os resultados são demasiado rígidos, ignorando os prompts → reduza os passos
- A influência do estilo é fraca → aumente os passos
- As imagens geradas são iguais aos dados de treino → reduza os passos (overfitting)
Formato da resposta
Monitorizar o progresso do treino
O treino demora normalmente 5-15 minutos. Consulte a Jobs API para verificar o estado:Valores de estado da tarefa
Valores de estado da tarefa
As tarefas de treino progridem por estes estados:
- queued - À espera na fila
- processing - Treino ativo
- completed - Treino concluído com sucesso
- failed - Treino encontrou um erro
- cancelled - Tarefa cancelada manualmente
Utilizar o seu estilo treinado
Assim que o treino terminar, aplique o seu estilo à geração de imagens usando o parâmetrostyles:
Intensidade do estilo
O parâmetrostrength (0.0-1.0) controla o quão fortemente o seu estilo é aplicado:
| Intensidade | Efeito |
|---|---|
| 0.5-0.7 | Influência subtil, mantém flexibilidade do prompt |
| 0.8-0.9 | Aplicação forte do estilo, ponto de partida recomendado |
| 0.95-1.0 | Aderência máxima ao estilo, pode reduzir resposta ao prompt |
Combinar vários estilos
Aplique vários estilos adicionando-os ao arraystyles:
Boas práticas
Seleção de imagens
Seleção de imagens
- Use tantas imagens de alta qualidade quantas tiver para resultados ideais
- Assegure um estilo consistente em todas as imagens de treino
- Inclua variedade de temas mantendo a coerência de estilo
- Evite marcas de água, texto sobreposto ou artefactos
- Use imagens com pelo menos 1024x1024 de resolução
Configuração do treino
Configuração do treino
- Comece com os parâmetros predefinidos usando o campo
type - Para estilos: 500-1000 passos são geralmente suficientes
- Taxas de aprendizagem mais baixas (0.0001-0.0003) evitam overfitting
- Aumente os passos se o estilo não for suficientemente forte
- Reduza os passos se o resultado for demasiado rígido
Palavras de ativação
Palavras de ativação
- Use a mesma palavra de ativação se planear combinar vários estilos
- As palavras de ativação são injetadas automaticamente no prompt se incluir o estilo
- Evite palavras comuns que apareçam em prompts típicos
- Use underscores para gatilhos com várias palavras:
my_custom_style