Descripción general
LoRA (Low-Rank Adaptation) es una técnica de ajuste fino que enseña a un modelo de IA un nuevo estilo visual usando un pequeño conjunto de imágenes de ejemplo. Funciona inyectando nuevos “pesos de estilo” en un modelo existente, lo que hace que el entrenamiento sea rápido y eficiente. Esta guía recorre el flujo completo:Prepara las imágenes de entrenamiento
Cura y sube imágenes de alta calidad que representen el estilo deseado
Envía el trabajo de entrenamiento
Envía una solicitud POST a
/styles/train con tus URLs de imágenes y la configuraciónPrepara las imágenes de entrenamiento
Curar tu dataset
La calidad de tus imágenes de entrenamiento impacta directamente en los resultados. Los distintos tipos de entrenamiento tienen requisitos diferentes:| Tipo | Caso de uso | Consejos |
|---|---|---|
| Style | Estilos artísticos, estéticas visuales | Estilo consistente en sujetos variados |
| Character | Semejanza personal, personajes consistentes | Poses, expresiones e iluminación variadas |
| Object | Elementos u objetos específicos | Múltiples ángulos, objeto consistente |
¿Cuántas imágenes?
La calidad importa mucho más que la cantidad. Un pequeño conjunto de imágenes excelentes superará a un conjunto grande de imágenes mediocres.| Tamaño del dataset | Guía |
|---|---|
| 5 imágenes | Mínimo viable. Puede funcionar para estilos simples y consistentes |
| 10-30 imágenes | Recomendado. Mejor balance entre calidad y cobertura |
| 50+ imágenes | Rendimientos decrecientes salvo que el estilo tenga alta variación |
Datasets de ejemplo
- Entrenamiento de personaje: fotos de una persona con poses, expresiones y condiciones de iluminación variadas. Evita incluir otras personas en las imágenes.
- Entrenamiento de estilo: una colección de obras de arte con un estilo consistente. Por ejemplo, The Metropolitan Museum of Art Ukiyo-E Dataset ofrece grabados japoneses en madera ideales para entrenar un estilo artístico.
Sube las imágenes
Antes de entrenar, sube tus imágenes para obtener URLs alojadas. Usa el endpoint/assets:
Entrena tu estilo
Ejemplo básico de entrenamiento
Envía las URLs de tus imágenes para iniciar el entrenamiento:Tipos de entrenamiento
El parámetrotype establece valores predeterminados inteligentes optimizados para tu caso de uso:
| Tipo | Ideal para |
|---|---|
Style | Estilos artísticos, estéticas visuales |
Character | Semejanza personal, personajes consistentes |
Object | Elementos o productos específicos |
Default | Entrenamiento genérico |
Parámetros
Parámetros obligatorios
Un nombre descriptivo para tu estilo personalizado.Ejemplo:
"Ukiyo-E Style", "Product Photos"Arreglo de URLs de imágenes con las que entrenar. Incluye más imágenes para mejores resultados.
Parámetros opcionales
Modelo base para entrenamiento:Modelos de imagen:
flux_dev- Alta calidad, versátilflux_schnell- El modelo en tiempo real de BFLqwen- El modelo de Alibabaz-image- El modelo de imagen eficiente de Alibabawan22- Solo generación de imagen
wan- El modelo de video de Alibaba
Categoría de entrenamiento:
Style, Object, Character o DefaultPalabra personalizada para activar este estilo en los prompts. Si no se especifica, se usa el nombre del estilo.
Parámetros avanzados
Parámetros avanzados
Controla la intensidad del entrenamiento. Valores más altos entrenan más rápido pero pueden sobreajustar.Rango recomendado: 0.0001 - 0.001
Máximo de iteraciones de entrenamiento. Rango: 1-2000
Imágenes procesadas simultáneamente. Lotes más grandes = entrenamiento más rápido pero más memoria.
Ajustar parámetros avanzados
Comienza con los valores por defecto que establece el campotype — funcionan bien en la mayoría de los casos. Solo ajústalos si observas problemas específicos:
Tasa de aprendizaje
Tasa de aprendizaje
Controla con qué agresividad el modelo se adapta a tus imágenes de entrenamiento.
Señales de que necesitas ajustar:
| Valor | Cuándo usarlo |
|---|---|
| 0.0001 (menor) | Problemas de sobreajuste, estilos complejos, datasets pequeños |
| 0.0003 (por defecto) | La mayoría de los casos |
| 0.0005-0.001 (mayor) | Entrenamiento más rápido |
- Las salidas se ven idénticas a las imágenes de entrenamiento → baja la tasa
- La influencia del estilo es débil tras el entrenamiento → sube la tasa ligeramente
Pasos de entrenamiento
Pasos de entrenamiento
Cuánto tiempo entrena el modelo con tus imágenes.
Señales de que necesitas ajustar:
| Tamaño del dataset | Pasos recomendados |
|---|---|
| 5-10 imágenes | 300-500 pasos |
| 15-30 imágenes | 500-800 pasos |
| 50+ imágenes | 800-1500 pasos |
- Las salidas son demasiado rígidas e ignoran los prompts → reduce los pasos
- La influencia del estilo es débil → aumenta los pasos
- Las imágenes generadas se ven exactamente como los datos de entrenamiento → reduce los pasos (sobreajuste)
Formato de respuesta
Monitorea el progreso del entrenamiento
El entrenamiento suele tardar de 5 a 15 minutos. Consulta la API de Jobs para verificar el estado:Valores del estado del trabajo
Valores del estado del trabajo
Los trabajos de entrenamiento pasan por estos estados:
- queued - En espera en la cola
- processing - Entrenamiento activo
- completed - Entrenamiento finalizado con éxito
- failed - El entrenamiento encontró un error
- cancelled - Trabajo cancelado manualmente
Usa tu estilo entrenado
Una vez completado el entrenamiento, aplica tu estilo a la generación de imágenes usando el parámetrostyles:
Intensidad del estilo
El parámetrostrength (0.0-1.0) controla con qué fuerza se aplica tu estilo:
| Intensidad | Efecto |
|---|---|
| 0.5-0.7 | Influencia sutil, mantiene la flexibilidad del prompt |
| 0.8-0.9 | Aplicación fuerte del estilo, punto de partida recomendado |
| 0.95-1.0 | Máximo apego al estilo, puede reducir la respuesta al prompt |
Combinar múltiples estilos
Aplica varios estilos agregándolos al arreglostyles:
Buenas prácticas
Selección de imágenes
Selección de imágenes
- Usa tantas imágenes de alta calidad como tengas para obtener resultados óptimos
- Asegura un estilo consistente en todas las imágenes de entrenamiento
- Incluye variedad de sujetos manteniendo la coherencia de estilo
- Evita marcas de agua, textos superpuestos o artefactos
- Usa imágenes de al menos 1024x1024 de resolución
Configuración del entrenamiento
Configuración del entrenamiento
- Comienza con los parámetros por defecto usando el campo
type - Para estilos: 500-1000 pasos suelen ser suficientes
- Tasas de aprendizaje más bajas (0.0001-0.0003) previenen el sobreajuste
- Aumenta los pasos si el estilo no es lo suficientemente fuerte
- Reduce los pasos si la salida es demasiado rígida
Palabras de activación
Palabras de activación
- Usa la misma palabra de activación si planeas combinar varios estilos
- Las palabras de activación se inyectan automáticamente en el prompt si incluyes el estilo
- Evita palabras comunes que aparezcan en prompts típicos
- Usa guiones bajos para triggers de varias palabras:
my_custom_style