Обзор
LoRA (Low-Rank Adaptation) — техника тонкой настройки, которая обучает модель ИИ новому визуальному стилю на небольшом наборе примеров. Она внедряет новые «веса стиля» в существующую модель, что делает обучение быстрым и эффективным. Это руководство описывает полный рабочий процесс:Подготовьте изображения для обучения
Отберите и загрузите качественные изображения, представляющие желаемый стиль
Отправьте задание на обучение
Отправьте POST-запрос на
/styles/train с URL изображений и конфигурациейПодготовка изображений для обучения
Формирование датасета
Качество обучающих изображений напрямую влияет на результат. У разных типов обучения разные требования:| Тип | Сценарий использования | Советы |
|---|---|---|
| Style | Художественные стили, визуальная эстетика | Согласованный стиль на разных сюжетах |
| Character | Персональное сходство, консистентные персонажи | Разнообразные позы, выражения, освещение |
| Object | Конкретные предметы, продукты | Несколько ракурсов, один и тот же объект |
Сколько нужно изображений?
Качество важнее количества. Небольшой набор превосходных изображений даст лучший результат, чем большой набор посредственных.| Размер датасета | Рекомендации |
|---|---|
| 5 изображений | Минимально работоспособный. Подходит для простых, консистентных стилей |
| 10–30 изображений | Рекомендуется. Оптимальный баланс качества и охвата |
| 50+ изображений | Диминishing returns, если только стиль не отличается высокой вариативностью |
Примеры датасетов
- Обучение персонажей: фотографии человека с разными позами, выражениями лица и освещением. Избегайте изображений с посторонними людьми.
- Обучение стилю: коллекция работ в одном стиле. Например, The Metropolitan Museum of Art Ukiyo-E Dataset предоставляет японские гравюры укиё-э, идеально подходящие для обучения художественному стилю.
Загрузка изображений
Перед обучением загрузите изображения, чтобы получить хостинговые URL. Используйте эндпоинт/assets:
Обучение стиля
Базовый пример обучения
Отправьте URL изображений, чтобы запустить обучение:Типы обучения
Параметрtype задаёт разумные значения по умолчанию, оптимизированные под ваш сценарий:
| Тип | Лучше всего подходит для |
|---|---|
Style | Художественные стили, визуальная эстетика |
Character | Персональное сходство, консистентные персонажи |
Object | Конкретные предметы, продукты |
Default | Универсальное обучение |
Параметры
Обязательные параметры
Описательное имя для вашего пользовательского стиля.Пример:
"Ukiyo-E Style", "Product Photos"Массив URL изображений для обучения. Больше изображений — лучше результат.
Необязательные параметры
Базовая модель для обучения:Модели изображений:
flux_dev— высокое качество, универсальнаяflux_schnell— realtime-модель BFLqwen— модель Alibabaz-image— эффективная модель изображений от Alibabawan22— только генерация изображений
wan— видеомодель Alibaba
Категория обучения:
Style, Object, Character или DefaultПользовательское слово для активации стиля в запросах. Если не указано, используется имя стиля.
Расширенные параметры
Расширенные параметры
Контролирует интенсивность обучения. Высокие значения ускоряют обучение, но могут приводить к переобучению.Рекомендуемый диапазон: 0.0001 – 0.001
Максимальное число итераций обучения. Диапазон: 1–2000
Число изображений, обрабатываемых одновременно. Больший batch = быстрее обучение, но больше памяти.
Настройка расширенных параметров
Начинайте с параметров по умолчанию, задаваемых полемtype — они хорошо работают в большинстве случаев. Меняйте эти значения, только если сталкиваетесь с конкретными проблемами:
Скорость обучения
Скорость обучения
Контролирует, насколько агрессивно модель адаптируется к вашим обучающим изображениям.
Признаки, что стоит скорректировать:
| Значение | Когда использовать |
|---|---|
| 0.0001 (ниже) | Проблемы переобучения, сложные стили, маленькие датасеты |
| 0.0003 (по умолчанию) | Большинство сценариев |
| 0.0005–0.001 (выше) | Более быстрое обучение |
- Результаты выглядят как копии обучающих изображений → понизьте скорость
- Влияние стиля слабое после обучения → слегка повысьте скорость
Шаги обучения
Шаги обучения
Как долго модель обучается на ваших изображениях.
Признаки, что стоит скорректировать:
| Размер датасета | Рекомендуемое число шагов |
|---|---|
| 5–10 изображений | 300–500 шагов |
| 15–30 изображений | 500–800 шагов |
| 50+ изображений | 800–1500 шагов |
- Результаты слишком жёсткие, игнорируют запросы → уменьшите число шагов
- Влияние стиля слабое → увеличьте число шагов
- Сгенерированные изображения выглядят точно как обучающие данные → уменьшите число шагов (переобучение)
Формат ответа
Отслеживание прогресса обучения
Обучение обычно занимает 5–15 минут. Опрашивайте Jobs API для проверки статуса:Значения статуса задания
Значения статуса задания
Задания обучения проходят через следующие состояния:
- queued — ожидает в очереди
- processing — активное обучение
- completed — обучение успешно завершено
- failed — при обучении произошла ошибка
- cancelled — задание отменено вручную
Использование обученного стиля
Как только обучение завершится, применяйте стиль при генерации изображений через параметрstyles:
Сила стиля
Параметрstrength (0.0–1.0) контролирует, насколько сильно применяется ваш стиль:
| Сила | Эффект |
|---|---|
| 0.5–0.7 | Мягкое влияние, сохраняется гибкость запроса |
| 0.8–0.9 | Сильное применение стиля, рекомендуемая стартовая точка |
| 0.95–1.0 | Максимальное следование стилю, может снизить отклик на запрос |
Комбинирование нескольких стилей
Применяйте несколько стилей, добавляя их в массивstyles:
Лучшие практики
Подбор изображений
Подбор изображений
- Для оптимального результата используйте как можно больше качественных изображений
- Обеспечьте согласованный стиль на всех обучающих изображениях
- Включайте разнообразные сюжеты, сохраняя единство стиля
- Избегайте водяных знаков, надписей и артефактов
- Используйте изображения не ниже 1024x1024
Конфигурация обучения
Конфигурация обучения
- Начинайте с параметров по умолчанию через поле
type - Для стилей обычно достаточно 500–1000 шагов
- Более низкие значения скорости обучения (0.0001–0.0003) предотвращают переобучение
- Увеличьте число шагов, если стиль недостаточно выражен
- Уменьшите число шагов, если результат слишком жёсткий
Триггерные слова
Триггерные слова
- Используйте одно и то же триггерное слово, если планируете комбинировать несколько стилей
- Триггерные слова автоматически подставляются в запрос при использовании стиля
- Избегайте распространённых слов, встречающихся в обычных запросах
- Для триггеров из нескольких слов используйте подчёркивания:
my_custom_style