개요
LoRA(Low-Rank Adaptation)는 소량의 예시 이미지로 AI 모델에게 새로운 비주얼 스타일을 가르치는 파인튜닝 기법입니다. 기존 모델에 새로운 “스타일 가중치”를 주입하는 방식으로 동작해 학습이 빠르고 효율적입니다. 이 가이드는 전체 워크플로우를 안내합니다:학습 이미지 준비
데이터셋 큐레이션
학습 이미지의 품질은 결과에 직접적인 영향을 줍니다. 학습 유형에 따라 요구 사항이 다릅니다:| 유형 | 활용 사례 | 팁 |
|---|---|---|
| Style | 예술적 스타일, 비주얼 미감 | 다양한 주제에서 일관된 스타일 유지 |
| Character | 개인 유사도, 일관된 캐릭터 | 다양한 포즈, 표정, 조명 |
| Object | 특정 사물, 제품 | 여러 각도, 일관된 사물 |
이미지는 몇 장이 필요할까요?
품질이 수량보다 훨씬 중요합니다. 훌륭한 이미지 소수가 평범한 이미지 다수보다 좋은 결과를 냅니다.| 데이터셋 크기 | 가이드 |
|---|---|
| 5장 | 최소한의 시작. 단순하고 일관된 스타일에 적합할 수 있음 |
| 10~30장 | 권장. 품질과 커버리지의 균형이 가장 좋음 |
| 50장 이상 | 스타일 변화가 크지 않다면 효용이 급감 |
예시 데이터셋
- 캐릭터 학습: 다양한 포즈, 표정, 조명 환경에서의 특정 인물 사진. 이미지에 다른 인물을 포함하지 마세요.
- 스타일 학습: 일관된 스타일의 아트워크 컬렉션. 예를 들어, The Metropolitan Museum of Art Ukiyo-E Dataset은 예술 스타일 학습에 이상적인 일본 우키요에 판화를 제공합니다.
이미지 업로드
학습 전에 이미지를 업로드해 호스팅 URL을 확보하세요./assets 엔드포인트를 사용합니다:
스타일 학습하기
기본 학습 예제
이미지 URL을 제출해 학습을 시작하세요:학습 유형
type 파라미터는 사용 사례에 맞게 최적화된 지능형 기본값을 설정합니다:
| 유형 | 적합한 용도 |
|---|---|
Style | 예술적 스타일, 비주얼 미감 |
Character | 개인 유사도, 일관된 캐릭터 |
Object | 특정 사물, 제품 |
Default | 일반적인 학습 |
파라미터
필수 파라미터
커스텀 스타일을 설명하는 이름입니다.예시:
"Ukiyo-E Style", "Product Photos"학습에 사용할 이미지 URL 배열입니다. 더 나은 결과를 위해 이미지를 여러 장 포함하세요.
선택 파라미터
학습 베이스 모델:이미지 모델:
flux_dev- 고품질, 다재다능flux_schnell- BFL의 실시간 모델qwen- Alibaba의 모델z-image- Alibaba의 효율적인 이미지 모델wan22- 이미지 생성 전용
wan- Alibaba의 영상 모델
학습 카테고리:
Style, Object, Character, 또는 Default프롬프트에서 이 스타일을 활성화하는 커스텀 단어입니다. 지정하지 않으면 스타일 이름을 사용합니다.
고급 파라미터
고급 파라미터
고급 파라미터 튜닝
type 필드가 설정하는 기본값으로 시작하세요 — 대부분의 경우 잘 작동합니다. 특정 문제가 나타날 때만 조정하세요:
Learning Rate
Learning Rate
모델이 학습 이미지에 얼마나 적극적으로 적응할지를 제어합니다.
조정이 필요한 신호:
| 값 | 언제 사용할까 |
|---|---|
| 0.0001 (낮음) | 과적합 문제, 복잡한 스타일, 소규모 데이터셋 |
| 0.0003 (기본값) | 대부분의 경우 |
| 0.0005-0.001 (높음) | 빠른 학습이 필요할 때 |
- 결과가 학습 이미지와 동일해 보임 → 값을 낮추세요
- 학습 후에도 스타일 반영이 약함 → 값을 조금 올리세요
Training Steps
Training Steps
모델이 이미지를 얼마나 오래 학습할지 결정합니다.
조정이 필요한 신호:
| 데이터셋 크기 | 권장 스텝 수 |
|---|---|
| 5-10장 | 300-500 스텝 |
| 15-30장 | 500-800 스텝 |
| 50장 이상 | 800-1500 스텝 |
- 결과가 너무 경직되어 프롬프트를 무시함 → 스텝 수를 줄이세요
- 스타일 반영이 약함 → 스텝 수를 늘리세요
- 생성 이미지가 학습 데이터와 완전히 똑같음 → 스텝 수를 줄이세요 (과적합)
응답 형식
학습 진행 상황 모니터링
학습에는 보통 5-15분이 소요됩니다. Jobs API를 폴링해 상태를 확인하세요:작업 상태 값
작업 상태 값
학습 작업은 다음 상태를 거칩니다:
- queued - 큐에서 대기 중
- processing - 학습 진행 중
- completed - 학습이 성공적으로 완료됨
- failed - 학습 중 오류 발생
- cancelled - 작업이 수동으로 취소됨
학습한 스타일 사용하기
학습이 완료되면styles 파라미터를 사용해 이미지 생성에 스타일을 적용하세요:
스타일 강도
strength 파라미터(0.0-1.0)는 스타일이 얼마나 강하게 적용될지를 제어합니다:
| 강도 | 효과 |
|---|---|
| 0.5-0.7 | 은은한 영향, 프롬프트 유연성 유지 |
| 0.8-0.9 | 강한 스타일 적용, 권장 시작점 |
| 0.95-1.0 | 최대 스타일 준수, 프롬프트 반응성이 저하될 수 있음 |
여러 스타일 결합하기
styles 배열에 여러 스타일을 추가해 함께 적용할 수 있습니다:
모범 사례
이미지 선정
이미지 선정
- 최적의 결과를 위해 보유한 고품질 이미지를 가능한 한 많이 사용하세요
- 모든 학습 이미지에서 일관된 스타일을 유지하세요
- 스타일 일관성을 유지하면서 주제는 다양하게 포함하세요
- 워터마크, 텍스트 오버레이, 아티팩트는 피하세요
- 최소 1024x1024 해상도의 이미지를 사용하세요
학습 구성
학습 구성
type필드로 설정되는 기본 파라미터부터 시작하세요- 스타일 학습: 500-1000 스텝이 대부분 충분합니다
- 낮은 러닝레이트(0.0001-0.0003)는 과적합을 방지합니다
- 스타일이 약하면 스텝을 늘리세요
- 출력이 너무 경직되면 스텝을 줄이세요
트리거 단어
트리거 단어
- 여러 스타일을 결합할 계획이라면 동일한 트리거 단어를 사용하세요
- 스타일을 포함하면 트리거 단어가 프롬프트에 자동으로 삽입됩니다
- 일반 프롬프트에 자주 등장하는 흔한 단어는 피하세요
- 여러 단어인 경우 언더스코어를 사용하세요:
my_custom_style