Genel Bakış
LoRA (Low-Rank Adaptation), bir AI modeline küçük bir örnek görüntü kümesi kullanarak yeni bir görsel stil öğreten bir ince ayar tekniğidir. Mevcut bir modele yeni “stil ağırlıkları” enjekte ederek çalışır, bu da eğitimi hem hızlı hem de verimli hale getirir. Bu kılavuz tam iş akışını anlatır:Eğitim Görüntülerini Hazırlayın
İstediğiniz stili temsil eden yüksek kaliteli görüntüleri küratörlüğünü yapın ve yükleyin
Eğitim İşini Gönderin
Görüntü URL’leriniz ve yapılandırmanızla
/styles/train adresine bir POST isteği gönderinEğitim Görüntülerini Hazırlama
Veri Kümenizin Küratörlüğünü Yapma
Eğitim görüntülerinizin kalitesi sonuçları doğrudan etkiler. Farklı eğitim türlerinin farklı gereksinimleri vardır:| Tür | Kullanım Alanı | İpuçları |
|---|---|---|
| Style | Sanatsal stiller, görsel estetik | Çeşitli konular arasında tutarlı stil |
| Character | Kişisel benzerlik, tutarlı karakterler | Çeşitli pozlar, ifadeler, aydınlatmalar |
| Object | Belirli öğeler, ürünler | Birden çok açı, tutarlı nesne |
Kaç Görüntü Gerekli?
Kalite, nicelikten çok daha önemlidir. Küçük ama mükemmel görüntülerden oluşan bir küme, büyük ama vasat bir kümeden daha iyi sonuç verir.| Veri Kümesi Boyutu | Rehberlik |
|---|---|
| 5 görüntü | Minimum uygun. Basit, tutarlı stiller için işe yarayabilir |
| 10-30 görüntü | Önerilen. Kalite ve kapsamın en iyi dengesi |
| 50+ görüntü | Stil yüksek varyasyona sahip olmadıkça azalan getiri |
Örnek Veri Kümeleri
- Karakter eğitimi: Çeşitli pozlar, ifadeler ve aydınlatma koşullarıyla bir kişinin fotoğrafları. Görüntülerde başka kişilerin bulunmasından kaçının.
- Stil eğitimi: Tutarlı bir stilde bir sanat eseri koleksiyonu. Örneğin, The Metropolitan Museum of Art Ukiyo-E Dataset, sanatsal bir stili eğitmek için ideal Japon tahta baskılarını sağlar.
Görüntüleri Yükleyin
Eğitimden önce, barındırılan URL’leri almak için görüntülerinizi yükleyin./assets uç noktasını kullanın:
Stilinizi Eğitin
Temel Eğitim Örneği
Eğitimi başlatmak için görüntü URL’lerinizi gönderin:Eğitim Türleri
type parametresi, kullanım durumunuz için optimize edilmiş akıllı varsayılanları ayarlar:
| Tür | En İyi Olduğu Alan |
|---|---|
Style | Sanatsal stiller, görsel estetik |
Character | Kişisel benzerlik, tutarlı karakterler |
Object | Belirli öğeler, ürünler |
Default | Genel eğitim |
Parametreler
Zorunlu Parametreler
Özel stiliniz için açıklayıcı bir ad.Örnek:
"Ukiyo-E Style", "Product Photos"Üzerinde eğitim yapılacak görüntü URL’lerinin dizisi. Daha iyi sonuçlar için daha fazla görüntü ekleyin.
Opsiyonel Parametreler
Eğitim için temel model:Görüntü modelleri:
flux_dev- Yüksek kalite, çok yönlüflux_schnell- BFL’nin gerçek zamanlı modeliqwen- Alibaba’nın modeliz-image- Alibaba’nın verimli görüntü modeliwan22- Yalnızca görüntü üretimi
wan- Alibaba’nın video modeli
Eğitim kategorisi:
Style, Object, Character veya DefaultPromptlarda bu stili etkinleştirmek için özel kelime. Belirtilmediğinde, stil adı kullanılır.
Gelişmiş Parametreler
Gelişmiş Parametreler
Eğitim yoğunluğunu kontrol eder. Daha yüksek değerler daha hızlı eğitir ancak overfitting yapabilir.Önerilen aralık: 0.0001 - 0.001
Maksimum eğitim iterasyonu. Aralık: 1-2000
Aynı anda işlenen görüntüler. Daha büyük batch’ler = daha hızlı eğitim ancak daha fazla bellek.
Gelişmiş Parametreleri Ayarlama
type alanı tarafından belirlenen varsayılanlarla başlayın—bunlar çoğu durum için iyi çalışır. Yalnızca belirli sorunlar görüyorsanız bunları ayarlayın:
Öğrenme Oranı
Öğrenme Oranı
Modelin eğitim görüntülerinize ne kadar agresif adapte olduğunu kontrol eder.
Ayarlamanız gerektiğine dair işaretler:
| Değer | Ne Zaman Kullanılır |
|---|---|
| 0.0001 (daha düşük) | Overfitting sorunları, karmaşık stiller, küçük veri kümeleri |
| 0.0003 (varsayılan) | Çoğu kullanım durumu |
| 0.0005-0.001 (daha yüksek) | Daha hızlı eğitim |
- Çıktılar eğitim görüntüleriyle aynı görünüyor → oranı düşürün
- Eğitimden sonra stil etkisi zayıf → oranı biraz artırın
Eğitim Adımları
Eğitim Adımları
Modelin görüntülerinizde ne kadar süre eğitildiği.
Ayarlamanız gerektiğine dair işaretler:
| Veri Kümesi Boyutu | Önerilen Adımlar |
|---|---|
| 5-10 görüntü | 300-500 adım |
| 15-30 görüntü | 500-800 adım |
| 50+ görüntü | 800-1500 adım |
- Çıktılar çok katı, promptları görmezden geliyor → adımları azaltın
- Stil etkisi zayıf → adımları artırın
- Oluşturulan görüntüler tam olarak eğitim verisi gibi görünüyor → adımları azaltın (overfitting)
Yanıt Formatı
Eğitim İlerlemesini İzleyin
Eğitim genellikle 5-15 dakika sürer. Durumu kontrol etmek için Jobs API’yi sorgulayın:İş Durum Değerleri
İş Durum Değerleri
Eğitim işleri bu durumlardan geçer:
- queued - Kuyrukta bekleme
- processing - Aktif eğitim
- completed - Eğitim başarıyla tamamlandı
- failed - Eğitimde bir hata oluştu
- cancelled - İş manuel olarak iptal edildi
Eğitilmiş Stilinizi Kullanın
Eğitim tamamlandığında,styles parametresini kullanarak stilinizi görüntü üretimine uygulayın:
Stil Gücü
strength parametresi (0.0-1.0) stilinizin ne kadar güçlü uygulandığını kontrol eder:
| Güç | Etki |
|---|---|
| 0.5-0.7 | İnce etki, prompt esnekliğini korur |
| 0.8-0.9 | Güçlü stil uygulaması, önerilen başlangıç noktası |
| 0.95-1.0 | Maksimum stil bağlılığı, prompt yanıt verme özelliğini azaltabilir |
Birden Fazla Stili Birleştirme
styles dizisine ekleyerek birden fazla stil uygulayın:
En İyi Uygulamalar
Görüntü Seçimi
Görüntü Seçimi
- Optimum sonuçlar için elinizdeki yüksek kaliteli görüntülerin mümkün olduğunca fazlasını kullanın
- Tüm eğitim görüntülerinde tutarlı bir stil sağlayın
- Stil tutarlılığını korurken konularda çeşitlilik ekleyin
- Filigranlardan, metin bindirmelerinden veya kusurlardan kaçının
- En az 1024x1024 çözünürlükteki görüntüleri kullanın
Eğitim Yapılandırması
Eğitim Yapılandırması
typealanını kullanarak varsayılan parametrelerle başlayın- Stiller için: 500-1000 adım genellikle yeterlidir
- Düşük öğrenme oranları (0.0001-0.0003) overfitting’i önler
- Stil yeterince güçlü değilse adımları artırın
- Çıktı çok katı ise adımları azaltın
Tetikleyici Kelimeler
Tetikleyici Kelimeler
- Birden fazla stili birleştirmeyi planlıyorsanız aynı tetikleyici kelimeyi kullanın
- Stili dahil ederseniz tetikleyici kelimeler otomatik olarak prompta enjekte edilir
- Tipik promptlarda görünen yaygın kelimelerden kaçının
- Birden çok kelimeli tetikleyiciler için alt çizgi kullanın:
my_custom_style