Ikhtisar
LoRA (Low-Rank Adaptation) adalah teknik fine-tuning yang mengajarkan model AI sebuah gaya visual baru menggunakan sekumpulan kecil gambar contoh. Cara kerjanya adalah dengan menyuntikkan “style weights” baru ke model yang sudah ada, membuat pelatihan cepat sekaligus efisien. Panduan ini memandu Anda melalui alur lengkap:Siapkan Gambar Pelatihan
Kurasi dan unggah gambar berkualitas tinggi yang mewakili gaya yang Anda inginkan
Siapkan Gambar Pelatihan
Mengurasi Dataset Anda
Kualitas gambar pelatihan Anda berdampak langsung pada hasil. Jenis pelatihan yang berbeda memiliki persyaratan yang berbeda:| Jenis | Kasus Penggunaan | Tips |
|---|---|---|
| Style | Gaya artistik, estetika visual | Gaya konsisten di berbagai subjek |
| Character | Kemiripan pribadi, karakter yang konsisten | Beragam pose, ekspresi, pencahayaan |
| Object | Objek atau produk tertentu | Beragam sudut, objek konsisten |
Berapa Banyak Gambar?
Kualitas jauh lebih penting daripada kuantitas. Sekumpulan kecil gambar yang sangat baik akan mengungguli sekumpulan besar gambar yang biasa saja.| Ukuran Dataset | Panduan |
|---|---|
| 5 gambar | Minimum yang layak. Bisa berhasil untuk gaya sederhana dan konsisten |
| 10-30 gambar | Direkomendasikan. Keseimbangan terbaik antara kualitas dan cakupan |
| 50+ gambar | Diminishing returns kecuali jika gaya memiliki variasi tinggi |
Contoh Dataset
- Pelatihan character: Foto seseorang dengan beragam pose, ekspresi, dan kondisi pencahayaan. Hindari menyertakan orang lain di dalam gambar.
- Pelatihan style: Kumpulan karya seni dalam gaya yang konsisten. Misalnya, The Metropolitan Museum of Art Ukiyo-E Dataset menyediakan cetakan kayu Jepang yang ideal untuk melatih gaya artistik.
Unggah Gambar
Sebelum pelatihan, unggah gambar Anda untuk mendapatkan URL yang di-hosting. Gunakan endpoint/assets:
Latih Gaya Anda
Contoh Pelatihan Dasar
Kirim URL gambar Anda untuk memulai pelatihan:Jenis Pelatihan
Parametertype menetapkan default cerdas yang dioptimalkan untuk kasus penggunaan Anda:
| Jenis | Cocok untuk |
|---|---|
Style | Gaya artistik, estetika visual |
Character | Kemiripan pribadi, karakter yang konsisten |
Object | Objek atau produk tertentu |
Default | Pelatihan generik |
Parameter
Parameter Wajib
Nama deskriptif untuk gaya kustom Anda.Contoh:
"Ukiyo-E Style", "Product Photos"Array URL gambar untuk dilatih. Sertakan lebih banyak gambar untuk hasil yang lebih baik.
Parameter Opsional
Model dasar untuk pelatihan:Model gambar:
flux_dev- Berkualitas tinggi, serbagunaflux_schnell- Model realtime dari BFLqwen- Model dari Alibabaz-image- Model gambar efisien dari Alibabawan22- Hanya untuk generasi gambar
wan- Model video dari Alibaba
Kategori pelatihan:
Style, Object, Character, atau DefaultKata kustom untuk mengaktifkan gaya ini di prompt. Jika tidak ditentukan, akan menggunakan nama gaya.
Parameter Lanjutan
Parameter Lanjutan
Mengontrol intensitas pelatihan. Nilai yang lebih tinggi melatih lebih cepat tetapi bisa overfit.Rentang yang direkomendasikan: 0.0001 - 0.001
Iterasi pelatihan maksimum. Rentang: 1-2000
Gambar yang diproses secara bersamaan. Batch lebih besar = pelatihan lebih cepat tetapi memori lebih banyak.
Menyesuaikan Parameter Lanjutan
Mulai dengan default yang ditetapkan oleh fieldtype—cocok untuk sebagian besar kasus. Hanya sesuaikan ini bila Anda melihat masalah tertentu:
Learning Rate
Learning Rate
Mengontrol seberapa agresif model beradaptasi dengan gambar pelatihan Anda.
Tanda perlu penyesuaian:
| Nilai | Kapan Digunakan |
|---|---|
| 0.0001 (lebih rendah) | Masalah overfitting, gaya kompleks, dataset kecil |
| 0.0003 (default) | Sebagian besar kasus penggunaan |
| 0.0005-0.001 (lebih tinggi) | Pelatihan lebih cepat |
- Output terlihat identik dengan gambar pelatihan → turunkan rate
- Pengaruh gaya lemah setelah pelatihan → naikkan rate sedikit
Training Steps
Training Steps
Berapa lama model berlatih pada gambar Anda.
Tanda perlu penyesuaian:
| Ukuran Dataset | Steps yang Direkomendasikan |
|---|---|
| 5-10 gambar | 300-500 steps |
| 15-30 gambar | 500-800 steps |
| 50+ gambar | 800-1500 steps |
- Output terlalu kaku, mengabaikan prompt → kurangi steps
- Pengaruh gaya lemah → tambah steps
- Gambar yang dihasilkan terlihat persis seperti data pelatihan → kurangi steps (overfitting)
Format Respons
Pantau Progres Pelatihan
Pelatihan biasanya memakan waktu 5-15 menit. Lakukan polling Jobs API untuk memeriksa status:Nilai Status Job
Nilai Status Job
Job pelatihan berjalan melalui status ini:
- queued - Menunggu di antrean
- processing - Pelatihan aktif
- completed - Pelatihan selesai dengan sukses
- failed - Pelatihan mengalami kesalahan
- cancelled - Job dibatalkan secara manual
Gunakan Gaya Terlatih Anda
Setelah pelatihan selesai, terapkan gaya Anda ke generasi gambar menggunakan parameterstyles:
Kekuatan Gaya
Parameterstrength (0.0-1.0) mengontrol seberapa kuat gaya Anda diterapkan:
| Strength | Efek |
|---|---|
| 0.5-0.7 | Pengaruh halus, mempertahankan fleksibilitas prompt |
| 0.8-0.9 | Penerapan gaya yang kuat, titik awal yang direkomendasikan |
| 0.95-1.0 | Kepatuhan gaya maksimum, mungkin mengurangi responsivitas prompt |
Menggabungkan Beberapa Gaya
Terapkan beberapa gaya dengan menambahkannya ke arraystyles:
Praktik Terbaik
Pemilihan Gambar
Pemilihan Gambar
- Gunakan sebanyak mungkin gambar berkualitas tinggi untuk hasil optimal
- Pastikan gaya konsisten di semua gambar pelatihan
- Sertakan variasi subjek sambil menjaga koherensi gaya
- Hindari watermark, teks overlay, atau artefak
- Gunakan gambar dengan resolusi minimum 1024x1024
Konfigurasi Pelatihan
Konfigurasi Pelatihan
- Mulai dengan parameter default menggunakan field
type - Untuk gaya: 500-1000 steps biasanya cukup
- Learning rate rendah (0.0001-0.0003) mencegah overfitting
- Tambah steps jika gaya belum cukup kuat
- Kurangi steps jika output terlalu kaku
Trigger Words
Trigger Words
- Gunakan trigger word yang sama jika Anda berencana menggabungkan beberapa gaya
- Trigger word otomatis disuntikkan ke prompt jika Anda menyertakan gaya
- Hindari kata umum yang muncul di prompt biasa
- Gunakan underscore untuk trigger multi-kata:
my_custom_style