نظرة عامة
LoRA (تكيّف الرتبة المنخفضة) هي تقنية للضبط الدقيق تُعلّم نموذج ذكاء اصطناعي أسلوبًا بصريًا جديدًا باستخدام مجموعة صغيرة من صور المثال. تعمل عن طريق حقن “أوزان أسلوب” جديدة في نموذج موجود، مما يجعل التدريب سريعًا وفعّالًا في آن واحد. يرشدك هذا الدليل عبر سير العمل الكامل:تحضير صور التدريب
تنسيق مجموعة البيانات لديك
تؤثر جودة صور التدريب مباشرةً على النتائج. تختلف متطلبات أنواع التدريب المختلفة:| النوع | حالة الاستخدام | نصائح |
|---|---|---|
| Style | الأساليب الفنية، الجماليات البصرية | أسلوب متسق عبر مواضيع متنوعة |
| Character | التشابه الشخصي، الشخصيات المتسقة | أوضاع وتعابير وإضاءة متنوعة |
| Object | عناصر أو منتجات محددة | زوايا متعددة، جسم متسق |
كم صورة؟
الجودة أهم بكثير من الكمية. مجموعة صغيرة من الصور الممتازة تفوق مجموعة كبيرة من الصور المتوسطة.| حجم مجموعة البيانات | إرشادات |
|---|---|
| 5 صور | الحد الأدنى العملي. قد تعمل مع أساليب بسيطة ومتسقة |
| 10-30 صورة | موصى بها. أفضل توازن بين الجودة والتغطية |
| 50+ صورة | عوائد متناقصة ما لم يكن للأسلوب تنوع كبير |
أمثلة على مجموعات البيانات
- تدريب الشخصيات: صور لشخص بأوضاع وتعابير وظروف إضاءة متنوعة. تجنّب تضمين أشخاص آخرين في الصور.
- تدريب الأسلوب: مجموعة من الأعمال الفنية بأسلوب متسق. على سبيل المثال، مجموعة بيانات Ukiyo-E من متحف المتروبوليتان للفنون توفر مطبوعات يابانية على الخشب مثالية لتدريب أسلوب فني.
رفع الصور
قبل التدريب، ارفع صورك للحصول على روابط مستضافة. استخدم نقطة النهاية/assets:
تدريب أسلوبك
مثال أساسي على التدريب
أرسل روابط صورك لبدء التدريب:أنواع التدريب
يعيّن معلمtype قيمًا افتراضية ذكية مُحسَّنة لحالة الاستخدام لديك:
| النوع | الأفضل لـ |
|---|---|
Style | الأساليب الفنية، الجماليات البصرية |
Character | التشابه الشخصي، الشخصيات المتسقة |
Object | عناصر أو منتجات محددة |
Default | تدريب عام |
المعلمات
المعلمات المطلوبة
اسم وصفي لأسلوبك المخصص.مثال:
"Ukiyo-E Style"، "Product Photos"مصفوفة من روابط الصور للتدريب عليها. أدرج المزيد من الصور للحصول على نتائج أفضل.
المعلمات الاختيارية
النموذج الأساسي للتدريب:نماذج الصور:
flux_dev- عالي الجودة، متعدد الاستخداماتflux_schnell- نموذج BFL الفوريqwen- نموذج Alibabaz-image- نموذج صور فعّال من Alibabawan22- توليد الصور فقط
wan- نموذج فيديو Alibaba
فئة التدريب:
Style أو Object أو Character أو Defaultكلمة مخصصة لتفعيل هذا الأسلوب في النصوص الوصفية. عند عدم تحديدها، يُستخدم اسم الأسلوب.
معلمات متقدمة
معلمات متقدمة
ضبط المعلمات المتقدمة
ابدأ بالقيم الافتراضية التي يضبطها حقلtype — إنها تعمل جيدًا لمعظم الحالات. اضبطها فقط إذا كنت تواجه مشكلات محددة:
معدل التعلّم
معدل التعلّم
يتحكم في مدى تكيّف النموذج بقوة مع صور التدريب لديك.
علامات تدل على أنك تحتاج إلى الضبط:
| القيمة | متى تستخدمها |
|---|---|
| 0.0001 (أقل) | مشاكل الإفراط في التعلّم، الأساليب المعقدة، مجموعات البيانات الصغيرة |
| 0.0003 (افتراضي) | معظم حالات الاستخدام |
| 0.0005-0.001 (أعلى) | تدريب أسرع |
- المخرجات تبدو مطابقة لصور التدريب ← اخفض المعدل
- تأثير الأسلوب ضعيف بعد التدريب ← ارفع المعدل قليلًا
خطوات التدريب
خطوات التدريب
مدة تدريب النموذج على صورك.
علامات تدل على أنك تحتاج إلى الضبط:
| حجم مجموعة البيانات | الخطوات الموصى بها |
|---|---|
| 5-10 صور | 300-500 خطوة |
| 15-30 صورة | 500-800 خطوة |
| 50+ صورة | 800-1500 خطوة |
- المخرجات جامدة جدًا، تتجاهل النصوص الوصفية ← قلّل الخطوات
- تأثير الأسلوب ضعيف ← زد الخطوات
- الصور المُولّدة تبدو تمامًا مثل بيانات التدريب ← قلّل الخطوات (إفراط في التعلّم)
تنسيق الاستجابة
مراقبة تقدّم التدريب
يستغرق التدريب عادةً 5-15 دقيقة. استعلم عن Jobs API للتحقق من الحالة:قيم حالة المهمة
قيم حالة المهمة
تمرّ مهام التدريب بهذه الحالات:
- queued - في انتظار الطابور
- processing - تدريب نشط
- completed - انتهى التدريب بنجاح
- failed - واجه التدريب خطأ
- cancelled - تم إلغاء المهمة يدويًا
استخدام أسلوبك المدرّب
بمجرد اكتمال التدريب، طبّق أسلوبك على توليد الصور باستخدام معلمstyles:
قوة الأسلوب
يتحكم معلمstrength (0.0-1.0) في مدى قوة تطبيق أسلوبك:
| القوة | التأثير |
|---|---|
| 0.5-0.7 | تأثير خفيف، يحافظ على مرونة النص الوصفي |
| 0.8-0.9 | تطبيق أسلوب قوي، نقطة انطلاق موصى بها |
| 0.95-1.0 | التزام أقصى بالأسلوب، قد يُقلل من الاستجابة للنص الوصفي |
دمج أساليب متعددة
طبّق أساليب متعددة عن طريق إضافتها إلى مصفوفةstyles:
أفضل الممارسات
اختيار الصور
اختيار الصور
- استخدم أكبر عدد ممكن من الصور عالية الجودة للحصول على نتائج مثالية
- تأكّد من تناسق الأسلوب عبر جميع صور التدريب
- تنوّع في المواضيع مع الحفاظ على تماسك الأسلوب
- تجنّب العلامات المائية أو النصوص المتراكبة أو التشوّهات
- استخدم صورًا بدقة 1024x1024 على الأقل
تكوين التدريب
تكوين التدريب
- ابدأ بالمعلمات الافتراضية باستخدام حقل
type - للأساليب: 500-1000 خطوة عادةً كافية
- معدلات التعلّم الأقل (0.0001-0.0003) تمنع الإفراط في التعلّم
- زد الخطوات إذا لم يكن الأسلوب قويًا بما يكفي
- قلّل الخطوات إذا كانت المخرجات جامدة جدًا
كلمات التفعيل
كلمات التفعيل
- استخدم كلمة التفعيل نفسها إذا كنت تخطط لدمج أساليب متعددة
- يتم حقن كلمات التفعيل تلقائيًا في النص الوصفي إذا أدرجت الأسلوب
- تجنّب الكلمات الشائعة التي تظهر في النصوص الوصفية النمطية
- استخدم الشرطات السفلية للكلمات المتعددة:
my_custom_style