
अवलोकन
OpenAI का नवीनतम इमेज जनरेशन मॉडल, GPT Image 1.5 पर बना है, एक मूल रूप से मल्टीमॉडल आर्किटेक्चर जो टेक्स्ट और इमेज को अलग-अलग सिस्टम के रूप में मानने के बजाय एक ही एकीकृत नेटवर्क के माध्यम से प्रोसेस करता है। इसका व्यावहारिक परिणाम एक ऐसा मॉडल है जो असामान्य सटीकता के साथ जटिल निर्देशों का पालन करता है, घने टेक्स्ट रेंडरिंग को सटीक रूप से संभालता है, और फ्रेम में बाकी सब कुछ अस्थिर किए बिना इमेजेस पर लक्षित एडिट करता है। यह Fast Models की तुलना में धीमा और अधिक क्रेडिट-गहन है, लेकिन उन कार्यों के लिए जिनमें सटीक प्रॉम्प्ट पालन, इमेजेस के भीतर पठनीय टेक्स्ट, या नियंत्रित पुनरावृत्तिपूर्ण संपादन की आवश्यकता होती है, यह प्लेटफ़ॉर्म पर सबसे सक्षम विकल्पों में से एक है।शुरू करना
- Image Generation पर जाएँ — krea.ai/image पर नेविगेट करें और ड्रॉपडाउन से इस मॉडल का चयन करें।
- ChatGPT 1.5 चुनें — मॉडल पिकर खोलें और Intelligent Models सेक्शन से ChatGPT 1.5 चुनें।
- अपना प्रॉम्प्ट लिखें — जितना संभव हो उतना विशिष्ट और वर्णनात्मक बनें। ChatGPT 1.5 सटीक निर्देश पालन के लिए बनाया गया है, इसलिए विस्तृत प्रॉम्प्ट अस्पष्ट प्रॉम्प्ट की तुलना में उल्लेखनीय रूप से बेहतर परिणाम देते हैं।
- संदर्भ इमेजेस जोड़ें (वैकल्पिक) — कंपोज़िशन, स्टाइल, या विषय-सामग्री को गाइड करने के लिए इमेजेस अपलोड करें।
- अपना आस्पेक्ट रेशियो चुनें — अपने उपयोग केस के आधार पर पोर्ट्रेट, लैंडस्केप, या स्क्वायर चुनें।
- Generate करें — Generate पर क्लिक करें। ChatGPT 1.5 फास्ट मॉडलों से धीमा है, लेकिन आउटपुट गुणवत्ता जोड़े गए प्रोसेसिंग समय को दर्शाती है।
- पुनरावृत्ति करें — अपने परिणाम में विशिष्ट परिवर्तन माँगें। ChatGPT 1.5 केवल वही संशोधित करेगा जो आप माँगते हैं, बाकी इमेज को सुसंगत रखते हुए।
एक नज़र में
| फ़ीचर | विवरण |
|---|---|
| गति | धीमा (1/3) |
| क्रेडिट्स | ~150 प्रति जनरेशन |
| अंतर्निहित मॉडल | GPT Image 1.5 (OpenAI) |
| सर्वोत्तम | जटिल प्रॉम्प्ट्स, टेक्स्ट रेंडरिंग, सटीक इमेज संपादन |
| समर्थित आकार | 1:1 स्क्वायर, 3:2 लैंडस्केप, 2:3 पोर्ट्रेट |
| स्टाइल संदर्भ समर्थन | हाँ |
ChatGPT 1.5 का उपयोग कब करें
ChatGPT 1.5 वह मॉडल है जिसे तब चुनना चाहिए जब गति से अधिक सटीकता मायने रखती हो। इसका मूल रूप से मल्टीमॉडल आर्किटेक्चर का मतलब है कि यह अधिकांश मॉडलों की तुलना में टेक्स्ट और इमेज के बीच के संबंध को अधिक गहरे स्तर पर समझता है, जो जटिल या स्तरित अनुरोधों पर मज़बूत प्रॉम्प्ट अनुपालन और अधिक विश्वसनीय परिणामों में तब्दील होता है। इसकी टेक्स्ट रेंडरिंग क्षमता विशेष रूप से मज़बूत है। जहाँ कई मॉडल किसी इमेज के भीतर पठनीय, सही ढंग से वर्तनी वाले टेक्स्ट का उत्पादन करने में संघर्ष करते हैं, ChatGPT 1.5 घने और छोटे-स्तर के टेक्स्ट को सटीक रूप से संभालता है, जो इसे किसी भी ऐसे प्रॉम्प्ट के लिए एक ठोस विकल्प बनाता है जिसमें साइनेज, टाइपोग्राफी, लेबल, या डायग्राम शामिल हों। यह पुनरावृत्तिपूर्ण संपादन में भी उत्कृष्ट है। जब आप इसे किसी इमेज में एक विशिष्ट चीज़ बदलने के लिए कहते हैं, तो यह केवल वही समायोजित करता है जो आपने निर्दिष्ट किया है, बाकी फ्रेम में चेहरे की समानता, लाइटिंग, कंपोज़िशन, और रंग टोन को संरक्षित करते हुए। यह AI इमेज जनरेशन के साथ सबसे सामान्य निराशाओं में से एक को संबोधित करता है, जहाँ एक छोटे एडिट के लिए पूछने से पूरी इमेज को शुरू से पुनः जनरेट करना पड़ता है।| उपयोग करें जब | बचें जब |
|---|---|
| आपका प्रॉम्प्ट जटिल है और सटीक व्याख्या की आवश्यकता है | आपको तेज़ परिणाम चाहिए या आप शुरुआती ड्राफ़्टिंग चरण में हैं |
| आपकी इमेज में पठनीय टेक्स्ट शामिल होना चाहिए | आप तंग क्रेडिट बजट पर हैं |
| आपको पूरी इमेज बदले बिना विशिष्ट एडिट करने की आवश्यकता है | आप एक भारी शैलीबद्ध या कलात्मक आउटपुट चाहते हैं |
| आप डायग्राम, कैरेक्टर, या विस्तृत सीन पर काम कर रहे हैं | आपको LoRA स्टाइल समर्थन चाहिए |
| एडिट में चेहरे की समानता या विज़ुअल कंसिस्टेंसी मायने रखती है |
सामान्य उपयोग केस
- डायग्राम और इंफ़ोग्राफ़िक्स: सटीक लेबल और टेक्स्ट के साथ तकनीकी इलस्ट्रेशन
- कैरेक्टर डिज़ाइन: कई पुनरावृत्तियों में सुसंगत कैरेक्टर उपस्थिति
- मार्केटिंग विज़ुअल्स: पठनीय कॉपी, लोगो, या प्रोडक्ट कॉलआउट्स के साथ लेआउट
- फ़ोटो एडिटिंग: पूर्ण पुनरुत्पादन के बिना मौजूदा इमेजेस में लक्षित संशोधन
- जटिल सीन: बहु-तत्व कंपोज़िशन जिनमें सटीक स्थानिक संबंधों की आवश्यकता होती है
प्रॉम्प्ट टिप्स
प्रभावी प्रॉम्प्ट लिखना
- प्रॉम्प्ट उसी तरह लिखें जैसे आप एक विस्तृत क्रिएटिव ब्रीफ देंगे — विषय, स्टाइल, लाइटिंग, कंपोज़िशन, और मूड का स्पष्ट रूप से वर्णन करें
- इमेजेस के भीतर टेक्स्ट के लिए, सटीक शब्दांकन, फ़ॉन्ट स्टाइल, आकार, और स्थान निर्दिष्ट करें
- स्थानिक संबंधों का स्पष्ट रूप से वर्णन करें: “एक सफेद टेबल के बाईं ओर एक लाल मग, दाईं ओर से खिड़की का प्रकाश”
- ChatGPT 1.5 लंबे, विस्तृत प्रॉम्प्ट को अच्छी तरह से संभालता है — जब आप विशिष्ट हो सकते हैं तो संक्षिप्त न करें
परिणामों पर पुनरावृत्ति
- संपादित करते समय, केवल वह परिवर्तन बताएँ जो आप चाहते हैं और बाकी सब कुछ अनिर्दिष्ट छोड़ दें — मॉडल जो आप उल्लेख नहीं करते उसे संरक्षित रखेगा
- कैरेक्टर कार्य के लिए, अपने पहले जनरेशन में उपस्थिति स्थापित करें, फिर फ़ॉलो-अप एडिट में इसे स्पष्ट रूप से संदर्भित करें
- यदि परिणाम पूरी तरह से सही नहीं है, तो उसी टेक्स्ट के साथ पुनः जनरेट करने के बजाय अपनी प्रॉम्प्ट भाषा को परिष्कृत करें
टेक्स्ट रेंडरिंग से अधिकतम लाभ प्राप्त करना
- अपने प्रॉम्प्ट के भीतर उद्धरण चिह्नों में इमेज में जो टेक्स्ट चाहिए वह डालें
- यदि यह मायने रखता है तो फ़ॉन्ट स्टाइल निर्दिष्ट करें: “सैन्स-सेरिफ़”, “हस्तलिखित”, “बोल्ड अपरकेस”
- पोस्टर या डायग्राम जैसे घने टेक्स्ट लेआउट के लिए, अपने प्रॉम्प्ट में लेआउट को स्पष्ट सेक्शन में विभाजित करें
उदाहरण
A photorealistic night scene on a narrow Barcelona street, warm amber streetlights , Gothic Quarter architecture lining both sides. In the foreground, a small tapas stall with a glowing sign reading "EL RACÓ" in bold yellow letters, a handwritten menu board underneath listing "Patatas Bravas, Croquetas, Pan con Tomate." Locals and tourists passing by, neon signs in Spanish and Catalan in the background.

इंफ़ोग्राफ़िक्स
ChatGPT 1.5 इंफ़ोग्राफ़िक जनरेशन के लिए Krea पर सबसे मज़बूत मॉडलों में से एक है। अधिकांश मॉडलों के विपरीत जो केवल टेक्स्ट को एक इमेज पर रखते हैं, यह पदानुक्रम, स्पेसिंग, और विज़ुअल संगठन के बारे में तर्क करता है, लिखित सामग्री और लेआउट के बीच के संबंध को संरचनात्मक स्तर पर समझता है। इसकी सटीक घनी टेक्स्ट रेंडरिंग के साथ मिलकर, यह एक जटिल बहु-सेक्शन प्रॉम्प्ट ले सकता है और कुछ ऐसा लौटा सकता है जो अनुमानित के बजाय सुविचारित दिखता है।A step-by-step process infographic titled "How Sourdough Bread is Made," showing 8 stages from starter to finished loaf — feeding the starter, mixing the dough, autolyse, bulk fermentation, shaping, proofing, scoring, and baking — each with a small hand-drawn style illustration and a time indicator. Warm cream background, hand-lettered headings, rustic editorial feel.

जटिल सीन
विशिष्ट स्थानिक संबंधों, विषयों के बीच अंतःक्रियाओं, और स्तरित पर्यावरणीय विवरण के साथ बहु-तत्व कंपोज़िशन।A busy Berlin market hall at 5am, three vendors in rubber aprons arranging fresh fish on crushed ice in the foreground, a fourth vendor mid-negotiation with a restaurant buyer in the middle ground, wooden crates stacked to the left, hanging overhead lights casting warm pools of yellow light across wet concrete floors, steam rising from a small food cart in the background selling hot broth to early morning workers, exposed iron roof structure and brick walls characteristic of a 19th century German markthalle visible above, depth of field pulling focus from the foreground vendors to the hazy activity behind, photorealistic, shot on 35mm.

स्पष्ट एडिट निर्देश
ChatGPT Image 1.5 सीधे इमेज एडिट निर्देशों का पालन करने में काफ़ी बेहतर है। अब आप प्रॉम्प्ट को पूरी इमेज का पुनः वर्णन करने के बजाय सटीक परिवर्तन अनुरोधों की तरह मान सकते हैं।Edit the uploaded image. Remove the person in the background on the left in the pink shirt. Keep the lighting unchanged. Preserve facial identity and skin texture of the main subjects. Maintain original camera angle and depth of field.

