
Descripción general
El modelo de generación de imágenes más reciente de OpenAI, construido sobre GPT Image 1.5, una arquitectura nativamente multimodal que procesa texto e imágenes a través de una sola red unificada en lugar de tratarlos como sistemas separados. El resultado práctico es un modelo que sigue instrucciones complejas con una precisión inusual, maneja el renderizado de texto denso con exactitud y realiza ediciones puntuales en las imágenes sin desestabilizar todo lo demás en el cuadro. Es más lento y consume más créditos que los Fast Models, pero para tareas que requieren un apego exacto al prompt, texto legible dentro de las imágenes o edición iterativa controlada, es una de las opciones más capaces de la plataforma.Cómo empezar
- Ve a la generación de imágenes — Navega a krea.ai/image y selecciona este modelo desde el menú desplegable.
- Selecciona ChatGPT 1.5 — Abre el selector de modelo y elige ChatGPT 1.5 en la sección Intelligent Models.
- Escribe tu prompt — Sé lo más específico y descriptivo posible. ChatGPT 1.5 está diseñado para seguir instrucciones con precisión, así que los prompts detallados producen resultados notablemente mejores que los vagos.
- Agrega imágenes de referencia (opcional) — Sube imágenes para guiar la composición, el estilo o el tema.
- Elige tu proporción — Selecciona vertical, horizontal o cuadrado según tu caso de uso.
- Genera — Haz clic en Generar. ChatGPT 1.5 es más lento que los modelos rápidos, pero la calidad de la salida refleja el tiempo adicional de procesamiento.
- Itera — Pide cambios específicos en tu resultado. ChatGPT 1.5 modificará solo lo que pidas manteniendo el resto de la imagen consistente.
De un vistazo
| Característica | Detalle |
|---|---|
| Velocidad | Lento (1/3) |
| Créditos | ~150 por generación |
| Modelo subyacente | GPT Image 1.5 (OpenAI) |
| Mejor en | Prompts complejos, renderizado de texto, edición precisa |
| Tamaños admitidos | 1:1 cuadrado, 3:2 horizontal, 2:3 vertical |
| Soporte de referencia de estilo | Sí |
Cuándo usar ChatGPT 1.5
ChatGPT 1.5 es el modelo adecuado cuando la precisión importa más que la velocidad. Su arquitectura nativamente multimodal significa que comprende la relación entre texto e imagen a un nivel más profundo que la mayoría de los modelos, lo que se traduce en un mayor apego al prompt y resultados más confiables en solicitudes complejas o en capas. Su capacidad de renderizado de texto es particularmente fuerte. Donde muchos modelos tienen dificultades para producir texto legible y correctamente escrito dentro de una imagen, ChatGPT 1.5 maneja texto denso y a pequeña escala con precisión, lo que lo convierte en una buena opción para cualquier prompt que incluya letreros, tipografía, etiquetas o diagramas. También destaca en la edición iterativa. Cuando le pides que cambie una cosa específica de una imagen, ajusta solo lo que especificaste preservando el parecido facial, la iluminación, la composición y el tono de color del resto del cuadro. Esto aborda una de las frustraciones más comunes con la generación de imágenes por IA, donde pedir una pequeña edición hace que se regenere toda la imagen desde cero.| Úsalo cuando | Evítalo cuando |
|---|---|
| Tu prompt es complejo y requiere interpretación precisa | Necesitas resultados rápidos o estás en una fase temprana de borrador |
| Tu imagen debe incluir texto legible | Tienes un presupuesto de créditos ajustado |
| Necesitas hacer ediciones específicas sin cambiar toda la imagen | Quieres una salida muy estilizada o artística |
| Estás trabajando en diagramas, personajes o escenas detalladas | Necesitas soporte de estilo LoRA |
| El parecido facial o la consistencia visual entre ediciones importa |
Casos de uso comunes
- Diagramas e infografías: ilustraciones técnicas con etiquetas y texto precisos
- Diseño de personajes: apariencia de personaje consistente a lo largo de múltiples iteraciones
- Visuales de marketing: layouts con copy legible, logos o callouts de producto
- Edición de fotos: modificaciones puntuales a imágenes existentes sin regeneración completa
- Escenas complejas: composiciones con múltiples elementos que requieren relaciones espaciales precisas
Consejos de prompt
Escribir prompts efectivos
- Escribe los prompts como si dieras un brief creativo detallado — describe sujeto, estilo, iluminación, composición y ambiente explícitamente
- Para texto dentro de las imágenes, especifica el texto exacto, el estilo de fuente, el tamaño y la posición
- Describe las relaciones espaciales con claridad: “una taza roja en el lado izquierdo de una mesa blanca, luz de ventana desde la derecha”
- ChatGPT 1.5 maneja bien los prompts largos y detallados — no abrevies cuando puedes ser específico
Iterar sobre los resultados
- Al editar, describe solo el cambio que quieres y deja todo lo demás sin especificar — el modelo preservará lo que no menciones
- Para trabajo de personajes, establece la apariencia en tu primera generación y luego refiérete a ella explícitamente en ediciones posteriores
- Si el resultado no es del todo correcto, refina el lenguaje del prompt en lugar de regenerar con el mismo texto
Sacarle el máximo al renderizado de texto
- Pon cualquier texto que necesites en la imagen entre comillas dentro del prompt
- Especifica el estilo de fuente si importa: “sans-serif”, “manuscrito”, “mayúsculas en negrita”
- Para layouts de texto denso como pósters o diagramas, divide el layout en secciones claras dentro del prompt
Ejemplos
A photorealistic night scene on a narrow Barcelona street, warm amber streetlights , Gothic Quarter architecture lining both sides. In the foreground, a small tapas stall with a glowing sign reading "EL RACÓ" in bold yellow letters, a handwritten menu board underneath listing "Patatas Bravas, Croquetas, Pan con Tomate." Locals and tourists passing by, neon signs in Spanish and Catalan in the background.

Infografías
ChatGPT 1.5 es uno de los modelos más fuertes en Krea para la generación de infografías. A diferencia de la mayoría de los modelos, que simplemente colocan texto sobre una imagen, este razona sobre la jerarquía, el espaciado y la organización visual, comprendiendo la relación entre el contenido escrito y el layout a un nivel estructural. Combinado con su renderizado preciso de texto denso, puede tomar un prompt complejo de múltiples secciones y devolver algo que se ve pensado en lugar de aproximado.A step-by-step process infographic titled "How Sourdough Bread is Made," showing 8 stages from starter to finished loaf — feeding the starter, mixing the dough, autolyse, bulk fermentation, shaping, proofing, scoring, and baking — each with a small hand-drawn style illustration and a time indicator. Warm cream background, hand-lettered headings, rustic editorial feel.

Escenas complejas
Composiciones con múltiples elementos, relaciones espaciales específicas, interacciones entre sujetos y detalle ambiental en capas.A busy Berlin market hall at 5am, three vendors in rubber aprons arranging fresh fish on crushed ice in the foreground, a fourth vendor mid-negotiation with a restaurant buyer in the middle ground, wooden crates stacked to the left, hanging overhead lights casting warm pools of yellow light across wet concrete floors, steam rising from a small food cart in the background selling hot broth to early morning workers, exposed iron roof structure and brick walls characteristic of a 19th century German markthalle visible above, depth of field pulling focus from the foreground vendors to the hazy activity behind, photorealistic, shot on 35mm.

Instrucciones de edición explícitas
ChatGPT Image 1.5 es significativamente mejor siguiendo instrucciones directas de edición de imágenes. Ahora puedes tratar los prompts como solicitudes precisas de cambio en lugar de volver a describir toda la imagen.Edit the uploaded image. Remove the person in the background on the left in the pink shirt. Keep the lighting unchanged. Preserve facial identity and skin texture of the main subjects. Maintain original camera angle and depth of field.

