A Timeline Infographic Titled The History Of The Internet Showing 12 Key Milestones From 1969 To 20 G7gl2uwzr2g5a00qmifa 0

Descripción general

El modelo de generación de imágenes más reciente de OpenAI, construido sobre GPT Image 1.5, una arquitectura nativamente multimodal que procesa texto e imágenes a través de una sola red unificada en lugar de tratarlos como sistemas separados. El resultado práctico es un modelo que sigue instrucciones complejas con una precisión inusual, maneja el renderizado de texto denso con exactitud y realiza ediciones puntuales en las imágenes sin desestabilizar todo lo demás en el cuadro. Es más lento y consume más créditos que los Fast Models, pero para tareas que requieren un apego exacto al prompt, texto legible dentro de las imágenes o edición iterativa controlada, es una de las opciones más capaces de la plataforma.

Cómo empezar

Ve a la generación de imágenes — Navega a krea.ai/image y selecciona este modelo desde el menú desplegable.
Selecciona ChatGPT 1.5 — Abre el selector de modelo y elige ChatGPT 1.5 en la sección Intelligent Models.
Escribe tu prompt — Sé lo más específico y descriptivo posible. ChatGPT 1.5 está diseñado para seguir instrucciones con precisión, así que los prompts detallados producen resultados notablemente mejores que los vagos.
Agrega imágenes de referencia (opcional) — Sube imágenes para guiar la composición, el estilo o el tema.
Elige tu proporción — Selecciona vertical, horizontal o cuadrado según tu caso de uso.
Genera — Haz clic en Generar. ChatGPT 1.5 es más lento que los modelos rápidos, pero la calidad de la salida refleja el tiempo adicional de procesamiento.
Itera — Pide cambios específicos en tu resultado. ChatGPT 1.5 modificará solo lo que pidas manteniendo el resto de la imagen consistente.

De un vistazo

Característica	Detalle
Velocidad	Lento (1/3)
Créditos	~150 por generación
Modelo subyacente	GPT Image 1.5 (OpenAI)
Mejor en	Prompts complejos, renderizado de texto, edición precisa
Tamaños admitidos	1:1 cuadrado, 3:2 horizontal, 2:3 vertical
Soporte de referencia de estilo	Sí

Cuándo usar ChatGPT 1.5

ChatGPT 1.5 es el modelo adecuado cuando la precisión importa más que la velocidad. Su arquitectura nativamente multimodal significa que comprende la relación entre texto e imagen a un nivel más profundo que la mayoría de los modelos, lo que se traduce en un mayor apego al prompt y resultados más confiables en solicitudes complejas o en capas. Su capacidad de renderizado de texto es particularmente fuerte. Donde muchos modelos tienen dificultades para producir texto legible y correctamente escrito dentro de una imagen, ChatGPT 1.5 maneja texto denso y a pequeña escala con precisión, lo que lo convierte en una buena opción para cualquier prompt que incluya letreros, tipografía, etiquetas o diagramas. También destaca en la edición iterativa. Cuando le pides que cambie una cosa específica de una imagen, ajusta solo lo que especificaste preservando el parecido facial, la iluminación, la composición y el tono de color del resto del cuadro. Esto aborda una de las frustraciones más comunes con la generación de imágenes por IA, donde pedir una pequeña edición hace que se regenere toda la imagen desde cero.

Úsalo cuando	Evítalo cuando
Tu prompt es complejo y requiere interpretación precisa	Necesitas resultados rápidos o estás en una fase temprana de borrador
Tu imagen debe incluir texto legible	Tienes un presupuesto de créditos ajustado
Necesitas hacer ediciones específicas sin cambiar toda la imagen	Quieres una salida muy estilizada o artística
Estás trabajando en diagramas, personajes o escenas detalladas	Necesitas soporte de estilo LoRA
El parecido facial o la consistencia visual entre ediciones importa

Casos de uso comunes

Diagramas e infografías: ilustraciones técnicas con etiquetas y texto precisos
Diseño de personajes: apariencia de personaje consistente a lo largo de múltiples iteraciones
Visuales de marketing: layouts con copy legible, logos o callouts de producto
Edición de fotos: modificaciones puntuales a imágenes existentes sin regeneración completa
Escenas complejas: composiciones con múltiples elementos que requieren relaciones espaciales precisas

Consejos de prompt

Escribir prompts efectivos

Escribe los prompts como si dieras un brief creativo detallado — describe sujeto, estilo, iluminación, composición y ambiente explícitamente
Para texto dentro de las imágenes, especifica el texto exacto, el estilo de fuente, el tamaño y la posición
Describe las relaciones espaciales con claridad: “una taza roja en el lado izquierdo de una mesa blanca, luz de ventana desde la derecha”
ChatGPT 1.5 maneja bien los prompts largos y detallados — no abrevies cuando puedes ser específico

Iterar sobre los resultados

Al editar, describe solo el cambio que quieres y deja todo lo demás sin especificar — el modelo preservará lo que no menciones
Para trabajo de personajes, establece la apariencia en tu primera generación y luego refiérete a ella explícitamente en ediciones posteriores
Si el resultado no es del todo correcto, refina el lenguaje del prompt en lugar de regenerar con el mismo texto

Sacarle el máximo al renderizado de texto

Pon cualquier texto que necesites en la imagen entre comillas dentro del prompt
Especifica el estilo de fuente si importa: “sans-serif”, “manuscrito”, “mayúsculas en negrita”
Para layouts de texto denso como pósters o diagramas, divide el layout en secciones claras dentro del prompt

Ejemplos

A photorealistic night scene on a narrow Barcelona street, warm amber streetlights , Gothic Quarter architecture lining both sides. In the foreground, a small tapas stall with a glowing sign reading "EL RACÓ" in bold yellow letters, a handwritten menu board underneath listing "Patatas Bravas, Croquetas, Pan con Tomate." Locals and tourists passing by, neon signs in Spanish and Catalan in the background.

A Photorealistic Night Scene On A Narrow Barcelona Street Warm Amber Streetlights Gothic Quarter A W6gluq1p0vlaxp7cvtll 1

Infografías

ChatGPT 1.5 es uno de los modelos más fuertes en Krea para la generación de infografías. A diferencia de la mayoría de los modelos, que simplemente colocan texto sobre una imagen, este razona sobre la jerarquía, el espaciado y la organización visual, comprendiendo la relación entre el contenido escrito y el layout a un nivel estructural. Combinado con su renderizado preciso de texto denso, puede tomar un prompt complejo de múltiples secciones y devolver algo que se ve pensado en lugar de aproximado.

A step-by-step process infographic titled "How Sourdough Bread is Made," showing 8 stages from starter to finished loaf — feeding the starter, mixing the dough, autolyse, bulk fermentation, shaping, proofing, scoring, and baking — each with a small hand-drawn style illustration and a time indicator. Warm cream background, hand-lettered headings, rustic editorial feel.

Omni D44c51a4 2adc 48c1 A5ac 45f045a22ba1

Escenas complejas

Composiciones con múltiples elementos, relaciones espaciales específicas, interacciones entre sujetos y detalle ambiental en capas.

A busy Berlin market hall at 5am, three vendors in rubber aprons arranging fresh fish on crushed ice in the foreground, a fourth vendor mid-negotiation with a restaurant buyer in the middle ground, wooden crates stacked to the left, hanging overhead lights casting warm pools of yellow light across wet concrete floors, steam rising from a small food cart in the background selling hot broth to early morning workers, exposed iron roof structure and brick walls characteristic of a 19th century German markthalle visible above, depth of field pulling focus from the foreground vendors to the hazy activity behind, photorealistic, shot on 35mm.

A Busy Berlin Market Hall At 5am Three Vendors In Rubber Aprons Arranging Fresh Fish On Crushed Ice 77hnonwv5pjlnu91pdfh 0

Instrucciones de edición explícitas

ChatGPT Image 1.5 es significativamente mejor siguiendo instrucciones directas de edición de imágenes. Ahora puedes tratar los prompts como solicitudes precisas de cambio en lugar de volver a describir toda la imagen.

Edit the uploaded image. Remove the person in the background on the left in the pink shirt. Keep the lighting unchanged. Preserve facial identity and skin texture of the main subjects. Maintain original camera angle and depth of field.

​Descripción general

​Cómo empezar

​De un vistazo

​Cuándo usar ChatGPT 1.5

​Casos de uso comunes

​Consejos de prompt

​Escribir prompts efectivos

​Iterar sobre los resultados

​Sacarle el máximo al renderizado de texto

​Ejemplos

​Infografías

​Escenas complejas

​Instrucciones de edición explícitas