Blog

Krea 2 em profundidade: exploração, referências de estilo e moodboards

by The Krea Team

Krea 2 em profundidade: exploração, referências de estilo e moodboards

Krea 2 é nosso primeiro modelo base, construído completamente do zero e focado em estética e controle criativo.

Ao criar uma imagem com IA, há realmente duas perguntas: o que você quer na imagem, e como você quer que ela pareça.
A maioria dos modelos é ótima na primeira. Eles lidam com prompts complexos sem esforço.
Mas quando se trata de estilo, eles padrão para algo polido, seguro e um pouco genérico — o visual de IA.

Já falamos antes sobre esse visual de IA e as barreiras que ele cria quando você tenta obter algo expressivo ou artístico de um modelo. Para o Krea 2, queríamos enfrentar isso de frente.
Colocamos tanto esforço em como uma imagem parece quanto no próprio modelo.
O objetivo era algo capaz de renderizar quase qualquer estilo — desde a fotografia de filme mais granulada até a foto de estúdio mais limpa, cenas cinematográficas, ilustração, pintura digital e territórios experimentais mais estranhos.
E tão importante quanto, algo que você possa controlar, não apenas dar um prompt.

A razão importa.
Os tipos de produtos e recursos que conseguimos construir na Krea sempre foram limitados pelos modelos aos quais tínhamos acesso.
Começar nosso próprio laboratório de pesquisa significa que finalmente podemos criar a tecnologia que nos permite construir ferramentas criativas que tratam a IA como um meio criativo real — bruto, flexível, sem opinião, sem cortes.
Algo que você pode quebrar se quiser, que não te encaixa silenciosamente nas mesmas poucas aparências.

Este post é um guia das três coisas que tornam isso possível no Krea 2: exploração aberta na ferramenta de imagem, referências de estilo e moodboards.

Assista ao mergulho completo

14 minutos do Krea 2 em ação.

Assistir no X

Comece vago. Deixe o modelo explorar.

Krea 2 não espera uma ideia totalmente formada.
Você pode entrar na ferramenta de imagem com algo tão simples quanto um gato andando de bicicleta e apenas gerar duas ou três vezes.
O que volta não são quatro variações de uma única interpretação segura — é o modelo pensando em maneiras completamente diferentes de renderizar esse conceito.
Pintura. Fotografia antiga em VHS. Ilustração minimalista. Formas abstratas com sua própria lógica interna.
A primeira rodada de gerações se torna uma espécie de varredura de humor — uma forma de ver que tipos de imagens existem dentro desse prompt, antes de você se comprometer com qualquer uma delas.

Um gato andando de bicicleta — Krea 2 retornando uma ampla variedade de interpretações de um prompt vago

Essa é uma postura diferente da que a maioria dos modelos de imagem te condiciona.
Você não precisa chegar com um briefing detalhado.
Pode usar as três primeiras gerações como pesquisa, encontrar a direção que gosta e então refinar a partir daí.
É mais próximo da forma como um diretor de arte trabalha — começar amplo, depois focar — do que a forma como a maioria das ferramentas de IA te força a escrever.

Aperte o prompt só um pouco — por exemplo, um gato andando de bicicleta, ilustração de desenho animado retrô — e você ainda obtém diversidade, mas o grupo se estreita.
Todos parecem desenhos animados retrô; a variedade está dentro desse estilo.
Alguns são mais complexos, outros mais minimalistas, mas todos são inconfundivelmente desenhos animados retrô.
O modelo não escolhe uma única interpretação canônica de "desenho animado retrô" e imprime quatro vezes; ele explora dentro desse espaço de estilo.

Variações de ilustração de desenho animado retrô do mesmo prompt do gato na bicicleta

A mesma coisa funciona em modos radicalmente diferentes.
Mude o prompt para um gato andando de bicicleta, cena cinematográfica sonhadora em 16:9 e você obtém um espectro inteiro de interpretações desse clima — iluminação diferente, linguagens de câmera diferentes, humores diferentes, todos confortavelmente sob o mesmo guarda-chuva "cinemático sonhador".

Gerações cinematográficas sonhadoras 16:9 do prompt do gato na bicicleta

E se você quiser empurrar o modelo para algo menos polido, pode.
Imagem VHS lo-fi extremamente granulada te dá exatamente isso — baixa resolução, aberração cromática, o tipo de textura que a maioria dos modelos tenta limpar ativamente.
Aqui é onde você sente a parte sem opinião do Krea 2 mais claramente.
O modelo não se segura, não te direciona silenciosamente para algo "de bom gosto", não suaviza as bordas do visual que você pediu.

Variações VHS lo-fi extremamente granuladas — Krea 2 explorando textura e aberração cromática

Referências de estilo: ajuste o visual para mais ou para menos

Depois de encontrar um visual que você goste — seja ele resultado de uma dessas rodadas exploratórias ou que você trouxe de outro lugar — as referências de estilo permitem que você o leve para prompts completamente diferentes.
Passamos tanto tempo no sistema de transferência de estilo quanto no próprio modelo base.

Como funciona: você arrasta qualquer imagem para a caixa de prompt, na área marcada adicionar como transferência de estilo, e então escreve o prompt que quiser.
Por trás dos panos, o sistema extrai os componentes estilísticos daquela imagem — cor, textura, pistas de composição, a sensação de pintura ou fotografia — e os aplica à sua nova geração.
Então, se você gostou do estilo de pintura de uma daquelas imagens do gato na bicicleta e quer ver o que ele faz com um assunto completamente diferente, pode.

Cavalo galopando em um campo com referência de estilo pintado a 50% de intensidade

O controle mais importante aqui é a intensidade.
A intensidade controla o quanto o estilo influencia o modelo base.
Em 50% você obtém uma mistura equilibrada — claramente estilizado, mas o prompt ainda está no comando.
A parte interessante é o que acontece nos extremos.

Baixe o controle para 20% e o mesmo prompt com a mesma referência produz algo muito mais realista.
Você ainda vê indícios da referência: um toque da paleta de cores, uma leve qualidade pintada.
Mas o modelo base tem a vantagem e puxa a imagem para a fotografia.
Isso é útil quando você quer que um estilo informe uma geração em vez de dominá-la — quando quer um toque da referência em vez do conjunto completo.

Mesmo prompt, intensidade do estilo reduzida para 20% — mais próximo da fotografia

Empurre para o outro lado para 80% e a relação se inverte.
Agora a referência está no comando.
Você obtém uma pintura completa na mesma paleta, com as mesmas pinceladas, a mesma linguagem composicional da imagem de referência.
Se empurrar ainda mais, o modelo começa a procurar lugares para colocar a cor da referência — às vezes sobrepondo o próprio sujeito para fazer o estilo encaixar.

Você pode ver isso nas saídas onde o modelo tenta tanto transferir a cor da bicicleta para o cavalo que começa a pintar partes do cavalo nessa cor.
Esse tipo de "quebra" é informativo; mostra exatamente onde a transferência de estilo está tentando chegar.

Intensidade do estilo em 80% — a pintura domina, às vezes sobrepondo o sujeito

Outra coisa que você pode fazer — e é aqui que as referências de estilo realmente começam a parecer um instrumento criativo — é combiná-las.
Você pode empilhar até quatro referências ao mesmo tempo, cada uma com seu próprio controle de intensidade.
Adicione uma referência de cavaleiro sombrio a 70% sobre uma ilustração a 50% e você começa a ver a parte interessante: componentes estilísticos de ambas as imagens coexistindo na mesma saída.
O cromo e a escuridão do cavaleiro, as aberrações pintadas e o traço mais solto da ilustração.
O cavalo sai parcialmente cromado, parcialmente pintado, com fundos e iluminação emprestados de ambos os mundos.

Combinação de duas referências: cavaleiro a 70%, ilustração a 50% — cavalo cromado com artefatos pintados

Reequilibre as mesmas duas — ilustração para 75%, cavaleiro para 57% — e o resultado se inclina para a ilustração: mais artefatos pintados, apenas certas partes do cavalo renderizadas em cromo em vez do todo.
Você literalmente sente cada controle puxando um aspecto diferente da saída.

Adicione uma terceira referência na mistura — uma ilustração em linha a 80% sobre a pintura a 60% e o cavaleiro a 44% — e todo o processo começa a parecer menos com escrever prompts e mais com girar botões físicos em uma ferramenta criativa.
Você não precisa escrever nenhum texto novo.
Pode mover controles, trocar referências, aumentar uma e diminuir outra, e ver a saída se rearranjar em resposta.

Para nós, essa é a resposta mais honesta para a pergunta "como dar a uma ferramenta de IA controle criativo real": você dá ao usuário variáveis que mapeiam qualidades visuais e deixa ele brincar.

Combinação de três referências — linha, pintura e cavaleiro misturados em intensidades diferentes

Moodboards: um tipo mais rico de referência

Referências de estilo são precisas.
Você entrega ao modelo uma imagem específica, ele extrai o estilo, você controla o quanto esse estilo influencia.
Moodboards são a outra novidade no Krea 2 e funcionam em um eixo diferente. Duas diferenças importantes:

  • Sem limite de quatro imagens. Você pode colocar quantas imagens quiser em um moodboard. O ponto é que um moodboard é um conjunto, não uma única referência, e o sistema raciocina sobre o conjunto.
  • O algoritmo faz mais que transferência de estilo. Moodboards usam transferência de estilo por baixo dos panos, sim, mas além disso executam LLMs personalizados e agrupamento nas suas imagens. Eles captam conceitos, personagens recorrentes, expressões, composições, atmosfera — o clima real do conjunto, não só seu estilo visual.

O fluxo de trabalho é simples.
Abra a barra lateral na ferramenta de imagem, clique em moodboards, crie um novo quadro, adicione um lote de imagens e clique em analisar.
Depois de um momento, você recebe três colunas:

  • Perfil de gosto. Uma descrição em alto nível dos tipos de coisas que os algoritmos encontraram no seu moodboard. Útil tanto como verificação quanto como um tipo de espelho — às vezes você vê seu próprio gosto descrito de uma forma que não teria escrito.
  • Palavras-chave. O conjunto de tags de estilo que o sistema usará por baixo dos panos toda vez que você gerar com esse quadro.
  • Evita. Coisas das quais o sistema vai ativamente se afastar quando você gerar com esse quadro. Essa é uma das partes mais subestimadas — poder codificar o que você não quer é muitas vezes mais útil do que codificar o que você quer.

Então você gera normalmente.
Dê o prompt um sapo contra um quadro de ilustração colorida e você obtém sapos que puxam a paleta e o traço — e às vezes vão além, captando detalhes incidentais como pequenas estrelas das referências e tecendo-as na cena.

A saída não é um "sapo no estilo do moodboard" tanto quanto "o que aconteceria se um sapo existisse dentro desse universo."
Às vezes isso vira o sapo observando suas próprias bolhas como um turista confuso. Esse é o ponto.

Geração condicionada por moodboard: um sapo renderizado na cor e estilo de linha do moodboard

Também lançamos um conjunto de predefinições para você brincar com o sistema antes de criar o seu próprio.
Cada predefinição é um moodboard selecionado à mão com seu próprio perfil de gosto, palavras-chave e evita — você pode trocar e ver instantaneamente o mesmo prompt renderizado através de universos estéticos completamente diferentes.

Retro web é um dos nossos favoritos.

Aplique-o ao mesmo prompt do sapo e você obtém território pixelado, um pouco caótico, de colagem 3D — pedaços da estética web do final dos anos 90 colidindo com objetos renderizados e adesivos.
Às vezes as saídas tendem para realismo com uma vibe, como uma colagem que quase faz sentido; às vezes vão para o totalmente pipe-and-3D-blob. Ambos estão corretos.

Predefinição de moodboard retro web aplicada ao prompt do sapo

Marcador expressivo leva o mesmo prompt para o território de personagens.
O conjunto de referência é um monte de personagens ilustrados expressivos e um pouco engraçados, e o sistema mantém esse clima consistente em tudo que você gerar com ele.
O sapo sai parecendo um pouco engraçado, um pouco estilizado, muito claramente um personagem e não apenas um objeto em um estilo.

Essa é a parte dos moodboards que as referências de estilo não conseguem fazer sozinhas: transferir não só o visual, mas a atitude.

Predefinição de moodboard marcador expressivo — sapos ilustrativos com foco em personagem

O modelo mental que funcionou melhor para nós: onde referências de estilo são sobre transferir um visual com precisão, moodboards são sobre entregar ao modelo uma vibe e ver o que ele faz com ela.\

Experimente

Krea 2 te dá muito espaço para explorar e muito controle estético.
Modo exploração para descobrir o que você quer.
Referências de estilo para levar um visual específico entre prompts e ajustar a intensidade.
Moodboards para entregar ao modelo um universo criativo inteiro e deixá-lo gerar dentro desse universo.

Eles foram projetados para serem usados juntos — comece com exploração, refine com referências de estilo, defina um universo estético com um moodboard — mas cada um funciona sozinho também.

A melhor forma de sentir a diferença é abrir a ferramenta de imagem e começar a usar.

Abra a ferramenta de imagem

Experimente Krea 2, referências de estilo e moodboards.

Experimente Krea 2

Perguntas frequentes