Blog

Krea 2 approfondimento: esplorazione, riferimenti di stile e moodboard

by The Krea Team

Krea 2 approfondimento: esplorazione, riferimenti di stile e moodboard

Krea 2 è il nostro primo modello di base, costruito completamente da zero e focalizzato sull'estetica e il controllo creativo.

Quando crei un'immagine con l'IA ci sono davvero due domande: cosa vuoi nell'immagine e come vuoi che appaia.
La maggior parte dei modelli è ottima per la prima. Gestiscono prompt complessi senza problemi.
Ma quando si tratta di stile, tendono a defaultare a qualcosa di rifinito, sicuro e un po' generico — l'aspetto IA.

Abbiamo già parlato di quell'aspetto IA e delle barriere che crea quando cerchi di ottenere qualcosa di espressivo o artistico da un modello. Per Krea 2 volevamo affrontarlo direttamente.
Abbiamo dedicato tanto lavoro a come appare un'immagine quanto al modello stesso.
L'obiettivo era qualcosa capace di rendere quasi ogni stile — dalla fotografia su pellicola più granulosa allo scatto in studio più pulito, scene cinematografiche, illustrazione, pittura digitale e territori sperimentali più strani.
E altrettanto importante, qualcosa che puoi guidare, non solo stimolare con un prompt.

Il motivo è importante.
I tipi di prodotti e funzionalità che abbiamo potuto costruire in Krea sono sempre stati limitati dai modelli a cui avevamo accesso.
Avviare il nostro laboratorio di ricerca significa che finalmente possiamo creare la tecnologia che ci permette di costruire strumenti creativi che trattano l'IA come un vero mezzo creativo — grezzo, flessibile, senza pregiudizi, non tagliato.
Qualcosa che puoi rompere se vuoi, che non ti rinchiude silenziosamente negli stessi pochi stili.

Questo post è una guida alle tre cose che rendono possibile tutto ciò in Krea 2: esplorazione aperta nello strumento immagine, riferimenti di stile e moodboard.

Guarda l'approfondimento completo

14 minuti di Krea 2 in azione.

Guarda su X

Parti vago. Lascia che il modello esplori.

Krea 2 non si aspetta un'idea completamente formata.
Puoi entrare nello strumento immagine con qualcosa di semplice come un gatto che va in bicicletta e premere genera due o tre volte.
Quello che torna non sono quattro variazioni di un'unica interpretazione sicura — è il modello che pensa a modi completamente diversi in cui quel concetto potrebbe essere rappresentato.
Pittura. Fotografia VHS d'epoca. Illustrazione minimalista. Forme astratte con una loro logica interna.
Il primo giro di generazioni diventa una sorta di esplorazione d'atmosfera — un modo per vedere che tipi di immagini vivono dentro questo prompt, prima di impegnarti in una di esse.

Un gatto che va in bicicletta — Krea 2 restituisce una vasta gamma di interpretazioni su un prompt vago

Questa è una postura diversa da quella in cui la maggior parte dei modelli di immagini ti abitua.
Non devi arrivare con un brief dettagliato.
Puoi usare le prime tre generazioni come ricerca, trovare la direzione che ti piace e poi restringere da lì.
È più simile al modo in cui lavora un direttore artistico — partire ampio, poi focalizzarsi — che al modo in cui la maggior parte degli strumenti IA ti costringe a scrivere.

Restringi il prompt solo un po' — per esempio, un gatto che va in bicicletta, illustrazione cartoon retrò — e ottieni ancora diversità, ma il cluster si restringe.
Tutti sembrano cartoon retrò; la varietà vive all'interno di quello stile.
Alcuni sono più complessi, altri più minimalisti, ma sono tutti inequivocabilmente cartoon retrò.
Il modello non sceglie un'unica interpretazione canonica di "cartoon retrò" e la stampa quattro volte; esplora all'interno di quello spazio stilistico.

Variazioni di illustrazione cartoon retrò dello stesso prompt del gatto in bicicletta

La stessa cosa funziona in modalità radicalmente diverse.
Cambia il prompt in un gatto che va in bicicletta, scena cinematografica onirica in 16:9 e ottieni un intero spettro di interpretazioni di quella vibrazione — diverse illuminazioni, diversi linguaggi di camera, diversi umori, tutti comodamente sotto lo stesso ombrello "cinematografico onirico".

Generazioni cinematografiche oniriche 16:9 del prompt del gatto in bicicletta

E se vuoi spingere il modello verso qualcosa di meno rifinito, puoi farlo.
Immagine VHS lo-fi estremamente granulosa ti dà esattamente questo — bassa risoluzione, aberrazione cromatica, il tipo di texture che la maggior parte dei modelli cerca attivamente di pulire.
Qui puoi sentire chiaramente la parte senza pregiudizi di Krea 2.
Il modello non si trattiene, non ti guida silenziosamente verso il "gustoso", non ammorbidisce i bordi dell'aspetto che hai chiesto.

Variazioni VHS lo-fi estremamente granulose — Krea 2 che enfatizza texture e aberrazione cromatica

Riferimenti di stile: regola l'aspetto su e giù

Una volta trovato un aspetto che ti piace — sia che sia uscito da uno di questi giri esplorativi o che l'abbia portato da qualche altra parte — i riferimenti di stile ti permettono di portarlo avanti in prompt completamente diversi.
Abbiamo dedicato tanto tempo al sistema di trasferimento di stile quanto al modello di base stesso.

Come funziona: trascini qualsiasi immagine nella casella del prompt, nell'area contrassegnata aggiungi come trasferimento di stile, e poi scrivi il prompt che vuoi.
Sotto il cofano, il sistema estrae i componenti stilistici di quell'immagine — colore, texture, indizi di composizione, la sensazione pittorica o fotografica — e li applica alla tua nuova generazione.
Quindi se ti è piaciuto lo stile pittorico di una di quelle immagini del gatto in bicicletta e vuoi vedere cosa fa con un soggetto completamente diverso, puoi farlo.

Cavallo che galoppa in un campo con un riferimento di stile pittorico al 50% di intensità

La manopola più importante qui è la forza.
La forza controlla quanto lo stile spinge contro il modello base.
Al 50% ottieni una miscela bilanciata — riconoscibilmente stilizzata, ma il prompt è ancora saldamente al comando.
La parte interessante è cosa succede agli estremi.

Abbassa il cursore a 20% e lo stesso prompt con lo stesso riferimento produce qualcosa di molto più realistico.
Puoi ancora vedere accenni del riferimento: un tocco della palette di colori, una lieve qualità pittorica.
Ma il modello base ha la meglio e tira l'immagine verso la fotografia.
Questo è utile quando vuoi che uno stile informi una generazione piuttosto che dominarla — quando vuoi un accenno del riferimento invece dell'intero.

Stesso prompt, forza dello stile ridotta al 20% — più vicino alla fotografia

Spingilo dall'altra parte a 80% e la relazione si inverte.
Ora il riferimento è al comando.
Ottieni un dipinto completo nella stessa palette, con le stesse pennellate, lo stesso linguaggio compositivo dell'immagine di riferimento.
Spingilo ancora oltre e il modello inizia a cercare posti dove mettere il colore del riferimento — a volte sovrascrivendo il soggetto stesso per far combaciare lo stile.

Puoi vedere questo nelle uscite dove il modello cerca così tanto di trasferire il colore della bici al cavallo che inizia a dipingere parti del cavallo stesso in quel colore.
Quel tipo di "rottura" è informativo; ti dice esattamente dove il trasferimento di stile sta cercando di arrivare.

Forza dello stile all'80% — il dipinto prende il sopravvento, a volte sovrascrivendo il soggetto

L'altra cosa che puoi fare — e qui i riferimenti di stile iniziano davvero a sembrare uno strumento creativo — è combinarli.
Puoi sovrapporre fino a quattro riferimenti contemporaneamente, ognuno con il proprio cursore di forza.
Aggiungi un riferimento a un cavaliere oscuro al 70% sopra un'illustrazione al 50% e inizi a vedere la parte interessante: componenti stilistici di entrambe le immagini che coesistono nella stessa uscita.
La cromatura e l'oscurità del cavaliere, le aberrazioni pittoriche e la mano più libera dell'illustrazione.
Il cavallo esce parzialmente cromato, parzialmente dipinto, con sfondi e illuminazioni presi da entrambi i mondi.

Combinazione di due riferimenti: cavaliere al 70%, illustrazione al 50% — cavallo cromato con artefatti pittorici

Ribilancia gli stessi due — illustrazione al 75%, cavaliere al 57% — e il risultato si inclina verso l'illustrazione: più artefatti pittorici, solo alcune parti del cavallo rese in cromatura invece che tutto.
Puoi letteralmente sentire ogni cursore che tira su un aspetto diverso dell'output.

Aggiungi un terzo riferimento nella miscela — un'illustrazione a linee all'80% sopra il dipinto al 60% e il cavaliere al 44% — e l'intero processo inizia a sembrare meno un prompt e più come girare manopole fisiche su uno strumento creativo.
Non devi scrivere nessun testo nuovo.
Puoi muovere i cursori, scambiare riferimenti, alzare uno e abbassare un altro, e vedere l'output riorganizzarsi in risposta.

Per noi questa è la risposta più onesta alla domanda "come si dà a uno strumento IA un vero controllo creativo": dai all'utente variabili che mappano qualità visive e li lasci giocare.

Combinazione di tre riferimenti — linee, pittura e cavaliere miscelati a diverse intensità

Moodboard: un tipo di riferimento più ricco

I riferimenti di stile sono precisi.
Dai al modello un'immagine specifica, estrae lo stile, controlli quanto quello stile spinge.
I moodboard sono l'altra novità in Krea 2 e lavorano su un asse diverso. Due differenze importanti:

  • Nessun limite di quattro immagini. Puoi inserire quante immagini vuoi in un moodboard. Il punto è che un moodboard è un insieme, non un singolo riferimento, e il sistema ragiona sull'insieme.
  • L'algoritmo fa più del trasferimento di stile. I moodboard usano il trasferimento di stile sotto il cofano, sì, ma sopra a questo eseguono LLM personalizzati e clustering sulle tue immagini. Catturano concetti, personaggi ricorrenti, espressioni, composizioni, atmosfera — il vero mood dell'insieme, non solo il suo stile visivo.

Il flusso di lavoro è semplice.
Apri la barra laterale nello strumento immagine, clicca su moodboard, crea una nuova board, inserisci un gruppo di immagini e clicca su analizza.
Dopo un attimo ottieni tre colonne:

  • Profilo di gusto. Una descrizione ad alto livello dei tipi di cose che gli algoritmi hanno trovato nel tuo moodboard. Utile sia come controllo di sanità mentale sia come una sorta di specchio — a volte vedi il tuo stesso gusto descritto in un modo che non avresti scritto tu stesso.
  • Parole chiave. L'insieme di tag di stile che il sistema userà sotto il cofano ogni volta che generi con questa board.
  • Evitare. Cose da cui il sistema si allontanerà attivamente quando generi con questa board. Questa è una delle parti più sottovalutate — poter codificare ciò che non vuoi è spesso più utile che codificare ciò che vuoi.

Poi generi come al solito.
Prompt una rana contro una board di illustrazione colorata e ottieni rane che prendono la palette e il tratto — e a volte vanno oltre, catturando dettagli incidentali come piccole stelle dai riferimenti e intrecciandoli nella scena.

L'output non è una "rana nello stile del moodboard" quanto piuttosto "cosa succederebbe se una rana esistesse dentro questo universo."
A volte questo si traduce in una rana che osserva silenziosamente le sue bolle come un turista confuso. Questo è il punto.

Generazione condizionata da moodboard: una rana resa nel colore e stile di linea del moodboard

Abbiamo anche rilasciato una serie di preset così puoi giocare con il sistema prima di costruire il tuo.
Ogni preset è un moodboard curato a mano con il proprio profilo di gusto, parole chiave ed evita — puoi scambiarli e vedere immediatamente lo stesso prompt reso attraverso universi estetici completamente diversi.

Retro web è uno dei nostri preferiti.

Applicalo allo stesso prompt della rana e ottieni territori pixelati, collage 3D leggermente caotici — pezzi di estetica web fine anni '90 che si scontrano con oggetti renderizzati e adesivi.
A volte le uscite tendono al realistico-con-vibrazione, come un collage che quasi ha senso; a volte vanno completamente pipe-e-blobs-3D. Entrambi sono corretti.

Preset moodboard retro web applicato al prompt della rana

Expressive marker sposta lo stesso prompt nel territorio dei personaggi.
Il set di riferimento è un gruppo di personaggi illustrati espressivi e un po' buffi, e il sistema mantiene quel mood coerente in tutto ciò che generi con esso.
La rana esce un po' buffa, un po' stilizzata, molto chiaramente un personaggio e non solo un oggetto in uno stile.

Questa è la parte dei moodboard che i riferimenti di stile non riescono a fare da soli: trasferire non solo l'aspetto ma l'atteggiamento.

Preset moodboard expressive marker — rane illustrative guidate da personaggi

Il modello mentale che ha funzionato meglio per noi: mentre i riferimenti di stile riguardano trasferire un aspetto con precisione, i moodboard riguardano dare al modello una vibrazione e vedere cosa ne fa.\

Provalo

Krea 2 ti dà molto spazio per esplorare e molto controllo estetico.
Modalità esplorazione per capire cosa vuoi.
Riferimenti di stile per portare un aspetto specifico attraverso i prompt e regolarlo con la forza.
Moodboard per dare al modello un intero universo creativo e lasciarlo generare all'interno di quell'universo.

Sono progettati per essere usati insieme — parti dall'esplorazione, affina con i riferimenti di stile, blocca un universo estetico con un moodboard — ma ognuno funziona anche da solo.

Il modo migliore per sentire la differenza è aprire lo strumento immagine e iniziare a usarlo.

Apri lo strumento immagine

Prova Krea 2, riferimenti di stile e moodboard.

Prova Krea 2

Domande frequenti