Глубокое погружение в Krea 2: исследование, стиль и мудборды

Krea 2 — наша первая фундаментальная модель, созданная полностью с нуля и сосредоточенная на эстетике и творческом контроле.

При создании изображения с помощью ИИ есть два вопроса: что вы хотите видеть на изображении и как вы хотите, чтобы оно выглядело.
Большинство моделей отлично справляются с первым. Они обрабатывают сложные запросы без труда.
Но когда дело доходит до стиля, они по умолчанию выбирают что-то отточенное, безопасное и немного общее — типичный ИИ-стиль.

Мы уже говорили о том ИИ-стиле и барьерах, которые он создает, когда вы пытаетесь получить что-то выразительное или художественное от модели. Для Krea 2 мы решили взять это в лоб.
Мы вложили столько же усилий в то, как выглядит изображение, сколько и в саму модель.
Цель была создать что-то способное воспроизводить практически любой стиль — от зернистой пленочной фотографии до чистейшей студийной съемки, кинематографичных кадров, иллюстраций, цифровой живописи и более экспериментальных направлений.
И не менее важно — что-то, чем можно управлять, а не просто задавать запрос.

Почему это важно.
Возможности продуктов и функций, которые мы создавали в Krea, всегда были ограничены моделями, к которым у нас был доступ.
Создание собственной исследовательской лаборатории означает, что мы наконец можем создавать технологии, позволяющие строить творческие инструменты, которые рассматривают ИИ как настоящий творческий материал — сырой, гибкий, без предвзятости, неограниченный.
Что-то, что можно сломать, если хотите, что не загоняет вас в одни и те же шаблоны.

Этот пост — обзор трех вещей, которые делают это возможным в Krea 2: открытое исследование в инструменте создания изображений, стильные референсы и мудборды.

Посмотреть полный разбор

14 минут работы Krea 2 в действии.

Смотреть на X

Начинайте с расплывчатого — дайте модели исследовать.

Krea 2 не требует полностью сформированной идеи.
Вы можете зайти в инструмент создания изображений с чем-то простым, например, кот на велосипеде, и просто нажать «создать» два-три раза.
То, что вернется, — это не четыре варианта одной безопасной интерпретации, а модель, которая обдумывает совершенно разные способы визуализации этой концепции.
Живопись. Старая VHS-фотография. Минималистичная иллюстрация. Абстрактные формы с собственной внутренней логикой.
Первый раунд генераций становится своего рода обзором настроения — способом увидеть, какие типы изображений вообще скрываются в этом запросе, прежде чем вы выберете что-то одно.

Кот на велосипеде — Krea 2 возвращает широкий спектр интерпретаций по расплывчатому запросу

Это другой подход, чем тот, к которому приучают большинство моделей.
Вам не нужно приходить с детальным брифом.
Вы можете использовать первые три генерации как исследование, найти понравившееся направление и сузить его.
Это ближе к работе арт-директора — начать широко, затем сузить — чем к тому, как большинство ИИ-инструментов заставляют вас писать запросы.

Уточните запрос чуть-чуть — например, кот на велосипеде, ретро-мультяшная иллюстрация — и вы все равно получите разнообразие, но кластер сужается.
Все они выглядят как ретро-мультики; разнообразие живет внутри этого стиля.
Некоторые сложнее, некоторые проще, но все однозначно в стиле ретро-мультика.
Модель не выбирает одну каноническую интерпретацию «ретро-мультика» и не печатает ее четыре раза; она исследует пространство этого стиля.

Вариации ретро-мультяшной иллюстрации того же запроса с котом на велосипеде

То же работает и для радикально разных режимов.
Поменяйте запрос на кот на велосипеде, мечтательная кинематографичная сцена в формате 16:9, и вы получите целый спектр интерпретаций этого настроения — разное освещение, разные языки камеры, разные настроения, все под одной «мечтательной кинематографичной» шапкой.

Мечтательные кинематографичные генерации 16:9 по запросу с котом на велосипеде

Если хотите подтолкнуть модель к чему-то менее отточенному, вы можете.
Очень зернистый лоу-фай кадр VHS даст именно это — низкое разрешение, хроматические аберрации, текстуру, которую большинство моделей стараются убрать.
Здесь вы отчетливо почувствуете непредвзятость Krea 2.
Модель не сдерживается, не направляет вас тихо к «вкусному», не смягчает края запрошенного образа.

Очень зернистые лоу-фай VHS вариации — Krea 2 акцентирует текстуру и хроматические аберрации

Стильные референсы: регулируйте внешний вид

Когда вы нашли понравившийся стиль — будь то результат одного из исследовательских раундов или принесенный из другого места — стильные референсы позволяют перенести его в совершенно другие запросы.
Мы потратили столько же времени на систему переноса стиля, сколько и на саму фундаментальную модель.

Как это работает: вы перетаскиваете любое изображение в поле запроса, в область с пометкой добавить как перенос стиля, а затем пишете любой запрос.
Под капотом система извлекает стилистические компоненты изображения — цвет, текстуру, композиционные подсказки, ощущение живописи или фотографии — и применяет их к новой генерации.
Если вам понравился стиль живописи одного из изображений с котом на велосипеде и вы хотите увидеть, как он работает с совершенно другим объектом, вы можете это сделать.

Лошадь, скачущая по полю, с референсом живописи на 50% силы

Самый важный параметр здесь — сила.
Сила контролирует, насколько сильно стиль влияет на базовую модель.
При 50% вы получаете сбалансированное смешение — узнаваемо стилизованное, но запрос все еще в главной роли.
Интересно, что происходит на крайних значениях.

Опустите ползунок до 20%, и тот же запрос с тем же референсом даст что-то гораздо более реалистичное.
Вы все еще видите намеки на референс: оттенок палитры, легкое ощущение живописи.
Но базовая модель доминирует и тянет изображение в сторону фотографии.
Это полезно, когда вы хотите, чтобы стиль лишь влиял на генерацию, а не доминировал — когда нужен оттенок референса, а не весь стиль целиком.

Тот же запрос, сила стиля снижена до 20% — ближе к фотографии

Поднимите ползунок до 80%, и ситуация меняется.
Теперь референс управляет процессом.
Вы получаете полноценную живопись в той же палитре, с теми же мазками кисти и композицией, что и на референсе.
Если поднять еще выше, модель начинает искать места, куда можно добавить цвет референса — иногда даже изменяя сам объект, чтобы стиль подошел.

Это видно на изображениях, где модель так старается перенести цвет велосипеда на лошадь, что начинает красить части лошади в этот цвет.
Такое «ломание» информативно — оно показывает, куда именно пытается попасть перенос стиля.

Сила стиля 80% — живопись доминирует, иногда изменяя объект

Еще одна возможность — и здесь стильные референсы превращаются в творческий инструмент — это комбинирование.
Вы можете использовать до четырех референсов одновременно, каждый с собственным ползунком силы.
Добавьте темного рыцаря с силой 70% поверх иллюстрации с 50%, и вы увидите интересное: стилистические компоненты обоих изображений сосуществуют в одном результате.
Хром и темнота рыцаря, живописные искажения и свободная рука иллюстрации.
Лошадь получается частично хромированной, частично живописной, с фоном и освещением из обоих миров.

Комбинация из двух референсов: рыцарь 70%, иллюстрация 50% — хромированная лошадь с живописными артефактами

Перебалансируйте те же два — иллюстрация 75%, рыцарь 57% — и результат смещается в сторону иллюстрации: больше живописных артефактов, только отдельные части лошади хромированы, а не вся целиком.
Вы буквально чувствуете, как каждый ползунок тянет за разные аспекты результата.

Добавьте третий референс — линейную иллюстрацию с 80% поверх живописи с 60% и рыцаря с 44% — и весь процесс начинает ощущаться не как написание запроса, а как поворот физических ручек творческого инструмента.
Вам не нужно писать новый текст.
Можно двигать ползунки, менять референсы, увеличивать один и уменьшать другой, и наблюдать, как результат меняется в ответ.
Для нас это самый честный ответ на вопрос «как дать ИИ-инструменту настоящий творческий контроль»: дать пользователю переменные, которые соответствуют визуальным качествам, и позволить играть с ними.

Комбинация из трех референсов — линия, живопись и рыцарь с разной силой

Мудборды: более богатый тип референса

Стильные референсы точны.
Вы даете модели конкретное изображение, она извлекает стиль, вы контролируете силу влияния.
Мудборды — это другая новинка в Krea 2, они работают по другой оси. Два важных отличия:

Нет ограничения в четыре изображения. Вы можете добавить в мудборд сколько угодно изображений. Суть мудборда — это набор, а не один референс, и система анализирует весь набор.
Алгоритм делает больше, чем просто перенос стиля. Мудборды используют перенос стиля, да, но поверх этого запускают кастомные LLM и кластеризацию по вашим изображениям. Они улавливают концепции, повторяющихся персонажей, выражения, композиции, атмосферу — настоящий настрой набора, а не только визуальный стиль.

Рабочий процесс прост.
Откройте боковую панель в инструменте создания изображений, нажмите мудборды, создайте новую доску, загрузите набор изображений и нажмите анализировать.
Через мгновение вы получите три колонки:

Профиль вкуса. Общее описание того, что алгоритмы нашли в вашем мудборде. Полезно как проверка и как зеркало — иногда вы видите свой вкус, описанный так, как сами бы не написали.
Ключевые слова. Набор тегов стиля, которые система будет использовать при генерации с этим мудбордом.
Избегать. То, от чего система будет активно отталкиваться при генерации с этим мудбордом. Это одна из недооцененных функций — возможность закодировать, чего вы не хотите, часто полезнее, чем то, что хотите.

Далее вы генерируете как обычно.
Запросите лягушку с мудбордом цветных иллюстраций, и получите лягушек, которые берут палитру и линию — а иногда и дальше, подхватывая случайные детали, например маленькие звездочки из референсов и вплетая их в сцену.

Результат — не «лягушка в стиле мудборда», а скорее «что было бы, если бы лягушка существовала в этой вселенной».
Иногда это превращается в лягушку, тихо наблюдающую за своими пузырьками, как озадаченный турист. Вот в чем суть.

Генерация с учетом мудборда: лягушка в цветах и стиле линий мудборда

Мы также выпустили набор пресетов, чтобы вы могли поиграть с системой, прежде чем создавать свой собственный.
Каждый пресет — это тщательно подобранный мудборд с собственным профилем вкуса, ключевыми словами и избеганиями — вы можете менять их и сразу видеть, как один и тот же запрос отображается в совершенно разных эстетических вселенных.

Ретро веб — один из наших любимых.

Примените его к тому же запросу с лягушкой, и вы получите пикселизированную, слегка хаотичную 3D-коллажную эстетику — элементы поздних 90-х в веб-дизайне, сочетающиеся с рендеренными объектами и стикерами.
Иногда результаты склоняются к реалистичному с настроением, как коллаж, который почти имеет смысл; иногда они идут в полную абстракцию с трубами и 3D-формами. Оба варианта правильны.

Пресет мудборда ретро веб, примененный к запросу с лягушкой

Экспрессивный маркер переводит тот же запрос в область персонажей.
Набор референсов — это выразительные, слегка забавные иллюстрированные персонажи, и система сохраняет это настроение во всем, что вы с ним создаете.
Лягушка получается немного смешной, немного стилизованной, явно персонажем, а не просто объектом в стиле.

Это то, что мудборды делают лучше, чем стильные референсы: передают не только внешний вид, но и настроение.

Пресет мудборда экспрессивный маркер — иллюстративные лягушки с характером

Ментальная модель, которая лучше всего работает для нас: если стильные референсы — это точный перенос внешнего вида, то мудборды — это передача настроения модели и наблюдение за результатом.\

Попробуйте

Krea 2 дает много пространства для исследования и большой эстетический контроль.
Режим исследования для понимания, чего вы хотите.
Стильные референсы для переноса конкретного стиля между запросами и регулировки силы.
Мудборды для передачи модели целой творческой вселенной и генерации внутри нее.

Они созданы для совместного использования — начните с исследования, уточните стильными референсами, закрепите эстетическую вселенную мудбордом — но каждый инструмент работает и отдельно.

Лучший способ почувствовать разницу — открыть инструмент создания изображений и начать экспериментировать.

Открыть инструмент создания изображений

Попробуйте Krea 2, стильные референсы и мудборды.

Попробовать Krea 2