Укрощаем картинки в нано-банане

МК: Укрощаем картинки в нано-банане

Нейроцех

Часть 1. Быстрый старт

Сгенерируйте картинку и получите её текстовое описание

Откройте Gemini и попросите модель сгенерировать произвольный пейзаж. Подойдёт любой запрос: горы, лес или дорожка через поле. Nano Banana сгенерирует картинку за несколько секунд.

Теперь попробуйте её изменить — например, попросите развернуть дорожку в другую сторону или сменить время суток. Модель может справиться, а может проигнорировать часть инструкций. Причина в том, что Nano Banana сильно цепляется за исходное изображение и с трудом вносит заметные изменения в рамках одного чата.

Чтобы обойти эту особенность, нужно получить текстовое описание картинки и дальше работать с ним вместо самого изображения. Скопируйте сгенерированный пейзаж и откройте новый чат в Gemini. Вставьте изображение и отправьте такой промпт:

Подробно опиши содержимое и стиль данной картинки. Это описание потом пойдет в нейросеть, которая генерирует картинки.

Gemini выдаст подробное текстовое описание: что изображено на картинке, какие цвета, какой стиль, как расположены объекты. Например, для горного пейзажа модель опишет горные вершины, извилистую тропу, освещение, цветовую палитру и общее настроение кадра. На выходе вы получите готовый промпт, который можно использовать для генерации с нуля.

Чтобы убедиться, что описание работает, скопируйте его и вставьте в новый чат с Nano Banana как промпт для генерации. Модель сгенерирует картинку, почти неотличимую от оригинала. Если результат похож на исходник, описание корректное, и с ним можно работать дальше.

Дальше вы можете вносить правки в текст описания: убирать лишние детали, добавлять нужные элементы и менять стиль — и генерировать новые картинки с нуля.

Впишите человека в сгенерированный пейзаж

Пейзаж готов, текстовое описание проверено. Теперь можно добавить в этот пейзаж конкретного человека по фотографии. Если просто написать в чате с Nano Banana «хочу, чтобы на этой картинке стоял вот этот человек», модель может сгенерировать человека в совершенно другом пейзаже. Она «видит» фотографию-референс, но теряет контекст предыдущего изображения и придумывает фон заново.

Чтобы этого избежать, нужно совместить описание пейзажа и портрет в одном промпте. Для этого откройте чат с Gemini в текстовом режиме (тот же, в котором вы получали описание пейзажа), вставьте фотографию человека и отправьте такой запрос:

Я хочу вставить туда свой портрет. Вот исходное изображение меня. Дай промпт для генерации картинки пейзажа плюс моего портрета, при этом фотография меня будет референсом к промпту.

Gemini возьмёт текстовое описание пейзажа из предыдущих сообщений, проанализирует фотографию и выдаст комбинированный промпт, в котором совместит оба элемента: место, освещение, стиль пейзажа и внешность человека. Этот…

🔒

Этот материал доступен участникам Клуба. Войдите или оформите доступ, чтобы читать целиком, открывать видео и комментировать.

Войти Вступить / купить доступ