За последний год я смотрел, как люди работают с генеративными моделями для фото — Gemini, Seedream, Grok Imagine. Заметная закономерность: при одинаковом доступе к одним и тем же моделям одни получают рабочий кадр с третьей попытки, другие после двадцати запросов всё ещё мучаются.

Разница не в моделях. Разница в процессе. Ниже — восемь приёмов, которые отличают тех, кто получает предсказуемый результат, от тех, кто гадает.

1. Не одна модель на все случаи, а стек под задачу

Универсальной модели на 2026 год нет. Это как с объективами: 50-миллиметровый фикс хорош для портрета, но снимать им свадебный зал не получится.

Грубое распределение, которое сложилось у нас на практике:

  • Черновики и быстрые итерации — Nano Banana на базе Gemini 2.5 Flash. Дешево, быстро, удобно прощупать концепцию.
  • Основная масса рабочих кадров — Nano Banana V2 на Gemini 3.1 Flash Image. Лучшее соотношение цена-качество.
  • Финал, где нужна максимальная детализация — Nano Banana Pro на Gemini 3 Pro. Только на утверждённых композициях, иначе сожжёте бюджет.
  • Гиперреалистичная фотография — Seedream V4.5. Кожа, мокрые волосы, отражения в стекле — здесь Seedream чаще выигрывает.
  • Постеры и стилизация — Grok Imagine. В нефотографических жанрах он, наоборот, сильнее.

2. Восемь из десяти хороших кадров — это правка, а не генерация

Самый недооценённый приём. У меня соотношение «генерация с нуля» к «правка существующего» — примерно один к четырём.

Большинство пользователей живёт в режиме «написал — не понравилось — переписал — всё равно не понравилось». Так не надо. Получили первый сносный кадр — отдайте его обратно как основу и точечно меняйте, что не нравится:

  • «Убери очки, остальное оставь»
  • «Замени фон на закат над морем»
  • «Сделай выражение лица серьёзнее»
  • «Сними шарф, добавь серёжки»

Композиция, поза, лицо, освещение — всё, что вам уже понравилось, сохраняется. Меняется только то, что вы попросили. Шанс попасть в нужный результат заметно выше, чем при генерации с нуля.

3. Структура промпта вместо потока сознания

«Красивая девушка сидит у окна с кофе и смотрит вдаль очень атмосферно, киношно, мягкий свет» — типичный промпт начинающего. Модель из такого описания додумывает половину сама. Обычно — не туда.

Рабочая структура из пяти блоков, каждый с новой строки:

  1. Кто или что в кадре — возраст, внешность, во что одет, что держит.
  2. Что происходит — действие, поза, направление взгляда.
  3. Стиль — фотореализм, плёнка, ретро, графика, рисунок маслом.
  4. Свет — направление, мягкость, время суток.
  5. Камера — фокусное расстояние, диафрагма, план.

Живой пример:

Женщина около тридцати, светлые волосы до плеч, минимум макияжа, белая льняная рубашка. Сидит у окна с керамической чашкой кофе в руках, смотрит вбок, лёгкая полуулыбка. Фотореализм, тёплая палитра, плёночное зерно средней зернистости. Мягкий рассеянный свет с левой стороны, час до заката, без жёстких теней. 50 мм, диафрагма f/1.8, средний план, фокус на лице, лёгкое размытие фона.
Кинопортрет в золотом свете
Кадр на структурном промпте — каждый параметр считывается: золотой час, боковой свет, портретник с размытым фоном, спокойная сосредоточенность.

На практике промпты, написанные по этой структуре, дают рабочий кадр в среднем с 2–3 попыток. Хаотичные — с 8–12.

4. Что значат «50 мм, f/1.8» и почему это работает

Технические настройки фотографии в промпте — не карго-культ. Модели обучены на миллионах подписей к фотографиям, где такие параметры реально стояли.

Фокусное расстояние меняет геометрию лица.

  • 24–35 мм — широкий угол, лёгкое искажение. Уличные репортажные кадры, человек в среде.
  • 50 мм — нейтральный, естественный. Универсальный выбор.
  • 85 мм — классический портретник. Сжимает черты лица, делает их «скульптурными».
  • 135 мм — длинный фокус, сильная компрессия фона.

Диафрагма управляет глубиной резкости.

  • f/1.4–f/2 — резкий объект, всё остальное в красивом размытии. Портреты.
  • f/2.8–f/4 — глубина резкости в пределах человека. Безопасный диапазон.
  • f/5.6–f/8 — резкость почти по всему кадру. Группы, интерьеры.
  • f/11+ — пейзажная резкость от земли до горизонта.

Тип плёнки или пресет задаёт палитру.

  • Kodak Portra 400 — мягкие телесные тона, тёплое золото. Свадебная и портретная съёмка.
  • Fuji Pro 400H — холодноватая зелено-голубая палитра. Лайфстайл, минимализм.
  • Cinestill 800T — фирменное красное гало вокруг источников света. Ночной город, неон.
  • Ilford HP5 — классическая чёрно-белая плёнка с заметным зерном.

Что не работает — указание модели камеры. Между «Sony A7R IV» и «Canon R5» в промпте разницы нет. Объектив и плёнка — есть.

5. Негативный промпт: что не должно попасть в кадр

Рядом с обычным промптом существует негативный — список того, чего вы видеть не хотите. Многие про него забывают, или пишут «плохое качество» и считают задачу закрытой. Так не работает: модель не понимает «плохое». Она оперирует конкретными визуальными концепциями.

Базовый набор для портретов и сцен с людьми:

  • Текст: distorted text, illegible letters, garbled signs, fake brand logos
  • Кожа: plastic skin, airbrushed face, doll-like, porcelain skin, retouched
  • Глаза: asymmetric pupils, dead glassy eyes, lifeless gaze, cross-eyed
  • Лица в массовке: melting background faces, distorted faces in crowd
  • Палитра: oversaturated, HDR look, overprocessed, fake bokeh
  • Стоковая банальность: posed stock photo, generic pose, stiff posing
  • Чужие водяные знаки: watermark, signature, getty images, shutterstock

Главная боль 2026 года — текст. Любая длинная фраза в кадре уходит в абракадабру, особенно с кириллицей. Если текст критичен — генерируйте пустую вывеску и накладывайте текст вторым шагом в графическом редакторе.

Про кожу: модели любят отретушированное «фарфоровое» лицо без пор. В пару к негативу полезно добавить в основной промпт: «natural skin texture, visible pores, slight imperfections».

Про стоковую банальность — это самое заметное «АИ-палево» 2026. Скрещенные руки, белозубая улыбка в камеру, симметрия по центру, белый фон. Полезно писать «candid moment, unposed, caught mid-motion».

6. Менее очевидные приёмы

То, что приходит с практикой.

Имена фотографов и художников. Модели видели подписи к снимкам в обучающих данных. «В стиле Annie Leibovitz» — контрастные портреты с продуманным светом. «В эстетике Вонга Карвая» — пустые ночные улицы, неон, тёплые тени, лёгкий смаз. «Композиция как у Вермеера» — окно слева, мягкий рассеянный свет, домашняя сцена. Один такой ориентир заменяет три-четыре строки описания.

Время года и время суток конкретно. Не «вечером», а «за 30 минут до заката» — модель переключает палитру на золотой час. Не «зимой», а «начало марта, последний снег и первая зелень».

Эмоция в кадре. «Усталая, но довольная», «задумчивый, чуть отсутствующий взгляд», «лёгкое раздражение, но контролируемое». Современные модели хорошо различают тонкие состояния. Без указания эмоции получаете нейтральное лицо.

Материалы и фактуры. Если в кадре есть предметная съёмка — называйте материал. «Чугунная сковорода с патиной», «латунная ручка, отполированная до блеска», «лён, мятый, не глаженый».

Композиционные подсказки. «По правилу третей», «низкая точка съёмки», «вид сверху», «диагональная композиция». Модели понимают эти термины.

Отрицание через положительное. Если лицо упорно получается симметричным, не пишите «не делай симметрию». Пишите «лёгкая асимметрия лица, естественная неправильность». Положительная формулировка работает в разы лучше.

7. Сначала черновик в низком разрешении, потом — увеличение

Самая распространённая трата денег — генерация сразу в максимальном разрешении. В три-пять раз дороже, и результат часто чуть менее чёткий, чем «небольшой кадр плюс отдельное увеличение».

Рабочий цикл: генерируете четыре-шесть вариантов в самом маленьком разрешении, выбираете лучший, и только его прогоняете через отдельный инструмент увеличения. Хорошие апскейлеры не растягивают пиксели, а достраивают детали — текстуру кожи, фактуру ткани, мелкий текст. Экономия — примерно половина бюджета.

8. Сохранение лица в серии

Если задача — серия из десяти кадров с одним человеком (контент-план аватарок, лукбук для интернет-магазина, единый персонаж), генерация с нуля по описанию работать не будет. Лицо «плывёт» от кадра к кадру даже при идентичном промпте.

Решение — режим работы по референсу. Загружаете чёткое фронтальное фото лица плюс промпт сцены. Модель сохраняет идентичность лица и генерирует окружение под него. На Gemini 3 Pro и Seedream V4.5 сохранение лица работает заметно стабильнее, чем на ранних моделях.

Стилизация под поп-икону
Поп-икона в красном — причёска, макияж, костюм и студийный свет генерируются с нуля, лицо переносится с референса.

Типичные ошибки, на которых горят все

Перегруз промпта прилагательными. «Атмосферный, кинематографичный, эпичный, потрясающий портрет с захватывающим освещением». Эти слова — синонимы и забивают канал. Вместо них работают конкретные технические описания.

Противоречия в одном промпте. «Минималистичный портрет с обилием деталей и сложным фоном». «Утро в плотном тумане с резкими длинными тенями». Модель идёт по среднему пути и выдаёт ни то ни сё. Перечитайте промпт перед отправкой и спросите себя — нет ли тут двух взаимоисключающих требований.

Pro-модель для черновиков. Финальная модель в три раза дороже черновой. Если ещё не определились с композицией — генерируйте на дешёвой, переключайтесь на Pro только когда выбрана концепция и идёт финал.

Игнорирование «голоса» модели. Если результат стабильно смещается в одну сторону — упорно делает фон тёмным, хотя вы просите светлый — это сигнал, что в промпте есть скрытый конфликт. Чаще всего виноват «стиль»: «киношный» в большинстве моделей по умолчанию означает контрастный и тёмный. Поменяйте слово.

Главное

Все восемь приёмов сводятся к одной идее: качество результата в генеративных моделях — функция от процесса, а не от инструмента. Доступ к Gemini 3 Pro сам по себе не делает кадр сильным. Его делает то, как вы выстраиваете промпт, как итерируете, какую модель выбираете под задачу.

Эта статья — выжимка наблюдений, собранных за полтора года практики с разными моделями.