Сергей Кочкин поделился практическими советами по управлению ИИ при визуальных генерациях. Он рассмотрел конкретные промты и их действие на примере Midjourney, Stable Diffusion, DALL-E, VEO и других моделей.
Общие советы:
• Помимо содержания картинки, промт должен описывать пять параметров: чёткость, детализацию, структурированность, стиль и атмосферу
• Формулировать запрос нужно максимально конкретно и недвусмысленно. Например, вместо «Рыба под водой» лучше написать «Карась в чёрном плавательном костюме сидит на качелях на дне моря»
• К промтам можно применять формулу из трёх вопросов — «Что? Как? Где?»
• Чтобы обозначить значимость объектов на изображении, можно указывать их вес в числовом выражении. Например, в Midjourney это можно сделать так: «Река :: 0.7»
• Нежелательные объекты можно исключить отрицательным весом или негативным промтом. В Midjourney с помощью команды «—no»
• Генерировать промты можно через текстовые модели, такие как ChatGPT. Можно загрузить картинку и попросить описать её промтом или просто сделать с нуля
• Промты для видео должны содержать описание не только визуала, но и действия. Например, вместо «Мужчина в лесу» нужно написать «Мужчина идёт по лесу»
• Помимо действия, стоит указать характер анимации. Например: плавная, естественная или резкая
#статья@zhurnalus_lite