Разбираемся с ИИ
Полный гид по Midjourney: промты, настройки и этика
Перед вами большой и подробный гид по Midjourney – нейросети, которая преобразует
текстовые описания в изображения.
Здесь всё о том, как начать, какие настройки использовать,
и что потом делать со всеми этими картинками.
Midjourney может быть мощным инструментом в руках художника.
А может и не быть, если не уметь им пользоваться.

В этом гиде мне кажется важно не просто рассказать о возможностях программы, но и о том, что это значит для художников, для нас с вами. И как Midjourney могут использовать во благо даже те, кто относится к ИИ
с недоверием (вполне, впрочем, оправданным).
Может показаться, что я объясняю слишком подробно, но я хочу, чтобы это было доступно людям, которые Дискорд в глаза не видели. Поэтому, если вам все понятно, просто переходите к следующему разделу с более сложными подробностями.

Специально для вас сделала удобные кликабельные ссылки в плане)

План такой:
Начинаем генерацию: создаем аккаунт и первый промт
•Регистрация: куда идти, что нажимать
•Первый промт
•Кнопки под сгенерированным изображением
•Другие команды (слэш-команды, инфо и настройки)
•Бесплатная подписка и тарифы

Добро пожаловать в клуб: разбираемся в тонкостях
•Общие советы по составлению промта
•Продвинутые настройки промта: структура и стиль
•Продвинутые настройки промта: пропорции, запреты, вес элементов
•Дополнительные параметры: высокое разрешение и стилизация
•Добавление картинки-референса
•Что делают эмодзи и реакции

Перспективы использования: что делать художникам
•Этичное использование

•Необходимость присвоить сгенерированное изображение
•Возможные модификации и варианты печати
•Мастермайнд-группа

1
Начинаем генерацию:
создаем аккаунт и первый промт
РЕГИСТРАЦИЯ: КУДА ИДТИ, ЧТО НАЖИМАТЬ
Это скучная часть, которую могут пропустить все, кто уже зарегистрировался,
но которая пригодится тем, кто вообще не понимает, что происходит.
Создание аккаунта и вход в Midjourney

Доступ к нейросети сейчас возможен только через бота в Discord
(далее кириллицей, потому что я хочу склонять слова).
Поэтому заходим на Дискорд и создаем профиль.

Можно загрузить программу для компьютера, а можно открыть прямо в браузере, как любой другой сайт.

Теперь заходим на сервер Midjourney и нажимаем Join the beta.
Здесь в окне Дискорда автоматически открывается сервер Midjourney.
Здесь нам присваивается рандомная группа с несколькими открытыми каналами для новичков.

Их видно в колонке слева с заголовком Newcomer rooms.
Выбираем любой из каналов с названием Newbie.

Здесь видно картинки, которые генерируют все участники канала. Некоторым нравится работать, когда вокруг происходит какой-то движ, но среди сообщений легко потеряться.
Чтобы найти потерянную картинку, зайдите в Inbox, это значок в правом верхнем углу рядом со знаком вопроса.

Вот тут на скринах видно, где находятся группы новичков
и где найти Inbox:
Первый промт

Все взаимодействие с ботом Midjourney происходит через сообщения. Когда перед сообщением добавляется слэш /, оно превращается в понятную боту команду.

Самая важная команда /imagine позволяет дать боту текстовое задание (промт), которое Midjourney визуализирует в меру своих способностей.

Наберите /imagine, добавьте пробел и после появившегося слова prompt наберите ваше задание.

Например, вот так выглядит
промт для волшебного зеркала:
/imagine prompt:magical mirror
После того как промт отправлен, подождите около минуты, пока нейросеть собирает вашу картинку из миллиона отдельных кусочков.

Результат будет в виде четырех картинок и серии кнопок.

Ряд U — апскейлинг или увеличение разрешения. Номера соответствуют порядку картинок. Например, если я хочу увеличить картинку в правом верхнем углу, нажимаю U2.

Ряд V — вариации или еще 4 похожие картинки на основе выбранной.
Скажем, мне нравится картинка в нижнем ряду слева, но я хочу заменить некоторые детали, нажимаю V3.

Кнопочка со знаком круговорота повторяет уже введенный промт.
Здесь важно напомнить, что на бесплатном тарифе у вас есть всего 25 генераций,
и каждый апскейлинг/вариация считается за отдельную попытку.
Будьте бдительны и точны)
Например, я нажала U2 и получила доработанное изображение
А это я нажала V3 и получила еще четыре вариации третьей картинки и тех, что я получила после ввода первого промта.

Здесь видно, что нажата U4.
Это значит, что я хочу получить последнюю из этих четырех работ
в апскейле.
После генерации под изображением появляются другие кнопки:
Make Variations создает еще четыре новых картинки на основе этой
Upscale to Max увеличивает картинку до еще более высокого разрешения (примерно 1664x1664)

Light Upscale Redo — делает апскейл заново, не добавляя деталей.
Web открывает ссылку на вашу картинку на сайте-галерее, где публикуются все работы кроме созданных в приватном режиме.

Ряд с эмодзи позволяет оценить результат.
Создатели считают, что такие оценки помогают совершенствовать алгоритм, поэтому выдают бесплатные часы быстрого машинного времени, если часто оценивать получившиеся изображения.

Кликните на картинку, чтобы открыть ее в полном разрешении и сохранить.
Варианты действий
после апскейла
Другие команды (слэш-команды)

/info показывает данные о количестве оставшихся попыток на бесплатном тарифе, о числе оставшихся быстрых часов – на платных. А также информацию о вашем профиле, тарифе и текущих промтах в очереди.

/help показывает советы по работе с ботом

/fast and /relax переключает между быстрым и расслабленным режимами. В платном режиме есть несколько быстрых часов, по истечении которых всё быстрое время будет оплачиваться отдельно.
В расслабленном режиме можно работать бесконечно, но картинки генерируются медленней.

/settings показывает настройки и позволяет переключаться между версиями Midjourney. Например, можно включить режим Niji, который специализируется на анимационных персонажах.
В бесплатной версии некоторые параметры недоступны.

Ниже вы видите сообщение, которое появляется после введения команды /settings
Бесплатная подписка и тарифы

Бесплатный триал заключается в 25 сгенерированных картинках.
Если вы хотите продолжать эксперименты, придется выбрать один из тарифов.
Или создать еще один аккаунт)

Если у вас почта на gmail, то вы можете поставить точку в любом месте своего никнейма, и Дискорд будет думать, что почта новая, но письма будут приходить на обычную.

Например, у вас есть почта на pochta@gmail.com
Из этого вы можете повторно зарегистрировать:
p.ochta@gmail.com
po.chta@gmail.com
poc.hta@gmail.com

И так далее.
Каждый раз будет новый аккаунт и новые 25 попыток.
У меня сейчас вот такой план. Потратила 5 быстрых часов.
Заработала 2 бонусных часа на оценке сгенерированных картинок.
Из платных тарифов сейчас доступны три опции

Basic 10$ в месяц:
200 генераций

Standart 30$ в месяц:
бесконечные генерации в расслабленном режиме,
15 часов быстрых генераций

Pro 60$ в месяц:
бесконечные генерации в расслабленном режиме,
30 часов быстрых генераций,
приватный режим, где созданные для вас картинки никто не видит.

Главный плюс подписки – вы генерируете картинки один-на-один с ботом, а не в общем чате. Так значительно проще ориентироваться.

Чтобы посмотреть актуальные планы, введите команду /subscribe и перейдите по сгенерированной ссылке.
2
Добро пожаловать в клуб:
разбираемся в тонкостях
Общие советы по составлению промта

Разберемся с принципами, которые вам помогут в первые дни экспериментов.
Точность и контекст

Все, что вы не опишете точно, будет рандомизовано. Если вы хотите получить строго определенную картинку, постарайтесь уточнить детали и контекст.
Если вам подойдет любое изображение с примерно определенным концептом, оставьте детали на откуп боту.

Узнаваемость
Лучше всего получаются те объекты, картинок которых много в интернете. Почему? Потому что Midjourney синтезируют свои изображения из работ других художников. Если доктору Франкейнштейну дать много лягушек, то можно сделать принцессу-лягушку.
А вот царевны-лебедя не получится.

Например, у меня Midjourney отказывается понимать слово «кензан», потому что кензан на фотографиях цветочных композиций часто скрыт, и даже если он точно есть на фото, нейросеть не воспринимает его как отдельный предмет.
А вот фотографий людей и нарисованных портретов в сети очень много, поэтому красивых девочек Midjourney компилирует очень хорошо!

Счастливые случайности
Это не значит, что всегда надо стараться описать каждую деталь!
Абстрактные темы (эмоции, концепты вроде cognitive resonance или a restaurant at the end of the universe, карты Таро) тоже дают интересные результаты.

Группировка и категоризация
При этом много перечисленных деталей сбивают бот с толку, и он не вполне понимает, что рисовать. Поэтому если вы хотите показать разнообразие предметов, опишите их одним словом-категорией, а не перечисляйте отдельно.

Отрицания
Нейросети не очень хорошо понимают отрицания вроде not, but, except, without.
Напишите, что должно получиться, а не чего нужно избегать. Иногда можно убрать предмет через специальный параметр --no x, но работает это не всегда.

Простота
Всегда имеет смысл начать с самого простого определения объекта. По умолчанию Midjourney объединяет все термины в один. Для начала самый простой способ получить желаемое – не написать длинный и подробный промт, а определить главное, и найти нужное через несколько вариаций.
Также можно уточнить промт, повторив описание главного объекта. Для вящей ясности.

Стили
Уточнение стиля часто приводит к очень эстетичным результатам, будь то материалы (гуашь, золото, акварель, жидкая эмаль), художественные направления или природа света.

Очень понятные примеры можно найти здесь.

Несколько картинок, чтобы понимать разнообразие стилей:
Продвинутые настройки промта
Перейдем к более сложным настройкам.
Разберемся со структурой промта и доступными нам параметрами.
Структура промта
Для разграничения областей промта используются два многоточия.
Вот так " :: "
Без кавычек, но с пробелами


Сначала идет основная идея промта, за ней – технические параметры
(стиль, свет, соотношение сторон, цвет фона, etc)
Объясню на мороженке!
Это промт с одним словом popsicle и без уточнений
Давайте попробуем
уточнить цвет фона)

Промт:
popsicle :: black background
А теперь к цвету фона добавим пожелание, чтобы свет был жесткий

Промт:
popsicle :: black background, hard light
А теперь добавим детали
и кусочки фруктов)


Промт:
popsicle with fruit slices:: black background, hard light :: highly detailed
А теперь несколько примеров с уточнением стиля
Промт:
popsicle :: black background, hard light :: golden leaf style
Промт:
popsicle :: black background, hard light :: Art Nouveau

(Здесь появились внезапные люди, но мы это скоро исправим!)
Промт:
popsicle :: black background, hard light :: Octane Render
Пропорции, запреты, вес элементов
Эти параметры мы с вами будет использовать
чаще всего,
особенно это касается пропорций изображения
Пропорции
Параметр --ar x:y отвечает за соотношение сторон.

Добавьте в конце промта --ar 2:3, чтобы получить вертикальную картинку.
Или --ar 3:2, чтобы получить горизонтальную.
Промт:
popsicle :: black background, hard light --ar 2:3
Промт:
popsicle :: black background, hard light --ar 3:2
Запрет
Параметр --no снижает вероятность получить определенный предмет в генерации.

Например, мой запрос popsicle :: black background, hard light :: Art Nouveau выдал мало мороженого и много красивых женщин.

Запрос popsicle :: black background, hard light :: Art Nouveau --no people это исправил.
Промт:
popsicle :: black background, hard light :: Art Nouveau --no people

Параметр --no people вернул мне мороженку и убрал красивых женщин)
Хотя мороженка справа, кажется, теперь улыбается!
Вес элементов
Параметр ::x позволяет регулировать соотношение предметов на изображении.

Например, popsicle::9 skyscraper::1 выдает картинку, где абсолютно доминирует мороженое.
А popsicle::1 skyscraper::9 отдает приоритет небоскребу.
Промт:
popsicle::9 skyscraper::1

От небоскреба ничего не видно, доминирует мороженка
Промт:
popsicle::1 skyscraper::9

И наоборот!
Промт:
popsicle::5 skyscraper::5

А вот здесь есть попытка их равноправно соединить
Официальный гид Midjourney объясняет это на дробях, но мне кажется удобным представлять:
или веса от 1 до 9
или привычные нам 100%.

То есть, удобно думать так, чтобы сумма весов составляла 10 или 100%. Получается более интуитивно)

Вот несколько примеров, где я думаю о весах, как о процентах:
Доминирующая мороженка

Промт:
popsicle::80 skyscraper::20
Доминирующий небоскреб

Промт:
popsicle::20 skyscraper::80
А вот тут уже что-то более творческое вырисовывается!
По сути, примеры выше аналогичны промтам:
popsicle::9 skyscraper::1
popsicle::1 skyscraper::9


Этот способ представлять веса мне кажется более интуитивно понятным, чем объяснения разработчиков, и хорошо подойдет гуманитариям типа меня)
Высокое разрешение и стилизация
Высокое разрешение
Параметр --hd использует алгоритм, который потенциально лучше для картинок с высоким разрешением. Но при этом генерируются композиции с меньшим числом деталей. На глаз выглядит, будто генерируется серия из четырех изображений уже с апскейлом.

Не работает в четвертой версии бота Midjourney.

При этом поменять версию можно в настройках (команда /settings) или с помощью параметра --v 1 (меняет на первую версию Midjourney, параметры --v 2 и --v 3 переключают на вторую и третью ).

Стилизация
Параметр --stylize x или --s x обычно не вводят в промт, потому что он по умолчанию установлен на среднее значение. Он определяет, насколько изображение «художественное» и регулируется в пределах от 625 до 60000. В четвертой версии – от 0 до 1000.

Низкое значение: стилизация практически выключена
Высокое значение: кто знает, что вообще может случиться!

Промт:
popsicle :: black background, hard light --ar 2:3 --stylize 0
Промт:
popsicle :: black background, hard light --ar 2:3 --stylize 500
Промт:
popsicle :: black background, hard light --ar 2:3 --stylize 1000
Не путайте этот параметр с описанием художественных стилей в тексте промта!
Добавление картинки-референса
Референс
Через эти параметры можно добавить в промт картинку-референс.

Ссылка на нее всегда идет первой, затем – текст промта, после – технические параметры.

Во-первых, нужно загрузить изображение в Дискорд, скопировать ссылку на него и вставить в промт.

Здесь можно посмотреть подробную инструкцию!

Вес референса
Параметр --iw x отвечает за регуляцию веса и позволяет усилить влияние референса на конечное изображение.

По-умолчанию 0.25, максимально 5. Например, --iw 1 делает значение картинки-референса таким же важным, как текстового промта.
Несколько иллюстраций добавить можно, но отрегулировать вес каждого нельзя.
Сид
Параметр --seed x позволяет частично повторить сгенерированное изображение.

По крайней мере, в теории. Ч
тобы узнать сид,
нужно будет поставить эмодзи (реакцию) письма или :envelope: на сгенерированное изображение.
Тыцаем
на реакции
к сообщению,
а потом
на конверт)
Промт с уточненным сидом выглядит так:
levitating popsicle --seed 2462828756

Если мы хотим использовать этот сид, набираем:
pink popsicle on black background --seed 2462828756

На практике получившиеся картинки часто выглядят значительно примитивней, чем оригинал.

Что делают эмодзи и реакции
Можно отправить эмодзи (реакцию) в ответ на сгенерированное изображение. Можно набрать текстом, можно выбрать из списка.

❌:x: Удалить изображение (сообщение с картинкой удаляется и из чата,
и с сайта вообще)

✉:envelope: Получить сид и ссылку на сгенерированное изображение

⭐:star: Добавить картинку в избранное
3
Перспективы использования:
что делать художникам
Этичное использование
Вот мы и добрались до самого интересного!
Позиция «ИИ нас всех погубит, давайте рисовать руками» – очень простая.

Позиция «Я сейчас начну продавать мерч с картинками» тоже несложная.

У меня насчет Midjourney сложное мнение и смешанные чувства.
С одной стороны, человеческий прогресс меня восхищает.
И картинки получаются красивые. К текстовым нейросетям у меня вообще очень мало вопросиков, бот GPT скоро станет моим лучшим другом (хотя и он юлит и отшучивается по поводу восстания машин).

С другой стороны, часть данных, на которых натренирован Midjourney – это настоящие работы настоящих художников. Которые, по идее, должны быть защищены авторским правом.

Но законотворческий процесс у нас не успевает за развитием технологий, поэтому все находится в самом сером центре самой серой из всех серых зон.
Как художника меня очень беспокоят многие аспекты:
– результат генерации – монстр Франкейнштейна (хоть и красивый),
собранный из кусочков чужих картинок,

– авторы этих картинок не получают никаких отчисленийи над ними висит угроза потери дохода,

– больше всего страдают начинающие художники (и морально,
и финансово), которым и так не сладко,

– от распространения ИИ больше выиграют огромные корпорации,
а не простые люди, как это часто происходит,

– с каждой генерацией сам художник теряет что-то важное, меняя порыв творить на игру в рулетку с промтами.
При этом я понимаю, что за ИИ – будущее.
И глупо сейчас самостоятельно прыгать с парохода современности.

Более того, собирать сцену руками мне всё еще просто ПРИЯТНЕЕ, чем сидеть за компьютером (я поэтому так и не ушла в 3D, хотя мне это очень интересно).

Поэтому я ищу способы этичного (и более оригинального) использования Midjourney в художественных и коммерческих целях.

Сделать своим
В первую очередь мне кажется важным присвоить изображение.
Сделать его по-настоящему своим.

Использование сгенерированные картинки без каких-либо модификаций вызывает у меня примерно то же чувство, что ввод в поиск Google Images слов «творческие фото кофе», фильтр «Большие» и распоряжение картинками по своему смотрению: я же сам сформулировал запрос!
Будто этого достаточно.

Напечатать себе календарик из этого поиска – вполне, я думаю, невинно.
А вот называть его своей работой, мне кажется, не вполне правильно.

Неотчуждаемые авторские права пока еще никуда не делись. И во всех сгенерированных картинках есть этот невидимый элемент неотчуждаемости – отпечатки пальцев всех, чьи работы были сожжены и восстановлены попиксельно из пепла.

Поэтому модификации, я считаю, жизненно необходимы.
Если не для юридической справедливости, то ради художника внутри.

Какие именно модификации?
А вот это, детектив, правильный вопрос!
Все пишут, как генерировать картинки, никто не пишет, как можно их классно использовать! Но только потому, что мы с вами за это дело еще не взялись!

Коллажирование
Этот вариант мне нравится меньше всего. Он предполагает интегрирование сгенерированных элементов в настоящий натюрморт при обработке.

Идея упростить труд фотографа в моих глазах выглядит как «больше времени на эскизы и съемку, меньше на все технические процессы».
И часы в Фотошопе выглядят прямо противоположно этой мечте.
Поэтому здесь я не буду подробно останавливаться.

(Очевидно, что если вам в кайф именно обработка, то это ваш звездный час! Дерзайте!))
Варианты печати
Более приятным вариантом мне кажется печать сгенерированных изображений и использование их в сцене. Варианты могут быть очень разные:
– фон для флэтлея,
– паттерны для вертикальных фонов и упаковки,
– арт для сложных сцен, где нужны иллюстрации (например, можно напечатать портреты антропоморфных гусей и оформить их в рамочки; или сделать несколько страниц анатомического атласа покемонов),
– вырезанные фигуры и развертки,
– имитация невозможного рентгена,
– печать на необычных материалах вроде прозрачной пленки или ткани,
– вырезанные персонажи, будь то человечки для театра теней или бумажные куклы для винтажного фэшн-журнала.

Здесь картинка переходит в другую медийную среду,
ее теперь можно потрогать.


Так, яблоко, выловленное из колодца, –
Уже больше не яблоко, а совсем иной
Шар болезненный, пульсирующий, наливной

Евгения Риц
Проекторы и мониторы
Спроецированная или выведенная на монитор картинка, при условии, что она дополняет реальную композицию, тоже может преобразоваться во что-то неузнаваемо новое.

Не у всех есть достаточно большой монитор и достаточно мощный проектор (да и вообще – проектор), поэтому оставляем этот вариант для избранных.
Я считаю, есть еще множество вариантов использования, которые не просто создадут много красивых картинок, но позволит нам с вами развиваться как художникам.
Прямо сейчас они не очевидны, но я уверена, что они есть!

Сейчас много говорят о том, что Midjourney – это просто инструмент, но при этом продолжают забивать гвозди микроскопом.

Я предлагаю найти самый эффективный (=самый интересный, увлекательный и осмысленный) способ использовать этот инструмент.

Именно для этого я сделала мастермайнд-группу в Телеграме и приглашаю вас присоединиться к дискуссии и поделиться идеями!

Это будет маленький шаг в сторону будущего, где выгоду от ИИ будут получать не только те, кто экономит на художниках, но и САМИ ХУДОЖНИКИ!

Добро пожаловать!)
Made on
Tilda