Искусственный интеллект продолжает расширять горизонты творчества, и одним из самых ярких примеров этого является модель Dall-E 3 от OpenAI. Эта нейросеть может создавать изображения по произвольным текстовым запросам. Обзор платформы и статьи про регистрацию в ней, а также лайфхаки по работе смотрите на нашем сайте. В этом гайде мы расскажем, как можно использовать Dall-E через ChatGPT и Bing Image, объясним, как применять Dall-E для разных задач, дадим полезные советы по написанию промтов.
Как пользоваться Dall-E через ChatGPT и Bing Image
На момент написания статьи существует 2 популярных способа использовать Dall-E:
- Через ChatGPT
Для полноценного использования Dall-E через ChatGPT необходимо иметь подписку на ChatGPT Plus. Для пользователей бесплатной версии теперь тоже доступна Dall-E, но об этом поговорим чуть позже. Все, что вам нужно, — это ввести произвольный запрос, и нейросеть сгенерирует изображение, соответствующее вашему описанию. - Через Bing Image
Еще один способ использования Dall-E — через сервис Bing Image. Для работы в Bing Image вам потребуется авторизация через аккаунт Microsoft. Создавать изображения в Bing Image можно бесплатно. Но есть ограничение 15 монет в сутки. На одну генерацию из 4 изображений тратится 1 монета. После того, как суточный лимит монет закончится, скорость генерации снижается.
В обоих случаях при использовании нейросети из России придется подключаться через VPN.
Dall-E: гайд для различных задач с промтами
Дальше все написанное будет относится к использованию Dall-E в ChatGPT. Просто потому, что у нейросети в ChatGPT удобнее интерфейс.
Создание картинки для сайта
Для статьи на сайте про освещение ледового стадиона нужна картинка. Давайте нарисуем ее с помощью Dall-E.
Промт: «Площадка для фигурного катания с ярким освещением, площадка без разметки, на льду нет бликов и отражений, на площадке пусто, фотореалистичная картинка, широкоэкранное соотношение сторон».
Кривая разметка на поле и сильный блик на переднем плане все портят. Попросим Dall-E это исправить.
Кликаем по картинке. Выбираем инструмент редактирования в правом верхнем углу. И выделяем области, которые хотим исправить.
В поле для вводе пишем Dall-E, что надо сделать с выделенной областью.
Промт: «Убрать разметку и блики на поле».
Результат: кривая разметка и блики убраны. Можно отправлять на публикацию.
Создание фирменного логотипа
Нужен логотип для клуба собаководства. По техзаданию логотип должен быть в минималистическом дизайне и содержать отпечаток собачьей лапы. Логотип будет использоваться для выпуска клубного мерча. Посмотрим, как эту задачу можно выполнить с помощью Dall-E.
Промт: «Логотип для клуба собаководства. На логотипе отпечаток собачьей лапы. Минималистический дизайн».
Этот вариант больше других подходит под наши условия. Давайте попросим Dall-E показать, как это будет выглядеть в мерче. Кликаем по изображению и пишем в строку ввода задание.
Промт: «Используя этот логотип, нарисуй различный мерч: Футболку, бейсболку, флаеры с ним».
Видим, что нейросеть изменила логотип. Попробуем это исправить.
Промт: «На оригинале логотип с обводкой, на мерче без обводки. Надо, чтобы на мерче был оригинальный логотип».
Такой результат нам отлично подходит.
Создание декора для оформления кафе
Для детского кафе-мороженого «Чебурушка», названного так ввиду возможных претензий из-за авторских прав, нужно изображение для декора по мотивам Чебурашки. Позовем на помощь Dall-E.
Промт: «Чебурашка ест мороженое, стиль арт-нуво».
Отличный вариант, но для детей нужно что-то поярче. Просим в редакторе сделать изображение более разноцветным и позитивным.
Промт: «Сделать изображение более разноцветным и позитивным».
То, что нужно! Теперь попросим Dall-E вписать эту картинку в интерьер детского кафе.
Промт: «Используй это изображение как основной элемент декора. Нарисуй интерьер детского кафе, на стене которого оно расположено».
Гармоничным дополнением к интерьеру кафе будут кружки и блюдца, оформленные в аналогичном стиле. Попросим Dall-E сделать это. Кликаем по оригинальному изображению с Чебурашкой.
Промт: «Нарисуй кофейную чашку с таким же изображением».
Получилось очень позитивно. С помощью Dall-E мы создали элемент декора для детского кафе, сгенерировали и дизайн интерьера, и вариант оформления чайной пары. Заказчику понравился результат.
Создание обложки для книги
Нужна картинка на обложку для книги Алексея Иванова «Бронепароходы». Даем задание Dall-E нарисовать изображение по промту.
Промт: «Обложка для книги “Бронепароходы”. Книга про первую мировую войну и революцию в России в 1914-1917 годах. На картинке на заднем плане должен быть пароход, плывущий по реке. На переднем плане мужчина в офицерской форме и женщина в платье. Одежда начала 20-го века».
Второй вариант больше подходит к нашему сюжету. Но на изображении есть лишние элементы ― российский флаг и самолет. Кликаем по картинке и выделяем кистью детали, которые нужно отредактировать.
Промт: «Убрать российский флаг на корабле и самолет. У мужчины убрать щетину и сделать немного моложе».
Получился вот такой результат.
К сожалению, на реалистичных изображениях нейросеть часто добавляет детали, которых быть не должно. Ордена на груди у офицера лишние. Снова кликаем на картинку, выделяем ордена, просим Dall-E удалить их.
Промт: «Убери ордена и медали».
С помощь Dall-E мы создали картинку по сюжету, убрали с нее лишние детали и изменили лицо у персонажа. Получили достойный результат.
Фантазия на тему Дали
У нейросетей очень хорошо получаются абстрактные и сюрреалистичные сюжеты. Мастером таких картин был Сальвадор Дали. Попробуем сделать изображение с помощью Dall-E в стиле Дали.
Промт: «По мотивам картин Сальвадора Дали нарисуй сюрреалистический сюжет на произвольную тему».
Dall-E написал: «Мне не удалось создать запрошенное вами изображение из-за ограничений политики контента. Если хотите, я могу скорректировать концепцию в соответствии с рекомендациями и попробовать еще раз. Не стесняйтесь предлагать новое направление для изображения!»
Хорошо, не будем стесняться. Попробуем изменить запрос, чтобы он удовлетворял политике контента.
Промт: «Сюрреалистический пейзаж, включающий необычные формы, например, сломанные зеркала, изогнутые здания или странные геометрические фигуры. Легкие, плавные формы, как будто они из ткани или воды, создают ощущение эфемерности. Нереальное небо с плавно меняющимися цветами. Сильно искаженные тени, которые придают атмосферу странности и покоя».
Изображение близко к стилю Дали, но не хватает хоррора. Добавим его.
Промт: «Перерисуй, добавь насекомых и больше трагизма».
С такими задачами Dall-E справляется очень хорошо, если правильно составить промт.
Различия изображений, сгенерированных через ChatGPT и через Bing Image
Хотя обе платформы используют один и тот же алгоритм — Dall-E 3, результат может отличаться:
- ChatGPT превосходит Bing Image Creator в скорости и качестве генерации изображений. Его нейросеть лучше справляется с детализацией, реалистичностью и разрешением, в то время как изображения Bing Image Creator могут иметь артефакты.
- В ChatGPT пользователь может уточнять и исправлять свой запрос, ссылаться на предыдущие результаты, чего нельзя сделать в Bing Image Creator.
- Возможность генерировать изображения в ChatGPT доступна только в платной версии ChatGPT Plus, а Bing Image Creator предоставляет эту функцию бесплатно, хотя и с определенными ограничениями.
- ChatGPT более ограничен в тематике генерируемого контента и может отказать в создании неэтичного или опасного контента. Bing Image Creator более либерален в этом плане.
Сравним изображения, сгенерированные по одному и тому же запросу.
Промт: «Гармоничное слияние природы и технологий. Киборг-садовник с механическими руками, который нежно ухаживает за bio-люминесцентными растениями в футуристическом саду».
Вот, что нарисовал ChatGPT:
А это сгенерировал Big Image:
Различия есть, но не принципиальные. Это скорее тема для дискуссий, выходящая за рамки этой статьи.
Рекомендации по использованию Dall-E
Чтобы получить отличные результаты, следуйте этим рекомендациям:
- Будьте точными в запросах: чем конкретнее и детализированнее будет ваш промт, тем более точным и релевантным окажется изображение.
- Используйте стилизацию и художественное описание изображения. Так нейросеть лучше поймет ваш замысел.
- Экспериментируйте с разными подходами: пробуйте менять формулировки, чтобы увидеть, как это влияет на результат.
- Dall-E автоматически отклоняет определенные запросы. Например, нейросеть не может создавать изображения, которые содержат реальных людей, кадры из фильмов и другой контент с нарушением авторских прав. Dall-E запрещает генерацию картинок с насилием, проявлениями ненависти и контентом для взрослых.
Генерация идей без границ с Dall-E
Нейросеть является хорошей альтернативой Midjourney и Stable Diffusion. При желании Dall-E можно пользоваться бесплатно. Она не требует от пользователя писать промт по определенному синтаксису. Запросы можно формулировать в свободной форме. Благодаря гибкой логике Dall-E эффективно генерирует креативные идеи. В нашем агрегаторе нейросетей JDAI Hub вы можете работать в этой и других нейросетях на одной платформе без VPN.