Использование AI в digital-маркетинге. Часть 3: Опыт Mobio в создании реалистичных изображений.
В прошлой статье команда Mobio рассмотрела потенциал AI для создания графических изображений в маркетинговых целях. А в этой поделимся результатами тестирования генеративных нейронных сетей по созданию реалистичных изображений для проектов Mobio. Как и в прошлой статье, для тестирования были выбраны два самых распространенных инструмента Midjournay и DALL-E.
Изображения знаменитостей и мемов
Для теста мы попытались получить изображения Дуэйна Скалы Джонсона и известного мема с улыбающимся котом.
Midjournay
Чтобы получить качественный результат, в запрос, помимо основного описания, стоит добавлять “хвост” перечисляющий признаки хороших изображений.
Здесь однозначно пришлось использовать готовое изображение в качестве основы и пробовать разнообразные вариации запросов. Все котики получались очень милые и симпатичные, но сильно отличались от исходного изображения.
После множества попыток, все таки удалось получить интересный результат, подходящий под наши задачи ⬇️
DALL-E
Котик получился с первой попытки.
Создание креатива со сложной сценой
Мы попытались получить изображение в стиле фотореализм по следующему описанию: уставшая женщина 40+ сидит на кухне, пьет чай и ест печенье, мрачные тона.
Midjournay
- Для сложных сцен необходим референс, он нужен для построения общей сцены изображения.
- С другой стороны, наиболее приемлемый результат удалось получить на основании только текстового описания. Имея в качестве базы картинку, MJ пытается повторить черты лица, позу и все остальное. В итоге результат более предсказуем, так как больше похож на исходное изображение, но качество “образа человека” сильно страдает.
- Очень сложно сгенерировать что-то во рту. Мы пробовали разные запросы, подбирали референсы как основу, но получить приемлемый результат не удалось.
- Еще одна большая, хорошо известная проблема MJ — руки и пальцы рук. Это уже в некоторой степени мем, как MJ рисует руки, а протестующие против использования AI художники площадки Artstation даже создали арт на эту тему ⬇️
Из этого можно сделать вывод, что чем меньше нагружать сюжет, тем лучше результат можно получить.
DALL-E
Оценка результатов и выводы Mobio
Что мы узнали:
- Что касается генерации изображений известных личностей и мемов, то тут результат нас порадовал. Причем с этой задачей справились обе нейросети.
- Явно просматривается корреляция “узнаваемый персонаж” – лучший результат. Также нейросети отлично справляются с генерацией изображений котиков и собачек. Но чем уникальнее запрос, тем хуже результат.
- Получить нужный нам результат при генерации изображения со сложной сценой и человеком нам так и не удалось. Возможно проблема в сложности необходимого нам сюжета. Переизбыток деталей запутывает искусственный интеллект, что плохо сказывается на качестве результата.
- Проблема с изображением рук пока не решена.
- Практически невозможно заставить сеть сгенерировать что-то во рту.
Применение MJ на практике, выводы Mobio.
Для работы креативного отдела возможность создавать фотореалистичные изображения по четким референсам — отличная возможность для расширения креативных подходов.
Зачастую в голову креаторов приходят интересные, но трудозатратные в производстве идеи. Найти фотографию на стоке оказывается сложно, а использовать подходящее изображение из интернета не позволяют юридические ограничения.
Возможности MJ и DALL-E упрощают реализацию нестандартных идей, хотя инструменты все еще имеют ограничения.
Olga Mazur — Head of Creative, Mobio