Антикейс icontext: как мы добавляли товары клиента на визуалы, или почему Midjourney не всесильна
Источник статьи: блог iConText Group.
Автор статьи: Артем Попов, Head of New Media агентства icontext (iConText Group).
Прогресс? Безусловно. Для тех, кто предлагает услуги, а не физические товары, ведь тогда мы можем силами нейросети визуализировать эту услугу. Но что делать тем, у кого есть конкретные товары и жесткий брендбук? Как применить возможности нейросети, например, Midjourney?
Чтобы ответить на вопрос, мы провели серию тестов в попытке заставить Midjourney корректно поместить товары клиента на визуалы.
Спойлер! Пока у нас ничего не вышло, но мы не оставляем попыток.
Как возникла идея теста
Вопрос был не праздный, так как клиент уже столкнулся с определенными сложностями, связанными с быстрым формированием каталогов одежды, одетой на разных людей.
Тогда мы решили протестировать возможности нейросетей. За основу взяли Midjourney как самую удобную и быструю сеть, максимально корректно рисующую лица людей и фигуры на момент первой половины 2023 года.
Соединяем два изображения в одно
Затем выбрали несколько вариантов одежды одного из наших клиентов. Взяли разные модели, но их всех объединяло одно — контрастность. Среди прочего в тесте были куртки, комбинезоны, а также такие банальные сочетания одежды, как джинсы и легкий свитер.
Как видите, результаты можно лишь частично назвать корректными. Например, с комбинезоном сеть справилась вполне неплохо. Но все равно продолжала убирать или дорисовывать детали, добавляя воротники, изменяя размер, тип карманов и форму пояса.
Если посмотреть на комбинацию «джинсы и свитер», то тут сеть полностью не справилась. Мы получили очень странные изображения. И ситуация не изменилась, несмотря на дополнительные уточняющие детали.
Загружаем фото товаров с уточняющим промтом
Тот же комбинезон сеть вполне корректно поместила на сгенерированного человека почти без изменений.
Неплохо при таких запросах сеть справилась с кожаной курткой — помогла простая текстура и понятная форма.
Причем иногда получались совсем странные и неожиданные результаты, несмотря на максимально корректный промт. Вот яркий пример обработки фото, на котором были представлены джинсы и свитер.
Как видим, результаты стали лучше, хотя иногда все равно получаются достаточно странные изображения.
В качестве резюме данного теста хотел отметить несколько вещей:
1. Нейросети, безусловно, — полезное изобретение человеческого гения, расширяющее наши возможности до невероятного уровня.
2. Несмотря на всю мощь технологий, иногда достаточно тривиальные задачи могут ставить нейросеть в тупик. Подчеркну, на сегодня.
3. Учитывая невиданный прогресс в области обучаемых моделей, могу предположить, что проблема надевания чего-либо на сгенерированное изображение человека, равно как и передача в руки какого-то товара, — вопрос самого короткого времени.
Тем не менее, на сегодня можно констатировать, что тест все же не удался. Так что ждем обновления нейросети MidJourney, чтобы снова ее протестировать.
*Данная статья написана БЕЗ использования ChatGPT 4.0.
Источник статьи: блог iConText Group.