Использование AI в digital-маркетинге. Исследование Mobio
Нейронные сети незаметно, но плотно вошли в нашу повседневную жизнь. И теперь трудно назвать область человеческой деятельности, которая обходится без использования технологий AI. Естественно, что маркетинг и создание рекламы не остались в стороне от технического прогресса. И активно используют все возможности нейронных сетей. В интернет-маркетинге AI применяется для улучшения результатов выдачи в соцсетях и поисковых системах, для показа наиболее релевантного контента и рекламных сообщений пользователям, мониторинга и анализа рынка, отслеживания поведения целевой аудитории и так далее. Нейронные сети помогли маркетинговым командам избавиться от сложной многомерной или монотонной рутинной работы и сделать ее быстрее и эффективнее.
Сегодня одной из самых популярных тем применения AI в маркетинге является обсуждение GAN. Генеративно-состязательные сети — это класс фреймворков глубокого обучения со структурой генеративной модели. Простыми словами, генеративный AI - это класс алгоритмов машинного обучения, предназначенных для создания нового оригинального контента на основе набора входных данных. GAN могут выполнять творческие задачи, которые раньше считались уникальными для людей, например, создание текста, изображений, музыки, кодов, веб-сайтов и видео.
В этой статье систематизированы возможности применения GAN в рекламном бизнесе, которые Mobio выделили как перспективные.
Визуальная реализация
- Генерация изображения на основе текста
- Семантический перевод изображения и генерация 3D-форм
- Преобразование изображения в изображение
Что можно осуществить с применением разных тезисов (запросов):
2. Преобразовать элементы изображения, такие как цвет, среда или форма при сохранении составных элементов (например, превратить дневное изображения в ночное).
3. Восстанавливать или реконструировать фотографии и некачественные снимки.
4. Объединять изображения.
5. Создавать убедительные фейки знаменитостей, которые трудно отличить от реальных фото.
- Увеличение качества изображения (супер-разрешение)
- Генерация видео
Способность алгоритмов AI накладывать изображение лица одного человека на реальное видео другого приводит к появлению deepfake. В сети много забавных дипфейковых видео, но также растет количество кибермошенников и deepfake-преступлений. Уже создаются сервисы, автоматически распознающие подделку, однако стоит заметить, что постоянно появляются и новые технологии машинного обучения, которые делают фейки все более реалистичными.
Подробно о тестировании потенциала AI в создании графических и фотореалистичных изображений для различных задач агентства на практике смотрите в серии наших статей (здесь и здесь).
Основные генераторы видео — Pictory.ai, Phenaki, InVideo, Imagen Video, Veed.io, Lumen5, Designs.ai, Elai, Synthesia. Как и в случае генераторов изображения, генераторы видео в основном платные. По крайней мере те, которые заслуживают пристального внимания.
Простые ролики не требуют особого профессионализма и записываются за несколько минут. С помощью Synthesia у нас получился абсолютно бесплатно вот такой примитивный ролик. С Pictory.ai мы записали такое видео, но возможности этого сервиса намного шире, если заняться им вплотную.
Основные генераторы дизайна — Uizard, Brandmark, Khroma, VanceAI для помощи в создании дизайна мобильных приложений, сайтов или лендингов, логотипов, подбора цветовых палитр и много другого.
Аудио реализация
Текстовая реализация
Генерация кода
Тестирование на практике
Самыми перспективными генераторами изображений на сегодняшний день нам показались Midjourney и DALL-E. Чтобы сравнить две нейронные сети и исследовать, насколько они применимы для решения рутинных задач агентства, мы взяли для теста три реальные задачи, стоящие перед командой Mobio.
Первой задачей было создать крупную цифру 5% в нежных пастельных тонах из атрибутов весны для рекламного баннера. С этой задачей однозначно лучше справился Midjourney. Правда, знак процентов не поддался ни одной сети.
Запрос:
number 5 assembled from flowers and butterflies, spring pastel colors
Midjourney
DALL-E
Вторая задача заключалась в создании узнаваемых мемных изображений, но без 100% их копирования, чтобы избежать юридических последствий использования. Для теста мы попытались получить изображения Дуэйна Скалы Джонсона и известного мема с улыбающимся котом.
С этим заданием обе сети справились довольно хорошо, но получить нужный результат от DALL-E оказалось намного проще благодаря инструменту генерации похожих на исходное изображение вариантов.
Дуэйн Джонсон Midjourney
Запрос:https://s.mj.run/YcIg_hysdcI dwayne the rock johnson smile, looking at camera, poster, reflections, dynamic pose, Cinematic, Color Grading, Depth of Field, hyper-detailed, insane details, intricate details, beautifully color graded, Unreal Engine, Editorial Photography, Depth of Field, DOF, White Balance, 32k, Super-Resolution, Megapixel, ProPhoto RGB, VR, Massive, Halfrear Lighting, Backlight, Natural Lighting, Incandescent, Optical Fiber, Moody Lighting, Cinematic Lighting, Studio Lighting, Soft Lighting, Volumetric, Contre-Jour, Beautiful Lighting, Accent Lighting, Global Illumination, Screen Space Global Illumination, Ray Tracing Global Illumination, Optics, Scattering, Glowing, Shadows, Rough, Ray Tracing Reflections, Lumen Reflections, Screen Space Reflections, GB Displacement, Scan Lines, Ray Traced, Ray Tracing Ambient Occlusion, Anti-Aliasing, FKAA, TXAA, RTX, SSAO, Shaders, OpenGL-Shaders, GLSL-Shaders, Post Processing, Post-Production, Cel Shading, Tone Mapping, CGI, VFX, SFX, insanely detailed and intricate, hypermaximalist, elegant, hyper realistic, super detailed, dynamic pose
Дуэйн Джонсон DALL-E
Мем с котиком. Оригинал:
Midjourney
Запрос:
https://s.mj.run/pe-FYjlI8q4 white cat, ears back, look at camera, close , cute face, scottish lop-eared, looking at camera, poster, reflections, dynamic pose, Cinematic, Color Grading, Depth of Field, hyper-detailed, insane details, intricate details, beautifully color graded, Unreal Engine, Editorial Photography, Depth of Field, DOF, White Balance, 32k, Super-Resolution, Megapixel, ProPhoto RGB, VR, Massive, Halfrear Lighting, Backlight, Natural Lighting, Incandescent, Optical Fiber, Moody Lighting, Cinematic Lighting, Studio Lighting, Soft Lighting, Volumetric, Contre-Jour, Beautiful Lighting, Accent Lighting, Global Illumination, Screen Space Global Illumination, Ray Tracing Global Illumination, Optics, Scattering, Glowing, Shadows, Rough, Ray Tracing Reflections, Lumen Reflections, Screen Space Reflections, GB Displacement, Scan Lines, Ray Traced, Ray Tracing Ambient Occlusion, Anti-Aliasing, FKAA, TXAA, RTX, SSAO, Shaders, OpenGL-Shaders, GLSL-Shaders, Post Processing, Post-Production, Cel Shading, Tone Mapping, CGI, VFX, SFX, insanely detailed and intricate, hypermaximalist, elegant, hyper realistic, super detailed, dynamic pose
DALL-E
Мы пробовали как генерацию по различным текстовым запросам, так и генерацию на основе базовой фотографии, но по итогу множества попыток получить изображение с нужной нам сценой так и не удалось.
Midjourney
Запрос:
This photo shows a middle-aged woman sitting alone in her kitchen on a cold and rainy evening. She is sad and looks downcast, her eyes fixed on the cup of coffee in her hands. The room is dimly lit, with only a small lamp providing the only light. The woman is wearing a simple grey dress and her hair is tied back in a low ponytail, her face expressionless. She looks lost in thought, her mind miles away from the gloomy kitchen. It is a poignant image, one that speaks to the loneliness and isolation that many of us feel in our daily lives.
Запрос:
This photo depicts a middle-aged woman sitting in a dimly-lit kitchen and biting into a cookie. She looks sad and downcast, with her eyes cast downward and her shoulders slumped. Her expression suggests she is in a state of deep contemplation and her posture suggests she is feeling isolated and alone. The kitchen is sparsely decorated and has a somewhat gloomy atmosphere. The woman is wearing casual clothing and her hair is tied back in a low ponytail. The cookie she is holding in her left hand is still whole, but her right hand is already starting to break it into small pieces. The scene conveys a sense of sorrow and loneliness.
DALL-E
Запрос:
"This photo shows a tired woman in her 40s sitting in her kitchen in the twilight, taking a bite from a cookie. She looks exhausted and overwhelmed, but still manages to take a break for a snack."
Оценка результатов и выводы Mobio
- Работа в дискорде и отсутствие API для удобства интеграции в бизнес-инструменты очень сильно осложняет ее использование в повседневной жизни агентства.
- Достаточно медленная работа движка, даже по сравнению с DALL-E, но при этом и цена в пять раз ниже “за попытку”.
Обновление софта или появление новых плагинов для привычных программ позволяет создавать более оригинальные изображения и оптимизировать работу. Специфика работы креативного отдела перфоманс агентства заключается в том, что нам зачастую требуется много итераций и вариантов креативов, прежде чем мы найдем наиболее подходящие для продвижения конкретного продукта нашего клиента. Скорость и возможность быстро создавать контент в таких условиях становится решающим фактором успеха.
MidJourney — это новый виток в развитии и, хотя на наш взгляд, текущая версия искусственного интеллекта не позволяет получить точный прогнозируемый результат, но точно применима в работе.
Мы планируем:
- использовать MJ как альтернативу стоковым изображениям
- создавать отдельные элементы баннеров или маркетинговых материалов
- использовать как замену работы иллюстраторов
Olga Mazur — Head of Creative, Mobio
Искусственный интеллект становится отличным вспомогательным инструментом для аналитики, создания креативных идей, текстовой и художественной генерации и для успешного проведения рекламной кампании в целом. Нейронные сети постоянно самообучаются, а нам нужно учиться работать с ними.
Полный список всех доступных нейросетей по категориям: изображения, тексты, звук + каталоги/подборки. Почти все они доступны без регистрации или по крайней мере бесплатные.
1. https://creator.nightcafe.studio/ (генерация изображений и видео);
2. https://openai.com/dall-e-2/ (создает, дорисовывает, добавляет объекты на изображение, регистрация по не русскому номеру);
3. https://deepdreamgenerator.com/ (создание реалистичных изображений в заданных стилях);
6. https://deepai.org/;
7. https://www.starryai.com/ (генератор nft);
8. https://www.fotor.com/ (nft-искусство);
9. https://runwayml.com/ (монтаж и редактор видео, анимация и 3d-модели);
10. https://www.wombo.art/ (сюрреалистичные дизайны, превращает фото в мультфильмы);
11. https://thispersondoesnotexist.com/ (генерирует портрет несуществующего человека);
12. http://smartsketch.xyz/ (превращает схематичные изображения в произведения искусства);
13. https://looka.com и https://www.logoai.com/ (рисует логотипы);
14. https://artsexperiments.withgoogle.com/poemportraits (накладывает текст на портрет);
15. benzin.io, https://www.remove.bg/ и https://retoucher.online/ru (удаляет фон с фотографии);
16. https://colorize.cc/ (раскрашивает ч/б фотографии);
17. https://dream.ai/create и https://hotpot.ai/art-generator (картинки по описанию, без регистрации);
18. https://reflect.tech/ (заменяет лицо на фото);
19. https://stablediffusionweb.com/ (генерирует картинки по текстовому описанию, без регистрации);
20. https://www.midjourney.com/home/ (аватары в разном стиле, объединяет картинки в одну, генерирует по текстовому описанию);
21. https://www.ostagram.me/ (соединяет в одну стили разных картин);
22. http://gaugan.org/gaugan2/ (картинки на основе эскизы и по текстовому описанию);
23. https://www.myheritage.com/deep-nostalgia (анимирует фотографии);
24. https://sketch.metademolab.com/ (оживляет скетчи и детские рисунки);
25. https://imglarger.com/, https://icons8.ru/upscaler, https://vanceai.com/,
https://waifu2x.udp.jp/index.ru.html, https://bigjpg.com/ и https://letsenhance.io/ (улучшают качество изображений);
26. https://lexica.art/ (вся ai-графика);
27. https://beta.tome.app/, https://www.beautiful.ai/ и https://piggy.to/ (создание презентаций с красочными слайдами на любую тему по текстовому запросу);
28. https://www.creatosaurus.io/ (вообще всё в одном месте);
29. https://www.craiyon.com/ (генерирует 9 картинок из 1 изображения в один клик, без регистрации);
30. https://prisma-ai.com/lensa (забытая классика);
31. https://h5.tu.qq.com/web/ai-2d/cartoon/index (превращает фото в аниме);
32. https://uizard.io/ (делает макет сайта по наброску от руки);
33. http://goart.fotor.com/ (стилизует фотографию под известные портреты или картины);
34. http://deepangel.media.mit.edu/ (удаляет с изображения людей или объекты);
35. https://experiments.withgoogle.com/cartoonify (превращает фотографию в мультяшку);
36. https://fusionbrain.ai/ (всё на русском, бесплатно и без регистрации);
37. https://dezgo.com/ (генерация картинок без цензуры);
38. https://mage.space/ и https://avyn.com/ (обычная понятная удобная генерация картинок, без ограничений);
39. http://cvl-demos.cs.nott.ac.uk/vrn/ (делает из 2D в 3D);
40. https://wonderdynamics.com/ (создает кино, одобрено Спилбергом);
41. http://photoai.io/ (очень продвинутый фоторедактор, на лету меняет фон и одежду у моделей);
42. https://www.tattoosai.com/ (генерирует дизайн татуировок);
43. https://github.com/microsoft/visual-chatgpt (Visual ChatGPT — нейронка позволяет редактировать изображения прямо в чате. Например, удаляет любые объекты, меняет их цвет, знает, какие предметы на фотке. Запоминает контекст и хорошо редачит. Конечно, можно генерировать пикчи по любому запросу);
44. https://pebblely.com/ (генерирует контент (картинки). Идеально для smm).
ГОЛОС И ЗВУКИ:
1. https://voice.headliner.app/ — озвучка голосом известных людей;
2. https://imaginarysoundscape.net/ — озвучка фотографий;
3. https://www.riffusion.com/ — генерирует музыку по текстовому описанию;
4. https://podcast.adobe.com/enhance — повышает качество аудио до уровня студийного;
5. https://otter.ai/ — превращает запись звонков в текст, удобно для телефонных переговоров;
6. https://experiments.withgoogle.com/sound-maker — создание собственных звуков;
7. https://experiments.withgoogle.com/scribbling-speech — превращает речь в анимацию в реальном времени;
8. https://www.figma.com/community/plugin/1159123024924461424 — конвертация любого сайта в редактируемый дизайн Figma. Этот плагин позволит использовать дизайн любого сайта как готовый шаблон для собственных проектов. Ещё может пригодиться в редизайне старого сайта, когда макеты были потеряны. Всего лишь потребуется установить плагин html.to.design и импортировать HTML-код нужного сайта в Figma, просто скопировав ссылку. Самое приятное — все объекты будут редактируемые, а значит можно полностью адаптировать дизайн под себя.
roomGPT.io — нейросеть генерирует дизайн интерьера. Если давно планируете обновить ремонт квартиры, то этот сервис вам точно поможет. Просто нужно загрузить фото комнаты, а нейронка придумает за пару секунд новый дизайн в выбранном вами стиле. Всё бесплатно.
Сборники/обзоры:
https://bit.ly/3G0d57f — 900 нейросетей!
@GPTtg_bot
@GPT4_Telegrambot
@ChatGPT_WeeziBot
@AlexCHATGPTrobot