Mobio

Блог компании на Cossa.ru

Mobio

Блог компании на Cossa.ru

28 марта 2023, 20:10

Использование AI в digital-маркетинге. Исследование Mobio

В этой статье Mobio поделится своим исследованием об использовании AI в digital маркетинге...

Мобио . , Мобио

Использование AI в digital-маркетинге. Исследование Mobio

Нейронные сети незаметно, но плотно вошли в нашу повседневную жизнь. И теперь трудно назвать область человеческой деятельности, которая обходится без использования технологий AI. Естественно, что маркетинг и создание рекламы не остались в стороне от технического прогресса. И активно используют все возможности нейронных сетей. В интернет-маркетинге AI применяется для улучшения результатов выдачи в соцсетях и поисковых системах, для показа наиболее релевантного контента и рекламных сообщений пользователям, мониторинга и анализа рынка, отслеживания поведения целевой аудитории и так далее. Нейронные сети помогли маркетинговым командам избавиться от сложной многомерной или монотонной рутинной работы и сделать ее быстрее и эффективнее.

Сегодня одной из самых популярных тем применения AI в маркетинге является обсуждение GAN. Генеративно-состязательные сети — это класс фреймворков глубокого обучения со структурой генеративной модели. Простыми словами, генеративный AI - это класс алгоритмов машинного обучения, предназначенных для создания нового оригинального контента на основе набора входных данных. GAN могут выполнять творческие задачи, которые раньше считались уникальными для людей, например, создание текста, изображений, музыки, кодов, веб-сайтов и видео.

В этой статье систематизированы возможности применения GAN в рекламном бизнесе, которые Mobio выделили как перспективные.

Визуальная реализация

Генерация изображения на основе текста

Искусственный интеллект дает возможность генерировать изображения на базе текста. На основании заданных параметров, темы, стиля или местоположения с помощью слов можно создавать необходимый визуальный материал, как анимационные изображения, так и реалистичные картинки, не отличимые от фотографий. Сети способны создавать абсолютно реалистичные изображения несуществующих людей или животных, абстрактные и сюрреалистические пейзажи и картины, которые не могут быть сделаны при помощи фотокамеры, и даже виртуальные миры.

Семантический перевод изображения и генерация 3D-форм

На основе семантического изображения или эскиза можно создать реалистичную версию изображения. Проанализировав миллионы фотографий, нейронная сеть воссоздает сцены и пейзажи, имитирующие реальные ландшафты. Также AI генерирует текст, числа и 2D-изображения в 3D-формы с топологией, богатыми геометрическими деталями и текстурами. Чтобы построить фотореалистичный мир, 3D-художнику нужно создать минимум, а GAN продолжат процесс 3D-моделирования сложных ландшафтных сцен.

Преобразование изображения в изображение

Вариаций преобразования у нейросетей бесконечное множество, а пользователь регулирует своими запросами получение желаемого результата.

Что можно осуществить с применением разных тезисов (запросов):

1. Переносить стиль одного изображения на другое или прописать определенный стиль в запросе текстом (реализм, аниме, фэнтези, киберпанк, скетчинг, стимпанк, стили известных художников и фотографов и т. д.).

2. Преобразовать элементы изображения, такие как цвет, среда или форма при сохранении составных элементов (например, превратить дневное изображения в ночное).

3. Восстанавливать или реконструировать фотографии и некачественные снимки.

4. Объединять изображения.

5. Создавать убедительные фейки знаменитостей, которые трудно отличить от реальных фото.

Увеличение качества изображения (супер-разрешение)

Нейросети можно использовать для улучшения качества изображений, делая их более четкими, резкими и детализированными. Применять эту способность GAN возможно не только для фотографий, но и для рисунков.

Генерация видео

Генеративный AI позволяет преобразовывать текст или изображение в видео. Подходит для генерации простых роликов в формате “диктор+фон”. Качество более сложных видеоматериалов еще сомнительно. Google, например, пока не предоставляет доступ к пользованию своей системой создания видео, но демонстрирует результаты работы своего сервиса, способного по словесным запросам генерировать видео с разрешением 1280×768 пикселей и частотой 24 кадра в секунду.

Способность алгоритмов AI накладывать изображение лица одного человека на реальное видео другого приводит к появлению deepfake. В сети много забавных дипфейковых видео, но также растет количество кибермошенников и deepfake-преступлений. Уже создаются сервисы, автоматически распознающие подделку, однако стоит заметить, что постоянно появляются и новые технологии машинного обучения, которые делают фейки все более реалистичными.

Основные генераторы изображений — Midjourney, DALL-E, Stable Diffusion, Deep Dream Generator, NightCafe, AI Playground, Let’s Enhance. Практически все сервисы платные, за исключением небольшого триального периода, когда новичкам предоставляются бесплатные минуты, энергия, попытки и т. д.

Подробно о тестировании потенциала AI в создании графических и фотореалистичных изображений для различных задач агентства на практике смотрите в серии наших статей (здесь и здесь).

Основные генераторы видео — Pictory.ai, Phenaki, InVideo, Imagen Video, Veed.io, Lumen5, Designs.ai, Elai, Synthesia. Как и в случае генераторов изображения, генераторы видео в основном платные. По крайней мере те, которые заслуживают пристального внимания.

Простые ролики не требуют особого профессионализма и записываются за несколько минут. С помощью Synthesia у нас получился абсолютно бесплатно вот такой примитивный ролик. С Pictory.ai мы записали такое видео, но возможности этого сервиса намного шире, если заняться им вплотную.

Основные генераторы дизайна — Uizard, Brandmark, Khroma, VanceAI для помощи в создании дизайна мобильных приложений, сайтов или лендингов, логотипов, подбора цветовых палитр и много другого.

Аудио реализация

1. Генератор преобразования текста в речь

На фоне развития Text-to-Speech (TTS) технологий общедоступными стали синтезаторы речи, которые распознают текст с учетом контекста с помощью искусственного интеллекта. Эта технология имеет множество применений, включая аудиокниги, озвучку фильмов, запись подкастов, «речевую навигацию», голосовой чат и т. д. Синтезированная речь может быть записана в аудиоформат или сохранена в формате OGG. Однако до сих пор все эти методы не могут превзойти по качеству естественный голос человека.

2. Преобразование речи в речь

Применение генеративного AI, связанное со звуком, включает генерацию голоса с использованием существующих источников голоса. С помощью STS можно создавать озвучку для рекламы или игр, не привлекая специалиста по озвучиванию.

3. Музыкальное преобразование

С помощью генеративного AI появилась возможность создавать музыку, исходя из своих предпочтений в отношении стиля, жанра и т. д. Эти инструменты можно использовать во многих сферах творчества, включая игры и рекламные объявления.

Основные голосовые генераторы — iSpeech, Text-to-Speech, Voicemaker, Play.ht, Lovo.ai.

Основные музыкальные генераторы — AIVA, Soundraw, Amadeus Code.

В маркетинге при использовании этих сервисов появилась возможность создавать фоновую музыку для рекламных объявлений, не имея специфических музыкальных навыков. Мы попробовали записать мелодию для ролика с тематикой рождественских скидок. Эта мелодия — наш первый опыт в этом направлении. Результат достаточно скромный, но перспективы многообещающие — нейронные сети смогли завершить неоконченную 10-ю симфонию Людвига ван Бетховена.

Текстовая реализация

В маркетинге и играх генеративный AI используют для создания диалогов, заголовков, рекламных слоганов и текстов, сообщений в блогах, в чатах для общения с клиентами в режиме реального времени или для создания описаний продуктов, статей и контента в социальных сетях.

Нейросетей для генерации текста достаточно много — Frase IO, Peppertype, Outranking, Writesonic, а GPT-3 — одна из самых больших (до 4,5млрд сгенерированных слов в день).

Генерация кода

Еще одним применением генеративного AI является разработка программного обеспечения благодаря его способности создавать код без необходимости ручного кодирования. Благодаря этому качеству разработка кода возможна не только для профессионалов, но и для людей, не связанных с программированием. Так, ChatGPT выдаёт полноценный код (макросы (скрипты) для Google Sheets и языков программирования (Python и др.) с дальнейшим применением и автоматизацией рутинной работы.

В маркетинге генератор кода может использоваться для написания нужных ботов. Например, бот, который будет присылать ссылки на статьи конкурентов, получившие более 100 лайков. Таким образом будет мониториться интерес аудитории к определенной теме.

Основные генераторы кода — CodeWhisperer, Copilot, Tabnine, AlphaCode.

Тестирование на практике

Создание контента (текстового, аудио или видео) с помощью GAN — это будущее, которое уже наступило. А это означает, что пришло время начать использовать те возможности, которые предоставляют нам нейронные сети. Так, например, ChatGPT можно использовать для получения:

информации (запрос на список из 10 основных конкурентов приложения)

краткого текста в виде резюме, содержащего основную информацию из статьи или текста (перевод текста с выжимкой на примере статьи с AppsFlyer)

семантического ядра (запрос на поиск ключевых слов для приложения с последующей рекламой в Яндекс. Директ)

Применять ChatGPT возможно для генерации неймингов, заголовков, текстов, описаний, техзаданий и медиапланирования. Широкий обзор возможностей ChatGPT (в том числе потенциал в аналитике рекламных кампаний) смотрите в нашей статье.

Самыми перспективными генераторами изображений на сегодняшний день нам показались Midjourney и DALL-E. Чтобы сравнить две нейронные сети и исследовать, насколько они применимы для решения рутинных задач агентства, мы взяли для теста три реальные задачи, стоящие перед командой Mobio.

Первой задачей было создать крупную цифру 5% в нежных пастельных тонах из атрибутов весны для рекламного баннера. С этой задачей однозначно лучше справился Midjourney. Правда, знак процентов не поддался ни одной сети.

Запрос:

number 5 assembled from flowers and butterflies, spring pastel colors

Midjourney

DALL-E

Вторая задача заключалась в создании узнаваемых мемных изображений, но без 100% их копирования, чтобы избежать юридических последствий использования. Для теста мы попытались получить изображения Дуэйна Скалы Джонсона и известного мема с улыбающимся котом.

С этим заданием обе сети справились довольно хорошо, но получить нужный результат от DALL-E оказалось намного проще благодаря инструменту генерации похожих на исходное изображение вариантов.

Дуэйн Джонсон Midjourney

Запрос:
https://s.mj.run/YcIg_hysdcI dwayne the rock johnson smile, looking at camera, poster, reflections, dynamic pose, Cinematic, Color Grading, Depth of Field, hyper-detailed, insane details, intricate details, beautifully color graded, Unreal Engine, Editorial Photography, Depth of Field, DOF, White Balance, 32k, Super-Resolution, Megapixel, ProPhoto RGB, VR, Massive, Halfrear Lighting, Backlight, Natural Lighting, Incandescent, Optical Fiber, Moody Lighting, Cinematic Lighting, Studio Lighting, Soft Lighting, Volumetric, Contre-Jour, Beautiful Lighting, Accent Lighting, Global Illumination, Screen Space Global Illumination, Ray Tracing Global Illumination, Optics, Scattering, Glowing, Shadows, Rough, Ray Tracing Reflections, Lumen Reflections, Screen Space Reflections, GB Displacement, Scan Lines, Ray Traced, Ray Tracing Ambient Occlusion, Anti-Aliasing, FKAA, TXAA, RTX, SSAO, Shaders, OpenGL-Shaders, GLSL-Shaders, Post Processing, Post-Production, Cel Shading, Tone Mapping, CGI, VFX, SFX, insanely detailed and intricate, hypermaximalist, elegant, hyper realistic, super detailed, dynamic pose

Дуэйн Джонсон DALL-E

Мем с котиком. Оригинал:

Midjourney

Запрос:

https://s.mj.run/pe-FYjlI8q4 white cat, ears back, look at camera, close , cute face, scottish lop-eared, looking at camera, poster, reflections, dynamic pose, Cinematic, Color Grading, Depth of Field, hyper-detailed, insane details, intricate details, beautifully color graded, Unreal Engine, Editorial Photography, Depth of Field, DOF, White Balance, 32k, Super-Resolution, Megapixel, ProPhoto RGB, VR, Massive, Halfrear Lighting, Backlight, Natural Lighting, Incandescent, Optical Fiber, Moody Lighting, Cinematic Lighting, Studio Lighting, Soft Lighting, Volumetric, Contre-Jour, Beautiful Lighting, Accent Lighting, Global Illumination, Screen Space Global Illumination, Ray Tracing Global Illumination, Optics, Scattering, Glowing, Shadows, Rough, Ray Tracing Reflections, Lumen Reflections, Screen Space Reflections, GB Displacement, Scan Lines, Ray Traced, Ray Tracing Ambient Occlusion, Anti-Aliasing, FKAA, TXAA, RTX, SSAO, Shaders, OpenGL-Shaders, GLSL-Shaders, Post Processing, Post-Production, Cel Shading, Tone Mapping, CGI, VFX, SFX, insanely detailed and intricate, hypermaximalist, elegant, hyper realistic, super detailed, dynamic pose

DALL-E

Третья задача состояла в том, чтобы получить изображение в стиле фотореализма по следующему описанию: уставшая женщина 40+ сидит на кухне, пьет чай и ест печенье, мрачные тона.

Мы пробовали как генерацию по различным текстовым запросам, так и генерацию на основе базовой фотографии, но по итогу множества попыток получить изображение с нужной нам сценой так и не удалось.

Midjourney

Запрос:

This photo shows a middle-aged woman sitting alone in her kitchen on a cold and rainy evening. She is sad and looks downcast, her eyes fixed on the cup of coffee in her hands. The room is dimly lit, with only a small lamp providing the only light. The woman is wearing a simple grey dress and her hair is tied back in a low ponytail, her face expressionless. She looks lost in thought, her mind miles away from the gloomy kitchen. It is a poignant image, one that speaks to the loneliness and isolation that many of us feel in our daily lives.

Запрос:

This photo depicts a middle-aged woman sitting in a dimly-lit kitchen and biting into a cookie. She looks sad and downcast, with her eyes cast downward and her shoulders slumped. Her expression suggests she is in a state of deep contemplation and her posture suggests she is feeling isolated and alone. The kitchen is sparsely decorated and has a somewhat gloomy atmosphere. The woman is wearing casual clothing and her hair is tied back in a low ponytail. The cookie she is holding in her left hand is still whole, but her right hand is already starting to break it into small pieces. The scene conveys a sense of sorrow and loneliness.

DALL-E

Запрос:

"This photo shows a tired woman in her 40s sitting in her kitchen in the twilight, taking a bite from a cookie. She looks exhausted and overwhelmed, but still manages to take a break for a snack."

Оценка результатов и выводы Mobio

Midjourney

Отличный инструмент для поколения AI художников. Красивые и качественные результаты. Для нашей работы подойдут как генератор артов и для создания графических элементов на заданную тему.

Слабые стороны:

Работа в дискорде и отсутствие API для удобства интеграции в бизнес-инструменты очень сильно осложняет ее использование в повседневной жизни агентства.
Достаточно медленная работа движка, даже по сравнению с DALL-E, но при этом и цена в пять раз ниже “за попытку”.

DALL-E

Хороший инструмент для дизайнера. Есть отличные инструменты для редактирования, замены, дорисовки — очень полезно. Есть API для интеграции с бизнес-инструментами на Python.

Как “генератор шедевров” относительно Midjourney средненький. Хотя, возможно, его надо изучить получше, прежде чем делать окончательные выводы. Может, для DALL-E нужно строить запросы как-то иначе.

Эти два инструмента отлично могут работать в паре: Midjourney генерировать арты, а DALL-E их редактировать.

В любом случае, на данном этапе нейронные сети не могут заменить труд дизайнера, ведь его работа заключается не только в отрисовке изображений, а включает в себя в первую очередь продумывание концепции, способной решить поставленную задачу.

Обновление софта или появление новых плагинов для привычных программ позволяет создавать более оригинальные изображения и оптимизировать работу. Специфика работы креативного отдела перфоманс агентства заключается в том, что нам зачастую требуется много итераций и вариантов креативов, прежде чем мы найдем наиболее подходящие для продвижения конкретного продукта нашего клиента. Скорость и возможность быстро создавать контент в таких условиях становится решающим фактором успеха.

MidJourney — это новый виток в развитии и, хотя на наш взгляд, текущая версия искусственного интеллекта не позволяет получить точный прогнозируемый результат, но точно применима в работе.

Мы планируем:
- использовать MJ как альтернативу стоковым изображениям
- создавать отдельные элементы баннеров или маркетинговых материалов
- использовать как замену работы иллюстраторов

Olga Mazur — Head of Creative, Mobio

Искусственный интеллект становится отличным вспомогательным инструментом для аналитики, создания креативных идей, текстовой и художественной генерации и для успешного проведения рекламной кампании в целом. Нейронные сети постоянно самообучаются, а нам нужно учиться работать с ними.

Полный список всех доступных нейросетей по категориям: изображения, тексты, звук + каталоги/подборки. Почти все они доступны без регистрации или по крайней мере бесплатные.

ИЗОБРАЖЕНИЯ И ВИДЕО:

1. https://creator.nightcafe.studio/ (генерация изображений и видео);

2. https://openai.com/dall-e-2/ (создает, дорисовывает, добавляет объекты на изображение, регистрация по не русскому номеру);

3. https://deepdreamgenerator.com/ (создание реалистичных изображений в заданных стилях);

6. https://deepai.org/;

7. https://www.starryai.com/ (генератор nft);

8. https://www.fotor.com/ (nft-искусство);

9. https://runwayml.com/ (монтаж и редактор видео, анимация и 3d-модели);

10. https://www.wombo.art/ (сюрреалистичные дизайны, превращает фото в мультфильмы);

11. https://thispersondoesnotexist.com/ (генерирует портрет несуществующего человека);

12. http://smartsketch.xyz/ (превращает схематичные изображения в произведения искусства);

13. https://looka.com и https://www.logoai.com/ (рисует логотипы);

14. https://artsexperiments.withgoogle.com/poemportraits (накладывает текст на портрет);

15. benzin.io, https://www.remove.bg/ и https://retoucher.online/ru (удаляет фон с фотографии);

16. https://colorize.cc/ (раскрашивает ч/б фотографии);

17. https://dream.ai/create и https://hotpot.ai/art-generator (картинки по описанию, без регистрации);

18. https://reflect.tech/ (заменяет лицо на фото);

19. https://stablediffusionweb.com/ (генерирует картинки по текстовому описанию, без регистрации);

20. https://www.midjourney.com/home/ (аватары в разном стиле, объединяет картинки в одну, генерирует по текстовому описанию);

21. https://www.ostagram.me/ (соединяет в одну стили разных картин);

22. http://gaugan.org/gaugan2/ (картинки на основе эскизы и по текстовому описанию);

23. https://www.myheritage.com/deep-nostalgia (анимирует фотографии);

24. https://sketch.metademolab.com/ (оживляет скетчи и детские рисунки);

25. https://imglarger.com/, https://icons8.ru/upscaler, https://vanceai.com/,
https://waifu2x.udp.jp/index.ru.html, https://bigjpg.com/ и https://letsenhance.io/ (улучшают качество изображений);

26. https://lexica.art/ (вся ai-графика);

27. https://beta.tome.app/, https://www.beautiful.ai/ и https://piggy.to/ (создание презентаций с красочными слайдами на любую тему по текстовому запросу);

28. https://www.creatosaurus.io/ (вообще всё в одном месте);

29. https://www.craiyon.com/ (генерирует 9 картинок из 1 изображения в один клик, без регистрации);

30. https://prisma-ai.com/lensa (забытая классика);

31. https://h5.tu.qq.com/web/ai-2d/cartoon/index (превращает фото в аниме);

32. https://uizard.io/ (делает макет сайта по наброску от руки);

33. http://goart.fotor.com/ (стилизует фотографию под известные портреты или картины);

34. http://deepangel.media.mit.edu/ (удаляет с изображения людей или объекты);

35. https://experiments.withgoogle.com/cartoonify (превращает фотографию в мультяшку);

36. https://fusionbrain.ai/ (всё на русском, бесплатно и без регистрации);

37. https://dezgo.com/ (генерация картинок без цензуры);

38. https://mage.space/ и https://avyn.com/ (обычная понятная удобная генерация картинок, без ограничений);

39. http://cvl-demos.cs.nott.ac.uk/vrn/ (делает из 2D в 3D);

40. https://wonderdynamics.com/ (создает кино, одобрено Спилбергом);

41. http://photoai.io/ (очень продвинутый фоторедактор, на лету меняет фон и одежду у моделей);

42. https://www.tattoosai.com/ (генерирует дизайн татуировок);

43. https://github.com/microsoft/visual-chatgpt (Visual ChatGPT — нейронка позволяет редактировать изображения прямо в чате. Например, удаляет любые объекты, меняет их цвет, знает, какие предметы на фотке. Запоминает контекст и хорошо редачит. Конечно, можно генерировать пикчи по любому запросу);

44. https://pebblely.com/ (генерирует контент (картинки). Идеально для smm).

ГОЛОС И ЗВУКИ:

1. https://voice.headliner.app/ — озвучка голосом известных людей;

2. https://imaginarysoundscape.net/ — озвучка фотографий;

3. https://www.riffusion.com/ — генерирует музыку по текстовому описанию;

4. https://podcast.adobe.com/enhance — повышает качество аудио до уровня студийного;

5. https://otter.ai/ — превращает запись звонков в текст, удобно для телефонных переговоров;

6. https://experiments.withgoogle.com/sound-maker — создание собственных звуков;

7. https://experiments.withgoogle.com/scribbling-speech — превращает речь в анимацию в реальном времени;

8. https://www.figma.com/community/plugin/1159123024924461424 — конвертация любого сайта в редактируемый дизайн Figma. Этот плагин позволит использовать дизайн любого сайта как готовый шаблон для собственных проектов. Ещё может пригодиться в редизайне старого сайта, когда макеты были потеряны. Всего лишь потребуется установить плагин html.to.design и импортировать HTML-код нужного сайта в Figma, просто скопировав ссылку. Самое приятное — все объекты будут редактируемые, а значит можно полностью адаптировать дизайн под себя.

roomGPT.io — нейросеть генерирует дизайн интерьера. Если давно планируете обновить ремонт квартиры, то этот сервис вам точно поможет. Просто нужно загрузить фото комнаты, а нейронка придумает за пару секунд новый дизайн в выбранном вами стиле. Всё бесплатно.

Сборники/обзоры:

https://bit.ly/3G0d57f — 900 нейросетей!

БОТЫ В ТЕЛЕГРАММЕ:

@GPTtg_bot

@GPT4_Telegrambot

@ChatGPT_WeeziBot

@AlexCHATGPTrobot

Мобио, mobio, AI, MJ, DALL-E, нейронные сети, искусственный интеллект, креативы, digital-маркетинг.

Закрыть

Блоги

Паспортные организации в Директе: что должны знать агентства о новом способе регистрации клиентов

Как интернет-магазин парфюмерии удвоил заказы: стратегия лидогенерации от Demis Group

Кризис доверия: почему клиенты уходят навсегда?

Создать свой блог

Использование AI в digital-маркетинге. Исследование Mobio

Визуальная реализация

Аудио реализация

Текстовая реализация

Генерация кода

Тестирование на практике

Запрос:

Midjourney

DALL-E

Дуэйн Джонсон DALL-E

Мем с котиком. Оригинал:

Midjourney

Запрос:

DALL-E

Midjourney

Запрос:

DALL-E

Запрос:

Оценка результатов и выводы Mobio

Ответить?

Рекомендуем!

Блоги

Ближайшие события

FMCG & Retail Trade Marketing Forum 2025

Международная конференция по искусственному интеллекту AiHUB STUDY 2025

Форум директоров по коммерческим закупкам VPROC 2025

Компания

Статьи