Как использовать ML-модели в оптимизации рекламных затрат?

Как с помощью ML-модели собственной разработки удалось снизить стоимость заявки на 21%, рассказывает Мария Косарева, Вице-Президент — начальник Департамента анализа данных и моделирования Газпромбанка.
— В чём заключались недостатки существующих рекламных кампаний, что стало драйвером разработки собственной ML-модели?
– Стандартный performance-маркетинг предполагает работу по аудиториям со сформированным спросом через инструменты контекстной рекламы, SMM и других каналов. Например, банки платят за то, чтобы при запросе «хочу кредит» первой в поисковике появлялась ссылка на их сайт. Либо размещают «догоняющие» баннеры, которые вы боковым зрением видите почти на каждом посещаемом сайте.
Принцип работы такого таргетинга хорошо известен — в Яндексе чаще всего это автостратегии, которые настроены на максимизацию количества заходов на сайт или кликов по баннеру. При этом внутренняя кухня банка — то есть дальнейшие этапы воронки — Яндексу неизвестна, его задача-максимум — привести на сайт человека, которого алгоритмы сочтут целевым.
Инструмент дорогой, а отдача от его использования невелика — в большинстве случаев либо сам человек отказывается от продукта, либо банк не одобряет заявку.
Кроме того, банку приходится платить и за нерелевантные запросы или неподходящую аудиторию — поисковик показывал нашу рекламу пользователям, которым не интересны услуги нашего банка, либо наоборот, тем, кто в последствии не получит одобрение кредита. Показатели одобрения и выдач с такими вводными оптимизировать затруднительно.
В итоге в коллаборации с подрядчиком мы решили разработать собственную ML-модель, которая бы позволила повысить точность настроек контекстной рекламы — с прицелом на людей, которые не только из чистого любопытства кликнут на баннер, но и пройдут все этапы одобрения и с большей вероятностью получат кредит.
— Как выглядит схема взаимодействия с подрядчиком?
— С помощью пикселя подрядчика мы собираем несколько типов информации о клиентах, посещающих сайт нашего банка: их интересы, данные об используемых устройствах и историю браузера.
Используя эту информацию, подрядчик формирует профиль клиента и передаёт его в банк. Мы в свою очередь обучаем модель на данных пользователей, посетивших наш сайт, где за целевое действие берем оформление заявки и получение предварительного одобрения, и отправляем её подрядчику. На выходе получаем следующую картину: человек с определёнными интересами, использующий определённое устройство, посещающий определённые сайты, с наибольшей вероятностью успешно пройдёт всю кредитную процедуру.
Далее подрядчик проводит скоринг пользователей сети, формирует сегменты (например, «плохие», «средние», «хорошие»), что позволяет нам при настройке Яндекс.Директа исключать некачественную аудиторию, либо корректировать цену клика в зависимости от сегмента.
— Какие данные для обучения вы использовали?
— Компания анализирует трафик пользователей, определяет их интересы и демографические признаки:
В категорию «Интересы» входят такие данные, как ЗОЖ, финансы, съём квартиры, туризм, наличие детей (маленьких или взрослых), хобби и пр. — всего около 500 параметров.
«Технические данные» — это информация по девайсам, браузер для входа, ОС — в целом около 40 параметров.
Таргетом для обучения являются заявки в розничном кредитном конвейере. Ключевые параметры — одобрение, посещение офиса выдачи и пр. Всего используется 10 целевых параметров.
— Как вы оцениваете текущее качество моделей?
— Качество моделей постоянно растёт, и уже достигло в среднем 80% по метрике ROC-AUC. Лучшие показатели — у потребительских кредитов, немного хуже — у кредитных и дебетовых карт, но в целом все результаты нас устраивают.
Единственным, пожалуй, недостатком подхода является процент покрытия аудитории данными из cookie, которые используются для применения моделей. Не все браузеры собирают данные по посетителям сайтов, при этом многие пользователи часто чистят cookie, что затрудняет идентификацию и сбор данных.
— Какими результатами пилота уже можете поделиться?
— Доля согласованных заявок на этапе AR (из визита на сайт) относительно стандартной РК выросла на 26%. На первый взгляд доля AR из визитов — 2,33% — не впечатляет, однако здесь надо понимать, что это доля не из заведённых заявок, а из заходов на сайт.
Основное же достижение — снижение средней стоимости заведения заявки на 21%. Именно это и стало основанием для признания пилота успешным.
— Почувствуют ли клиенты результаты использования данной модели?
— Наши объявления будут реже демонстрироваться нецелевым пользователям, человек не будет тратить время на заведение заявки. Мы таким образом не повышаем количество лояльных клиентов, а снижаем число раздражённых, хотя и первый вариант тоже возможен, зависит от емкости «хороших» сегментов и потребностей бизнеса.
— Есть ли дополнительные «бонусы» для банка от этого проекта?
— Помимо сформированных категорий интересов, наш подрядчик поставляет данные по посещенным URL. Мы проводили анализ и группировали некоторые сайты по категориям, что давало прирост в ROC-AUC 1–1,5%. Например, если пользователь посещал страницы микрофинансовых организаций (с целью получения микрозайма), то вероятность заведения заявки на кредит у него будет существенно выше, а вероятность одобрения будет стремиться к нулю.
— Как в итоге изменилась стратегия рекламных кампаний в Яндексе?
— Глобально принцип настройки рекламы остался прежним, только теперь есть дополнительные сегменты, с помощью которых можно понижать цену клика у определенных пользователей (вплоть до их исключения показов), либо наоборот повышать ставки и чаще выигрывать аукцион Яндекс.Директа за показы для подходящих пользователей.