Глаза боятся, руки делают: чистим трафик сайта от ботов
Как вычислить и вычистить ботов. Рассказывает Дмитрий Максаков из ADV Digital.
Допустим, у вас есть сайт с какой-то небольшой аудиторией, для которого пока нет медийного продвижения. По какой-то причине вы чувствуете, что часть этой аудитории вам нерелевантна, но не знаете, насколько эта часть большая. По данным исследования Bot Traffic Report 2016, до половины трафика в интернете — боты.
Рассказываем, как понять, есть ли боты на вашем сайте, сколько их и как избавиться от этой заразы с помощью Google Analytics.
Первые шаги
Сначала нужно выгрузить все возможные показатели активности пользователей на сайте (показатель отказов, процент новых пользователей, среднее время сессии и прочее) по различным фильтрам (источники трафика, каналы, операционные системы, браузеры, типы устройств).
Успейте купить корпоративный пакет COSSA-2025 со скидкой!
Cossa анонсирует главный рекламный формат на весь 2025 год: сразу 8 различных опций.
Пакет идеально подходит для онлайн-сервисов, стартапов, интернет-компаний и digital-агентств.
Успейте приобрести пакет до повышения цены!
Далее находим статистические показатели, которые сильно отличаются от нормы, за норму можно принять среднее значение по всем сайтам, с которыми вы работаете. Если такого опыта у вас нет, то можно примерно рассчитать норму, основываясь на показателях одного сайта.
Пример. Допустим, трафик на сайт приходит из 10 браузеров, показатели в GA по 9 из них примерно похожи, а вот по одному сильно отличаются, это и будет поводом для более детальной проверки данного источника. Для геолокации подход такой же.
Такие аномалии могут вызывать боты. Но бывает и так, что сбоит сам счётчик. Это возможно в следующих случаях.
1. Установлено два и более счётчика GA на один сайт. В таком случае счётчики могут перебивать данные друг друга.
2. Счётчик установлен не там. Рекомендуется устанавливать счётчик аналитики перед закрывающим тегом head.
3. Установлена старая версия Google Analytics.
4. У вас одностраничный сайт, навигация по которому осуществляется без смены url. В таком случае без дополнительно настроенных событий показатель отказов будет стремиться к 100%, а время на сайте к 0.
5. Настроены события на различные pop-up events, которые автоматически срабатывают на сайте и скручивают показатель отказов до 0%.
6. Счётчик GA установлен не на все страницы сайта.
Примеры аномальной статистики из GA, которая поможет выявить ботов
Пример 1. Новых сеансов меньше 5% (обычно можно посмотреть, сколько у вас новых сеансов в ретаргетинге, и поставить это значение). Слишком высокие или слишком низкие показатели процента отказов, страниц за сеанс, средней продолжительности сеанса.
В данном случае невозможно дать какие-либо точные бенчмарки, так как нужно ориентироваться на средние показатели, а они индивидуальны для каждого сайта.
Пример 2. Аномальный коэффициент достижения цели как в общем по каналу, так и по какому-то фильтру.
Вот конкретный пример такого анализа, благодаря которому мы смогли вычислить нечестную CPA сеть.
Показатели выбиваются из общей картины
Как видно на скриншоте из GA, существует очень большая разница в коэффициенте конверсии как минимум для двух городов. При среднем значении конверсии в 17% в Ступино мы имеем 0,13%, а в Тамбове аж 95%. Если видите что-то подобное, это повод разобраться в источнике трафика.
Пример 3. Большой процент трафика приходится на пользователей, у которых GA не смог распознать возраст или пол.
Ранее в GA этот трафик указывался как not set или вообще не показывается в фильтре по демографии. Это не самый очевидный параметр для определения мошеннического трафика, так как Google физически не может определять пол и возраст у 100% трафика, но если мы видим большую долю таких сеансов, то лучше с этим разобраться.
Пример 4. Очень низкий процент новых сеансов на сайте с определённого канала.
Низкий процент, конечно, может быть обусловлен тем, что аудитория сайта в принципе невелика и на него заходят одни и те же пользователи, но в других случаях стоит проверить источник таких посещений, так как вполне возможно, что данные сессии генерируются одним ботом, поэтому и показатель новых сеансов низкий.
Пример 5. Странная активность с прочих технологических фильтров: ОС, браузера, устройства, IP-адреса.
Иногда следует обратить внимание на технологические отчеты GA, так как там также попадается много интересного. Часто мы можем видеть большой процент трафика с нецелевого для нас гео или странные показатели с какого-либо браузера или операционной системы.
Вывод
Описанное выше — элементы «обязательной программы» по борьбе с ботами. Если мы имеем дело с более совершенными «созданиями», которые ведут себя как нормальные пользователи, есть ещё один подход.
Поведение человека и бота на сайте может отличаться тем, что человек, перейдя на сайт, понимает, какие области тут кликабельные, какие ему интересны, и обращает внимание только на некоторые кнопки.
Бот же скликивает на сайте все элементы, которые для этого предназначены. Чтобы отсеять данный тип мошенничества, мы можем добавить на сайт невидимый глазу кликабельный пиксель и настроить в GA соответствующие события и цели, связанные с кликом по этому пикселю. Таким образом канал, с которого будут приходить сеансы со сработавшими целями по клику на данный пиксель, нужно будет дополнительно проверить на качество трафика, так как настоящий посетитель (не бот) может совершить такое событие на сайте только случайным образом.
Мы провели такой тест для клиента и увидели подобные сработавшие события, но таких сеансов было не более 0,1% от общего количества аудитории на сайте. Более детальную информацию по настройке такого фильтра вы найдете в инструкции.
В этом материале мы рассмотрели несколько способов провести быструю диагностику трафика сайта и найти неблагонадёжные источники. В следующей статье расскажем о системах бот-фильтрации, отсекающих ненужные сеансы на уровне рекламной кампании. Stay tuned!
Мнение редакции может не совпадать с мнением автора. Ваши статьи присылайте нам на 42@cossa.ru. А наши требования к ним — вот тут.