Вашу личность можно установить по пяти приложениям на смартфоне. И всё это открытые данные
Поведение каждого человека в цифровых сервисах уникально.
Датские учёные провели исследование, в рамках которого выяснили, что большинство пользователей можно распознать из выборки, состоящей даже из несколько миллионов человек. Для этого достаточно проанализировать открытые данные об использовании пяти приложений на смартфонах людей.
Исследователи назвали свой научный метод «отпечатками приложений». Они в течение года собирали данные 3,5 млн мобильных пользователей. В результате учёные пришли к выводу, что даже четырёх приложений хватает для уникальной идентификации 91,2% пользователей, тем временем с помощью пяти сервисов можно распознать до 96% пользователей.
Исследователи анализировали именно приложения, так как поведение пользователей в них уникально и чаще всего не меняется. Поэтому они решили, что с помощью мобильных сервисов можно качественно идентифицировать конкретных людей.
Использование бинарного метода
Исследователи отмечают, что по данным о приложениях можно узнать возраст, пол, статус отношений, уровень образования, политические взгляды, сексуальную ориентацию, религию и даже характеристики личности пользователя. При анализе учёные не учитывали стандартные приложения смартфонов, например, такие как будильник и фонарик.
Сначала исследователи использовали бинарный метод и отмечали себе только факт использования человеком какого-то приложения в течение месяца. Если пользователь запускал на телефоне в течение месяца только определённый набор сервисов, и эта комбинация больше не встречалась среди данных, то учёные считали его идентифицированным.
Так исследователи смогли повторно распознать каждого пятого пользователя (21,8%). По мнению учёных, даже это значение — довольно высокое, учитывая простоту метода.
Усложнение метода исследования
Исследователи решили использовать открытые данные о популярности приложений в Google Play. Так они смогли узнать, сколько пользователей в выборке скачало конкретный сервис.
Благодаря этому точность «отпечатков приложений» выросла сразу в несколько раз: анализируя данные о четырёх сервисах, исследователи смогли повторно определить уже 91,2% пользователей. При этом размер выборки слабо влияет на результаты: точность распознавания снижается всего на 4% при увеличении тестируемой аудитории с 1 до 3,5 млн (на 250%). А если база данных составит 35 млн человек, достоверность метода уменьшится всего лишь до 75-80%.
Выводы
- «Отпечатки приложений» медленно меняются для большинства пользователей.
- На точность распознавания пользователей влияет сезонность: летом идентифицировать людей оказалось проще. Учёные связывают это с изменением поведения людей — пользователи чаще путешествуют и развлекаются.
- Данные об использовании приложений более выгодны ИТ-корпорациям, чем результаты стандартных методов отслеживания. В отличие от cookie или рекламных идентификаторов, даже если пользователь сменит устройство, его привычки не изменятся, считают учёные.
- «Отпечатки приложений» не позволят определить реальную личность пользователя, однако, по словам исследователей, это возможно при перекрёстном сравнении с другими источниками информации.
Читайте далее: Как россияне используют мобильные приложения
О диджитале в удобном формате ➜ читайте нас в Telegram
Фото на тизере: Rahul Chakraborty
Успейте купить корпоративный пакет COSSA-2025 со скидкой!
Cossa анонсирует главный рекламный формат на весь 2025 год: сразу 8 различных опций.
Пакет идеально подходит для онлайн-сервисов, стартапов, интернет-компаний и digital-агентств.
Успейте приобрести пакет до повышения цены!