Google применяет машинное обучение для группировки и отсеивания вредоносных приложений в Play Store

За последний год Google предпринял ряд мер по поиску вредоносных приложений в Play Store. Последняя разработка использует машинное обучение в крупном масштабе для техники, известной как анализ групп аналогов, которая сравнивает приложения для выявления вредоносных.

Конкретная категория вредоносных приложений, которые Google стремится отсеять, — это те, которые запрашивают и отправляют слишком много пользовательских данных.

Используя сигналы конфиденциальности и безопасности, приложения, схожие по функциональности, группируются вместе. Эти группы аналогов создаются для оценки ожидаемой функциональности приложения, а также «адекватных границ поведения, которое может считаться небезопасным или навязчивым».

Реклама — прокрутите дальше для получения дополнительного контента

Например, большинству приложений-раскрасок не нужно знать точное местоположение пользователя для работы, и это может быть установлено путем анализа других приложений-раскрасок. В отличие от этого, картографическим и навигационным приложениям нужно знать местоположение пользователя, и часто требуется доступ к датчику GPS.

Если приложение из группы запрашивает информацию, которая не требуется большинству аналогов, оно будет отмечено для дальнейшей проверки Google.

Ручное создание групп аналогов чревато ошибками и отнимает много времени, поэтому Google обратился к машинному обучению, чтобы «[кластеризовать] мобильные приложения со схожими возможностями».

Наш подход использует глубокое обучение векторных представлений для идентификации групп аналогов приложений со схожей функциональностью, используя метаданные приложений, такие как текстовые описания, и метрики пользователей, такие как установки.


Смотрите 9to5Google на YouTube для получения большего количества новостей!