ГлавнаяSkyNetИдентификация личности → Владельца банковской карты можно выделить из миллионного списка по четырём покупкам
Создано: 09.02.2015 13:07:04 · Исправлено: 09.02.2015 13:07:34 · Прочтений: 744

Исследователи из MIT разоблачили несколько мифов о приватности в современном обществе. Они установили, что даже неполные данные о четырёх покупках, совершённых при помощи банковских карт, позволяют установить личность человека в 90% случаев. Необходимо знать только даты и места покупок. Эти данные сравнивались со списком транзакций за три месяца, совершённых более чем миллионом человек.

Владельца банковской карты можно выделить из миллионного списка по четырём покупкам

Более того, если воспользоваться грубыми данными о ценах покупок (стоимость покупки с точностью до 50%), то количество точек привязки сокращается до трёх, а точность вырастает до 94%. То есть, к примеру, вооружившись одним выброшенным вами чеком, одной фотографией вашего завтрака в кафе из Instagram и одним вашим твитом с сообщением о покупке нового гаджета, можно почти наверняка идентифицировать вас в списке транзакций среди миллиона других покупателей.

Для исследования был использован список транзакций, включающий названия и местоположение магазинов, а также дату и сумму покупки. Покупки, совершённые с одной банковской карты, были отмечены одним и тем же id. Во время работы над проектом исследователи пробовали разное количество опорных точек, от двух до пяти. Даже при использовании двух точек без информации о стоимости покупки идентификация человека становится возможной в 40% случаев. Использование пяти точек приводит к результатам, близким к 100%.

Встал вопрос — каким образом можно было бы изменить набор данных, чтобы он всё ещё представлял интерес с точки зрения экономистов и маркетологов, но при этом улучшал приватность покупателей. Для этого исследователи пробовали делать информацию менее точной, укрупнив временной промежуток покупки до недели, а место покупки обобщив до 150 магазинов на определённой территории. И всё равно по четырём опорным точкам, у которых стоимость покупки указана с точностью 50%, оказалось возможным выделить человека из общего набора транзакций с вероятностью 70%.

Современные средства обработки больших данных позволяют из такой, казалось бы, обезличенной информации, как база покупок, или база перемещений и использования мобильных телефонов, строить неожиданно точные выводы. Пожалуй, обычным гражданам опасаться таких возможностей не стоит. Но и не нужно питать иллюзий по поводу вашей анонимности, если вам по каким-то причинам это важно. Особенно, когда вы активно пользуетесь социальными сетями, мобильным телефоном и банковскими картами.

Источник: Habrahabr

Категории

Microsoft (1015.04.2016)
Движок (1511.08.2013)
О блоге (315.04.2016)
SkyNet
Киборг (14 30.11.2017)
Идентификация личности (31 15.04.2016)
Роботы (5830.11.2017)
Интернет (3009.03.2016)
Видеонаблюдение (1207.01.2015)
NTP сервер (501.02.2017)

Истинный облик

Истинный облик

Информация

Этот сайт работает на GlassCubeServer - производительном портативном веб-сервере, разрабатываемым автором блога. На сегодняшний день скорости GCS достаточно для обслуживания 3000 - 4000 запросов страниц в секунду. Комплекс состоит из исполняемого файла и нескольких файлов для хранения данных, перемещается между серверами простым копированием. Может работать с флешки или компакт-диска (в режиме только для чтения). Управление материалами сайта, его оформлением выполняется из интерфейса Windows-приложения. Дистрибутив сервера недоступен для скачивания до момента его релиза, в данный момент проект находится, скорее, в стадии альфа-тестирования.