Специалисты Google и ученые из Колумбийского университета создали алгоритм, позволяющий на основе двух независимых наборов данных геолокации точно идентифицировать человека.

Об этом сообщает “Хакер”.

Стоит отметить, что данный алгоритм определяет посты одного и того же пользователя в разных социальных сетях, сопоставляя данные о платежах по банковской карте с историей звонков у мобильного оператора.

Во время исследования специалисты пытались найти метод, позволяющий сопоставить два независимых друг от друга набора данных, где каждой записи соответствуют географические координаты, а также выделить посты в соцсетях.

ЧИТАЙТЕ ТАКЖЕ: Владелец хостинга удалил все данные с серверов одной строчкой кода

Издание подчеркивает, что примером таких наборов данных являются посты в соцсетях, данные о платежах по карте и данные о звонках, собираемые мобильным оператором.

Новый алгоритм действует в два этапа. Первым делом попарно сравниваются записи в разных наборах данных и вычисляются рейтинги для каждой пары, описывающие вероятность того, что они принадлежат конкретному пользователю. После этого строится полный двудольный граф, в котором все записи представляют собой вершины, а соединяющие их дуги имеют вес, идентичный вычисленному ранее рейтингу. В двудольном подграфе с дугами, имеющими максимальный вес, все соединенные между собой вершины принадлежат одному человеку.

Для испытания ученые взяли три пары наборов данных. В рамках первых двух тестов алгоритм сранивал посты в Twitter и Foursquare, а также в Twittter и Instagram. Требовалось определить, какие аккаунты в разных соцсетях принадлежат одному человеку, используя только геолокационные метки. Отмечается, что алгоритм успешно справился с поставленной задачей.

ЧИТАЙТЕ ТАКЖЕ: Специалистам удалось взломать вредоносные программы Petya и CryptoHost

Для третьего теста было решено сопоставить набор данных мобильного оператора, в котором для звонков указывалось время и координаты ближайшей соты, с набором данных по банковской карте, где платежам соответствовало время и координаты терминала. Алгоритм связал абонентов сотового оператора с клиентами банка, продемонстрировав более высокую точность, чем другие методы.

“В действительности это показывает, что простой анонимизации данных недостаточно. Нам следует перейти к модели защиты персональных данных посредством безопасности. Вместо анонимизации данных перед публикацией нам нужен технический контроль над тем, кто получает к ним доступ, как они используются и для чего именно”, – заявил специалист по защите данных из MIT Media Lab Ив-Александр де Монжуа.

Напомним, ранее из-за так называемого “бага 1970” у хакеров появилась возможность сломать iPhone по Wi-Fi.