L'identité d'un internaute peut se deviner au travers de ses identifiants

Par 02 février 2011
Mots-clés : Smart city, Europe
un utilisateur d'ordinateur

Pour relier plusieurs pseudonymes à une seule et même personne, inscrite sur divers sites Internet, des méthodes de calcul de probabilité peuvent être utilisées, à partir de certaines similitudes observées.

Identifier une personne en s’intéressant aux différents identifiants et pseudonymes qu’elle utilise pour se connecter à diverses plates-formes en ligne. Voilà le point de départ d’une équipe de chercheurs de l’institut de recherche en informatique et en automatique (INRIA). Selon ces scientifiques, il est possible de calculer les probabilités pour que plusieurs identifiants correspondent à une seule et même personne. En effet, certains préfixes, par exemple, permettent de relier plus facilement des pseudonymes à une identité unique. “Si l’on prend l’exemple de deux pseudonymes, sur deux sites distincts, alors grâce à notre base de données et à l’étude de la combinaison des lettres qui les constituent, on pourra déduire avec une certaine probabilité que ces identifiants correspondent ou non à la même personne”, explique à L’Atelier Claude Castelluccia, l’un des chercheurs.

Mieux protéger sa vie privée

Les scientifiques ont mis en place un logiciel qui, en utilisant une base de donnés de dix millions d’identifiants recensés sur Ebay et Google, et des combinaisons de lettres de différents dictionnaires, permet de donner la probabilité de correspondance de plusieurs pseudonymes à une identité unique. “Notre équipe travaille sur la protection de la vie privée et sur la sécurité des données”, souligne Claude Castelluccia. L’intérêt est donc, par exemple, de permettre aux utilisateurs de tester leur futurs identifiants pour voir s’ils pourront être facilement reliés ou non à leur identité, mais surtout à toutes leurs données déjà en ligne sur la Toile.

Un enrichissement progressif de la base de données

Mais l’intérêt, inversement, est aussi, à terme, pour les entreprises qui cherchent à identifier des clients potentiels sur le Web. Comment ? En regroupant les pseudonymes afin de remonter à une seule et même personne. “Le logiciel n’est que dans la première phase de son développement”, précise le scientifique. Ce sont les utilisateurs qui, en testant la qualité de leurs identifiants, enrichiront progressivement la base de données et permettront au logiciel de faire augmenter la probabilité que plusieurs pseudonymes correspondent bien à une unique personne.

Mentions légales © L’Atelier BNP Paribas