Les adresses IP affinent la précision des bases de données géolocalisées

Par 01 juin 2010
Mots-clés : Smart city, Moyen-Orient

Pour identifier les erreurs présentes dans les bases d'informations et s'assurer de la fiabilité de ces dernières, l'une des solutions consiste à juxtaposer les adresses IP et les points de connexion.

Si la plupart des données géolocalisées sont désormais fiables - à quelques dizaines de kilomètres près -, certaines d'entre elles sont encore imprécises, affirment deux chercheurs israéliens de l'université de Tel-Aviv. Pour être massivement adoptées, les bases de données doivent pourtant être pertinentes, et il apparaît du coup essentiel pour les scientifiques d'affiner les méthodes de calcul de positions. Leur approche consiste à juxtaposer une cartographie des adresses IP, et une représentant les PoP ("point of presence"), c'est-à-dire des lieux physiques localisés au sein d'un même campus, ou d'un même bâtiment, à partir desquels il est possible d'accéder à Internet. Le but de l'opération ? S'assurer de la cohérence des bases de données corrélées.
Vérifier la pertinence et la précision des informations collectées
L'algorithme utilisé combine ainsi mesures de délai et structure graphique, avec une très faible probabilité de voir deux adresses IP ayant des données de localisation différentes renvoyer au même PoP. De fait, selon les chercheurs, la logique veut que toutes les adresses IP situées sur un même point partagent la même localisation. La méthode permet donc de vérifier la pertinence et la précision des bases de données géolocalisées. "Si deux adresses IP d'un même PoP renvoient à deux lieux différents, il y a un problème, et nous pouvons utiliser les distances entre ces différentes localisations pour mesurer la fiabilité de la base de données", expliquent les chercheurs.
Corriger le tir en amassant de nouvelles données
Pour tester leur méthode, ces derniers ont analysé pas moins de 126 millions de données, collectées dans le cadre du projet DIMES. Cela comprend plus de soixante dix pays. Selon les scientifiques, les résultats indiquent que dans la majorité des cas, les données sont pertinentes à quelques kilomètres près. Leur approche permettant d'identifier les erreurs les plus grossières. L'idée est dans un premier temps de mesurer la fiabilité des informations collectées, pour à terme encourager les professionnels à corriger le tir en amassant de nouvelles données plus pertinentes.

Mentions légales © L’Atelier BNP Paribas