Découvrir les modèles au cœur de vastes jeux de données

Par 26 décembre 2011
Mots-clés : Smart city, Amériques, Asie, EMEA
Outil informatique

Des chercheurs américains viennent de développer un outils capable d'analyser des ensembles de données extrêmement volumineux. Un outil qui pourrait s'avérer très utile pour l'aide à la décision.

Des chercheurs d’Harvard et du Broad Institute ont créé un outil révélant des modèles à partir de gros volumes d’informations. Baptisé MIC pour Maximal Information Coefficient, cet outil informatique détecte plusieurs événements récurrents et des jeux de données cachés parmi les informations de santé réparties autour du globe, par exemple sur les évolutions du milieu bactérien de nos intestins. Les chercheurs américains ont crée ce programme dans le cadre du projet Mine, une nouvelle exploration à base de statistiques (Maximal Information-based Nonparametric Exploration). 

Des relations souvent enfouies

La force de MIC repose sur sa faculté à trier les immenses volumes actuels de variables de recherche. Ces informations aident à prévoir les ouragans, à modéliser les tremblements de terre ou à découvrir de nouvelles particules comme le boson de Higgs. D’autres données complexes sont réparties et stockées en grande quantité. Elle concernent les interactions des réseaux sociaux, l’évolution des résultats sportifs ou encore celle des marchés financiers. Les chercheurs utilisent des technologies avancées pour réunir ces jeux de données, qui s’avèrent particulièrement utiles pour comprendre le fonctionnement de systèmes. En effet, les grands volumes de données peuvent être organisés afin de pouvoir extraire des informations narratives, voire explicatives. En explorant ces ensembles de données à grande vitesse, les outils statistiques contribuent à détecter des types de modèles difficiles à percevoir autrement. Ils facilitent ensuite l’analyse avancée des données.

Des comparaisons riches d'enseignement

Détecter et analyser un large éventail de modèles permet ensuite de les personnaliser selon plusieurs paramètres intéressants pour le chercheur. A la différence d’autres outils statistiques capables d’identifier des modèles, MIC peut évaluer et comparer plusieurs types de relations possibles. Les chercheurs exploitent la suite d’outils Mine pour générer de nouvelles idées et de nouvelles connexions.

Mentions légales © L’Atelier BNP Paribas