Pingar cible la recherche en limitant le corpus

Par 06 août 2008
Mots-clés : Smart city

Le site dispose d'une base de données mise à disposition par des organismes comme des universités. Son moteur comprend le langage naturel : il recherche selon le contexte le fichier idéal et permet un accès gratuit.

Quand un internaute effectue une recherche sur Internet, il lui arrive fréquemment de tomber sur plusieurs liens qui ne correspondent pas du tout à sa requête mais qui intègrent un ou deux des mots clés qu'il avait inscrits. Les moteurs de recherche qui s'inspirent du web sémantique proposent de mieux cibler ces recherches. Ils sont de plus en plus nombreux à comprendre le langage naturel ainsi que le contexte et le concept des pages référencées. Reste un problème : celui de ne pas trouver immédiatement, face à l'ampleur du World Wide Web, les pages pouvant véritablement être utiles à l'utilisateur. Un problème qui peut ralentir les professionnels en quête d'informations précises sur le Web. C'est cette lacune que Pingar souhaite combler. Son moteur, capable de cerner le contexte d'une question posée en langage naturel, débusque ensuite dans sa base de données les sites et fichiers qui répondent à la demande de l'internaute. Ce, en cherchant des occurrences précises entre la question et la réponse.
Un corpus limité pour mieux cibler la recherche
Et c'est là la grande différence : contrairement aux sites comme Cuil, dont le but est de proposer un moteur qui indexe un nombre maximal de pages web, Pingar puise dans le contenu mis à disposition par des organismes professionnels : universités, sociétés de médias, institutions financières... "Quand l'une de ces organisations conclut un partenariat avec nous, nous publions ensuite un encart sur leur site invitant les internautes à s'inscrire gratuitement", précise Peter Wren-Hilton, directeur de Pingar. L'intérêt est de proposer des résultats ciblés et répondant avec précision aux besoins de l'internaute. "Plus le contenu parcouru par un moteur est structuré, plus les outils sémantiques comme Pingar sont efficaces", explique à L'Atelier Fabrice Epelboin, PDG de la start-up BixMix. Et d'ajouter : "en réduisant la taille du corpus, on peut faire des présuppositions sur la structure des différents contenus que le moteur aura à traiter et ainsi augmenter significativement la pertinence du moteur et sa capacité à comprendre le contenu".
Un modèle économique fragile ?
L'utilisation de Pingar est entièrement gratuite. La raison en est simple : le site revend aux annonceurs les informations données au moment de l'inscription par les membres sur leur âge, leur adresse, et leur métier. Les marketeurs peuvent alors afficher leur logo ou leur pub en haut de la page, selon le profil de l'internaute qui effectue une recherche. Les revenus générés sont ensuite distribués entre le moteur et les fournisseurs de contenu. Mais ce modèle économique, très utilisé par les applications grand public, pourrait bien être le talon d'Achille de Pingar. "Si vous avez des dizaines de millions de requêtes, c'est un bon modèle. Pour une application B2B, j'ai des doutes", modère ainsi Fabrice Epelboin. Autre problème, susceptible de décourager les organismes partenaires : ceux-ci risquent en effet de voir apparaître un concurrent parmi les publicités. A noter : le site a bénéficié d'une aide financière de la Fondation pour la Recherche, les Sciences et la Technologie. Il cherche désormais de nouveaux investisseurs.

Mentions légales © L’Atelier BNP Paribas