Analyser les annotations permet de juger de la qualité d'un PDF

Par 09 novembre 2011
Mots-clés : Smart city, Asie du Sud
PDF

KMAD prend en compte les commentaires des lecteurs d'un document afin de déterminer la qualité de ce dernier en fonction des jugements laissés

Afin de pouvoir juger efficacement de la qualité d'un document, Archana Sukla, du département d'informatique et d'ingénierie de l'Institut national de technologie Motilal Nehru (Inde) propose de réaliser une étude des annotations qui seraient laissées par les précédents lecteurs. Dans ce but, la chercheuse a mis au point un logiciel du nom de KMAD. Celui-ci analyse en fait une base de données de PDF annotés et uploadés sur le logiciel par les utilisateurs. Les annotations prises en compte peuvent être de trois types: commentaire, accentuation, ou mise en lumière, définies par l'utilisateur lors de leur rédaction sur le PDF. Pour pouvoir exploiter pleinement ces commentaires, le logiciel les identifie, puis les stocke tout d'abord dans une base de données commune, en fonction du PDF d'origine.

Donner une note au PDF en fonction de ses annotations

En recourant au logiciel sémantique SentiWordnet, il va alors fournir une appréciation à chacun de ces commentaires, en fonction des mots que ces derniers intègrent. C'est à dire que le logiciel est capable de reconnaître les mots présents selon qu'ils sont "positifs", "négatifs", ou "neutres". En faisant la moyenne des mots présents dans un commentaire, ce dernier se voit alors crédité d'une note oscillant entre 0 (négatif) et 1 (positif) qui permet de se faire une idée sur la qualité du document. Et une fois qu'une note a été accolée à chacun des commentaires d'un document, le logiciel fait alors la moyenne de toutes ces appréciations, et octroie une note finale au PDF de base.

Une base de données qui doit être évolutive et en ligne pour être efficace

Le logiciel est intéressant, en ce qu'il intègre également dans son fonctionnement les commentaires  portant sur des annotations, ou "méta-annotations". Celles-ci sont prises en compte lors du calcul de la note des commentaires, et pondèrent cette dernière en l'accentuant ou en la diminuant. Pour que ces notes puissent être utiles, il est nécessaire que les documents ainsi modifiés puissent être accessibles par d'autres utilisateurs. Le chercheur souligne donc l'importance de mettre la base de données en ligne, afin que chacun des utilisateurs puisse à la fois proposer des versions annotées des PDF, et en même temps  profiter de celles des autres utilisateurs

Mentions légales © L’Atelier BNP Paribas