La détection du plagiat ne fait plus l'impasse sur la paraphrase

Par 24 mars 2010
Mots-clés : Smart city

L'université de Chiao-Tung propose de mieux déceler quand un texte a été copié en étant légèrement modifié, en combinant deux logiciels : l'un se centre sur les aspects sémantiques, l'autre reconstitue les phrases morcelées.

"Il existe plusieurs méthodes de détection du plagiat, mais la plupart échouent dès lors que le texte est modifié. C'est-à-dire lorsque certains mots sont ajoutés, supprimés ou remplacés", signalent des chercheurs de l'université de Chiao-Tung à Taiwan. Du coup, pour contourner les programmes de contrôle et plagier un document sans risque, il suffit de s'écarter un tant soit peu du texte, en paraphrasant des passages. Pour mettre un terme à ces pratiques et perfectionner la détection du plagiat, l'équipe propose un système qui combine deux techniques existantes. D'abord le programme "Rouge". Ce logiciel, initialement conçu pour évaluer la pertinence des notes de synthèse, balaye le document à la recherche de similitudes.
Rouge reconstitue une phrase séparée en plusieurs morceaux
Et analyse l'occurrence statistique de certains termes. Ici, il est utilisé pour repérer une phrase qui a été reproduite, mais séparée en plusieurs morceaux. Ce, en comparant les termes présents dans le passage concerné avec ceux du document d'origine. Ensuite le logiciel nommé WordNet*. Celui-ci, conçu dès l'origine pour le contrôle du plagiat, repère les analogies sémantiques entre deux documents. Il utilise une base de données sémantique pour résoudre le problème de la substitution d'un mot par un autre ("néanmoins" remplacé par "toutefois" ou "cependant", par exemple). "Rouge permet de repérer les corrélations au niveau des termes utilisés".
Combiner deux programmes améliore la détection
"Il vient en fait suppléer WordNet, qui prend davantage en compte la signification du texte", expliquent les chercheurs. En combinant ces deux programmes, il est possible d'augmenter grandement les résultats de détection, expliquent les scientifiques. Pour le démontrer, ces derniers ont comparé dans une étude les résultats des différentes méthodes actuellement à l'œuvre avec la leur. Et concluent en affirmant que ce système pourrait être utilisé à des fins pédagogiques.On peut aussi envisager une utilisation au niveau des dépôts de brevet.
* Système développé par l'université de Princeton.

Mentions légales © L’Atelier BNP Paribas