Comprendre la structure des contenus multimédias améliore leur compression

Par 29 décembre 2011
data compression

Déterminer les parties inédites de celles redondantes d'une image, d'un son ou d'une vidéo permet de compresser uniquement les premières. Les deuxièmes pouvant être plus aisément restituables.

Afin de pouvoir mieux compresser des contenus multimédia, il faut pouvoir détecter les données essentielles de celles qui sont redondantes (arrière-plan, couleurs identiques...) dans un groupe de fichiers. Dans cette optique, John Scoville, chercheur au Centre d'Astrophysique d'Harvard a créé un algorithme capable de différencier ces deux sortes d'éléments sur des images, des sons ou encore des vidéos. Le logiciel se charge ensuite de les compresser séparément pour que le fichier final soit moins lourd et d'une qualité équivalente à ceux résultant de méthodes de compression classique. Le scientifique a voulu s'inspirer du cerveau humain, pouvant instantanément identifier les caractéristiques principales d'une image (technique employée, courbes, couleurs dominantes...).

Une compression en deux parties

L'algorithme fonctionne sur le même principe. Il repère les éléments centraux du contenu multimédia (nommés "signaux"), ceux qui sont uniques et font sa spécificité. Les données correspondantes seront compressées sans perte (lossless) et pourront être reconstruites à l'identique lors de la décompression. Les parties moins importantes (appelées "bruits") de l'image sont ensuite identifiées. Chacune d'entre elles ne sera compressée qu'une seule fois. Le logiciel intègre simplement au fichier le positionnement de chaque élément identique afin de pouvoir reconstituer l'intégralité de ces données à partir d'un seul exemplaire. Imaginons une succession d'arbres similaires sur une image. L'algorithme ne retiendra l'apparence que d'un seul d'entre eux, puis le placement exact de tous les autres. A noter que le logiciel marche aussi sur le principe du machine learning et perfectionne de lui-même, au fur et à mesure des différents fichiers traités.

Une méthode utilisable pour tous les contenus multimédia

La méthode présentée fonctionne également pour les vidéos (qui ne sont qu'une succession d'images à un certain rythme par seconde) ou encore les sons. Le logiciel identifie les blancs, voire les refrains ou les accords de même nature sur une chanson par exemple, et applique le même principe. La technique employée aurait plusieurs avantages puisqu'elle utilise, en partie la méthode de compression sans perte, généralement utilisée pour les fichiers textes ou les exécutables, assurant ainsi une meilleure restitution des données. Elle permet également, grâce à sa compression en deux temps, de diminuer significativement le poids des archives créées. Plus la qualité initiale du contenu est importante (résolution de l'image, longueur de la vidéo...), plus le gain est conséquent dans ce domaine, proportionnellement parlant. Reste encore à régler la problématique d'une utilisation de masse. Pour le moment, l'algorithme a besoin de machines très puissantes pour fonctionner et prend beaucoup plus de temps que les méthodes traditionnelles.

Mentions légales © L’Atelier BNP Paribas