Les images 3D ne se regardent pas seulement, elles se manipulent

Par 28 décembre 2010
cube 3D

Pour reproduire des images en trois dimensions sur le principe du copier/coller, il faut calculer la profondeur de la scène et s'assurer que les objets reproduits respectent les ombres et la perspective.

Avec la popularité croissante de la stéréoscopie 3D pour les films, la télévision, ou les jeux vidéo, il devient important de développer des outils d’édition adaptés, explique une équipe de chercheurs des universités de San Diego, de Bern, et du centre de recherche Disney de Zürich. Forts de ce postulat, les scientifiques ont mis au point un logiciel permettant de copier/coller des images en 3D. C’est-à-dire de reproduire en trois dimensions une image à différents emplacements, tout en maintenant la cohérence globale de la scène. Pour ce faire, l’enjeu principal consiste à préserver les bonnes échelles, et la bonne profondeur des objets les uns par rapport aux autres. Le système fonctionne ainsi en trois temps. La première étape est la construction d’une "carte de profondeur" ("depth map").

Analyser la profondeur de l’image

Concrètement, il s’agit d’analyser les pixels de l’image, en prenant en compte la distance entre ceux de couleur rouge et ceux de couleur cyan – soit ceux visibles par l’œil gauche et ceux visibles par l’œil droit. Plus la distance est importante, plus la profondeur perçue est grande. Deuxième étape : la sélection. L’objectif est cette fois de faciliter la manipulation de l’utilisateur, en segmentant automatiquement l’image en fonction des objets qui la composent, et en distinguant le premier plan, et l’arrière plan. L’utilisateur peut préciser le contour de l’objet qu’il souhaite copier/coller, comme il le ferait pour une image en 2D. Enfin, la dernière étape, dite de la "composition" consiste à reproduire l’image copiée à l’emplacement souhaité.

Respecter la cohérence globale de la scène

Pour éviter les imprécisions et les incohérences, le système effectue une série de calculs afin de respecter l’alignement des objets en fonction des surfaces, mais aussi la perspective – en prenant en compte la profondeur de l’image précédemment analysée – ainsi que les occlusions. En infographie, ce terme d’occlusion désigne une ombre de contact entre deux objets. En attachant de l’importance aux ombres, le logiciel fournit un rendu plus vraisemblable. Les scientifiques précisent que des incohérences peuvent persister lorsque la géométrie des scènes considérées est particulièrement complexe, par exemple. A noter, le projet a été présenté lors de la conférence Siggraph Asia computer graphics qui s’est tenue à Séoul, en Corée du Sud.

Mentions légales © L’Atelier BNP Paribas