Photomath met l’OCR au service de l’éducation

Par 21 octobre 2014
PhotoMath

Dernier né du groupe MicroBlink, le spécialiste en applications pour smartphone utilisant l’OCR, Photomath ajoute à la reconnaissance optique de caractère une dose d’intelligence artificielle.

L’histoire de la reconnaissance optique de caractères (OCR) rejoint en partie celle de l’intelligence artificielle. La première promesse fut celle d’une retranscription d’un texte écrit en format binaire. Pour, à terme, transformer un mot, c’est-à-dire une suite de signes éparses, en une suite de caractère qu’un ordinateur reconnaît et stocke comme des lettres indépendantes les unes des autres. Un lecteur OCR devait donc au préalable être "entraîné" pour savoir rapprocher un signe photographié ou scanné en un code binaire.

Le scientifique Ray Kurzweil, fut le premier à avoir, dans les années 1970, donné au grand public l’usage d’un OCR fonctionnel. La première application a été de pouvoir faire lire un texte à un ordinateur – à l’usage des malvoyants. L’application Photomath, finaliste lors de la dernière conférence TechCrunch, cherche à aller plus loin dans la démocratisation de cette technologie, via le secteur éducatif, en permettant pour sa part d’identifier une équation à un inconnu et d’en donner la solution instantanément.

En effet, l’expérience utilisateur de Photomath se poursuit après l’affichage des résultats : l’application intègre une composante d’intelligence artificielle pour proposer un protocole pour résoudre le problème en plus du résultat brut. L’application combine ainsi la détection des signes mathématiques – pour l’instant réduite aux opérations simples – et des algorithmes suffisamment sophistiqués pour reconstruire à rebours les étapes d’une solution mathématique.

Et Damir Sabol PDG de MicroBlink et à l’origine de Photmath, d’insister que l’aspect technologie prime sur le marché de l’éducation que Photomath participe, indirectement, à déconstruire. D’ailleurs, celui-ci précise que son entreprise est avant tout une agence spécialisée dans la reconnaissance visuelle. Le groupe MicroBlink propose en effet plusieurs applications qui utilisent la technologie de l’OCR au niveau de la reconnaissance faciale pour les cartes d’identité (blinkID), ou pour des factures d’entreprises (PhotoPay).

Mais cette volonté de démocratisation de cette technologie est également visible sur le moteur de recherche Google qui intègre d’ores et déjà un nombre considérable d’ouvrages et, passés par un lecteur OCR, il renvoie directement à des mots ou des expressions présentes dans les ouvrages. Toutefois, l’ampleur du projet Google Books dépasse le simple recensement du plus grand nombre de livre possible et s’adresse, à la différence de Photomath et de Ray Kurzweil, plus aux machines qu’aux hommes. En effet, le fait d’avoir indexé chaque mot et expression est avant tout un moyen de donner à une intelligence artificielle le pouvoir de "crawler" dans une base de données.

Mentions légales © L’Atelier BNP Paribas