Quand l’ombre nourrit l’intelligence artificielle

La technique mise au point par Rafik Gouiaa pourra servir à différents types d’applications, telles que la détection de dangers dans des lieux publics ou celle du risque de chutes dans des centres pour aînés.

La technique mise au point par Rafik Gouiaa pourra servir à différents types d’applications, telles que la détection de dangers dans des lieux publics ou celle du risque de chutes dans des centres pour aînés.

Crédit : Rafik Gouiaa

En 5 secondes

Une technique mise au point par Rafik Gouiaa permet à un ordinateur d’apprendre à prédire des mouvements, en combinant des postures humaines tirées d’images et des ombres projetées au sol et au mur.

Si des ordinateurs sont déjà capables de prédire certains mouvements que les humains peuvent effectuer, une technique mise au point par le chercheur Rafik Gouiaa permet désormais à l’ordinateur d’apprendre à le faire, avec une précision inouïe, à partir de postures et d’ombres obtenues en laboratoire.

Cette avancée en reconnaissance de mouvements, produite sous la direction du professeur Jean Meunier, du Département d’informatique et de recherche opérationnelle de l’Université de Montréal, pourra servir à différents types d’applications, telles que la détection de dangers dans des lieux publics ou celle du risque de chutes dans des centres pour aînés.

Une seule caméra et des lumières infrarouges

Alors que les algorithmes de vision par ordinateur cherchent souvent à éliminer les ombres, Rafik Gouiaa propose au contraire d'utiliser l’information qu’elles apportent pour la reconnaissance d’activités humaines et, éventuellement, pour d’autres applications.

Crédit : Rafik Gouiaa

Jusqu’à maintenant, la reconnaissance par ordinateur de postures humaines reposait sur des techniques de prise d’images qui alimentent la machine dans l’apprentissage par couches – ou profond – de ces postures.

«Lorsqu’on obtient des images de postures à partir d’une seule caméra, l’ordinateur a peu d’information à traiter et la qualité de ses prédictions est moins grande, explique M. Gouiaa. Mais quand on utilise plusieurs caméras, la quantité de données devient très importante et mène parfois à des difficultés de calcul et d’analyse.»

Pour résoudre cette double problématique, Rafik Gouiaa a eu l’idée de n’employer qu’une seule caméra et d’y associer des lumières infrarouges qui projettent des ombres en haute définition. «Les ombres étant enregistrées en temps réel, soit au même moment que le mouvement est exécuté, les informations qui en résultent nécessitent moins de calculs; la combinaison de l’image et des ombres permet d’arriver à une reconnaissance globale d’une plus grande précision», indique le diplômé de l’UdeM.

Cependant, la tâche se complique, puisque le sol et les murs déforment quelque peu les ombres projetées. Pour contourner cette difficulté, M. Gouiaa a recouru à une approche d’apprentissage profond qui demande toutefois beaucoup de données. Puisqu’il est ardu d’obtenir un très grand nombre d’exemples concrets, un logiciel de synthèse d’images par infographie pour produire des images modélisées en trois dimensions a été utilisé pour compléter les données réelles.

Alors que les algorithmes de vision par ordinateur cherchent souvent à éliminer ou à réduire les ombres, Rafik Gouiaa propose au contraire de miser sur l’information qu’elles apportent pour la reconnaissance d’activités humaines et, éventuellement, pour d’autres applications telle la reconstruction 3D d’objets mobiles ou non.