Jian-Yun Nie: saisir le sens

  • Forum
  • Le 28 mars 2018

  • UdeMNouvelles
Jian-Yun Nie

Jian-Yun Nie

Crédit : Amélie Philibert

En 5 secondes

Professeur au Département d’informatique et de recherche opérationnelle de l’UdeM, Jian-Yun Nie travaille à améliorer le système des moteurs de recherche.

Son bureau se trouve au deuxième étage du pavillon André-Aisenstadt, à l’Université de Montréal, tout au fond du couloir. Tous les jours, le professeur Jian-Yun Nie s’y rend dans l’espoir d’améliorer le système des moteurs de recherche. Son domaine d’étude est celui de la recherche d’information. À l’instar de son petit bureau isolé, sa discipline évolue un peu en marge du champ des bases de données ou de l’intelligence artificielle. Mais au fil des ans, elle est devenue essentielle à nos activités du quotidien.

Il fallait du flair pour choisir cette avenue-là dans les années 80, avant l’avènement du Web. «À l’époque, quand on travaillait en recherche d’information, c’était comme travailler dans un centre d’information, avec une base de données textuelles dans laquelle on tentait de trouver quelque chose. Une autre application typique consistait à automatiser la recherche de références à la bibliothèque. Maintenant, nos travaux débordent largement de ces cadres», indique M. Nie.

Bien sûr, dans ce secteur comme dans bien d’autres, le Web est venu tout changer. De nouvelles données sont apparues, comme celles qui sont issues de l’interaction avec les utilisateurs, pour accroître la qualité des recherches. Et depuis près de 30 ans, c’est cette amélioration qui est dans la ligne de mire de Jian-Yun Nie. Mais il n’est pas encore satisfait des résultats obtenus malgré les énormes progrès réalisés. Quand on soumet une requête à un moteur de recherche, on ne trouve pas nécessairement ce qu’on cherche. C’est à la fois frustrant et stimulant pour le chercheur: «Ça nous montre que le système ne comprend pas tout et qu’il y a encore beaucoup de choses à corriger. C’est ce qui me motive.»

Alors, pour arriver à ses fins, il multiplie les collaborations avec de grandes entreprises comme Microsoft. Cela lui permet, entre autres, d’avoir accès à des données réelles de moteurs de recherche et donc de travailler sur des problèmes concrets. «Les nouveaux problèmes naissent souvent dans les entreprises qui ont un contact direct avec les utilisateurs. Si les universités n’ont pas ce contact-là, on ne peut pas savoir comment les utilisateurs cherchent sur le Web», précise M. Nie.

Chaque fois qu’on soumet une requête à un moteur de recherche ou qu’on clique sur un document présenté dans les résultats, ces actions sont enregistrées. Ces données permettent d’observer comment les utilisateurs interagissent avec le système des moteurs de recherche et de juger de la qualité des documents présentés à l’utilisateur quand il choisit de les ouvrir. Ce type de données permet de raffiner l’algorithme de recherche pour mieux ordonner les résultats de la prochaine requête similaire.

Et cette collaboration entre chercheurs et entreprises profite à tous. Microsoft optimise ses outils en même temps qu’elle favorise l’avancement de la recherche dans le domaine en s’alliant avec des chercheurs universitaires. «Dans beaucoup de cas, les entreprises ont des expertises à l’interne, mais elles bénéficient aussi des collaborations avec des chercheurs de longue date.»

En effet, Jian-Yun Nie s’intéresse à la recherche d’information depuis le début de son doctorat, fait à Grenoble. C’était d’ailleurs la première fois qu’il quittait la Chine. «Il y avait peu d’étudiants qui partaient à l’étranger. Je me considérais comme chanceux. Cette année-là, on était 120 dans toute la Chine à sortir du pays pour aller en France. Grenoble avait une expertise notoire en informatique. Mon directeur en Chine avait déjà visité la ville, il en avait gardé un bon souvenir, c’était un centre de très bon niveau.» Après quelques mois de cours intensifs de français, le jeune Chinois s’exprimait dans la langue de Molière.

Le choix de Montréal

Le choix de Montréal s’est imposé presque spontanément après ses études en France. Il savait qu’il voulait poursuivre sa carrière de chercheur en intelligence artificielle et dans le domaine de la recherche d’information. L’Institut des algorithmes d’apprentissage de Montréal n’existait pas encore, mais le Département d’informatique et de recherche opérationnelle de l’UdeM était bien établi et la traduction automatique y était une discipline particulièrement reconnue. «Comme je travaillais sur la recherche d’information, le traitement des langues naturelles, je connaissais aussi un peu la traduction automatique. C’est comme ça que j’ai entendu parler de l’Université de Montréal, qui avait très bonne réputation grâce au système pionnier de traduction automatique TAUM.» Jian-Yun Nie est entré à l’UdeM en 1991, au laboratoire en informatique cognitive INCOGNITO, devenu en 1997 le laboratoire RALI, qui se consacre au traitement automatique des langues naturelles et à ses applications.

Quelques décennies plus tard, le secteur de la recherche d’information a beaucoup changé, mais les chercheurs qui y font carrière restent rares dans la métropole. «À Montréal, on n’est pas nombreux, mais beaucoup de collègues mènent des travaux sur le traitement automatique des langues naturelles. Il y a de multiples collaborations parce que la recherche d’information est fortement liée au traitement des langues naturelles, donc je ne me sens pas seul.» Montréal est d’ailleurs bien représenté dans la communauté de la recherche d’information. M. Nie a agi comme président de la prestigieuse conférence annuelle ACM SIGIR en 2011, et il présidera le comité chargé du programme de la rencontre de 2019.

Les travaux effectués en intelligence artificielle commencent à avoir une influence sur ceux en recherche d’information. Ce n’est pas encore généralisé, mentionne M. Nie, mais les chercheurs y voient un grand potentiel pour faire passer la discipline à un autre échelon, en s’attelant au sens. Tous les moyens sont bons pour tenter de résoudre le problème de sens auquel font face les moteurs de recherche.  

Dans le domaine de la recherche d’information, on n’a pas encore atteint le degré de compréhension que deux interlocuteurs peuvent avoir. Selon M. Nie, «on ne connaît pas exactement le sens décrit dans un texte ou le sens d’une requête. Le système va reconnaître les mots, mais on est encore loin de la représentation du sens et du raisonnement sur les sens».

C’est le principal défi pour la plupart des applications de traitement des langues naturelles, signale-t-il. «En recherche d’information, il faut comprendre de quoi un texte parle et ce qu’on cherche. C’est le sens qui va nous permettre de faire des comparaisons.» Heureusement, beaucoup d’étudiants s’intéressent aux problèmes en recherche d’information, puisque, au-delà des moteurs de recherche, on retrouve leurs contributions un peu partout dans des applications. La relève semble donc bien assurée.

Catherine Mathys
Collaboration spéciale