Le vocabulaire incontournable de l’intelligence artificielle

Crédit : DataFranca

En 5 secondes

Le nouveau lexique «Les 101 mots de l’intelligence artificielle» présente une sélection de termes français essentiels en intelligence artificielle ainsi que leurs définitions.

Chatbot, deepfake, big data, etc.  Comment exprimer ces concepts en français?

Pour répondre à cette question, DataFranca vient de publier le lexique Les 101 mots de l’intelligence artificielle: petit guide du vocabulaire essentiel de la science des données et de l’intelligence artificielle. Au-delà d’une traduction des termes incontournables dans ce domaine, cet ouvrage vulgarise les concepts pour en faciliter la compréhension.

Ce projet a été dirigé, pour le volet scientifique, par Patrick Drouin, professeur de traduction à la Faculté des arts et des sciences de l’Université de Montréal, et Claude Coulombe, diplômé en physique et en informatique de l’UdeM.

S’approprier le vocabulaire de l’intelligence artificielle en français

Réalisant que la terminologie relative à l’intelligence artificielle, l’apprentissage automatique et l’apprentissage profond était rare en français, l’organisme sans but lucratif DataFranca a réuni sur un site wiki plus de 5500 termes liés à ces champs d'activité. Une communauté francophone mondiale composée de nombreux scientifiques, terminologues et traducteurs a rédigé des milliers de fiches encyclopédiques qui ont été soumises à la révision par les pairs. Parmi les contributeurs de ce projet soutenu par les Fonds de recherche du Québec et l’Office québécois de la langue française, on compte Yoshua Bengio, de Mila – l’Institut québécois d’intelligence artificielle –, et Hugo Larochelle, de Google.

Le lexique Les 101 mots de l’intelligence artificielle représente le cœur de ce travail. Constitué de 101 entrées en français et en anglais, il présente les termes les plus fréquemment employés tels apprentissage profond, arbre décisionnel ou encore couche de neurones.

Claude Coulombe et Patrick Drouin ont travaillé en binôme sur ce lexique: le premier s’est consacré à l’aspect technique, le deuxième a pris en charge l'aspect vulgarisation et linguistique. «Claude discutait des concepts, puis je les adaptais sous forme d'explications compréhensibles», dit Patrick Drouin.

Une rapidité d’action nécessaire

«C'est important, la rapidité de réaction, la flexibilité, parce que, si l’on ne va pas assez vite, le terme anglais va s'imposer et après ce sera très difficile de revenir en arrière et de défaire les habitudes», indique Claude Coulombe.

On pense à nombre de termes informatiques anglais qui sont utilisés en français, par exemple data set. Les linguistes ont aujourd’hui bien du mal à implanter l’équivalent «jeu de données».

Créer de nouveaux termes en français

Certains mots ont été traduits presque littéralement comme chatbot, rendu par «agent conversationnel», ou deepfake, traduit par «hypertrucage».

Dans certains cas, les métaphores ont été gardées, telle celle de la mine pour l’expression data mining, qui se traduit par «forage de données».

Dans d’autres cas, les chercheurs ont choisi de rendre les termes plus explicites: le nom transformer est devenu «réseau de neurones autoattentif» ou «réseau à autoattention», qui désigne «une architecture de réseau de neurones profond, de séquence à séquence, très performante. Il utilise le mécanisme d’attention, plus précisément l’autoattention, pour remplacer à la fois les récurrences et les convolutions. D’ailleurs, l’emploi de l’attention en traduction automatique est issu des travaux pionniers du MILA», lit-on dans le lexique.

Un vocabulaire évolutif

Ce vocabulaire est amené à évoluer. Big data était traduit jusqu’à présent par «mégadonnées». «Or, quand on sait que le préfixe méga- provient du grec qui signifie “million” et qu’on parle aujourd’hui d’informations qui ne sont plus stockées dans des mégaoctets [108], mais vont au-delà des téraoctets [109], des pétaoctets [1015], cela n’a plus de sens de parler de mégadonnées. On devrait donc plutôt parler de données massives», déclare Patrick Drouin.

À propos

Sous la direction de Claude Coulombe et Patrick Drouin, Les 101 mots de l’intelligence artificielle: petit guide du vocabulaire essentiel de la science des données et de l’intelligence artificielle, DataFranca, 2022, 96 p.

Le lexique est également disponible sous forme d’application mobile.