Les systèmes d’intelligence artificielle générative (IAG) comme ChatGPT peuvent-ils faire preuve de créativité? Une équipe de recherche dirigée par le professeur Karim Jerbi, du Département de psychologie de l'Université de Montréal, dont faisait partie le pionnier de l'intelligence artificielle (IA) Yoshua Bengio, aussi professeur à l'UdeM, vient de publier la plus grande étude comparative jamais réalisée sur la créativité des grands modèles de langage face aux humains.
Ses conclusions, parues dans la revue Scientific Reports du groupe Nature, révèlent que l'IAG a franchi un cap important: elle peut désormais surpasser le niveau moyen de la créativité humaine. Toutefois, les individus les plus créatifs continuent de devancer nettement les systèmes d’IA les plus performants.
L'IA franchit le seuil de la créativité moyenne humaine
L'équipe a testé la créativité de plusieurs grands modèles de langage (comme ChatGPT, Claude, Gemini et plusieurs autres) en les comparant avec celle de 100 000 participants humains. Les résultats marquent un tournant majeur: certains modèles d’IA, tels que GPT-4, surpassent désormais la performance créative moyenne observée chez les humains dans des tâches de créativité linguistique divergente.
«Notre étude montre que certains systèmes d’IA fondés sur de grands modèles de langage peuvent aujourd’hui dépasser la créativité moyenne humaine dans des tâches bien définies, indique Karim Jerbi. Ce constat peut surprendre, voire inquiéter, mais notre étude met aussi en évidence un fait tout aussi important: même les meilleurs systèmes d’IA restent en deçà des niveaux atteints par les humains les plus créatifs.»
En effet, les analyses menées par les deux copremiers auteurs de l’étude, le postdoctorant Antoine Bellemare-Pépin (Université de Montréal) et le doctorant François Lespinasse (Université Concordia), mettent en lumière une réalité nouvelle et intrigante: les mesures de créativité utilisées montrent que certains systèmes d’IAG dépassent désormais la créativité humaine moyenne. Cela dit, pour l’instant, les niveaux les plus élevés de créativité restent humains.
La moyenne des performances de la moitié la plus créative des participants surpasse tous les modèles d’IA testés, et les 10 % les plus créatifs creusent un écart encore plus marqué.
«Nous avons établi un cadre rigoureux qui permet de comparer, avec les mêmes outils, la créativité humaine avec celle de l’IA sur la base de données recueillies auprès de plus de 100 000 participants, en collaboration avec Jay Olson, de l’Université de Toronto», explique Karim Jerbi, qui est également professeur associé à Mila, l’Institut québécois d’intelligence artificielle.