Le 7 novembre 2017, Reddit ferme r/Incels, un forum qui rassemblait plus de 40 000 membres, après avoir adopté une politique qui proscrit tout contenu incitant à la violence. Les incels (contraction des mots anglais involuntary celibates ou «célibataires involontaires»), ces hommes qui partagent une vision du monde où leur incapacité à nouer des relations amoureuses est imputée aux femmes et à une structure sociale estimée injuste, ont alors migré rapidement vers d’autres forums. Leurs discours, profondément misogynes, ont conduit à des actes d’une extrême violence en Amérique du Nord tels que la tuerie d’Isla Vista ou l’attaque au camion-bélier de Toronto. Mais leur rhétorique se réinvente, emprunte des codes opaques et reste difficile à détecter automatiquement sur des forums.
C’est dans ce contexte que Dominic Forest, professeur à l’École de bibliothéconomie et des sciences de l’information (EBSI) de l’Université de Montréal, et Camille Demers, son étudiante de doctorat, ont publié les résultats d’une étude consacrée à la détection automatique du discours des célibataires involontaires sur Reddit. Ils testent différentes approches d’exploration de textes afin de pouvoir distinguer au mieux les propos de ces internautes des autres discussions qui ont lieu sur la plateforme.