Moins, c’est plus: corriger la carte de l’évolution microbienne

En 5 secondes Dans une étude parue récemment, l’informaticien Miklós Csűrös, de l’UdeM, propose une nouvelle assise statistique rigoureuse pour mieux comprendre l’évolution des premières formes de vie sur Terre.
Une représentation de la recherche scientifique, mettant en scène le séquençage génétique et le matériel de laboratoire.

À l’ère des mégadonnées, l’idée dominante veut qu’une plus grande quantité d’informations mène à de meilleures réponses. Or, une nouvelle étude canadienne montre que, dans la quête des ancêtres lointains de la vie, l’accumulation de données peut au contraire éloigner les scientifiques de la réalité.

Publiés dans les Proceedings of the National Academy of Sciences, les résultats des travaux de Miklós Csűrös, professeur agrégé d’informatique à l’Université de Montréal, révèlent que les méthodes courantes de reconstruction des génomes de microbes anciens sont dépassées par l’explosion de l’information disponible.

Ce paradoxe amène les modèles actuels à «halluciner» des évènements évolutifs – en particulier un nombre invraisemblablement élevé de transferts horizontaux de gènes – qui ne seraient de fait que des mirages statistiques, indique l’étude.

Miklós Csűrös y met en lumière un point de rupture en biologie évolutive: à mesure que les scientifiques tentent de concilier des milliers de séquences génétiques à l’échelle de tout l’arbre du vivant, le signal évolutif réel commence à s’effacer, remplacé par du bruit mathématique.

Ne pas regarder de trop près

«Les outils traditionnels tentent de suivre chaque mutation et chaque échange, mais, à cette échelle, le signal s’effondre, explique Miklós Csűrös. C’est comme essayer de lire un livre dont l’encre aurait bavé: si l’on regarde de trop près, on ne distingue plus les lettres.»

Pour résoudre ce problème, le chercheur a conçu le cadre GLD (pour gain-loss-duplication ou «gain, perte et duplication»). Plutôt que de se perdre dans «l’encre brouillée» des séquences individuelles, ce cadre s’intéresse à la démographie des familles de gènes: il suit leur apparition, leur disparition et leurs déplacements au fil du temps.

Grâce à des calculs de vraisemblance robustes et à une prise de recul par rapport au bruit des variations individuelles, le cadre GLD offre une carte du passé plus claire et plus stable, selon Miklós Csűrös. «En surmontant les difficultés mathématiques des processus de naissance et de mort, il devient un outil puissant d’archéologie génomique», dit-il.

Appliqué à un vaste ensemble de données portant sur 269 génomes d’archées, le cadre GLD a corrigé les résultats déformés d’études antérieures très citées, a constaté le chercheur. L’étude montre que l’évolution des archées ne relève pas d’un échange chaotique de gènes, mais plutôt d’un équilibre dynamique finement préservé. 

Trois composantes mises au jour

Cet équilibre repose sur trois composantes.

D’abord, un tiraillement en coulisses. La majeure partie de la vie d’un génome se déroule selon un cycle fréquent d’allègement – une «fuite» constante de gènes individuels – contrebalancé par un afflux généralisé de gènes transitoires. L’étude mentionne que, pour chaque famille de gènes stable, on compte six fois plus de gènes transitoires de passage. Cette découverte a été rendue possible par une nouvelle méthode mathématique qui corrige le biais associé au fait de n’observer que les gènes courants.

Ensuite, des pertes modulaires adaptatives. Au-delà du bruit de fond aléatoire, les travaux ont mis en évidence des profils modulaires dans lesquels des ensembles entiers de gènes fonctionnels sont perdus simultanément. Ces pertes ne sont pas aléatoires: elles constituent des adaptations stratégiques. Par exemple, lorsqu’un microbe ancien change de régime alimentaire, il se débarrasse, dans un même mouvement évolutif coordonné, de toute la machinerie biologique dont il n’a plus besoin.

Enfin, des gains massifs ponctuels. Ces pertes sont entrecoupées de rares poussées massives de nouveau matériel génétique. Ces évènements jouent le rôle de «fondateurs évolutifs» en fournissant la matière première qui permet à de nouvelles classes d’organismes – comme les halobactéries – de prospérer dans des environnements entièrement nouveaux.

En démontrant que «moins, c’est plus» lorsqu’il est question de signal phylogénétique, Miklós Csűrös estime que son étude offre «une nouvelle assise statistique rigoureuse pour comprendre l’évolution des premières formes de vie sur Terre».

«Elle propose un mécanisme essentiel de contrôle de la qualité pour la prochaine génération de travaux de recherche en évolution afin que nous ne confondions pas le bruit des mégadonnées avec le signal de l’histoire du vivant», conclut-il.

Demandes médias

Université de Montréal
Tél. : 514 343-6111, poste 75930