«Les outils traditionnels tentent de suivre chaque mutation et chaque échange, mais, à cette échelle, le signal s’effondre, explique Miklós Csűrös. C’est comme essayer de lire un livre dont l’encre aurait bavé: si l’on regarde de trop près, on ne distingue plus les lettres.»
Pour résoudre ce problème, le chercheur a conçu le cadre GLD (pour gain-loss-duplication ou «gain, perte et duplication»). Plutôt que de se perdre dans «l’encre brouillée» des séquences individuelles, ce cadre s’intéresse à la démographie des familles de gènes: il suit leur apparition, leur disparition et leurs déplacements au fil du temps.
Grâce à des calculs de vraisemblance robustes et à une prise de recul par rapport au bruit des variations individuelles, le cadre GLD offre une carte du passé plus claire et plus stable, selon Miklós Csűrös. «En surmontant les difficultés mathématiques des processus de naissance et de mort, il devient un outil puissant d’archéologie génomique», dit-il.
Appliqué à un vaste ensemble de données portant sur 269 génomes d’archées, le cadre GLD a corrigé les résultats déformés d’études antérieures très citées, a constaté le chercheur. L’étude montre que l’évolution des archées ne relève pas d’un échange chaotique de gènes, mais plutôt d’un équilibre dynamique finement préservé.
Trois composantes mises au jour
Cet équilibre repose sur trois composantes.
D’abord, un tiraillement en coulisses. La majeure partie de la vie d’un génome se déroule selon un cycle fréquent d’allègement – une «fuite» constante de gènes individuels – contrebalancé par un afflux généralisé de gènes transitoires. L’étude mentionne que, pour chaque famille de gènes stable, on compte six fois plus de gènes transitoires de passage. Cette découverte a été rendue possible par une nouvelle méthode mathématique qui corrige le biais associé au fait de n’observer que les gènes courants.
Ensuite, des pertes modulaires adaptatives. Au-delà du bruit de fond aléatoire, les travaux ont mis en évidence des profils modulaires dans lesquels des ensembles entiers de gènes fonctionnels sont perdus simultanément. Ces pertes ne sont pas aléatoires: elles constituent des adaptations stratégiques. Par exemple, lorsqu’un microbe ancien change de régime alimentaire, il se débarrasse, dans un même mouvement évolutif coordonné, de toute la machinerie biologique dont il n’a plus besoin.
Enfin, des gains massifs ponctuels. Ces pertes sont entrecoupées de rares poussées massives de nouveau matériel génétique. Ces évènements jouent le rôle de «fondateurs évolutifs» en fournissant la matière première qui permet à de nouvelles classes d’organismes – comme les halobactéries – de prospérer dans des environnements entièrement nouveaux.
En démontrant que «moins, c’est plus» lorsqu’il est question de signal phylogénétique, Miklós Csűrös estime que son étude offre «une nouvelle assise statistique rigoureuse pour comprendre l’évolution des premières formes de vie sur Terre».
«Elle propose un mécanisme essentiel de contrôle de la qualité pour la prochaine génération de travaux de recherche en évolution afin que nous ne confondions pas le bruit des mégadonnées avec le signal de l’histoire du vivant», conclut-il.