Vers un plus grand partage des données de la recherche scientifique

  • Forum
  • Le 19 septembre 2017

  • UdeMNouvelles
Crédit : Thinkstock

En 5 secondes

Au moment où s’ouvre la conférence RDA10, organisée par l’Université de Montréal, Vincent Larivière fait le point sur le mouvement de partage des données de la recherche.

Alors qu’Internet a ouvert le champ des possibilités, le mouvement pour un partage des données de la recherche prend de l’ampleur. Le sujet, qui fait de plus en plus parler dans le milieu scientifique, n’est cependant pas sans susciter le débat.

Si certains domaines de recherche sont très avancés en la matière, il reste encore beaucoup à faire pour que la pratique se généralise. «Si l’on regarde l’ensemble des disciplines, une minorité de chercheurs rendent, à ce jour, leurs données accessibles», affirme Vincent Larivière, professeur à l’École de bibliothéconomie et des sciences de l’information de l’UdeM.

La pression s’accroît cependant pour qu’ils le fassent. Des publications scientifiques comme PLOS ONE et Nature obligent ainsi le partage des données. «Comme elles sont des revues importantes, cela pourrait avoir un effet d’entraînement.»

Multiplier les travaux de recherche

Vincent Larivière

Crédit : Amélie Philibert

En rendant publiques ses données, un chercheur permet aux collègues de les utiliser pour entreprendre de nouvelles recherches. «Collectivement, cela favorise un plus grand avancement de la connaissance, qui est un bien commun», explique M. Larivière.

Pourquoi le mouvement n’est-il donc pas généralisé? «Des chercheurs qui passent des années à recueillir des données peuvent avoir envie de les garder pour leurs recherches ultérieures, déclare le professeur. Certains ont également peur que le partage des données crée une génération de chercheurs parasites qui utiliseraient seulement les données des autres.» Accorder du crédit aux chercheurs qui voient leurs données réutilisées pourrait toutefois changer la donne. «Des revues scientifiques commencent à créer des mécanismes pour citer la source des données employées, comme un index», dit Vincent Larivière.

Validation des données

Ce partage permet en outre une nouvelle analyse des données de la recherche qui deviendront encore plus solides si elles passent au travers du processus de validation. «Cette transparence peut permettre de découvrir des faiblesses ou des erreurs dans la collecte de données, mentionne M. Larivière. Les chercheurs n’y sont pas à l’abri, mais c’est beaucoup plus difficile à détecter si l’on a seulement accès à l’article et non aux données.»

D’ailleurs, il constate que dans certaines disciplines, comme en biologie et en écologie, celui qui ne partage pas ses données voit sa crédibilité grandement entachée.

Données partagées et réutilisées?

Mais si on rend de plus en plus les données accessibles, les utilisera-t-on? Pour Vincent Larivière, les chercheurs n’ont pas nécessairement le réflexe de fouiller dans les données des autres. «Il peut y avoir un défi quant au format employé pour collecter les données et aussi celui de bien comprendre ce qu’on trouve dans le fichier, indique-t-il. Si celui qui produit les données met uniquement une colonne de chiffres, personne d’autre ne pourra s’y retrouver. Pour s’assurer que les données sont réutilisables, qu’elles sont digestes, les chercheurs doivent faire un minimum de travail de documentation. Tous ne souhaitent pas y consacrer du temps.»

L’enjeu de la confiance est également réel. «Un chercheur qui a l’habitude de récolter ses données avec son équipe sur le terrain fera-t-il vraiment confiance à quelqu’un d’autre? Ce n’est pas si évident. Il faut rester critique et ne pas faire confiance à n’importe quel jeu de données.»

Les organismes subventionnaires entrent dans la mêlée

Joueurs incontournables du monde de la recherche, les organismes subventionnaires commencent à prendre position. Aux États-Unis, les National Institutes of Health ont ainsi rendu le partage des données obligatoire, notamment pour ce qui est des recherches cliniques et en génomique.

«Parce qu’il s’y produit 30 % de la recherche mondiale, les États-Unis ont un grand pouvoir d’influence», constate M. Larivière. Santé Canada a pour sa part créé une base de données sur les essais cliniques, mais l’organisation s’en tient pour le moment à encourager son utilisation.

On tend aussi de plus en plus vers le libre accès des articles scientifiques. «Environ un article sur deux est déjà déposé en libre accès, signale le professeur de l’UdeM. Les organismes subventionnaires fédéraux l’exigent, mais accordent tout de même aux revues savantes le monopole sur la commercialisation pour les 12 premiers mois après la publication.» Au pays, le Fonds de recherche du Québec–Santé a adopté les mêmes conditions que le fédéral et les autres organismes subventionnaires travaillent à une politique du libre accès.

«Ces recherches sont financées par les fonds publics, donc par les contribuables, qui devraient avoir accès aux résultats, fait valoir M. Larivière. Il s’agit aussi de maximiser le rendement du capital public investi. Parce que si l’on n’a pas accès aux résultats de travaux qui ont déjà été menés, on ne peut pas en produire de nouveaux.»

À ses yeux, c’est une première étape à franchir en matière de science ouverte. «Ensuite, on pourra mieux s’attaquer aux enjeux du partage des données de la recherche et créer des infrastructures pour le faire qui présenteront de nombreux avantages pour les chercheurs et pour toute la société.»

 

Martine Letarte
Collaboration spéciale

Jean-Claude Guédon, infatigable militant pour le partage des données

Jean-Claude Guédon - crédit : Andrei Romanenko

Les organisateurs de la conférence RDA10 ont décidé de saluer l’engagement de Jean-Claude Guédon en faveur du partage des données, en le désignant invité d’honneur du banquet organisé durant la rencontre.

Le professeur du Département de littératures et de langues du monde de l’UdeM, qui est l’un des fondateurs de Research Data Alliance, a effectivement fait siennes les questions du libre accès aux résultats de la recherche et aux archives ouvertes et celle des logiciels à code source ouvert.

Favorable à la libre diffusion des connaissances scientifiques sur le Web, il a été l'un des signataires de l'appel de Budapest, qui a lancé le mouvement des archives ouvertes.

M. Guédon est membre de l’Internet Society et de l'Association francophone des utilisateurs de logiciels libres.