Inscrivez-vous

Document de travail

Données et IA pour la science : considérations clés

Cet article présente un aperçu des facteurs techniques, éthiques et environnementaux à prendre en compte lors de la préparation de données scientifiques pour l'intelligence artificielle (IA), et explique comment ces facteurs s'inscrivent dans le mouvement de la « science ouverte ». Les informations présentées sont pertinentes pour les chercheurs, les praticiens des données, les organismes scientifiques et les décideurs politiques du secteur scientifique.

Cet article fait partie d’une série de trois amorces qui explorent diverses dimensions techniques de l’IA et son impact sur la science :

  1. Types d'IA dans la science
  2. Réflexions sur l'impact environnemental de l'IA dans les sciences
  3. Données pour l'IA dans la science

La première section présente les concepts fondamentaux et discute des avantages et des défis liés à la préparation des données scientifiques à l'IA.

La deuxième section Cet article examine les principaux facteurs à prendre en compte pour la préparation des données à l'IA et, inversement, pour l'IA dans sa gestion. Nous nous appuyons sur les normes de données tout en abordant des aspects spécifiques à l'IA, tels que la lisibilité par machine et la réduction des biais, et soulignons les considérations éthiques et environnementales liées à la préparation des données à l'IA en science.

La troisième section discute de la préparation des données dans le cadre de la science ouverte, présente deux études de cas qui illustrent comment les pratiques de la science ouverte peuvent soutenir la préparation de l'IA pour la recherche scientifique.

Recommandations

  • Convergence vers les cadres et normes de données existants, par exemple, FAIR-R et Croissant, devraient être utilisés par les scientifiques et les gestionnaires de données.
  • Structures de gouvernance des données devrait aller au-delà des normes techniques pour promouvoir l’équité, l’accès aux ressources informatiques et le renforcement des capacités.
  • Investissement dans l'infrastructure de données et le développement des compétences est une condition préalable à une utilisation efficace et compétitive de l’IA dans la science.
  • Reconnaissance de carrières en gestion des données dans le domaine scientifique, et les incitations visant à encourager ces compétences, constituent une voie de mise en œuvre fondamentale de l’investissement susmentionné.

Données et IA pour la science : considérations clés

Septembre 2025

DOI: 10.24948 / 2025.11


Ce travail a été réalisé grâce à une subvention du Centre de recherches pour le développement international (CRDI), Ottawa, Canada. Les opinions exprimées ici ne reflètent pas nécessairement celles du CRDI ou de son Conseil des gouverneurs.