Inscription

Tour d'horizon de la science ouverte : juillet 2024

Dans ce numéro, nous présentons un article d'actualité de Wellett Potter, maître de conférences en droit à l'Université de la Nouvelle-Angleterre, États-Unis. Il est republié à partir de The Conversation via Creative Commons CC-BY-ND.

Un éditeur universitaire a conclu un accord sur les données d'IA avec Microsoft – à l'insu de ses auteurs

En mai, une multinationale britannique multimilliardaire appelée Informa a annoncé dans un communiqué mise à jour commerciale qu'il avait signé un accord avec Microsoft impliquant « l'accès à du contenu et des données d'apprentissage avancés, ainsi qu'un partenariat pour explorer les applications expertes en IA ». Informa est la société mère de Taylor et Francis, qui publie un large éventail de livres et de revues académiques et techniques, les données en question peuvent donc inclure le contenu de ces livres et revues.

D’après rapports publiés en juillet, les auteurs du contenu ne semblent pas avoir été interrogés ni même informés de l'accord. De plus, ils affirment qu’ils n’ont pas eu la possibilité de se retirer de l’accord et qu’ils n’en tireront aucun profit.

Les universitaires ne sont que le dernier parmi plusieurs groupes de ce que nous pourrions appeler des créateurs de contenu à s’offusquer de voir leur travail ingéré par les modèles d’IA générative qui se précipitent actuellement pour aspirer les produits de la culture humaine. Journauxartistes visuels et  labels de disques poursuivent déjà les entreprises d’IA en justice.

Bien qu'il soit difficile de savoir comment Informa réagira aux grondements de mécontentement, l'accord rappelle aux auteurs d'être conscients des termes contractuels des accords d'édition qu'ils signent.

Qu'y a-t-il dans l'accord Informa ?

La mise à jour d'Informa énonçait quatre domaines prioritaires de l'accord Microsoft :

  • augmenter la propre productivité d'Informa
  • développer un outil de citation automatisé
  • développer un logiciel d'assistance à la recherche alimenté par l'IA (peut-être comme un système testé par bibliothèque académique en ligne JSTOR)
  • donner accès aux données de Microsoft pour « aider à améliorer la pertinence et les performances des systèmes d’IA ».

Informa recevra plus de 8 millions de livres sterling (15.5 millions de dollars australiens) pour l'accès initial aux données, suivi de paiements récurrents d'un montant non précisé au cours des trois prochaines années.

Nous ne savons pas exactement ce que Microsoft envisage de faire avec son accès aux données, mais un scénario probable est que le contenu des livres et articles universitaires soit ajouté aux données de formation des modèles d'IA générative de type ChatGPT. En principe, cela devrait rendre les résultats des systèmes d'IA plus précis, même si les modèles d'IA existants ont fait l'objet de vives critiques, non seulement pour leur régurgitation des données d'entraînement sans citation (ce qui peut être considéré comme une sorte de plagiat), mais aussi pour inventer de fausses informations et  attribuer à des sources réelles.

Cependant, la mise à jour indique également que « l’accord protège les droits de propriété intellectuelle, y compris les limites imposées aux extraits de texte textuels et l’alignement sur l’importance des références détaillées des citations ».

Les « limites des extraits de texte textuels » mentionnées concernent probablement la Doctrine américaine du fair use, qui autorise certaines utilisations de matériel protégé par le droit d'auteur.

De nombreuses entreprises d’IA générative sont actuellement faire face à des poursuites pour violation du droit d'auteur sur leur utilisation des données de formation, et leurs défenses reposeront probablement sur la revendication d'une utilisation équitable.

L'« importance des références de citation détaillées » peut concerner le concept d'attribution dans le droit d'auteur. C'est un droit moral possédés par les auteurs. Il prévoit que le créateur de l'œuvre doit être connu et désigné comme l'auteur lorsque son œuvre est reproduite.

Comment fonctionne habituellement l’édition scientifique ?

La plupart des universitaires ne reçoivent aucune rémunération et ne réalisent aucun profit sur la plupart de leurs publications scientifiques. Au contraire, la rédaction d’articles de revues et de conférences est généralement considérée comme faisant partie du travail d’un poste permanent à temps plein. La publication renforce la crédibilité d'un universitaire et promeut ses recherches.

Le processus de base se déroule souvent comme suit : un auteur recherche et écrit un article original et le soumet à un éditeur de revue pour examen par les pairs. La plupart des pairs évaluateurs et des membres du comité de rédaction ne reçoivent également aucune rémunération pour leur travail.

En fait, certaines revues peuvent exiger que les auteurs paient une «frais de traitement de l'article» pour couvrir les frais d’édition et autres. Cela peut représenter des milliers de dollars pour un accès libre publication. De manière générale, plus la publication est prestigieuse, plus le tarif est élevé.

Si un article réussit l'examen par les pairs, l'auteur sera invité à signer un accord d'édition. Les conditions peuvent couvrir des arrangements logistiques tels que le moment où l'article sera publié, le format (imprimé, en ligne ou les deux) et la répartition des redevances (le cas échéant). Il y aura également des arrangements concernant le droit d'auteur et la propriété de l'article.

Un auteur doit généralement également accorder droits exclusifs à l'éditeur de distribuer et de publier l'article. Cela peut signifier que l'auteur ne peut pas publier l'article ailleurs, et que l'éditeur peut également être en mesure de sous-licencier l'article à un tiers, tel qu'une société d'IA.

Parfois, les éditeurs exigent qu'un auteur leur cède les droits d'auteur sur l'article via un droit permanent. accord de transfert de droits d'auteur.

Essentiellement, cela signifie que l'auteur accorde à l'éditeur tous ses droits d'auteur en tant que titulaire du droit d'auteur sur l'œuvre. L'éditeur peut alors reproduire, communiquer, distribuer ou concéder sous licence l'œuvre à des tiers à sa guise.

Il est possible de n'attribuer que des droits limités, plutôt que tous les droits, et c'est un élément que les auteurs devraient prendre en compte.

Exploration de contenu

Il est essentiel que les auteurs comprennent les implications de la licence et de la cession et qu'ils réfléchissent précisément à ce qu'ils acceptent lorsqu'ils signent un contrat. À la lumière de la tendance récente de les éditeurs concluent des accords avec des sociétés d'IA générative, les politiques des éditeurs en matière d'IA doivent également être examinées de près.

Aux États-Unis, une norme solution de licence collective pour l'utilisation de contenu dans les systèmes d'IA internes a récemment été publié, qui définit les droits et la rémunération des titulaires de droits d'auteur. Des licences similaires pour l’utilisation de contenu pour les systèmes d’IA arriveront probablement très prochainement sur le marché australien.

Les types d’accords conclus entre les éditeurs universitaires et les sociétés d’IA ont suscité des inquiétudes plus vastes chez de nombreux universitaires. Voulons-nous que la recherche scientifique soit réduite à un contenu destiné à Exploration des connaissances sur l'IA? Il n’existe pas de réponses claires sur l’éthique et la morale de telles pratiques.

A propos de l'auteure:

Dr Wellett Potter est maître de conférences à la Faculté de droit de l'Université de la Nouvelle-Angleterre à Armidale. Fière ancienne élève de l'UNE, elle est devenue membre du personnel à temps plein en 2022, après avoir obtenu son doctorat en droit en mars 2021. Avant 2022, elle a passé onze ans comme universitaire de session à l'École de droit de l'UNE, participant à plus de 25 unités de droit.


Les grandes histoires de la science ouverte

Le CERN fournit un « mode d'emploi » de son bureau de science ouverte

Le Bureau de la science ouverte du CERN, dirigé par Anne Gentil-Beccot, propose des conseils sur la publication en libre accès, la gestion des données de recherche et les logiciels open source pour rendre la recherche scientifique plus accessible et plus efficace. Créé en 2023, le bureau fournit des ressources, organise des réunions de gouvernance et planifie de futurs cours de formation, dans le but de soutenir l'engagement de longue date du CERN en faveur de la science ouverte. Pour plus de détails sur la façon dont la communauté des chercheurs et des universitaires peut contribuer et en bénéficier, consultez le l'article complet.

Meta collabore avec des chercheurs pour étudier la santé mentale des adolescents

Meta a annoncé un nouveau programme pilote pour donner aux chercheurs du Centre pour la science ouverte (COS) accès aux données Instagram pendant six mois. Le programme vise à rechercher et analyser l’impact des plateformes de médias sociaux sur la santé mentale des adolescents. Kumar Hémant, rédacteur adjoint chez Candid.Technology et Emma Roth à The Verge, explorez la question.

Lectures complémentaires : Le Conseil scientifique international a récemment lancé un programme sur la santé mentale pour les jeunes dans le cadre d'un protocole d'accord avec l'Organisation mondiale de la santé. https://council.science/our-work/mental-wellbeing-young-people/

Annonce de la Global Diamond Open Access Alliance

L'UNESCO a organisé un événement en ligne le 10 juillet pour présenter et annoncer officiellement la Global Diamond Open Access Alliance, en soulignant sa vision, sa mission et ses objectifs, et pour impliquer les parties prenantes dans un effort de collaboration visant à promouvoir le Diamond Open Access.

Regarder l'enregistrement de l'événement ici.

L’intégrité en jeu : confronter «publier ou périr» dans les pays en développement et les économies émergentes

La "publier ou périr" La culture a conduit à d’importants défis éthiques dans l’édition scientifique, en particulier dans les économies en développement. Des pratiques contraires à l’éthique telles que la vente de paternités, la prolifération des « usines de papier » et l’utilisation abusive de l’IA pour produire des recherches frauduleuses portent atteinte à l’intégrité de la recherche scientifique et faussent les mesures académiques. Cette étude, publiée dans Frontiers in Medicine, met en lumière des cas de fraude académique, en particulier dans les pays à faible revenu, et recommande une vérification plus stricte de la paternité, des mesures disciplinaires en cas de fraude scientifique et des politiques favorisant la transparence et la responsabilité dans la recherche.

Le Structural Genomics Consortium explore une feuille de route en matière de science des données pour les organisations scientifiques ouvertes engagées dans la découverte de médicaments à un stade précoce.

Disponible depuis Communications Nature, l'organisation de recherche en science ouverte qui se concentre sur les opportunités que l'intelligence artificielle (IA) peut apporter en tant qu'accélérateur principal dans le domaine, arguant qu'une gestion robuste des données nécessite des ontologies précises et un vocabulaire standardisé, tandis qu'une architecture de base de données centralisée entre les laboratoires facilite l'intégration des données dans des environnements de pointe. ensembles de données de valeur.


Événements et opportunités de la science ouverte 


Nos cinq meilleures lectures sur la science ouverte


Clause de Non-responsabilité

Les informations, opinions et recommandations présentées par nos invités sont celles des contributeurs individuels et ne reflètent pas nécessairement les valeurs et les convictions de l'International Science Council.


Photo par COUPE-CHUTE on Unsplash

Passer au contenu