MESRI - Etude sur l’utilisation d’œuvres relevant des arts visuels dans les publications scientifiques
MESRI - Etude sur l’utilisation d’œuvres relevant des arts visuels dans les publications scientifiques

Picto Cible

Contexte

Afin de préparer la mise en place des licences collectives étendues pour faciliter la reproduction d’œuvres protégées par le droit d’auteur dans les publications scientifiques, le Ministère de l’enseignement supérieur, de la recherche et de l’innovation a confié à Datactivist et Pierre-Carl Langlais une étude visant à :

  • établir, sur la base d’une connaissance de la volumétrie globale d’images publiées dans des travaux et publications scientifiques sur une année, une estimation du nombre d’images entrant dans le champ de la mesure ;
  • fournir une méthodologie permettant de réitérer ce calcul sur les flux annuels de travaux et publications scientifiques, dans 3 ans, 5 ans, voire 10 ans si c’est encore possible ;
  • évaluer le nombre d’images entrant dans le champ de la mesure dans les collections rétrospectives de publications scientifiques (portail Persée).

Approche adoptée

  • constitution, via le portail Isidore, d’un corpus de publications en SHS en accès libre pour l’année 2019 ;
  • extraction et classification automatique des images contenues dans ces publications (soit 899 567 objets visuels pertinents) ;
  • analyse documentaire d’un échantillon de 2 039 images afin de déterminer les indices de leur régime juridique ;
  • test de méthodes automatique susceptibles de reproduire les résultats de l’analyse manuelle, mobilisant des techniques actuellement développées dans le champ des humanités numériques et du traitement du texte et du document ;
  • développement d’un modèle (documents exécutables sous R) permettant d’estimer le nombre d’images dans le champ de la mesure publiées dans le corpus 2019, pouvant être réitéré à partir de toute nouvelle interrogation Isidore.

Picto Soleil loupe

Résultats obtenus

  • rapport de 86 pages validé par le Comité de pilotage (MESRI, Ministère de la culture, organismes de gestion collective) pour déterminer le montant des licences collectives ;
  • montée en compétences de ces institutions sur l’utilisation des images par les chercheurs et chercheuses, et l’évolution possible de ce comportement après la mise en place des licences collectives ;
  • intervention de Pierre Carl Langlais lors du colloque #dhnord 2021 : « Cultures visuelles en SHS. Construire un corpus de 470 000 images scientifiques avec du deep learning ».

Plus de références