Chapitre 2 Le cadre juridique de l’open data en France

On pourrait croire que l’open data constitue un mouvement récent né il y a près de dix ans. En réalité, les principes internationaux que nous venons de découvrir s’inscrivent dans la continuité du droit français et européen qui garantit la transparence de l’action de l’administration. En plus de porter l’attention sur les données brutes de l’administration, les principes de l’open data ont apporté deux nouveautés : la consécration du droit de réutilisation avec l’apparition de standards internationaux et l’importance de la lisibilité des données par les machines.

2.1 La loi CADA : accorder aux citoyens un “droit de savoir”

On peut retracer la philosophie de l’open data dans les fondements même de la République avec la Déclaration des Droits de l’Homme et du Citoyen de 1789 qui dispose dans son article 15 que “la Société a le droit de demander compte à tout Agent public de son administration.” Cet article pose un devoir de reddition de comptes pour l’administration qui s’est exercé pendant longtemps principalement par des institutions comme la Cour des Comptes en charge du contrôle de l’action public.

Néanmoins, c’est véritablement à partir de 1978 qu’a émergé un droit d’accès à l’information publique qui s’est progressivement transformé en droit de réutilisation avec le développement d’Internet. Le droit d’accès des citoyens à l’information publique émerge en 1978 avec la loi dite CADA du nom de la Commission d’Accès aux Documents Administrations Administratifs. La France était alors le troisième pays au monde après la Suède en 1766 et les Etats-Unis en 1966 avec le Freedom of Information Act (FOIA) en 1966 à accorder un “droit de savoir” à ses citoyens qui permet de demander aux administrations les informations publiques qu’elles détiennennt. En 1978, c’est un droit d’accès qui est accordé aux citoyens, la priorité à l’époque étant d’améliorer la relation entre l’administration et le public et de renforcer la transparence de l’action publique.

La loi CADA donne une définition très large d’un document administratif comme “tous les documents produits ou reçus par l’administration qu’ils se présentent sous forme écrite (dossiers, rapports, études, comptes rendus, procès-verbaux, statistiques, directives, instructions, circulaires…), sous forme d’enregistrement sonore ou visuel ou sous forme numérique ou informatique.” C’est dans ce cadre très générique que s’inscrit l’ouverture des données. Le droit d’accès s’appplique aux documents administratifs produits dans le cadre d’une [mission de service public](de manière directe par les acteurs publics ou indirecte (délégation de service public), c’est-à-dire l’accomplissement de toute activité prise en charge de manière directe par les acteurs publics ou indirecte (délégation de service public) pour satisfaire l’intérêt général et régi par des principes de continuité, d’égalité et d’adptabilité. Enfin, le droit d’accès ne s’exerce que si l’administration a effectivement en sa possession le document demandé, que si le document est formellement achevé et qu’il n’est pas préparatoire à une décision administrative en cours d’élaboration.

Sont exclus du droit d’accès les documents administratifs pouvant atteindre porter atteinte à l’exercice des activités régaliennes de l’État et à l’intérêt général. Plusieurs secrets sont protégés notamment concernant les délibérations du Gouvernement, le secret de la défense nationale, la sécurité publique ou encore le déroulement des procédures juridictionnelles. Surtout, le cadre de la loi CADA exclut les données à caractère personnel, relatives à des personnes physiques et permettant leur identification directe ou indirecte. Toutefois, les documents comprenant des données à caractère personnel ne sont communicables et réutilisables que si au moins l’une des trois conditions suivante est remplie : 1. le consentement des personnes concernées a été recueilli après leur bonne information sur la finalité et les modalités de la communication ou de la réutilisation des données les concernant ; 2. les données sont anonymisées (c’est-à-dire non identifiantes ou ne permettant pas, compte tenu de leur niveau d’agrégation, d’identifier à nouveau les personnes concernées) ; 3. la réutilisation est autorisée par un texte législatif ou réglementaire.

Aller plus loin : Sur tous ces points, le site de la CADA détaille la jurisprudence, en particulier dans la partie sur l’étendue du droit d’accès. Le guide de demande de données publiques auprès des collectivités produit par Bordeaux Métropole permet aussi de mieux comprendre le cadre légal.

2.2 Du droit d’accès au droit de réutilisation

La loi CADA a accordé aux citoyens un droit d’accès aux documents administratifs, la question de la réutilisation des données publiques a émergé dans les années 1990 avec le développement d’Internet facilitant la diffusion des données publiques et le développement de nouveaux services au public. Comme l’explique Boustany (2013), “la différence réside dans les enjeux : l’accès aux documents publics relève de la démocratie et de la transparence des institutions ; la réutilisation des données des données pour produire des services ou pour la connaissance présente des enjeux socio-économiques.”

Aller plus loin : lire l’article de Joumana Boustany (2013), « Accès et réutilisation des données publiques : État des lieux en France" dans la revue Les Cahiers du numérique

La frise qui suit retrace les principales dates de l’apparition du droit de réutilisation des données, chacune de ces dates étant développée à la suite :

Le droit de réutilisation des informations publiques a été fortement soutenu par l’Union Européenne en particulier avec la Directive dite PSI (Public Sector Information) de 2003 concernant la réutilisation des informations du secteur public qui fixe les règles minimales et les conditions de réutilisation de ces données publiques. Elle a été transposé en droit français par l’ordonnance du 6 juin 2005 qui autorise les usages commerciaux des données publiques et fixe le cadre de la réutilisation en autorisant notamment le paiement d’une redevance couvrant des frais autre que ceux de la reproduction des documents. En 2013, la révision de la directive PSI a instauré un véritable droit à réutilisation des données du secteur public pour lequel persiste toutefois une exception pour le secteur culturel (musées, bibliothèques, archives). La loi relative à la gratuité et aux modalités de la réutilisation des informations du secteur public, dite loi Valter de 2015, l’a traduit en droit français en instaurant le principe de gratuité généralisé à tous les secteurs, toutefois, les données des services publics industriels et commerciaux restent exclues ce qui a été abrogé par la loi pour une République Numérique que nous détaillerons dans la prochaine section.

Aller plus loin : lire le guide “Les lois régulant la donnée publique” produit par Open Data France et la présentation “Quelles obligations réglementaires pour l’ouverture des données?” produite par le SGAR de la région Occitanie dans le cadre du projet Open DataLab

Enfin, dernier élément du contexte juridique, la directive européenne Inspire du 14 mars 2007 vise à l’harmonisation et à l’ouverture des données géographiques au niveau européen.Transposée en droit français par l’ordonnance du 21 octobre 2010, elle impose aux autorités publiques de recenser les données qui rentrent dans le périmètre concerné par la directive, de créer et de maintenir les métadonnées selon les normes établies par la commission européenne, de mettre les métadonnées et les données en suivant les standards européens. Pour certaines données qui ne pourraient être ouvertes au public, la directive impose le partage entre autorités publiques.

Aller plus loin : lire le document “La directive Inspire pour les néophytes” établi par la Mission de l’information géographique (MIG) du ministère du développement durable en 2016

2.3 Loi pour une République Numérique : l’ouverture des données par défaut

Promulguée le 7 octobre 2016, la loi pour une République Numérique a fait l’objet de près de quatre ans d’annonces, de consultations et de débat. Son titre 1 porte sur l’ouverture des données publiques et rend obligatoire la mise à disposition des données publiques communicables.

La loi impose un principe d’ouverture des données par défaut à toutes les administrations et collectivités locales de plus de 3500 habitants et 50 agents qui concerne un périmètre très large comprenant les documents communiqués suite à des demandes CADA (depuis le 7 avril 2017), les “bases de données” et les données “dont la publication présente un intérêt économique, social, sanitaire ou environnemental” à partir d’octobre 2018. Rares sont les données publiques qui ne sont donc pas concernées par cette obligation d’ouverture. L’obligation concerne aussi les entreprises délégataires d’une mission de service public pour les données collectées ou produites à l’occasion de l’exploitation du service public faisant l’objet du contrat qui doivent être fournies gratuitement aux acteurs publics, en charge alors de les diffuser. La loi ne prévoit pas de sanctions pour les administrations qui ne respecteraient pas cette obligation.

Toutefois, la notion de données qui délimite le périmètre concerné par l’obligation d’ouverture ne fait pas l’objet d’une définition juridique. Classiquement, on définit les données comme une forme de représentation d’une réalité destinée généralement à être traitées par un ordinateur, à l’opposée des informations généralement destinées à être traitées par des humains. Cette définition est une parmi d’autres, la notion de données faisant l’objet de débats dans la littérature sur lequel nous n’allons pas nous étendre ici. Dans le droit, la seule référence que nous connaissons est un arrêté du 22 décembre 1981 relatif à l’enrichissement du vocabulaire informatique définit la donnée comme la « représentation d’une information sous une forme conventionnelle destinée à faciliter son traitement (en anglais : data). » L’absence de définition juridique pourrait devenir problématique dès lors que des contentieux tenteront de faire appliquer l’obligation d’ouverture des données prévus par la loi pour une République numérique.

Sur ce point, la loi pour une République Numérique consacre l’utilisation de standards ouverts pour la communication des documents administratifs afin de faciliter la réutilisation des données par les machines L’administration (ministères, collectivités territoriales, établissements publics…) sera dorénavant tenue, lorsqu’elle communique un document administratif au format électronique, de le mettre à disposition du citoyen “dans un standard ouvert, aisément réutilisable et exploitable par un système de traitement automatisé”. Concrètement, cela empêche la publication de fichiers PDF là où un fichier CSV pourrait être diffusé, conformément aux principes internationaux de l’open data évoqué dans la section précédente.

Enfin, la loi limite par décret les licences qui peuvent être utilisées par les administrations. Le décret du 27 avril 2017 autorise deux licences : la Licence Ouverte d’Etalab et la licence OpenDataBaseLicense (nous reviendrons à la suite sur le contenu de ces licences). Les administrations qui voudront utiliser une autre licence devront remplir une procédure d’homologation auprès des sercices du Premier ministre qui impose notamment un exposé des motifs ayant conduit conduit à choisir une licence hors de la liste fixée dans le décret et une consultation des usagers affectés par la licence proposée. L’homologation doit être faite pour chaque jeu de données même si la licence reste la même.

Aller plus loin : lire l’article “On vous explique le volet « Open Data » de la loi Lemaire” publié par le site NextInpact

Ces deux licences offrent un choix aux administrations, la licence ouverte étant plus permissive que la licence ODBL qui a été conçue dans une logique de “pot commun” permettant de garantir que les données resteront ouvertes après leur réutilisation.

Panorama des licences de données ouvertes (source : Open Data Lab

Figure 2.1: Panorama des licences de données ouvertes (source : Open Data Lab

Aller plus loin : le guide "Ouverture des données de la recherche. Guide d’analyse du cadre juridique en France " de l’INRA présente dans sa fiche numéro 6 une comparaison complète de la licence ouverte et de la licence ODBL