class: center, middle, inverse, title-slide # Data activism ## Comment faire campagne avec des données ? ### Samuel Goëta ### Greenpeace France, 11 juillet 2017 --- class: center, middle Retrouvez les matériaux sur https://github.com/datactivist/greenpeace-formation/ Ces slides en ligne : http://datactivi.st/greenpeace-formation/ Les productions de Datactivist sont librement réutilisables selon les termes de la licence [Creative Commons 4.0 BY-SA](https://creativecommons.org/licenses/by-sa/4.0/legalcode.fr). <img src="./img/Logo_DATACTIVIST_TW.png" height="150px" /> --- ## Open data : Un trésor méconnu et sous exploité [![](./img/reddit.png)](https://www.reddit.com/r/france/comments/5ing61/datagouv_ou_comment_perdre_des_heures_%C3%A0_se/) ??? Vous êtes probablement déjà allé sur un portail open data et peut etre que vous avez été déçu par les données que vous y avez trouvé. J'ai été très surpris par ce message qui est resté en une de Reddit France où l'auteur montre des faits intriguants à partir de data.gouv.fr --> vous montrer que l'open data peut révéler de nouvelles choses ou vous permettre les choses sous un autre angle --- # Mobiliser avec des données ###Exemple : Mejora tu escuela (Mexique) [![](img/mexico.png)](http://www.mejoratuescuela.org/escuelas/index/13DES0047O) .footnote[appuyer sur la touche `p` pour obtenir des détails sur le projet] ??? vu dans la[ 4ème édition du rapport annuel d'Open Data Barometer](http://opendatabarometer.org/doc/4thEdition/ODB-4thEdition-GlobalReport-FR.pdf): L’initiative pour l’éducation Mejora tu Escuela (« Améliore ton école ») est une plateforme en ligne qui donne des renseignements aux citoyens sur les résultats des écoles. Elle a comme objectif principal d’aider les parents. Elle permet aux utilisateurs de comparer les données de 163 785 bases différentes pour aider à la prise de décision en matière d’éducation et améliorer l’éducation des enfants. Le pouvoir décisionnel des parents a été renforcé et l’initiative a également permis d’exercer un contrôle plus efficace et de réduire la corruption dans le système éducatif mexicain. Outre les parents, d’autres acteurs importants, dont les enseignants, les décideurs politiques et les organisations de la société civile utilisent ces données pour analyser et évaluer les performances des élèves actuellement scolarisés, afin de renforcer, voire de réformer, le système scolaire. Le Mexique a un taux d’obtention du diplôme de fin d’études secondaires plus bas que la moyenne des pays de l’OCDE. Améliorer ce résultat est donc un objectif prioritaire et un outil comme Mejora tu Escuela peut contribuer à y parvenir. --- # Mobiliser avec des données ###Exemple : Paysages de France .reduite2.center[![](img/paysage.png)] .footnote[`p` pour obtenir des détails] ??? Voir la [présentation à l'OGP](http://pdfext.github.io/OGP2016/PitchCorner_OpenData_Thursday_December_8th__9_30_AM.pdf) Tout ceci se passe fin 2015 et début 2016. L'association 'Paysages de France' qui défend depuis plus de 25 ans le paysage contre toutes formes de pollution visuelle et notamment celle qui est due aux panneaux publicitaires, est informée fin août 2015 d'un projet de décret gouvernemental sur l'affichage publicitaire. Après avoir compris la portée de ce projet de décret, préparé sans nul doute par les lobbies publicitaires qui régulièrement essayent de faire évoluer la réglementation en leur faveur, l'association engage toutes ses forces pour s'y opposer, et commence alors une course de vitesse et une lutte de plus de 6 mois. Il faut évaluer, pour chacun des territoires français, la portée exacte de ce projet de décret, et il faut ensuite faire connaître au plus grand nombre cette étude d'impact. Que chacun puisse juger ! Pour ceci les données ouvertes sur les unités urbaines, les communes, sur la population, sur les Parcs Naturels Régionaux s'avèrent indispensables, la réglementation se basant sur ces données pour établir des seuils d'autorisation ou d'interdiction. Ces données récupérées sur la plateforme OpenData du gouvernement servent à établir une cartographie complète du projet de décret, en ligne et interactive, extrêmement éloquente : les communes ou les PNR qui seraient concernés apparaissent alors très clairement. Les effets de ce projet sautent alors aux yeux de tous, et leurs aspects très néfastes ! Cette cartographie est reprise progressivement par un grand nombre de médias nationaux et provinciaux, jusqu'aux JT de France3 et au JT du 20h de France2, et a ainsi contribué de manière décisive à la prise de conscience du public. Cette cartographie s'est rajoutée à toute une panoplie d'actions de l'association Paysages de France. La transparence et l'évaluation objective manquaient vraiment dans ce projet gouvernemental. Devant sa réalité dévoilée aux yeux de tous, le gouvernement a dû finalement renoncer à tous les articles de ce projet de décret (sauf un article relatif à la publicité autour des grands stades dans le cadre de l'Euro 2016, article qu'il faut continuer de dénoncer) et donc notamment renoncer complètement à étendre les zones où l’installation de panneaux publicitaires au sol de grand format aurait été autorisée. --- # Mobiliser avec des données ###Exemple : Transparency France - [Visualiser la corruption](https://www.visualiserlacorruption.fr/home) .reduite2.center[![](img/corrup.png)] ??? Lisez cet article dans [Le Monde](http://abonnes.lemonde.fr/chronique-des-communs/article/2017/02/11/une-carte-collaborative-de-la-corruption-en-france_5078252_5049504.html) qui présente le travail des bénévoles derrière ce projet. --- #Objectif de la formation 📣 Exploiter les données ouvertes pour faire campagne et mobiliser .pull-left[ **Session 1 : Ouvrir des données** <br/><br/><br/> ✅ Faire la différence entre open data et big data <br/><br/><br/> ✅ Connaitre les origines et les grands principes de l'open data <br/><br/><br/> ✅ Découvrir des bases de données ouvertes à exploiter <br/><br/><br/>] .pull-right[ **Session 2 : Faire ouvrir des données** <br/><br/><br/> ✅ "Just good enough" data: constituer une base de données suffisante pour mobiliser <br/><br/> ✅ S'appuyer sur le droit d'accès et la loi CADA <br/><br/><br/> ✅ Le crowdsourcing de données] --- class:inverse,middle,center # Les habits neufs des données ###Petit glossaire préalable --- # Les habits neufs des données .pull-left[- **Open data** : des données numériques souvent publiques librement réutilisables par tou.te.s d'un point de vue à la fois technique (formats ouverts) et juridique (licence ouverte) <br/><br/><br/> - **Linked data** : des données structurées définies par des ontologies sémantiques communes (chaque concept fait l'objet d'une définition) et reliées entre elles sur le web.] .pull-right[ ![](img/w3c.jpg) ] --- # Les habits neufs des données .pull-left[- **Big data** : des données généralement privées et fermées caractérisées principalement par leur volume (téraoctets de données), la vélocité de leur traitement (temps réel) et leur variété <br/><br/><br/> - **Data API** : une interface de programmation qui permet de se « brancher » pour échanger des données. L'API définit les règles et les limites à l'accès aux données. ] .pull-right[ ![](img/big.jpg) ] --- class:inverse, center, middle #Petite histoire de l'open data ###Connaitre les principes, découvrir les acteurs --- #2005 : Open Definition, définir le savoir libre ![http://opendefinition.org](img/opendef.png) --- #2007 : Sebastopol (CA), établir les principes de l'Open Data ![](img/sebastopol.jpg) --- #2009 : Tim Berners-Lee, les données brutes sous les projecteurs .reduite[![](img/ted.png)] --- #2011 : Open Government Partnership, l'internationale de l'ouverture ![](img/opengov.png) --- #2011 : Open Government Partnership, l'internationale de l'ouverture ![](img/ogp_mecanisme.jpeg) --- class:center, inverse, middle #L'open data en France ### Cadre juridique et principaux acteurs --- #Loi Commission d'Accès aux Documents Administratifs (1978) - Droit d'accès aux documents administratifs s'applique à **tous les documents** quelqu'en soit la forme : les données en font partie - S'impose à tous les organismes publics et privés **chargés d'une mission de service public** - Porte sur les documents **existants** et **achevés**. Exclut les demandes manifestivement **abusives** (entraver l'administration), les informations sur les **personnes physiques**, le **secret industriel** et commercial et la sureté de l'Etat. - La demande peut se faire par **e-mail ou par courrier**, l'administration a un mois pour répondre. La CADA peut être saisie dans un **délai de deux mois** après le refus (y compris tacite). A la suite, le tribunal administratif puis le Conseil d'Etat peuvent être saisis. .footnote[Le [site de la CADA](www.cada.fr) explique en détail la jurisprudence et les modalités d'exercice du droit d'accès.] --- # Les directives européennes .pull-left[ - **Directive Public Sector Information** (2003, révisée en 2013) : définit des règles minimales pour la réutilisation des informations publiques, limite les redevances et réduit certains obstacles à la réutilisation - **Directive INSPIRE (2007)** a pour objectif de créer une infrastructure de données environnementales et géographiques. Impose des normes pour les métadonnées et des spécifications pour les données dans 34 thèmes.] .pull-right[ ![](./img/euro.png) ] --- #Loi pour une république numérique (2016) : l'open data devient la norme en France .pull-left[![](img/repu_numerique.jpg)] .pull-right[ Ouverture “dans un standard ouvert, aisément réutilisable et exploitable par un système de traitement automatisé” : - des “bases de données” : à définir - des données “dont la publication présente un intérêt économique, social, sanitaire ou environnemental” Obligation qui s’applique à partir de fin 2018 aux collectivités locales de 3500 habitants et aux administrations plus de 50 agents] --- # Les licences de réutilisation .pull-left[- Article 11 de la loi pour une République Numérique : encadre les licences open data par décret. Deux licences homologuées : 1. **La licence ouverte** : totale liberté de réutilisation des données, y compris à des fins commerciales, des données. Impose de citer la source des données. 2. **La licence ODBL** : dans une logique de pot commun et de réciprocité, impose de maintenir la licence sur la base de données et les modifications qui y sont apportées.] .pull-right[ ![](https://www.etalab.gouv.fr/wp-content/uploads/2011/10/licence-ouverte-open-licence.gif) ![](https://upload.wikimedia.org/wikipedia/commons/c/cc/Open_Data_stickers.jpg) ] --- #Etalab : de l'ouverture à la gouvernance des données .pull-left[![](https://upload.wikimedia.org/wikipedia/fr/2/2f/Logo-etalab-320x200.png)] .pull-right[ - Etalab : mission en charge de l'ouverture des données publiques - Pilote le plan d'action de la France à l'OGP - 2014 : nomination d'Henri Verdier en tant qu'Administrateur Général des Données (Chief Data Officer) - Startups d'Etat ] --- #Data.gouv.fr : la plateforme ouverte des données publiques françaises .pull-left[![data.gouv.fr](img/dgf.png)] .pull-right[ - Objectif : simplifier le partage des données de l'Etat - Ouvert à toutes les contributions - Moissonage des portails open data français - Pas de visualisation - Un portail destiné à un public avancé ] --- ## L'ouverture des données des collectivités locales ![](img/odf.png) --- # Focus sur un acteur associatif : Regards Citoyens .pull-left[ - Association créée en juillet 2009 à l’initiative de 4 citoyens composée essentiellement de bénévoles <br/><br/> - Mission : proposer un accès simplifié au fonctionnement de nos institutions démocratiques à partir des informations publiques <br/><br/> - Acteur majeur du plaidoyer pour l'open data et la transparence de la vie publique ] .pull-right[ ![](https://www.regardscitoyens.org/wp-content/uploads/2009/10/logo_regardscitoyens.svg.png) ] --- # Regards Citoyens : quelques projets .pull-left[![](img/nosdeputes.png)[Nosdeputes.fr](www.nosdeputes.fr)![](img/fabrique.png)[La fabrique de la loi](www.lafabriquedelaloi.fr)] .pull-right[![](img/declaration.png)[Déclarations d'intérêt](https://www.regardscitoyens.org/interets-des-elus/) ![](img/parite.png) [Rapporteurs citoyens](https://www.regardscitoyens.org/rapporteurs-citoyens/)] --- class:center, inverse, middle #Sélection de données ouvertes ### Données emblématiques hors du domaine de l'environnement --- #La base SIRENE .reduite[.center[![](img/sirene.png)]] --- #La base SIRENE : exemple de cas d'utilisation .reduite[.center[![](img/ruesoif.png)]] --- ##La base SIRENE : faire une requête [![](img/sireneviz.png)](https://public.opendatasoft.com/explore/dataset/sirene/map/?q=nucl%C3%A9aire&refine.libapen=Enrichissement+et+retraitement+de+mati%C3%A8res+nucl%C3%A9aires&location=6,46.17317,2.22443&basemap=jawg.streets) --- Les marchés publics .reduite[.center[![https://www.data.gouv.fr/fr/datasets/marches-publics-conclus-recenses-sur-la-plateforme-des-achats-de-letat/](img/place.png)]] --- #Les marchés publics .reduite2[.center[![https://www.data.gouv.fr/fr/datasets/marches-publics-conclus-recenses-sur-la-plateforme-des-achats-de-letat/](img/place2.png)]] --- #La base transparence santé .reduite[.center[![](img/transpsante.png)]] --- #La base transparence santé .reduite2[.center[![](img/transpsante2.png)]] --- class:inverse, middle, center # Sélection de données ouvertes ### 🚜Agriculture --- # IGN : registre parcellaire graphique [![](img/rpg.png)](http://www.data.gouv.fr/fr/datasets/registre-parcellaire-graphique-rpg-contours-des-ilots-culturaux-et-leur-groupe-de-cultures-majoritaire/) --- # IGN : registre parcellaire graphique [![](img/rpg2.png)](https://www.geoportail.gouv.fr/carte?c=4.200599069655903,45.796124429708925&z=13&l0=ORTHOIMAGERY.ORTHOPHOTOS::GEOPORTAIL:OGC:WMTS&l1=LANDUSE.AGRICULTURE2013::GEOPORTAIL:OGC:WMTS&permalink=yes) --- # E-phy : le catalogue des produits phytosanitaires [![](img/ephy.png)](https://www.data.gouv.fr/fr/datasets/donnees-ouvertes-du-catalogue-des-produits-phytopharmaceutiques-adjuvants-matieres-fertilisantes-et-support-de-culture-produits-mixtes-et-melanges-e-phy/) --- # Agence bio : production animale et végétale par département .pull-left[ [![](img/bio.png)](https://www.data.gouv.fr/fr/organizations/agence-bio/)] .pull-right[ - Des données agrégées au département - Des données obsolètes : 2011 - Nouvelle initiative en septembre : espoir de mise à jour ] --- class:inverse, middle, center # Sélection de données ouvertes ### 🌱Environnement --- # Ademe : les émissions des véhicules commercialisés en France [![](img/ademe.png)](https://www.data.gouv.fr/fr/datasets/emissions-de-co2-et-de-polluants-des-vehicules-commercialises-en-france/) --- # Ademe : les émissions des véhicules commercialisés en France [![](https://www.data.gouv.fr/s/images/f3/d82b46c895495d9452ed8ea4540888.png)](https://www.data.gouv.fr/fr/reuses/visualize-characteristics-of-car-models-sold-in-france/) --- # Ademe : la base Carbone .pull-left[ [![](img/carbone.png)](https://www.data.gouv.fr/fr/datasets/base-carbone/#discussion-5721143a88ee382962a19f12-1) ] .pull-right[ - Recense plus de 1 300 facteurs d’émissions pour la France métropolitaine - Permet de convertir des activités en kilogrammes équivalent CO2 - Licence interdit usages commerciaux : 🤔pas de l'open data ] --- #IGN : inventaire forestier ![](img/inventaire.png) --- #CGDD : concentrations en nitrates [![](img/nitrates.png)](https://data.statistiques.developpement-durable.gouv.fr/explore/dataset/eau_qual_sup_nit/information/) --- #CGDD : concentrations en nitrates [![](img/nitrates2.png)](https://data.statistiques.developpement-durable.gouv.fr/explore/dataset/sout_nit_ref/information/?disjunctive.code_com&disjunctive.code_dep&disjunctive.classe_qualite&disjunctive.niveau) --- # Nitrates : cartographie des données [![](img/nitrates-viz.png)](https://data.statistiques.developpement-durable.gouv.fr/explore/dataset/eau_qual_sup_nit/custom/?refine.classe_associee=plus+de+50+mg%2FL) --- #Registre des émissions polluantes [![](img/irep.png)](http://www.georisques.gouv.fr/dossiers/irep-registre-des-emissions-polluantes) --- # Registre des émissions polluantes [![](img/mars.png)](https://marsactu.fr/chroniques/pollution-vous-avez-dit-pollution/) --- # INERIS, Prevair : prévision de la pollution [![](img/prevair.png)](http://www.data.gouv.fr/fr/datasets/mise-a-disposition-de-donnees-de-qualite-de-lair-sur-la-france-www-prevair-org-1/) --- class:inverse, middle, center #Sélection de données ouvertes ### ⚡️Energie --- # Ouverture des données de l'énergie : une obligation légale .pull-left[>"Permettre la réutilisation des données détaillées de consommation et de production issues de leur système de comptage d'énergie, dans l'objectif de favoriser notamment le développement d'offres d'énergie, d'usages et de services énergétiques.<br/> **Article 23 de la loi pour une république numérique**] .pull-right[![](img/decret.png)[Décret d'application](https://www.legifrance.gouv.fr/eli/decret/2017/4/5/ECFC1631045D/jo/texte)] --- #RTE : courbe de charge de la consommation [![](img/courbe.png)](https://rte-opendata.opendatasoft.com/explore/dataset/cdc_conso/information/?disjunctive.qualite&dataChart=eyJxdWVyaWVzIjpbeyJjaGFydHMiOlt7InR5cGUiOiJsaW5lIiwiZnVuYyI6IkFWRyIsInlBeGlzIjoiY29uc28iLCJjb2xvciI6IiNlYTUyNTQiLCJzY2llbnRpZmljRGlzcGxheSI6dHJ1ZX1dLCJ4QXhpcyI6ImRhdGVfaGV1cmUiLCJtYXhwb2ludHMiOm51bGwsInRpbWVzY2FsZSI6ImhvdXIiLCJzb3J0IjoiIiwiY29uZmlnIjp7ImRhdGFzZXQiOiJjZGNfY29uc28iLCJvcHRpb25zIjp7ImRpc2p1bmN0aXZlLnF1YWxpdGUiOnRydWV9fX1dLCJ0aW1lc2NhbGUiOiJ5ZWFyIn0%3D) --- ## RTE : courbe de charge de la production par filière [![](img/courbeProd.png)](https://rte-opendata.opendatasoft.com/explore/dataset/cdc_conso/information/?disjunctive.qualite&dataChart=eyJxdWVyaWVzIjpbeyJjaGFydHMiOlt7InR5cGUiOiJsaW5lIiwiZnVuYyI6IkFWRyIsInlBeGlzIjoiY29uc28iLCJjb2xvciI6IiNlYTUyNTQiLCJzY2llbnRpZmljRGlzcGxheSI6dHJ1ZX1dLCJ4QXhpcyI6ImRhdGVfaGV1cmUiLCJtYXhwb2ludHMiOm51bGwsInRpbWVzY2FsZSI6ImhvdXIiLCJzb3J0IjoiIiwiY29uZmlnIjp7ImRhdGFzZXQiOiJjZGNfY29uc28iLCJvcHRpb25zIjp7ImRpc2p1bmN0aXZlLnF1YWxpdGUiOnRydWV9fX1dLCJ0aW1lc2NhbGUiOiJ5ZWFyIn0%3D) --- ## RTE : imports et exports d'énergie .pull-left[ ] .pull-right[ ] [![](img/imports.png)](https://rte-opendata.opendatasoft.com/explore/dataset/imports_exports_commerciaux/) --- # RTE: registre des installations de production .pull-left[- [Registre](https://rte-opendata.opendatasoft.com/explore/dataset/registre_parc_prod_rpt/map/?disjunctive.exploitant&disjunctive.filiere&disjunctive.combustible&disjunctive.hierarchie_filiere_combustible&sort=filiere&location=5,46.93526,1.66992&basemap=osmtransport) présente les installations de production raccordées au Réseau de Transport d'Electricité au 31 décembre 2015. - Comporte type de combustible et SIRET de l'entreprise - 881 enregistrements ] .pull-right[![](img/registre-viz.png)] --- # Enedis : consommation journalière par catégorie client .pull-left[Moyenne journalière de la consommation par catégorie client] .pull-right[[![](img/conso.png)](https://data.enedis.fr/explore/dataset/bilan-electrique-transpose/information/)] --- # Enedis : bilan électrique au pas demi-heure [![](img/bilan.png)](https://data.enedis.fr/explore/dataset/bilan-electrique-transpose/information/) --- # Enedis : consommation électrique par secteur d'activité par IRIS .pull-left[ - Consommation électrique annuelle moyenne et totale et le nombre de sites par secteur d’activité, aux mailles géographiques région, EPCI et IRIS sur le réseau Enedis. - Les [données](https://data.enedis.fr/explore/dataset/consommation-electrique-par-secteurs-dactivite/information/?location=13,47.81898,3.56489) publiées correspondent aux années 2011 à 2015. ] .pull-right[![](img/consoiris.png)] --- # GRTgaz : consommation de gaz par secteur d'activité .pull-left[[Données](https://opendata.grtgaz.com/explore/dataset/conso_gaz_secteurs_industiels/?disjunctive.secteur_industriel&sort=-mois) sur la consommation de gaz annuelle des sites industriels raccordés au réseau de GRTgaz et leur nombre, par maille géographique IRIS ] .pull-right[ ![](img/gaz.png) ] --- # CRE : outils de calculs de la structure des tarifs [![](img/cre.png)](http://www.cre.fr/reseaux/reseaux-publics-d-electricite/outils-de-calcul-de-la-structure-des-tarifs) --- class:inverse, middle, center #L'open data par défaut : un mirage ? --- #Une obligation sans moyens dédiés .pull-left[ ![](img/datameme.jpg) ] .pull-right[ - Un travail sous-évalué - Un travail qui n'entre pas dans les missions des agents - Une transition vers l'open data par défaut peu préparée ] --- #La qualité des données .pull-left[ - Des retours des usagers difficilement pris en compte - Encore trop de fichiers inexploitables - Des données trop souvent agrégées : la quête des données brutes ] .pull-right[ ![](img/dirtydata.jpg) ] --- #La loi CADA doit être renforcée et mieux connue .reduite2[.center[![](img/cadawtf.jpg)]] --- #Vers un open data de la demande ![](img/opengov.jpg) --- class:inverse,center,middle #Merci !