Carnet de bord de l’ouverture des données de Maremne Adour Côte Sud - groupe 11
par BIBRON Louis, HERAIEF Ilan, BENOCCI Enza, BETZ Nina, CIVET Léonie, ROMBY Antoine, LESCOUARCH Auriane
INTRODUCTION
“You can have data without information, but you cannot have information without data.”. Daniel Keys Moran souligne à travers cette citation l’enjeu des datas dans notre monde. A travers cette 5ème édition de Challenge Data proposée par Datactivist aux élèves de SciencesPo Saint-Germain-en-Laye du 21 au 25 novembre 2022, nous avons pu apprivoiser le monde de l’ouverture des données publiques, ses enjeux et ses pratiques.
9h. Salle médiane. Un rituel désormais bien connu pour tous les étudiants d’IEP. Chaque matin, l’équipe de MACS Challengers, accompagnée de son référent C.M., se retrouve pour affronter de nouveaux défis. Au fil de la semaine, leurs yeux deviennent de plus en plus bouffis et les cernes se creusent, mais leur motivation et leur persévérance sont sans faille. Et pour cause, les enjeux de la mission qui leur est confiée sont d’une importance capitale. Le but : “challenger des datas” pour aider une collectivité à publier des jeux de données et les rendre accessibles aux citoyens. Plus précisément, MACS Challengers accompagne la Communauté de Communes Maremne Adour Côte Sud (MACS). 8 jeux de données ont été analysés, nettoyés, ordonnés, validés et publiés.
Ils concernent des données centrés sur les transport et l’environnement, en particulier : les aménagements cyclables, les arrêts et les trajets des bus du réseau YÉGO, les transports scolaires, les aires de covoiturage, les zones humides du territoire, la consommation d’électricité et de gaz, l’éclairage public et les gisements solaires et potentiel thermique. Ainsi, grâce à la publication de ces données, les données sont désormais ouvertes et réutilisables pour des usages variés et respectent la Loi pour une République numérique de 2016 (obligeant les collectivités de plus de 3,5000 habitants et 50 agents à publier des données publiques par principe). Enfin, les visualisations créées par notre équipe MACS Challenger permettent de rendre ces données faciles d’utilisation pour tous les citoyens.
Ce carnet de bord des MACS Challengers revient avec honnêteté sur les difficultés et les réussites rencontrées au cours de cette semaine. Une semaine riche en apprentissage et en découvertes, et toujours dans la bonne humeur. Mais avant toute chose, une petite présentation des 7 MACS Challengers s’impose:
JOUR 1 – DIAGNOSTIC
Nous travaillons sur la Communauté de Communes Maremne Adour Côte Sud (MACS), cet EPCI (Etablissements publics de coopération intercommunale) au Sud-Ouest du département des Landes dans la région Nouvelle-Aquitaine. D’une superficie d’environ 603 km2, ce territoire est composé de 23 communes et d’environ 60 000 habitants. Son président est Pierre Froustey (PS) élu fin 2017 et réélu en 2020. Il était auparavant maire de Vieux Boucau. Située sur le littoral, la communauté de communes présente des enjeux à fortes dimensions environnementale, naturelle et maritime, en partie dûs à son activité côtière dynamique, son tropisme touristique et une forte croissance démographique. Elle accueille en effet 8 nouveaux aquitains sur 100 et 300 000 touristes chaque année. Si seulement 5% du territoire est urbanisé, de nombreux espaces naturels sont préservés ou appellent à être protégés. On y compte 2 lacs marins, 3 réserves naturelles, 20 km de berges, 200 km de cours d’eau à entretenir, 1200 plans d’eau à préserver et 35 km de littoral à protéger de l’érosion. Suite à notre interview avec M.D, nous avons pu établir un bilan du diagnostic. Nous avons déterminé, via le questionnaire, la maturité open data de la Communautés de Communes Maremne Adour Côte Sud. Le niveau de maturité de la communauté est au palier 3, ce qui nous indique que cette dernière est déjà à un stade assez avancé s’agissant de l’open data comparé à d’autres collectivités. Ce résultat s’explique notamment par l’ouverture d’un poste dédié exclusivement à cette activité ainsi qu’à l’existence d’un catalogue de données. En effet, la personne interrogée, bien que récemment en poste, dispose de quelques notions et est familière aux problématiques d’open data. La plupart des questions qui se rapportent à différents jeux de données sont effectivement traitées par les différents services correspondants de la communauté. Notre interlocutrice nous a effectivement confirmé l’existence d’un personnel compétent sur l’open data dans cet EPCI. La Communauté utilise des scripts pour créer un catalogue de données, connaît les réglementations s’agissant des conditions d’utilisation pour publier des données en open data et communique régulièrement sur ses réseaux et son site internet. Nous travaillerons donc avec une intercommunalité avancée en la matière. Ainsi, les jeux de données retenus par la collectivité et sur lesquels nous travaillerons activement cette semaine portent d’une part sur les infrastructures de recharge pour les voitures électriques, les lieux de covoiturage, les indicateurs de valeur humide du territoire et les aménagements cyclables. Dans un souci de priorisation, nous traiterons d’autre part les jeux de données relatifs aux lignes de bus, à l’éclairage public, aux gisements solaires et potentiels thermiques ainsi qu’à la consommation annuelle d’électricité et de gaz par commune. La Communauté de Communes a pour finir l’intention d’ouvrir ses données dans un souci de transparence, mais aussi afin d’aider les différents acteurs, que ce soit les autres collectivités, la population ou les entreprises. Ses objectifs sont de récolter le plus d’informations possibles, les trier, les classer et de coller à la réglementation.
Nous avons identifié 8 jeux de données que la Communauté de communes MACS souhaite explorer. Ci-dessous les différents jeu de donné avec leur ordre de préférence et les noms et services des personnes à contacter pour la 2ème journée.
La wishlist de la Communautés de Communes de Maremne Adour Côte Sud
Equipe 11 avant l’interview - Day 1. On est au MACS !
JOUR 2 – IDENTIFICATION
Ce matin, nous avons commencé par télécharger les données que nous a envoyé MACS. Nous pensions retrouver des fichiers CSV mais malheureusement nous avons reçu des fichiers Shapesfiles. Ainsi, à force de lecture sur Google et de téléchargement de différents liens, nous avons réussi à exporter les données géographiques vers un fichier CSV (même si les coordonnées nous ont bien compliqués la tâche). Lorsqu’une partie de groupe s’occupait à réaliser cette tâche, une autre partie du groupe a réalisé l’organigramme des données :
Concernant les données, nous avons dû utiliser QGIS, des convertisseurs sur Internet ainsi que Google Earth et croiser les données extraites afin de former les meilleurs fichiers CSV possibles. Néanmoins, nous n’avons pas réussi à extraire les coordonnées de certains fichiers.
Ensuite, nous avons étudié les différents templates présents sur le Google Drive afin de pouvoir comparer nos fichiers et ainsi évaluer leur précision.
En étudiant nos fichiers CSV, nous avons remarqué certaines anomalies et nous avons eu un certain nombre de questions. C’est pourquoi, nous avons contacté le responsable du service Transport au sein de la collectivité. Ce fut un échange très constructif et enrichissant dans lequel nous avons pu obtenir des réponses à nos nombreuses questions en particulier sur les pistes cyclables, les bornes de recharge ainsi que les aires de covoiturage. Lors de cet échange, le responsable nous a confié qu’ Open Street Map est un véritable outil avec une utilisation beaucoup plus intuitive et facile d’utilisation face à parfois des tâches dans les services internes beaucoup plus longues. C’est pourquoi, nous allons étudier la possibilité d’inclure Openstreetmap dans la suite de notre travail.
Enfin, nous avons donc évalué notre wish list en fonction des fichiers que nous avons (à nettoyer / à compiler / à compléter / à standardiser) et nous avons alors conclu cette wanted data list :
Malgré un début très difficile, on reste toujours au MACS !
JOUR 3 – MISE EN QUALITE
Aujourd’hui, il a été question de nettoyer les dix fichiers qui nous ont été donnés par la collectivité. Il a donc fallu corriger les données fausses ou incorrectes en rapport avec la localisation en les confrontant à des données de sites comme Openstreetmap. Nous avons réparti entre nous les dix fichiers en suivant la procédure à suivre sur OpenData. Notre référent a réussi à nous convertir les fichiers que nous a envoyé M.D. de la collectivité en format cvs. En effet, ces fichiers n’étaient pas complets car en les convertissant, les coordonnées étaient perdues. Ainsi, la conversion des huit fichiers par notre référent nous a permis d’ajouter les données de localisation; une fois ces fichiers complets, nous avons converti nos fichiers en Geojson, pour les rendre exploitables par la suite auprès de la collectivité.
Sur le fichier aires de covoiturage, nous avons réussi à exporter les données du site Blablacar à partir d’un template où se trouvent toutes les aires de covoiturage de France. Cela nous a permis d’avancer très rapidement en évitant de vérifier l’existence et les coordonnées de chaque aire sur google map/ Openstreetmap
Un MACS de concentration pour cette journée!
JOUR 4 – PUBLICATION
Aujourd’hui nous avons commencé par une répartition du travail d’équipe pour le remplissage de la fiche descriptive des jeux de données (infrastructures de recharge pour véhicules électriques, gisements solaires et potentiel thermique, indicateurs sur nature humide du territoire, éclairage public, localisation des aires de covoiturage, liste des parcours des lignes de bus du réseau YÉGO, arrêt de bus YÉGO, consommation annuelle d’électricité et de gaz, aménagements cyclables et enfin transport scolaire).
Certaines données sont manquantes, principalement autour de quatre questions (le processus de collecte, la fréquence de mise à jour, la licence et les attributions) dans les domaines affectant le transport. Nous avons donc appelé à 11h, L.S., du Service Transport. Les réponses à nos questions ont été assez fructifiantes, hormis sur la question des licences, en raison de son arrivée assez récente au sein du Service transport (six mois). Nous avons voulu finir sur une question plus personnelle sur son parcours personnel pour apprendre plus de nos interlocuteurs dans le cadre de notre challenge data. Avoir un apport de nos interlocuteurs est toujours un plus. Après cette interview, nous avons complété les informations manquantes sur les fiches descriptives sur les jeux de données.
Puis nous avons eu un deuxième entretien à 14h30 avec le TEPOS (Service Environnement), et plus particulièrement avec S.R, pour avoir nos réponses à nos questions manquantes sur les fiches descriptives des jeux de données dans les secteurs de l’environnement. Nos questions portaient particulièrement sur le sujet des bornes de recharge des véhicules électriques et l’absence récurrente aux réponses des fiches descriptives comme le processus de collecte et la licence par exemple.
Puis, préparation de la communication de la commune autour de l’ouverture des données.
Plan de communication pour la page Facebook de MACS et la page Instagram
JOUR 5 – VALORISATION
L’objectif du jour était de mettre en valeur les données traitées pendant la semaine: une journée sous le signe de la MACSi création. Nous avons donc commencé par un brainstorming des datavisualisations que nous pourrions mettre en œuvre. Nous avons ainsi parcouru le site https://datavizproject.com/ pour choisir les visuels qui seraient le plus parlant en créant un fichier répertoriant nos idées. Ensuite, nous avons mis en œuvre nos visualisations à l’aide de UMap, ainsi que de l’outil “graphique” de Google Sheets. Finalement, nous avons rempli le document “Contexte de la datavisualisation” afin de préciser l’intérêt, une description plus précise ainsi que les éventuelles remarques liées à chaque visualisation.
A 11h30, nous avons eu un appel avec notre référente pour nous faire un retour sur les jeux de données envoyés la veille: celle-ci a validé notre travail. Après une pause déjeuner bien méritée, nous avons créé un PowerPoint de manière à préparer la présentation que nous ferons à notre référente en fin de journée afin de récapituler tout notre travail de la semaine. Nous avons alors expliqué notre démarche, les difficultés rencontrées ainsi que les réussites notables. Enfin, nous avons détaillé les datavisualisations réalisées. Pour nous aider dans notre travail, nous n’avons pas hésité à nous sustenter avec des MACSi gourmandises achetées par les membres de l’équipe (photo contractuelle).
Voyant qu’il nous restait un peu de temps avant le rendez-vous avec notre référente, nos MACSi challengers se sont lancés dans l’écriture d’un article à lui présenter pour communiquer sur le site de la collectivité autour de la publication des données.
A 17h, nous avions rendez-vous avec notre interlocutrice pour lui faire un compte-rendu de notre semaine. Nous avons donc présenté notre diaporama et eu un échange sur leur future publication. Nous avons ainsi pu la remercier pour sa coopération et sa disponibilité tout au long de la semaine. Finalement, nous avons terminé la journée (et la semaine!) en envoyant un mail récapitulatif à notre référente pour lui récapituler toutes ces informations et la remercier une dernière fois.
CONCLUSION
Après cinq jours intenses de joie, de rires, de désillusions et de casse-têtes, le challenge Data est terminé. Le résultat est là. Huit jeux de données vont être publiés grâce au travail de l’équipe des MACS Challengers sur l’objectif de 10, établi le deuxième jour.
Le premier jour, fait de découvertes et d’espoir face à la communauté de communes MACS, plutôt mature en termes d’open data, ne nous laissait pas présager les complications rencontrées ensuite. La désillusion fut grande lorsqu’on découvrit le format des jeux de données transmis : shapefile. Un format inconnu pour nous tous et impossible à exploiter tel quel. Ilan, le geek de l’équipe, installe plus vite que son ombre Qgis, le logiciel permettant de transformer les documents shapefile en format csv. Les données sont désormais lisibles. Mais les difficultés ne s’arrêtent pas là. Les jeux de données ne sont pas tous d’une qualité suffisante pour être publiés. Commence alors le travail de nettoyage des jeux de données. Après plusieurs appels avec la référente, avec le service transport, avec le service environnement et plusieurs mails échangés, nous réussissons à établir huit jeux de données prêts à être publiés. Malgré la déception de ne pas avoir obtenu des jeux de données exploitables pour les pistes cyclables et les bornes de recharge pour véhicules électriques après plusieurs heures de travail dessus, nous quittons, la troisième journée, épuisés mais confiants, nous pensons les ennuis terminés. Or une nouvelle déception nous guette. La CC MACS a une convention avec le GIP ATGeRi (PIGMA) pour la publication de données, nous ne pourrons pas le faire nous-mêmes et elles ne seront pas ouvertes avant la fin de la semaine. Cependant, notre motivation ne s’émousse pas. Nous proposons un plan de communication, inventons un slogan, préparons des visuels pour mettre en avant le travail d’une semaine lors de la publication. Le dernier jour nous concevons des datavisualisations afin de valoriser l’ouverture de ces jeux de données et faire comprendre leur utilité aux agents et citoyens.
Le soulagement se fait sentir après la restitution finale. Notre référente de la communauté de communes MACS est contente du travail effectué. Les jeux de données ne pourront pas tous être publiés mais cela a justement permis d’identifier ceux à compléter et les données restantes à récolter. Par exemple, le jeu de données sur les bornes de recharge, une des priorités de la CC, était très incomplet, la CC pourra donc se concentrer sur la collecte de ces données. De plus, elle a souligné la valeur de ce travail pour comprendre comment des personnes extérieures à la CC peuvent comprendre et mettre en avant les données. Notre approche nouvelle par rapport à la collectivité a permis d’identifier des enjeux nouveaux, qu’elle pourra exploiter. Une semaine gagnante du côté de la communauté de communes et du nôtre. Nous repartons grandis de cette semaine, avec une multitude de nouvelles connaissances. Ilan est devenu pro du logiciel QGIS. Le fonctionnement d’une collectivité locale n’a plus aucun secret pour Louis (ni pour aucun de nous d’ailleurs). Enza peut nommer plus de 492 zones humides dans la région. Léonie connaît par cœur tous les transports disponibles dans la communauté de communes. Antoine peut vous recommander l’aire de covoiturage la plus adaptée à vos besoins. Auriane peut désormais suivre n’importe quel processus de valorisation des données. Nina est capable de localiser toutes les bornes de recharge de MACS.
Plus généralement, cette semaine de challenge data nous a permis de comprendre l’enjeu des données pour les collectivités territoriales. Que ce soit pour un souci de transparence ou pour mettre à disposition des citoyens des informations essentielles pour le fonctionnement de la collectivité, l’ouverture des données est essentielle désormais dans les collectivités. Les problématiques liées aux données sont de plus en plus nombreuses et les collectivités territoriales comme l’ensemble des acteurs politiques auront de plus en plus de défis à gérer en termes de données. Ce challenge nous a permis de le comprendre de manière moins conventionnelle qu’un cours classique. Mener un projet tel que celui-ci nous a confronté à la réalité de ces enjeux. Enfin, ce nouveau projet de groupe a renforcé notre sentiment d’être plus efficace en équipe. C’est en combinant nos différentes connaissances et compétences que nous avons réussi à surmonter les défis de cette semaine et à aboutir à un résultat dont nous sommes fiers.
L’équipe des MACS Challengers tient donc à remercier la communauté de communes MACS, de nous avoir fait confiance cette semaine pour exploiter leurs données et la team de Datactivists et en particulier Clément, notre référent, de nous avoir accompagné toute la semaine et aidé à faire face aux (nombreuses) difficultés rencontrées.
Une semaine faite de haut et de bas (ci-dessous le graphique représentant nos émotions au cours de la semaine) mais très enrichissante.