Carnet de bord de l’ouverture des données du Pays Saint-Omer - groupe 18
par PERRAUDEAU Charlize, DUVAL Clara, PELEAU Juliette, SALOMON Lucie, SAUNIER Camille, BOLLA Timothee, RENTE NOGUEIRA Diogo
INTRODUCTION
Ce lundi 21 novembre marque le début de la semaine tant attendue du #CHALLENGEDATA !
Nous avons entendu parler de cette semaine tout au long de nos années à Sciences Po et le moment est arrivé… avec beaucoup d’appréhension.
Nous attaquons cette semaine avec un très bon esprit d’équipe, la possibilité de choisir notre groupe nous permet de nous retrouver sur un projet commun et stimulant. Nous avions beaucoup d’appréhension sur le travail attendu cette semaine.
A présent, le travail à effectuer nous semble clair et intéressant. Au départ, nous avions peur de la charge de travail qui semblait être conséquente, mais après avoir divisé les tâches au sein de notre groupe, cela nous semble tout à fait réalisable. Nous avons eu une réunion dans l’après-midi pour collecter des informations avec la collectivité dont nous sommes en charge (la Communauté d’Agglomération du Pays de Saint-Omer), ce qui nous a permis d’avancer dans notre travail, malgré quelques difficultés de collecte de données. Les responsables, avec qui nous sommes en contact, ne nous ont pas donné les informations directement donc nous avons eu la chance de terminer notre journée du lundi pas trop tard, le temps de bien se reposer avant d’attaquer le deuxième jour du challenge data!
JOUR 1 – DIAGNOSTIC
Nous avons commencé la journée par une session d’introduction au Challenge Data par les référents Datactivist, qui nous ont expliqué le déroulement de la semaine et les conseils à suivre. Nous avons poursuivi sur la découverte des ressources à disposition, comme Google Drive qui nous sert de plateforme de travail au fil de cette semaine, et opendatacanvas.org qui détaille les ressources et les méthodes à adopter au jour le jour. Nous avons été affecté à la Communauté d’Agglomération du Pays de Saint-Omer (CAPSO), que nous avons pu contacter dans la foulée sur la plateforme GatherTown après avoir cherché quelques informations préliminaires sur la CAPSO.
Avant l’appel, notre référent Datactivist Allyson nous a fait quelques explications et éclaircissement sur le projet du Challenge Data, nous a clarifié quelques points en amont de l’appel, et nous a accompagné à celui-ci. Nous étions deux groupes (14 et 18) à travailler avec la CAPSO, nous avons donc fait un appel commun avant de se répartir sur deux grands thèmes qui sont ressortis de l’appel suite à la direction donné par le DG de la CAPSO : transports (groupe 14) et environnement (groupe 18), nous permettant d’avoir chacun un référent CAPSO différent et traiter des données complémentaires. Au terme des 45 minutes d’appel, nous avons conclu que la motivation de la CAPSO reposait sur un essai de commencer à publier de l’open data, mais sans avoir de structure ou d’acteurs dédiés à cette tâche, et avait donc besoin de notre aide pour les guider dans cette direction.
Nous avons pu faire la wishlist correspondante au domaine de l’environnement (cf image ci-dessous), que nous avons affiné avec le deuxième appel (voir Jour 2).
JOUR 2 – IDENTIFICATION
En ce deuxième jour challengesque, nous avons pris le taureau par les cornes et nous avons rédigé un mail complet et explicatif à notre interlocutrice. Hier, elle nous avait envoyé en fin de soirée des données pour commencer le travail. Cependant, ces données n’étaient pas directement exploitables parce qu’elles avaient été déjà été traitées.
Pour résoudre ce problème, nous avons appelé nos 3 interlocuteurs du pôle environnement de la CAPSO. Ce deuxième appel a été décisif dans le déroulé de notre journée. Nous avons pu clarifier nos demandes avec beaucoup de tact et diplomatie.
A la suite de cette réunion, nous avons pu obtenir des données brutes, et ce, par communes.
Pour la suite de la journée, toute l’équipe s’est activée à travailler autour de la sélection des bases de données. L’objectif : trier les documents que l’on peut exploiter de ceux qui sont inutiles. Et une fois ce travail accompli, une liste des jeux de données qui semblait être exploitable a été établie:
- Solaire → traité et mis en conformité par Charlize, Juliette et Clara
- Eolien → traité et mis en conformité par Diogo et Clara
- Tri sélectif → traité et mis en conformité par Juliette et Lucie
- Qualité de l’air → recherche de donnés par Lucie et Charlize
- Consommation électrique et gaz → traité et mis en conformité par Lucie et Tim
Évidemment, cette liste était susceptible de changer à tout moment en fonction des informations manquantes découvertes.
Beaucoup de rebondissements, d’appels à passer pour contacter des détenteurs de datas en tout genre. Nous avons eu au téléphone la responsable du traitement des déchets de la CAPSO, la responsable de l’ATMO pour obtenir des données sur la qualité de l’air.
Breaking news : 17h30, Juliette et Lucie se sont rendues compte qu’on pouvait ouvrir un nouveau jeu de données sur les déchèteries de la CAPSO. Il manquait seulement quelques informations pour le rendre exploitable. Pour obtenir ces informations, nous devions entrer en contact avec la direction du Syndicat Mixte Lys Audomarois. Un nom savant pour désigner les responsables des déchèteries.
Cette personne sera contactée le lendemain. Et ce jeu de données remplacera le jeu sur le tri sélectif, qui n’était pas exploitable.
A la fin de cette incroyable deuxième jour, ce n’est pas moins de 4 jeux de données qui seront ouverts. VICTOIRE !
JOUR 3 – MISE EN QUALITÉ
En ce Jour 3 du #Challenge Data, nous sommes comme tous les jours dans les Starting Blocks ! La journée de la veille a été éprouvante, nous reprenons donc du poil de la bête pour nous atteler à une journée intense : celle de la mise en qualité des données.
Notre journée commence par notre traditionnel point matinal, toujours accompagné de viennoiseries : dans le groupe 18, impossible de commencer sa journée sans pains au chocolat. C’est donc le ventre bien rempli qu’après avoir résumé nos avancées de la veille, nous nous répartissons les tâches pour cette journée qui s’annonce chargée.
Pour mettre en qualité nos différents jeux de données, nous avons encore besoin de données supplémentaires afin que nos jeux soient aux normes vis à vis des templates types. C’est là notre tâche la plus difficile. Voici nos différentes avancées pour les 5 différents jeux de données :
-
La consommation électrique et de gaz par commune : Pour ces données, il a été particulièrement difficile de les compléter. En fait, ce jeu est très spécifique et n’étant pas électriciens, nous avons dû faire preuve de persévérance pour comprendre quelles étaient les données manquantes. Nous avons fait appel au chargé de la transition écologique de la CAPSO, qui nous a sauvé en nous envoyant d’autres sources de données qui complètent à merveille les données manquantes. Merci ! Nous avons, ensuite, continué notre travail de standardisation en corrigeant les fautes de frappe notamment. Coup de chance : les données étaient finalement déjà très proches des normes imposées, nous avons donc pu finir la mise en valeur dans la matinée.
-
La qualité de l’air : Ce sera notre seule déception de la journée. Nous avions contacté la veille l’ATMO, entité travaillant avec la CAPSO, capable de nous fournir les données dont nous avions besoin. Sans réponse de leur part, nous les avons relancé dans la matinée. Notre interlocutrice Claudie nous a envoyé plusieurs données, brutes et traitées, mais malheureusement elles étaient inexploitables car pas assez spécifiques. Nous avons demandé à Claudie des données plus précises, commune par commune notamment, mais l’ATMO n’était pas en capacité de nous les fournir. Nous décidons donc de ne pas ouvrir le jeu de données sur la qualité de l’air (RIP).
- Les énergies solaires : Ce jeu de données a été particulièrement facile à traiter ! Les données étaient proches des normes donc après un travail pour compléter les données manquantes, nous avons réussi à boucler la standardisation dès le début de la matinée !
-
Les énergies éoliennes : La mise en conformité de ce jeu de données était relativement simple. Les difficultés étaient de récupérer deux données qui étaient absentes par rapport au template. Néanmoins, après un échange de mail avec le chargé de la transition écologique, cela été récupéré. Également, c’était de savoir quoi garder sur ce jeu de données. Ainsi, nous nous sommes concentrés sur l’année la plus récente pour être le plus actuel et parlant possible. Pour conclure, avec un peu de patience, nous avons réussi à cleaner ce jeu de données avant la fin de la matinée également !
- La fréquentation des déchetteries : grosse surprise de la veille, nous pouvons ouvrir également ce jeu de données ! Hier, nous avions déjà commencé la mise en conformité pour que nous puissions seulement compléter les informations manquantes le lendemain. Nous avons donc contacté le Syndicat Mixte Lys Auderois pour leur demander les informations nécessaires et nous avons fini la standardisation dans la foulée !
Lien du bilan des traitements des bases de données : https://docs.google.com/document/d/13Y9kxfnhTxcvBxUl9_1A4YO7vZhuH5Q1/edit?usp=drivesdk&ouid=112375867797054262680&rtpof=true&sd=true
En résumé : nous avons été particulièrement rapides et efficaces dans la standardisation ! Notre motivation s’explique, sans aucun doute par les allusions d’Allyson sur la présence de champagne vendredi au cocktail… En tout cas, cette avance nous a permis de commencer à travailler sur les problématiques de communication avec la CAPSO dès le début de l’après-midi. Et TIMING PARFAIT, nous avons terminé la mise en qualité juste avant notre point quotidien avec la CAPSO. Pendant notre échange, toujours mené par Camille d’une main de maître, nous avons présenté les quatre jeux de données et nous avons commencé à aborder le sujet de la communication avec la collectivité.
Nous avons également envoyé tous nos jeux de données aux normes à la CAPSO pour qu’elle ait conscience de notre travail et surtout qu’elle valide les données pour la publication ! Bien évidemment, notre travail étant particulièrement qualitatif, la CAPSO nous donne son aval pour que nous publions les données sur data.gouv.fr : ce sera une de nos missions de demain !
Plus généralement c’est une journée riche en fous rires car nous avons su travailler dans la joie et surtout la bonne humeur !
JOUR 4 – PUBLICATION
Jour 4, toujours aussi motivés ! Aujourd’hui, après un petit déjeuner composé de chouquettes et de pains au chocolat, nous nous répartissons les tâches du jour : travailler sur la publication de nos données sur data.gouv et créer un plan de communication pour la collectivité. A 11h, nous avons fait une réunion “Communication” avec le groupe 14 qui travaille aussi sur la CAPSO.
Ainsi, nous nous sommes mis d’accord sur la stratégie à adopter et les médias sur lesquels nous allons publier en accord avec la chargée de communication de la CAPSO :
- Réseaux sociaux (Twitter, Facebook) : Préparation de visuels par Charlize
- Communication interne auprès des collaborateurs de l’agglomération (Intranet, CAPSO news) : Rédaction d’un texte pour expliquer la participation de la Capso au challenge Data par Tim et Juliette
- Communication externe via la presse locale par Camille
- Data visualisation : mise en forme de graphiques et de cartes par Lucie et Juliette
La chargée de communication, nous a laissé le champ libre quant à la forme et à l’apparence des visuels à publier.
Pour la publication des données, la stratégie de publication était assez simple : la publication sur data.gouv.fr. La Communauté d’Agglomération du Pays de Saint-Omer possédait déjà un compte organisation sur data.gouv.fr. La difficulté était de récupérer les accès pour un compte à nous. Ainsi, nous avons contacté l’administrateur de la collectivité sur le site Data-Gouv, qui nous a permis de manipuler le compte de l’organisation et de publier les données.
A partir de là, tout s’est bien déroulé. Il fallait juste répondre aux critères de publication de data.gouv.fr : tout a été correctement mis en forme, notamment à l’aide des fiches descriptives pour chaque jeu de données fait par Tim. L’unique élément que nous ne pouvions pas renseigner était la fréquence de mise à jour car nous ne savons pas si la collectivité va régulièrement mettre à jour. Néanmoins, malgré ça, nos jeux de données ont une qualité de métadonnées vertes, ce qui les rend satisfaisantes.
Nous avons profité de notre avance pour commencer à avancer sur les data visualisation. Juliette et Lucie découvrent alors Khartis, Rawgraphs et Umap. La visualisation cartographique de nos données nous a donné du fil à retordre, notamment car le fond de carte Geogjon de la collectivité récoltés sur OpenDataSoft n’était pas exactement aux normes pour Khartis. Mais après un acharnement sans faille et quelques coups de maître, nous avons réussi à prendre en main ses outils pour réaliser de super cartes !
Url des jeux de données publiés :
https://www.data.gouv.fr/fr/datasets/installation-production-electrique-solaire-par-commune-en-2020/
Publication pour les réseaux sociaux afin de montrer le participation au challenge Data :
Ressources de communication :
https://drive.google.com/drive/folders/1NIcC3ImDE3u4W_hGmZz5FXxNxZAzh4yx
JOUR 5 – VALORISATION
Aujourd’hui, dernière ligne droite ! En cette matinée, nous avons fini nos data visualisations (graphiques, cartes et illustrations) dans l’objectif de rendre plus claires et percutantes nos données. Dans cette datavisualisation, nous avons essayé de garder le même code couleur que celui utilisé par la CAPSO afin que tous nos supports puissent vraiment être utilisés et publiés. Nous avons décidé de réaliser nos datavisualisations à l’aide de Canva, Rawgraphs et Khartis. Chacun de nos jeux de données correspond à une datavisualisation.
Nous avons beaucoup apprécié cette étape qui nous a permis à la fois d’apprendre à utiliser de nouveaux logiciels et notamment Rawgraphs et Khartis, même si nous avons eu quelques difficultés à comprendre leur fonctionnement. Ce sont des logiciels très utiles que nous seront très probablement amenés à réutiliser. Nous avons également apprécié faire appel à notre esprit créatif.
Ensuite deuxième gros travail de la journée : la préparation de notre présentation de la semaine à la collectivité. Nous réalisons cette présentation avec le groupe 14, nous nous sommes donc mis d’accord sur le type de présentation que nous voulions réaliser.
Nous avons décidé de découper notre présentation accompagnée d’un (super) powerpoint en 4 parties :
- Introduction et résumé rapide du contexte du Challenge Data (groupe 14 et 18)
- Résumé de la semaine, accomplissement et difficultés rencontrées pour le groupe chargé des transports
- Résumé de la semaine, accomplissement et difficultés rencontrées pour le groupe chargé de l’environnement
- Présentation du plan de communication externe, interne et sur les réseaux sociaux (Groupe 14 et 18)
Enfin, pendant l’après-midi nous avons également fini la rédaction de nos dossiers de travail à rendre, à savoir le carnet de bord et le plan de communication. Sur notre plan de communication, nous avons regroupé toute la stratégie médiatique, tous nos écrits (posts pour les réseaux sociaux, articles, communiqué de presse, …) tous nos visuels, nos datavisualisations et les explications concernant les datavisualisations.
Nous sommes prêts pour la présentation finale! Mais nous sommes tout de même un peu triste que cette expérience se termine.
Lien vers les datavisualisations :
CONCLUSION
Derniers mots sur cette expérience : nous avons pu avoir de bonnes relations avec la Communauté d’Agglomération du Pays de Saint-Omer. Dès la moindre sollicitation, ils étaient réactifs. Également, nous avons eu une superbe harmonie et unité d’équipe, nous permettant d’avancer rapidement et efficacement. Grâce à ces coopérations, nous avons pu ouvrir pas moins de 4 jeux de données. Les principales difficultés et réussites ont été surtout liées aux jeux de données, concernant les informations manquantes ou leur standardisation. Cependant, la plus belle réussite de cette semaine reste notre travail d’équipe. Cette semaine nous a ouvert les yeux sur la réalité du travail avec les collectivités, sur le rôle des datas et leurs enjeux. Cette semaine nous a permis de développer nos compétences sur de nombreux points. Ainsi, ce challenge a été très enrichissant. Malgré quelques montagnes russes émotionnelles, le résultat est là.
Pour conclure cette expérience, nous tenons à remercier l’équipe Datactiviste et tout particulièrement Allyson, notre référent, pour sa bonne humeur, son accompagnement et sa patience cette semaine. Nous avons passé une semaine chargée, riches en joie et rires mais aussi stress et inquiétudes. Malgré tout, cette semaine de Challenge Data nous a fait sortir de notre zone de confort. Nous avons appris beaucoup sur les données, sur le fonctionnement de la CAPSO, sur l’utilisation de certains logiciels et techniques de travail… Mais aussi, nous avons appris à travailler en groupe, à communiquer avec des professionnels et avec les autres étudiants de la promo !