Skip to the content.

Carnet de bord de l’ouverture des données de Reims

par COSSET Armand, ROIGNANT Keryann, MALENFER Henri, DECOMBE Solene, VOLDOIRE Alexandre, BOCQUET Guillaume, PERROTTE Léa

Introduction

An de grâce 2022, l’équipe 17 de la 5ème édition du challenge data s’apprête à mener l’assaut de la forteresse datatistique de la ville de Reims pour rendre les très saintes données accessibles à la peuplade. Ce bourg de 181 194 âmes où nos rois furent couronnés est une sous-préfecture du département de la Marne. Cette ville située en Champagne est marquée par la culture de la vigne comme en témoigne le nombre de caves où le champagne coule à flot et certains champs de vignes présents dans les limites administratives de la ville.

L’équipe 17 est composée de profils divers: une princesse en master “Culture communication” (Solène, régnant sur le comte de Blois), une chevaleresse en master “Relations internationales” (Léa, comtesse du Vexin), un chevalier en master “Management et finances” (Keryann, héritier du trône des îles du vent) et quatre chevaliers en master “Droit et action publique” (Alexandre comte de Velay, Armand comte de Poitou, Guillaume comte de Carcassonne et Henri comte de Provence). Pour les aider dans leur projet l’équipe 17 est aidée par une membre de la confrérie Datactivist (Magalie, comtesse de Toulouse, de Damas et protectrice du royaume des données) par les équipes de la mairie de Reims (La Cheffe de projets Laboratoire d’Innovation au pôle services urbains et par différents agents de la ville des espaces verts, de l’information géographique).

Le projet du challenge data est de travailler (nettoyer, mettre en conformité, etc.) avec des données fournies par des collectivités et que ces données soient ouvertes (publiées en accès libre). Cette année les équipes du Challenge data doivent travailler les données en lien avec la transition écologique.

Leurs armes numériques en poche (7 ordinateurs, 7 smartphones, 3 paires d’écouteurs bluetooth et un enrouleur multiprise), l’équipe 17 lance l’assaut.

JOUR 1 – DIAGNOSTIC

A 10h30, on a commencé à travailler sur la ville de Reims. Guillaume est choisi comme porte-parole, on prépare des questions pour l’interlocutrice, Diane D-J, chargée du laboratoire. 11h30, rendez-vous sur Gather, avec Christine M, de la direction des espaces verts et Elodie M, travaillant au Service Ressource Information Géographique chargée du Grand Reims. Elles nous expliquent l’intérêt de l’open source, de fournir des données aux citoyens pour leur information professionnelle ou personnelle. Depuis la loi open data de 2016, appliquée en 2018, la ville diffuse petit à petit ses données, mais surtout sur la transition écologique. On nous conseille d’aller sur le site data.gouv.fr pour explorer les données déjà publiées par la ville de Reims. Madame Lombard nous explique ce qu’elle attend de nous : des données sur les arbres, le Plan Canopée et les espaces verts. A nous de fouiller dans les données ouvertes et fermées. L’intérêt des arbres étant la réduction de la température en ville. Reims n’est pas à la pointe de l’open data, tous ses agents n’y étant pas formés et ne possédant pas de plateforme d’open data. A 11h53, le rendez-vous prend fin, on regarde les données que l’on a à partir de la wishlist.

A 13h40, on a reçu des données de la part de la ville sur wetransfer, mais qui sont très incomplètes. On regarde les données, Magalie nous aide un peu. On prépare des questions pour avoir des données qui nous manquent. À 15h42, on fait le deuxième appel, mais Elodie nous répond que nous devons créer de la donnée, et qu’elle ne peut rien nous fournir de plus. Elle nous propose de compter des arbres à partir des photos aériennes.

Elle nous conseille de regarder sur la plateforme atmo pour se renseigner sur la qualité de l’air, et qu’il faut inclure des données sur les parcs et squares pour la Direction des espaces verts. 15 minutes plus tard, nous mettons fin à l’appel, et recherchons des données afin de publier quelque chose d’inédit, qui n’a jamais été publié. Mais nous manquons de sources et de cadre, car nous avons très peu de données disponibles.

L’équipe 17 est motivée !

“Rendre visible l’invisible”

JOUR 2 – IDENTIFICATION

9:30: début de la journée de recherche de data, installation de la multiprise et prise de café

Élaboration d’un début de mind map sur le site “MindMup”

Une équipe motivée….

et studieuse!

Un exemple de jeu de données traité aujourd’hui: les fontaines de la ville

Arrivée à 8h45. Toute l’équipe est très motivée pour cette journée, après une journée de prise de connaissance sur les attendus du challenge. Aujourd’hui, le but est de trouver et identifier les données : demander à différents services les données de notre wishlist. Ensuite, nous allons nettoyer les jeux de données reçues, les ouvrir et en faire un organigramme (mind map).

Après la réunion préparatoire générale, nous commençons à travailler à 9h30, en établissant dans un premier temps notre programme de la journée. Nous avons un rendez-vous en ligne avec notre référente à la mairie de Reims pour faire le point. Première difficulté de la journée, Christine M., notre seconde interlocutrice à la mairie, à répondu à notre mail d’hier :

Elle désire que nous terminions les îlots de chaleur de la ville de Reims, mais nous ne sommes pas en mesure de produire cette donnée. Nous avons par conséquent recherché des données sur les îlots de fraîcheur (parcs, plans d’eau, espaces arborés). Nous recherchons aussi en parallèle d’autres moyens d’obtenir de la donnée, sur les sujets que nous avons déterminés la veille : les espaces verts et les arbres. Alexandre s’occupe des recherches sur la qualité de l’air : les recherches sont malheureusement infructueuses, malgré de nombreux efforts.

10h20 : nous avons déjà avancé : on a pu mettre la main sur une carte répertoriant les arbres dans la ville de Reims, et un organigramme nous donnant le nom du directeur des espaces verts de Reims : Eric L. Par ailleurs, Guillaume a pu mettre la main sur un article de presse écrit par Eric L qui informe du nombre d’arbres en 2021 à Reims : environ 26000 arbres. Nous envisageons de le contacter. Aussi, une partie du groupe recherche des données sur les zones humides, et sur la pollution de l’air selon les quartiers. Finalement, après avoir contacté à nouveau Diane DJ, nous apprenons que Eric L sera présent pour la réunion de 14h. Le groupe finit la matinée en répertoriant les questions à poser pour la réunion du début d’après-midi.

A midi, le groupe part en pause déjeuner, après une matinée pleine de rebondissements.

14h : appel avec Christine M, Diane D-J et Eric L, directeur des espaces verts de la ville de Reims. D’où provient la donnée de 26000 arbres dans la ville de Reims ? Eric L : la ville dispose d’un inventaire d’arbres d’alignement dans la ville : 26000, mais cela ne comprend pas les arbres dans les parcs, squares, etc. Eric L nous a expliqué que le vrai travail de données qui doit être fait est un travail sur la surface recouverte par les arbres. Il faut s’intéresser aux parcs, plus qu’aux arbres. On a proposé le projet de faire une carte interactive sur la disposition des arbres à Reims, pour la rendre accessible aux habitants. Il faudrait avoir des informations sur la couverture arborée dans les parcs. Le meilleur moyen pour cela est de digitaliser des photos de 2022, de plan aérien des espaces verts de la ville. Nous pouvons au moins ajouter la présence des points d’eau sur la carte. Un rendez-vous pour faire le point est pris pour demain, 11h30.

14h30 : parmi les jeux de données fournies par la mairie, le document répertoriant les parcs de la ville ainsi que leurs adresses comportent des fautes au nom des rues. C’est un problème qui nous complexifie la tâche et nécessite de vérifier avec rigueur chaque information du document. Solène réalise en parallèle un mind map/ organigramme qui synthétise les données étudiées par chacun.

15h10 : Le groupe admet à l’unanimité que le problème majeur rencontré aujourd’hui est la lenteur de la connexion internet, qui ralentit grandement notre travail. Léa et Henri cartographient la surface des arbres par rapport aux parcs. Une compétition saine centrée sur le comptage des arbres à dynamiser leur travail ! Keryann s’occupe des données sur la localisation des parcs, Alexandre, Armand et Guillaume traitent la cartographie des points d’eau. Solène cherche sur le site Landsat 9 data, des données sur la qualité de l’air, et des données diverses. La recherche s’est révélée malheureusement infructueuse…

JOUR 3 – MISE EN QUALITE

Jour 3 : début du briefing à 9:05, l’objectif du jour est le nettoyage des jeux de données en uniformisant, supprimer les données inutiles et les aplatir, les standardiser. Pourquoi ? On doit rendre les données utiles, faire un bon format open data qui puisse être utilisé, la ville doit pouvoir les télécharger pour les utiliser. On commence par regarder les vidéos du jour 3 sur open data canvas pour comprendre nos objectifs.

Henri et Léa reprennent leur tâche d’hier qui consiste à entourer les arbres dans les parcs de Reims, pour voir les parcs ombragés et ceux très ensoleillés. Le dicton du jour : il vaut mieux trop d’arbres que pas assez ! On utilise Umap et l’option d’édition “polygones”, avec un calque pour les arbres par dessus le calque avec les parcs (issu des données de la mairie).

Keryann arrive vers 9:40 avec une cheville tordue et 8 croissants pour motiver les troupes. ll bosse sur les coordonnées géographiques des parcs et des squares et complète le document Excel donné par la mairie. Il utilise openstreetmap pour les trouver à partir de leurs adresses.

Guillaume a reçu le document de la mairie sur les fontaines mais Solène n’arrive pas à ouvrir le document. On le met sur le drive, les data sont désorganisées.

Alexandre et Armand tentent de télécharger l’application de cartographie qgis, mais il y avait un bug après l’installation que Magalie a résolu. Ils s’intéressent ensuite aux données sur les fontaines : le document de google street map ne correspond pas à celui donné par la mairie (5 fontaines manquantes). L’objectif d’Alexandre est de mettre les coordonnées des fontaines sur une carte umap, ce qui s’avère particulièrement complexe.

Réunion à 11:30 entre Guillaume et les responsables de la mairie (Solène prend en note la réunion) : elles nous parlent du projet du maire de connaître la couverture boisée de Reims et s’assurer que chaque habitant ait un parc à moins de 300m de chez lui. Notre travail sur la canopée s’inscrit dans cette politique. Elles vont nous donner des informations plus précises sur les fontaines, entre les fontaines d’eau potable et celles décoratives ou pour l’amusement des enfants.

Reprise du travail à 14h : on commence à nettoyer et standardiser nos jeux de données. On cherche les 5 fontaines manquantes à l’aide de google street view, c’est un travail assez long mais la mairie souhaite des données complètes.

Cours sur Qgis : Une nouvelle quête attend nos chevaliers de l’équipe 17, elle se nomme qgis. Magalie nous montre comment utiliser ce site de cartographie à partir des données récoltées par Henri et Léa sur la couverture boisée des parcs, on voit les bases de son utilisation pour faire une carte.

On crée un dossier “Données clean” pour mettre les documents en csv et geojson qui ont été triés et standardisés dans la journée par toute l’équipe. Ci-dessus, la Carte umap de l’espace canopée (en bleu) de Reims.

JOUR 4 – PUBLICATION

Début de journée avec une citation inspirante de Guillaume:

“Je n’aime pas les chiens et le café mais j’aime ma mère et la France”

9h45: Début de journée et assignation des tâches, aujourd’hui nous devons finir de “clean” les jeux de données, établir un plan de communication à proposer à notre commune et lui créer un compte Data.gouv (s’ils n’en ont pas déjà un). Armand et Alexandre se concentrent sur le référencement des fontaines de Reims, aidés par un jeu de données envoyé par la collectivité plus tôt dans la matinée à Guillaume.

10h30: Solène s’attaque au plan de communication et tente d’établir des conclusions sur les réseaux sociaux et journaux de la ville de Reims pour trouver les meilleurs vecteurs d’information. Henri rédige l’introduction du journal de Bord. Léa et Keryann s’attèlent aux fiches descriptives, quand Guillaume crée notre compte Data.gouv et demande l’accès au compte de la Ville de Reims. La matinée se déroule bien et comme prévu, pas d’embuches.

11h30: Appel quotidien avec les référents de la collectivité. Nous posons des questions sur leurs attendus au niveau de la communication et quels sont leurs vecteurs d’informations favoris en règle générale. Nous en profitons pour donner l’état des lieux de notre travail ainsi que pour demander des dernières informations quant aux données que nous allons, plus tard dans la journée, publier sur Data.gouv. Henri et Léa présentent la carte que nous avons créée aux référents sur Zoom. On apprend que la ville de Reims et le Grand Reims sont plus liés que nous le pensions, nous allons donc publier les jeux de données sur data.gouv via le compte du Grand Reims. Pour ce qui est de la communication, on nous confirme la faible possibilité de publier dans les journaux connus de la région mais la forte présence sur les réseaux sociaux (notamment le compte Facebook et instagram de la ville de Reims) ainsi que sur le site de la ville.

12h40: Pause déjeuner (crucial)

14h00: Retour, répartition des tâches de l’après-midi: Solene travaille sur le plan de communication et crée le logo qui sera proposé à la diffusion sur les réseaux sociaux de la ville pour appuyer le texte de présentation du projet carte interactive et open data (prototype non définitif ci-contre). Henri continue l’introduction du carnet de bord. Léa et Keryann finissent les fiches descriptives des jeux de données, quant à Armand et Alexandre ils finissent la fiche du jeu de données concernant les fontaines. Guillaume rédige la conclusion du journal de bord. Nous avançons sur les objectifs de la journée dans la bonne humeur.

15h15: Debriefing sur le plan de communication sur lequel Armand et Solène ont travaillé, l’équipe s’accorde sur l’insertion du logo de Reims dans sa police telle que diffusée sur les différents réseaux de la ville. L’objectif maintenant est de trouver un slogan ou un titre à notre projet (carte interactive + informer sur l’Open data).

15h45: Plan de communication presque établi: diffusion du logo + texte explicatif/ vidéo explicative du projet sur instagram et Facebook, tweet informatif rapide sur Twitter. La ville de Reims est bien suivie par sa communauté sur ses réseaux (leur Facebook est suivi par 79K personnes) donc l’accent sera plutôt mis sur Facebook. Un article sera aussi transmis aux citoyens via la newsletter du site internet de la ville.

Projets visuels finaux, l’un plus sombre pour être diffusé sur Twitter/ newsletter, l’autre plus coloré pour Instagram et Facebook. Autre proposition: Stand situé dans la ville de Reims, pourquoi pas devant la Cathédrale (parce que place centrale et visitée par beaucoup de citoyens), prise de contact avec la population, explication de ce qu’est l’open data de manière ludique et initiation à la participation à la carte intéractive sur des Ipads.

Les étapes de réalisation de notre travail :

JOUR 5 – VALORISATION

Débat présidentiel du groupe 17: Toboggans ou pas toboggans?

H-7 avant rendu : Vendredi 10h marque le début de la dernière journée de bataille de la forteresse datastistique aidé par une fierté de la France: des croissants. Comme lors des jours précédents, nous finalisons les différents travaux de la veille dont principalement le calcul de la surface d’ombrage et la réponse au questionnaire d’Allyson. L’appel quotidien avec la collectivité se passe assez bien même si nous n’avons pas pu leur soutirer un engagement de diffusion du fruit de notre travail (béni). Dans le domaine fermé qu’est la communication avec les collectivités, Guillaume se perfectionne à tel point qu’il devient un poisson dans l’eau. Cette expérience va-t-elle mener à une reconversion professionnelle? Rendez-vous dans quelques années. Ils nous ont quand même rappelé leur désir de faire figurer les données de l’ombrage des espaces verts.

H-6 avant le rendu, le débat commence : Avant la pause tant attendue du festin du midi, beaucoup de rebondissements : Léa commence le travail autour de la finalisation des supports topographiques, aussi appelées cartes. S’ensuit un grand débat acharné entre Léa secondée par Magalie contre Keryann déterminer à faire figurer les données des jeux pour enfants et les espaces verts dans la même carte. Aucun débatteur ne voulant lâcher l’affaire face à l’ennemi, démontre ses arguments à base de démonstrations et d’illustrations. Après un échange très long d’environ 5 min, un des parties s’est incliné face à l’adversité provoquant la séparation des cartes.

H-5 avant le rendu : Henri après avoir passé toute l’après-midi d’hier à calculer ligne par ligne la superficie ombragée des parcs a été très enchanté lorsque Magalie lui a annoncé qu’il avait seulement à étirer la formule de son tableau pouvant résumer un travail de 4h à seulement 4 minutes. Il a même tenté de remettre en question ses paroles à base de “non je pense pas que ça marche”. La moralité de l’histoire est: Excel c’est important.

H-4 avant le rendu: pause déjeuner en prenant connaissance des infrastructures saint-germanoises.

H-1 avant le rendu, le stress s’installe: L’heure de la réunion approche, tout comme notre stress. Nous vérifions les derniers détails et nous nous rendons compte que les dernières données envoyées par Reims sont fausses: les coordonnées des jeux à eau ne sont pas sous le bon format rendant ses dernières fausses. Léa est sur la fin de la mise en œuvre des cartes et nous préparons les slides de présentation. Nous paniquons tous un peu, les cartes ne sont pas terminées à cause du format des données des jeux d’eau qui n’étaient pas uniformes. Les autres groupes présents avec nous ont terminé. Leur session d’entraînement, 30 min avant l’heure fatidique, se passe super bien. Il faut avouer que nous avons peur de ne pas être dans les temps. Bref, Guillaume stresse; nous stressons.

H-H, le compte rendu, c’est maintenant: Notre session d’entraînement est coupée de cours lorsque la sonnerie de 17h retentit. Nous avons pu finaliser l’ensemble des rendus, les cartes sont prêtes ainsi que la trame de la présentation de notre travail. Nous nous connectons et tous les interlocuteurs Rémois de notre semaine sont présents. Nous arrivons à présenter l’ensemble de nos travaux que nous trouvons clairs. Personne ne s’est emmêlé les pinceaux et malgré quelques remarques du côté de la ville de Reims concernant par exemple les surfaces géométriques des cartes, ils ont quand même pris en compte le temps restreint pour réaliser le travail.

Nous sommes très contents de nous et remercions Magalie pour cette super semaine. (Malgré les soldats partis vers d’autres contrées, nous avons fêté notre victoire autour d’un calice de jus de pomme.)

Les cartes interactives, disponibles ici :

CONCLUSION

Nous avons pris part au Challenge data ce lundi 21 novembre à 8h45, tel sept mousquetaires un peu perdus, nous plongions dans l’inconnu. La ville de Reims, Diane DJ, Elodie M et Christine L et Eric L nous attendaient. L’aventure commençait sur les chapeaux de roue avec un entretien au bout d’une heure de travail. Christine L orientait notre travail sur les arbres, cela nous donnait un premier cap, dans le même temps. Au cours de cette première rencontre Diane D. nous explique l’intérêt pour la municipalité de l’open source. Celui-ci est de fournir des données aux citoyens pour leur information professionnelle ou personnelle. Depuis la loi pour une République numérique du 7 octobre 2016 entrée en vigueur en 2018. Notre objectif est de publier quelque chose d’inédit de « créer » de nouvelles données ouvertes qui serviront le bien commun. A dix heures et demie, nous avons commencé à travailler sur la ville de Reims. Guillaume est choisi comme porte-parole, on prépare des questions pour l’interlocutrice, Diane DJ, chargée du laboratoire. 11h30, rendez-vous sur Gather, avec Christine L de la direction des espaces verts et Elodie M, travaillant au Service Ressource Information Géographique chargée du Grand Reims. Ces trois mousquetaires à la recherche de la data perdue (ou inexistante) comme Proust il y a un siècle seront nos interlocutrices. Nous les verrons chaque jour en fin de matinée. Notre production s’est nourrie de ces échanges féconds parfois teintés d’incompréhension. Lors des deux premiers jours nous avons eu du mal à rassembler les jeux de données qui constitueront à partir du mercredi 23 novembre le socle de notre travail. Nous ne savions pas quelles étaient les données les plus pertinentes que nous pouvions utiliser. Des informations éparses étaient disponibles sur internet mais celles-ci demeurent difficilement exploitables, nous avions du mal à comprendre ce que la ville attendait de nous. Le Comte de Carcassonne semblait être le plus perdu de l’équipe, les Cathares attaquaient son fief, l’absence de data dans la ville de Reims et la mauvaise connexion internet (sans doute brouillée par les hérétiques cathares) constituaient leur meilleure arme. Guillaume Bocquet, ce petit homme devenu Comte de Carcassonne à la suite d’un malheureux concours de circonstance, n’était qu’un lointain arrière petit neveux du précédent Comte nullement préparé à cette fonction, il était fainéant et limité, pour lui la vie n’était qu’amusement et il se trouva fort dépourvu lorsque la guerre des données fut venue.

Le mardi 22 novembre, la bataille de l’opendata faisait rage et tournait aux désavantages de nos sept héros, le Comte de Carcassonne était au plus mal. A trois heures passés de dix minutes le Soleil était au zénith comme à Austerliz et la cité s’apprêtait à être prise jusqu’au coup d’éclat stratégique de la Comtesse du Vexin Léa Perrotte et du Comte de Provence Henri Malenfer qui grâce à leur utilisation exceptionnelle de l’outil umap qui a permis de prendre les cathares à revers en deux heures de temps. Cette bataille constitue l’une des rares où nos héros ont eu l’impression de faire fausse route, à l’issue de cet affrontement, le Comte de Carcassonne Guillaume Bocquet avait perdu la foi dans la capacité du groupe à collecter, nettoyer et recréer de la donnée, blessé et rendu infirme à l’issue de la journée du 22 novembre, il était heureusement accompagné d’une valeureuse équipe prête à se tout pour collecter de la data pour le roi Robinet. Après cinq jours de résistance à des assauts répétés qui lui ont permis de sauver son fief face à l’hérésie des données fermées qui se faisait de plus en plus menaçante. La ville de Reims a progressivement rassemblé les données qu’elles disposaient émanant de différents services relatifs aux espaces verts et aux points d’eau. Le Comte de Carcassonne qui est désormais vieux monsieur déclare : « une fois que le nettoyage des jeux de données fut réalisé notre mission nous sembla beaucoup plus claire, à partir de cet instant nous le savions, nous arriverons, cela serait encore difficile, nous passerions certainement par quelques nouvelles tribulations mais nous allions réussir rien ne saurait nous empêcher d’accomplir notre mission comme nous le répétait la Comtesse de Toulouse ». Tout avait changé ce mardi 22 novembre, Eric L responsable de la direction générale des espaces verts à la mairie de Reims avait expliqué à l’équipe que le vrai travail de données était un travail concernant la taille de surface arborée dans les parcs municipaux. Après une consultation des sept guerriers où le Comte de Carcassonne toujours blessé n’eut la force de prendre la parole, l’équipe a décidé à l’unanimité de réaliser une carte interactive sur la disposition des arbres dans les parcs municipaux de la ville de Reims pour rendre cette information accessible aux habitants (information utiles notamment en période de canicule comme lors de l’été 2022).

Le 24 novembre, les premières tensions apparaissent dans l’équipe, la Comtesse de Blois était chargée du plan communication et tout le monde n’était pas d’accord, ils finirent par trouver un point d’accord et livrèrent leur donnée le lendemain à l’heure dite. Le Comte de Provence déclare : « Notre objectif à travers cette carte interactive à laquelle nous avons joint quelques graphiques était de produire de la donnée au service des citoyens rémois pour qu’ils puissent voir où se trouvent dans les parcs les espaces verts, les espaces boisées et les équipements de jeux pour enfants. Notre carte est partielle et a vocation à être complétée par la suite. Nous avons privilégié le format de la carte interactive car cela permettrait à chaque rémois de s’investir dans ce projet cartographique en ayant la possibilité d’œuvrer à son exhaustivité ». Cette data nouvelle fut remise entre les mains du roi Robinet, les cathares furent vaincus. Nos sept héros furent faits citoyens d’honneur de la ville de Reims. Ils ont livré de nombreux autres combats datatistiques à travers le monde. Ils vécurent heureux et restèrent amis pour toujours. S’il y a bien une morale à tirer de cette histoire c’est que les plus belles amitiés se forgent dans la difficulté des data et les épreuves.