Carnet de bord de l’ouverture des données de Rouen - par le groupe 5
par NEUTELINGS Lucas, BADUEL CRISPIN Margot, CHAUMONT Chloé, DE CHARETTE Pierre, GUIAVARCH Juliette, CHERCHOUR Etienne
JOUR 1 – DIAGNOSTIC
Pour cette cinquième édition du Challenge Data, notre équipe travaille sur l’ouverture des données de la ville de Rouen, en Seine-Maritime (76). Chef-lieu de la Normandie, Rouen compte 107.000 habitants et 2.000 agents. Étant une ville de taille importante, il nous semblait que Rouen était un espace tout à fait propice à la problématique de l’ouverture et du traitement des données.
Après une réunion générale (et matinale), notre équipe commence à s’approprier la documentation du jour et à se familiariser avec les outils qui seront les nôtres durant toute la durée de ce challenge. Un café et une vidéo explicative plus tard, nous sommes déjà en mesure de contacter notre interlocutrice, Cheffe de projet Transition Écologique. En attendant sa réponse, nous avons chacun étudié le catalogue de données selon les différents niveaux de maturité, afin de se familiariser avec les divers jeux de données. Nous nous sommes rapidement positionnés sur les données catégorisées sous le label Environnement, énergie, logement – en lien avec les considérations de notre interlocutrice. Première difficulté rencontrée : nous ne sommes pas seuls sur le dossier rouennais ! En effet, le groupe 4 est également chargé de traiter et d’ouvrir les données de la ville de Rouen.
Ainsi, dès 11:30, nous avons été en mesure de rencontrer notre interlocutrice via Gather, afin d’échanger avec elle. Le groupe 4 s’est d’abord occupé de récupérer les informations sur les caractéristiques et les besoins de la Collectivité en posant les questions prédéfinies. L’entretien a été intéressant à plusieurs égards :
- D’abord, il s’est avéré que notre interlocutrice n’était pas nécessairement familiarisée avec la notion d’open data. Cependant, elle avait déjà eu l’occasion de travailler sous des directions plus sensibles au sujet. De plus, la ville étant sur le point d’accueillir un responsable data dès l’année prochaine, un certain nombre de formations sont déjà en cours de réalisation.
- Ensuite, les motivations de la ville de Rouen à ouvrir et traiter leurs données étaient éloquentes.
- Tout d’abord, une obligation légale des communes d’ouvrir leurs données sur certains domaines tels que les délibérations, pour favoriser une transparence démocratique. À ce sujet, les délibérations sont déjà accessibles sur le site en open data, d’après notre interlocutrice.
- La volonté de communiquer les données sur un certain nombre de sujets, notamment celui de la transition écologique, constitue une seconde motivation.
- Enfin, la ville de Rouen mentionne une motivation liée à l’organisation interne de la collectivité. En effet, plus de 2.000 agents sont répartis sur l’ensemble de la ville de Rouen, mais les directions restent éparpillées. Ainsi, une réelle chasse aux données est forcée de s’opérer en interne régulièrement. Il s’agit donc de mieux optimiser le travail sur la collecte des données et de faciliter le travail entre les directions – c’est-à-dire de ne pas perdre de temps. Il manque pour une meilleure organisation en matière de communication un outil général pour que chacun soit sur une même base.
- En résumé, l’idée est de travailler sur le volet interne, puis de mettre à disposition du public en fonction de l’avancée – c’est-à-dire à destination des citoyens. C’est un véritable travail de communication, car les données brutes sont indigestes – ni parlantes, ni ludiques. Il s’agit d’un vrai enjeu pour le volet de transition écologique aujourd’hui, selon notre interlocutrice. La ville de Rouen est ainsi motivée par le désir de communiquer autour des grands enjeux contemporains.
À ce titre, la ville a déjà commencé un travail d’open data sur certaines problématiques telles que la cartographie des cimetières à destination du personnel d’abord, mais qui a vocation à servir les citoyens – par exemple en accédant via son smartphone à la localisation de chaque tombe si aucun gardien n’est présent, etc. Notre interlocutrice note une pression au niveau des élus d’avancer sur les questions d’ouverture des données – ce qui justifie le travail qui s’ébauche actuellement en interne.
Cependant, notre interlocutrice n’est pas en mesure de nous renseigner sur les canaux de diffusion et de standardisation utilisés. La question d’open data reste assez nouvelle et complexe pour les collectivités en général. C’est à ce moment-là que nous nous sommes rendus compte de la composante challenge du Challenge Data. À la suite de ce questionnaire, la note attribuée à la ville de Rouen était de 32, c’est-à-dire un niveau de maturité égal à 1 – proche du palier 2 cependant.
Dans la seconde partie de l’entretien, nous avons présenté à notre interlocutrice les jeux de données possibles. Nous avons ciblé en premier lieu les données relatives à la question de l’écologie. Cependant, il a été compliqué d’établir une wishlist précise et claire : notre interlocutrice déclarait ne pas avoir en sa possession la plupart des données ou sous des formes non adaptées. Plusieurs catégories de jeux de données, étrangers au catalogue initial, ont donc été proposées.
Le plus gros casse-tête arrive après le repas : établir la wishlist. On a essayé d’établir une liste d’une vingtaine de jeux de données pour les deux groupes. Comme peu de catégories de données ont été retenues lors de l’entretien, nous avons décidé de proposer d’autres catégories pouvant être intéressantes. Ainsi, nous avons retenu les besoins de notre interlocutrice tout en intégrant des propositions annexes selon le catalogue proposé. Entre temps, la Cheffe de projet Transition Écologique nous a envoyé via un lien WeTransfer des données – qui allaient d’un powerpoint à des Excel plus ou moins exploitables. Pour réorienter notre interlocutrice, nous avons envoyé un mail d’explication plus clair en demandant d’effectuer une hiérarchie dans nos jeux de données proposés dans la wishlist, ainsi que de nous fournir les contacts des services concernés.
Le mail de réponse est arrivé une heure plus tard. La plupart des jeux de données dépendent de la métropole et non de la ville – et sont donc impossibles à récupérer. Les autres jeux de données sont inexistants selon notre interlocutrice, ou inexploitables (par exemple une carte en pdf). Finalement, peu de jeux de données sont exploitables et pertinents – et davantage en sachant que nous sommes deux groupes à travailler sur la ville de Rouen. Ainsi, il conviendra demain de perfectionner la wishlist en déterminant les données assez solides pour être exploitées. Un problème après l’autre !
Notre wishlist dûment complétée
JOUR 2 – IDENTIFICATION
Après une première journée de datactivité et une petite nuit, nous sommes de retour en salle médiane tôt ce matin, car les data n’attendent pas. Nous assistons au briefing de nos référents et, dès 9:30, nous commençons à analyser et séparer les données, en collaboration avec nos camarades du groupe 4. Nous nous sommes positionnés sur la part des véhicules à faible émission dans le renouvellement d’un parc ; la consommation des bâtiments en eau ; et l’émission GES des agents. Chacun travaille sur un jeu de données en binômes, afin de compléter la wishlist et d’évaluer les travaux à venir.
On remarque rapidement que les jeux de données nécessitent un nettoyage, une compilation et une standardisation quasiment systématique. Lors de l’évaluation, nous décidons d’ouvrir ces trois jeux de données malgré les difficultés rencontrées. Nous sommes plus ou moins contraints d’ouvrir ces données : effectivement, il y avait peu de données exploitables parmi les propositions faites à notre interlocutrice. Ce problème se renforce sachant que nous sommes deux groupes à travailler sur la ville de Rouen et à pâtir de ce manque de données. Nous choisissons donc d’ouvrir ces trois jeux de données sus-cités, qui restent corrects.
Une fois l’évaluation faite et la structure des données analysée, Juliette, Margot et Lucas réalisent l’organigramme de la ville de Rouen sous la forme d’une mindmap. Ils choisissent d’inscrire la wanted data list du groupe 4 également, tout en mettant en avant notre propre wanted data list avec des couleurs. Notre mindmap reste assez partielle : effectivement, notre interlocutrice ne souhaite pas nous communiquer le nom des autres services impliqués. Toutes nos données dépendent donc du bon-vouloir et de la coopération de notre interlocutrice. Cependant, chaque groupe dispose d’assez de jeux de données à ouvrir pour que ce Challenge soit utile et agréable.
Notre mindmap de la répartitions des jeux de données
Après avoir finalisé la mindmap (voir ci-dessus), chacun reprend son travail sur les jeux de données. Nous avons décidé de nous avancer pour la journée du lendemain : chaque binôme commence ainsi à compiler et nettoyer les données. Cette opération prend du temps, tant les données sont éparpillées. La plupart du temps, nous opérons à la main pour recréer un Excel distinct avec les données utiles. Nous exportons ensuite nos jeux de données en format .csv avant de les importer sur le Google Sheets, dans les templates associés.
Nous nous sommes ensuite demandés si nous pouvions ouvrir un nouveau jeu de données. Datamotivés, nous décidons d’ouvrir le jeu de données accessibilité des bâtiments pour les personnes handicapées. Les données sont propres et nécessitent peu d’intervention de notre part : nous choisissons ainsi d’ouvrir un quatrième jeu de données pour permettre une ouverture des données plus complète et utile aux citoyens. Nous incluons ce jeu de données dans notre wanted data list, que nous allons soumettre lors de notre rendez-vous avec notre interlocutrice à 15:30.
La wanted data list que nous soumettons à notre interlocutrice rouennaise
Notre wanted data list comprend ainsi quatre jeux de données :
- La part des véhicules à faibles émissions dans le parc. Ce jeu de données est analysé par Lucas.
- La consommation des bâtiments en eau. Ce jeu de données est analysé par Chloé et Étienne.
- Émissions GES des services de la ville. Ce jeu de données est analysé par Margot et Juliette.
- Accessibilité des bâtiments pour les personnes handicapées. Ce jeu de données est analysé par Pierre.
Chacun continue sa remise en forme des données, tandis que Juliette essaye de trouver des modèles d’open data d’émissions GES de la ville de Paris. On trouve des données assez partielles en open data sur un rapport de la ville de Paris, ainsi qu’un type de standardisation pour notre jeu de données issu de l’ADEME. On trouve également des visualisations très intéressantes qui nous aident à appréhender notre quatrième journée.
- https://cdn.paris.fr/paris/2020/02/06/dc2edb10d13ae050815850f721f5a837.pdf
- https://www.data.gouv.fr/fr/datasets/bilans-demissions-de-ges-publies-sur-le-site-de-lademe-1/
Nous préparons ensuite notre entretien avec notre interlocutrice, afin de lui soumettre notre wanted data list et lui présenter notre méthode. On se prépare à être diplomatiques sur les conseils de notre coach Clément ! Après cet entretien, nous pourrons lui faire parvenir notre organigramme. Nous espérons que notre chasse aux données lui conviendra et que notre wanted data list sera pertinente pour la ville de Rouen !
L’entretien terminé, nous pouvons débriefer. Notre interlocutrice nous a d’abord invités à contacter la Direction des Systèmes d’Informations (DSI) afin de savoir si les jeux de données dont nous disposons peuvent être publiés en open data. Elle a ensuite mentionné les difficultés administratives à publier des données parfois non conformes aux réglementations, notamment par crainte de représailles de la part de l’État. Aussi, certains jeux de données contiennent des informations sensibles (noms, adresses, etc.) qui ne peuvent pas être publiés en open data, nous obligeant à altérer les données. Néanmoins, il semblerait que trois jeux de données (la part des véhicules ; les bilans GES ; et la consommation des bâtiments en eau) puissent être publiés en open data – et, pour certains, servir de standard aux autres collectivités. L’entretien s’est donc bien passé. Nous décidons maintenant de contacter la DSI. Nous ne savons donc pas pour l’instant si nous pouvons poursuivre l’ouverture des données de l’accessibilité des bâtiments aux personnes handicapées - le quatrième jeu de données que nous souhaitions ouvrir. De même pour les autres jeux de données, dont nous ne sommes pas véritablement certains qu’ils peuvent être ouverts et publiés.
Présentation de la wanted data list à notre interlocutrice sur Gather
JOUR 3 – MISE EN QUALITE
En ce troisième jour du Challenge Data, nous continuons de travailler sur nos jeux de données respectifs, en se concentrant maintenant sur la mise en qualité. Margot et Juliette finalisent la compilation du jeu de données des Émissions GES en rajoutant certaines colonnes jugées pertinentes, telles que l’incertitude de valeur, de facteur d’émission et l’incertitude totale. Après avoir commencé à rentrer les données à la main, nous trouvons un moyen de copier puis coller les valeurs des données uniquement, sans les formules (grand gain de temps !). Après avoir terminé la mise en qualité de ce jeu de données, nous nous avançons sur les tâches à effectuer pour demain, telles que les fiches descriptives des jeux de données.
Quant à Lucas, celui-ci tente d’adapter le jeu de données Part des véhicules à faible émission dans le renouvellement d’un parc. Il rencontre cependant la difficulté suivante : le template proposé est peu utilisable, dans la mesure où elle n’a pas forcément à voir avec les données qui lui ont été envoyées par la ville de Rouen. Lucas tente alors de voir ce qui peut être utilisé. Il doit reprendre chaque donnée et les classer par année, mais également effectuer et insérer des calculs à la main concernant les véhicules.
Pierre, qui travaille sur le jeu de données de l’accessibilité des bâtiments pour les personnes handicapées, se concentre ce matin sur la récupération des données qu’il va utiliser pour affiner et préciser son jeu. Il anticipe également les tâches de demain en cherchant les latitudes et longitudes des adresses des lieux de travaux. Ces données ont par la suite été converties dans une carte sur uMap OpenStreetMap pour qu’elles puissent être lisibles par les associations ou les personnes handicapées elles-mêmes.
Étienne et Chloé s’organisent sur le jeu de données de consommation d’eau et du bâtiment. Ces derniers finalisent ce matin le nettoyage et l’harmonisation des données, notamment en classifiant ces dernières par année, ce qui s’avère long et complexe. La difficulté rencontrée est la suivante : selon les années, il n’y a pas le même nombre d’entrées. En d’autres termes, des consommations d’eau et des factures ont été rajoutées au fur et à mesure des années. Par exemple, pour une école en 2011, il y avait deux factures contre quatre en 2014 et six en 2016. Il est donc difficile d’harmoniser et de standardiser les données. Par ailleurs, tous nos jeux de données sont complets et comprennent beaucoup d’entrées.
Après une courte pause déjeuner, nous voilà de retour. Après cette matinée, nous nous sommes aperçus que certains jeux de données sont plus complexes et longs que d’autres, exigeant une plus grande minutie. Margot et Juliette continuent de finaliser le jeu de données des émissions de GES, et Margot s’occupe ensuite de recenser les progrès de chacun dans le groupe pour avancer sur le carnet de bord. Cet après-midi, Étienne et Chloé terminent de remplir les données manquantes du jeu de données de consommation d’eau. Le travail sur ce jeu s’avère complexe, dans la mesure où chaque semestre doit être entré par colonne. Sachant qu’il y a quarante neuf colonnes et quatre cent lignes, ce travail nécessite de gérer plus de treize mille données, ce qui entraîne un grand volume de travail. La problématique est la suivante : de nouvelles factures de consommation d’eau sont créées au fur et à mesure des années, ce qui fait qu’il n’est pas possible de copier et coller chaque colonne de manière automatique. Donc cela nécessite de recréer un nouveau format de standardisation en remplissant les données à la main, de manière méthodique et minutieuse.
Lucas continue de travailler sur le formatage et la classification des données pour le parc automobile, et notamment sur l’explicitation des colonnes de données (75 explications à faire), ce qui ne peut pas être réalisé autrement qu’à la main.
Concernant le jeu de données sur l’accessibilité des bâtiments pour les personnes handicapées, Pierre a réussi à convertir les adresses des lieux de travaux initialement en numéro de rue et rue, en longitude et latitude afin de créer une carte. Afin d’aider le groupe quatre dans leurs avancées, Pierre leur explique la méthode suivante qu’il a utilisée.
Cependant il rencontre une difficulté, notamment sur la compréhension des données fournies par notre interlocutrice. En effet, certaines adresses ne sont pas localisées à Rouen mais éparpillées dans plusieurs endroits de la France. La question est ainsi la suivante : ces adresses correspondent-elles au lieu exact des bâtiments en travaux ou aux sociétés effectuant les travaux, dont leur siège social peut ainsi être localisé en dehors de Rouen ? Pendant ce temps, Juliette avance sur le bilan de la mise en qualité des données pour les quatre jeux de données, et commence à compléter les fiches descriptives des jeux de données pour s’avancer sur le quatrième jour. Juliette note également les questions à poser demain à notre interlocutrice de la ville de Rouen (le processus de collecte des données ? la licence ? les attributions).
En fin d’après-midi, nous pouvons finalement échanger avec notre interlocutrice afin d’évoquer nos avancées et les difficultés rencontrées sur les jeux de données. Pierre en profite alors pour éclaircir ses doutes de compréhension sur le jeu de données d’accessibilité des personnes handicapées. Notre interlocutrice nous a expliqué qu’après 2018, de nouvelles adresses en dehors de Rouen ont été insérées au document. Celles-ci correspondent aux adresses des particuliers ou de leur avocat, ayant déposé un dossier pour faire des travaux dans des bâtiments ou commerces afin de les mettre aux normes d’accessibilité aux personnes handicapées. Puis, Étienne évoque les difficultés qu’il a rencontré avec Chloé sur le jeu de données de consommation d’eau. En effet, les données sont très complexes et peu organisées, donnant lieu à un travail long et nécessitant beaucoup de minutie. A la suite de cela, Margot et Juliette demandent des éclaircissements sur la signification de trois colonnes dites « incertitudes » présentes dans les données fournies par la ville concernant les émissions de GES.
Après un échange très productif, nous rejoignons tous les quatre Chloé et Lucas qui finalisent les jeux de données les plus complexes.
JOUR 4 – PUBLICATION
Notre quatrième journée de ce Challenge Data est d’abord marquée par un mail reçu la veille au soir. L’un de nos interlocuteurs nous annonçait qu’il ne souhaitait pas voir les données publiées et ouvertes, invoquant des raisons de délai trop court et de manque d’arbitrage. Cette décision nous a tout de suite paru étrange, tant elle ne semblait pas rentrer en concordance avec le postulat de base de ce challenge, ayant justement pour objectif d’ouvrir et de libérer un maximum de données en une semaine. De plus, certaines des données que nous traitons sont censées, en vertu des lois en vigueur, être ouvertes à toutes et à tous.
Le spectre du doute a donc plané sur toute cette journée, alors que certains de nos jeux de données n’étaient pas encore tout à fait traités. Chloé, bien qu’ayant continué à travailler sur le jeu des coûts en eau des bâtiments publics de Rouen, n’a pas été en mesure de tout finir en une soirée. Nous nous sommes donc mis à cinq, puis à six, pour continuer et achever la standardisation des quelques 6.145 cellules composants le jeu de données.
Pierre, quant à lui, retravaille son jeu de données sur les travaux d’aménagements de la Ville, et arrive déjà à obtenir une première visualisation sous la forme d’une carte. En même temps, Juliette et moi remplissons les fiches de présentation des jeux de données, qui vont rapidement s’imposer comme la seconde grande difficulté de la journée. En effet, nous ne possédons pas toutes les informations pour remplir ces fiches, il faut donc interroger à nouveau notre interlocutrice Rouennaise. De plus, la catégorie « contenu des données » s’avère particulièrement ardue à compléter pour certains jeux de données. Mon jeu, sur le parc automobile de la Ville de Rouen, ne possède pas moins de 75 colonnes à expliciter, dans des termes parfois très techniques. Cette recatégorisation occupera une bonne partie de mon début d’après-midi.
Pendant ce temps, Etienne se renseigne sur l’aspect juridique des données, afin d’être absolument prêt pour le rendez-vous de 17h avec notre interlocutrice, un responsable SIG et une responsable Open Data.
C’est à ce moment que je comprends avoir produit deux jeux de données à propos du parc de véhicules de la Ville de Rouen. Il m’est donc nécessaire de remplir une deuxième fiche descriptive pour ce nouveau jeu de données. Même si nous nous sommes renseigné sur la publication des jeux de données, il nous est pour le moment impossible de nous avancer sur cette étape, sans l’accord en aval de la Ville de Rouen. Cette incertitude, s’ajoutant à la difficulté de traitement de nos jeux de données, nous fait grandement douter de nous même. Nous sommes obligés de revoir nos méthodes de travail, afin de mieux se répartir le travail.
Il nous est également nécessaire de travailler en flux tendu avec le groupe 5, qui est bien entendu soumis aux mêmes restrictions que nous concernant la publication des jeux de données. Tout au long de la journée, nous préparons et envoyons nos jeux de données ouverts à nos interlocuteurs afin qu’ils puissent juger de la qualité, et surtout de la pertinence et de la nécessité de notre travail.
De plus, ces difficultés nous font également perdre du temps sur la suite du travail, qui est conséquente ! Il s’agit en effet d’établir un plan de communication, normalement réalisé à la suite de la publication des données. Au milieu de l’après-midi, nous sommes donc encore dans une zone bien épineuse…
C’est à 17 heures, au moment de la réunion, que la journée prend un tout autre tournant. Pierre et Etienne, accompagnés de deux membres du groupe 5, participent à une réunion avec notre interlocutrice, le responsable SIG et la responsable open data de notre collectivité. C’est finalement grâce à cette dernière, plus sensible aux
enjeux des données ouvertes, que la situation est clarifiée : enfin, nous avons le feu-vert pour publier les données ! Cela devra attendre le lendemain : d’abord, nous établissons un plan de communication complet, sur lequel nous travaillons toutes et tous. Cette campagne de communication s’appuie tout d’abord sur des leviers d’action à l’échelle locale, en s’appuyant sur le double thématique du développement durable et de la transparence des données. Afin d’encourager la ville de Rouen à communiquer autour de l’ouverture des données, Chloé a confectionné un nouveau logo mettant en valeur la démarche et le site web de la collectivité :
JOUR 5 – VALORISATION
La cinquième et dernière journée est celle de la finalisation de nos travaux. C’est le jour de la conception de nos visualisations et de leur présentation à notre interlocutrice de Rouen.
Nous commençons par une réunion à 9 heures 30, avec la responsable data de la métropole Rouen Normandie. On nous explique comment utiliser la plateforme d’utilisation des datas de la ville de Rouen pour finaliser la visualisation de nos jeux de données. Cette courte réunion nous rassure quant à la réalisation de nos datavisualisations. On nous explique le fonctionnement de tous les outils mis à notre disposition, qui nous permettront de finaliser nos visuels.
Cette journée nous offre la possibilité de finaliser le travail de la semaine. Terminer nos visualisations permet à chaque membre du groupe de se rendre compte de toute la démarche accomplie depuis lundi. A 17 heures, tout le groupe a rendez-vous avec la référente de la ville de Rouen pour présenter les datavisualisations, les expliquer, les contextualiser en prévision des possibles publications.
Lucas produit ses visuels qui permettent de suivre l’évolution de la part des véhicules à faible consommation de Rouen. Il utilise les données qu’il possède déjà pour conceptualiser des visuels efficaces et concis, compréhensible rapidement.
Margot et Juliette s’occupent des graphiques de jeux de données de gaz à effet, et en produisent plusieurs de manière à être capables de présenter un panel complet à notre référente pour que la ville de Rouen puisse faire le choix des graphiques qu’elle publiera.
Etienne et Chloé terminent les visualisations de leurs jeux de données. Chloé s’occupe sur le logiciel R studio de nettoyer son document pour obtenir un jeu de données cohérent et ainsi réaliser des jeux de données plus pertinents. Elle modifie la chronologie et la structure de son document pour le rendre plus clair et plus lisible pendant l’après-midi. Etienne et Chloé produisent et finalisent leurs visualisations pour pouvoir les présenter à la réunion de 17 heures.
De mon côté (Pierre) je produis les cartes des lieux ayant bénéficié de travaux d’aménagement d’accessibilité aux personnes handicapées, qui permettront aux associations de personnes à mobilité réduite de mieux connaître les lieux qui leurs sont accessibles dans la ville de Rouen. En modifiant complètement mon jeu de données, j’arrive à anonymiser les noms et à ne garder que les localisations des travaux afin de produire une carte plus pertinente.
Vient enfin la réunion qui scelle cette semaine de challenge data. Il est 17 heures et c’est le moment d’aller présenter la transformation finale de nos jeux de données en datavisualisations à notre référente. La réunion se déroule très bien, la référente semble particulièrement s’intéresser aux visualisations relatant les émissions GES de Margot et Juliette et des volumes d’eau de Etienne. Elle souligne l’utilité des visuels de Lucas et s’attarde sur l’utilisation que pourrait en faire la ville de Rouen.
Répertoire cartographié des lieux ayant bénéficié de travaux d’aménagement d’accessibilité aux personnes handicapées de 2018 à 2021
Répertoire cartographié des lieux ayant bénéficié de travaux d’aménagement d’accessibilité aux personnes handicapées de 2018 à 2021
Catégorie de travaux d’accès handicapé effectués de 2018 à 2021
Part des carburants principaux utilisés dans les véhicules du parc automobile de la Ville de Rouen
L’émission de GES des différents services de la ville par catégorie d’émission
L’émission de GES des différents services de la ville par catégorie d’émission
Volume par année en mètre cube d’eau pour chaque secteur des bâtiments de la ville de Rouen
Montant par année des dépenses en eau pour chaque secteur des bâtiments de la ville de Rouen
Évolution des parts de véhicules à faibles émissions dans le renouvellement des flottes de véhicules légers
Part des types d’équipement dans le parc automobile de la Ville de Rouen
CONCLUSION
Le challenge data est une expérience à part. Elle nous a permis de tester nos capacités à travailler en groupe et avec une collectivité, à acquérir de nouvelles compétences dans la mise en qualité, la visualisation et la publication des données. La numérisation des données est un phénomène très récent puisque concomitant à l’apparition des technologies associées à la fin des années 1990. Le partage de ces données et donc la nécessité grandissante de leur standardisation est un phénomène d’autant plus récent dont l’adhésion des institutions n’est significative que depuis 2010. De par le travail de l’exécutif aux différentes échelles administratives, des activistes de l’open data, du besoin d’amélioration de la qualité et du suivi des services ; les institutions publiques sont aujourd’hui sensibilisées autour de la question et investissent d’autant plus dans la collecte, le traitement et la publication de données sous leurs prérogatives et selon l’échelle d’organisation, ou “gouvernance” la plus adéquate au cadre d’utilisation des données. Néanmoins, nous avons observé des freins à la mise en place de l’open data à l’échelle des collectivités territoriales. Déjà, au sujet de la collecte et du traitement des données. Il est notable que le budget et le temps alloués à la collecte et au traitement de la donnée sont insuffisants bien qu’en cours d’amélioration (ouverture d’un poste dédié prochainement) et que le processus de traitement des données n’est pas précisément connu par l’ensemble des agents. Notre interlocutrice à la ville de Rouen soulignait que l’administration est une “grosse machine” au sein de laquelle il est difficile d’échanger avec l’ensemble des agents et que “le manque de temps” et d’organisation peuvent expliquer l’absence de données fraîches. Ensuite, la publication des données peut être empêchée par des blocages internes à l’administration : des données jugées trop sensibles ou qu’on ne voudrait pas entre de mauvaises mains, ou bien simplement la volonté de ne pas diffuser les possibles écarts de la ville aux réglementations. Enfin, la valorisation des données par la communication de celles-ci via des datavisualisation n’est pas encore acquise par la ville de Rouen. Pourtant, les réactions positives et la volonté de reprendre à leur tour nos datavisualisations et notre communication autour de celles-ci est fort encourageante. En effet, les freins internes aux institutions face à l’open data ont de moins en moins d’emprises, la ville de Rouen et l’ensemble des collectivités territoriales sont tenues légalement à la publication de leurs données en open data d’une part, et présentent d’autre part une volonté sincère d’impliquer leurs services dans l’open data notamment grâce à l’ensemble des bénéfices qui en découlent. L’open data n’est pas seulement une preuve de maturité numérique, mais aussi démocratique et technique qui est attractive pour les entreprises et les habitants. En tant qu’étudiants en Institut d’Etudes Politiques, nous avons fortement bénéficié de cette expérience. De l’aspect organique du challenge data, la diversité des intervenants avec qui nous avons pu échanger, la richesse de ces échanges nous ont permis de mieux comprendre le fonctionnement interne et officieux des administrations autour de l’open data. Aussi, notre besoin de communiquer, de répartir notre travail et de s’entraider ont construit une cohésion sans pareil entre les membres de notre équipe. D’une approche plus technique du challenge data, les jeux de données ont présenté de fortes disparités dans leur complexité, nous avons rencontré des difficultés majeures quant au fichier recensant la consommation en volume et en montant d’eau par bâtiments de la ville de Rouen de 2009 à 2016 puis en 2021. Ce fichier résume l’ensemble des limites que nous avons pu rencontrer en traitant les données brutes qui étaient souvent irrégulières dans le temps, incomplètes, incohérentes, désalignées ou encore non décrites, “à déchiffrer”. L’étape de visualisation a néanmoins permis d’identifier les dernières coquilles glissées à l’intérieur des fichiers. En effet, la qualité de la collecte et du traitement des données sont essentielles pour ne pas aboutir à un jeu de données inexploitables et l’étape de publication permet d’identifier l’ensemble des erreurs inscrites dans le document. En tant qu’étudiants en sciences politiques avec des spécialités extrêmement différentes, nous n’avions que très peu d’expérience en traitement de données et nous ne connaissions pas les enjeux de l’open data.
Bien qu’il n’était pas nouveau, pour la plupart d’entre nous, d’échanger avec les services administratifs d’une collectivité territoriale, ce travail de longue haleine avec la ville de Rouen nous a appris à adapter notre communication autour de l’open data avec notre interlocuteur et a donné du sens à notre implication dans le challenge data. Nous avons tous ressenti un fort sentiment d’accomplissement en présentant nos travaux par des datavisualisations à notre interlocutrice à la ville de Rouen, qui, au delà des compliments, a été convaincue des possibilités de communications autour de la donnée numérique via les datavisualisations et confirmait l’utilité de celles-ci pour la ville. Finalement, notre plus belle réussite réside dans l’aboutissement de notre implication par la création de visuels pertinents et d’échanges productifs avec la collectivité qui souhaite améliorer la rigueur de collecte et de traitement de la donnée. Après notre Challenge Data, nous savons que la Ville de Rouen ira toujours un peu plus dans le sens de l’open data. Enfin, questionner la portée de nos jeux de données nous a permis d’identifier une communauté d’acteurs extrêmement diversifiés pour lesquels la mobilisation de ces données ou de notre modèle comme standard peut être très pertinente. La communication de nos données en données ouvertes est aussi un outil vertueux stimulant la réutilisation de nos productions, la création d’initiatives et la culture du partage des données.
Nous souhaitons remercier chaleureusement les services de la ville, mais aussi notre référent “Datactivist” ainsi que l’ensemble de leur équipe sans qui l’expérience n’aurait pas eu une telle dimension inoubliable. Sans eux, nous ne serions peut-être pas parvenus à réaliser nos visualisations et nous n’aurions pas pu apprendre autant en une seule semaine.
Afin de clôturer mon propos, voici une illustration de Lucas présentant ses datavisualisations lors de la réunion de rendu du data challenge auprès de la ville de Rouen :