Carnet de bord de l’ouverture des données de Boulogne Billancourt

par S.G, Aysel S., Aya Amour, Lucie L. et Anne-Marie

Illustration réalisée par Anne-Cécile Calléjon

INTRODUCTION

Notre groupe accompagne la collectivité de Boulogne-Billancourt, commune des Hauts-de-Seine (92) qui appartient à la métropole du Grand Paris, à l’établissement public territorial Grand Paris Seine Ouest (GPSO) et au syndicat mixte des Coteaux et du Val de Seine, dont elle accueille le siège

Il s’agit d’une commune d’une taille importante puisque c’est la ville la plus peuplée d’Île-de-France (118 000 habitants) après Paris. Elle est donc largement concernée par l’obligation d’open data qui s’impose pour les collectivités territoriales de plus de 3500 habitants et plus de 50 agents (on en compte 2000 à Boulogne). C’est aussi une des villes les plus diplômées (40% niveau bac +5) et les plus attractives pour les entreprises et pour l’emploi notamment dans le secteur tertiaire.

Boulogne-Billancourt semble être familière avec l’Open data : 22 jeux de données sont déjà ouverts et disponibles sur www.data.gouv.fr relatifs à des thèmes variés : informations sur les bureaux de vote, les quartiers, les listes des prénoms utilisés en 2019, les lieux de cultes… De plus, nous sommes en contact avec non seulement la direction de la Ville Intelligente et la direction du SIG qui travaille en plein cœur des données.

Toutefois, bien que cette commune semble être lancée dans la dynamique de l’open data, le diagnostic nous a permis de constater des difficultés dans la matière.

JOUR 1 – DIAGNOSTIC

Notre groupe est en charge de Boulogne-Billancourt, donc une commune de taille assez importante au premier abord pour nous inquiéter quant à la complexité de la tâche.

La réunion étant prévue à 14h, nous avons passé la matinée à nous renseigner sur la ville, et sur l’open data de manière plus globale.

Lors de la réunion, il s’est avéré que la ville, bien que conséquente en termes d’équipe (2000 agents, pour 118 000 habitants), est encore dans une démarche débutante sur la question de l’open data.

Il y a bien une personne chargée de l’open data, mais son utilisation est encore limitée. La préparation de jeux de données se résume à des tableaux croisés avec des filtres et l’exploitation de données cartographiques est pour l’instant inaccessible, de même que l’utilisation prédictive des données, ce qu’ils ambitionnent pour la suite. La communication passe par des mises à jour sur le site et quelques posts sur les réseaux sociaux. Les motivations de la collectivité sont simples : d’un point de vue externe, vulgariser et sensibiliser la population mais aussi permettre aux créateurs de start-ups ou aux étudiants d’utiliser les données ; d’un point de vue interne, développer la culture de la donnée parmi les agents.

Ainsi, son score de maturité n’est que de 2, c’est-à-dire que le même que des plus petites communes comme Châtillon, et moins avancé que Béthune ou Baugé-En-Anjou.

Après ce constat, nous nous sommes penchés sur la wishlist déjà préparée par notre interlocutrice. Nous avons repris chaque point pour voir ce qu’il nous était possible de trouver par nous-mêmes, avec quelques résultats, mais pas suffisants. Cela nous a cependant permis d’élaborer un mail adressé à notre interlocutrice, pour lui demander les contacts exacts des services à contacter (dans la matinée de mardi) en interne, et des pistes de contacts externes.

wishlist

Livrable : Whishlist

JOUR 2 – IDENTIFICATION

cafe_croissant

Nos indispensables de la semaine : thé, café et croissants (merci S.G)

Pour commencer par du positif, nous nous sommes beaucoup mieux sentis aujourd’hui qu’hier. Si hier nous avions l’impression d’être un peu perdus, de ne pas trop savoir quoi faire, aujourd’hui nous avons su mettre en place une vraie organisation et comprendre le sens de nos actions.

Notre journée peut se résumer en deux étapes majeures : la dataexploration et l’évaluation des datas obtenues. Pour la recherche de données, nous avons eu un contact principal qui nous a permis de récolter des databases avant notre réunion. Nous avons aussi cherché des informations de notre côté en contactant différents organismes, notamment les bibliothèques.

Ensuite, notre réunion avec l’équipe de la Mairie à 14h nous a permis de leur présenter un premier état des lieux des données obtenues : de quoi dispose-t-on ? Qu’est-ce qui est exploitable ? qu’est-ce qu’il manque ? On a pu définir avec la mairie un ordre de priorité et mieux cerner leurs attentes.

Après la réunion, nous sommes repartis en phase de dataexploration pour les données manquantes (permis de construire, éclairage, recharge de véhicule électrique) et d’évaluation pour les données disponibles (emprunts de livres et stationnement).

Nous avons donc pu proposer à la maire une liste réduite des thèmes qui nous semble pertinents à garder dans la wanted data list. Nous validons les emprunts de livres et les lieux de stationnements, et leur proposons de choisir entre permis de construire et DAE, qui demandent tous deux un grand travail de complétion. Nous attendons confirmation de leur part.

Organigramme

Organigramme Free mind map (mindmup.com)

JOUR 3 – MISE EN QUALITÉ

Plus confiant-e-s et déterminé-e-s dans notre mission qu’avant, nous adoptons une approche plus sereine face à la journée de mise en qualité qui nous attend. Avant toute chose, notre équipe s’est réunie pour décider de notre programme du jour. Il a fallu refaire un point sur la sélection des jeux de données pertinents, mais aussi traitables en une journée. Pour cela, nous nous sommes entendues avec notre interlocutrice sur le choix des 3 jeux de données définitifs : le stationnement, les permis de construire, et les livres. Nous attaquons d’entrée de jeu le fichier des permis de construire qui est une donnée complexe et multiforme. 3 fichiers différents sont en notre possession dont 1 qui nous a été envoyé par la commune. Le premier problème auquel nous nous confrontons est celui de l’uniformisation de la donnée, chacun des fichiers présentant des statistiques très différentes dont certaines informations semblent erronées. Arthur nous conseille de récupérer les positions géographiques, mais aussi approuve notre idée de relancer la commune pour compléter la statistique sur la superficie, le IDPC, le type d’événement et la nature du projet. En effet, nous trouvons ce jeu donné utile pour les citoyens ou professionnels de la ville.

Après avoir nettoyé toutes les données, nous nous divisons la charge de travail. Pour créer une grosse base de données commune, nous passons à la jointure entre les données de stationnement, les places PMR et de livraison. Cependant, nous avons du mal à avoir un résultat car nous n’avons pas de donnée commune entre les fichiers (adresse et géolocalisation différente). En effet, cette manœuvre nécessite l’intervention de Magalie qui accepte de joindre les données à partir d’un dispositif cartographique. Nous la remercions pour son aide précieuse.

Quant au fichier sur les livres, nous sommes contraints de supprimer une colonne “nombre de consultations” car elle s’avère incomplète et la colonne “editeur” inutile question utilité publique. La standardisation demande un effort important, car nous supprimons aussi les données d’auteur traducteurs des ouvrages ainsi que la durée de vie des auteurs. Nous dégageons de cela un objectif qui est de trier les romans par ordre des livres les plus empruntés aux livres dès moins empruntés, utile pour un citoyen lecteur de la tendance littéraire.

Enfin, nous sommes amenés à compléter à la main quelques informations manquantes sur les défibrillateurs car la commune avait insisté sur le travail de cette donnée.

Entre-temps, la commune nous renvoie un fichier complet sur les permis de construire, nous passons à la standardisation mais lorsque nous joignons les deux fichiers un problème technique nous empêche d’avancer (surface terrain et fichier commune). Finalement, Julia nous conseille de n’utiliser que le jeu de données de la mairie. En effet, lorsque nous avons joint les 2 fichiers, les données ne “matchaient” que sur 11 lignes. Donc sur un fichier de plus de 300 permis de construire, on a jugé inutile de garder le deuxième fichier. Après une mission de mise en valeur de la donnée complétée, nous envoyons un mail de demande d’approbation et de publication à la commune.

JOUR 4 – PUBLICATION

Le jour 4 a commencé par la finalisation des jeux de données préparés la veille. Nous avons terminé de standardiser les derniers jeux de données pour la voirie et les emprunts de livres. Nous avons également essayé de régler les problèmes d’affichage des numéros de SIRET du jeu de données des permis de construire qui ne marchaient pas parfaitement sur Workbench, sans succès. Il a ensuite fallu planifier une réunion avec l’équipe de Boulogne-Billancourt, en leur communiquant les liens pour accéder aux fichiers Workbench et Excel de nos jeux de données.

Ensuite, nous avons rempli les fiches descriptives de chaque jeu de données, afin de les publier avec un maximum d’informations et de précision. Avant de prendre notre pause déjeuner, nous avons préparé la réunion avec Boulogne, en se mettant d’accord sur les points que nous voulions aborder, et en faisant un powerpoint pour leur expliquer clairement ce que nous avions fait et ce que nous voulions ensuite faire.

Difficultés rencontrées dans la matinée : le problème d’affichage de certaines colonnes du document Excel sur les permis de construire a pris du temps et embêté une partie de l’équipe, car il a été très long de le mettre en qualité avant de le publier sur Workbench. Ensuite, après avoir parlé avec Magalie de Datactivist, nous avons du _spliter _à la dernière minute le jeu de données des stationnements sur la voirie (séparer les deux roues, les PMR, les places de livraison de la voirie), et donc refaire les fiches descriptives (voir dans le prochain paragraphe l’avenir de ces fiches descriptives).

Après une pause déjeuner des plus réjouissantes, nous avons eu rendez-vous sur Teams avec l’équipe de la mairie, pour valider les données et parler de leur stratégie de communication (en théorie). Nous avons alors rencontré de nombreux problèmes techniques, car les équipes de la collectivité ne pouvaient pas accéder à nos fichiers sur Workbench. Après réflexion (surtout pour Arthur et Julia), nous avons décidé de leur envoyer les fichiers en format CSV, sans passer par Workbench pour limiter les problèmes, afin de rapidement valider nos jeux de données. L’un de nos interlocuteurs ayant du s’absenter, nous n’avons pas pu échanger sur la stratégie de communication. Ils nous ont finalement informés qu’ils ne publiaient pas leurs données sur data.gouv mais sur open.data.soft, et qu’il n’y avait donc pas besoin de fiches descriptives que nous avions remplies (avec amour).

Après avoir raccroché, nous avons commencé à publier des jeux de données, en commençant par celui des permis de construire, qui avait été validé en direct pendant la réunion. D’autres obstacles ont ponctué notre chemin vers la publication, comme l’absence d’autorisation d’accéder à la sécurité pour la gestion des données (nous avions publié les jeux, mais ils n’étaient pas visibles). Après un (énième) appel avec Arthur, nous avons pu demander à la mairie de Boulogne de nous donner cet accès, et nous avons donc publié nos 4 premiers jeux de données.

En attendant que Magalie nous envoie les derniers jeux de données concernant les stationnements, nous avons commencé à réfléchir à la stratégie de communication à établir pour prévenir les habitants de la commune de l’ouverture de la data aux yeux de tous. Une fois les derniers jeux de données reçus, nous avons terminé leur publication.

Il est actuellement 17h, nos jeux de données sont publiés et nos cerveaux ont brainstormé au sujet de la communication interne (en encourageant chaque service de la mairie à collecter et à publier ses données) et externe (informer sur les réseaux sociaux que ces publications, la ville étant très active sur Twitter et Facebook) pour informer de l’ouverture des données de la ville. Sans nouvelle de notre interlocutrice après nos diverses relances, nous attendons patiemment d’en savoir plus pour agir concrètement.

En attendant, voici donc la liste de nos jeux de données :

1/Les DAE : https://boulognebillancourt-seineouest.opendatasoft.com/explore/dataset/dae-boulogne-billancourt/information/

2/ Les permis de construire : https://boulognebillancourt-seineouest.opendatasoft.com/explore/dataset/permis-de-construire-boulogne-billancourt/information/

3/ Les emprunts de romans d’adultes : https://boulognebillancourt-seineouest.opendatasoft.com/explore/dataset/emprunts-romans-adultes/information/

4/Les lieux de stationnement en sous-sol : https://boulognebillancourt-seineouest.opendatasoft.com/explore/dataset/lieux-de-stationnement-parkings-sous-sols/information/

5/ Les places de livraison en voirie https://boulognebillancourt-seineouest.opendatasoft.com/explore/dataset/places-de-livraison-en-voirie/information/

6/ Les places de stationnement PMR en voirie : https://boulognebillancourt-seineouest.opendatasoft.com/explore/dataset/places-de-stationnement-pmr-en-voirie/information/

7/ Les zones de stationnement en voirie : https://boulognebillancourt-seineouest.opendatasoft.com/explore/dataset/zones-de-stationnement/information/

8/ Les places de stationnement deux roues :https://boulognebillancourt-seineouest.opendatasoft.com/explore/dataset/place-de-stationnement-deux-roues-en-voirie/information/

Difficultés rencontrées dans l’après-midi et bilan : les divers problèmes techniques relatifs à l’ouverture de Workbench par les services de la mairie, et l’attente de réponse de la commune quant à nos stratégies de communication. Le reste a été plutôt fluide, et la publication des jeux de données est un jeu d’enfant comparée aux étapes précédentes.

JOUR 5 – VALORISATION

Avant de parler de notre journée de valorisation des données, il s’agit de revenir rapidement sur la suite de notre journée 4 : la publication des jeux de données qui nous paraissait être si simple, a finalement été plus créatrice de tension que ce que l’on imaginait. Hier soir à 21h les jeux de données sont repassés en accès limité. Nous les avons rouverts et supposons que le personnel de la mairie les a bloqués sans nous aviser.

Ce matin, nous arrivons l’esprit léger après le pep talk de Julia qui nous assure de la qualité de notre travail. Nous commençons à travailler sur les datavisualisations, le premier objectif du jour. Nous nous heurtons en travaillant à des problèmes sur nos jeux de données : une colonne a disparu du fichier “permis de construire” et nous sommes parties en fouilles archéologiques dans nos anciens fichiers pour la retrouver. Egalement, nous nous apercevons que les 4 jeux de données de stationnement travaillés par Magalie sont des données GPSO et non uniquement centrés sur Boulogne-Billancourt comme nous le souhaitions, nous attendons donc de recevoir les jeux corrects pour pouvoir avancer.

Mais si des écueils nous ont barrés la route, nous avons aussi eu de belles réussites : notre mail de communication interne pour informer les collaborateurs de l’ouverture à l’open data de la ville de Boulogne-Billancourt a été validé par notre interlocutrice ! De plus, nous avons réalisé de belles datavisualisations sur workbench, ODS et rawgraph concernant les jeux de données “emprunt de romans” et “DAE”. Nous avons aussi compris avec succès comment réaliser une carte sur umap qui superposera plusieurs couches de données concernant l’ensemble des places de stationnement de la ville !

Datavisualisations réalisées et publiées :

Nous avons terminé la journée en avance, ce qui nous a permis de nous préparer pour la restitution, notamment en créant un diaporama que nous pourrons montrer

CONCLUSION

A la fin de cette semaine très intense, nous pouvons dire que le bilan, de la commune ainsi que de notre groupe, est très satisfaisant : nous avons ouvert huit jeux de données, actualisé et fournit de nouvelles données, notamment pour les défibrillateurs, tout en maintenant une (très) bonne ambiance au sein de l’équipe, et ce malgré les difficultés rencontrées.

Nous avons dû faire face à de nombreux obstacles au cours de cette semaine, le premier ayant été la nécessité de se familiariser très vite avec des outils permettant de comprendre et de manier les données. Mais les freins les plus importants que nous avons rencontrés pour ouvrir les données ont été des freins d’ordre technique : problème d’affichage de certaines données sur le document excel recensant les données relatives au permis de construire ou encore impossibilité pour la collectivité d’accéder à nos fichiers sur workbench. Nous avons également été confrontés aux procédures administratives, puisque la ville de Boulogne-Billancourt, comme toute collectivité, fonctionne grâce à une pluralité de services, qui doivent se coordonner entre eux. Ainsi nous avons pu recevoir des réponses tardives, ce qui nous a obligé à nous adapter aux évolutions des différentes situations. Enfin, l’uniformisation, la standardisation et la récolte des données (particulièrement en ce qui concerne les défibrillateurs) ont constitué une source de travail importante, même si cela faisait partie des objectifs du challenge.

Au niveau des leviers de l’ouverture des données, le fait que 6 membres sur 7 aient pu se retrouver pour travailler ensemble à l’IEP à partir de mardi a largement facilité le travail et l’entraide au sein de l’équipe. C’est d’ailleurs cette solidarité dans le travail qui a constitué à notre sens le principal levier de l’ouverture des données, et le fait que nous ne nous sommes jamais découragés malgré les obstacles. Nous en profitons ici pour remercier Julia, notre accompagnatrice, pour ses nombreux “pep talk” lorsque nous avions le sentiment que notre travail ne remplissait pas d’utilité particulière. Enfin, la division des tâches et l’organisation a largement contribué au fait que nous avons réussi à publier huit jeux de données, puisque dès qu’un sous-groupe avait terminé son travail, celui-ci venait en soutien d’un autre pour accélérer et faciliter le travail.

L’un des plus gros casse-tête (et le plus frustrant) aura sans conteste été d’avoir recherché manuellement les données de géolocalisation de diverses adresses ayant un défibrillateur, alors qu’il existe une application permettant de faire ce travail en une seule fois. Notre plus belle réussite aura été, sans conteste encore une fois, d’avoir réussi à publier huit jeux de données et d’avoir ainsi atteint le “record de publication de jeux de données”, ce qui a constitué une grande source de fierté.

Nous profitons de la conclusion pour remercier chaleureusement les organisateurs et les organisatrices de ce challenge, et plus particulièrement Julia, qui nous a fourni tous les jours une aide précieuse, mais aussi Magalie qui nous a beaucoup aidé pour les permis de construire, ainsi qu’Arthur, dont l’aide fût également précieuse pour appréhender workbench!