Carnet de bord de l’ouverture des données de Caudebec-les-Elbeuf - groupe 9
par VIVIER Clotilde, CUMUNEL Margaux, ZHAO Zhenqiu, DURAND WEBER Léa, THIENPONT Yente, SINNAEVE Claire, MAUGUIN Emma
Introduction
Challenge data - une semaine du 21 au 25 novembre,
Un groupe – 7 personnes,
Un objectif - aider une collectivité à ouvrir les jeux de données.
Objectifs du challenge data
L’objectif du Challenge data est d’aider les collectivités à ouvrir leurs données. Nous les accompagnons dans une démarche de transparence et d’ouverture vis-à-vis des citoyens. Le but est de permettre, après la fin du challenge data, que cette collectivité poursuive la démarche par elle-même.
Objectifs du carnet de bord
L’objectif de ce carnet de bord est de retracer le chemin parcouru par notre groupe durant toute la semaine du challenge data. Cette description des difficultés et des réussites permettra, on l’espère du moins, d’aider les collectivités souhaitant ouvrir leurs jeux de données en open data ; autant pour respecter leurs obligations légales que pour permettre la transparence nécessaire vis-à-vis des citoyens.
Présentation de la collectivité
Nous avions en charge, tout comme le groupe 10, la collectivité de Caudebec-lès-Elbeuf, commune de Seine-Maritime, dans la région Normandie. Cette commune de 9 949 habitants, limitrophe des communes de Elbeuf et Saint-Pierre-lès-Elbeuf, est située dans l’aire d’attraction de Rouen.
Présentation de l’équipe
Pour finir cet avant-propos, voici une petite présentation de l’équipe 9. Nous tenons également à remercier l’équipe 10 avec qui nous avons travaillé.
JOUR 1
DIAGNOSTIC
Notre première journée a commencé avec une réunion d’information où nous sommes accueillis en auditorium par l’équipe du Challenge data afin de nous dévoiler de façon synthétique les enjeux et tâches du challenge. À l’issue de la photo de groupe, nous nous sommes retrouvés dans notre salle attribuée, avec deux autres groupes. Nous avons discuté avec notre référente Magalie, et nous avons appris que nous étions deux groupes à travailler sur la même collectivité, avec lequel nous avons décidé d’une solidarité commune.
Nous avons eu un premier contact avec l’interlocuteur désigné de la commune et nous avons convenu d’une réunion commune avec l’autre groupe travaillant sur la collectivité, à 12h. En attendant celle-ci, nous nous sommes familiarisés avec les divers outils (le drive, le site internet d’opendatacanvas.org, ainsi que la plateforme gather). Nous avons ensuite effectué des recherches afin de préparer au mieux l’entretien et nous nous sommes répartis les rôles. La réunion s’est tenue de 12h à 12h20, et notre interlocuteur ne semblait pas informé sur l’objectif du data challenge car il ne possédait aucune donnée et n’avait pas de recommandations particulières pour la wishlist. C’est pourquoi cette commune correspondait au niveau 1 sur 4 lors du diagnostic de maturité. À la suite de la réunion, nous avons fait part de cette difficulté à notre référente. Cette dernière nous a proposé de réaliser un compte rendu de l’appel, et de préparer le prochain entretien avec notre collectivité, à 16 heures.
C’est aussi notre référente qui a mené l’entretien afin d’éclaircir la situation et nous aider dans la planification de nos objectifs. L’entretiens, qui a duré une dizaine de minutes, a révélé que nous allions devoir mettre l’accent sur de la recherche de données à exploiter, le lendemain. De ce fait, durant le reste de l’après-midi, nous avons tenté d’avancer et de remplir tous les éléments de la check-list, et notamment, notre wish list, qui dirigera nos recherches du jour 2, que voici.
( Wish list )
JOUR 2
Identification, Data, Exploration et Adaptation
Notre deuxième journée commença vers de nouveaux horizons, plus précisément la salle médiane de l’ancienne bibliothèque de l’école. Après la réunion quotidienne des Data activists faisant le point sur les tâches accomplies le jour précédent et celles à effectuer pour la journée, nous retournions à nos occupations.
Seulement, notre groupe était toujours dans le flou. Sans direction claire, il était délicat d’avancer. Ainsi, nous n’avions d’autre choix que de procéder par tâtonnements. Nous avions commencé par une nouvelle répartition des rôles (organisation d’organigrammes, mails, extraction de data dans des bases nationales, recherche des éléments de la wishlist…) puis avons attaqué nos tâches respectives.
Mais notre élan est interrompu par de nouveaux inattendus :
-Un problème de santé venant d’un membre de notre groupe, retardant son arrivée.
Un mail de notre interlocuteur énonçant l’envoi de data vers midi mais surtout, l’impossibilité pour notre groupe de contacter les services municipaux.
Cette dernière restriction posa une nouvelle difficulté sur la procédure (création de l’organigramme du jour). Sans l’aval de notre interlocuteur principal, nous ne pouvons contacter les différents services pour leur demander des données brutes. Et sans données, pas de travail. Par conséquent, de dix heures à midi, nous étions dans une situation délicate que certains pourraient qualifier de « Hors Service ».
Malgré cela, l’équipe n’a pas abandonné. Puisque nous ne pouvions avoir les données, nous avons décidé de les trouver nous-même, dans des bases de données nationales. Cette étape de recherches, en plus d’être fastidieuse, a mis le groupe face à une impasse : certaines données étaient introuvables (à notre échelle). Pour n’en citer que quelques-unes, nous n’avions aucune donnée sur les informations travaux, les places de parking, les points de covoiturage et les parcs parking. Ainsi, cette étape de recherches nous força à adapter la méthode de répartition des rôles : il fallait désormais trouver les tâches impossibles à réaliser (par manque de data) afin de ne se concentrer que sur ce qui est faisable au moment même.
Parmi les tâches réalisables, nous pouvons compter les bornes de recharges électriques, les naissances et décès entre 2014 et 2021, les associations, la liste des élus, les élections législatives et présidentielles, les effectifs scolaires, les horaires d’administrations, les subventions des associations et les activités commerciales. Ces points constituent notre «wanted datalist».
En d’autres termes, la création d’une base de données était enfin possible.
A cette bonne nouvelle, s’ajoutait le mail envoyé par notre interlocuteur qui a apporté des clarifications et surtout, quelques data tant attendues. Ainsi, nous avons finalement pu compléter l’organigramme de la journée.
Précisons que cet organigramme est encore incomplet, c’est pourquoi un dernier mail a été envoyé en fin de journée pour demander certaines données requises (transport, tri sélectif, logements) et exposer les avancées du groupe comme l’évaluation de la maturité de la commune au sujet de la data.
Pour terminer, cette journée connut deux autres inattendus :
Au sujet des données sur la base horaire des commerces, les informations reçues ne correspondaient pas aux templates proposés par l’équipe datactivist. Face à cela, nous avons tenté une méthode alternative, en nous appuyant sur le site geo data mine pour trouver un template plus adapté.
Nous avons connu en début de matinée des problèmes de communication et de répartition des tâches entre nos deux groupes. Le fait était que plusieurs personnes ne s’occupaient du même sujet (effectifs scolaires, associations…), ce qui entraîna inévitablement une forme d’inefficacité. Toutefois, au fil de la journée, cette discorde finit par devenir une force : la nécessité de se coordonner avec le second groupe fît que nos membres finirent par travailler ensemble. De deux groupes, travaillant chacun dans son coin en début de journée, nous aboutissions en fin de journée à un seul groupe uni, travaillant sur une même table, pour une seule et même commune.
Bref, l’apparition de ces inattendus eut un effet bénéfique (inattendu) : le développement du caractère d’adaptation de chacun dans un environnement de travail collectif.
(Un poème inattendu).
Des mirmillons modernes. Armés de leur brouillon et de leur crayon,
Sans direction, comment assurer la survie du bataillon ?
Les tensions arrivent. Notre groupe est fragmenté, c’est un champ de mines.
,
Jour 2, encore un jour sans fin.
Perdus au milieu d’une spirale de l’incertain,
Plaintifs, inattentifs, passifs… Ce travail est apocryphe.
,
Lecture et analyse de données ? Modernité et adaptabilité ?
Oubliez. Nous sommes déjà dépassés.
Le soleil est clair, le ciel est bleu, le nombre de gens sérieux est de deux. Un indice, je ne fais pas partie d’eux.
Bref, la pause est terminée. Donc voici un logo que j’ai fait :
JOUR 3
MISE EN QUALITÉ
En début de journée, il nous restait uniquement à compléter la base de données sur les activités des commerces et standardiser les données sur les résultats des élections présidentielles et législatives ainsi que la base horaire des services. Nous les avons ensuite validées à l’aide du validateur informatique ou à la main. Le groupe 10 s’est principalement occupé des vérifications à l’aide du validateur et les vérifications à la main ont été faites par groupes de deux.
Le point quotidien avec l’interlocuteur a permis de mettre en lumière quelques erreurs dans la base de données des commerces. Ce point nous a aussi permis de nous rendre compte que notre interlocuteur se familiarise peu à peu avec les open data et malgré le manque de bases de données fournies, nous avons su improviser et les réunir.
Nous avons regroupé les différentes bases de données complétées dans les deux drives de nos deux groupes afin que chaque groupe ait les mêmes informations. Nous avons pu nous répartir les tâches de manière efficace avec deux personnes sur chaque base de données et des personnes différentes qui vérifient leur validité afin d’avoir un nouvel œil sur ces bases de données et donc de ne rien manquer. Nous avons ensuite, à la demande de notre interlocuteur, rédigé un résumé des étapes et de la méthodologie de recueil des données avant de la transmettre à notre interlocuteur. Enfin, nous avons réalisé le bilan de mise en qualité des données. Nous avons travaillé main dans la main avec le groupe 10 afin de rendre notre travail plus efficace et permettant une très bonne ambiance de groupe, portée par la solidarité.
JOUR 4
PUBLICATION
Après notre réunion quotidienne nous détaillant les tâches de la journée, nous nous sommes réuni.e.s et avons entamé notre travail de publication. La première étape a été de nous répartir les jeux de données à présenter dans les fiches descriptives, afin de synthétiser les informations générales et juridiques sur les jeux et les rendre intelligibles aux citoyens ou réutilisateurs des données. Ainsi, ces fiches détaillent le contenu des données, notre processus de collecte, la motivation du choix de traiter tel jeu, la licence Creative Commons, les sources des données, les considérations légales et éthiques et enfin les potentiels usages de ces données.
Nous avons ensuite fait un point avec notre référente à propos de nos documents complétés depuis le début de la semaine. Ainsi, nous nous sommes aperçus que nous n’avions pas rempli les bilans de mise en qualité à la suite de nos validations hier, nous avons donc procédé à rattraper ça, en nous coordonnant tant bien que mal.
Ensuite, nous avons réparti les jeux de données entre les deux groupes pour la publication et la datavisualisation (demain). Notre groupe gère donc :
- les effectifs scolaires (2022)
- l’évolution des effectifs scolaires
- la liste des élus
- les résultats des élections présidentielles et législatives
- les bornes de recharge électrique
Nous avons ensuite fixé un rendez-vous téléphonique avec notre interlocuteur de Caudebec (13h45) afin de discuter de la publication des jeux sur opendata.gouv et la stratégie de communication.
Nous avons créé le compte data.gouv.fr de la commune et communiqué les identifiants à notre interlocuteur. A la suite de notre appel avec ce dernier, nous nous sommes réparti les tâches de communication et de publication.
Communication :
Notre interlocuteur a souhaité que nous créions un logo, des visuels pour la communication sur les réseaux sociaux, un article pour le journal de la ville et un communiqué de presse.
Nous avons rédigé l’article, créé un package réseaux sociaux avec logo, visuels et texte, un communiqué de presse, une fiche d’info interne, et un article pour le journal de la commune.
Publication :
Nous avons publié nos fichiers de données sur data.gouv.fr et avons utilisé les fiches descriptives remplies le matin même afin de renseigner ces informations sur le site officiel.
Ayant un peu de temps libre, certains d’entre nous ont anticipé nos activités de demain en préparant les datavisualisations.
JOUR 5
VALORISATION
Point à 9h30
Après notre briefing matinal quotidien, nous avons entamé notre journée de travail en complétant le questionnaire sur la publication des données, que nous avions par inadvertance oublié de remplir la veille. Par la suite, nous nous sommes répartis les différentes datavisualisations à effectuer par notre groupe et nous avons continué à préparer la méthodologie souhaitée par notre interlocuteur. Dans le même temps, nous avons envoyé un mail à notre interlocuteur afin d’organiser une réunion avec lui en fin de matinée.
Point à 11h45
La plupart des datavisualisations ont été réalisées. L’équipe qui s’est chargée des cartes a eu quelques difficultés en s’apercevant que les adresses et coordonnées géographiques ne correspondent pas toujours. Un travail de mise à jour à donc été nécessaire. L’équipe qui s’est occupée de la réalisation des graphiques s’en est plutôt bien sortie malgré l’impossibilité de réaliser des graphiques via Rawgraphs. Nous avons notamment réalisé des tableaux croisés dynamiques grâce à notre experte excel (Merci Emma ;) ).
Nous avons eu un retour de notre interlocuteur ! Nous avons rendez-vous à 12h !
Point 12h15
Lors de notre entretien avec notre interlocuteur, nous avons convenu d’un rendez-vous à 17h pour la présentation de nos data visualisations. La carte interactive sur les horaires des services de la commune est enfin terminée ! Elle situe les différents services et fournit des informations plus précises lorsque les icônes sont sélectionnés tel que l’adresse, les horaires…
Point 14h45
Après avoir mangé, nous nous sommes remis au travail ! Nous avons entamé le powerpoint regroupant les différentes datavisualisations créés par les deux groupes (9 et 10). Nous avons donc mis en commun nos différents travaux sur les bases de données créés ces derniers jours. Nous avons aussi finalisé la contextualisation des données.
Point 15h30
Nous avons fini le powerpoint. Nous avons ajouté les différentes datavisualisations des 2 groupes et même créé une carte regroupant les 4 cartes sur les commerces, services, les bornes électriques et défibrillateurs ! Nous avons aussi terminé la création du compte de l’organisation sur data.gouv et transféré les données.
Point 16h15
Après notre pause chocolat chaud, nous avons terminé de préparer la présentation et nous avons répété devant un public attentif la présentation de notre travail de la semaine ! Cette répétition qui nous a permis de nous rendre compte de quelques erreurs d’inattention notamment une erreur de graphique. A présent, nous nous apprêtons à écouter le groupe ayant préparé un travail pour la ville de Reims.
Point à 16h53
Retournement de situation : Nous venons de terminer notre entretien avec notre interlocuteur ! Afin de pouvoir avoir un entretien avec notre interlocuteur nous avons avancé notre rendez-vous à 16h40. Nous avons tous présenté avec succès notre travail (malgré quelques problèmes de connexion au wifi). Notre interlocuteur était ravi de notre travail et à notre plus grand plaisir, nous a signalé que notre travail lui avait montré combien l’ouverture des données pouvait être importante. Il nous a confirmé que suite à notre production, la commune continuerait le travail d’ouverture des données notamment avec l’ouverture du nouveau site internet à partir du mois de janvier.
Travail du jour, Présentation des Datavisualisations
Quelques exemples …
La magnifique carte synthétisée ! (http://umap.openstreetmap.fr/fr/map/commerces_838452?fbclid=IwAR1Wln9zR6kleEK-EyC7eRU04OdykVXoLhYbqCDoa9mEhOA4Va06tvEBKao#14/49.2936/1.0368 )
CONCLUSION
Cette semaine a été une semaine productive pendant laquelle nous avons pu ouvrir, en collaboration avec le groupe 10, près de 11 jeux de données sur des thèmes très variés. Le premier jour nous a permis de prendre contact avec notre interlocuteur représentant la collectivité de Caudebec-lès-Elbeuf. Nous avons ainsi pu comprendre que le but principal de notre mission était d’explorer la démarche d’ouverture des données afin d’une part aider la collectivité à l’ouverture des données en tant que tel et d’autre part d’équiper la collectivité avec des outils méthodologiques pour poursuivre cette démarche.
C’est pourquoi le deuxième jour a été consacré à la recherche de données permettant de constituer des jeux que la collectivité pourrait ouvrir sur le portail data.gouv.fr. Nous avons repris les modèles thématiques de jeux de données dont nous disposions et qui sont communs à de nombreuses bases similaires. Le fait de constituer directement les bases nous a permis de procéder à la mise en qualité au fur et à mesure. Le troisième jour a permis de clôturer la mise en qualité et de valider l’ensemble des bases de données soit par des validateurs internet, soit par des méthodes manuelles. Le quatrième jour fut celui de la publication des données et de la réflexion sur le plan de communication. Un compte a donc été ouvert pour la collectivité sur le portail data.gouv et les 11 bases de données ont été publiées tout comme leurs fiches descriptives. Notre équipe ainsi que nos collègues de l’équipe 10 nous sommes ensuite penchés sur la préparation d’outils de communication pour la collectivité. Enfin, le dernier jour, nous avons achevé de rédiger le document méthodologique et nous avons réalisé plusieurs graphiques et cartes qui permettent de valoriser les bases de données créées. Dans le cas des données géographiques, il a été possible de faire des cartes représentant les emplacements des commerces, des services de la commune, des défibrillateurs et des bornes de recharge économiques. Dans les autres cas (élections législatives et présidentielles, liste des élus, effectifs scolaires et évolution de ces effectifs, naissance et décès), il a été préféré de réaliser des graphiques. Bien que nous ayons strictement divisé les tâches entre les groupes 9 et 10 en ce qui concerne la datavisualisation, la carte synthétisant l’ensemble des données géographiques a fait l’objet d’une collaboration rapprochée et la restitution des résultats auprès de notre interlocuteur a mobilisé l’ensemble des deux équipes.
Quel bilan selon notre interlocuteur ?
Lors de notre restitution (ci-contre), notre interlocuteur s’est déclaré ravi de notre collaboration. Notre travail lui a permis de se familiariser avec les différentes étapes de l’open data. Cela lui permet aussi d’alimenter son plan de communication en préparation pour les prochains mois. Nous voyons ainsi l’utilité concrète de notre travail pour la collectivité.
Quel bilan dans notre groupe ?
Notre plus grand défi :
Dans l’ensemble, notre groupe s’accorde à dire que le plus grand défi et le plus fastidieux fût de chercher et trouver les données sur internet. En effet, jusqu’à mardi midi, nous avions à créer nous mêmes les bases de données. Nous avons ensuite reçu des compléments ce qui nous a permis de compléter ce que nous avions déjà trouvé.
Les autres grands défis selon notre groupe furent le travail de standardisation notamment des horaires et des positions géographiques pour les différents commerces et services. En effet, ce travail répétitif nécessite de la concentration sur la longue durée alors. Enfin, du fait de notre organisation complexe répartie sur deux groupes, la répartition des tâches a parfois été difficile ou peu claire ce qui créait des moments de flou et d’attente. Cependant, l’organisation a aussi été une des grandes réussites.
Notre plus grande réussite :
À l’unanimité, les membres de notre groupe ont relevé comme principale réussite notre cohésion d’équipe y compris notre collaboration avec le groupe 10, notre entraide et la bonne ambiance de travail. Nous avons dans l’ensemble su communiquer efficacement malgré notre grand nombre. Pour nous organiser, nous avons mis en place des points réguliers et un tableau pour suivre notre avancement (dont une photo est visible ci-contre).
Par ailleurs, nous nous réjouissons aussi du résultat que nous avons pu produire grâce à cette collaboration réussie puisque nous avons pu :
- ouvrir un grand nombre de jeux de données,
- compiler des données qui n’étaient pas en possession de la commune et qui étaient éparpillées auprès de diverses sources
- réaliser les graphiques et les cartes qui nous apparaissent comme pertinentes
- accompagner notre interlocuteur sur le plan méthodologique conformément au souhait et besoin qu’il avait exprimé le premier jour.
Nous avons ainsi le sentiment d’avoir accompli un travail utile à la collectivité et aux habitants de celle-ci.
Qu’avons nous appris ?
Ce Challenge Data nous a permis de réaliser à la fois à quel point l’open data était une démarche déjà bien présente en France, et de mesurer tout le chemin qu’il reste à parcourir ainsi que les perspectives de progression. En effet, nous voyons d’un côté combien l’open data est investi de par l’existence des Datactivist, des portails de publication de données, des outils spécifiques au traitement de données ou encore à travers les missions que les autres groupes étudiants participant au challenge ont pu réaliser. De l’autre côté, nombreuses sont les communes qui découvrent seulement ce qu’est l’open data et les perspectives qui y sont associées.
De par ce travail, nous avons également pu nous familiariser avec différents outils : certains ont redécouvert la satisfaction de créer de beaux tableaux croisés dynamiques tandis que d’autres ont découvert des outils inconnus jusqu’alors tels que Umap ou GéoDataMine.
Ce travail fut aussi l’occasion d’approfondir nos connaissances de la réglementation de l’open data et de nous rendre compte des multiples étapes qui sillonnent la démarche ainsi que la rigueur que cela nécessite. En effet, il ne s’agit pas simplement de compiler des données et de réaliser des graphiques mais aussi de rédiger les fiches descriptives des données et les contextualisations des datavisualisations. C’est donc une démarche pointilleuse qui vise à permettre une réelle analyse des données.
Enfin, le Challenge Data fut une formidable expérience humaine puisqu’il a fallu user de patience dans la lutte avec le wifi, la confrontation avec les tableurs excel et nos discussions entre nous. Mais comme déjà écrit précédemment, c’est aussi là que réside l’une des grandes réussites de ce Challenge Data. Nous avons particulièrement apprécié travailler avec le groupe 10 pleins d’imagination comme en atteste le poème “Challenge Data” ci-dessus.
Merci donc à notre référente Datactivist qui nous a accompagnés dans cette démarche d’open data, à notre interlocuteur au sein de la collectivité qui s’est montré flexible et à notre écoute et au membres du groupe 10 qui ont été des collègues dynamiques et joyeux.