Chapitre 1 Le dataviz challenge : un évènement à répliquer

Le dataviz challenge s’est inscrit dans le cadre de la mission relative aux politiques éducatives territoriales confiée en octobre 2018 par le ministre de l’Education nationale et de la Jeunesse, Jean-Michel Blanquer, à Ariane Azéma, inspectrice générale de l’administration de l’éducation nationale et de la recherche et à Pierre Mathiot, professeur des universités.

Il part du constat que la concentration géographique des inégalités sociales et ses effets sur l’échec scolaire est identifiée depuis de nombreuses années en France : elle est un des fondements historiques des politiques d’éducation prioritaire. Le ministère doit procéder à la révision de la carte de la géographie prioritaire et , plus globalement, souhaite mieux prendre en compte l’ensemble des enjeux territoriaux qui contribuent à la réussite de tous les élèves.

Dans le cadre de cette mission, le 110 bis, lab d’innovation de l’Education nationale, a expérimenté du vendredi 22 mars 9h au samedi 23 mars 19h un nouveau format d’exploitation des données visant à co-construire des outils, une méthodologie et des pratiques pour améliorer les politiques publiques éducatives.

L’évènement s’adressait à un large public : développeurs, enseignants, data scientists, designers, chercheurs, professionnels de l’éducation, décideurs public, étudiants… Et quiconque souhaitant apporter sa contribution sur le sujet des politiques éducatives territoriales et s’immerger dans une équipe interdisciplinaire le temps des deux jours du dataviz challenge.

Extrait du livret du dataviz challenge représentant la diversité des participants

Figure 1.1: Extrait du livret du dataviz challenge représentant la diversité des participants

Les 3 défis du dataviz challenge ont été identifiés lors d’une journée contributive le 3 octobre 2018 avec les acteurs de terrain.

Les défis 1 et 2 se sont appuyés sur des données qui ne sont pas librement réutilisables en open data. Bien qu’anonymisées, ces données concernaient des personnes physiques ou morales et les participants se sont engagés à ne pas altérer les données ou dénaturer leur sens ainsi qu’à présenter les résultats de manière à ne pas permettre une éventuelle identification.

1.1 Défi 1 : les déplacements en cascade

1.1.1 Cadrage du défi

L’émergence des campus des métiers et des qualifications, le développement de l’apprentissage, la réforme du lycée, etc. sont autant de politiques publiques éducatives qui peuvent se traduire par la modification de l’offre de formation sur le territoire. Comment représenter les conséquences potentielles de ces modifications sur les déplacements des élèves et des professeurs ?

Objectifs : anticiper les impacts plausibles d’une modification de l’offre de formation au niveau local sur les déplacements des professeurs et des élèves (nombre de personnes impactées, temps de transport, etc.)

3 questions pour démarrer le DataViz Challenge :

  • Comment mettre en regard le déplacement de l’offre de formation et l’offre de transports, dont une partie est gérée par les collectivités ?

  • Comment tenir compte et représenter les différentes stratégies qui peuvent être mises en oeuvre par les élèves ?

  • Quels sont les effets du déplacement d’une option ou d’une spécialité sur la mixité sociale ?

Trois projets ont été développés dans le cadre de ce défi.

1.1.2 🏆 Projet “Mixité Sociale”

Ce projet a été retenu par le jury pour le défi 1.
Lien vers le code et la documentation : https://github.com/kir0ul/DataTerr

Contexte

Au sein d’un périmètre restreint, des établissements peuvent être caractérisés par des niveaux de mixité sociale, entendue comme la représentation équilibrée de toutes les différentes professions et catégories socioprofessionnelles (PCS), très inégaux.

A Bordeaux, trois collèges publics voisins ont des indices de mixité respectifs de 30,4, 46,2 et 9,7 %, tandis que la moyenne académique est de 34,9%.

Comment améliorer cet indice, notamment pour les établissements où il demeure faible ? Comment identifier les variables sur lesquelles jouer et leur impact plausible sur l’indice de mixité d’établissements proches ?

Produit final S’appuyant sur QGIS pour explorer les données, l’équipe s’est focalisée sur la ville de Bordeaux pour laquelle nous disposions des données de carte scolaire. Chaque établissement est représenté par ses indicateurs PCS, le nombre d’élèves de secteur non présents dans l’établissement, l’indicateur PCS_D (catégories sociaux professionnelles défavorisées) prédit par le modèle et enfin l’indicateur PCS_D après déplacement d’options.

L’équipe avait aussi pour projet de développer une aide à la modification des cartes scolaires, non réalisée faute de temps.

Exemple de carte prédisant le niveau de mixité sociale

Figure 1.2: Exemple de carte prédisant le niveau de mixité sociale

Méthode Le modèle choisi est un régresseur à base de forêts aléatoires. La variable à prédire est le taux d’élèves en PCS très défavorisée et les variables d’entrée sont le nombre d’élèves, le secteur (public ou privé), le nombre d’options disponibles et les options d’intérêt.

Représentation synthétique du modèle

Figure 1.3: Représentation synthétique du modèle

Malgré la simplicité de cette sélection de variables, le modèle a une erreur RMSE (mesure caractérisant la « précision » d’un estimateur) de 2%, ce qui est très faible.

Représentation sous forme de boite à moustache de la hiérarchisation automatique des variables utilisées par le modèle

Figure 1.4: Représentation sous forme de boite à moustache de la hiérarchisation automatique des variables utilisées par le modèle

1.1.3 Projet “Locaviz”

Lien vers le code et la documentation du projet

Contexte : La fermeture ou l’ouverture d’un établissement scolaire peut avoir de sérieux impacts sur les capacités d’accueil des établissements similaires voisins, les trajets quotidiens des élèves, et donc sur des enjeux plus vastes tels que l’environnement.

Comment prévoir les impacts de la fermeture ou de l’ouverture d’un établissement sur ces trois paramètres ?

Produit final: En fonction du nombre de classes de l’établissement, le prototype anticipe la réaffectation des élèves dans les établissements environnants, ses impacts sur les trajets au travers d’une carte décrivant les impacts de la fermeture d’un établissement sélectionné. Les caractéristiques sociales de chaque établissement sont visualisées dans une rosace qui se déplie par niveau.

Représentation cartographique de la suppression de la classe et des déplacements engendrés

Figure 1.5: Représentation cartographique de la suppression de la classe et des déplacements engendrés

Le projet prévoit la réaffectation des élèves dans les établissements en prenant en compte sa capacité actuelle et sa capacité après réaffectation. Le temps de trajet n’a pu être calculé mais la distance est représentée avec une estimation de l’impact carbone de ces déplacements.

1.1.4 Projet I.P.E.D. (Indice de Performance des Déplacements)

Lien vers le code et la documentation

Contexte : Les enseignants qui exercent au sein de plusieurs établissements, ou enseignants en compléments de services, doivent souvent réaliser de nombreux déplacements qui peuvent sensiblement peser sur leur vie personnelle et professionnelle. A terme, cela peut avoir des impacts notoires sur d’autres paramètres tels que l’environnement ou les chances de réussite des élèves.

Comment analyser ces déplacements pour apporter des solutions efficaces permettant de les limiter et d’en réduire les impacts?

Carte représentant les déplacements effectués par les enseignements en complément de service.

Figure 1.6: Carte représentant les déplacements effectués par les enseignements en complément de service.

Produit Final : l’équipe a élaboré une maquette de plateforme permettant de visualiser l’évolution d’un Indice de Performance des Déplacements (IPED) en fonction de l’évolution de paramètres qui déterminent l’offre éducative.
Maquette de la plateforme IPED.

Figure 1.7: Maquette de la plateforme IPED.

Méthode : Le projet a abouti à la création d’un indicateur IPED. Indice annuel d’évaluation de l’impact mobilité des enseignants de base 100, il se compose de l’addition des trajets à vol d’oiseau de chacun.e des enseignant.e.s.

Selon le lieu de résidence de l’enseignant, les matières et options enseignées et la typologie de l’établissement, un algorithme recommande un scénario d’optimisation des trajets.

1.1.5 Projet Spé et ruralité

Lien vers la documentation

Le projet vise à assurer l’égalité de tous sur l’accès aux spécialités en particulier dans les territoires ruraux. Comment limiter le temps de déplacement d’un élève ayant choisi une option qui n’est pas dans l’établissement où il est scolarisé ? Les participants ont souhaité développer un outil permettant de consulter la cartographie des lycées proposant les options et de proposer des solutions ou des alternatives aux élèves qui ne peuvent pas se rendre dans l’établissement. Du fait de la technicité des données, ce projet n’a pas pu être réalisé mais plusieurs axes de réflexion ont été développés dans ce projet :

Temporalité des attributions de spécialités Actuellement, le Recteur décide de la répartition des spécialités par établissement au mois de Janvier, moment où la dotation horaire globale est attribuée aux établissements. Or, les élèves font leurs choix de spécialités au cours du deuxième trimestre, après que le Recteur ait fait la répartition. On peut s’interroger s’il faut définir plus tôt dans l’année les choix de spécialités des élèves ou que le Recteur revoit la répartition des spécialités plus tard dans l’année.

Délocalisation des cours Dans certains cas, la configuration des territoires ne pourra pas permettre de satisfaire toutes les demandes. Il peut donc être utile de délocaliser un cours. Le groupe a tenté de visualiser l’idée qu’il faudrait trouver un barycentre, un centre de gravité qui rapproche tous les élèves souhaitant assister à une option. ous viendrions lui proposer un outil numérique.

L’outil envisagé est une carte interactive qui permet au recteur de visualiser les spécialités afin de repérer les zones blanches et les distorsions entre l’offre et la demande.

Les calques sur la carte présentée lors du Dataviz Challenge

Figure 1.8: Les calques sur la carte présentée lors du Dataviz Challenge

Le prototype réalisé à partir de calques permet de superposer : * Le domicile de l’élève * L’établissement dans lequel Léa est scolarisée avec la spécialité choisie * La carte des internats * La carte des tiers-lieux

1.2 Défi 2 : la carte d’identité des établissements en temps réel

1.2.1 Cadrage du défi

Les recteurs comme d’autres acteurs de l’Education nationale ont souvent besoin de pouvoir prendre connaissance, en un coup d’oeil, de la situation globale d’un établissement. Etat des ressources humaines et financières, situation sociale, résultats des élèves, etc. Comment remplacer une pile de dossiers papiers hétérogènes qui demandent un effort considérable de constitution et de consultation, par une vision synthétique, actualisée et à 360°, des informations relatives à un établissement ?

Objectifs : avoir une vision consolidée et à jour d’un établissement, diminuer le temps de préparation au profit du temps consacré à l’échange et ainsi faciliter le dialogue.

3 questions pour démarrer le DataViz Challenge :

  • Comment synthétiser les informations nécessaires à la prise de connaissance de l’état d’un établissement ?
  • Comment permettre aux utilisateurs en mobilité (ex : recteurs) d’en disposer lors de leurs déplacements ?
  • Comment rendre cet outil utile pour des utilisateurs non experts de la donnée ?

1.2.2 🏆Projet Eduscope

Ce projet a été retenu par le jury pour le défi 2.
Lien vers l’outil : https://avouacr.shinyapps.io/eduscope_shinyapp
Lien vers le code et la documentation : https://github.com/avouacr/EduScope

Contexte : Les recteurs, agents du ministère ou chefs d’établissement ont souvent besoin d’obtenir rapidement des informations sur les caractéristiques générales et les spécificités d’un établissement cible. Aujourd’hui ces informations se trouvent dispersées et stockées dans différentes bases de données (ex: GAIA, Mosart, EPI…), ce qui limite leur accessibilité, leur lisibilité et peut donc complexifier la prise de décision.

Quel outil pourrait donc répondre aux besoins des différents utilisateurs que sont :

  • la visualisation rapide d’indicateurs ;

  • la mobiquité ;

  • l’aide à la prise de décisions ?

Produit final : Plateforme interactive qui permet de centraliser et de visualiser divers indicateurs de performance scolaire. La priorisation des indicateurs d’intérêt s’adapte en fonction du profil utilisateur (recteur, chef d’établissement, service support…) et de l’échelle de prise de décision souhaitée (nationale, académique, départementale, locale, individuelle), tout en demeurant flexible.

Vue synthétique des données disponibles par établissement.

Figure 1.9: Vue synthétique des données disponibles par établissement.

La plateforme permet également de visualiser l’évolution des différents indicateurs dans le temps, mais aussi de faire circuler des informations qualitatives entre utilisateurs.

1.2.3 Open

Lien vers la documentation

Contexte : L’identité d’un établissement se résume souvent à bien plus que ses indicateurs de performance. Elle peut aussi être enrichie par son dynamisme interne et son écosystème socio-culturel (proximité des lieux culturels, des infrastructures sportives, d’associations, etc). Ces informations peuvent être particulièrement utiles pour les élèves, qui disposent actuellement de peu d’outils pour comprendre et prendre part à la vie de leur établissement et tirer profit de son environnement.

Comment remettre les élèves au centre de l’identité et du processus de décision des établissements ?

Produit final : la maquette de plateforme participative donne aux élèves pourvus d’un identifiant la possibilité de réagir, partager leur ressenti, mais aussi émettre des propositions pour améliorer la vie dans leur établissement.

Elle propose également une vision géolocalisée de l’établissement leur permettant d’identifier les offres pédagogiques, sportives et culturelles à proximité, puis d’effectuer un retour d’expérience sur ces offres.

Visuels du service OPEN.

Figure 1.10: Visuels du service OPEN.

1.2.4 Antisèche

Lien vers la documentation

Contexte : Lors de leurs déplacements, les recteurs et agents du ministère ont besoin d’accéder rapidement à une vue synthétique des principales caractéristiques d’un établissement, où qu’ils soient et sans avoir forcément accès à un poste informatique. Afin d’orienter leurs discours et prise de décision, il leur est essentiel de disposer d’une vision comparative des informations entre les établissements, .

Comment concevoir un outil répondant à l’ensemble de ces besoins ?

Produit final: le prototype d’application permet une visualisation géolocalisée des établissements et l’accès à une présentation synthétique et ergonomique des principaux indicateurs (nombre d’élèves, taux de réussite au Brevet des Collèges, cours et options proposées, capacité d’accueil, nombre d’enseignants par élève, etc).

L’outil propose également une vision évolutive de ces indicateurs dans le temps, ainsi qu’une fonction de filtre permettant de cibler les variables d’intérêt ¨

Maquette du service Antisèche

Figure 1.11: Maquette du service Antisèche

1.3 Défi 3 : carto du numérique dans les territoires

1.3.1 Cadrage du défi

eCarto est un outil créé par la Caisse des Dépôts, en partenariat avec le ministère de l’Education nationale et de la Jeunesse et les associations de collectivités. Il permet de visualiser le déploiement du numérique éducatif dans chacun des 63 000 établissements scolaires, en rassemblant les données en open data sur la connectivité, l’équipement, les ressources et les expérimentations. Il a vocation à être un outil permettant : * au plus grand nombre de s’informer sur l’état du numérique éducatif en France ;

  • aux décideurs publics d’ajuster l’accompagnement des académies et des collectivités en matière de déploiement du numérique éducatif ;

  • aux acteurs des politiques éducatives locales d’identifier plus facilement les établissements où un enseignement à distance serait possible dans de bonnes conditions.

Objectifs : faciliter l’appropriation des données relatives au déploiement du numérique éducatif en France en augmentant l’outil eCarto.

3 questions pour démarrer le DataViz Challenge :

  • Quelles sont les disparités territoriales observables ?

  • Quelles données complémentaires et extensions possibles pour enrichir la représentation du niveau de maturité numérique d’un territoire ?

  • Quelles mises en perspective possibles entre niveau de maturité numérique et niveau d’enclavement / isolement géographique d’un territoire ?

1.3.2 🏆Alain Jette

Projet retenu par le jury pour le défi 3
Lien vers la documentation

Contexte :Les établissements scolaires regorgent de projets pédagogiques. Cependant, ceux-ci ont souvent peu de visibilité au sein de leur territoire. Ce qui peut limiter leur portée et l’investissement qu’ils reçoivent en ressources humaines, financières et matérielles nécessaires à leur portage. Cette opacité peut également jouer sur l’image d’un établissement, les indicateurs standards ne permettant pas d’en valoriser la prise d’initiatives, la créativité et le dynamisme internes.

Comment rendre visible les projets pédagogiques sur un territoire afin de développer l’inspiration , le partenariat et l’action de tous ?

Produit final: une maquette de carte multidimensionnelle et collaborative des projets pédagogiques dont le design est inspiré de l’univers LEGO® invite à concevoir les projets pédagogiques comme des co-constructions. L’outil recense l’ensemble des projets organisés sur un territoire (ici l’Académie de Dijon) ainsi que leur description.

Illustrations du projet à partir de LEGO.

Figure 1.12: Illustrations du projet à partir de LEGO.

Il offre également un module de recherche ciblée selon des critères structurels (nombre d’élèves, budget, durée, etc) et fonctionnels (utilisation des outils numériques, pédagogie innovante, interdisciplinarité, etc). Cette recherche affinée est amenée à faciliter la conclusion de partenariats et le partage de ressources entre les équipes pédagogiques, mais peut aussi aider le recteur à piloter son académie. Elle valorise ainsi aussi bien le projet que son établissement d’accueil.

1.3.3 Panser la fracture numérique

Lien vers la documentation

Contexte : Les établissements scolaires sont les premiers touchés par les effets de la “fracture numérique”. Ces inégalités ne se réduisent pas à l’accès aux équipements informatiques mais sont aussi fonction de la couverture numérique de l’établissement, sa catégorie (ex: REP/REP+), ses financements, son nombre d’enseignants, leurs formations…

Comment mesurer et visualiser les écarts de facilité d’accès au numérique entre différents établissements en tenant compte de tous ces paramètres pour mieux adapter les réponses politiques et évaluer leurs impacts?

Produit final : Maquette de cartes en relief permettant de visualiser un indicateur synthétique d’accès au numérique, d’en cibler les composantes et de les comparer à ceux des établissements environnants et à la moyenne nationale.

Indicateur synthétique sur accès au numérique

Figure 1.13: Indicateur synthétique sur accès au numérique

Méthode :

  • Création d’un indicateur synthétique (Numeriscor) croisant les données existantes (débit internet, nombre d’élève parterminal, vétusté des équipements, etc.) et d’autres données aujourd’hui difficilement trouvables (qualification des professeurs C2i2e, nombre de formations sur le numérique, etc.) ;
  • intégration de l’indicateur à eCarto et à la fiche de chaque établissement ;
  • création d’une moyenne départementale et nationale sur eCarto permettant de positionner facilement un établissement par rapport aux autres et identifier ceux en difficultés.

1.3.4 Cartorézo

Lien vers la documentation

Contexte : Les données de l’outil e-carto peuvent parfois manquer de lisibilité pour les décideurs publics. L’outil ne semble en effet pas avoir été conçu pour un profil d’utilisateur cible et son design peu pensé pour faciliter la prise de décision.

Comment donner un sens aux données présentes dans e-Carto ? Comment la data visualisation peut elle permettre de les rendre plus parlantes et utilses pour un nombre élargi d’acteurs décisionnaires ?

Produit final : Prototype de plateforme web visant à mettre en lumière les potentiels de collaboration et d’e partage de ressources des établissements. Chaque lycée est géolocalisé, et peut donc prendre conscience des différentes structures qui l’entourent (bibliothèques, associations dans le numérique, tiers-lieux) et d’accéder à leur fiche descriptive.

Elle permet également d’évaluer les potentiels de collaboration des établissements entre eux ou avec les structures environnantes, notamment grâce à un système de recommandations. Plus un acteur coopère, plus il est mis en valeur sur la carte.

Prototype de la plateforme Cartorezo

Figure 1.14: Prototype de la plateforme Cartorezo

Méthode :

Le prototype s’appuie sur les données de l’enquête sur les technologies de l’information et de la communication (ETIC). L’équipe a regardé les variables présentes une à une pour identifier les données à regrouper comme le nombre de terminaux par élève et le débit de l’école (avec une mauvaise connexion, ces tablettes serviront peu) et les données extérieures à mobiliser pour leur donner du sens (ex: équipement par professeur (ETIC) et formation au usages numériques (GAIA)).

En fonction des différentes relations identifiées, la plateforme devait idéalement proposer des “thématiques” (avec un format tableau de bord), adressées à des acteurs spécifiques :

  • Collaboration” : regroupe des données sur l’équipement numérique des établissements avec des données disponibles en open data sur les tiers-lieux, les bibliothèques, et les associations , afin que directeurs d’établissement et professeurs prennent conscience de l’écosystème qui les entoure

  • “Urgence” : regroupe toutes les variables qui témoignent d’un retard dans le numérique (ex: équipement de plus de 5 ans, pas de maintenance informatique, pas de ressources numériques, faible débit), visibles d’un coup d’œil pour les recteurs, avec une identification des problèmes de chaque lycée.

  • Pilotage numérique” : indique aux directeurs d’établissement leur situation en termes d’équipement (terminaux par élève, débit, numérisation des process…) par rapport aux autres établissements.

L’équipe s’est concentrée sur le premier point du fait de la technicité des données et du temps imparti.