class: center, middle, inverse, title-slide # Introduction à l’open data ## Challenge Data ### Datactivist, 2019-2020 --- layout: true <div class='my-footer'><span>Challenge Data, Sciences Po Saint-Germain-en-Laye</span> <center><div class=logo><img src='' width='100px'></center></span></div> --- class: center, middle Cette présentation en ligne : https://datactivist.coop/SPoSGL/sections/IntroOpenData.html Sources : https://github.com/datactivist/SPoSGL/ Les productions de Datactivist sont librement réutilisables selon les termes de la licence [Creative Commons 4.0 BY-SA](https://creativecommons.org/licenses/by-sa/4.0/legalcode.fr). <BR> <BR> .center[<img src="./img/ccbysa.png" height="100"/>] --- ## May the data be with you ! <BR> .center[<img src="https://media.giphy.com/media/3o7aDgsiRMtIlrSZpu/giphy.gif" height="350"/>] --- class: inverse, center, middle ## 1. La nombrification du monde --- Class: ## La pyramide Data-Information-Knowledge-Wisdom .pull-left[ [](https://commons.wikimedia.org/w/index.php?curid=37705247) ] .pull-right[Attribuée à [Russell Ackoff](http://en.wikipedia.org/wiki/Russell_L._Ackoff), 1989 Les données peuvent être des : - faits - signal/stimulis - symboles] --- Class: ## La pyramide Data-Information-Knowledge-Wisdom - Les **.red[données]** sont la matière "brute" d'où naît l'information. - **.red[L'information]** pourrait être définie comme des données qui ont été consignées, classées, organisées, raccordées ou interprétées dans un cadre qui en dégage le sens - En donnant du sens à de l'information, on obtient de la **.red[connaissance]** - En donnant du sens à la **.red[connaissance]** on obtient du savoir --- Class: ## La pyramide Data-Information-Knowledge-Wisdom .center[<img src="./img/competence.png" height="300"/>] _NB : le haut de la pyramide, est parfois remplacé par "compétence"_ --- ## La "nombrification" du monde .pull-left[.reduite[]] .pull-right[ > La numérisation ne serait pas survenue sans une "nombrification" préalable qui consiste à quantifier de plus en plus d'aspects de notre expérience du réel. > **Au commencement était le verbe, il semble à la fin que tout devient nombre.** > Personne ne saurait parler sérieusement de l'état de la société et discuter politique sans se référer aux informations quantitatives.] --- Class: middle, center ## La mise en données du monde - Concrètement, aujourd'hui, quels aspects de votre vie sont mis en données ? -- - Recherches internet, pratiques sportives, consommation énergie, régime alimentaire, trajets dans les transports en commun... - Cette mise en donnée est rendue possible par le développement de .red[**capteurs**] qui viennent collecter et agréger ces données -- - Recherches internet .red[(cookies)], pratiques sportives .red[(montres connectées)], consommation énergie .red[(compteurs connectés)], régime alimentaire .red[(appli type Yuka)], trajets dans les transports en commun .red[(Pass Navigo)]... - La question devient peut-être, *quels aspects de votre vie ne sont pas (encore) mis en données ?* --- Class: ## Les données brutes sont un oxymore .pull-left[ > Les données sont toujours "cuisinées" et jamais tout à fait "brutes" > Les données ont besoin au préalable d'être imaginées comme données pour exister et fonctionner comme telles. L'imagination de ces données implique une base d'interprétation ] .pull-right[  .footnote[© Xavier Gorce 2018]] --- class: inverse, center, middle ## 2. Open data : les grands principes --- ## 07 Décembre 2007 : la rencontre de Sebastopol .pull-left[ 👥 **Quoi ?** Une rencontre de l'Open Governement Group à Sebastopol (Californie), siège des éditions O'Reilly 🎯 **Pourquoi ?** : Influencer le futur président des Etats Unis pour faire avancer l'open data 📜 **Comment ?** En adoptant une déclaration définissant les grands principes de l'Open Government Data ] .pull-right[  ] --- class:middle, center  # Revue des principes --- class: middle, center # 1. Des données complètes ### Toutes les données publiques doivent être rendues disponibles dans les limites légales liées à la vie privée ou la sécurité --- class: center, middle  # BY DEFAULT --- class: middle, center # 2. Des données primaires ### Les données ouvertes sont telles que collectées à la source, non-agrégées avec le plus haut niveau de granularité --- class: middle, center # 3. Des données fraiches (*timely*) ### Les données doivent être disponibles dès qu'elles sont produites --- class: middle, center # 4. Des données accessibles ### Les données doivent être utilisables par le plus grand nombre d’usagers potentiels --- class: middle, center # 5. Des données exploitables par les machines ### Les données peuvent être traitées automatiquement par les machines --- class: middle, center # 6.Des données non discriminatoires ### Elles peuvent être utilisées par tous sans réclamer un enregistrement préalable --- class: middle, center # 7. Des données dans un format ouvert ### Ce format ne doit pas être la propriété d'une organisation en particulier (.xls) et doit être gouvernée par ses usagers --- class: middle, center # 8. Des données dans une licence ouverte ### Idéalement dans le domaine public sinon dans une licence conforme à l'[Open Definition](www.opendefinition.org) : Licence Ouverte (CC-BY) ou ODBL (CC-BY-SA) --- class: inverse, center, middle ## 3. Open data : back to reality --- ## Défi 1 : la découvrabilité des données .pull-left[ > Data findability is a major challenge. We have data portals and registries, but government agencies under one national government still publish data in different ways and different locations.(…) **Data findability is a prerequisite for open data to fulfill its potential and currently most data is very hard to find.** ] .pull-right[  .footnote[https://index.okfn.org/insights/] ] --- class:middle, center  --- ## Défi 2 : le problème de la qualité .pull-left[ >**Government data is usually incomplete, out of date, of low quality, and fragmented.** In most cases, open data catalogues or portals are manually fed as the result of informal data management approaches. **Procedures, timelines, and responsibilities are frequently unclear among government institutions tasked with this work.** ] .pull-right[  .footnote[http://opendatabarometer.org/4thedition/report/] ] --- ## Exemple de données ouvertes: la base SIRENE .center[.reduite2[]] --- ## La base SIRENE : exemple de cas d'utilisation .reduite[.center[]] --- ##Exemple de données ouvertes : les accidents de la route .center[<img src="img/accidents.png" height="400"/>] --- ## Les accidents de la route : exemple de cas d'utilisation .center[<img src="img/marsactu.png" height="400"/>] .footnote[[Carte par Joël Gombin dans Marsactu](https://joelgombin.github.io/marsactu_accidents/chronique.html)] --- class: inverse, center, middle ## 4. Données et usages --- Class: middle, center ## Ouvrir des données à tout prix ? .center[<img src="img/reutilisations.png" height="200"/>] .center[*Nombre de réutilisations connues sur data.gouv.fr (février 2019)*] Or ouvrir des données peut représenter un **coût** pour les organismes publics Pour les convaincre de continuer, il s'agit de .red[**montrer le potentiel et la valeur de ces données**], notamment en repartant des .red[**utilisateurs**] et de leurs .red[**usages**] --- Class: middle, center ## Partir de la demande - Dans un premier temps, il s'agit de bien comprendre les usagers possibles des données publiques. - Cela peut passer par une cartographie des besoins des utilisateurs en définissant des **personas**. Ex ici avec la ville de New-York .center[<img src="img/personas.png" height="200"/>] - Dans un deuxième temps, il faut mettre en place des mécanismes d'échange entre administrations et utilisateurs (fonctionnalité de commentaires et de discussions) --- Class: middle, center ## Challenge data : croiser données et usages ! Vous allés être confrontés à des challenges où il s'agit de - **Valoriser des données existantes** - **Déterminer des usages possibles** à des données ouvertes - **Concevoir des services** utilisant des données ouvertes - **Comprendre les besoins réels d'usagers** pour ouvrir des données - **Concevoir un modèle économique** se basant sur des données ouvertes - **Trouver d'autres données ouvertes** pour les croiser et enrichir des données internes - **Créer des scenarios prospectifs** en définissant l'impact des données sur un secteur --- Class: middle, center ## Challenge data : croiser données et usages ! Données et usages font bon ménage... A vous de réveiller le potentiel de ces données ! .center[<img src="https://media.giphy.com/media/l378fIHIADPMXGwww/giphy.gif" height="300"/>] --- class: inverse, center, middle # Merci ! Contact : [timothee@datactivi.st](mailto:timothee@datactivi.st)