Au-delà des expérimentations (conférence nationale) [Open Data Week 2/7]

La conférence nationale du 24 mai 2012 dressait pour la France un état de l’art de l’Open data naissant et essayait aussi d’imaginer des perspectives pour passer la seconde.

La synthèse de ce que j’en retiens en 3 confirmations, 4 leçons et 3 besoins d’approfondissement.

3 confirmations

Les fonctionnaires territoriaux sont de bons professionnels

La présentation en fin de journée du collectif informel Open Data France qui rassemble les collectivités (les plus) engagées dans l’Open data fût assez bluffante sur la masse du travail abattu en si peu de temps (l’Open data n’a démarré qu’en 2010 à Rennes). Parmi ses réalisations, la mise en place d’un référentiel de bonnes pratiques sous licence CC (checklists.opquast.com/fr/opendata) qui permet à chacun de voir où il en est et de se positionner vis-à-vis des autres (opendatafrance.opquast.net/barometers/open-data) dans le cadre d’une démarché qualité itérative.

Présentation du référentiel Qualité

Autre élément à signaler, la vision stratégique développé en PACA, qui ne sont pas des pionniers sur le sujet, et qui cherchent à articuler cette politique d’ouverture des données publiques à la politique d’innovation numérique d’ensemble (clusters, ERIC, schémas locaux et appels à projets, PACAlabs) afin d’assurer cohérence et efficacité à l’action publique.

 

Nécessité de développer la culture de la donnée

La question de l’appropriation des enjeux, potentiels et bénéfices de l’Open data revient comme une ritournelle et rejoint celle du phénomène du Big data, l’existence de masse de données gigantesques liés à notre usage du web : utilisation des moteurs de recherche et des réseaux sociaux (voir ma présentation : Internet, la connaissance parfaite ?).

Cela passe par l’acculturation aux données, qui a depuis longtemps été travaillé à l’école par les profs de math, géo, éco,…, mais qui devient sans doute plus indispensable aujourd’hui.

3 niveaux de compétences sont identifiées :

  • interpréter les données et les résultats obtenus à partir de leur traitement (ne pas confondre causalité et corrélation,…)
  • lecture critique des représentations créées à partir des données (choix d’échelle, de couleurs, de types de graphiques ou infographie,…)
  • reconnaître les limites liées aux données (intentions et conditions de production des données, contextualisation,…)

Atelier sur les modèles de l’Open data avec Simon Chignard (gauche) et Daniel Kaplan (centre)

L’évangélisation et les gourous portent bien leurs noms.

Les nouvelles technologies s’appuient en partie sur un modèle religieux pour leur diffusion : mise en avant de gourous qui montrent le chemin de l’avenir radieux. Ils sont de vrais évangélisateurs qui prennent leur bâton de pèlerin pour aller prêcher la bonne parole dans la société : cette technologie va nous changer la vie (en mieux en principe).

On les reconnaît quand, un peu à court d’idées, ils en arrivent à sortir le non-argument suivant : « la question n’est pas de savoir si vous aller y aller, mais comment y aller ? » (cela marche pour internet, les réseaux sociaux, le mobile, le cloud, l’open data,…). On est quand même très proche du TINA (there is no alternative) de Margaret Tatcher, et les défenseurs de la démocratie devraient s’en inquiéter avant qu’on en arrive au « Ne vous demandez pas ce que l’Open data peut faire pour vous, mais ce que vous pouvez faire pour l’Open data ! ».

 

4 leçons

C’est autant utile en interne qu’à l’externe

Alors que l’open data est a priori prévu pour que les acteurs de la société civile puisse produire de la valeur en réutilisant les données publiques, il apparaît que le travail de catalogage, de structuration, de qualification des données apportent aux collectivités des gains internes pour mieux valoriser les données, communiquer, piloter, aider à la décision. C’est ce qui ressort des actions mises en place par le CG71, département pionnier avec le Loir-et-Cher, qui a notamment produit un outil de visualisation des données à usage interne.

Cela me conforte dans la pertinence d’un outil de capitalisation des données sur les projets en cours pour ma collectivité (avec des vues cartographiques notamment).

 

On a besoin d’outils de visualisation facilement appropriables

La Communauté urbaine de Bordeaux développe l’API CUB (jeu de mots inside), une boîte à outil pour développer simplement des applications cartographiques. L’outil masque la complexité de l’information géographique (formats, projections, mode d’appel) pour l’utilisateur qui choisit d’associer les données sur une même carte sans avoir à gérer les questions techniques. Et cela marche, puisque c’est utilisé par la Direction de la communication, pas spécialement experte technique.

 

La mutualisation entre les collectivités s’accélère

Exemple local où le couple CG – Agglo/Ville qui a décidé de mutualiser sa plateforme de mise à disposition des données va être rejoint par le Conseil régional. C’est sans doute plus facile quand les collectivités ont la même couleur politique, même si ce n’est pas une garantie de réussite. D’ailleurs, c’est une démarche sans doute plus contrainte par les tensions sur les finances publiques (a fortiori pour les Départements) que volontariste.

 

« animation, animation, animation ? C’est plutôt perfusion, perfusion, perfusion »

Lire mon billet à venir : Open Data : pourquoi cet acharnement de la politique de l’offre ? [Open Data Week 5/7]

 

3 besoins d’approfondissement

Les nouveaux champ de pouvoir sont d’abord appropriés par ceux qui ont déjà du pouvoir

« sans appropriation par tous, on risque de renforcer les plus forts » – Simon Chignard

On retrouve ici la même difficulté que dans le champ de la démocratie participative qui tend à donner encore plus de poids à ceux qui sont déjà représentés. On a besoin d’une démarche de capacitation (empowerment) pour que les nouvelles marges de manœuvres soient appropriées par tous (cf le projet d’infolabs).

Concrètement, l’illustration la plus parlante de ce phénomène est celle du marché de l’immobilier. L’ouverture des données publiques permet de mieux informer sur les services publics accessibles dans les différentes quartiers d’une ville (école, crèche, parc, transports en commun,…). L’ouverture de données privées comme celles des banques sur les transactions (à l’exemple des travaux de la BBVA en Espagne) augmenterait alors l’information disponible. Un double biais vient alors renforcer la ségrégation sociale dans l’espace :

  • une asymétrie d’information : ceux qui sont les plus à même d’accéder/analyser ses informations en profitent. C’est un des rares secteur où on voit émerger un modèle économique pour les intermédiaires : agences immobilières, notaires.
  • une accentuation des inégalités : l’information disponible fait monter les enchères pour les quartiers les mieux « quotés » ce qui créée une barrière à l’entrée pour ceux qui ont les revenus les plus faibles.

Mais, d’un autre côté, ces nouvelles données offre aussi un appui pour émettre des revendications politiques et bâtir des politiques publiques en termes d’accès aux services, de logement social,…

Extrait de la présentation de la banque espagnole BBVA

« il faut construire des systèmes qui ne collectent pas les données en premier lieu » (EFF)

Il est intéressant de voir cette préoccupation remise dans un débat où la règle semble être : « plus il y a de données, mieux c’est », et on peut donc remercier Hubert Guillaud, rédacteur en chef d’Internet Actu.

Néanmoins, force est de constater que peu de collectivités semblent réfléchir dans ces termes (voir mon billet sur CapComNet 2011). Même la CNIL semble plus se préoccuper de la transparence sur les données collectées et les traitements que de la limitation de la collecte.

 

Anonymisation des données

Seconde question éthique. Comment développer une anonymisation forte, c’est-à-dire qui garantisse qu’on ne puisse pas identifier une personnes à partir d’un jeu de données ? Si cela est plus compliqué que de simplement retirer les prénoms et noms, il semble qu’il y ait des pistes (voire des solutions existantes) intéressantes comme l’indique une étude présentée lors de la conférence scientifique du vendredi (Non-interactive differential privacy : a survey, David Leoni, LINA lab, Université de Nantes) dont je serai bien incapable de vous rendre compte.

A l’opposé, la question a été soulevée de rendre obligatoire la publicité de données individuelles (qui ne seraient donc plus perçues comme personnelles donc) dans un intérêt collectif (ou intérêt général si on est républicain). L’exemple fourni est celui des consommations énergétique (gaz, électricité,…) dans le cadre de la lutte contre le changement climatique et l’épuisement des ressources.

 

* * *

Voir ma série d’articles consacrée à la Semaine européenne de l’open data, Nantes, mai 2012

Publicités

Étiquettes : , , , ,

3 responses to “Au-delà des expérimentations (conférence nationale) [Open Data Week 2/7]”

  1. schignard says :

    Merci Mickael pour ce billet sur l’open data week. J’ai aussi été frappé par le niveau de professionnalisme mis en place par le collectif open data France…
    J’ai vu ma photo dans ce billet : j’espère que c’est davantage pour illustrer le propos qui précède (sur l’appropriation et la critique des données) plutôt que celui qui suit (sur les gourous). Je pense, avec mon livre et le blog qui l’accompagne, faire preuve aussi de la prise de recul et du regard critique nécessaires et ne pas faire parti des optimistes béats 🙂

    • Mickaël says :

      C’était clairement pour illustrer le propos sur la critique des données qui reprenait ta présentation ce jour-là, et dont tu développes un des points dans le billet En finir avec le mythe de la donnée brute sur ton blog.

      Note : le monde (de l’innovation publique) est petit, j’ai découvert depuis l’Open data week que nous nous étions déjà parlé lors de la préparation de ce billet sur la Transfo Pays de la Loire.

Laisser un commentaire

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion / Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion / Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion / Changer )

Photo Google+

Vous commentez à l'aide de votre compte Google+. Déconnexion / Changer )

Connexion à %s

%d blogueurs aiment cette page :