Je voudrais revenir sur l’Open Data d’autant que je viens de regarder le tweet de Cyril Lage qui propose une interview de Dominique Cardon sur ce sujet.
D. Cardon est un sociologue connu dont les travaux sont intéressants. Mais lorsqu’on écoute son discours sur l’Open Data on doit se dire qu’il y a pas mieux pour torpiller un projet. Il existe plusieurs façons de saboter un projet dont s’opposer à lui de toutes ses forces, mettre des obstacles à chaque pas et déclarer que le projet est merveilleux et ne peut que conduire au meilleur des mondes. Mais la meilleure façon est de faire comme si l’objet du projet était connu ou parfaitement déterminé. Or rien n’est moins connu que le terme de “data”.
J’ai déjà écrit dans Edgeryders que l’on devrait faire comme si nous ne savions pas ce que veut dire “Open Data” et qu’il fallait construire l’objet en utilisant par exemple la modélisation non-standard. Mais prenons maintenant “data”? Qu’est-ce que c’est?
Des quantités, des qualités? Mais pourquoi pas les raisonnements qui ont permis de traiter ou d’obtenir ces quantités et ces qualités? Comme ce sont des chaînes algorithmiques, computées ou non, nous pouvons les prendre pour des données, structurées. Mais pourquoi ne pas considérer que les “data” sont aussi les connaissances mobilisées pour traiter ces données ou les obtenir ou d’autres “données” venues de l’extérieur mais de manière masquée.
Enfin de compte l’Open Data ne devrait-il pas être de rendre clair et disponible l’ensemble des informations utilisées et produites par des gouvernements, leurs administrations, etc.? Les data ne sont pas seulement des collections de quantités ou de qualités.
Négliger cela revient, ce que j’ai déjà écrit, à fournir du “raw material” à des gens qui ne pourront rien en faire et qui, après avoir essayé de l’utiliser, s’en remettront à des spécialistes, c’est-à-dire de gens qui rendront nécessairement les mécanismes d’action, de prise de décision, obscurs, non partagés et partageables par la communauté.
Bien sûr, pour créer une nouvelle industrie, de nouveaux marchés, faire ainsi est une bonne voie. Toute industrie a besoin de “raw materials” et a tendance, puisque les industries sont en compétition, a préférer que ces matières premières ne puissent être traitées que par des spécialistes. Et personne ne souhaite que l’on considère ces modes de raisonnement comme des données, des datas.
Mais est-ce une bonne voie dans le cadre d’un OpGov? J’en doute. J’en doute parce qu’en ne rendant pas claire la façon qu’à une administration, un politique, de traiter des informations et d’en tirer des conclusions, des propositions d’action, nous, citoyens sommes réduits à l’impuissance ou à l’invective. Par contre en ayant accès à cette sorte de data, nous pouvons d’abord vérifier si le process a été bien mené, si les data utilisées pour traiter d’autres data sont de qualité et nous pouvons aussi nous approprier ce process pour traiter à notre tour d’autres data. Vous me répondrez que ce transfert doit se faire à l’école. Mais déjà il faudrait que cette sorte de donnée soit accessible pour pouvoir être enseignée et je ne vois pas pourquoi elle serait le bien des pédagogues.
Si nous devons être dans une société dite de connaissance nous ne pouvons pas garder les data qui permettent de traiter d’autres data comme des biens personnels ou des produits de peu d’intérêt. Et si nous voulons qu’un gouvernement ouvert fonctionne, les data doivent être définies, qualifiées, avant d’être mises à disposition. Et nous devons pouvoir vérifier la qualification donnée.
Nous avons besoin de données de qualité et non de quantité de données en fin de compte informes.