De toute façon, on ne peut pas activer la CADA dans ce cas.
Aujourd'hui, on réfléchit à la vente de données brutes par certains services publics « moins administratifs », si j'ose dire, tels Météo France ou l'IGN, au regard du principe de gratuité des documents administratifs, mais j'ai tendance à considérer que ce cas de figure n'était pas celui visé par le législateur. On a montré, de manière assez probante, qu'il valait mieux laisser circuler les données pour que les gens s'en emparent et que les innovateurs innovent : c'est ainsi que l'on produit le plus de valeur économique et sociale. Cela dit, un tel raisonnement ne résulte pas d'une grande réflexion sur les infrastructures-clés et les biens communs, et plus l'économie va se fonder sur les données – en particulier celles créées par le service public, plus nous aurons de problèmes à résoudre.
Indiquer ce que devrait contenir une future loi n'est pas aisé, la principale difficulté consistant à déterminer la nature des données ayant vocation à être rendues publiques. Aujourd'hui, à partir des cartes de cantine électroniques des fonctionnaires, on est en mesure de déterminer le nombre de calories consommées en moyenne par chaque agent public ; cet exemple est révélateur du fait que les données les plus intéressantes sont souvent celles issues de l'informatique de gestion – donc les plus banales en apparence –, et non de l'informatique de décision. La Direction interministérielle des systèmes d'information et de communication (DISIC) a publié il y a quinze jours un nouveau plan stratégique qui me paraît très prometteur, ayant pour objet l'architecture des systèmes d'information, les interfaces de programmation (Application Programming Interface, ou API) et les plates-formes.
Pour la préservation des biens communs, on a le droit de jouer aussi sur les conditions juridiques elles-mêmes. Aujourd'hui, pour le service public administratif, Etalab encourage les licences les plus ouvertes possibles – une décision interministérielle est allée dans ce sens –, ce qui implique une mise à disposition sans conditions des données. La communauté OpenStreetMap a exprimé la crainte qu'un opérateur géant ne s'approprie les données rassemblées grâce au travail de ses contributeurs, pour ensuite effectuer seul toutes les mises à jour. C'est ce qui est arrivé à l'IGN qui, après avoir vendu ses fonds de cartes pour 14 millions d'euros à Google, s'est entendu dire qu'on se passerait de lui pour les mises à jour, le réseau des téléphones Android étant parfaitement suffisant pour recueillir les données nécessaires – et désormais, les innovateurs délaissent l'IGN pour recourir à Google Maps. Pour éviter cela, nombre de collectivités locales, ainsi que certaines communautés telles OpenStreetMap, ont opté pour des licences share-alike, prévoyant que l'utilisateur d'une donnée ait l'obligation soit de remettre le fruit de son travail au pot commun, soit de payer.
Sans aller jusqu'à exposer des business models, il me semble qu'il convient de tracer dès maintenant des trajectoires de pérennisation du bien commun par ceux qui, parce qu'ils en tirent le plus de profit, ont intérêt à agir. Prévoir de tels mécanismes est utile dans certains cas – certainement pas dans ceux de la base de données des adresses des lycées de France ou encore de la base des prix de l'essence relevés par la DGCCRF, mais dans les situations où il est nécessaire d'investir durablement dans la mise à jour. J'ai mentionné tout à l'heure les compteurs électriques intelligents, qui ont une grande valeur potentielle, mais qui nécessiteront des investissements considérables pour anonymiser de manière irréversible les données qu'ils produiront – ce qui ne représente pas une nécessité de service public pour EDF.
Il existe plusieurs stratégies permettant de faire payer celui qui tire le plus de profit de l'exploitation des données, qu'il s'agisse de la mise en place de plates-formes, d'un système de freemium, ou encore d'API progressives, en ce qu'elles établissent une tarification différente en fonction de la fréquence à laquelle la base de données est sollicitée par l'usager – il est possible, par exemple, de fixer un seuil à cinq appels par heure. Il est difficile d'être plus précis sur ce point, la plupart des cas ayant vocation à être examinés au cas par cas.
Tout ce que je viens d'évoquer est d'ordre technique et ne recouvre pas l'aspect juridique des choses. Comme l'a indiqué le Conseil d'État, il n'y a pas d'obligation légale pour une administration de mettre en oeuvre des moyens de mettre à disposition des citoyens – et éventuellement de valoriser – les données se trouvant en sa possession. Quant à la loi sur les documents administratifs, elle se rapporte uniquement aux données de l'informatique de décision, et non à celles de l'informatique de gestion, qui ont pourtant souvent plus de valeur.
Sur ce point, je conclurai par une anecdote. Quand la Ville de Paris a voulu mettre en place son portail open data, elle a souhaité qu'y figurent tous les secteurs d'activité de la ville, y compris celui de la culture. Les responsables de ce secteur ont estimé qu'il était impossible de partager la moindre donnée, partant du principe que les oeuvres étaient protégées par la propriété intellectuelle. Cela a duré un an ou deux, jusqu'à ce que quelqu'un s'avise du fait que les données recueillies par le biais des cartes de bibliothèque électroniques avaient en réalité une grande valeur en termes de sociologie culturelle. Comme vous le voyez, il ne serait pas facile de fixer dans une loi quelles sont les données ayant vocation à être partagées.