Actualité

Open data, y-a-t-il un pilote dans l’avion ?

La Cour des comptes vient de publier un référé récent relatif à la valorisation des données de l’IGN, de Météo-France et du CEREMA. Et le moins que l’on puisse dire c’est qu’elle ne mâche pas ses mots : « depuis le 7 octobre 2018, l’ouverture mise en œuvre par les acteurs publics [de leurs données publiques] doit être automatique. » Or la Cour relève « des difficultés récurrentes et multiples pour se conformer à la loi » : ainsi les opérateurs contrôlés ne respectent pas l’obligation de publication des répertoires des principales données détenues, ne mettent pas à disposition du public les « informations publiques » que constituent « de nombreux logiciels et certaines de leurs bases de données », et spécifiquement les « codes sources et paramétrages de certains modèles informatiques de Météo-France », une complexité dans la tarification pour l’IGN et une tarification « hors la loi » pour le CEREMA « qui contrevient à l’article R.324-4-1 du CRPA (code des relations entre le public et l’administration) en vendant des logiciels et des publications hors habilitation à percevoir des redevances. »

Les magistrats de la rue Cambon constatent donc de graves errements qui relèvent pour ces opérateurs soit du viol de la loi (aucune habilitation pour le CEREMA, manque d’homologation pour certaines licences payantes pour Météo-France), absence de répertoire exhaustif des données ouvertes[1], etc. soit à tout le moins de son esprit (licences dérogatoires et temporaires pour l’IGN, complexité des tarifications). Or, ce que pointe plus spécifiquement la Cour, c’est surtout les insuffisances de pilotage de l’ouverture des données.

Mais que fait la DINSIC ?

La Cour le relève, qu’une pléiade d’acteurs est chargée au niveau de l’Etat de la promotion de l’accès aux données publiques : CADA (commission d’accès aux documents administratifs), DINSIC (direction interministérielle du numérique et du système d’information et de communication de l’Etat), l’administrateur général des données, la DRI (direction de la recherche et de l’innovation), du CGDD (commissariat général au développement durable) du ministère de l’écologie.

Chaque acteur, bien évidemment, dispose de sa propre feuille de route et défend ses intérêts, cependant elle relève le rôle central de la DINSIC en matière d’homologation des licences de réutilisation et de vérification de l’obligation « de repartage gratuit des améliorations apportées » par les réutilisateurs (une difficulté qui freine d’ailleurs le processus de réutilisation et encourage au contraire les usages contractuels payants) en cas de souscription d’une licence de réutilisation gratuite. En réalité, faute d’une hiérarchie claire entre les différents « régulateurs » et autorités de tutelle de la donnée publique, des projets s’enlisent. « Un pilotage plus efficace de l’ouverture des données est nécessaire pour éviter l’accumulation d’avis consultatifs, sans qu’une décision soit prise au détriment de projets structurants ».

Un exemple ? La mise en place de la BAN (la base adresse nationale) qui devrait profiter à l’ensemble des acteurs publics et associatifs chargés d’une mission de service public en livrant une base d’adresses unifiées (au bénéfice des services de secours, des entreprises de réseaux et des administrations). Le projet piloté par la DINSIC (mission Etalab) réunit des détenteurs de données (La Poste, la DGFiP) et des représentants de la société civile via l’association OpenStreetMap (OSM). Or, relève la Cour, « ce projet est aujourd’hui inachevé et sans perspective précise d’achèvement, puisque la DINSIC, qui en avait la responsabilité, a constaté son enlisement. » Pire, l’IGN commercialise toujours un produit similaire sous licence ad hoc à titre onéreux, bien évidemment.

Rififi au sommet de la DINSIC

Henri Verdier vient d’être remplacé à la tête de la DINSIC, poste qu’il occupait depuis le 23 septembre 2015, par Nadi Bou Hanna (X-Télécom) à compter du 10 décembre 2018. M. Verdier était par ailleurs depuis 2012 directeur d’Etalab, structure de promotion de l’Open data au niveau de l’Etat, puis nommé administrateur général des données par le décret n°2014-1050 du 16 septembre 2014. L’AGD étant un poste rattaché à l’ex-SGMAP placé à l’époque auprès des services du Premier ministre (aujourd’hui DITP).

L’AGD, directeur de la DINSIC avait donc tout pouvoir pour impulser mais aussi s’assurer du suivi du développement de l’Open data au sein de la sphère publique étatique. Ses compétences le plaçant naturellement à un niveau interministériel. Le constat de la Cour est donc cruel[2] puisqu'elle recommande de : « clarifier la doctrine et les conditions d’application des règles relatives à l’ouverture des données et des codes sources des logiciels, ainsi que celles afférant à la gestion des licences. » Une clarification complexe mais possible qui suppose un portage fort par les pouvoirs publics et l’exercice d’une vraie culture du changement dans les modèles d’affaires de certains opérateurs.

Signe des tensions existantes au sein de la DINSIC, Christian Quest, contributeur à OpenStreetMap et chargé de mission chez Etalab, a démissionné de la DINSIC début février[3].

Interrogé sur ses nouvelles fonctions Nadi Bou Hanna témoigne « ce qui est assez frappant (…) et que j’avais probablement sous-estimé, c’est l’attente extrêmement forte qu’il y avait vis-à-vis de la DINSIC (…) aussi bien en interministériel (DSI, directions métier…) qu’en interne, où il y a aussi je pense un souhait d’avoir des idées claires sur le cap que l’on va construire ensemble. C’est une agréable surprise que de voir que la DINSIC n’est pas une direction qui est simplement de figuration ou en animation.[4] » Le constat de la Cour des comptes est suffisamment clair pour inciter à passer à la vitesse supérieure.

Clarifier la doctrine de l’Etat en matière de données publiques

Or cet appel de la Cour en matière de clarification de la doctrine de l’Etat qui suppose pour être effective - faute d’une autorité régulatrice susceptible de sanctionner les administrations et les opérateurs qui n’appliquent pas la loi en vigueur -, de proposer un changement radical du mode d’affaires des organismes/services (INSEE, etc.) dont les produits de réutilisations constituent un montant significatif de leurs ressources propres.

Sur ce point la réponse du Premier ministre au référé de la Cour semble assez claire : « Cet enjeu me semble (…) dépasser les trois opérateurs étudiés plus précisément par le contrôle et questionner plus globalement les moyens du pilotage et de la gouvernance par l’Etat de sa politique de la donnée au « jour le jour ». C’est un point dont l’Etat s’est insuffisamment préoccupé dans la période récente et qu’il convient de corriger. »

Le gouvernement missionne donc l’IGF et en appui la DINSIC pour un rapport sur le sujet à lui remettre dans les 6 mois. Le problème cependant demeure et reste très complexe à arbitrer :

  • L’IGN par exemple, soutenu par le ministère de l’Ecologie (sa tutelle) « souhaite, avant tout, préserver son modèle d’affaires et ses partenariats et, pour cela, continuer à utiliser des licences commerciales ad hoc, ce qui ne va pas dans le sens de la politique de simplification et d’ouverture menée par la DINSIC. » ;
  • Par ailleurs la transition vers des opérateurs de « services » n’est pas évidente car elle suppose également des investissements importants (rôle de certification pour l’IGN). Ainsi « le renouvellement de supercalculateur pour Météo France, la Géoplateforme portée par l’IGN, etc.)

D’où la réponse du Gouvernement en trois points :

  • La mission IGF/DINSIC devrait permettre de savoir si le basculement vers la gratuité[5] devra être compensé par une augmentation des subventions pour charge de service public (SCSP) des opérateurs concernés afin d’assurer la transition financière de ces entités vers de nouveaux modèles économiques « de service » commerciaux tout en assurant les ressources nécessaires pour qu’ils continuent d’assurer leurs missions de service public (dont la constitution et la diffusion gratuites des données publiques susvisées) ;
  • Le déblocage d’un financement des investissements structurants de ces entités via le PIA (plan d’investissement d’avenir) et le FTAP (fonds de transformation de l’action publique) ;
  • La poursuite d’un calendrier volontariste en matière d’ouverture des données publiques : déploiement du projet BAN à marche forcée avant le 1er janvier 2020 (« dans les plus brefs délais et au plus tard au 1er janvier 2020 sous licence ouverte.) ; généralisation de la gratuité de la réutilisation des données, notamment de l’IGN au plus tard en 2022. « la décision de gratuité, complète à horizon 2022, permettra de simplifier de manière efficace la question de l’utilisation des licences » en permettant le basculement sur licence ouverte, avec un guide opérationnel pour l’ensemble des administrations publiques « sous trois mois ».

Les collectivités territoriales encore loin du compte

Si l’état de diffusion des données publiques au niveau de l’Etat et de ses opérateurs n’est pas brillant (on s’interrogera sur la mise en open data et sous format réutilisable des documents budgétaires, non systématisés sur data.gouv.fr, contrairement aux données INSEE), force est de constater que les collectivités territoriales n’ont pas de meilleurs résultats.

En effet ces dernières dans le cadre de la loi pour une République numérique, avaient deux ans (jusqu’au 7 octobre 2018) pour ouvrir leurs données par défaut. Une ouverture concernant les collectivités de plus de 3.500 habitants et d’au moins 50 agents (ETP)[6]. Les collectivités concernées sont au nombre de 4.510 (métropoles, régions, départements, EPCI, communes). Or l’Observatoire Open Data des territoires[7], dans son pointage d’octobre 2018 mettait en exergue que seulement moins de 8% des collectivités territoriales concernées ont ouvert leurs données publiques[8]. Un nouveau pointage en mars 2019, met en exergue le passage de 343 à 383 pour les collectivités territoriales stricto-sensu et de 450 à 512 acteurs locaux largo sensu. Le taux de collectivités passe donc de 8% à 8,5% ce qui est un frémissement sur 6 mois. A ce rythme il faudra près de 40 ans pour que l’ensemble des collectivités puisse se conformer à la loi. Le chemin de l’open data local est donc particulièrement long, surtout si par « ouverture » on entend la livraison minimale d’un seul jeu de données (rappelons qu’en octobre 1/3 des collectivités avait publié moins de 3 jeux de données et 50% moins de 10 jeux).

Conclusion

Au-delà des constats sévères de la Cour sur le déploiement de l’Open Data chez certains opérateurs, c’est la position faîtière de la DINSIC qui est interrogée notamment dans sa capacité d’impulsion et de réalisation en la matière. Par ailleurs les dispositifs de déploiement n’étant pas assortis de sanctions, il n’existe pas d’incitations à régulariser les comportements contra legem, ni de publier des référentiels communs opposables. La dynamique est malheureusement comparable pour les collectivités où les incitations sont inexistantes et où une contractualisation similaire à celle existant en matière financière n’a pas été déployée s’agissant des données publiques. La Cour relève que les établissements publics producteurs de données sont « depuis des années soumis à une forme d’injonction paradoxale : développer leurs ressources propres, notamment par la commercialisation des données, tout en procédant à leur diffusion gratuite ». Certes, mais alors que le phénomène est connu depuis au moins 10 ans, depuis deux quinquennats où les problèmes avaient été bien cernés dès le départ, c’est le manque d’un acteur majeur décisionnaire assurant la régulation de la donnée (ce que l’administrateur général des données aurait dû incarner) qui aurait dû émettre avec le soutien politique nécessaire les lignes directrices claires en la matière.  Les administrations et les opérateurs au lieu de s’adapter et d’anticiper, ont plutôt cherché à jouer la montre afin de tenter de peser de façon dérisoire dans les arbitrages budgétaires. On arrive cependant à un niveau où des investissements massifs sont nécessaires pour faire évaluer leurs modèles d’affaires alors même que l’on se trouve en pleine disette budgétaire. Il aurait plutôt mieux fallu faire évoluer leur statut vers des entités commerciales (type trading funds) tout en s’assurant du service public de la donnée. Pour les collectivités un processus de contractualisation aurait dû être engagé avec l’Etat sur ce champ afin de mieux développer l’open data local. Enfin, rappelons que « la société civile peut assigner une autorité publique qui ne satisferait pas à l’ouverture des données à compter du 7 octobre. » A bon entendeur...


[1] En vertu de la loi n°2016-1321 du 7 octobre 2016 pour une République numérique sont visées spécifiquement les bases et les données « dont la publication présente un intérêt économique, social, sanitaire ou environnemental », qu’elles soient détenues ou produites, et doivent en outre être répertoriées, accessibles au public et réutilisables gratuitement.

[2] Voir par exemple les écarts entre les intentions pointées dans son dernier rapport annuel disponible et les constats sur les opérateurs et le projet BAN par la Cour, https://www.etalab.gouv.fr/wp-content/uploads/2018/04/RapportAGD_2016-2017_web.pdf

[3] https://www.nextinpact.com/brief/remous-autour-d-une-demission-a-la-dinsic-7898.htm

[4] https://www.nextinpact.com/news/107707-entretien-avec-nadi-bou-hanna-nouveau-directeur-interministeriel-au-numerique-dinsic.htm

[5] Voir le rapport de V. FAURE-MUNTIAN, relatif aux données géographiques souveraines, juillet 2018 http://www.ign.fr/institut/publications-de-l-ign/Institut/Actualites/Rapport_parlementaire/20180713_rapport_vfm.pdf

[6] Et pour les EPCI de plus de 50 agents.

[7] http://www.opendatafrance.net/2019/03/07/observatoire-open-data-des-territoires-mise-a-jour-mars-2019/ ainsi que http://www.observatoire-opendata.fr/

[8] http://www.maire-info.com/numerique/open-data-moins-de-8-des-collectivites-locales-concernees-ont-ouvert-leurs-donnees-publiques-article-22309