Ouverture des données de santé : vitale
Criminel ! C'est le terme employé par André Loth, co-auteur du rapport à Marisol Touraine, ministre de la Santé, sur « la gouvernance et l'utilisation des données de santé ». Un terme fort pour qualifier les conséquences d'un blocage éventuel des recherches faute d'accès aux données médicales existantes. C'était aussi le terme utilisé par la Fondation iFRAP dans son intervention sur « l'Open data » dans le secteur de la santé. Alors pourquoi ce sujet avance-t-il si lentement ? Par précaution ?
Criminel n'est sans doute pas exagéré puisqu'une exploitation simple des données médicales aurait permis de détecter rapidement les dérives dans l'utilisation du Mediator, de la pilule Diane 35 ou de la Méthadone, et donc d'en limiter fortement les conséquences dramatiques. Trois cas découverts par hasard qui rendent très probable l'existence de nombreux autres ignorés. Mais l'utilisation de ces données va bien au-delà de la possibilité de détecter des problèmes. Elle permet aussi d'accélérer la recherche médicale fondamentale et appliquée, d'améliorer le traitement des malades et la prévention de tous, et de réduire les dépenses de soins. Une technique qui permet d'attaquer une nouvelle dimension de la médecine, celle de la complexité du très grand nombre, du temps long et des multi-traitements. Tout le monde en est convaincu, mais, là comme ailleurs, le « zéro risque » bloque la mécanique. Une situation d'autant plus choquante que la France posséderait la meilleure base de données du monde dans ce domaine, avec un excellent suivi des personnes à travers le temps, mais sous-utilisée.
Exploiter les données médicales : pour quoi faire ?
- Évaluer la performance des traitements en phase de recherche et en phase d'exploitation,
- Évaluer les performances des équipes de soins,
- Mesurer le suivi des traitements par les patients,
- Connaître le mode de prescription par les médecins,
- Évaluer les effets des traitements multiples,
- Étudier la trajectoire des malades sur le moyen et long terme,
- Guider les assurés dans la prise en charge de leur santé.
Confidentialité : un problème réel mais surestimé [1]
Les données individuelles de santé sont stockées dans de nombreux cabinets et établissements médicaux, dans les fichiers de la CNAM et, en partie, dans ceux de nombreuses assurances complémentaires. On n'a pourtant constaté ni fuite à partir de ces sources, ni attaque informatique ou à main armée de leurs dépositaires. Le risque existe-t-il ? Oui, après une simple anonymisation des noms des personnes, il est possible, en connaissant par ailleurs des données précises sur les événements médicaux d'une personne (exemple : nature, date et lieu des traitements), de l'identifier dans les fichiers. Mais d'une part, des procédés d'anonymisation plus raffinés peuvent être réalisés (les régions et le nom de établissements de soins peuvent être supprimés pour les études qui ne s'intéressent ni à l'impact de la géographie ni à celui du type d'établissement). Et d'autre part, il existe des lois pour réprimer ces éventuelles violations de la confidentialité, comme il en existe pour punir les autres délits : le risque de se faire écraser n'empêche pas de sortir dans la rue.
Dans des domaines un peu similaires, les patrimoines des élus sont désormais consultables par tous les Français, mais ne peuvent pas être publiés sous peine de sanctions ; les données confidentielles possédées par les banques, les organismes de crédit, les gestionnaires des cartes de crédit, n'ont jamais posé de problème majeur ; les fonctionnaires du fisc, les avocats ou les notaires ont aussi accès à des données très personnelles, sans créer de scandales. Il faut croire que la déontologie plus des sanctions dissuasives sont efficaces. Dans tous ces secteurs, aucune bavure sérieuse n'a été constatée, sauf quand l'État a accepté des données volées et divulguées par des salariés de banque malhonnêtes.
Détournement : un problème réel mais transitoire
L'autre crainte exprimée par les dépositaires actuels de ces données, est qu'elles soient mal utilisées. C'est la raison invoquée par la CNAM pour avoir fait interdire la reprise par d'autres sites Internet des tarifs des médecins qu'elle publie. Sa première crainte concerne la diffusion d'informations de mauvaise qualité : les tarifs étant mis à jour très souvent, les sites extérieurs risqueraient de publier des informations inexactes, et les données de la CNAM étant déjà des synthèses, les sites extérieurs risqueraient d'en tirer des conclusions erronées. Sa seconde crainte est que ces informations soient détournées : la CNAM a constaté que des données qu'elle avait fournies pour une étude ont été réutilisées ailleurs de façon qu'elle estime tendancieuse et erronée. Ces arguments de « mauvaise » utilisation sont généralement rejetés. Notamment dans le monde Internet, la multiplication des utilisateurs des données médicales aboutit à faire émerger des sources d'information reconnues et crédibles. Les autres disparaissent. Les motivations de la CNAM sont sans doute autres.
Accès aux données : un problème réel mais soluble
La procédure envisagée semble être de créer un guichet où les organismes désirant utiliser des données de santé, entreposées par exemple dans les établissements de soins ou à la CNAM, déposeraient leurs demandes à un organisme indépendant. C'est la procédure appliquée à l'étranger qui semble inévitable et raisonnable, mais qui soulève cinq questions :
- Quels organismes ?
Ces données sont nécessaires aux établissements de soins, aux organismes de recherche, aux producteurs de médicaments et de produits de santé, aux assureurs santé et à des sociétés spécialisées dans le traitement des informations, qu'ils soient publics ou privés. Les possibilités ouvertes par les nouvelles techniques d'analyse de données massives font que de nombreux organismes sont prêts à développer de multiples projets d'études dans ce domaine. Comme dans tout secteur innovant, seul un foisonnement des intervenants permettra de découvrir les meilleures idées.
- Homologation par projet ou par organisme ?
Les organismes intéressés conduisent souvent de très nombreux projets en parallèle (des dizaines voire des centaines par an) et ont donc besoin d'une homologation globale et non pas au coup par coup.
- Gratuit ou payant ?
Mis à part le cas de fichiers « généraux » utilisables par de nombreux projets, la préparation des fichiers spécifiques, extraction des données correspondant aux caractéristiques demandées, a un coût. Il est normal qu'il soit payé par les organismes demandeurs. Comme dans les autres domaines, la Fondation iFRAP est en revanche opposée à un prix correspondant à la valeur des données elles-mêmes. La gratuité est de règle pour ces données publiques comme pour les autres [2].
- Délai en semaines ou en années ?
Les délais actuels, pour des organismes de recherche reconnus, sont très excessifs (ex. 18 mois). Un délai acceptable, celui qui existe au Danemark, est de deux à trois mois.
- Public vs. privé ?
La possibilité de privilégier les acteurs publics (plus vite, moins cher) par rapport aux privés ne serait pas acceptable. Quel que soit l'utilisateur de ces données, l'objectif est soit de faire avancer les connaissances médicales soit d'améliorer les performances économiques du système de santé, et le plus souvent les deux. Une distinction public / privé serait d'autant plus difficile à admettre que les recherches sont très souvent réalisées en coopération ou en sous-traitance par des organismes publics et privés.
- Suivi des traitements, des patients ET des professionnels ?
Ces données peuvent aussi être utilisées pour contribuer à l'amélioration des performances des professionnels de santé. Il est certainement utile pour un médecin de connaître le résultat de ses traitements, et comment il se situe par rapport à ce qu'obtiennent ses confrères. Au Royaume-Uni, des données sur la performance par service sont déjà fournis au public, avec des avertissements sur la façon de les interpréter (ex. les services qui traitent les cas les plus graves ont plus de décès). En France les rapports des audits conduits par la Haute autorité de santé (HAS) sont rendus publics, mais ne décrivant que les moyens mis en œuvre et pas les résultats obtenus, ils restent assez formels.
2005 - 2013 : Réflexion
2014 : Action
Le système de santé français est toujours bien classé dans les palmarès internationaux, mais est confronté à plusieurs problèmes : mécontentement des professionnels de la santé, déficit, injustices et confusion des patients. L'exploitation des données médicales peut être un puissant levier pour traiter ces dysfonctionnements, et constituer un progrès sans doute aussi décisif que la découverte de la vaccination par Pasteur ou celle de la pénicilline par Fleming. Aussitôt le rapport Bras/Loth reçu le 3 octobre 2013, la ministre a commandé une étude à Franck Von Lennep (directeur de la recherche, des études, de l'évaluation et des statistiques – DREES) sur « la sécurité des données de santé », « la faisabilité juridique et pratique des propositions sur le contrôle d'accès aux données » et « les modalités de gestion des bases de données ainsi constituées ». Notre pays ne peut plus attendre, alors que la CNIL s'est prononcé dès 2007 sur l'identifiant à utiliser pour identifier chaque personne en respectant son anonymat.
D'autres pays (ex. Danemark et Royaume-Uni de façon centralisée, États-Unis de façon décentralisée) se sont déjà lancés dans cette voie de progrès pour la santé et de développement d'une nouvelle industrie numérique du traitement de ces informations.
Rapport de Pierre Bras, inspecteur général des affaires sociales, la gouvernance et l'utilisation des données de santé, rédigé avec le concours d'André Loth.André Loth a été très impliqué dans la mise en place du programme de comptabilité analytique des soins dans les hôpitaux publiqus (PMSI) puis de la Tarification à l'activité (T2A). Il est Directeur de projet à la Direction de la recherche, des études, de l'évaluation et des statistiques (DREES), service rattaché au Ministère des Affaires sociales et de la Santé.
[1] Conférence au Collège des économistes de la santé (15 mai 2014)
[2] Même si des acteurs privés semblent accepter de payer pour ces données, sans doute pour accélérer la mise en place de ce guichet.