Actualité

Fraude fiscale et sociale : l'urgence d'un vrai datamining

La traque de la fraude fiscale ainsi que la traque de la fraude sociale, sont devenues aujourd'hui des objectifs centraux des pouvoirs publics dans le cadre contraint de nos dépenses et de nos recettes publiques. Récemment, la délégation nationale de lutte contre la fraude, organisme « inter-services » rattaché à Bercy, publiait son rapport annuel, le Bilan 2013 de la lutte contre la fraude [1], mettant en exergue les bons résultats des contrôles fiscaux et sociaux, mais également l'écart très important entre les sommes redressées et recouvrées et les montants de fraude estimés : de l'ordre de 10% s'agissant de la fraude fiscale et de 3% s'agissant de la fraude sociale. Ce qui pose à nouveaux frais la question du Big Data et de son exploitation intelligente, le datamining. Dans ce domaine, malheureusement, il semble que pour la France, les projets soient timides et bien inférieurs aux enjeux.

Un très fort écart entre la fraude détectée et la fraude estimée

Ainsi, le Bilan 2013 met en exergue :

  • Une fraude fiscale détectée à 3,42 milliards d'euros pour 2013, accompagnée d'une notification de pénalités de 2,4 milliards d'euros (DGFiP), ainsi qu'une fraude douanière enregistrée de 403,7 millions d'euros (pour un contrôle fiscal rapportant 18 milliards d'euros de droits constatés et pénalités [2]) ;
  • Une fraude détectée des organismes de sécurité sociale ayant atteint 636,1 millions d'euros, ce montant se décomposant en 327,3 millions d'euros de fraude aux prestations et 308,8 millions d'euros de fraude aux cotisations/lutte contre le travail illégal [3] ;
  • Une fraude détectée à Pôle Emploi de 58,67 millions d'euros.

L'ensemble représente donc une détection de fraude de l'ordre de 6,9 milliards d'euros où la fraude fiscale représente près de 90% des montants isolés.

Il faut cependant mettre en parallèle cette fraude détectée avec la fraude estimée statistiquement par les pouvoirs publics :

  • S'agissant de la fraude fiscale, les estimations du manque à gagner en matière de TVA (méthode dite de « post-stratification [4] ») sont évaluées entre 9,1 et 10,5 milliards [5] d'euros ; s'agissant de l'IS, une estimation a pour la première fois été réalisée à partir des résultats des contrôles fiscaux 2012, mais n'a pas été publiée. La seule estimation globale de la fraude fiscale représentant environ 60 milliards d'euros doit être retrouvée dans le rapport Dupont-Aignan/Bocquet, du 9 octobre 2013 [6].
  • Côté fraude aux cotisations sociales, les estimations de l'ACOSS pour l'année 2012, suivant en cela la même méthodologie que le CPO (conseil des prélèvements obligatoires) pour l'année 2004, donne une estimation pour 2012 entre 20,1 et 24,9 milliards d'euros (sur champ large incluant l'UNEDIC et les cotisations de retraites complémentaires obligatoires), dont 16,8 à 20,8 milliards sur le champ stricte de la Sécurité sociale [7].

On vérifie donc que les éléments « détectés » par les services compétents en matière de fraude fiscale comme de fraude aux cotisations et prestations sociales sont extrêmement faibles par rapport à leur estimation statistique : de l'ordre de 10% pour la fraude fiscale et pour la fraude sociale de l'ordre de 3%. Il existe donc véritablement une marge de progression très importante en matière de renforcement de la capacité de contrôle, de croisement des fichiers et d'initiatives favorisant la mutualisation des données. C'est dans ce contexte que le « datamining » - que l'on peut définir comme un balayage des données à l'aide de fonctions de recherche paramétrées, ainsi que la mise en correspondance de ces données (datamatching) et leur partage (datasharing) entre les administrations compétentes - devrait constituer un axe stratégique essentiel de modernisation des contrôles.

Le Datamining en matière de fraude fiscale et sociale est-il véritablement mis en œuvre ?

En France, les services administratifs ont du mal à exploiter les compétences issues du privé, et préfèrent développer leurs outils « en interne ». Une tendance qui, en matière informatique a déjà débouché sur le pire notamment avec le projet LOUVOIS de paie des armées. Une tendance qui explique que certains développements prennent en réalité des années.

  • Exemple 1 : le CFVR (ciblage de la fraude et valorisation des requêtes) : ce dispositif est porté par la mission « requêtes et valorisation » exploitant les données de la DNEF (Direction nationale des enquêtes fiscales) (11 fichiers fiscaux existants). La mission a été rattachée directement à la Direction générale (DG) des finances publiques. Pourtant, les travaux semblent ne pas avancer bien vite. Si l'autorisation CNIL acquise, la mission a pu être finalement lancée pour 6 mois début 2014 [8], celle-ci a nécessité en urgence un arrêté de prolongation de 6 nouveaux mois en date du 19 septembre 2014 en raison d'une vitesse de développement plus faible qu'escompté. La technique a en réalité été importée à partir d'un outil développé par les caisses d'allocations familiales afin de « cibler » les allocataires présentant des risques de fraude [9], plutôt que développée par des prestataires extérieurs comme en Belgique notamment [10]. Reste à savoir si cette stratégie du « tout interne », ne va pas conduire à porter préjudice à l'efficacité de l'outil, ni à museler ses fonctionnalités pour des raisons de « paix sociale » dans les services, alors même qu'il pourrait constituer un puissant facteur de leur réorganisation. À cet égard, les premières appréciations syndicales sur le CFVR sont assez éclairantes (voir encadré).
Le CFVR suscite déjà quelques réticences syndicales

En réalité, la mission elle-même et l'avenir que pourrait apporter ce nouvel outil suscitent déjà des réticences syndicales : en effet, le succès du dispositif notamment dans le « profilage » des fraudeurs, et la lutte contre les carrousels à TVA pourrait entraîner une modification radicale de l'organisation du contrôle fiscal lui-même. La CGT Finances publiques met en exergue les projets de la Direction générale, s'agissant de la mise en place d'une « sixième Division informatique pour une « meilleure exploitation des données » (…) transverse : (…) servant d'interlocuteur à la mission « requête et valorisation » [11]. Et le syndicat de conclure : «  si nous ne sommes pas opposés à la création de cette 6ème division, nous attendons de voir le fonctionnement du datamining et son apport. » Même inquiétude s'agissant de Solidaires finances publiques. Dans une note d'information d'août 2014 ceux-ci précisent : « La DNEF a été associée à la Mission requêtes et valorisation mise en place à la DG qui a pour but de mettre en œuvre de nouvelles méthodes de détection de la fraude en utilisant le datamining (…). Si la DNEF doit à l'évidence continuer d'y être associée, il faut que ce soit pour y apporter une véritable expertise et non être simplement le fournisseur de données […] Au-delà, le datamining doit être un outil de plus au service de la recherche et de la détection de la fraude et ne doit donc pas se substituer à la présence sur le terrain. ».

  • Exemple 2 : SUPTIL (outil partagé de suivi des procédures de travail illégal) : le comité national de lutte contre la fraude, dans une communication du 14 décembre 2010 mettait en avant la constitution d'un nouvel outil de partage d'informations entre les services chargés de la lutte contre le travail illégal. L'enjeu était d'importance dans la mesure où celui-ci représente le plus gros de la fraude sociale estimée (entre 15,4 et 22,9 milliards d'euros). La mise en place d'une base de données nationale avait été lancée en 2008, et c'était l'URSSAF de Paris-Région parisienne qui devait se charger de la maîtrise d'œuvre. Celle-ci sera finalement abandonnée en 2012 [12], sans que cet axe pourtant structurant de la lutte contre les fraudes Etat-ACOSS, ne soit particulièrement mis en lumière par les pouvoirs publics, ni que soient explicitées les difficultés techniques rencontrées dans le cadre du Bilan triennal COG 2010-2012 : « le projet consistant à mettre en place un outil inter administratif de suivi des procédures LCTI [lutte contre le travail illégal ndlr] a été abandonné ». Il est donc particulièrement urgent de remettre sur pied cette initiative. Le fait de passer comme actuellement uniquement par une information mutualisée par l'intermédiaire des CODAF (comités opérationnels départementaux anti fraude) qui sont les démembrements territoriaux de la DNLF (Direction nationale de lutte contre la fraude), ne peut se comparer à un outil national mutualisant les informations concernant l'ensemble des procédures lancées. Il s'agit en outre d'un secteur où les gains en matière de lutte contre la fraude sont les plus importants, la fraude aux cotisations issues du travail illégal ne représentant que 300 millions détectés en 2013 soit 1,5% de la fraude liée au travail dissimulé (sur le champ sécurité sociale).
  • Exemple 3 : Le très lent déploiement du fichier RNCPS : mais pour le répertoire national commun de la protection sociale, il ne s'agit pas en tant que tel de datamining. Le logiciel vise plutôt à lutter contre la fraude aux allocations sociales, qu'aux cotisations qui ne seront pas concernées par le dispositif et son rôle devrait être préventif. Il s'agit donc d'un outil de lutte visant à empêcher la dépense « frauduleuse » et non d'un outil de lutte afin d'augmenter l'assiette taxable. Cependant, au vu de la lenteur de déploiement dont il fait l'objet, il est curieux que les pouvoirs publics n'aient pas la possibilité d'effectuer un « bouclage » entre cet outil et les autres dispositifs sus-mentionnés (notamment parce que des travailleurs fictifs ou frauduleux sont peut-être en même temps de vrais/faux allocataires etc.).

Des trous béants de contrôle subsistent

On le voit donc, les initiatives sont encore très timides. Il existe par ailleurs un « ventre mou » du datamining puisqu'il n'y a aujourd'hui aucun projet concret de « datamining » mené par l'ACOSS ou les URSSAF en parallèle de la mise en place à compter du 1er janvier 2016 de la déclaration sociale nominative qui devrait normaliser dans un document unique l'ensemble des déclarations encore aujourd'hui disparates que doivent remplir les entreprises.

Mais les lacunes sont en réalité plus profondes. Ainsi la Cour des comptes dans son rapport relatif à la Sécurité sociale 2014 a-t-elle pu mettre en évidence qu'il existait dans le secteur de la sécurité sociale, une véritable inertie aux contrôles :

  • Une stratégie très insuffisante de contrôle de la part de la MSA (mutualité sociale agricole). Dans ce secteur, la coordination est très insuffisante avec les services fiscaux, bien qu'une coordination plus rapprochée soit en route, notamment à partir de 2015, avec la communication par la DGFiP, via son Centre national de transfert des données fiscales, des bénéfices forfaitaires des non-salariés agricoles, ce qui devrait permettre un « pré-remplissage » des déclarations sociales de revenus professionnels, mais :
    • La MSA n'a pas établi de méthodologie commune de contrôle, ou des analyses de risques préventives ;
    • Elle n'a pas spécialisé d'agents dans le contrôle de cotisations.
  • S'agissant des travailleurs indépendants non-agricoles (régime spécial des indépendants), il n'existe toujours pas de procédure permettant de recouvrer des cotisations frauduleusement éludées dans des situations de dissimulations partielles d'activité. Cela suppose que les données fournies par les services fiscaux ne sont tout simplement pas exploitées par les services du RSI. En conséquence, il n'existe pas encore à l'heure actuelle, de politique active de contrôle (par les organismes sociaux) des travailleurs indépendants ;
  • Par ailleurs, les redressements prononcés par les URSSAF ou le RSI n'entraînent aucun examen des cotisations de retraite, alors que leur élision à souvent lieu dans le même mouvement ;
  • Il n'existe pas à l'ACOSS de structure chargée du contrôle spécifique des déclarations sociales des grandes entreprises ;
  • Enfin, plus largement en matière de lutte contre le travail illégal (LCTI), il n'y a pas aujourd'hui d'outil permettant le rapprochement des déclarations annuelles des données sociales avec les bordereaux récapitulatifs de cotisations. Cela veut donc dire qu'il n'existe pas encore de dispositif analogue (en matière de TVA notamment) au CFVR fiscal sur le plan social. Or non seulement un tel dispositif est nécessaire, mais son interconnexion avec le CFVR (lorsque celui-ci sera pleinement déployé) sera indispensable si l'on veut faire une chasse active aux entreprises fictives ou à durée de vie programmée (notamment s'agissant du travail au noir).

Conclusion

Les enjeux du datamining pour l'administration fiscale comme pour les administrations de sécurité sociales sont importants et multiples. Le déploiement des outils permettant de renforcer la lutte numérique contre la fraude fiscale et sociale sont encore largement en devenir. Il importe cependant de prendre dès aujourd'hui les bonnes décisions afin de repenser l'architecture des services de contrôles en fonction de ces nouvelles problématiques :

  • Déployer résolument l'outil de lutte contre la fraude à la TVA, le CFVR en communiquant sur les avancées du projet ;
  • Mettre en parallèle une mission symétrique auprès de l'ACOSS et des URSSAF afin de disposer d'un contrôle de cohérence avancé des déclarations sociales ;
  • Reprendre le dossier de l'outil SUPTIL, afin de relancer le partage des données dans la lutte contre le travail clandestin et de l'ouvrir au Big Data ;
  • Régler urgemment l'archaïsme du contrôle de la MSA sur ses propres travailleurs agricoles ;
  • Boucler la stratégie du contrôle sur les indépendants en professionnalisant la fonction au niveau du RSI ;
  • Connecter ces outils avancés avec le RNCPS lorsque celui-ci pourra livrer les informations des montants d'allocations fournies, afin de bien articuler la bascule cotisation/allocation.

[1] Bilan 2013 de la lutte contre la fraude, DNLF, janvier 2015

[2] Voir en particulier la note DNLF, lutte contre la fraude aux finances publiques en 2014 ; même si la présentation entretient la confusion entre performance du contrôle fiscale et constatation de la « fraude » stricto sensu, une erreur n'étant pas assimilable à la fraude par défaut d'élément intentionnel

[3] Op.cit, p.11-12.

[4] Voir le guide des méthodes de la DNLF

[5] Une estimation bien inférieure à celle de la Commission européenne s'agissant du VAT gap, voir à ce sujet le rapport de juillet 2013 et surtout sa remise à jour de septembre 2014 qui met en exergue une fraude à la TVA de l'ordre de 25,583 milliards d'euros en 2012, soit 15% de la ressource collectée.

[6] En réalité sur la base du rapport du syndicat Solidaires Finances publiques, relatif à la fraude fiscale, de 2013, p.20.

[7] Voir l'analyse détaillée donnée sur cette question par la Cour des comptes dans son rapport Sécurité sociale 2014 de septembre 2014, qui reprend en particulier les chiffres de la DNLF, non encore publiés à l'époque, p.129,

[8] Délibération n°2014-045 du 30 janvier 2014 de la CNIL, portant avis sur un projet d'arrêté portant création par la DGFiP d'un traitement automatisé de lutte contre la fraude dénommé « ciblage de la fraude et valorisation des requêtes », J.O., 6 mars 2014. Un arrêté du 21 mars 2014 lancera officiellement l'étude du traitement automatisé.

[9] La cheffe de mission, Mme Cécile Vandamme, administratrice des finances publiques était auparavant affectée à la direction spécialisée des finances publiques de l'APHP en charge notamment des services facturiers.

[10] Voir notre note du 15 mai 2014

[11] Compte rendu du groupe de travail, 4 octobre 2013

[12] Voir à ce propos Bilan triennal COG 2010-2012, COG 2010-2013, Etat-ACOSS p.34. ; ainsi que le rapport de l'IGAS 2014 sur la COG elle-même, http://www.igas.gouv.fr/IMG/pdf/201…