Le data-mining à la DGFiP

16 décembre 2020

Le bureau SJCF-1D, créé le 1er octobre dernier dans le cadre de la mise en place du nouveau service de la sécurité juridique et du contrôle fiscal reprend les attributions de la Mission Requêtes et Valorisation (MRV). Il est notamment chargé de la conduite du projet CFVR (ciblage de la fraude et valorisation des requêtes). Ce projet, qui a fait l’objet, en 2017, d’un financement par le FTAP (fonds de transformation de l’action publique) de 5 millions d’euros a pour objectif d’améliorer l’efficacité des opérations de contrôle fiscal en rénovant la phase de ciblage des opérations.

Source : e-FiP, le e-journal de la DGFiP / Novembre 2020 /

La phase de ciblage des opérations placée en amont du processus de contrôle, détermine, en grande partie les résultats de l’ensemble de la chaîne du contrôle fiscal. La DGFiP dispose d’un volume important de données dans des domaines variés, concernant à la fois les entreprises et les particuliers. C’est pourquoi elle a entrepris, depuis quelques années de moderniser ses techniques d’analyse. Le data-mining consiste à analyser et à recouper toutes les informations dont la DGFiP dispose aux fins d’y repérer des profils de fraude. Ces travaux mettent en œuvre des techniques d’apprentissage automatique qui ont pour but d’identifier, par des méthodes statistiques ou mathématiques, les critères caractérisant une personne fraudeuse et établir ainsi un profil de fraude qui sera appliqué à une population cible.

À côté de ces techniques avancées, le bureau SJCF-1D met à profit les effets de décloisonnement permis par l’existence d’un entrepôt de données unique pour détecter des anomalies simples (incohérences entre différentes déclarations, erreurs...) ou pour enrichir et automatiser certaines requêtes élaborées au niveau local. L’avantage de cet entrepôt unique est non seulement d’avoir les données figurant dans les applications de programmation utilisées habituellement, mais également de pouvoir aller au-delà de ces applications en croisant leurs informations avec des données plus nombreuses et plus récentes.

Ces travaux sont menés en lien étroit avec les pôles de programmation des DIRCOFI, qui sont chargés d’identifier les attentes des services locaux en matière de programmation et de faire remonter les observations sur les productions. S’agissant des fraudes relatives aux professionnels, cette coopération a permis de construire plus d’une centaine de modèles statistiques ou des requêtes correspondant à autant de risques fiscaux. L’ouverture, depuis le 1er septembre 2020, de la plateforme informatique du bureau SJCF-1D aux pôles de programmation des DIRCOFI, permet également d’approfondir la coordination des travaux et d’augmenter la volumétrie des productions issues du data-mining.

La montée en puissance des contrôles ciblés par le data-mining reposera par ailleurs, en 2021 et 2022, sur l’exploitation accrue des données extérieures aux déclarations fiscales afin d’avoir une vision plus globale des entreprises et des particuliers qui prenne en compte les éléments de contexte (patrimoine et comportement des dirigeants, antécédents fiscaux ...). Dans cette optique, seront notamment exploitées les données des plateformes collaboratives obtenues par la DGFiP et les données collectées sur les réseaux sociaux. Elle s’appuiera enfin sur la réorganisation des circuits de transmission des productions issues du data-mining qui alimenteront directement, à moyen terme les nouveaux outils informatiques qui seront mis à disposition des équipes de contrôle tel que le projet PILAT, qui vise à transformer le système d’information relatif à la chaîne du contrôle fiscal.