Select Page

Détection des comportements atypiques : Application à la lutte contre la fraude aux prélèvements SEPA

9 July 2024 | Cas client, Data

La norme SEPA en vigueur depuis 2014 simplifie les paiements au sein de l’Union européenne et des États associés en supprimant l’autorisation de prélèvement bancaire grâce au SEPA Direct Debit (SDD). En conséquence de cette simplification, un nouveau type de fraude a émergé : le prélèvement injustifié émis par des établissements référencés comme « créancier SEPA » (entreprises, associations, etc.). Les banques domiciliant ces établissements sont contraintes d’indemniser les victimes jusqu’à 13 mois après le débit. Elles peuvent ainsi subir des pertes financières pouvant dépasser plusieurs millions d’euros en quelques heures.
Ce nouveau phénomène prend de l’ampleur – sa contribution à la valeur totale des fraudes est passée de 0,6 % en 2022 à 2 % en 20231 –, même s’il demeure extrêmement marginal par rapport aux fraudes constatées sur les autres moyens de paiement. Les taux de fraude à la carte bancaire et aux chèques sont estimés autour d’environ 0,05 %, alors que celui aux prélèvements SDD est estimé autour de 0,001 %2. Cette extrême rareté remet en cause l’application de méthodes et d’algorithmes de machine learning éprouvés adressant la particularité des jeux de données déséquilibrés (c’est-à-dire lorsque la proportion de la classe à prédire est sous-représentée par rapport aux autres classes). Square Management a été mandaté par une filiale d’un grand groupe mutualiste pour refondre le système de détection de la fraude aux prélèvements SDD. Pour cela, Square Management s’est appuyé sur les travaux de son centre de recherche, le Square Research Center.

Solution

Le Square Research Center traite l’étude de l’extrême rareté au travers du prisme de la détection des comportements atypiques et, plus particulièrement en matière d’intelligence artificielle, de celui de la détection d’anomalies. Outre la faible production académique, la complexité inhérente à cette problématique peut être exposée par les défis suivants :
  • La définition d’un consensus métier autour de la notion d’atypisme ;
  • La distinction entre donnée atypique et donnée aberrante;
  • L’impact des tendances de fond et de saisonnalité sur la modélisation ;
  • La validation des modèles de détection.

Dans ce contexte, trois axes de recherche et d’application ont été développés.

1. ANALYSE COMPORTEMENTALE

Afin d’alerter en temps réel sur le caractère atypique d’un prélèvement, la première solution a reposé uniquement sur les données concernant la transaction : date d’exécution de l’ordre, montant, IBAN, etc. L’objectif était de capter le comportement « normal » d’un compte et d’observer l’écart entre son comportement normal historique et son comportement à un instant t. Si cet écart est trop important, le prélèvement est dit « atypique » et une alerte est levée. Pour ce faire, la transposition statistique et algorithmique de ces déviations, via l’étape de création de nouvelles caractéristiques, a été longue, mais déterminante.

Square Management a proposé une méthode innovante de transformation des données brutes pour mettre en exergue les évolutions brusques. Les variations de comportement les plus fortes, représentées par les valeurs extrêmes dans la distribution des indicateurs comportementaux ainsi créés, ont alors été désignées comme atypiques.

Le dispositif mis en place est efficient, paramétrable et explicable :

  • Bien que certaines transactions ne soient pas jugées comme frauduleuses après examen a posteriori, la pertinence de l’ensemble des cas remontés a été validée par les analystes ;
  • Les analystes peuvent regrouper les établissements (par secteur d’activité, par chiffre d’affaires, etc.) et ajuster les seuils de détection afin de maîtriser leur charge de travail journalière et en fonction de l’intérêt métier de chaque caractéristique comportementale ;
  • Une information précise est fournie sur la raison pour laquelle une transaction est détectée.

 

Square Management considère l’explicabilité comme nécessaire à toute modélisation afin d’en assurer l’adoption. C’est pourquoi un axe de recherche spécifique lui est dédié au sein du Square Research Center.

 

2. PRÉDICTION DU TAUX DE REJET

Lorsqu’un prélèvement est frauduleux, la victime peut signaler celui-ci à sa banque et demander réparation. Si le signalement est effectué rapidement, la banque de la victime peut rejeter la transaction. Fort de ce constat, un taux de rejet important est suspect.
L’idée, simple, mais efficace, de prédire le taux de rejet à l’aide des données comportementales et du taux de rejet antérieur permet d’anticiper le changement de comportement d’un compte. Néanmoins, dans la mesure où le fraudeur peut faire sortir les fonds pendant le délai entre le prélèvement et le rejet ou la contestation, cette solution sert à évaluer le caractère « à risque » d’un compte et non à déclencher une alerte de manière proactive.

3. MODÉLISATION PAR MOTIFS DE REJET

La typologie des rejets offre une information cruciale sur le caractère frauduleux ou non du comportement d’un compte. Intuitivement, certains motifs de rejet sont considérés comme moins suspects que d’autres : à titre d’exemple, un rejet pour absence de fonds nécessaires à la transaction est considéré comme moins suspect qu’un rejet pour cause de compte clôturé, de contestation ou d’absence de mandat de prélèvement.
La compréhension de la typologie des rejets et la rationalisation de leurs niveaux de légitimité a été possible grâce au recours à des modèles de machine learning non supervisés. Ces modèles ont permis de constituer des clusters – c’est-à-dire des regroupements de transactions homogènes – et de définir un seuil, pour chaque motif de rejet, au-delà duquel un compte doit être placé sous surveillance.

Résultat

Le dispositif de détection par analyse comportementale des comptes constitue un premier rempart efficace contre la fraude aux prélèvements SDD, orientant au plus tôt les analystes vers les cas les plus préoccupants.
Les deux axes de recherche exploitant les rejets ont mené à la création de nouvelles règles dans le dispositif existant, en alertant sur les niveaux de rejets et la distribution des motifs. Ce second rempart, bien qu’efficace, souffre d’un manque de réactivité.

LE

SQUARE MANAGEMENT
  • Un centre de recherche interne, le Square Research Center, focalisé sur les défis de nos clients ;

 

  • Une thématique de recherche en IA couvrant la détection de la fraude : la détection de comportements atypiques ;

 

  • La compréhension rapide des enjeux métiers et techniques de nouveaux scénarios de fraude ;
  • La conception d’une solution de détection efficiente, paramétrable et explicable facilitant la prise de décision des analystes ;

 

  • Le développement d’un outil maintenable et extensible à de nouveaux périmètres ;

 

  • Le respect des standards d’industrialisation de projets data science et la rédaction d’un guide utilisateur ;

 

  • Le pilotage de projets data science en mode Agile.

CONTACT

MICHAËL TOUZÉ

MICHAËL TOUZÉ

Senior Manager en data science

CHRISTOPHE BERTERO

CHRISTOPHE BERTERO

Consultant Chercheur en data science

Share This