Détection des comportements atypiques : Application à la lutte contre la fraude aux prélèvements SEPA
Solution
- La définition d’un consensus métier autour de la notion d’atypisme ;
- La distinction entre donnée atypique et donnée aberrante;
- L’impact des tendances de fond et de saisonnalité sur la modélisation ;
- La validation des modèles de détection.
Dans ce contexte, trois axes de recherche et d’application ont été développés.
Afin d’alerter en temps réel sur le caractère atypique d’un prélèvement, la première solution a reposé uniquement sur les données concernant la transaction : date d’exécution de l’ordre, montant, IBAN, etc. L’objectif était de capter le comportement « normal » d’un compte et d’observer l’écart entre son comportement normal historique et son comportement à un instant t. Si cet écart est trop important, le prélèvement est dit « atypique » et une alerte est levée. Pour ce faire, la transposition statistique et algorithmique de ces déviations, via l’étape de création de nouvelles caractéristiques, a été longue, mais déterminante.
Square Management a proposé une méthode innovante de transformation des données brutes pour mettre en exergue les évolutions brusques. Les variations de comportement les plus fortes, représentées par les valeurs extrêmes dans la distribution des indicateurs comportementaux ainsi créés, ont alors été désignées comme atypiques.
Le dispositif mis en place est efficient, paramétrable et explicable :
- Bien que certaines transactions ne soient pas jugées comme frauduleuses après examen a posteriori, la pertinence de l’ensemble des cas remontés a été validée par les analystes ;
- Les analystes peuvent regrouper les établissements (par secteur d’activité, par chiffre d’affaires, etc.) et ajuster les seuils de détection afin de maîtriser leur charge de travail journalière et en fonction de l’intérêt métier de chaque caractéristique comportementale ;
- Une information précise est fournie sur la raison pour laquelle une transaction est détectée.
Square Management considère l’explicabilité comme nécessaire à toute modélisation afin d’en assurer l’adoption. C’est pourquoi un axe de recherche spécifique lui est dédié au sein du Square Research Center.
Lorsqu’un prélèvement est frauduleux, la victime peut signaler celui-ci à sa banque et demander réparation. Si le signalement est effectué rapidement, la banque de la victime peut rejeter la transaction. Fort de ce constat, un taux de rejet important est suspect.
L’idée, simple, mais efficace, de prédire le taux de rejet à l’aide des données comportementales et du taux de rejet antérieur permet d’anticiper le changement de comportement d’un compte. Néanmoins, dans la mesure où le fraudeur peut faire sortir les fonds pendant le délai entre le prélèvement et le rejet ou la contestation, cette solution sert à évaluer le caractère « à risque » d’un compte et non à déclencher une alerte de manière proactive.
La typologie des rejets offre une information cruciale sur le caractère frauduleux ou non du comportement d’un compte. Intuitivement, certains motifs de rejet sont considérés comme moins suspects que d’autres : à titre d’exemple, un rejet pour absence de fonds nécessaires à la transaction est considéré comme moins suspect qu’un rejet pour cause de compte clôturé, de contestation ou d’absence de mandat de prélèvement.
La compréhension de la typologie des rejets et la rationalisation de leurs niveaux de légitimité a été possible grâce au recours à des modèles de machine learning non supervisés. Ces modèles ont permis de constituer des clusters – c’est-à-dire des regroupements de transactions homogènes – et de définir un seuil, pour chaque motif de rejet, au-delà duquel un compte doit être placé sous surveillance.
Résultat
Les deux axes de recherche exploitant les rejets ont mené à la création de nouvelles règles dans le dispositif existant, en alertant sur les niveaux de rejets et la distribution des motifs. Ce second rempart, bien qu’efficace, souffre d’un manque de réactivité.
LE
- Un centre de recherche interne, le Square Research Center, focalisé sur les défis de nos clients ;
- Une thématique de recherche en IA couvrant la détection de la fraude : la détection de comportements atypiques ;
- La compréhension rapide des enjeux métiers et techniques de nouveaux scénarios de fraude ;
- La conception d’une solution de détection efficiente, paramétrable et explicable facilitant la prise de décision des analystes ;
- Le développement d’un outil maintenable et extensible à de nouveaux périmètres ;
- Le respect des standards d’industrialisation de projets data science et la rédaction d’un guide utilisateur ;
- Le pilotage de projets data science en mode Agile.