White Paper
KI-basierte Betrugserkennungssysteme in Politik und Finanzwesen
Die Methoden im Finanzbetrug werden immer ausgeklügelter. Auch zum Leidwesen von Unternehmen. Besonders auf die Kartenzahlung haben es Betrügende abgesehen. In unserem aktuellen White Paper: Finanzbetrug und KI-basierte Betrugserkennungssysteme zeigen unsere Experten auf, wie sich Attacken KI-basiert erkennen und verhindern lassen. Denn Künstliche Intelligenz ist ein sehr effektives Instrument in der Betrugsbekämpfung.
Die heutige Betrugslandschaft
Obwohl die Betrugs- und Korruptionsraten in den vergangenen Jahren nicht signifikant gestiegen sind, sahen sich dennoch fast die Hälfte aller Unternehmen in den letzten zwei Jahren mit einer Art von Finanzbetrug konfrontiert. Die Betrugsformen, denen die Unternehmen ausgesetzt sind, lassen sich in drei Hauptkategorien einteilen:
- Bankenbetrug
- Unternehmensbetrug
- Versicherungsbetrug
Bankenbetrug
Kreditkartenbetrug (engl.: Credit card fraud)
Unter Kreditkartenbetrug versteht man den Zugriff auf eine Kreditkarte einer bestimmten Person oder deren Verwendung ohne Zustimmung. Diese Art von Betrug kann z. B. im Rahmen eines Antragsverfahrens geschehen, bei dem Betrügende falsche Informationen oder die Daten anderer Personen verwenden, um neue Kreditkarten von ausstellenden Unternehmen zu erhalten. Mit dem Wachstum des Online-Handels hat auch der Betrug mit gefälschten Karten in den vergangenen Jahren stark zugenommen. Die Daten zur Fälschung der Karten werden in der Regel durch Phishing, das Auslesen der Karte an manipulierten Geldautomaten oder durch Hacking gewonnen. Die derzeit angewandten Methoden zur Aufdeckung von Kreditkartenbetrug basieren auf der Analyse des Ausgabeverhaltens der Kundinnen und Kunden. Dabei werden Transaktionen, die eindeutig von den vorgegebenen Richtlinien der Regelsysteme abweichen, sowie frühere Betrugsfälle markiert. Die Regelsysteme bestehen aus intern von Expertinnen und Experten entwickelten Wertgrenzen, welche einzelne oder mehrere Transaktionsvariablen nicht über- oder unterschreiten dürfen.
Hypothekenbetrug (engl. Mortgage fraud)
Hypothekenbetrug ist eine Art von Finanzbetrug, bei dem Informationen in Immobilien- oder Hypothekenunterlagen falsch dargestellt oder weggelassen werden. Er wird genutzt, um einen Kredit oder einen anderen finanziellen Vorteil zu erlangen, der nicht möglich gewesen wäre, wenn der/die Kreditgebende über vollständige und genaue Informationen verfügt hätte. Dieser Betrug wird häufig mithilfe manipulierter Immobiliendokumente begangen, die den wahren Wert der Immobilie verschleiern, um einen höheren Kredit vom Kreditgebenden zu erhalten. Ähnlich wie beim Kreditkartenbetrug basiert die Aufdeckung von Betrugsfällen auf Regelsystemen von Experten sowie der manuellen Analyse der Dokumente.
Geldwäsche (engl.: Money laundering fraud)
Unter Geldwäsche versteht man das Verbergen oder Verschleiern der illegalen Herkunft von Geld, das durch kriminelle Aktivitäten erlangt wurde, oder die Umwandlung dieses Geldes in Produkte oder Dienstleistungen.
Unternehmensbetrug
Bilanzierungsbetrug (engl.: Financial statement fraud)
Bilanzierungsbetrug ist eine Form des Unternehmensbetrugs. Er umfasst die Manipulation unternehmensbezogener Dokumente, um die Öffentlichkeit beziehungsweise die Steuerbehörden zu täuschen oder den Wert eines Unternehmens für Investoren betrugsbedingt zu steigern. Die US Association of Certified Fraud Examiners (ACFE) unterscheidet die folgenden fünf Arten von Bilanzbetrug:
- Zeitliche Unterschiede
- Fiktive/unangemeldete Einnahmen
- Verdeckte/überhöhte Verbindlichkeiten und Ausgaben
- Unsachgemäße Bewertung von Vermögenswerten
- Unzulässige Offenlegungen
Bilanzfälschungen werden aus einer Vielzahl von Gründen begangen, z. B., um Steuerpflichten zu minimieren, die Aktien-Performance zu heben oder Bankkredite zu erhalten. Bilanzfälschungen lassen sich nur schwer aufdecken, da sie nur selten vorkommen und in der Regel von Insidern begangen werden. Die Aufdeckung hängt weitestgehend von der manuellen Überprüfung der Dokumente durch externe Prüfpersonen ab.
Wertpapier- und Wirtschaftswarenbetrug (engl.: Securities and commodities fraud)
Der Zweck des Wertpapierbetrugs, der auch als Wirtschaftswarenbetrug bezeichnet wird, besteht darin, eine Person dazu zu bringen, in ein Unternehmen zu investieren. Betrug mit hochverzinslichen Anlagen, Schneeballsysteme, Devisenbetrug, Marktmanipulation und Veruntreuung durch Makler sind nur einige der häufigsten Arten von Wertpapier- und Wirtschaftswarenbetrug, die vorkommen.Unter Geldwäsche versteht man das Verbergen oder Verschleiern der illegalen Herkunft von Geld, das durch kriminelle Aktivitäten erlangt wurde, oder die Umwandlung dieses Geldes in Produkte oder Dienstleistungen.
Versicherungsbetrug
(Krankenversicherung oder andere Versicherungen; engl.: Insurance fraud)
Versicherungsbetrug kann in jeder Phase des Versicherungsverfahrens vorkommen, z. B. bei der Antragstellung oder bei Schadensfällen. Betrügerische Versicherungsansprüche beruhen häufig auf übertriebenen Verletzungen oder vollständig inszenierten Ereignissen. Die Aufdeckung von Versicherungsbetrug stützt sich derzeit auf Regelsysteme und/oder die manuelle Überprüfung von Ansprüchen und deren Belegen.
Einführung in die KI-basierte Betrugserkennung
Die Aufdeckung von Finanzbetrug gestaltete sich in der Vergangenheit äußerst schwierig. Die derzeitigen Aufdeckungssysteme stützen sich entweder auf Expertinnen und Experten, die wahrscheinliche Betrugsfälle überprüfen, oder auf regelbasierte Systeme. Ein regelbasiertes System besteht aus einer Reihe spezifischer Prüfschritte die zahlreiche Kriterien, wie beispielsweise eine Verkettung von Minimal- und Maximalbeträgen, zur Erkennung von Mustern verwenden. Obwohl sie relativ leistungsfähig sind, ist die Entwicklung und Pflege dieser Regeln zeitaufwändig. Darüber hinaus wird dies durch die Tatsache erschwert, dass in den meisten Bereichen die Betrugsrate unter 0,1 Prozent liegt. Dadurch wird die Wahrscheinlichkeit falscher positiver Ergebnisse erhöht. Außerdem neigen die Verantwortlichen dazu, die Schemata für eine spezifische Betrugssituation unabhängig voneinander zu erstellen. Das bedeutet, dass diese Regeln oft eigenständig sind und einander nicht ergänzen.
Der Einsatz von künstlicher Intelligenz (KI) kann einige der Unzulänglichkeiten von derzeit verwendeten Methoden beheben. Es gibt eine Vielzahl von KI-basierten Methoden wie beispielsweise neuronale Netze, Support Vector Machines oder logistische Regression. Darunter erweisen sich sogenannte Decision Forests für diese Aufgabe als besonders geeignet. Im Falle der Betrugserkennung besteht die Aufgabe entweder in der Klassifizierung (z. B. Vorhersage von Betrug oder Nicht-Betrug) oder in einer Regression (Vorhersage einer Betrugswahrscheinlichkeit).
Im Kern bestehen Decision Forests (auch Ensemble Learning genannt) aus mehreren Entscheidungsbäumen, die ihrerseits eine Reihe von Ja-/Nein-Fragen darstellen. Jede einzelne Beobachtung, die den Entscheidungsbaum durchläuft, trifft auf der einzelnen Ebene auf eine einzige Frage. Die Gesamtzahl der Fragen innerhalb einer Ebene dagegen verdoppelt sich mit jeder weiteren Ebene. In einem einfachen Beispiel, bei dem es darum geht, festzustellen, ob eine Kreditkartentransaktion betrügerisch war oder nicht, könnten die Knoten (in unserem Beispiel die Fragen) im Entscheidungsbaum die Fragen “Ist der Transaktionsbetrag größer als 500,- Euro” oder “Hat der/die Karteninhaber*in schon einmal bei diesem/ dieser Händler*in gekauft” enthalten. Der Algorithmus bestimmt die genauen Fragen, die zu stellen sind; die menschliche Eingabe liefert lediglich die Variablen wie den Transaktionsbetrag. Diese Auswahl oder Erzeugung von Eingabevariablen wird als Feature Engineering bezeichnet und ist eine der zeitaufwändigsten Aufgaben in der Aufbauphase eines maschinellen Lernmodells. Ein einzelner Entscheidungsbaum ist zwar einigermaßen effektiv, aber die sukzessive Kombination mehrerer kleinerer Bäume führt in der Regel zu besseren Vorhersageergebnissen. Diese Art von Algorithmus wird als Boosting bezeichnet. Ein besonders erfolgreicher Algorithmus in Bezug auf Genauigkeit und Geschwindigkeit ist der in Forschung und Wirtschaft weit verbreitete XGBoost . Nach der Erstellung des ersten Baums wird jeder nachfolgende Baum in der Form trainiert, dass der Fehler (z. B. die Differenz zwischen dem tatsächlichen und dem vorhergesagten Wert) des vorherigen Baums minimiert wird. Die Ergebnisse/Vorhersagen der einzelnen Bäume werden dann gewichtet und zu einer endgültigen Vorhersage kombiniert. Der Name “Boosting” leitet sich von der Idee ab, ein einzelnes, schwaches Modell durch die Kombination mit mehreren anderen, ihrerseits schwachen Modellen, zu einem insgesamt starken Modell zu “boosten”.
Das Boosting-Modell steht im Gegensatz zur herkömmlichen, weniger genauen Regelerstellung, bei der Hunderte von separaten binären Regeln mit jeweils einem bestimmten Zweck definiert werden. Diese Hunderte von Regeln überschneiden sich nicht – zum Teil, weil dies für Menschen extrem schwierig zu handhaben wäre. Das heißt, wenn keine einzige Regel konkret verletzt wird, wird die Handlung als nicht betrügerisch eingestuft, auch wenn zahlreiche Regeln fast die Auslöseschwelle zur Verletzung erreichen. Eine KI wie XGBoost erzeugt hingegen eine einzige Betrugsbewertung bzw. -vorhersage aus der Kombination sämtlicher Entscheidungsknoten, auf deren Grundlage das Unternehmen dann entsprechende Handlungen vornehmen kann.
Anwendungsfall 1: Betrugserkennung bei Kartenzahlungen
Wie bereits eingehend erläutert, ist der Kartenzahlungsbetrug einer der relevantesten Bereiche innerhalb der Betrugsbekämpfung – seine Aufdeckung kann durch KI unterstützt werden. Bei einem KI-System erlernt ein maschinelles Lernmodell die Betrugsmuster auf der Grundlage früherer Datensätze, die von einer Zahlungsplattform oder Bank gesammelt wurden. Nachdem die Lernphase abgeschlossen ist, wird das Modell eingesetzt, um eingehende Zahlungsanforderungen nahezu in Echtzeit zu klassifizieren. Eine markierte Transaktion kann dann automatisch blockiert oder von Mitarbeitenden überprüft werden.
Ziel
Die Ziele bei der Entwicklung eines Betrugserkennungssystems für Kartenzahlungen werden in zwei Stufen erreicht: Zunächst soll der manuelle Arbeitsaufwand für das Auffinden und die Identifizierung betrügerischer Transaktionen verringert und gleichzeitig die Geschwindigkeit des Betrugserkennungsprozesses erhöht werden. Nach der erfolgreichen Einführung eines ersten Erkennungssystems besteht das Ziel darin, die Anzahl der Falschmeldungen zu verringern, was den manuellen Arbeitsaufwand und die Kosten weiter reduziert.
Der Status Quo
In der Regel wird ein Betrugsfall bei Kartenzahlungen zunächst durch ein Regelsystem erkannt. Dieses Regelsystem kennzeichnet Transaktionen auf Grundlage der von Menschen entwickelten Regeln oder Schwellenwerten wie Transaktionsbetrag, Anzahl der Transaktionen innerhalb eines bestimmten Zeitraums oder Ähnlichem. Ein weiteres Erkennungsmerkmal ist der Common Point of Purchase (CPP). Dieser wird ermittelt, indem die im Online-Handel innerhalb eines bestimmten Zeitraums verwendeten Karten untersucht werden. Dabei wird der Anteil der einzelnen Zahlungskarten, die anschließend in betrügerische Transaktionen verwickelt waren, geschätzt. Nach dem ersten Flagging wird die Transaktion häufig von einer Expertin oder einem Experten überprüft.
Unter dem Gesichtspunkt der Einhaltung von Vorschriften ist es von Vorteil, die Zahl der betrügerischen Transaktionen im System zu verringern und damit das Risiko von Haftungsansprüchen zu reduzieren.
Was wird benötigt?
Die Wirksamkeit einer KI-gestützten Betrugserkennung hängt stark von den Daten ab, mit denen sie trainiert wird. Erstens müssen die Daten gelabelt werden, d. h. Transaktionen, die korrekt als betrügerisch identifiziert wurden, müssen in den bisherigen Daten als solche gekennzeichnet werden. Zweitens müssen die Daten von persönlichen Informationen bereinigt werden, um Konflikte mit Datenschutzgesetzen zu vermeiden. Schließlich gibt es neben dem bereits erwähnten CPP, die nachfolgend aufgeführten drei Hauptkomponenten von Wissen, die gegen Betrügende eingesetzt werden können, indem komplexere Merkmale aus den verfügbaren Daten herausgearbeitet werden.
Merkmale des Karteninhabers:
Darunter fallen die üblichen Ausgabengewohnheiten einer bestimmten Kundin oder eines bestimmten Kunden sowie die Informationen über die üblichen Umsatzbeträge für eine bestimmte Karte (die bei einigen hoch und bei anderen sehr niedrig sein können). Auch die Wahrscheinlichkeit, dass eine Person mit einer bestimmten Ausgabengewohnheit, die mit allen anderen Karten verglichen wird, zum ersten Mal Leistungen oder Waren in einem bestimmten Geschäft oder bei bestimmten Dienstleistenden einkaufen wird, zählt dazu.
Merkmale des Händlers:
Da nur eine sehr kleine Teilmenge von Händlerinnen und Händlern kompromittiert ist, sollten Merkmale wie der Anteil betrügerischer Transaktionen, Spitzen im Transaktionsvolumen oder Ähnliches aus den Daten abgeleitet werden können, um die Klassifizierungsergebnisse zu verbessern.
Zeitliche Aspekte:
Betrügende werden versuchen, so viel Bargeld wie möglich abzuheben, bevor sie bemerkt werden. Während die “üblichen Gewohnheiten” durch die Merkmale des Karteninhabenden abgedeckt sind, ist es nützlich, Echtzeitinformationen über das Risikoniveau von Verkäuferin oder Verkäufer und Karte zu besitzen. So kann beispielsweise ein ungewöhnlicher Anstieg der Umsätze bei einer Handel treibenden Person innerhalb der letzten Stunde ein Betrugsmerkmal sein.
Anwendungsfall 2: Betrug mit Emissionszertifikaten
Seit dem Beginn des Handels mit CO2-Emissionsrechten im Jahr 2004 hat die Branche große Steuerbetrugsfälle zu verzeichnen. Der Betrug basiert auf gefälschten Emissionszertifikaten, welche grenzüberschreitend gehandelt werden, um eine faktisch niemals gezahlte Mehrwertsteuer zurückzuerhalten. Es ist zudem möglich, dass in diesem Prozess noch weitere Betrugsdelikte begangen wurden. Durch das Trainieren einer KI, mit den von nationalen Behörden wie der Deutschen Emissionshandelsstelle (DEHSt) gesammelten Daten über den Handel mit Zertifikaten in der Vergangenheit, können potenziell betrügerische oder missbräuchliche CO2-Emissionsrechtsgeschäfte erkannt und überprüft werden.
Ziel
Da der Betrug mit CO2-Zertifikaten sowohl für die Behörden als auch für Unternehmen kostspielig ist, besteht das Ziel darin, betrugsbedingte Verluste zu verringern und gleichzeitig den Erkennungsprozess zu beschleunigen. Ähnlich wie bei Anwendungsfall 1 besteht das Ziel eines Erkennungssystems nach dem anfänglichen Start darin, die Anzahl der Falschmeldungen zu verringern, was den manuellen Arbeitsaufwand und die Kosten weiter reduziert.
Der Staus Quo
Nach dem Mehrwertsteuerkarussell-Betrug von 2009 haben die meisten Länder mit dem ReverseCharge-Verfahren reagiert. Abgesehen davon werden derzeit höchstwahrscheinlich Regelsysteme eingesetzt, die dem bereits erwähnten System zur Erkennung von Kartenbetrug ähneln. Nach der ersten Markierung wird die Transaktion in der Regel von Fachleuten überprüft.
Was wird benötigt?
Die Daten, aufgrund derer ein KI-gestütztes Betrugserkennungssystem trainiert wird, haben einen erheblichen Einfluss auf dessen Wirksamkeit. Die Daten müssen zunächst gekennzeichnet werden, d. h. es müssen Zertifikatsgeschäfte markiert werden, die in früheren Daten eindeutig als betrügerisch identifiziert wurden. Anschließend müssen nützliche Merkmale erstellt werden, um ein effizientes Vorhersagesystem zu entwickeln. Dazu gehören Merkmale wie:
- Eigenschaften von Verkaufenden und Kaufenden wie Branche, frühere gehandelte Zertifikate, Standort usw.
- Transaktionsdetails, wie z. B. der Betrag oder ob ein Handel zwischen den Parteien schon einmal stattgefunden hat.
- Steuerdaten von Verkaufenden und Kaufenden.
- Zeitliche Aspekte, wie z. B. ein ungewöhnlicher Anstieg der gehandelten Zertifikate in einem bestimmten Zeitraum.
Fazit
Die Erstellung eines KI-Models hat den Vorteil, dass sowohl menschliche als auch maschinell generierte Informationen in einem einzigen Rahmen zusammengefasst werden, der dann eine möglichst genaue Betrugsbewertung generieren kann.
Der generierte Betrugsscore lässt sich in einer Vielzahl von Betrugsdimensionen, wie beispielsweise dem Bilanzierungsbetrug oder dem Kreditkartenbetrug einsetzen. Zur Generierung der Betrugsscores ist der Algorithmus XGBoost sehr effizient und zusammen mit dem notwendigen Domänenwissen perfekt geeignet die Betrugserkennung in vielen Use-Cases zu verbessern.
Kontaktieren Sie uns
Wir machen Ihr Projekt zu unserem Anliegen.