Odhalí umelá inteligencia finančný podvod?

13. augusta 2019 Ing. Barbora Tináková

O finančných podvodoch ste už zrejme počuli, minimálne z televízie alebo internetu. Obeťou však môžeme byť aj my, aj keď nemusíme vlastniť žiadnu korporáciu. Stačí, ak používame platobnú kartu v obchode alebo ňou platíme online. Podvody sa rozšírili aj vďaka možnosti platenia mobilným telefónom. Taktiky zlodejov naberajú stále nové možnosti, a tak bez toho, aby ste o tom vedeli, dokážu pri vašej platbe z tesnej blízkosti skopírovať údaje o karte. V inom prípade, kedy hovoríme o tzv. „phishingu“, ide o zadanie údajov o karte na nedôveryhodnej stránke, prípadne o vylákanie formou SMS či mailu, kde žiadajú za výhru a pod. údaje o vašej karte.Možnosti zneužitia karty sú viaceré a keď tieto údaje niekto získa, nastáva otázka, či sa dá míňaniu vašich peňazí rýchlo zabrániť.

zdroj: Ahmad Ardity, Pixabay

Model

V kórejskom Centre pre technológie informačnej bezpečnosti (CIST) sa tejto téme venovali a vytvorili funkčnú metódu, ktorá dokáže detegovať falošnú transakciu.

Pohrali sa s možnosťami umelej inteligencie a spojili viaceré metódy, aby dosiahli uspokojivú úspešnosť.

Na jej porovnanie použili metódy strojového aj hlbokého strojového učenia. Učenie bez učiteľa poslúžilo na určenie potenciálneho podvodu a učenie s učiteľom na klasifikovanie podvodu v rámci prostredia „Internet of Things, IoT“ (platba telefónom, online platba).

Počas experimentu vytvorili viaceré kombinácie neurónových sietí, logistickej regresie, rozhodovacích stromov, metódy podporných vektorov (SVM), samoorganizujúcej sa mapy (SOM), Gaussovej funkcie a fuzzy logiky.

Dáta

Výskum robili na 270 000 dátach o transakciách vykonaných v priebehu pol roka, z ktorých extrahovali dokopy 21 príznakov z charakteristík ako číslo transakcie, jej typ, telefónne číslo, ID obchodu, telekomunikačnú spoločnosť a iné. Niektoré typy dát však počtom vysoko prevyšovali iné, a tak bolo trénovanie na poddimenzovaj a naddimenzovanej vzorke náročné. Pomocou klastrovania, po zadefinovaní príznakov, použili výsledky ako trénovací set na klasifikáciu podvodov. Po aplikovaní učenia s učiteľom na tieto výsledky, dosiahli ešte lepšiu predikciu.

zdroj: Kevin Phillips, Pixabay

Zhrnutie

Navrhnutý model CIST-u s použitím strojového učenia bol založený na výbere príznakov, procese klastrovania a klasifikačnom procese. Po použití klasifikačných algoritmov, vďaka regresii, rozhodovaciemu stromu či C4.5 algoritmu, dosiahli úspešnosť cez 99 %.

Výsledky experimentu boli lepšie pri použití strojového učenia než pri neurónových sieťach, s ktorými bol proces detekcie navyše aj pomalší. Hoci, ako uvádzajú, záleží na dátach. Šancu na reálne využitie by takýto model dostal až po úprave, o čo sa aktuálne aj snažia.