Marta Jaakson • 27. august 2015 kell 10:30

Pargipink võib ennustada maksekäitumist

Big Data Scoring juht ja omanik Erki Kert kasutab maksekäitumise hindamiseks viite erinevat andmerühma.   Foto: Erik Prozes/Postimees/Scanpix

Maksekäitumise hindamisel analüüsitakse andmeid, mille mahajätmist inimesed ise enamasti ei tajugi, rääkis tänasel Taust.ee ja Julianus Inkasso hommikuseminaril Big Data Scoring omanik ja juht Erki Kert.

Kert meenutas, et kui ta töötas pangas ja pidi tegema otsuse, kas anda taotlejale laenu või mitte, ei teinud ta seda pelgalt laenutaotlust vaadates, kuna avalik internetiotsing andis tavaliselt väärtuslikku lisainfot. „Pangad seda praegu ei tee. Kui me inimese tööle palkame, siis me guugeldame, kui aga raha laename, siis millegipärast pigistab laenuandja sellel kohal silma kinni,“ nentis Kert.

Kert rääkis, et 92 protsenti kõikidest internetis saada olevatest andmetest on loodud viimase kahe aasta jooksul. Ta viitas Google’i endise juhi Eric Schmidti sõnadele, et kahe päevaga toodetakse sama palju andmeid kui interneti aegade algusest 2003. aastani kokku. Muu hulgas teeb andmeanalüüsi lihtsamaks see, et info salvestamine ja töötlemine on läinud erakordselt odavaks.

Ta meenutas, et kui ta oma tegevust alustas, leiti Kesk- ja Ida-Euroopast paar head partnerit, kes andsid laene. Ligikaudu poolteist aastat nende klientide kohta infot kogudes ja analüüsides sai Big Data Scoring hakata otsima seoseid ja leida tegurid, et analüüsida, millised inimesed jäävad laenude tagasimaksmisel suurema tõenäosusega hätta ja millised mitte. Praegu teeb Big Data Scoring koostööd Mastercardiga.

Andmeid kogutakse viies rühmas

Big Data Scoring kogub internetis pankadelt laenu taotlejate kohta andmeid viies erinevas andmerühmas.

Esiteks, seadme tehnilised andmed, mis näitavad, milline on seade, millega inimene veebilehele sattus ja kui tihti ta brauserit värskendab. Teatud tüüpi seadmete ja tarkvara kasutajad jäävad Kerti sõnul suurema tõenäosusega hätta. Ent see oleneb suuresti ka turust. Erinevate turgude krediidimudelid tuleb kohandada ja neid pidevalt uuendada. See annab pangale väärtuslikku infot, kas inimene jääb laenu tagasimaksmisega hätta.

Teiseks vaadatakse käitumuslikku infot. Kert rääkis, et enamasti inimesed ei taju seda, et hetkest, kui isik tuleb veebilehele, on võimalik tema kohta infot koguda - mida inimene vaatab, kuhu klikkab jne. Kui inimene läheb veebilehele laene küsima, siis Kerti sõnul on enamasti halvema maksekäitumisega need, kes hakkavad kohe laenutaotlust täitma. Need, kes loevad läbi hinnakirja, mõtlevad pikemalt, käivad võib-olla kodupangast laenujääke kontrollimas, on sageli parema krediidikäitumisega. Tihti pööratakse tähelepanu ka sellele, kuidas isik veebilehele jõudis ning mis oli see otsingusõna, mis ta veebilehele tõi. Seega algab Kerti sõnul krediidivõimekuse hindamine juba enne, kui inimene laenutaotluseni üldse jõuab.  

Kolmas oluline rühm on asukoha info. Enamasti pangad kogutava aadressiga midagi ei tee. Edasijõudnumad üritavad Kerti sõnul analüüsida postiindeksid, sest näiteks Tallinna teatud piirkondadest tulevad pangakliendid on üldjuhul parema maksekäitumisega. Kert rääkis, et Big Data Scoring koostab inimese kohta Google'i kaartide otsingu, mis annab neile sadu lehekülgi numbreid. Need maalivad pildi, kus inimene elab, ja annavad võimaluse maksekäitumist analüüsida.

Muu hulgas tõi Kert üllatava näite, mis võib osutuda maksekäitumise hindamisel positiivseks. Big Data Scoringu meeskond avastas, et mida rohkem on inimese kodukoha lähedal pargipinke, seda parema maksekäitumisega ta on. „Pinkide arvukus näitas, et elukoht asub parkide lähedal. Parkide lähedal asuvate inimeste kinnisvara on üldiselt kallim ja kaudselt saime analüüsida, kas inimene maksab hiljem oma laenu tagasi või mitte,“ rääkis Kert.

Neljas andmerühm on avalikud andmed. Kerti sõnul on inimesed, keda guugeldades ilmub nende LinkedIni konto, tavaliselt parema maksekäitumisega. Need, kelle loetellu kuulub aga näiteks mõnes foorumis esinemine, on halvema maksekäitumisega. „99% sellest, mida me kogume, on müra ega aita maksekäitumist prognoosida. Kui me oleme aga leidnud need üksikud killud, siis see müra järjest rohkem selgineb,“ kirjeldas Kert avalike andmete töötlust.

Viiendaks vaadatakse sotsiaalmeediast kogutud andmeid. Kert nentis, et sotsiaalmeediast automaatselt andmeid võtta ei saa ega ka soovita. „See on õhukesel jääl kõndimine, sest puudutab nii privaatset kui ka seadusandlikku poolt,“ nentis Kert.

Küll aga on laenuandjad hakanud viimasel ajal üha rohkem küsima laenutaotlejalt luba Facebooki kontole ligipääsuks. Kert hindab sotsiaalmeediat ülimalt väärtuslikus infokanaliks. „Ühe inimese kohta on võimalik saada kuni 10 000 andmepunkti,“ ütles ta. Kui laenutaotleja luba on saadud, on nähtav kogu selle inimese Facebooki ajalugu, mis võimaldab Kerti hinnangul tema maksekäitumist ette näha. „Sisuliselt on ühel laenuandjal võimalik teha laenuotsus puhtalt Facebooki profiili põhjal,“ ütles ta.

Mida rohkem andmeid, seda täpsem

Eestis on Big Data Scoring alustanud kahe andmerühma analüüsimist: asukoht ja avalikud internetis leitavad andmed. Nende abil suudab Kerti sõnul võrdlemisi hästi eristada inimese maksekäitumist.

Kert ei öelnud, kui palju on tema ettevõttel kliente, küll aga märkis, et neid on Lõuna-Ameerikast Euroopa ja Aasiani. Firma tegutseb enamasti pankade ja teiste laenuandjatega, e-kaubanduses, kindlustuse valdkonnas ning telekommunikatsiooni valdkonnas. 

„Eestis on meid vähe näha, meie peamine müügirusikas asub Kesk-Euroopas ja Skandinaavias. Praegu võtame inimesi tööle ja kuu aja jooksul avame kontori Londonis,“ rääkis Kert.

Valdavalt aitab Big Data Scoring kliente, kes pakuvad pigem lühemaajalisi laene, mõnest kuust kuni mõne aastani. Pikemaajaliste laenude hindamiseks ei ole mudeleid kohandatud ning andmeid kogutud.

Firma meeskond koosneb kümnest inimesest, kellest kolmandik asub Eestis ja kaks kolmandikku Soomes. Küsimusele, kui palju töötajaid firma juurde palkab, vastas Kert, et nii palju kui häid inimesi leidub.

Hetkel kuum