Esküszöm, hogy jó cikk lesz

2018. május 29. 14:57 - Pintér András

Az információ korában élünk. Több mint 4 millió YouTube videót nézünk, 18 millió sms-t és nagyságrendileg 200 millió emailt küldünk. Percenként. Az IBM becslése szerint az emberiség napi 2,5 trillió byte-nyi adatot hoz létre (18 nulla van a számsor végén…), a növekedés üteme pedig egészen elképesztő: az emberek által létrehozott adatmennyiség 90%-a az elmúlt két évben keletkezett. 

Laikusként is mindannyiunk számára egyre világosabb, hogy a legtöbbet már nem a párunk vagy a szüleink, hanem a Google keresőmotorja, a bankkártya társaságok és a mobilszolgáltatók tudják rólunk. Mi érdekel vagy aggaszt minket? Merre járunk? Mire költünk? – mindenről van adat valakinél. Ahogy pedig az elmúlt időszak Facebookhoz kötődő botrányai is megmutatták, ha valamilyen szolgáltatás látszólag ingyenes, ott valójában a saját adatainkkal fizetünk. 

A létrejövő hatalmas adatmennyiség új tudományterületet szült, a big data technológiák pedig ezt próbálják meg feldolgozni és értelmezni. Sokszor lenyűgözően érdekes és kreatív módokon. 

Vegyük például a banki hitelek visszafizetési valószínűségét. A pénzügyi szektor működésének egyik legkritikusabb kérdése, hogy a nyújtott hitelek visszafizetésre kerülnek-e vagy sem. Ha egy bank rosszul méri fel hitelezési kockázatait, komoly veszteségekbe szaladhat bele – ezt a több százmilliárdos leckét a magyar bankszektor is megtanulta az elmúlt években. A különféle banki hitelezési scoring modellek ezért számos változó használatával próbálják meg a visszafizetés valószínűségét becsülni, a hitelfelvevő jövedelmi helyzetétől kezdve a múltbeli hitelek törlesztési történetével bezárólag. 

A nagy kérdés az, hogy mindezek az előrejelzések finomíthatóak-e az új adatelemzési technikák segítségével? Oded Netzer és társai szerint igen. Az amerikai kutatótrió a Prosper nevű, amerikai peer-to-peer hitelezési platform több mint 120 ezer hiteligénylési adatait szövegelemzési módszerrel vizsgálva ugyanis arra jutott, hogy a hiteligénylési kérelemben tapasztalat szóhasználat segíthet előrejelezni a hitel-visszafizetés valószínűségét. 

A kutatást idéző könyv összefoglalója szerint nem is igazán az az érdekes, hogy melyek azok a szavak és kifejezések (például: „adósságmentes", „diplomás", „alacsonyabb kamatszint") melyeket a hiteligénylésben látva a hitelt nyújtó megnyugodhat – hiszen ezek a legtöbb esetben átgondold hitelfelvételi célról és bizonyos fokú pénzügyi jártasságról tanúskodnak. A csavar a negatívan korreláló, azaz az átlagosnál magasabb bedőlési arányt mutató hiteligényléseknél jön. Ezekben ugyanis a legtipikusabban előforduló kifejezések között több olyat is találunk, amire talán nem számítottunk volna: „Isten", „fizetni fogok", „esküszöm", „kórház", „köszönöm".  

20180529.png

A szövegelemzés alapján úgy tűnik tehát, hogy minél elszántabban fogadkozik valaki, annál kisebb az esélyünk hitelnyújtóként, hogy pénzünket viszontlátnánk – a felsőbb erőkre való hivatkozás önmagában 2,2-szeresére növelte a vizsgált mintában a bedőlés valószínűségét. (Mint a legtöbb big data elemzés, ez is felvet etikai aggályokat, hiszen ami igaz az átlagok szintjén, az teljesen téves lehet egyes egyének esetében. Egy ilyen adatelemzés önmagában például sosem fogja tudni eldönteni, hogy valaki valós helyzetére utalva hivatkozik a kölcsönigénylésben egy családtagjának kórházi kezelésére, vagy pedig csak a szokásos, átlagnál magasabb bedőlési arányra utaló álindoklásról van szó.) 

A lényegen ugyanakkor ez nem változtat: az átlagok szintjén nincs veszélyesebb annál, mint amikor egy hiteligénylő esedezve könyörög vagy fűre-fára esküdözik, hogy fizetni fog. Fura az emberi természet: minél jobban ígérgetünk valamit, annál valószínűtlenebb, hogy betartjuk azt. Minél határozottabban hangoztatjuk, hogy becsületesek vagyunk, annál valószínűbb, hogy nem vagyunk azok. Minél többször ismételjük, hogy most valóban őszintén beszélünk, annál sanszosabb, hogy kamuzunk. 

„Egyetlen módja van megtudni, hogy egy ember becsületes-e: kérdezd meg; ha igent mond, tudod, hogy tisztességtelen." – mondta Mark Twain, és nagyon is igaza volt. 

Így az irodalmi érettségik idején mindezek fényében már csak egy dolgot sajnálok: hogy nem most vagyok 18 éves. Petőfi Nemzeti dalának fülünkben csengő négy sorára („A magyarok istenére / Esküszünk, / Esküszünk, hogy rabok tovább / Nem leszünk!") fiatalos gőggel vághatnám rá: bár magával ragadó a költő hevülete és lelkesedése, hitelt nem adnék neki. Gyanúsan sokat esküdözik!