Lēmuma koku, gadījuma mežu un loģistiskās regresijas modeļu salīdzinājums klientu maksātspējas prognozēšanai
Author
Grundmane, Kristīne
Co-author
Latvijas Universitāte. Fizikas un matemātikas fakultāte
Advisor
Valeinis, Jānis
Date
2017Metadata
Show full item recordAbstract
Mūsdienu tehnoloģiju attīstība nodrošina iespēju jebkurā laikā un vietā saņemt naudas aizdevumu. Tas savukārt nozīmē, ka uzņēmumiem, kas izsniedz aizdevumus, ir jānodrošina ātra pieteikumu izvērtēšana un procesam jābūt maksimāli automatizētam. Balstoties uz vēsturiskiem datiem, var veidot modeļus, kas prognozēs jauno klientu maksātspēju. Mērķa pazīme pieņem tikai divas vērtības: ’labs’ vai ’slikts’. Tā ir divu klašu klasifikācijas problēma. Darbā tiek apskatītas trīs metodes, kā risināt šo problēmu, - lēmumu koku algoritms, gadījuma mežu algoritmsunloģistiskāregresija. Lēmumukokuungadījumamežualgoritmiirmašīnmācīšanās algoritmi, kas tiek trenēti uz treniņa datiem. Ja treniņa dati ietver plašākas datu kombinācijas, tad algoritmu prognoze kļūst precīzāka. Tomēr, lai algoritmi neprognozētu labāku iznākumu nekātaspatiesībāirsagaidāms,irnepieciešamspārbaudītmodeļupielāgotību. Nowadaystechnologydevelopmentgivesopportunitytogetloanatanyplaceandatany time. Thatmeansthatcompaniesthatgivesloanshavetoensurefastapplicationevaluationand processhavetobeeasautomaticaspossible. Dependingonhistoricaldata, thereispossibility tocreatemodelsfornewclientevaluation. Targethaveonlytwovalues: ’good’or’bad’. This is two class classification problem. In this work there are three methods that are compared - decision tree algorithm, random forest algorithm and logistic regression. Decision tree and random forest algorithms are machine learning algorithms, that are trained on training data. If training data contains more variable combinations, algorithm prediction is more accurate. Howeveroverfittingneedstobechecked.