Show simple item record

dc.contributor.advisorValeinis, Jānis
dc.contributor.authorLazareva, Lana
dc.contributor.otherLatvijas Universitāte. Fizikas, matemātikas un optometrijas fakultāte
dc.date.accessioned2020-07-01T01:12:21Z
dc.date.available2020-07-01T01:12:21Z
dc.date.issued2020
dc.identifier.other77061
dc.identifier.urihttps://dspace.lu.lv/dspace/handle/7/51855
dc.description.abstractŠajā darbā tiek izpētīti un salīdzināti trīs no jaunākiem un plaši izmantotiem gradienta pastiprināšanas algoritmiem - XGBoost, LightGBM un CatBoost. Šie algoritmi tiek salīdzināti pēc to ātrdarbības, kā arī tendences uz pārpielāgošānos treniņa datiem. Tiek analizēta arī šo algoritmu spēja izmantot modelēšanā kategoriskus mainīgos. Papildus tiek izpētīti algoritmu hiperparametri un to ietekme uz algoritma pārpielāgošanos un modeļa precizitātes rādītājiem. Balstoties uz rezultātiem, tiek sniegti ieteikumi par hiperparametru skaņošanu. Otrajā eksperimenta daļā tiek izpētīta uz spēļu teorijas Šaplī vērtību balstītā metode mainīgo būtiskuma noteikšanai. Iegūtiem rādītājiem ar būtstrapa metodes palīdzību tiek noteikti ticamības intervāli.
dc.description.abstractThis work covers studies on three of the newest and commonly used gradient boosting algorithm implementations: XGBoost, LightGBM and CatBoost. Algorithms are studied and compared by their training speed, precision and overfitting properties. Algorithm common hyperparameter effect on these metrics is analysed and compared as well. Based on the results, some recommendations are given for hyperparameter tuning. The second part provides analysis on feature importance estimation method based on game theory's Shapley values. Confidence intervals are then determined for acquired importances, using bootstrap resampling method.
dc.language.isolav
dc.publisherLatvijas Universitāte
dc.rightsinfo:eu-repo/semantics/openAccess
dc.subjectMatemātika
dc.subjectCatBoost
dc.subjectLightGBM
dc.subjectSHAP
dc.subjectXGBoost
dc.subjectmainīgo būtiskums
dc.titleGradientu pastiprināšanas algoritmu salīdzinājums un mainīgo būtiskuma analīze
dc.title.alternativeComparison of gradient boosting algorithms and analysis of feature significance
dc.typeinfo:eu-repo/semantics/bachelorThesis


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record