Mašīnmācīšanās metožu salīdzinājums ar klasiskajām pieejām izdzīvošanas datu analīzē
Author
Kubliņš, Uldis Kārlis
Co-author
Latvijas Universitāte. Eksakto zinātņu un tehnoloģiju fakultāte
Advisor
Pahirko, Leonora
Date
2025Metadata
Show full item recordAbstract
Šajā darbā tiek izpētītas izdzīvošanas datu analīzes metodes. Apskatīti izdzīvošanas datu raksturlielumi, kā arī analizēts Kaplana – Meiera novērtējums. Detalizēti izpētīts Koksa proporcionālo risku modelis, tā pieņēmumi un interpretācija. Tiek izpētīti gradientu pastiprināšanas algoritmi un analizēts XGBoost algoritms. Apskatīts, kā novērtēt izveidotos modeļus un kā interpretēt modeļos iegūtās vērtības. Tiek apskatītas SHAP vērtības, lai noteiktu mainīgo nozīmīgumu. Izmantojot datu kopu, modeļi izveidoti praktiski. Tiek noteikti nozīmīgākie prediktori un salīdzināta modeļu kvalitāte, izmantojot c-indeksu un ROC līknes, kā arī apskatīts AUC dažādos laika momentos. Darba mērķis ir apskatīt izdzīvošanas datu analīzes metodes un pielietot tās praksē. This thesis explores survival data analysis methods. It examines the characteristics of survival data and analyzes the Kaplan–Meier estimator. A detailed study is conducted on the Cox proportional hazards model, including its assumptions and interpretation. Gradient boosting algorithms are reviewed, with a focus on XGBoost algorithm for survival analysis. The work discusses how to evaluate the performance of predictive models and interpret the values produced by them. SHAP values are used to determine variable importance. Using a real dataset, models are built in practice, key predictors are identified, and model performance is compared using C-index and the area under the ROC curve (AUC) at different time points. The aim of the thesis is to explore survival analysis methods and apply them in practice.