Mašīnmācīšanās modeļa izveide futbola spēļu iznākumu prognozēšanai, izmantojot xG rādītājus
Autor
Grīnbergs-Zaļkalns, Kaspars
Co-author
Latvijas Universitāte. Eksakto zinātņu un tehnoloģiju fakultāte
Advisor
Diebelis, Edgars
Datum
2025Metadata
Zur LanganzeigeZusammenfassung
Darbā pētīta datu analīzes un mašīnmācīšanās algoritmu pielietošana futbola spēļu iznākumu prognozēšanā, īpaši pievēršoties sagaidāmo vārtu (xG) rādītājiem. Tiek aplūkotas dažādas futbolā izmantotās rezultātu prognozēšanas pieejas, analizēti un salīdzināti mašīnmācīšanās modeļi un algoritmi. Darba mērķis ir izstrādāt un novērtēt mašīnmācīšanās modeli futbola spēļu iznākumu prognozēšanai, izmantojot xG rādītājus. Darbā apkopoti Anglijas Premjerlīgas spēļu dati (no 2020./2021. līdz 2024/2025. gada sezonai), izveidoti komandu uzbrukuma, aizsardzības un spēka rādītāju modeļi. Prognozēšanas modeļa izveidei izmantots XGBoost mašīnmācīšanās algoritms. Modeļa precizitāte novērtēta xG prognozēs un spēļu iznākumos, salīdzinot ar faktiskajiem datiem un cita modeļa prognozēm, izmantojot kļūdu metrikas RMSE, MAE un Pearson korelācijas koeficientu. Darbs apliecina xG metrikas rādītāju lietderību un mašīnmācīšanās modeļu spēju nodrošināt konkurētspējīgas prognozes. This work explores the application of data analysis and machine learning algorithms for predicting football match outcomes, with a particular focus on expected goals (xG) metrics. The thesis reviews various approaches to football result prediction and analyzes different machine learning models and algorithms. The aim of the thesis is to develop and evaluate a machine learning model for predicting football match outcomes using xG indicators. English Premier League match data from the 2020./2021. to 2024./2025. seasons is collected and processed, and team attack, defense, and strength indicator models are created. The XGBoost machine learning algorithm is used for building the prediction model. The model’s accuracy is evaluated both for xG predictions and match outcomes, comparing results with actual data and those of another predictive model, using error metrics such as RMSE, MAE, and the Pearson correlation coefficient. This work confirms the usefulness of the xG metric and demonstrates the ability of machine learning models to generate competitive predictions.