Tenisa spēļu iznākumu prognozēšana, izmantojot datu datorizētu statistisko analīzi
Author
Čudihins, Dmitrijs
Co-author
Latvijas Universitāte. Datorikas fakultāte
Advisor
Smotrovs, Juris
Date
2012Metadata
Show full item recordAbstract
Bakalaura darba ietvaros ir apskatīta tenisa spēļu iznākumu prognozēšana, izmantojot datu datorizētu statistisko analīzi.
Teniss ir viens no populārākajiem sporta veidiem pasaulē. Vairāki zinātnieki pētījuši statistikas datus, lai iepriekš noteiktu spēles uzvarētāju. Bakalaura darba izstrādei veikta datu analīze un rezultātu prognozēšana, kura balstīta uz konkrētu dalībnieku spēju uzvarēt spēlē, kas noteikta pamatojoties uz iepriekšējiem rezultātiem.
Spēlētāja līmeņa noteikšanai izmantoti detalizēti dati par viena gada periodu, ar kuru palīdzību izsekotas un pārbaudītas konkrēta spēlētāja tendences, piemēram, sezonalitāte un veikti aprēķini. Prognožu veikšanai izmantotas vairākas programmas- Match Stat apstrādes rīks, trešās puses izstrādātas programmas QlikView, IBM Stats un Microsot Excel. Dati tika analizēti un prognozēti izmantojot trukstošo datu apstrādi ar paticamības metodi.
Bakalaura darba noslēguma daļā veikta derību portālu likmju un reālo iznākumu salīdzināšana. Ir pareizi noteikts 71% no visiem spēļu iznākumiem, kas ir vienāds derību portāla prognozēm. Prediction of tennis match results by computer-based statistical data analysis.
This bachelor thesis investigates prediction of tennis match results by computer-based statistical data analysis. Tennis is one of the most popular sports in the world. Several researchers have studied and analyzed statistical data to predict the winners and game outcomes. In this bachelor thesis the data analysis and prediction of outcomes is based on a particular participant's ability to win the game, determined on the basis of player historical results.
To determine player's strength detailed historical data for the last year period is used. It helps to identify and test individual player tendencies, such as seasonality and help to make further forecasts. Several software packages were used to identify and determine players’ strength and winning probability, such as Match Stat tennis data collecting and processing tool and third party developed software QlikView, IBM Stats and Microsot Excel. Data analysis and forecast were made based on maximum-likelihood estimation.
At the end of this work comparison with betting site odds and real outcomes of the games are made. The results showed 71% of successfully forecasted outcomes of the games, that is equals to betting portal forecasts.