Gausa procesu regresija lielām datu kopām
Author
Garnizone, Agrita
Co-author
Latvijas Universitāte. Datorikas fakultāte
Advisor
Freivalds, Kārlis
Date
2018Metadata
Show full item recordAbstract
Mūsdienu datu kopu apjoms strauji aug, kas noved pie nepieciešamības izstrādāt jaunas statistiskās un mašīnmācīšanās metodes, kas spētu apstrādāt lielas datu kopas saprātīgā laikā, iegūstot nozīmīgu informāciju. Gausa procesi ir zināmi ar savu precīzo prognozētspēju, tomēr Gausa procesu regresija nav plaši pielietota kubiskā laika sarežģītības dēļ. Pēdējos gados ir izrādīta palielināta interese mašīnmācīšanās kopienā samazināt šo procesu laika sarežģītību, vienlaicīgi palielinot to precizitāti. \par Šī darba mērķis ir padziļināti izpētīt vispārpieņemtus konceptus un tehnikas pašreizējo ierobežojumu atrisināšanai. Turklāt, rezultāti, kas iegūti, izveidojot vairāk kā trīsdesmit modeļus trīs reālām datu kopām, uzsver pašreizējos sasniegumus, mērogojot Gausa procesa regresiju lielajiem datiem. Modern data sets are rapidly growing which leads to a pressing need to develop new statistical methods and machine learning techniques that could handle large data sets in reasonable time and extract valuable information. Gaussian Processes are known to be highly accurate for making prediction, yet Gaussian process regression is not broadly used due to the cubic time complexity. In the recent years there has been great interest within Machine Learning community to reduce the complexity of time for Gaussian Process regression whilst increase the accuracy of prediction. \par The aim of this study is to extensively research general concepts and techniques for solving current limitations. Furthermore, results observed by developing more than thirty models for three real life data sets highlights current achievements towards scaling Gaussian Process Regression for Big Data.