Empīriskās ticamības funkcijas izmantošana klasteru analīzē

Gaile, Dace

View/Open

304-72410-Gaile_Dace_dg15023.pdf (914.5Kb)

Author

Gaile, Dace

Co-author

Latvijas Universitāte. Fizikas, matemātikas un optometrijas fakultāte

Advisor

Luguzis, Artis

Date

2019

Metadata

Show full item record

Abstract

Bakalaura darbā apskatīta klasteru analīze ar empīriskās ticamības funkciju. Tās rezultāti salīdzināti ar pazīstamāko klasteru analīžu rezultātiem: hierarhisko klasterizāciju, k-vidējo klasterizāciju un uz modeļa balstīto Gausa jaukto modeļu klasterizāciju. Tika aplūkotas klasterizācijas metodes simulētiem un reāliem datu piemēriem, lai novērtētu, kurš algoritms veiksmīgāk veic datu klasterizāciju. Simulēto datu gadījumā Rand indekss rezultātus salīdzina ar sākotnējo datu grupām. Darba mērķis ir noskaidrot, kādas priekšrocības ir klasterizējot datus ar empīriskās ticamības funkciju. Gūtie rezultāti liecina, ka novērojumiem, kuros ir izlēcēji, klasteru analīze ar empīrisko ticamības funkciju veiksmīgi veic datu klasterizēšanu.

Thesis outlines the idea of clustering through empirical likelihood ratio. Analysis results was compered with most familiar cluster analysis: hierarchical clustering, k-means clustering and clustering with Gaussian mixture model. Simulation analysis was performed for all cluster analysis and results showed which algorithm works better for data from distribution and which works better for noisy data. For simulated data Rand index result represents cluster similarity between clustering method and simulated data in the beginning. The results showed that new clustering technique using empirical likelihood ratio clustered noisy data sets very well.

URI

https://dspace.lu.lv/dspace/handle/7/47455

Collections

Bakalaura un maģistra darbi (FMOF) / Bachelor's and Master's theses [2631]