Empīriskās ticamības funkcijas izmantošana klasteru analīzē
Author
Gaile, Dace
Co-author
Latvijas Universitāte. Fizikas, matemātikas un optometrijas fakultāte
Advisor
Luguzis, Artis
Date
2019Metadata
Show full item recordAbstract
Bakalaura darbā apskatīta klasteru analīze ar empīriskās ticamības funkciju. Tās rezultāti salīdzināti ar pazīstamāko klasteru analīžu rezultātiem: hierarhisko klasterizāciju, k-vidējo klasterizāciju un uz modeļa balstīto Gausa jaukto modeļu klasterizāciju. Tika aplūkotas klasterizācijas metodes simulētiem un reāliem datu piemēriem, lai novērtētu, kurš algoritms veiksmīgāk veic datu klasterizāciju. Simulēto datu gadījumā Rand indekss rezultātus salīdzina ar sākotnējo datu grupām. Darba mērķis ir noskaidrot, kādas priekšrocības ir klasterizējot datus ar empīriskās ticamības funkciju. Gūtie rezultāti liecina, ka novērojumiem, kuros ir izlēcēji, klasteru analīze ar empīrisko ticamības funkciju veiksmīgi veic datu klasterizēšanu. Thesis outlines the idea of clustering through empirical likelihood ratio. Analysis results was compered with most familiar cluster analysis: hierarchical clustering, k-means clustering and clustering with Gaussian mixture model. Simulation analysis was performed for all cluster analysis and results showed which algorithm works better for data from distribution and which works better for noisy data. For simulated data Rand index result represents cluster similarity between clustering method and simulated data in the beginning. The results showed that new clustering technique using empirical likelihood ratio clustered noisy data sets very well.