Eksperimenti ar topoloģisko datu analīzi
Author
Bētiņa, Ieva
Co-author
Latvijas Universitāte. Datorikas fakultāte
Advisor
Podnieks, Kārlis
Date
2022Metadata
Show full item recordAbstract
Maģistra darba mērķis ir iepazīstināt ar topoloģisko datu analīzi, kas ir pieeja datu kopu analīzei, izmantojot topoloģijas, kā matemātikas novirziena, metodes. Šī inovatīvā datu analīzes metode pasaulē pēdējos gados strauji attīstās un ar vien plašāk tiek pielietota, lai iegūtu informāciju no sarežģītiem, liela apjoma, daudzdimensionāliem datiem. Pašreiz nekur nav atrodams topoloģiskās datu analīzes apraksts un pielietojamība, latviešu valodā. Darbā tiek apskatīti divi dažādi uz topoloģiskās datu analīzes balstīti algoritmi - Mapper un ToMATo, kuru veiksmīgā izmantošanā noteicošais ir pareizu parametru izvēle. Darbā tiek pētītas un piedāvātas šo algoritmu parametru optimizācijas metodes un rezultātā demonstrētas datu kopas topoloģiskās struktūras aprakstošas vizualizācijas, gan noturīgu homoloģiju svītrkoda formā ToMATo algoritma gadījumā, gan savienotu komponentu grafa formā Mapper gadījumā. The aim of the master's thesis is to introduce topological data analysis, which is data analysis approach using field of mathematics called topology. This innovative method of data analysis has developed rapidly in the world in recent years and is increasingly being used to obtain information from complex, large-scale, multidimensional data. At present, the topological data analysis applicability description is not Pieejams anywhere in Latvian. The paper deals with two different algorithms that are based on topological data analysis - Mapper and ToMATo, the choice of parameters of which is not a trivial task. Optimization methods for these parameters were studied and proposed, and as a result, descriptive visualizations of the topological structure of the data set are demonstrated, both in the form of persistent homology barcode with regards to ToMATo algorithm and in the form of a graph of connected components in the case of Mapper.