Datizrace mobilo sakaru operatoru tīklos
Author
Saulespurēns, Valdis
Co-author
Latvijas Universitāte. Datorikas fakultāte
Advisor
Podnieks, Kārlis
Date
2013Metadata
Show full item recordAbstract
Mūsdienu strauji augošajā mobilo telekomunikāciju vidē ir aktuāli strukturēt mobilo sakaru lietotāju grupas. Darbā tiek veikta datizrace mobilo sakaru operatora datu kopai.
Darba sākuma posmā tiek risinātas praktiskas ar dotā datu apjoma apstrādi saistītas problēmas, novērtēti dažādi rīki un tehnoloģijas. Darba gaitā tiek atrasta grafu formā pārvērstu datu apstrādei piemērotākā programmu grupa: Python graph-tool bibliotēka.
Darba nobeigumā tiek apskatītas dažādas kopienu atrašanas metodes, no kurām par piemērotāko apskatāmajam datu apjomam izvēlēts Lēvenes algoritms.
Darba rezultātā secināts, ka ar Python skriptu, Neo4J datubāzes, graph-tool bibliotēkas, Lēvenes algoritma realizācijas C++ un Gephi programmas iekļaušanu secīgā darba plūsmā ir iespējams padarīt milzīgu neapstrādātu mobilo saišu kopu par sakarīgu un apgūstamu apakšgrafu kopu. The fast growing mobile telecommunications world has actualized the need to structure groups of mobile network users. This thesis deals with data mining mobile networks.
The work starts with describing and tackling issues in processing raw mobile network data into graph form. The work proceeds with analysis of various graph databases and programming libraries useful for analyzing graphs. The chosen framework of Python graph-tools library is analyzed in more depth. Finally, community structure algorithms are analyzed with Louvain algorithm selected for producing communities.
Main conclusion of thesis is the finding of working chain of tools: Python scripts, Neo4J data base, graph-tool library, implementation of Louvain algorithm in C++ and Gephi as the means for structuring and visualizing large quantities of raw mobile data into subgraphs of strongly connected components.