Show simple item record

dc.contributor.advisorBārzdiņš, Guntis
dc.contributor.authorDarģis, Roberts
dc.contributor.otherLatvijas Universitāte. Datorikas fakultāte
dc.date.accessioned2016-07-02T01:08:25Z
dc.date.available2016-07-02T01:08:25Z
dc.date.issued2016
dc.identifier.other53421
dc.identifier.urihttps://dspace.lu.lv/dspace/handle/7/32225
dc.description.abstractMūsdienās, strauji pieaugot internetā pieejamajam informācijas apjomam, aktuāla tēma valodu tehnoloģiju jomā ir informācijas grupēšana (klasterēšana) pēc vienotiem principiem vieglākai informācijas uztveramībai un izkaisītas informācijas apjoma mazināšanai. Darbā "Liela apjoma datu kopu klasterēšanas algoritmi" teorētiskajā daļā izpētītas un apkopotas metodes dokumentu klasterēšanai ar mērķi atrast piemērotāko metodi vai metožu kopu daudzvalodu ziņu straumju klasterēšanai. Darbā arī pētītas un salīdzinātas dažādas klasterēšanas rezultāta novērtēšanas metrikas. Praktiskajā daļā izstrādāta un izvērtēta sistēma daudzvalodu ziņu straumju klasterēšanai, tā darbības rezultāti un turpmāki pētījuma virzieni apkopoti darba nobeigumā.
dc.description.abstractNowadays one of the current trends of language technologies is information clustering with common traits for simplified information perception and reduction of scattered information amount in the continuous large information flow. Study "Clustering algorithms for large scale data sets" theoretical part includes research of the methods used in document clustering. The goal is to find the most suitable method or set of methods for multilingual message stream clustering. The work also contains research and comparison of various metrics of clustering result evaluation. The practical part includes implementation and evaluation of the system for multilingual news clustering. The results and future research directions are included in the end of the work.
dc.language.isolav
dc.publisherLatvijas Universitāte
dc.rightsinfo:eu-repo/semantics/openAccess
dc.subjectDatorzinātne
dc.subjectdokumentu straumju klasterēšana
dc.subjectdaudzvalodu dokumentu vektoriālā reprezentācija
dc.subjectklasterēšanas rezultāta novērtēšanas metrikas
dc.subjectdokumentu attāluma funkcijas
dc.titleLiela apjoma datu kopu klasterēšanas algoritmi
dc.title.alternativeClustering algorithms for large scale data sets
dc.typeinfo:eu-repo/semantics/masterThesis


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record