Показать сокращенную информацию

dc.contributor.advisorZuters, Jānis
dc.contributor.authorKalniņš, Mikus
dc.contributor.otherLatvijas Universitāte. Datorikas fakultāte
dc.date.accessioned2019-07-04T01:06:20Z
dc.date.available2019-07-04T01:06:20Z
dc.date.issued2019
dc.identifier.other71009
dc.identifier.urihttps://dspace.lu.lv/dspace/handle/7/48335
dc.description.abstractTeksta analīzes veikšanai ir pieejamas vairākas metodes, šajā dokumentā ir apskatīts kā pielietot Correlation Explanation[7] (korelāciju skaidrošana, turpmāk CorEx[7]) teksta analīzes metodi, implementējot atvērtā pirmkoda (open-source) bibliotēku corextopic[3], jau izstrādātā sistēmā - mašīnmācīšanās teksta analizatorā (turpmāk MMTA). Darbā ir aprakstīta MMTA pamatdarbība un tā mijiedarbība ar implementēto corextopic[3] bibliotēku. MMTA ir programmprodukts ar implementētām vairākām bibliotēkām, kas dod iespēju programmprodukta lietotājam izvēlēties starp vairākām datu apstrādes metodēm saistībā ar teksta analīzi. MMTA darbība iedalās. Informācijas ekstrakcija un tēmu modelēšana ir divi MMTA darbības iedalījumu piemēri. Darbā tiek apskatīta tēmu modelēšana, jo corextopic[3] bibliotēka sniedz bagātīgi modelētas tēmas, tā raksturojot apstrādājamo datu kopumu.
dc.description.abstractText analysis has many algorithms that try to solve the problem of topic modeling. This document explains how the text analisys method called Correlation Explanation[7] was intergrated into a Machine Learning Text Analyzer (MaLTA) using an open-source Python library corextopic[3]. The document describes core functions of MaLTA and how they interact with the integrated corextopic[3] library. MaLTA is a prgram product with many integrated open-source libraries, that offer the user of MaLTA to choose from a variety of methods to use for text analisys. There are several categories of text analysis that MaLTA works with. Topic Modeling and Information Extraction are two examples. The document describes the process of Topic Modeling since corextopic[3] offers richly modeled topics in such a way describing the input data.
dc.language.isolav
dc.publisherLatvijas Universitāte
dc.rightsinfo:eu-repo/semantics/openAccess
dc.subjectDatorzinātne
dc.subjectCorEx
dc.subjecttēmu modelēšana
dc.subjectmašīnmācīšanās
dc.subjectteksta analīze
dc.subjectpython
dc.titlePapildu funkciju izstrāde mašīnmācīšanās teksta analizatoram
dc.title.alternativeAdditional Feature Development for Machine Learning Text Analyzer
dc.typeinfo:eu-repo/semantics/bachelorThesis


Файлы в этом документе

Thumbnail

Данный элемент включен в следующие коллекции

Показать сокращенную информацию