Show simple item record

dc.contributor.advisorGrūzītis, Normunds
dc.contributor.authorDzalbe, Kristīne
dc.contributor.otherLatvijas Universitāte. Fizikas un matemātikas fakultāte
dc.date.accessioned2017-07-02T01:09:35Z
dc.date.available2017-07-02T01:09:35Z
dc.date.issued2017
dc.identifier.other60695
dc.identifier.urihttps://dspace.lu.lv/dspace/handle/7/36496
dc.description.abstractMūsdienās arvien pieaug uzglabātās informācijas un datu apjoms. Daudz informācijas tiek uzkrāts teksta dokumentos, kas lielākoties tiek uzglabāti nestrukturētā veidā. Maģistra darba mērķis ir iepazīties ar teksta klasifikācijas problemātiku un izpētīt dažādas, biežāk lietotās mašīnmācīšanās metodes, ko izmanto šī uzdevuma atrisināšanai. Tāpat darbā apskatītas metodes teksta datu dimensiju skaita samazināšanai. Darba gaitā veikta angļu valodas datu klasifikācija atbilstoši tēmām, izmantojot ”The New York Times” ziņu virsrakstu datus. Veikta arī latviešu ziņu portālu komentāru klasifikācija agresīvos un neagresīvos komentāros. Abām datu kopām klasifikācija veikta, izmantojot atbalsta vektoru metodi, klasifikācijas kokus un gadījuma mežus. Labākie rezultāti sasniegti ar atbalsta vektoru metodi.
dc.description.abstractNowadays amount of stored information and data increase exponentially. Besides, a lot of this information is accumulated in textual data. Those text data usually are stored in unstructured way. The aim of this paper is to investigate the problem of text classification and explore most frequently used machine learning methods for this task. Moreover, different dimensionality reduction techniques for textual data are investigated in this paper. To reach the goal of the thesis two different data sources are used: English headlines from “The New York Times” and Latvian comments of Latvian news portals. Three classifiers are employed: support vector machines, decision trees and random forests, however, the best classification accuracy are achieved with support vector machines.
dc.language.isolav
dc.publisherLatvijas Universitāte
dc.rightsinfo:eu-repo/semantics/openAccess
dc.subjectMatemātika
dc.subjectteksta klasifikācija
dc.subjectmašīnmācīšanās
dc.subjectatbalsta vektoru metode
dc.titleAtbalsta vektoru metodes izmantošana teksta klasifikācijai
dc.title.alternativeSupport Vector Machines for Text Classification
dc.typeinfo:eu-repo/semantics/masterThesis


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record