dc.contributor.advisor | Bārzdiņš, Guntis | en_US |
dc.contributor.author | Rikters, Matīss | en_US |
dc.contributor.other | Latvijas Universitāte. Datorikas fakultāte | en_US |
dc.date.accessioned | 2015-03-24T08:42:26Z | |
dc.date.available | 2015-03-24T08:42:26Z | |
dc.date.issued | 2014 | en_US |
dc.identifier.other | 42278 | en_US |
dc.identifier.uri | https://dspace.lu.lv/dspace/handle/7/25104 | |
dc.description.abstract | Maģistra darba mērķis ir izpētīt populāro valodas apstrādes rīku Maltparser, tā teikumu sintaktiskajā analizatorā izmantotos algoritmus – sintaktiskās analīzes algoritmu Arc-Eager Shift-Reduce un mašīnmācīšanās algoritmu SVM. Maģistra darbā SVM algoritms tiks salīdzināts ar citiem mašīnmācīšanās algoritmiem – C4.5 un C5.0 – kas sniedz ievērojamas priekšrocības tieši valodas apstrādes vajadzībām. Maģistra darba gaitā izstrādāta arī autora realizācija minētajam sintaktiskās analīzes algoritmam un mašīnapmācības algoritmam. Šī maģistra darba mērķis ir pārbaudīt, vai teikuma sintaktiskajai analīzei SVM klasifikatoru var veiksmīgi aizstāt ar C5.0 klasifikatoru, kas ģenerēs cilvēkam izlasāmus un vieglāk uztveramus klasifikācijas kokus un / vai likumus nekā SVM ģenerētais vektora formāts. Maģistra darbā paredzēts arī kvantitatīvi salīdzināt algoritmu precizitāti un citus izmērāmus raksturlielumus. | en_US |
dc.description.abstract | The objective of this master’s thesis is to explore the popular language processing tool Maltparser and the algorithms used in its sentence syntactic analyzer – the dependency parsing Arc-eager Shift-reduce algorithm and the machine learning SVM algorithm. In this thesis the SVM algorithm will be compared to two other machine learning algorithms – C4.5 and C5.0 that produce more promising results especially for language processing tasks. In the course of this thesis the author will also develop his own implementation of said dependency parsing algorithm combined with C4.5 / C5.0. The objective of this master’s thesis is to verify whether the SVM classification algorithm can be successfully replaced with the C5.0 classification algorithm. This would make the classification trees and / or rules that are generated by the algorithm easier readable for users unlike the SVM vector format. This thesis will also provide a quantitative comparison of the accuracy and other characteristics. | en_US |
dc.language.iso | N/A | en_US |
dc.publisher | Latvijas Universitāte | en_US |
dc.rights | info:eu-repo/semantics/openAccess | en_US |
dc.subject | Datorzinātne | en_US |
dc.title | C4.5, C5.0 un SVM klasifikācijas algoritmu izpēte un salīdzināšana datorlingvistikas vajadzībām | en_US |
dc.title.alternative | Comparison and exploration of classification algorithms C4.5, C5.0 and SVM for computational linguistics | en_US |
dc.type | info:eu-repo/semantics/masterThesis | en_US |