Latviešu valodas morfosintaktiskais marķētājs

dc.contributor.advisorSkadiņa, Ingunaen_US
dc.contributor.authorŅikiforovs, Pēterisen_US
dc.contributor.otherLatvijas Universitāte. Datorikas fakultāteen_US
dc.date.accessioned2015-07-06T01:08:22Z
dc.date.accessioned2025-07-21T04:11:09Z
dc.date.available2015-07-06T01:08:22Z
dc.date.issued2015en_US
dc.description.abstractBakalaura darbā aprakstīta morfoloģiskā marķētāja, kas izmanto vairāku klašu vidējo perceptrona mašīnmācīšanās algoritmu, izstrāde latviešu valodai. Darbā izstrādātajam marķētājam ir augsta precizitāte (95,20% un 94,32% - mērīta uz diviem dažādiem korpusiem), kas atbilst labākajiem rezultātiem pasaulē morfoloģiski sarežģītām valodām. Marķētājs salīdzināts ar diviem marķētājiem latviešu valodai, un tam ir labāka precizitāte nekā marķētājam, kas izmanto maksimālās entropijas modeli (94,83% un 91,51%), un nedaudz labāka precizitāte (93,67% un 93,6%) par marķētāju, kas izmanto nosacījumu Markova modeli.en_US
dc.description.abstractIn this thesis, a part-of-speech tagger for the Latvian language based on the multiclass averaged perceptron machine learning algorithm is described. The tagger achieves an accuracy of 95.20% and 94.32% when evaluated on two different corpora. When compared with two other taggers for the Latvian language, it has a better accuracy than a tagger based on the maximum entropy model (95.20% vs 91.51%) and a tagger based on the conditional Markov model (93.67% vs 93.6%).en_US
dc.identifier.other49044en_US
dc.identifier.urihttps://dspace.lu.lv/handle/7/29536
dc.language.isoN/Aen_US
dc.publisherLatvijas Universitāteen_US
dc.rightsinfo:eu-repo/semantics/openAccessen_US
dc.subjectDatorzinātneen_US
dc.subjectlatviešu valodaen_US
dc.subjectdatorlingvistikaen_US
dc.subjectdabiskās valodas apstrādeen_US
dc.subjectmorfosintaktiskā marķēšanaen_US
dc.subjectmašīnmācīšanāsen_US
dc.titleLatviešu valodas morfosintaktiskais marķētājsen_US
dc.title.alternativeLatvian part-of-speech taggeren_US
dc.typeinfo:eu-repo/semantics/bachelorThesisen_US

Files

Original bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
302-49044-Nikiforovs_Peteris_pc09002.pdf
Size:
907.14 KB
Format:
Adobe Portable Document Format

License bundle

Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
license.txt
Size:
1.46 KB
Format:
Plain Text
Description: