Show simple item record

dc.contributor.advisorSiņenko, Nadeždaen_US
dc.contributor.authorPole, Sandraen_US
dc.contributor.otherLatvijas Universitāte. Fizikas un matemātikas fakultāteen_US
dc.date.accessioned2015-03-24T08:01:46Z
dc.date.available2015-03-24T08:01:46Z
dc.date.issued2008en_US
dc.identifier.other9619en_US
dc.identifier.urihttps://dspace.lu.lv/dspace/handle/7/21811
dc.description.abstractDarbā aplūkoti un salīdzināti n-gramu visbiežāk lietotie valodas modeļi, kā arī noteikts vispiemērotākais modelis n-gramu varbūtību aprēķināšanai. Praktiskajā darba daļā tiek noteikti visbiežāk lietotie n-grami latviešu valodā (n=1, 2, 3), ņemot vērā, ka izmantotie teksta resursi ir sastādīti tā, lai teksts aptvertu visu latviešu valodu. Darbs sastāv no divām daļām un pielikuma ar izmantotajām programmām, pirmā daļa ir teorētiskais pamatojums katram modelim, un praktiskā daļa ir šo modeļu pielietojums izvēlētajam teksta failam. Nepieciešamā informācija no teksta failiem ir iegūta ar programmēšanas valodas Turbo Pascal Version 7.0 palīdzību, bet paši aprēķini veikti Microsoft Excel.en_US
dc.description.abstractIn this work are compared the most used language models, and elect the best of these models for n-gram probability calculations. In practical part are shown the most used n-grams (n=1, 2, 3) in Latvian language, considering, that text corpus is built in such a way, that it covers all Latvian language. This bachelor thesis consists of two parts and appendix with used programs, first part is theoretical motivation for each model, and the other is practical these model usage for chosen text corpus. Necessary information from text corpus is computed with programming language Turbo Pascal Version 7.0, all other calculations are made in Microsoft Excel.en_US
dc.language.isoN/Aen_US
dc.publisherLatvijas Universitāteen_US
dc.rightsinfo:eu-repo/semantics/openAccessen_US
dc.subjectMatemātikaen_US
dc.titleN-gramu modeļi sabalansētam latviešu valodas teksta korpusamen_US
dc.title.alternativeN-gram models for integrated latvian language text corpusen_US
dc.typeinfo:eu-repo/semantics/bachelorThesisen_US


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record