Markova ķēžu pielietojums latviešu valodas vārdnīcas kontekstā
Author
Brence, Karīna
Co-author
Latvijas Universitāte. Fizikas, matemātikas un optometrijas fakultāte
Advisor
Bēts, Raivis
Date
2021Metadata
Show full item recordAbstract
Lai pētītu Markova ķēžu pielietojumu latviešu valodas vārdnīcas kontekstā,tiek izveidots uz Markova ķēdēm balstīts modelis, kas aprēķina latviešu literārāsvalodas vārdnīcā iekļauto vārdu varbūtību parādīties tekstā. Iegūtās varbūtībastiek salīdzinātas ar reālām vērtībām, kas iegūtas no diviem dažādiem apkopototekstu korpusiem. Pētīšanas procesā tiek veikts aprēķins vidējām vērtībām, kāarī vidējām relatīvām kļūdām. Tiek analizēta vārdam piemītošo īpašību ietek-me uz iegūtās varbūtības precizitāti. Tiek noteikts vārdu tips, kam izmantotāmetode dod labākos rezultātus. Darbā aprakstītas Markova ķēdes un to papla-šinātā modeļu klase, doti piemēri. Tiek iegūts latviešu valodas alfabēta sākumavarbūtību vektors un pārejas varbūtību matrica. In order to study the application of Markov chains in the context of theLatvian dictionary, a model based on Markov chains is developed, which calcu-lates the probability of words included in the dictionary of the Latvian literarylanguage appearing in a text. The obtained probabilities are compared with realvalues obtained from two different corpora of collected texts. In the examinationprocess, the mean values and mean relative error is calculated. The influenceof word properties on the obtained probability accuracy is analyzed. The typeof words for which the used method gives the best results is determined. Thework includes an introduction to Markov chains and their extended model classwith given examples. The starting probability vector of the Latvian alphabetand the transition probability matrix are obtained.