Show simple item record

dc.contributor.advisorSkadiņa, Inguna
dc.contributor.authorUpeniece, Anete Alise
dc.contributor.otherLatvijas Universitāte. Datorikas fakultāte
dc.description.abstractBakalaura darba mērķis ir izpētīt latviešu valodas teksta vienkāršošanas sistēmas izstrādes procesu, kā arī apkopot un analizēt sistēmas īstenošanā izmantotās mašīnmācīšanās metodes un citus pielietotos rīkus. Darbā salīdzināti vairāki valodu modeļi un veikta piemērotākā modeļa papildu apmācība teksta vienkāršošanas uzdevumam, izmantojot eksistējošu latviešu valodas datu kopu. Sistēmas izstrādes procesā lietoti arī sintaktiskās parsēšanas un morfoloģiskās analīzes rīki vārdšķiru marķēšanai, vārdu locīšanai, lemmu iegūšanai, kā arī teikuma struktūras analīzei un transformācijai. Piedāvātais risinājums novērtēts gan manuāli, apskatot un salīdzinot iegūtos rezultātus, gan automātiski, izmantojot lasāmības indeksus.
dc.description.abstractThe aim of the bachelor thesis is to research the text simplification system development process for Latvian language and to summarize and analyse the machine learning methods and other tools used in implementing the system. Multiple language models are compared with the objective of finding the most suitable one, which is then fine-tuned using an existing dataset in Latvian language. The system’s development process also includes the use of syntax parsing and morphological analysis tools with the aim of Part-of-speech tagging, word inflection, lemmatization and sentence structure analysis and transformation. The proposed solution is evaluated manually by examining and comparing results, as well as automatically by using readability indices.
dc.publisherLatvijas Universitāte
dc.subjectteksta vienkāršošana
dc.subjectdabiskās valodas apstrāde
dc.subjectvalodas modelis
dc.subjectlatviešu valoda
dc.titleMašīnmācīšanās metožu lietojums latviešu valodas tekstu vienkāršošanā
dc.title.alternativeThe use of machine learning methods in Latvian text simplification

Files in this item


This item appears in the following Collection(s)

Show simple item record