• English
    • Latviešu
    • Deutsch
    • русский
  • Help
  • English 
    • English
    • Latviešu
    • Deutsch
    • русский
  • Login
View Item 
  •   DSpace Home
  • B4 – LU fakultātes / Faculties of the UL
  • A -- Eksakto zinātņu un tehnoloģiju fakultāte / Faculty of Science and Technology
  • Bakalaura un maģistra darbi (EZTF) / Bachelor's and Master's theses
  • View Item
  •   DSpace Home
  • B4 – LU fakultātes / Faculties of the UL
  • A -- Eksakto zinātņu un tehnoloģiju fakultāte / Faculty of Science and Technology
  • Bakalaura un maģistra darbi (EZTF) / Bachelor's and Master's theses
  • View Item
JavaScript is disabled for your browser. Some features of this site may not work without it.

Mašīnmācīšanās metožu lietojums latviešu valodas tekstu vienkāršošanā

Thumbnail
View/Open
302-96291-Upeniece_Anete.Alise_au19025.pdf (1.013Mb)
Author
Upeniece, Anete Alise
Co-author
Latvijas Universitāte. Datorikas fakultāte
Advisor
Skadiņa, Inguna
Date
2023
Metadata
Show full item record
Abstract
Bakalaura darba mērķis ir izpētīt latviešu valodas teksta vienkāršošanas sistēmas izstrādes procesu, kā arī apkopot un analizēt sistēmas īstenošanā izmantotās mašīnmācīšanās metodes un citus pielietotos rīkus. Darbā salīdzināti vairāki valodu modeļi un veikta piemērotākā modeļa papildu apmācība teksta vienkāršošanas uzdevumam, izmantojot eksistējošu latviešu valodas datu kopu. Sistēmas izstrādes procesā lietoti arī sintaktiskās parsēšanas un morfoloģiskās analīzes rīki vārdšķiru marķēšanai, vārdu locīšanai, lemmu iegūšanai, kā arī teikuma struktūras analīzei un transformācijai. Piedāvātais risinājums novērtēts gan manuāli, apskatot un salīdzinot iegūtos rezultātus, gan automātiski, izmantojot lasāmības indeksus.
 
The aim of the bachelor thesis is to research the text simplification system development process for Latvian language and to summarize and analyse the machine learning methods and other tools used in implementing the system. Multiple language models are compared with the objective of finding the most suitable one, which is then fine-tuned using an existing dataset in Latvian language. The system’s development process also includes the use of syntax parsing and morphological analysis tools with the aim of Part-of-speech tagging, word inflection, lemmatization and sentence structure analysis and transformation. The proposed solution is evaluated manually by examining and comparing results, as well as automatically by using readability indices.
 
URI
https://dspace.lu.lv/dspace/handle/7/64317
Collections
  • Bakalaura un maģistra darbi (EZTF) / Bachelor's and Master's theses [5688]

University of Latvia
Contact Us | Send Feedback
Theme by 
@mire NV
 

 

Browse

All of DSpaceCommunities & CollectionsBy Issue DateAuthorsTitlesSubjectsThis CollectionBy Issue DateAuthorsTitlesSubjects

My Account

Login

Statistics

View Usage Statistics

University of Latvia
Contact Us | Send Feedback
Theme by 
@mire NV