• English
    • Latviešu
    • Deutsch
    • русский
  • Help
  • English 
    • English
    • Latviešu
    • Deutsch
    • русский
  • Login
View Item 
  •   DSpace Home
  • B4 – LU fakultātes / Faculties of the UL
  • A -- Eksakto zinātņu un tehnoloģiju fakultāte / Faculty of Science and Technology
  • Bakalaura un maģistra darbi (EZTF) / Bachelor's and Master's theses
  • View Item
  •   DSpace Home
  • B4 – LU fakultātes / Faculties of the UL
  • A -- Eksakto zinātņu un tehnoloģiju fakultāte / Faculty of Science and Technology
  • Bakalaura un maģistra darbi (EZTF) / Bachelor's and Master's theses
  • View Item
JavaScript is disabled for your browser. Some features of this site may not work without it.

Lielo valodas modeļu izmantošana dokumentu vienkāršošanai

Thumbnail
View/Open
302-102959-Straume_Katrina.Tina_ks20111.pdf (627.4Kb)
Author
Straume, Katrīna Tīna
Co-author
Latvijas Universitāte. Datorikas fakultāte
Advisor
Ivanovs, Maksims
Date
2024
Metadata
Show full item record
Abstract
Šajā darbā izstrādāts pētījums par lielo valodas modeļu izmantošanu teksta vienkāršošanai jeb saīsināšanai. Teksta saīsināšana ir garu teksta dokumentu pārveidošana īsākā, saprotamā tekstā, saglabājot oriģinālā teksta kontekstu un svarīgākās detaļas. Darbā apskatīti pieci lielie valodas modeļi un to teksta saīsināšanas spējas, izmantojot četras dažādas datu kopas – trīs specifiski teksta saīsināšanas pārbaudei sagatavotas datu kopas un viena autores atlasīta datu kopa. Katrā datu kopā aprēķināti modeļu saīsināšanas rezultāti ar ROGUE metriku. Pētījuma rezultāti norāda, ka modeļu veiktspēja atšķiras no konkrētās datu kopas, proti, no teksta sarežģītības un struktūras. Balstoties uz pētījuma secinājumiem, iespējams izvēlēties personīgi piemērotāko lielo valodas modeli attiecīgajam pielietojumam un avota tekstam. Darbs ietver teorētisko pārskatu par dabiskās valodas apstrādi, valodas modeļu attīstību, pētījuma metodoloģiju, eksperimenta gaitu, rezultātus un secinājumus.
 
In this work is a developed study about the use of large language models for text simplification or summarization. Text summarization is the transformation of long text documents into shorter, understandable text, preserving the context and important details of the original text. The paper examines the five large language models and their summarization abilities using four different data sets – three data sets specifically prepared for testing text summarization and one data set selected by the author. Model summarization results are calculated with ROGUE metrics for each data set. The results of the experiment indicate that the performance of the models varies by the specific data set, namely with the complexity and structure of the original text document. Based on the experiment results, it is possible to choose the most suitable large language model for the relevant application and source text. The work includes a theoretical overview of natural language processing, the development of language models, research methodology, the course of the experiment and conclusion.
 
URI
https://dspace.lu.lv/dspace/handle/7/66141
Collections
  • Bakalaura un maģistra darbi (EZTF) / Bachelor's and Master's theses [5688]

University of Latvia
Contact Us | Send Feedback
Theme by 
@mire NV
 

 

Browse

All of DSpaceCommunities & CollectionsBy Issue DateAuthorsTitlesSubjectsThis CollectionBy Issue DateAuthorsTitlesSubjects

My Account

Login

Statistics

View Usage Statistics

University of Latvia
Contact Us | Send Feedback
Theme by 
@mire NV