• English
    • Latviešu
    • Deutsch
    • русский
  • Help
  • English 
    • English
    • Latviešu
    • Deutsch
    • русский
  • Login
View Item 
  •   DSpace Home
  • B4 – LU fakultātes / Faculties of the UL
  • A -- Eksakto zinātņu un tehnoloģiju fakultāte / Faculty of Science and Technology
  • Bakalaura un maģistra darbi (EZTF) / Bachelor's and Master's theses
  • View Item
  •   DSpace Home
  • B4 – LU fakultātes / Faculties of the UL
  • A -- Eksakto zinātņu un tehnoloģiju fakultāte / Faculty of Science and Technology
  • Bakalaura un maģistra darbi (EZTF) / Bachelor's and Master's theses
  • View Item
JavaScript is disabled for your browser. Some features of this site may not work without it.

Mašīntulkotu nosaukto entitāšu gramatisko locījumu noteikšana automātiskajā pēcrediģēšanā

Thumbnail
View/Open
302-75927-Volska_Kristine_kv16035.pdf (869.2Kb)
Author
Voļska, Kristīne
Co-author
Latvijas Universitāte. Datorikas fakultāte
Advisor
Bergmanis, Toms
Date
2020
Metadata
Show full item record
Abstract
Dziļās mašīnmācīšanās sasniegumi ir veicinājuši ievērojamu attīstību mašīntulkošanas jomā. Tomēr joprojām bieži tiek novērots, ka retas nosauktās entitātes neironu mašīntulkošanas sistēmas iztulko nepareizi. Kļūdaini tulkotu nosaukto entitāšu labošanu var veikt, izmantojot automātisko pēcrediģēšanu. Pēcrediģēšana kā vienu no soļiem ietver teikuma kontekstā iederīgas morfoloģiskās formas noteikšanu. Šī darba mērķis bija izstrādāt un apmācīt klasifikatoru nosauktās entitātes teikumā iederīgo morfoloģisko kategoriju formu paredzēšanai. Darba ietvaros tika izpētīts, kā risinātas līdzīgas ar vārdu kontekstuālu morfoloģisko analīzi saistītas problēmas, sagatavoti klasifikatoram piemēroti apmācības dati, izstrādāts un novērtēts klasifikators. Darbā izstrādātais klasifikators 95 % gadījumu paredzēja morfoloģisko kategoriju formas teikumā iederīgajai morfoloģiskajai formai vai kādai no tās sinkrētiskajām formām.
 
Deep learning methods have made significant advances in the field of machine translation. However, it is still common that neural machine translation systems translate rare named entities incorrectly. Mistranslated named entities can be corrected using automatic post-editing methods. One of the steps during post-editing is to detect the correct paradigm slot of the entity, depending on the context of the sentence. The aim of this study was to develop and train a classifier for detecting the correct morphological category forms of the named entity in the context of the sentence. In the scope of the study, it was examined how similar problems related to word contextual morphological analysis were addressed, training data for the classifier were prepared and the classifier was developed and evaluated. In 95% of the cases, the classifier predicted correct morphological category forms for the morphological form or one of its syncretic forms.
 
URI
https://dspace.lu.lv/dspace/handle/7/51702
Collections
  • Bakalaura un maģistra darbi (EZTF) / Bachelor's and Master's theses [5688]

University of Latvia
Contact Us | Send Feedback
Theme by 
@mire NV
 

 

Browse

All of DSpaceCommunities & CollectionsBy Issue DateAuthorsTitlesSubjectsThis CollectionBy Issue DateAuthorsTitlesSubjects

My Account

Login

Statistics

View Usage Statistics

University of Latvia
Contact Us | Send Feedback
Theme by 
@mire NV