Mašīntulkotu nosaukto entitāšu gramatisko locījumu noteikšana automātiskajā pēcrediģēšanā
Author
Voļska, Kristīne
Co-author
Latvijas Universitāte. Datorikas fakultāte
Advisor
Bergmanis, Toms
Date
2020Metadata
Show full item recordAbstract
Dziļās mašīnmācīšanās sasniegumi ir veicinājuši ievērojamu attīstību mašīntulkošanas jomā. Tomēr joprojām bieži tiek novērots, ka retas nosauktās entitātes neironu mašīntulkošanas sistēmas iztulko nepareizi. Kļūdaini tulkotu nosaukto entitāšu labošanu var veikt, izmantojot automātisko pēcrediģēšanu. Pēcrediģēšana kā vienu no soļiem ietver teikuma kontekstā iederīgas morfoloģiskās formas noteikšanu. Šī darba mērķis bija izstrādāt un apmācīt klasifikatoru nosauktās entitātes teikumā iederīgo morfoloģisko kategoriju formu paredzēšanai. Darba ietvaros tika izpētīts, kā risinātas līdzīgas ar vārdu kontekstuālu morfoloģisko analīzi saistītas problēmas, sagatavoti klasifikatoram piemēroti apmācības dati, izstrādāts un novērtēts klasifikators. Darbā izstrādātais klasifikators 95 % gadījumu paredzēja morfoloģisko kategoriju formas teikumā iederīgajai morfoloģiskajai formai vai kādai no tās sinkrētiskajām formām. Deep learning methods have made significant advances in the field of machine translation. However, it is still common that neural machine translation systems translate rare named entities incorrectly. Mistranslated named entities can be corrected using automatic post-editing methods. One of the steps during post-editing is to detect the correct paradigm slot of the entity, depending on the context of the sentence. The aim of this study was to develop and train a classifier for detecting the correct morphological category forms of the named entity in the context of the sentence. In the scope of the study, it was examined how similar problems related to word contextual morphological analysis were addressed, training data for the classifier were prepared and the classifier was developed and evaluated. In 95% of the cases, the classifier predicted correct morphological category forms for the morphological form or one of its syncretic forms.