Показать сокращенную информацию

dc.contributor.advisorBergmanis, Toms
dc.contributor.authorVoļska, Kristīne
dc.contributor.otherLatvijas Universitāte. Datorikas fakultāte
dc.date.accessioned2020-07-01T01:08:44Z
dc.date.available2020-07-01T01:08:44Z
dc.date.issued2020
dc.identifier.other75927
dc.identifier.urihttps://dspace.lu.lv/dspace/handle/7/51702
dc.description.abstractDziļās mašīnmācīšanās sasniegumi ir veicinājuši ievērojamu attīstību mašīntulkošanas jomā. Tomēr joprojām bieži tiek novērots, ka retas nosauktās entitātes neironu mašīntulkošanas sistēmas iztulko nepareizi. Kļūdaini tulkotu nosaukto entitāšu labošanu var veikt, izmantojot automātisko pēcrediģēšanu. Pēcrediģēšana kā vienu no soļiem ietver teikuma kontekstā iederīgas morfoloģiskās formas noteikšanu. Šī darba mērķis bija izstrādāt un apmācīt klasifikatoru nosauktās entitātes teikumā iederīgo morfoloģisko kategoriju formu paredzēšanai. Darba ietvaros tika izpētīts, kā risinātas līdzīgas ar vārdu kontekstuālu morfoloģisko analīzi saistītas problēmas, sagatavoti klasifikatoram piemēroti apmācības dati, izstrādāts un novērtēts klasifikators. Darbā izstrādātais klasifikators 95 % gadījumu paredzēja morfoloģisko kategoriju formas teikumā iederīgajai morfoloģiskajai formai vai kādai no tās sinkrētiskajām formām.
dc.description.abstractDeep learning methods have made significant advances in the field of machine translation. However, it is still common that neural machine translation systems translate rare named entities incorrectly. Mistranslated named entities can be corrected using automatic post-editing methods. One of the steps during post-editing is to detect the correct paradigm slot of the entity, depending on the context of the sentence. The aim of this study was to develop and train a classifier for detecting the correct morphological category forms of the named entity in the context of the sentence. In the scope of the study, it was examined how similar problems related to word contextual morphological analysis were addressed, training data for the classifier were prepared and the classifier was developed and evaluated. In 95% of the cases, the classifier predicted correct morphological category forms for the morphological form or one of its syncretic forms.
dc.language.isolav
dc.publisherLatvijas Universitāte
dc.rightsinfo:eu-repo/semantics/openAccess
dc.subjectDatorzinātne
dc.subjectdabisko valodu apstrāde
dc.subjectautomātiskā pēcrediģēšana
dc.subjectmorfoloģiskā formveidošana
dc.subjectmašīnmācīšanās
dc.subjectperceptrons
dc.titleMašīntulkotu nosaukto entitāšu gramatisko locījumu noteikšana automātiskajā pēcrediģēšanā
dc.title.alternativeAutomatic post-editing: paradigm slot prediction for machine-translated named entities
dc.typeinfo:eu-repo/semantics/bachelorThesis


Файлы в этом документе

Thumbnail

Данный элемент включен в следующие коллекции

Показать сокращенную информацию