Mašīntulkošanas korpusu tīrītāja rīka izstrāde
Author
Zariņa, Ieva
Co-author
Latvijas Universitāte. Datorikas fakultāte
Advisor
Rikters, Matīss
Date
2015Metadata
Show full item recordAbstract
Darbs „Mašīntulkošanas korpusu tīrītāja rīka izstrāde” apraksta programmas izstrādi, kas ļauj filtrēt un apstrādāt paralēlu vai neparalēlu korpusa tekstu, vadoties pēc kvantificējamiem un kvalitatīviem kritērijiem. Tie iekļauj noteiktu daudzumu filtrējošu un tīrošu funkciju. The paper “Development of Corpus Cleaner in the Field of Machine Translation” deals with mono and parallel corpora cleaning and filtering of selected sentence pairs by quantitative and qualitative criteria. This includes a number of filtering and cleaning functions.