Mašīntulkošanas korpusu tīrītāja rīka izstrāde
Autor
Zariņa, Ieva
Co-author
Latvijas Universitāte. Datorikas fakultāte
Advisor
Rikters, Matīss
Datum
2015Metadata
Zur LanganzeigeZusammenfassung
Darbs „Mašīntulkošanas korpusu tīrītāja rīka izstrāde” apraksta programmas izstrādi, kas ļauj filtrēt un apstrādāt paralēlu vai neparalēlu korpusa tekstu, vadoties pēc kvantificējamiem un kvalitatīviem kritērijiem. Tie iekļauj noteiktu daudzumu filtrējošu un tīrošu funkciju. The paper “Development of Corpus Cleaner in the Field of Machine Translation” deals with mono and parallel corpora cleaning and filtering of selected sentence pairs by quantitative and qualitative criteria. This includes a number of filtering and cleaning functions.