Dažādu formātu dokumentu transformācija mašīntulkošanā
Author
Želvis, Miks
Co-author
Latvijas Universitāte. Datorikas fakultāte
Advisor
Šics, Valters
Date
2014Metadata
Show full item recordAbstract
Kvalifikācijas darba „Dažādu formātu dokumentu transformācija mašīntulkošanā” mērķis ir izveidot un integrēt modulāru un elastīgu moduli LetsMT mašīntulkošanas platformā, kas nodrošina vairāku formātu bagātināta satura un atšķirīgi marķētu dokumentu transformāciju tulkošanas vajadzībām, to satura tulkošanas izsaukšanu, kā arī iztulkotā satura atjaunošanu ievades dokumentam atbilstošā formātā. Darba ietvaros implementēta DOCX, TXT, TTX, TMX, Leaf, XLIFF un to paveidu failu transformācija un tulkošana.
Programmatūra izstrādāta Python programmēšanas valodā un paredzēta darbināšanai Linux vidē.
Atslēgvārdi: mašīntulkošana, bagātināta teksta dokumenti, teksta izguve, dokumentu transformācija The qualification work "Multi-format Document Transformation in Machine Translation" aims to develop and integrate a modular and flexible module in the LetsMT machine translation platform, that provides multi-format enriched content and tagged document transformation for translation needs, translation itself, as well as the renewal of the translated content in the appropriate format based on the input document. As a part of the work, DOCX, TXT, TTX, TMX, Leaf, XLIFF and SDLXLIFF format document transformation and translation has been implemented.
The software is developed in Python programming language and is intended to operate in the Linux environment.
Keywords: machine translation, rich text documents, text retrieval, document transformation