Sintaksē balstīta subtitru tulkošana pēc BBC vadlīnijām
Author
Pauniņš, Artis
Co-author
Latvijas Universitāte. Datorikas fakultāte
Advisor
Pinnis, Mārcis
Date
2023Metadata
Show full item recordAbstract
Subtitru tulkošanas mērķis ir iztulkot subtitru failos esošo tekstu no vienas valodas citā un to tulkojumus konstruēt jaunos subtitru failos. Tiek apstrādāts subtitru fails, no kura ir jāiegūst teksta saturs. Pirms tulkošanas tekstu apvieno veselos teikumos un pēc tulkošanas sadala subtitros. Subtitri tiek veidoti atbilstoši subtitru veidošanas vadlīnijām, un vadlīnijās norādītajiem nosacījumiem būtu jāsaglabājas arī pēc tulkošanas. Kursa darba ietvaros tika pētīta mašīntulkotu subtitru atbilstība BBC subtitru veidošanas vadlīniju nosacījumiem (lasīšanas ātrums, rindu skaits un simbolu skaits rindā). Papildus tam tika pētīta subtitru tulkojumu kvalitāte, subtitrus tulkojot pa teksta rindām, veseliem subtitriem un veseliem teikumiem ar un bez tagiem. Bakalaura darba ietvaros tiks tālāk attīstīts kursa darba pētījums, pētot teksta dalīšanu subtitros un teksta rindās, ņemot vērā sintaktiskās konstrukcijas, kuras ir aprakstītas BBC vadlīnijās, kā arī teksta dalīšanu subtitros, ņemot vērā vārdu sastatījumu starp avotvalodu un mērķvalodu. Tiks radīts risinājums, kas ļauj izmantot arī ārējus tulkošanas pakalpojumus, kas nenodrošina vārdu sastatīšanu tulkojumiem. The aim of subtitle translation is to translate text in subtitle files from one language to another and to insert their translations into new subtitle files. The subtitle file is processed to obtain text content which is then combined into whole sentences before translation. The translated text is divided into subtitles. Subtitle are created according to subtitling guidelines, and the conditions specified in the guidelines should remain after translation. The coursework studied the compliance of machine-translated subtitles based on BBC's subtitling guidelines (reading speed, number of rows and number of symbols per row). In addition, the quality of subtitle translations was explored, with subtitles translated by lines of text, whole subtitles, and whole sentences with and without tags. The bachelor’s word continues the study explored in the coursework by exploring the division of text into subtitles and lines of text, considering the syntactic chunks described in the BBC guidelines, as well as the division of text into subtitles, given the word alignments between source language and target language. A solution will be created that also allows for the use of external translation services that do not acquire word alignments for translations.