Show simple item record

dc.contributor.advisorVeisbergs, Andrejs
dc.contributor.authorSeikstule, Rūta
dc.contributor.otherLatvijas Universitāte. Humanitāro zinātņu fakultāte
dc.date.accessioned2019-07-04T01:08:05Z
dc.date.available2019-07-04T01:08:05Z
dc.date.issued2019
dc.identifier.other71561
dc.identifier.urihttps://dspace.lu.lv/dspace/handle/7/48503
dc.description.abstractŠajā maģistra darbā tiek pētīta latviešu valodas atpazīšanai pielāgotu balss atpazīšanas sistēmu kvalitāte mutvārdu mašīntulkojuma sistēmas izveides kontekstā. Šī darba mērķis identificēt kļūdu īpatsvaru "Tildes Balss" balss atpazīšanas sistēmas izvaddatos, kā arī to ietekmi uz turpmāku valodas apstrādi "Tildes Tulkotājs" mašīntulkošanas sistēmā. Šī pētījuma ietvaros no 35 tiešsaistē pieejamiem materiāliem tika izveidots 4 stundu un 47 minūšu ilgs saistītās runas korpuss, veikta rezultātu analīze, izmantojot kļūdu īpatsvara aprēķina formulu, kā arī eksperimentāla analīze, lai noteiktu identificēto kļūdu ietekmi uz mašīntulkojuma rezultātiem. Pētījumā iegūtie rezultāti liecina, ka vispārējais kļūdu īpatsvars "Tildes Balss" izvaddatos ir 10,5 %, un lielākajai daļai analizēto izvaddatu ir neliela ietekme vai nav nekādas ietekmes uz turpmāku valodas apstrādi "Tildes Tulkotājs" mašīntulkošanas sistēmā.
dc.description.abstractThis Master Thesis is an investigation of the current state of automated speech recognition for Latvian in the context of designing speech-to-speech translation systems. The goal of this paper is to identify the error rates in 'Tildes Balss' automated speech recognition outputs and their effect on further 'Tildes Tulkotājs' machine translation language processing. The research involves developing a 4-hour and 47-minute continuous spoken language corpus derived from 35 Online sources, analysis by means of word-error rate calculation, and experimental evaluation of the effects of the identified errors on machine translation outputs. The obtained results indicate that the overall word-error rate in 'Tildes Balss' outputs is 10.5%, and the majority of the evaluated output errors have no or minor effect on further language processing in 'Tildes Tulkotājs' machine translation system.
dc.language.isolav
dc.publisherLatvijas Universitāte
dc.rightsinfo:eu-repo/semantics/openAccess
dc.subjectValodniecība
dc.subjectbalss atpazīšana
dc.subjectmutvārdu mašīntulkojums
dc.subjectkļūdu īpatsvars
dc.subjectautomatizēta valodu apstrāde
dc.titleRunas atpazīšana mutvārdu mašīntulkojumā
dc.title.alternativeAutomated speech recognition in speech-to-speech translation
dc.typeinfo:eu-repo/semantics/masterThesis


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record