Show simple item record

dc.contributor.advisorSkadiņa, Ingunaen_US
dc.contributor.authorBrālītis, Edgarsen_US
dc.contributor.otherLatvijas Universitāte. Fizikas un matemātikas fakultāteen_US
dc.date.accessioned2015-03-24T07:36:52Z
dc.date.available2015-03-24T07:36:52Z
dc.date.issued2008en_US
dc.identifier.other9285en_US
dc.identifier.urihttps://dspace.lu.lv/dspace/handle/7/19834
dc.description.abstractDarbā aprakstīti statistiskās mašīntulkošanas sistēmas darbības pamatprincipi un komponenti (valodas modelis, tulkošanas modelis un dekoders). Teorētiskās metodes izmantotas angļu-latviešu eksperimentālas statistiskās mašīntulkošanas sistēmas izveidē, pilnveidē un novērtēšanā. Eksperimentālās sistēmas apmācīšanai un novērtēšanai izmantotas JRC-Acquis angļu-latviešu korpusa 2.2 un 3.0 versijas. Ar praktisku eksperimentu pierādīta hipotēze, ka angļu-latviešu statistiskās mašīntulkošanas sistēmas tulkošanas kvalitāti iespējams uzlabot, palielinot apmācības korpusu. Sistēmas novērtēšanai izmantota BLEU metrika, kas labāko sistēmu novērtēja ar 0.3182 punktiem (31.82 %). Labākās sistēmas demonstrācijas versija pieejama adresē: kushkjis.selfip.net/en-lv_smt_demo.php Atslēgvārdi: statistiskā mašīntulkošana, valodas modelis, tulkošanas modelis, dekoders.en_US
dc.description.abstractIn this work main principles of the Statistical Machine translation System and its constituents (language model, translation model and decoder) are described. Theoretical methods are applied in development, improvement and evaluation of the English-Latvian experimental statistical machine translation system. In order to create the experimental system, JRC-Acquis English-Latvian parallel corpus (versions 2.2 and 3.0) were used. Hypothesis that enlargement of training corpus results in improvement of translations quality was proved. For evaluation BLEU metrics was used, which for the best system reached 0.3182 points (31.82 %). The demonstration of the best translation system with the highest BLEU metrics is available at kushkjis.selfip.net/en-lv_smt_demo.php Keywords: statistical machine translation, language model, translation model, decoder.en_US
dc.language.isoN/Aen_US
dc.publisherLatvijas Universitāteen_US
dc.rightsinfo:eu-repo/semantics/openAccessen_US
dc.subjectDatorzinātneen_US
dc.titleAngļu-latviešu statistiskās mašīntulkošanas sistēmas izveide, pilnveide un novērtēšanaen_US
dc.title.alternativeDevelopment, improvement and evaluation of the English-Latvian statistical machine translation systemen_US
dc.typeinfo:eu-repo/semantics/bachelorThesisen_US


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record