Show simple item record

dc.contributor.advisorSkadiņš, Raivisen_US
dc.contributor.authorŠics, Valtersen_US
dc.contributor.otherLatvijas Universitāte. Datorikas fakultāteen_US
dc.date.accessioned2015-03-24T08:42:06Z
dc.date.available2015-03-24T08:42:06Z
dc.date.issued2010en_US
dc.identifier.other16104en_US
dc.identifier.urihttps://dspace.lu.lv/dspace/handle/7/24964
dc.description.abstractStatistiskā mašīntulkošana (SMT) teksta tulkošanai izmanto statistikas datus, kas iegūti no iepriekš tulkotiem tekstiem jeb paralēlajiem korpusiem. Lai iegūtie statistikas dati būtu ticami nepieciešams ļoti daudz šāda teksta. Latviešu valodai paralēlos korpusus iegūt ir krietni grūtāk nekā lielajām valodām kā angļu. Turklāt latviešu valoda ir lokāmu un ar sarežģītu gramatiku. Šī iemesla dēļ ticamas statistikas veidošanai nepieciešams vēl vairāk paralēlo korpusu. Salīdzinoši nesen ir ieviesti faktormodeļi, kas ļauj veidot SMT, kas papildinātas ar lingvistiskajām zināšanām. Izmantojot informāciju par vārdu locījumiem un vārdšķirām, iespējams precīzāk modelēt tulkojumus. Darba mērķis ir atrast efektīvus faktormodeļus, kas uzlabo tulkojuma kvalitāti angļu-latviešu tulkošanas virzienam. Eksperimentu ceļā darbā ir pierādīts, ka faktormodeļu izmantošana dod tulkojuma uzlabojumu salīdzinājumā ar tradicionālo SMT.en_US
dc.description.abstractThe statistical machine translation (SMT) systems translate a text using a statistical data obtained from the previously translated texts so called parallel corpus. To be sure that statistical data are reliable, requires a lot of such text. Obtaining parallel corpuses for the Latvian language is much harder than for the big languages like English. Furthermore, the Latvian language is highly inflected with complex grammar. For this reason, to achieve reliable statistics, it is necessary for even more parallel corpuses. Relatively recently factored models has been introduced which allows to build SMT system augmented by linguistic knowledge. Using information of inflections and the parts of speech can accurately produce the translations. The goal is to find effective factored models which improve the quality of the translation in the English-Latvian translation direction. Experimentation through the work it is shown that the use of factored models gives the translation improvement compared to traditional SMT.en_US
dc.language.isoN/Aen_US
dc.publisherLatvijas Universitāteen_US
dc.rightsinfo:eu-repo/semantics/openAccessen_US
dc.subjectDatorzinātneen_US
dc.titleUz Mosesen_US
dc.title.alternativebāzes izstrādātas statistiskās mašīntulkošanas sistēmas pielāgošana latviešu valodaien_US
dc.typeinfo:eu-repo/semantics/masterThesisen_US


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record