• English
    • Latviešu
    • Deutsch
    • русский
  • Help
  • русский 
    • English
    • Latviešu
    • Deutsch
    • русский
  • Войти
Просмотр элемента 
  •   Главная
  • B4 – LU fakultātes / Faculties of the UL
  • B --- Bij. Fizikas, matemātikas un optometrijas fakultātes studentu noslēguma darbi / Faculty of Physics, Mathematics and Optometry - Graduate works
  • Bakalaura un maģistra darbi (FMOF) / Bachelor's and Master's theses
  • Просмотр элемента
  •   Главная
  • B4 – LU fakultātes / Faculties of the UL
  • B --- Bij. Fizikas, matemātikas un optometrijas fakultātes studentu noslēguma darbi / Faculty of Physics, Mathematics and Optometry - Graduate works
  • Bakalaura un maģistra darbi (FMOF) / Bachelor's and Master's theses
  • Просмотр элемента
JavaScript is disabled for your browser. Some features of this site may not work without it.

Angļu-latviešu statistiskās mašīntulkošanas sistēmas izveide, pilnveide un novērtēšana

Thumbnail
Открыть
304-9285-Bralitis_Edgars_DatZ030080.pdf (408.7Kb)
Автор
Brālītis, Edgars
Co-author
Latvijas Universitāte. Fizikas un matemātikas fakultāte
Advisor
Skadiņa, Inguna
Дата
2008
Metadata
Показать полную информацию
Аннотации
Darbā aprakstīti statistiskās mašīntulkošanas sistēmas darbības pamatprincipi un komponenti (valodas modelis, tulkošanas modelis un dekoders). Teorētiskās metodes izmantotas angļu-latviešu eksperimentālas statistiskās mašīntulkošanas sistēmas izveidē, pilnveidē un novērtēšanā. Eksperimentālās sistēmas apmācīšanai un novērtēšanai izmantotas JRC-Acquis angļu-latviešu korpusa 2.2 un 3.0 versijas. Ar praktisku eksperimentu pierādīta hipotēze, ka angļu-latviešu statistiskās mašīntulkošanas sistēmas tulkošanas kvalitāti iespējams uzlabot, palielinot apmācības korpusu. Sistēmas novērtēšanai izmantota BLEU metrika, kas labāko sistēmu novērtēja ar 0.3182 punktiem (31.82 %). Labākās sistēmas demonstrācijas versija pieejama adresē: kushkjis.selfip.net/en-lv_smt_demo.php Atslēgvārdi: statistiskā mašīntulkošana, valodas modelis, tulkošanas modelis, dekoders.
 
In this work main principles of the Statistical Machine translation System and its constituents (language model, translation model and decoder) are described. Theoretical methods are applied in development, improvement and evaluation of the English-Latvian experimental statistical machine translation system. In order to create the experimental system, JRC-Acquis English-Latvian parallel corpus (versions 2.2 and 3.0) were used. Hypothesis that enlargement of training corpus results in improvement of translations quality was proved. For evaluation BLEU metrics was used, which for the best system reached 0.3182 points (31.82 %). The demonstration of the best translation system with the highest BLEU metrics is available at kushkjis.selfip.net/en-lv_smt_demo.php Keywords: statistical machine translation, language model, translation model, decoder.
 
URI
https://dspace.lu.lv/dspace/handle/7/19834
Collections
  • Bakalaura un maģistra darbi (FMOF) / Bachelor's and Master's theses [2775]

University of Latvia
Контакты | Отправить отзыв
Theme by 
@mire NV
 

 

Просмотр

Весь DSpaceСообщества и коллекцииДата публикацииАвторыНазванияТематикаЭта коллекцияДата публикацииАвторыНазванияТематика

Моя учетная запись

Войти

Статистика

Просмотр статистики использования

University of Latvia
Контакты | Отправить отзыв
Theme by 
@mire NV