• English
    • Latviešu
    • Deutsch
    • русский
  • Help
  • русский 
    • English
    • Latviešu
    • Deutsch
    • русский
  • Войти
Просмотр элемента 
  •   Главная
  • B4 – LU fakultātes / Faculties of the UL
  • A -- Eksakto zinātņu un tehnoloģiju fakultāte / Faculty of Science and Technology
  • Bakalaura un maģistra darbi (EZTF) / Bachelor's and Master's theses
  • Просмотр элемента
  •   Главная
  • B4 – LU fakultātes / Faculties of the UL
  • A -- Eksakto zinātņu un tehnoloģiju fakultāte / Faculty of Science and Technology
  • Bakalaura un maģistra darbi (EZTF) / Bachelor's and Master's theses
  • Просмотр элемента
JavaScript is disabled for your browser. Some features of this site may not work without it.

Fonētiskās vārdnīcas un valodas modeļa izstrāde latviešu valodas runas apstrādei

Thumbnail
Открыть
302-43332-Dargis_Roberts_rd10007.pdf (1.156Mb)
Автор
Darģis, Roberts
Co-author
Latvijas Universitāte. Datorikas fakultāte
Advisor
Bārzdiņš, Guntis
Дата
2014
Metadata
Показать полную информацию
Аннотации
Darbā tika pētītas divas no svarīgākajām sastāvdaļām ir valodas modelis un fonētiskā vārdnīca. Analizēta četru dažādu tekstu korpusu un to apvienojumu ietekme uz runas atpazīšana kvalitāti latviešu valodā. Testētas trīs dažādas fonētiskās izrunas ieguves metodes. Iegūtais rezultāts ir valodas atkarīgs, bet izmantotās metodes ir valodas neatkarīgas. Bāzlīnijas nepārtrauktas runas atpazīšanas sistēmas precizitāte ir 36.17%. Pēc uzlabojumu veikšanas precizitāte paaugstinājās par 6.45%, no 36.17% uz 42.62%. Lai gan labākie rezultāti tika sasniegti ar bāzlīnijas metodēm, darba izstrādes laikā iegūtās zināšanas ļaus pilnveidot bāzlīnijā izmantoto metožu kvalitāti. Atslēgvārdi: runas atpazīšanas sistēmas, runas atpazīšana process, valodas modeļi, fonētiskā vārdnīca.
 
The study investigated two of the most important components of speech processing - a language model and phonetic dictionary. Comparison of four different text corpora and their combination was done to estimate language model impact on Latvian speech recognition. Three different phonetic pronunciation extraction methods were tested. The result is language dependent, but the methods used are language independent. The baseline for continuous speech recognition system is 36.17%. After improvement the accuracy increased by 6:45% from 36.17% to 42.62%. Although the best results were achieved with the baseline methods, the knowledge gained in method development will help to improve the quality of the methods used in the baseline. Keywords: speech recognition systems, speech recognition, language modeling, graphe-to-phoneme modelation.
 
URI
https://dspace.lu.lv/dspace/handle/7/21139
Collections
  • Bakalaura un maģistra darbi (EZTF) / Bachelor's and Master's theses [6025]

University of Latvia
Контакты | Отправить отзыв
Theme by 
@mire NV
 

 

Просмотр

Весь DSpaceСообщества и коллекцииДата публикацииАвторыНазванияТематикаЭта коллекцияДата публикацииАвторыНазванияТематика

Моя учетная запись

Войти

Статистика

Просмотр статистики использования

University of Latvia
Контакты | Отправить отзыв
Theme by 
@mire NV