• English
    • Latviešu
    • Deutsch
    • русский
  • Help
  • English 
    • English
    • Latviešu
    • Deutsch
    • русский
  • Login
View Item 
  •   DSpace Home
  • B4 – LU fakultātes / Faculties of the UL
  • A -- Eksakto zinātņu un tehnoloģiju fakultāte / Faculty of Science and Technology
  • Bakalaura un maģistra darbi (EZTF) / Bachelor's and Master's theses
  • View Item
  •   DSpace Home
  • B4 – LU fakultātes / Faculties of the UL
  • A -- Eksakto zinātņu un tehnoloģiju fakultāte / Faculty of Science and Technology
  • Bakalaura un maģistra darbi (EZTF) / Bachelor's and Master's theses
  • View Item
JavaScript is disabled for your browser. Some features of this site may not work without it.

Runas sintēze latviešu valodā

Thumbnail
View/Open
302-103021-Saulitis_Kriss_ks18108.pdf (2.879Mb)
Author
Saulītis, Krišs
Co-author
Latvijas Universitāte. Datorikas fakultāte
Advisor
Urtāns, Ēvalds
Date
2024
Metadata
Show full item record
Abstract
Pētījuma mērķis bija izstrādāt augstākas kvalitātes un precizitātes latviešu valodas runas sintēzes modeli, izpētot datu kopas priekšapstrādes un apmācības metodes. Lai to sasniegtu tika veikta eksperimentālā salīdzināšana un izstrādāts jauns runas sintēzes modelis latviešu valodā, izmantojot inovatīvas datu priekšapstrādes un apmācības metodes. Pārbaudot esošās runas sintēzes datu kopas un to priekšapstrādes procedūras, tika sagatavotas un apmācītas datu kopas, kā arī veikts salīdzinājums ar tirgū pieejamiem runas sintēzes rīkiem. Jaunizstrādātais modelis sasniedza augstākas kvalitātes rādītāju nekā citi runas sintēzes rīki - NISQA 5.02 un CER 0.17%. Pētījums norāda, ka kvalitatīvai runas sintēzei ir būtiski veikt rūpīgu datu kopu priekšapstrādi, izmantojot ASR modeļus, uzlabojot balss ierakstu kvalitāti un runātāju balss pārnesi.
 
The goal of this study was to develop speech synthesis model for the Latvian language that achieves a higher quality and precision. To do this, the study conducted an experimental comparison and the development of a new speech synthesis model for the Latvian language, employing innovative data preprocessing and training methods. Existing speech synthesis datasets and their preprocessing procedures were examined, leading to the preparation and training of a dataset, which was then compared with commercially available speech synthesis tools. The newly developed model achieved higher quality metrics, than other speech synthesis tools, recording a NISQA score of 5.02 and a CER of 0.17%. The research indicates that for high-quality speech synthesis, meticulous preprocessing of datasets is essential, utilizing ASR models to enhance the quality of voice recordings and the transfer of speaker voices.
 
URI
https://dspace.lu.lv/dspace/handle/7/66163
Collections
  • Bakalaura un maģistra darbi (EZTF) / Bachelor's and Master's theses [5688]

University of Latvia
Contact Us | Send Feedback
Theme by 
@mire NV
 

 

Browse

All of DSpaceCommunities & CollectionsBy Issue DateAuthorsTitlesSubjectsThis CollectionBy Issue DateAuthorsTitlesSubjects

My Account

Login

Statistics

View Usage Statistics

University of Latvia
Contact Us | Send Feedback
Theme by 
@mire NV