• English
    • Latviešu
    • Deutsch
    • русский
  • Help
  • Deutsch 
    • English
    • Latviešu
    • Deutsch
    • русский
  • Einloggen
Dokumentanzeige 
  •   DSpace Startseite
  • B4 – LU fakultātes / Faculties of the UL
  • A -- Eksakto zinātņu un tehnoloģiju fakultāte / Faculty of Science and Technology
  • Bakalaura un maģistra darbi (EZTF) / Bachelor's and Master's theses
  • Dokumentanzeige
  •   DSpace Startseite
  • B4 – LU fakultātes / Faculties of the UL
  • A -- Eksakto zinātņu un tehnoloģiju fakultāte / Faculty of Science and Technology
  • Bakalaura un maģistra darbi (EZTF) / Bachelor's and Master's theses
  • Dokumentanzeige
JavaScript is disabled for your browser. Some features of this site may not work without it.

Latviešu valodas teksta automatizēta apstrāde runas sintēzes vajadzībām

Thumbnail
Öffnen
302-101451-Lasmanis_Viesturs.Julijs_vl19039.pdf (1.684Mb)
Autor
Lasmanis, Viesturs Jūlijs
Co-author
Latvijas Universitāte. Datorikas fakultāte
Advisor
Grūzītis, Normunds
Datum
2024
Metadata
Zur Langanzeige
Zusammenfassung
Latviešu valodas runas sintēzē ir identificētas dažādas situācijas, kad kontekstuāli pareizas tekstvienību izrunas noteikšana sagādā problēmas. Darbā tiek aplūkotas divas pieejas kā automatizēti noteikt kontekstam atbilstošās izrunas: skaitļu izvēršana vārdos, izrunas anotēšana. Darba ietvaros tika izstrādātas un salīdzinātas trīs metodes skaitļu izvēršanai: sintaktiskā parsēšana, ChatGPT ar attiecīgu sistēmas uzvedni, specializēta mT5 neironu modeļa apmācīšana. Visaugstākos rezultātus iegūst sintaktiskās parsēšanas metode, sasniedzot 78,8% un 80% precizitāti uz divām darbā izveidotajām testa datu kopām. Vārdu un to locījumu fonētiskajai transkribēšanai ir veiksmīgi izveidots morfoloģiskā analizatora LVTagger paplašinājums. Vienlaikus tika konstatēti nepieciešamie uzlabojumi bāzes tagerī, lai šo metodi varētu pilnvērtīgi pielietot.
 
Latvian language text to speech synthesis has many situations in which it is difficult to determine the contextually proper pronunciation. Within this work the author looks at two approaches to automate pronunciation correction: numeral expansion, phonetic transcribing. The author developed and tested three different methods for expanding numerals within text – syntactic parsing, promt-engineered ChatGPT and fine-tuned mT5 neural network model. The highest accuracy for the task was achieved with the syntactic parsing method (78,76% and 80%) on the two created test datasets. For the purposes of correcting and declinating Latvian phonetic transcription, the author developed an extension for the morphological analyzer LVTagger. Additionally the author determined necessary LVTagger base model improvents to use this feature in practice.
 
URI
https://dspace.lu.lv/dspace/handle/7/66057
Collections
  • Bakalaura un maģistra darbi (EZTF) / Bachelor's and Master's theses [5770]

University of Latvia
Kontakt | Feedback abschicken
Theme by 
@mire NV
 

 

Stöbern

Gesamter BestandBereiche & SammlungenErscheinungsdatumAutorenTitelnSchlagwortenDiese SammlungErscheinungsdatumAutorenTitelnSchlagworten

Mein Benutzerkonto

Einloggen

Statistik

Benutzungsstatistik

University of Latvia
Kontakt | Feedback abschicken
Theme by 
@mire NV