• English
    • Latviešu
    • Deutsch
    • русский
  • Help
  • Deutsch 
    • English
    • Latviešu
    • Deutsch
    • русский
  • Einloggen
Dokumentanzeige 
  •   DSpace Startseite
  • B4 – LU fakultātes / Faculties of the UL
  • B --- Bij. Fizikas, matemātikas un optometrijas fakultātes studentu noslēguma darbi / Faculty of Physics, Mathematics and Optometry - Graduate works
  • Bakalaura un maģistra darbi (FMOF) / Bachelor's and Master's theses
  • Dokumentanzeige
  •   DSpace Startseite
  • B4 – LU fakultātes / Faculties of the UL
  • B --- Bij. Fizikas, matemātikas un optometrijas fakultātes studentu noslēguma darbi / Faculty of Physics, Mathematics and Optometry - Graduate works
  • Bakalaura un maģistra darbi (FMOF) / Bachelor's and Master's theses
  • Dokumentanzeige
JavaScript is disabled for your browser. Some features of this site may not work without it.

Statistiskās metodes runas audiosignālu un fonētiskā pieraksta sastatīšanai

Thumbnail
Öffnen
304-44042-Katrina_Paikena-kp06017.pdf (637.1Kb)
Autor
Paikena, Katrīna
Co-author
Latvijas Universitāte. Fizikas un matemātikas fakultāte
Advisor
Valeinis, Jānis
Datum
2014
Metadata
Zur Langanzeige
Zusammenfassung
Runas sastatīšana ar tekstu jeb runas segmentācija ir problēma, kā atrast vietu, kur audio ierakstā parādās katrs vārds vai skaņa. Runas segmentāciju var veikt cilvēks manuāli, taču šajā darbā ir apskatīta automātiskā runas segmentācija, kas dod iespēju ātri apstrādāt lielus datu apjomus. Maģistra darbā ir izpētītas automātiskajā runas segmentācijā izmantotās statistikas metodes, īpašu uzmanību pievēršot slēptajiem Markova modeļiem un to problemātikai. Tiek aplūkoti arī jauktie Gausa modeļi, kas tiek izmantoti runas segmentēšanā, lai modelētu nepārtrauktu audio signālu. Darbā ir aprakstītas runas atpazīšanas rīkkopas, HTK un Julius, kas praksē izmanto slēptos Markova modeļus, un tiek apskatīti vairāki uz šīm rīkkopām balstīti runas segmentācijas rīki. Tā kā līdz šim neeksistēja runas segmentācijas rīks latviešu valodai, darba praktiskajā daļā tika izveidots rīks, kas veic runas segmentāciju latviešu valodai, izmantojot slēptos Markova modeļus un Viterbi algoritmu.
 
Forced speech alignment or text segmentation is the problem of finding the time at which each sound and word appear in an audio recording. Forced alignment can be done manually, but the manual alignment of large amounts of data can take an excessively long time. This paper discusses automatic alignment, which can relatively quickly align large corpora of speech. This paper investigates the statistical methods used in speech alignment, particularly Hidden Markov Models and their main problems, as well as Gaussian Mixture models, a type of Hidden Markov Models that are used in speech alignment to model a continuous signal. Additionally, this paper describes two speech recognition toolkits that use Hidden Markov Models, HTK and Julius, and a number of speech segmentation tools based on them. Finally, a forced alignment tool that uses hidden Markov models and Viterbi algorithm was developed for the Latvian language, since no such tool currently exists.
 
URI
https://dspace.lu.lv/dspace/handle/7/27455
Collections
  • Bakalaura un maģistra darbi (FMOF) / Bachelor's and Master's theses [2775]

University of Latvia
Kontakt | Feedback abschicken
Theme by 
@mire NV
 

 

Stöbern

Gesamter BestandBereiche & SammlungenErscheinungsdatumAutorenTitelnSchlagwortenDiese SammlungErscheinungsdatumAutorenTitelnSchlagworten

Mein Benutzerkonto

Einloggen

Statistik

Benutzungsstatistik

University of Latvia
Kontakt | Feedback abschicken
Theme by 
@mire NV