Runas izdalīšana audio ierakstos, izmantojot dziļo mašīnapmācību

Saulītis, Krišs

dc.contributor.advisor	Urtāns, Ēvalds
dc.contributor.author	Saulītis, Krišs
dc.contributor.other	Latvijas Universitāte. Datorikas fakultāte
dc.date.accessioned	2021-02-04T02:02:26Z
dc.date.available	2021-02-04T02:02:26Z
dc.date.issued	2021
dc.identifier.other	80080
dc.identifier.uri	https://dspace.lu.lv/dspace/handle/7/53893
dc.description.abstract	Kvalifikācijas darbā tiek aprakstīta sistēma, tās prasības un realizācija. Šī sistēma sastāv no tīmekļa vietnes un mašīnmācīšanās modeļa, ar kura palīdzību ir iespējams izdalīt runas fragmentus augšupielādētajā audio failā. Šī sistēma satur arī datu kopas sagatavošanas moduli, ar kura palīdzību tiek apkopoti dati no FSD50K kopas, un tie tiek sagatavoti priekš jau iepriekš apmācīta DenseNet modeļa pielāgošanas un apmācības. Rezultātā tika apmācīti vairāki modeļi, no kuriem tika atlasīts labākais, kurš pēc tam tika savienots ar tīmekļa vietni, ar kuras palīdzību ir iespējams iesniegt failu runas izdalīšanas analīzei un apskatīt atgriezto rezultātu lietotājam vienkāršā veidā.
dc.description.abstract	This qualification work describes a system, its requirements and realisation. This system contains a website and a machine learning model, which extracts speech fragments from the uploaded audio file. This system also contains the data preparation module, which gathers data from FSD50K dataset and prepares the data for pre-trained DenseNet models training and fine- tuning. As the result, multiple machine learning models were trained and only the best one of chosen to be a part of the website system. The website is used for uploading an audio file for speech extraction analysis and prepares and shows the retuned data in an easy to understand way.
dc.language.iso	lav
dc.publisher	Latvijas Universitāte
dc.rights	info:eu-repo/semantics/openAccess
dc.subject	Datorzinātne
dc.subject	dziļā mašīnmācīšanās
dc.subject	DenseNet
dc.subject	FSD50K
dc.subject	Programmatūra
dc.subject	Audio ieraksti
dc.title	Runas izdalīšana audio ierakstos, izmantojot dziļo mašīnapmācību
dc.title.alternative	Speech extraction from audio recordings using deep machine learning
dc.type	info:eu-repo/semantics/bachelorThesis

Files in this item

Name:: 302-80080-Saulitis_Kriss_ks181 ...
Size:: 1.090Mb
Format:: PDF

View/Open

This item appears in the following Collection(s)

Bakalaura un maģistra darbi (DF) / Bachelor's and Master's theses [3341]

Show simple item record