Atpazīšanas problēmas risināšana, pielietojot daļēji uzraudzītu mašīnmācīšanos

Tarasovs, Maksims

View/Open

302-18320-Tarasovs_Maksims_mt07002.pdf (1.888Mb)

Author

Tarasovs, Maksims

Co-author

Latvijas Universitāte. Datorikas fakultāte

Advisor

Zuters, Jānis

Date

2011

Metadata

Show full item record

Abstract

Tradicionāli, mašīnmācīšanās tiek pētīta vai nu ar neuzraudzītās apmācīšanās paradigmu(piem., klāsterizācija), kur visi dati ir neatzīmēti, vai arī ar uzraudzītās apmācīšanās paradigmu(piem., klasifikācija, regresija), kur visi dati ir atzīmēti. Šī darba mērķis ir izpētīt, kā atzīmēto un neatzīmēto datu kombinācija var izmainīt apmācīšanās uzvedību un apskatīt algoritmus, kas izmanto tādu kombināciju. Daļēji uzraudzītā apmācīšanās ir ļoti perspektīvā tādās nozarēs kā mašīnmācīšanās un datu krāšana, jo tā var izmantot viegli pieejamus neatzīmētus datus, lai uzlabot uzraudzītās apmācīšanās uzdevumu risināšanu situācijās, kad atzīmēti dati ir dārgi.

Traditionally, machine learning has been studied either in the unsupervised paradigm (e.g., clustering) where all the data are unlabeled, or in the supervised paradigm (e.g., classification, regression) where all the data are labeled. The goal of this work is to understand how combining labeled and unlabeled data may change the learning behavior, and describe algorithms that take advantage of such a combination. Semi-supervised learning is of great interest in machine learning and data mining because it can use readily available unlabeled data to improve supervised learning tasks when the labeled data are expensive.

URI

https://dspace.lu.lv/dspace/handle/7/15901

Collections

Bakalaura un maģistra darbi (EZTF) / Bachelor's and Master's theses [6168]