Atpazīšanas problēmas risināšana, pielietojot daļēji uzraudzītu mašīnmācīšanos
Author
Tarasovs, Maksims
Co-author
Latvijas Universitāte. Datorikas fakultāte
Advisor
Zuters, Jānis
Date
2011Metadata
Show full item recordAbstract
Tradicionāli, mašīnmācīšanās tiek pētīta vai nu ar neuzraudzītās apmācīšanās paradigmu(piem., klāsterizācija), kur visi dati ir neatzīmēti, vai arī ar uzraudzītās apmācīšanās paradigmu(piem., klasifikācija, regresija), kur visi dati ir atzīmēti.
Šī darba mērķis ir izpētīt, kā atzīmēto un neatzīmēto datu kombinācija var izmainīt apmācīšanās uzvedību un apskatīt algoritmus, kas izmanto tādu kombināciju. Daļēji uzraudzītā apmācīšanās ir ļoti perspektīvā tādās nozarēs kā mašīnmācīšanās un datu krāšana, jo tā var izmantot viegli pieejamus neatzīmētus datus, lai uzlabot uzraudzītās apmācīšanās uzdevumu risināšanu situācijās, kad atzīmēti dati ir dārgi. Traditionally, machine learning has been studied either in the unsupervised paradigm (e.g., clustering) where all the data are unlabeled, or in the supervised paradigm (e.g., classification, regression) where all the data are labeled.
The goal of this work is to understand how combining labeled and unlabeled data may change the learning behavior, and describe algorithms that take advantage of such a combination. Semi-supervised learning is of great interest in machine learning and data mining because it can use readily available unlabeled data to improve supervised learning tasks when the labeled data are expensive.