Uzraudzītas mašīnmācīšanās klasifikatoru izpēte un empīriska salīdzināšana
Author
Damberga, Dace
Co-author
Latvijas Universitāte. Datorikas fakultāte
Advisor
Bārzdiņš, Guntis
Date
2015Metadata
Show full item recordAbstract
Maģistra darbā ir salīdzināti uzraudzītas mašīnmācīšanās klasifikatori SVM, C5.0 un C6.0. Darba pirmajā daļā veikta SVM, C5.0 un C6.0 klasifikatoru salīdzināšana pēc ieejas datu formāta un saprotamības, izejas datu formāta un saprotamība un algoritma darbības principa.
Otrajā daļā veikta SVM, C5.0 un C6.0 klasifikatoru empīriska salīdzināšana. Rezultātā izveidots vērtīgs mašīnmācīšanās klasifikatora C6.0 salīdzinājums ar citiem uzraudzītas mašīnmācīšanās klasifikatoriem, novērtējot klasifikācijas kļūdas procentu. Klasifikatoru testēšanai galvenokārt tika izmantotas diskrētas datu kopas, taču pilnvērtīgākam salīdzinājumam, tika iekļautas arī datu kopas ar trūkstošām un skaitliskām vērtībām. Līdz šim šāds salīdzinājums nebija veikts, jo izveidotais mašīnmācīšanās algoritms C6.0 ir nesen izstrādāts The Master’s thesis compares the SVM, C5.0, and C6.0 supervised machine learning classifiers. The first part contains the comparison of SVM, C5.0, and C6.0 by input data format and interpretability, output data format and interpretability and working principles of algorithm.
The second part contains the empirical comparison of SVM, C5.0, C6.0. As a result, a valuable comparison of the C6.0 machine learning with other supervised machine learning classifiers by evaluating the error rate of classification. Discrete data sets were mostly used for testing classifiers, but for more complete comparison, data sets with missing and numeric values were included. Such comparison has not been made as of yet, because the C6.0 machine learning algorithm has only been developed recently.