Dažādu teksta izmēru klasifikācija

Sosins, Artūrs

dc.contributor.advisor	Zviedris, Mārtiņš	en_US
dc.contributor.author	Sosins, Artūrs	en_US
dc.contributor.other	Latvijas Universitāte. Datorikas fakultāte	en_US
dc.date.accessioned	2015-03-24T08:22:58Z
dc.date.available	2015-03-24T08:22:58Z
dc.date.issued	2013	en_US
dc.identifier.other	34060	en_US
dc.identifier.uri	https://dspace.lu.lv/dspace/handle/7/23096
dc.description.abstract	Mūsdienās strauji pieaug informācijas daudzums, ko var atrast sociālajos portālos. Twitter, Facebook statusi un FourSquare checkin padomi, satur daudzu cilvēku viedokļus, atsauksmes un citu svarīgu informāciju, kā arī daudziem cilvēkiem tas ir kļuvis par primāro jaunas un interesantas informācijas iegūšanas avotu, taču šī informācija satur arī daudz papildus informāciju, kas apgrūtina saistošās informācijas iegūšanu. Šādu informāciju, kā viedokļus, cilvēki intereses, notikumus, utt. ir vērts apstrādāt mēģinot to saklasificēt un strukturēt, lai piemēram, varētu attēlot tikai cilvēkiem interesējošus ierakstus, vai izvilkt viedokļus par noteiktām lietām. Bet lielā šīs informācijas daudzuma dēļ to nevar izdarīt manuāli. Ar standarta automatizētām klasifikācijas metodēm arī nepietiek, jo šādi tekstuāli resursi ir parasti ļoti maza izmēra (140 simboliem un mazāk), līdz ar to ir jāmeklē jauni veidi kā varētu izmantot šādus informācijas avotus un apstrādāt datus ar tik mazu izmēru. Šī darba mērķis ir izpētīt kā klasifikācijas metodes atšķiras darbojoties ar dažāda izmēra tekstiem un atrast metodes un klasifikatorus, kas der vislabāk noteiktiem tekstu izmēriem, un noteiktām tekstu īpašībām, piemēram, dažādiem vārdu daudzumiem vai vārdu atkārtojumiem starp tekstiem, kā arī atrast labāko variantu tieši maza izmēri tekstiem un implementēt to.	en_US
dc.description.abstract	Nowadays amount of the information available on social networks is rapidly increasing. Twitter, Facebook statuses and FourSquare checkins, contain advices, reviews and opinions of many people, as well as for many people it has become the primary source of new and interesting information. It is worth to try processing such information by classifying and structuring it, but because of the vast amount of this information, it cannot be done manually. And standard automated classification methods are also insufficient, as such textual resources are usually very small (140 characters or less), hence there is a need for new ways of processing such small pieces of information. The purpose of the work “Various text size classifications” is to research different classification methods and try to apply them to text classification of different sizes, while trying to find the most suitable methods for small text classification or propose new solutions.	en_US
dc.language.iso	N/A	en_US
dc.publisher	Latvijas Universitāte	en_US
dc.rights	info:eu-repo/semantics/openAccess	en_US
dc.subject	Datorzinātne	en_US
dc.title	Dažādu teksta izmēru klasifikācija	en_US
dc.title.alternative	Various text size classification	en_US
dc.type	info:eu-repo/semantics/masterThesis	en_US

Files in this item

Name:: 302-34060-Sosins_Arturs_as07142.pdf
Size:: 1.512Mb
Format:: PDF

View/Open

This item appears in the following Collection(s)

Bakalaura un maģistra darbi (DF) / Bachelor's and Master's theses [3341]

Show simple item record