Show simple item record

dc.contributor.advisorVinčela, Zigrīdaen_US
dc.contributor.authorZariņa, Ievaen_US
dc.contributor.otherLatvijas Universitāte. Humanitāro zinātņu fakultāteen_US
dc.date.accessioned2015-03-24T08:45:38Z
dc.date.available2015-03-24T08:45:38Z
dc.date.issued2013en_US
dc.identifier.other39004en_US
dc.identifier.urihttps://dspace.lu.lv/dspace/handle/7/26217
dc.description.abstractŠajā darbā ir veikta mikroblogošanas vietnes tvitera ierakstu analīze. Darba mērķis bija izpētīt vārdšķiru, īpašu simbolu un saīsinājumu lietojuma biežumu tvitera ierakstu korpusā, kurš uzkrāts viena gada laikā, un salīdzināt iegūtos rezultātus ar vārdšķiru biežumu LSWE korpusā iekļautajos tekstos, kas izkārtoti četrās grupās. Lai īstenotu mērķi, darbā tika pielietota kvantitatīva korpusa analīzes metode izmantojot Twitter Tokenizer and POS Tagger datorprogrammu. Iegūtie rezultāti liecina, ka lietvārdi, darbības vārdi, apstākļa vārdi, īpašības vārdi un daļēji prievārdi un norādāmie vārdi atbilst attiecīgo vārdšķiru biežumam daiļliteratūras tekstos, vietniekvārdi un sakārtojuma saikļi – biežumam laikrakstu tekstos un skaitļa vārdi un daļēji prievārdi un norādāmie vārdi – biežumam sarunās. Lietvārdu biežums samazinājās, kamēr atbilžu un retvītu biežums palielinājās apskatītajā periodā. Emocijzīmju, hipersaišu un saīsinājumu biežums šajā periodā saglabājās vienā līmenī.en_US
dc.description.abstractThe present work deals with the analysis of posts of microblogging site Twitter. The goal of this paper is to investigate the frequency variation of parts-of-speech (POS), special symbols and abbreviations in a corpus of Twitter posts accumulated over a one-year period and to compare the obtained results with the POS frequency in the texts of the LSWE corpus that are grouped into four registers. In order to reach the goal the method of quantitative corpus analysis by applying the Twitter Tokenizer and POS Tagger program was used. The results show that the frequency of nouns, verbs, adverbs, adjectives and partially prepositions and determiners correspond with the respective POS frequencies in fiction, pronouns and coordinators – in newspaper articles and numerals and partially prepositions and determiners – in conversation. The frequency of nouns decreased while the frequency of at-mentions and retweets increased over the period; emoticons, hyperlinks and abbreviations remained stable.en_US
dc.language.isoN/Aen_US
dc.publisherLatvijas Universitāteen_US
dc.rightsinfo:eu-repo/semantics/openAccessen_US
dc.subjectValodniecībaen_US
dc.titleVārdšķiru , simbolu un saīsinājumu lietojuma biežums tvitera ierakstosen_US
dc.title.alternativeThe Frequency of Parts-of-Speech , Symbols and Abbreviations in Twitter Postsen_US
dc.typeinfo:eu-repo/semantics/bachelorThesisen_US


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record