Vārdšķiru , simbolu un saīsinājumu lietojuma biežums tvitera ierakstos
Author
Zariņa, Ieva
Co-author
Latvijas Universitāte. Humanitāro zinātņu fakultāte
Advisor
Vinčela, Zigrīda
Date
2013Metadata
Show full item recordAbstract
Šajā darbā ir veikta mikroblogošanas vietnes tvitera ierakstu analīze. Darba mērķis bija izpētīt vārdšķiru, īpašu simbolu un saīsinājumu lietojuma biežumu tvitera ierakstu korpusā, kurš uzkrāts viena gada laikā, un salīdzināt iegūtos rezultātus ar vārdšķiru biežumu LSWE korpusā iekļautajos tekstos, kas izkārtoti četrās grupās. Lai īstenotu mērķi, darbā tika pielietota kvantitatīva korpusa analīzes metode izmantojot Twitter Tokenizer and POS Tagger datorprogrammu. Iegūtie rezultāti liecina, ka lietvārdi, darbības vārdi, apstākļa vārdi, īpašības vārdi un daļēji prievārdi un norādāmie vārdi atbilst attiecīgo vārdšķiru biežumam daiļliteratūras tekstos, vietniekvārdi un sakārtojuma saikļi – biežumam laikrakstu tekstos un skaitļa vārdi un daļēji prievārdi un norādāmie vārdi – biežumam sarunās. Lietvārdu biežums samazinājās, kamēr atbilžu un retvītu biežums palielinājās apskatītajā periodā. Emocijzīmju, hipersaišu un saīsinājumu biežums šajā periodā saglabājās vienā līmenī. The present work deals with the analysis of posts of microblogging site Twitter. The goal of this paper is to investigate the frequency variation of parts-of-speech (POS), special symbols and abbreviations in a corpus of Twitter posts accumulated over a one-year period and to compare the obtained results with the POS frequency in the texts of the LSWE corpus that are grouped into four registers. In order to reach the goal the method of quantitative corpus analysis by applying the Twitter Tokenizer and POS Tagger program was used. The results show that the frequency of nouns, verbs, adverbs, adjectives and partially prepositions and determiners correspond with the respective POS frequencies in fiction, pronouns and coordinators – in newspaper articles and numerals and partially prepositions and determiners – in conversation. The frequency of nouns decreased while the frequency of at-mentions and retweets increased over the period; emoticons, hyperlinks and abbreviations remained stable.