• English
    • Latviešu
    • Deutsch
    • русский
  • Help
  • English 
    • English
    • Latviešu
    • Deutsch
    • русский
  • Login
View Item 
  •   DSpace Home
  • B4 – LU fakultātes / Faculties of the UL
  • A -- Humanitāro zinātņu fakultāte / Faculty of Humanities
  • 1 -- Bakalaura un maģistra darbi (HZF) / Bachelor's and Master's theses
  • View Item
  •   DSpace Home
  • B4 – LU fakultātes / Faculties of the UL
  • A -- Humanitāro zinātņu fakultāte / Faculty of Humanities
  • 1 -- Bakalaura un maģistra darbi (HZF) / Bachelor's and Master's theses
  • View Item
JavaScript is disabled for your browser. Some features of this site may not work without it.

Vārdšķiru , simbolu un saīsinājumu lietojuma biežums tvitera ierakstos

Thumbnail
View/Open
306-39004-Zarina_Ieva_iz09005.pdf (3.878Mb)
Author
Zariņa, Ieva
Co-author
Latvijas Universitāte. Humanitāro zinātņu fakultāte
Advisor
Vinčela, Zigrīda
Date
2013
Metadata
Show full item record
Abstract
Šajā darbā ir veikta mikroblogošanas vietnes tvitera ierakstu analīze. Darba mērķis bija izpētīt vārdšķiru, īpašu simbolu un saīsinājumu lietojuma biežumu tvitera ierakstu korpusā, kurš uzkrāts viena gada laikā, un salīdzināt iegūtos rezultātus ar vārdšķiru biežumu LSWE korpusā iekļautajos tekstos, kas izkārtoti četrās grupās. Lai īstenotu mērķi, darbā tika pielietota kvantitatīva korpusa analīzes metode izmantojot Twitter Tokenizer and POS Tagger datorprogrammu. Iegūtie rezultāti liecina, ka lietvārdi, darbības vārdi, apstākļa vārdi, īpašības vārdi un daļēji prievārdi un norādāmie vārdi atbilst attiecīgo vārdšķiru biežumam daiļliteratūras tekstos, vietniekvārdi un sakārtojuma saikļi – biežumam laikrakstu tekstos un skaitļa vārdi un daļēji prievārdi un norādāmie vārdi – biežumam sarunās. Lietvārdu biežums samazinājās, kamēr atbilžu un retvītu biežums palielinājās apskatītajā periodā. Emocijzīmju, hipersaišu un saīsinājumu biežums šajā periodā saglabājās vienā līmenī.
 
The present work deals with the analysis of posts of microblogging site Twitter. The goal of this paper is to investigate the frequency variation of parts-of-speech (POS), special symbols and abbreviations in a corpus of Twitter posts accumulated over a one-year period and to compare the obtained results with the POS frequency in the texts of the LSWE corpus that are grouped into four registers. In order to reach the goal the method of quantitative corpus analysis by applying the Twitter Tokenizer and POS Tagger program was used. The results show that the frequency of nouns, verbs, adverbs, adjectives and partially prepositions and determiners correspond with the respective POS frequencies in fiction, pronouns and coordinators – in newspaper articles and numerals and partially prepositions and determiners – in conversation. The frequency of nouns decreased while the frequency of at-mentions and retweets increased over the period; emoticons, hyperlinks and abbreviations remained stable.
 
URI
https://dspace.lu.lv/dspace/handle/7/26217
Collections
  • 1 -- Bakalaura un maģistra darbi (HZF) / Bachelor's and Master's theses [6055]

University of Latvia
Contact Us | Send Feedback
Theme by 
@mire NV
 

 

Browse

All of DSpaceCommunities & CollectionsBy Issue DateAuthorsTitlesSubjectsThis CollectionBy Issue DateAuthorsTitlesSubjects

My Account

Login

Statistics

View Usage Statistics

University of Latvia
Contact Us | Send Feedback
Theme by 
@mire NV