Automātiskā teksta emocionālās noskaņas noteikšana latviešu valodā
Author
Gediņš, Kārlis
Co-author
Latvijas Universitāte. Datorikas fakultāte
Advisor
Paikens, Pēteris
Date
2013Metadata
Show full item recordAbstract
Darbā tiek apskatītas pasaulē izmantotās teksta emocionālās noskaņas noteikšanas metodes, izvērtējot to pielietojuma iespējas tīmeklī izteiktā viedokļa izguvei. Atsevišķas metodes ir praktiski realizētas, un novērtēta to efektivitāte uz pieejamiem latviešu valodas datiem. Tiek aprakstīts metožu izmantojums un veikti secinājumi ar ieteikumiem par šādu rīku izveidi.
Šī darba pētījumi tika apkopoti, un rezultātā tika izveidots teksta emocionālās noskaņas noteikšanas rīks latviešu valodā. Rīka izmantotās metodes un nepieciešamā datu apstrādē tika detalizēti aprakstīta. Iegūtais rīks spēj klasificēt tekstu par „pozitīvu” vai negatīvu. Šis rīks tika novērtēs ar cilvēka klasificētu mikroemuāru testa kopu. Tas novērtēja pozitīvos un negatīvos tekstus tāpat kā cilvēka novērtētājs 85,7% gadījumu. This paper contains an overview of sentiment analysis tools in the research field and the evaluation of their capabilities of retrieving opinions expressed on the web. These methods are then applied and tested on the data available to Latvian language. A detailed description on the development of methods is given and the conclusions give insights in the development of a sentiment analysis tool.
The result of the research is used to create a sentiment analysis tool for Latvian. The methods and the required data processing are described. This tool can classify text as “positive” or “negative”. It was evaluated using a human evaluated micro blog corpora and the tool classified the data as “positive” and “negative” the same as the human evaluator in 85.7% of cases.