Mašīntulkošanas iespējas Twitter sīkziņu sentimenta analīzē
Author
Peisenieks, Jānis
Co-author
Latvijas Universitāte. Datorikas fakultāte
Advisor
Skadiņš, Raivis
Date
2014Metadata
Show full item recordAbstract
Darba mērķis bija izpētīt mašīntulkošanu un sentimenta analīzi, kā arī noskaidrot, vai ir iespējams izmantot publiski pieejamus mašīntulkošanas un sentimenta analīzes rīkus, lai veiktu kvalitatīvu latviešu valodā rakstītu Twitter sīkziņu sentimenta analīzi.
Darba rezultātā tika izveidota publiski pieejam Twitter sīkziņu anotēšanas pūļpakalpojuma vietne. Izmantojot šo vietni tika iegūts publiski pieejams, anotēts latviešu valodā rakstītu Twitter sīkziņu testa korpuss, kuram pievienota sentimenta informācija. Tika veikta mašīntulkošanas un sentimenta analīzes rīku izpēte, kā arī izveidotā sīkziņu testa korpusa apstrāde ar trīs dažādu mašīntulkošanas rīku un trīs dažādu sentimenta analīzes pakalpojumu pāriem. The main goal of this paper, “Uses of machine translation in the sentiment analysis of tweets”, is to research machine translation, sentiment analysis, and to determine the viability of using machine translation to translate tweets made in internationally less used languages and using tools made for more frequently used languages to determine the original sentiment of the tweets.
As a result of this work, a custom crowd-sourcing web page was made, for the sole purpose of creating a publically available tweet test corpus with sentiment polarity annotation in Latvian language. By then using this test corpus, a study of 3 most popular machine translation services that support Latvian, and 3 sentiment analysis platforms was conducted, to reach the main goal of this paper.