Ēšanas tvītu modelēšana ar mašīnmācīšanās metodēm
Author
Sproģis, Uga
Co-author
Latvijas Universitāte. Datorikas fakultāte
Advisor
Rikters, Matīss
Date
2020Metadata
Show full item recordAbstract
Darbā tiek aprakstīta apstrāde un modelēšana konkrētai no mikroblogošanas vietnes Twitter iegūtai datu kopai, kura ir par pārtikas produktu un ēšanas/dzeršanas tematiku, izmantojot mašīnmācīšanās metodes. Darba sākumā tiek izpētīta iegūtā datu kopa un no tās tiek izveidots datu korpuss. Šis korpuss tiek izanalizēts dažādos šķērsgriezumos un publicēts publiski citiem interesentiem. Kā viens no mašīnmācīšanās modeļiem tiek izstrādāts sentimenta analizators, kurš nosaka tvīta noskaņojumu. Izstrādes procesā maksimālā efektivitāte bijusi, ka vairāk kā pusi no novērtēšanas datiem modelis ir spējis pareizi novērtēt, saliekot vairākus tvītu datu kopas kopā. The thesis describes the processing and modeling of a specific data set from the microblogging site Twitter, which is about food and eating / drinking topics using machine learning methods. At the beginning of the work, the obtained data set is studied, and a data corpus is created from it. This corpus is analyzed in various cross-sections and published publicly to other interested parties. As one of the machine learning models, a sentiment analyzer is developed, which determines the mood of the tweet. The maximum efficiency in the development process has been that the model has been able to evaluate more than half of the evaluation data correctly by assembling several tweet data sets together.