Studējošo jautājumu dabiskās valodas analīze
Autor
Lācis, Kārlis Andrejs
Co-author
Latvijas Universitāte. Datorikas fakultāte
Advisor
Paikens, Pēteris
Datum
2020Metadata
Zur LanganzeigeZusammenfassung
Latvijas Universitātes (LU) studentiem bieži rodas jautājumi vai neskaidrības par kādas situācijas risināšanu, kas tiek uzdoti LU forumā. Bakalaura darbā ir veikta šādu studējošo jautājumu dabiskās valodas analīze un to pielietojuma iespējas jautājumu un atbilžu sistēmas izveidē. Darbā tiek veikta atšķirīgu datu apjoma izmaiņu metožu salīdzināšana un pielietošanas ieguvuma izvērtēšana, veicot studējošo jautājumu mērķa noteikšanas moduļa izveidi. Darbā veikta studējošo jautājumu reprezentācijas izveide izmantojot vārdu maisa metodi, BERT un FastText modeļus, veikta mērķa klasifikācija, sasniedzot 86% precizitāti mērķa noteikšanā četrām dažādām jautājumu kategorijām. University of Latvia (UL) students often have questions or confusions on how to approach a particular situation which are asked in the UL Forum. Bachelor thesis performs student question natural language analysis and possible application in creation of a question and answer system. This work includes comparison of different resampling methods and their impact in the creation of an intent detection module. Various student question embedding methods offered by bag-of-words, BERT and FastText models are compared by performing intent detection that achieves up to 86% accuracy of detecting intent in four various question categories.