Nodoma noteikšana cilvēka-datora saziņā, izmantojot neironu tīklus
Автор
Raģels, Dāvis
Co-author
Latvijas Universitāte. Datorikas fakultāte
Advisor
Skadiņa, Inguna
Дата
2020Metadata
Показать полную информациюАннотации
Nodoma noteikšana dabiskās valodas tekstā ir viena no aktuālajām problēmām, veidojot mākslīgā intelekta (MI) dialogsistēmas. Lai dialogsistēma varētu veiksmīgi paveikt kādu uzdevumu (atbildēt uz jautājumu, iegūt datus no zinību bāzes, veikt praktisku darbību, utt.), vispirms jāsaprot, ko lietotājs ir domājis. Darbā analizētas jaunākās metodes nodoma noteikšanai, apskatīti un salīdzināti esošie risinājumi. Darba ietvaros izveidota dialogsistēma, kuras pamatā ir mākslīgais neironu tīkls, kas spēj klasificēt lietotāja nodomu latviešu valodas tekstā. Autors parāda, ka šībrīža līderis dažādu valodas apstrādes problēmu risināšanā – BERT – spēj labi darboties arī latviešu valodā, pārspējot MI platformu Facebook Wit.ai uz autora veidotajiem piemēriem, un nedaudz atpaliekot no K. Baloža fastText modeļa, kurš sākotnēji trenēts uz būtiski lielāku treniņdatu apjomu. INTENT DETECTION IN HUMAN-COMPUTER INTERACTION, USING NEURAL NETWORKS Natural language text intent detection is one of the relevant problems when creating artificial intelect (AI) driven dialogue systems. To do any task successfully (answering a question, retrieving data from knowledge base, doing some practical task, etc.), dialogue system needs to understand what the user meant. In this work there are analyzed methods used to determine intent; reviewed and compared existing solutions. In scope of this paper, a neural network dialogue system was created, which can classify user’s intent in a Latvian language text. Author shows, that the current best performer in various natural language processing tasks – BERT – can work well with Latvian language too, testing better in accuracy on author’s dataset than AI platform Facebook Wit.ai; slightly worse in accuracy than K.Balodis’ fastText model, which was originally trained on a significantly larger corpus.