Show simple item record

dc.contributor.advisorBārzdiņš, Guntis
dc.contributor.authorStrazds, Guntis Vilnis
dc.contributor.otherLatvijas Universitāte. Datorikas fakultāte
dc.date.accessioned2021-02-04T02:02:28Z
dc.date.available2021-02-04T02:02:28Z
dc.date.issued2021
dc.identifier.other80388
dc.identifier.urihttps://dspace.lu.lv/dspace/handle/7/53900
dc.description.abstractInteraktīvas tekstuālas piedzīvojumu spēles var izmantot, lai pārbaudītu mašīnmācīšanās aģentu spējas tikt galā ar dažādiem izaicinājumiem, kas saistīti ar dabiskās valodas izpratni, problēmu risināšanu un atbilžu meklēšanu, vai tādas darbības izvēles stratēģiju apgūšana, kas vispārinās uz iepriekš nesastaptām vidēm. TextWorld platforma ir šādiem pētījumiem domāts ietvars un palīgrīki, ar kuru palīdzību var darbināt daudzas iepriekšpublicētas teksta piedzīvojumu spēles, vai arī definēt un ģenerēt jaunas spēles, dažādās sarežģītības pakāpēs un gandrīz bezgalīgās variācijās. Šajā darbā aprakstīta tāda algoritmiska orākula (oracle) ieviešana, kas var veiksmīgi atrisināt spēles no 3 dažādām iepriekšpublicētām spēļu kopām TextWorld platformā, kā arī orākula izmantošana kā apmācības datu avotu eksperimentiem, lai pārbaudītu mašīnmācīšanās modeļa, kas balstīts uz GPT­2, spēju iemācīties atrisināt šīs spēles. Ir iegūti daudzsološi sākotnēji rezultāti, kas liek domāt, ka GPT­2 arhitektūra var iemācīties –vismaz daļēji– atdarināt orākula darbību. Apmācītā modeļa snieguma līmeņa atšķirības to parbaudot uz divām dažādām testa spēļu kopām rada dažus interesantus jautājumus par to, kādi faktori varētu veicināt tā spēju vai nespēju vispārināties uz iepriekš neredzētām spēļu vidēm, un norāda uz dažiem interesantiem virzieniem turpmākiem eksperimentiem.
dc.description.abstractLearning to Perform Tasks in Interactive Textual Environments Interactive text­adventure games can be used as a versatile proving ground to test the abilities of machine­learning agents to deal with various challenges related to natural language understanding, exploration and problem solving, or learning action selection policies that generalize across a range of new environments. The TextWorld platform is a research platform that can run many existing text­adventure games, and can also be used to generate new games of varying degrees of difficulty and in almost endless variations. This thesis describes the implementation of an algorithmic oracle that can successfully solve games from 3 different previously published datasets of TextWorld games, and its use as a source of training data for experiments testing the ability of a machine­learning model based on GPT­2 to learn to to do the same. Some promising initial results are obtained, suggesting that the GPT­2 architecture can learn to imitate the behavior of the oracle to at least some extent. Differences between the success rate of the trained model on two different datasets of test games raise some interesting questions about what factors might contribute to its success or failure to generalize to previously unseen game environments, and suggest some interesting directions for follow up experiments.
dc.language.isolav
dc.publisherLatvijas Universitāte
dc.rightsinfo:eu-repo/semantics/openAccess
dc.subjectDatorzinātne
dc.subjectArtificial Neural Networks
dc.subjectMeta­learning
dc.subjectText Adventure Games
dc.subjectmašīnmācīšanās
dc.subjectinteraktīvas tekstuālas piedzīvojumu spēles
dc.titleMašīnmācīšanās uzdevumu risināšanai interaktīvās tekstuālās vidēs
dc.title.alternativeLearning to Perform Tasks in Interactive Textual Environments
dc.typeinfo:eu-repo/semantics/masterThesis


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record