Q-Learning algoritma darbība dinamiskā vidē
Автор
Purens, Kārlis
Co-author
Latvijas Universitāte. Datorikas fakultāte
Advisor
Zuters, Jānis
Дата
2014Metadata
Показать полную информациюАннотации
Eksistējošie mašīnmācīšanās algoritmi galvenokārt paredzēti tikai statiskai videi, kurā stāvokļi un to vērtības ir nemainīgas. Taču īstajā dzīvē bieži vien informācija par apkārtējo vidi laika gaitā mainās, un algoritmam radušās izmaiņas ir jāspēj saprast un novērtēt.
Darba mērķis ir pielāgot klasisko Q-Learning algoritmu labākai darbībai dinamiskas vides apsktākļos.
Darbā tiek noskaidrotas problēmas, kas rodas, darbinot klasisko Q-Learning algoritmu dinamiskā vidē, tiek piedāvāti risinājumi un veikta šo risinājumu analīze.
Iegūtie rezultāti apstiprina, ka veicot šajā bakalaura darbā minētās modifikācijas ir iespējams uzlabot klasiskā Q-Learning algoritma darbību dinamiskā vidē. Existing machine learning algorithms are mostly used in static environments where states and their values are constant. In real life the information about the environment can change and these changes must be understood and evaluated by the algorithm.
The goal of this bachelor thesis is to adjust classical Q-Learning algoritm for better operation in dynamic environment.
This thesis identifies the problems that arise from using classical Q-Learning algorithm in dynamic environment, and also offers solutions and detailed analysis of those problems.
The results show that it is possible to improve the efficiency of classical Q-Learning algorithm in dynamic environment by implementing the changes listed in this bachelor thesis.