Q-Learning algoritma darbība dinamiskā vidē

Purens, Kārlis

Открыть

302-42794-Purens_Karlis_pk10006.pdf (946.0Kb)

Автор

Purens, Kārlis

Co-author

Latvijas Universitāte. Datorikas fakultāte

Advisor

Zuters, Jānis

Дата

2014

Metadata

Показать полную информацию

Аннотации

Eksistējošie mašīnmācīšanās algoritmi galvenokārt paredzēti tikai statiskai videi, kurā stāvokļi un to vērtības ir nemainīgas. Taču īstajā dzīvē bieži vien informācija par apkārtējo vidi laika gaitā mainās, un algoritmam radušās izmaiņas ir jāspēj saprast un novērtēt. Darba mērķis ir pielāgot klasisko Q-Learning algoritmu labākai darbībai dinamiskas vides apsktākļos. Darbā tiek noskaidrotas problēmas, kas rodas, darbinot klasisko Q-Learning algoritmu dinamiskā vidē, tiek piedāvāti risinājumi un veikta šo risinājumu analīze. Iegūtie rezultāti apstiprina, ka veicot šajā bakalaura darbā minētās modifikācijas ir iespējams uzlabot klasiskā Q-Learning algoritma darbību dinamiskā vidē.

Existing machine learning algorithms are mostly used in static environments where states and their values are constant. In real life the information about the environment can change and these changes must be understood and evaluated by the algorithm. The goal of this bachelor thesis is to adjust classical Q-Learning algoritm for better operation in dynamic environment. This thesis identifies the problems that arise from using classical Q-Learning algorithm in dynamic environment, and also offers solutions and detailed analysis of those problems. The results show that it is possible to improve the efficiency of classical Q-Learning algorithm in dynamic environment by implementing the changes listed in this bachelor thesis.

URI

https://dspace.lu.lv/dspace/handle/7/14950

Collections

Bakalaura un maģistra darbi (EZTF) / Bachelor's and Master's theses [6025]