Sporta sacensību fotogrāfiju klasificēšana, izmantojot dziļos neironu tīklus
Author
Gataļskis, Vladislavs
Co-author
Latvijas Universitāte. Datorikas fakultāte
Advisor
Freivalds, Kārlis
Date
2022Metadata
Show full item recordAbstract
Bakalaura darbā “Sporta sacensību fotogrāfiju klasificēšana, izmantojot dziļos neironu tīklus” tiek apskatīti mašīnmācīšanās veidi un visbiežāk izmantotā arhitektūra fotogrāfiju klasificēšanā – konvolucionālais neironu tīkls (CNN) un uz tā bāzēti algoritmi un ietvari. Kā arī darba ietvaros tika izstrādāts mežā notiekoša maratona fotogrāfiju kolekcijas augsta līmeņa klasifikators, kurš spēj noteikt fotogrāfijās attēlotos notikumus, balstoties uz atrasto cilvēku skaitu, seju skaitu un fotogrāfijā attēloto atrašanās vietu. Mūsdienās gandrīz jebkuru fotogrāfiju klasificēšanas uzdevumu veic ar dziļās mācīšanās un dziļo neironu tīklu palīdzību, jo dziļā mācīšanās ļauj datoram iemācīties daudz sarežģītākas objektu iezīmes un veikt specifiskāku klasificēšanu. Augsta līmeņa fotogrāfiju klasifikatori spēj noteikt informāciju, kas nav tikai fotogrāfijā redzamie objekti. Tā informācija nav tieši attēlota, taču tiek izsecināta, balstoties uz vairākiem faktoriem. The bachelor's thesis " Classification of sport competition photographs using deep neural networks" examines the types of machine learning and the most used architecture for classifying photographs - the convolutional neural network (CNN), as well as some popular algorithms and frameworks that are based on CNN. Also, a high-level classifier of the forest marathon photograph collection was developed, which can determine the events depicted in the photographs based on the number of people, the number of faces and the location in the photograph. Today, almost any image classification task is performed using deep learning and deep neural networks because deep learning allows the computer to learn more complex object features and perform more specific classification. High-level image classifiers can identify information that is not displayed in the image. This information is inferred from several factors.