Praktisks CycleGAN un difūzijas modeļu salīdzinājums attēlu stilizēšanas uzdevumam multfilmu stilā
Autor
Kiseļovs, Sergejs
Co-author
Latvijas Universitāte. Eksakto zinātņu un tehnoloģiju fakultāte
Advisor
Kozlovičs, Sergejs
Datum
2024Metadata
Zur LanganzeigeZusammenfassung
Šajā bakalaura darbā tiek veikta salīdzinoša analīze starp divām modernām attēlu stilizācijas metodēm — CycleGAN un difūzijas modeļiem, ar īpašu uzsvaru uz to pielietojumu attēlu pārveidošanai multiplikācijas stilā. Darba teorētiskajā daļā tiek izpētītas abu pieeju arhitektūras, apmācības principi un praktiskās īpatnības. Praktiskajā daļā tiek realizēta attēlu stilizācija, izmantojot gan no nulles apmācītus CycleGAN modeļus, gan pielāgotus iepriekš apmācītus difūzijas modeļus ar tādām metodēm kā img2img, ControlNet un apgrieztās difūzijas metode. Tiek veikti eksperimenti ar dažādām parametru konfigurācijām un stilizācijas pieejām, kā arī salīdzināta rezultātu kvalitāte, stila atbilstība, oriģinālā attēla konteksta saglabāšana un aprēķinu izmaksas. Darbs sniedz padziļinātu ieskatu attēlu stilizācijas jomā un var kalpot kā vērtīgs resurss turpmākiem pētījumiem un praktiskiem risinājumiem, kas saistīti ar mākslīgā intelekta pielietošanu digitālajā mākslā. This bachelor’s thesis presents a comparative analysis of two modern image stylization approaches — CycleGAN and diffusion models, with a particular focus on their application for transforming images into animation-style visuals. The theoretical part explores the architectures, training principles, and practical characteristics of both methods. The practical section involves implementing image stylization using both CycleGAN models trained from scratch and adapted pre-trained diffusion models, applying techniques such as img2img, ControlNet, and reverse diffusion. Various experiments were conducted with different parameter configurations and stylization techniques, and the results were compared in terms of image quality, style conformity, context preservation, and computational cost. This work provides an in-depth overview of the image stylization domain and can serve as a valuable resource for future research and practical applications involving artificial intelligence in digital art.