Mākslīgās inteliģences metožu izmantošanas potenciāls atmosfēras piesārņojuma datu apstrādē un interpretācijā
Author
Zabītis, Gints
Co-author
Latvijas Universitāte. Ģeogrāfijas un Zemes zinātņu fakultāte
Advisor
Šteinberga, Iveta
Date
2022Metadata
Show full item recordAbstract
Automatizēta datu kvalitātes kontrole kļūst aizvien populārāka lielu datu kopu apstrādē. Kā arī lielāku popularitāti vides metrikā gūst sabiedriskā zinātne, pieļaujot izmantot alternatīvas un ne tik sarežģītas mēriekārtas un metodes (t.s. ne-references iekārtas). Nereti šo ne-references staciju dati ir publiski pieejami, bet šo datu kvalitāte ir novērtējama kā apšaubāma, ar zemu ticamības līmeni, ja netiek veikta mērījumu kvalitātes kontrole. Atmosfēras piesārņojuma jomā, izmantojot sensoru iekārtas, mērījumi bieži vien tiek veikti 1 – 10 minūšu intervālā, kas ļauj iegūt milzīgas datu kopas. Pietiekami blīvs sabiedriskās zinātnes ne-references iekārtu tīkls sniedz būtisku telpisku vides kvalitātes informāciju par situāciju konkrētās teritorijās, pat ja references stacija ir pāris simtu metru attālumā. Maģistra darbā novērtēts mākslīgo inteliģences metožu (ANN) izmantošanas potenciālu atmosfēras piesārņojuma datu apstrādē, apskatot dažādas specifiskas metodes - regresijas modeļus, neironu tīklus, pašvadītās kartes un strukturālos algoritmus. Praktiskās daļas īstenota ar specifiskas “JASP” programmas rīkiem - mašīnmācīšanās “Random Forest” regresijas analīzi, klastera metodi, regularizēto lineāro regresiju un neironu tīkla metodoloģiju. Automated data quality control is becoming more and more popular in processing large data sets. As well as increased popularity in environmental metrics, public science is gaining through the use of alternatives and less sophisticated measuring equipment and techniques (including non-reference equipment). Data from these non-reference stations are often available to the public, but the quality of these data is assessed as questionable, with a low level of assurance if no measurement quality control is performed. In the field of atmospheric pollution, measurements are often made at a 1-10 minute interval using sensor equipment, which allows huge data sets to be obtained. A sufficiently dense network of public science non-reference equipment provides essential spatial environmental quality information on the situation in specific areas, even if the reference station is a few hundred metres away. The Master's thesis asses the potential for using artificial intelligence techniques (ANN) in the processing of atmospheric pollution data by looking at a variety of specific methods: regression models, neuron networks, self-guided maps and structural algorithms. Practical parts have been implemented with the tools of a specific “JASP” program, a regression analysis of machine learning “Random Forest”, a cluster method, a regularized linear regression and a neuron network methodology.