Cukura diabēta kontroles uzlabošana: Mašīnmācīšanās risinājums hipoglikēmijas prognozēšanai
Author
Bitāns, Emīls
Co-author
Latvijas Universitāte. Datorikas fakultāte
Advisor
Lazovskis, Jānis
Date
2024Metadata
Show full item recordAbstract
Bakalaura darbs veidots ar mērķi uzlabot cukura diabēta kontroles iespējas pirmā tipa cukura diabēta slimniekiem, izmantojot mašīnmācīšanās risinājumu hipoglikēmijas jeb zemas glikozes koncentrācijas asinīs priekšlaicīgai prognozēšanai 30 minūšu laika intervālā. Pētījumā izstrādātā modeļa efektivitāte tiek novērtēta, izmantojot īstus diabētiķu datus un cukura līmeņa rādījumus. Darbā tiek apmācīts gadījuma mežu (random forest) modelis, kas tiek trenēts, izmantojot diabētiķu cukura līmeņa rādījumus un to tendenču saturošu datu kopu. Modeļa efektivitāte tiek mērīta pēc tā precizitātes (accuracy), f1-rezultāta (f1-score) un citiem mērījumiem. Izstrādātais modeļa risinājums sasniedz 96.9% precizitāti un 70.3% f1-rezultātu, tādējādi demonstrējot kvalitatīvu hipoglikēmijas klasificēšanas spēju. Taču rezultāti ir nepietiekami, lai modeli droši varētu izmantot medicīniskos nolūkos. Darba izstrādes laikā autors saskārās ar nevienmērīgu klašu sadalījumu un ierobežotu apmācības apakškopu, kas sastāvēja tikai no cukura līmeņa vērtībām, bet neņēma vērā tādas nianses kā sirdsdarbības ātrumu, apēsto ogļhidrātu daudzumu un citus faktorus. Plašāka datu kopas izmantošana un citu limitāciju pārvarēšana rezultētos ar labāku modeļa efektivitāti, it īpaši lielākos laika intervālos. Šis prototips var kalpot kā pamats turpmākiem pētījumiem, kuru mērķis būtu pilnveidot šajā darbā iegūtos rezultātus. Nākotnes pētījumi varētu tikt saistīti ar citu mašīnmācīšanās algoritmu izmantošanu un salīdzinājumu, datu kopas papildināšanu, kā arī ar jaunu modeļu izstrādi, kas prognozētu hiperglikēmiju vai precīzu cukura līmeņa koncentrāciju asinīs. Uzlabotam modelim ir potenciāls revolucionizēt 21. gadsimta diabēta kontroli, nodrošinot cilvēkiem ar diabētu mūsdienīgu risinājumu cukura līmeņu kontrolei. Diplomdarba saturs ir rakstīts angļu valodā, tā apjoms ir 48 lappuses, kas ietver teorijas daļu (11 lpp.), praktisko daļu (10 lpp.), rezultātu analīzi (9 lpp.), septiņus attēlus, trīs tabulas, 41 literatūras avotu un divus pielikumus. Atslēgvārdi: Diabēts, mašīnmācīšanās, gadījuma meži, hipoglikēmija, prognozēšana. This bachelor thesis paper focuses on improvement of diabetes management for type 1 diabetics by applying machine-learning solution for hypoglycemic event predictions. As diabetes is becoming more prevalent amongst society, the importance of proper diabetes management tools is rising. The study aims to develop a predictive classification model and measure its efficacy on real patient data, as no commercially available solutions are yet to be available. Methodologically, the study employs a random forest model to train and test its predictions using a dataset consisting of blood glucose levels and trends of diabetic patients. Although similar approaches have been utilized by other researchers, this study sets itself apart by systematically mitigating their limitations and yielding improved results. The model’s performance is measured using accuracy, precision, recall and f1-score metrics. These results not only illustrate the model’s capability in forecasting hypoglycemic events 30 minutes in advance, but also reveal the occurrence of false positives and false negatives, providing insights into its true predictive accuracy and reliability. With an accuracy of 96.9%, precision of 71.9%, recall of 68.8%, and f1-score of 70.3%, the model demonstrates promising predictive capabilities; however, the performance is still lacking, considering its potential applications as a medical product. Nonetheless, the solution holds promise for future studies focused on refining the results and overcoming the inherent limitations of this paper. Research was constrained by class imbalance problem arising from the nature of diabetic data and a limited number of features, which posed a challenge in achieving accurate predictions, particularly for larger prediction horizons. Future work would entail employing different machine-learning algorithms, using a larger dataset with additional physiological features (such as heart rate, carbohydrate and sugar intake, insulin dosage, etc.), as well as creating solutions for predicting hyperglycemia or precise glucose levels. Enhancing the model’s performance has the potential to revolutionize diabetes care by providing individuals with diabetes access to advanced and predictive support solutions. This paper is written in English and is made up of 48 pages in total, consisting of a theoretical analysis of related work and introduction to diabetes (11 pages), research methodology and solution description (10 pages), results and discussion section (9 pages), seven figures, three tables, as well as 41 referenced sources and two appendices. Keywords: Diabetes, machine-learning, random forest, hypoglycemia, predictions.