• English
    • Latviešu
    • Deutsch
    • русский
  • Help
  • Deutsch 
    • English
    • Latviešu
    • Deutsch
    • русский
  • Einloggen
Dokumentanzeige 
  •   DSpace Startseite
  • B4 – LU fakultātes / Faculties of the UL
  • B --- Bij. Bioloģijas fakultātes studentu noslēguma darbi / Faculty of Biology - Graduate works
  • Bakalaura un maģistra darbi (BF) / Bachelor's and Master's theses
  • Dokumentanzeige
  •   DSpace Startseite
  • B4 – LU fakultātes / Faculties of the UL
  • B --- Bij. Bioloģijas fakultātes studentu noslēguma darbi / Faculty of Biology - Graduate works
  • Bakalaura un maģistra darbi (BF) / Bachelor's and Master's theses
  • Dokumentanzeige
JavaScript is disabled for your browser. Some features of this site may not work without it.

Mašīnmācīšanās darbplūsmas izstrāde klasifikācijas modeļu ģenerēšanai un biomarķieru identifikācijai, izmantojot zarnu mikrobioma datus un metadatus

Thumbnail
Öffnen
301-104264-Grausa_Kristina_kg22093.pdf (2.306Mb)
Autor
Grausa, Kristīna
Co-author
Latvijas Universitāte. Bioloģijas fakultāte
Advisor
Vilne, Baiba
Datum
2024
Metadata
Zur Langanzeige
Zusammenfassung
Darba mērķis bija izstrādāt mašīnmācīšanās darbplūsmu, kas spēj ģenerēt, salīdzināt un interpretēt klasifikācijas modeļus, izmantojot zarnu mikrobioma datus un saistītos metadatus. Darba ietvaros tika izstrādāta Python darbplūsma binārās un vairāku klašu klasifikācijas uzdevumu veikšanai. Darbplūsma ietvēra datu analīzes un priekšapstrādes soļus, pazīmju atlasi, hiperparametru optimizāciju, šķērsvalidāciju un modeļu interpretāciju. Viegli interpretējamie koku bāzes klasifikatori tika izmantoti potenciālo biomarķieru identifikācijai. Tika izmantoti 10 klasifikācijas algoritmi, no kuriem labākais mikrobioma datu modelis bija daudzslāņu preceptrons (AUC=0.73±0.02), un labākais metadatu modelis bija Elastic Net loģistiskās regresijas (AUC=0.76±0.01). Darbplūsma pieejama GitHub platformā: https://github.com/NebulaKit/BioFlowML
 
The aim of this work was to develop a machine learning workflow capable of generating, comparing, and interpreting classification models using gut microbiome data and associated metadata. A Python workflow was developed for performing binary and multi-class classification tasks. The workflow included steps for data analysis and preprocessing, feature selection, hyperparameter optimization, cross-validation, and model interpretation. Easily interpretable tree-based classifiers were used for the identification of potential biomarkers. Ten classification algorithms were used, with the best microbiome data model being the multilayer perceptron (AUC=0.73±0.02), and the best metadata model being Elastic Net logistic regression (AUC=0.76±0.01). The workflow is available on GitHub: https://github.com/NebulaKit/BioFlowML
 
URI
https://dspace.lu.lv/dspace/handle/7/66029
Collections
  • Bakalaura un maģistra darbi (BF) / Bachelor's and Master's theses [1229]

University of Latvia
Kontakt | Feedback abschicken
Theme by 
@mire NV
 

 

Stöbern

Gesamter BestandBereiche & SammlungenErscheinungsdatumAutorenTitelnSchlagwortenDiese SammlungErscheinungsdatumAutorenTitelnSchlagworten

Mein Benutzerkonto

Einloggen

Statistik

Benutzungsstatistik

University of Latvia
Kontakt | Feedback abschicken
Theme by 
@mire NV