Metodes un programmatūra genoma datu analīzei
Author
Milta, Iveta
Co-author
Latvijas Universitāte. Datorikas fakultāte
Advisor
Vīksna, Juris
Date
2017Metadata
Show full item recordAbstract
Maģistra darba tēma “Metodes un programmatūra genoma datu analīzei” Maģistra darbā apkopota informācija par nozīmīgākajām genoma datu analīzes metodēm. Izpētītas praksē biežāk lietotās metodes SNP (single nucleotide polymorphisms) identifikācijai jaunās paaudzes sekvencēšanas (NGS) datos, pieejamā programmatūra, kurā šīs metodes ir implementētas, un veiktas dažādu metožu un programmu darbības salīdzināšana uz simulētām NGS datu kopām. Salīdzinātas programmas genoma datu analīzei - GemSIM, Bowtie2, Samtools, Bfctools, Gatk. Iegūtie rezultāti pārbaudīti ar un salīdzināti ar simulētām datu kopām. Darbā aprakstīta četru genotipēšanas algoritmu darbība: GenoSNP, Illuminus, CRLMM, un GenCall. Tie salīdzināti pēc datu precizitātes, kvalitātes rādītājiem paraugu datos. A Master thesis topic “Methods and Software genome data analysis” Master's work contains information about the important genome data analysis methods. Verified the practice used methods SNP (single nucleotide polymorphisms) identification of a new generation of sequencing (DGS) data, available software, as these methods are implemented, and carried out different methods and program performance comparison of simulated DGS datasets. Compared the genome data analysis - GemSIM, Bowtie2, Samtools, Bfctools, Gatk. The results obtained and verified by compared with simulated data sets. The four genotyping algorithm described in: GenoSNP, Illuminus, CRLMM and GenCall. They compared by the degree of accuracy, quality indicators in the sample data.