Proteīnu virkņu un struktūru telpas topoloģijas izpēte
Author
Bisenieks, Jānis
Co-author
Latvijas Universitāte. Datorikas fakultāte
Advisor
Vīksna, Juris
Date
2010Metadata
Show full item recordAbstract
Viens no biologiem ļoti svarīgiem jautājumiem ir proteīnu homoloģija t.i. vai proteīniem ir kopējs sencis un tie ir radniecīgi. Dabisks šīs problēmas risināšanas veids ir attāluma (vispārinātas edit distance) izrēķināšana starp proteīnu virknēm, izmantojot dinamiskās programmēšanas algoritmu. Šāda salīdzināšana mēdz tikt lietota kā ad hoc metode konkrētiem proteīniem. Tomēr līdz šim nav pētījumi par to, kādas sakarības veidojas, pielietojot tranzitīvu salīdzināšanu uz visiem proteīniem, kuru struktūra ir zināma.
Ļoti līdzīgi aprakstītajai tranzitīvās homoloģijas metodei strādā PSI-BLAST, kurš ir heiristisks algoritms, piemērots attālu evolucionāru radniecību atrašanai [1]. Darbs zināmā mērā pēta šādas tranzitīvas salīdzināšanas priekšrocības un robežas.
Autors savstarpēji salīdzināja proteīnu virknes no reprezentatīvas proteīnu kopas, uzkonstruēja grafu, balstoties uz iegūtajām proteīnu virkņu līdzībām. Mainot sliekšņus, virs kuriem proteīnu virknes tika uzskatītas par homologām, darba autors apskatīja, kā mainās ar tranzitīvo metodi atrasto homolgo proteīnu pāri un to ticamība. Tika arī salīdzinātas grafa topoloģijas ar proteīnu struktūras klasifikāciju CATH. One of the most important subjects of bioinformatics is homology of proteins. Natural approach for this matter is to calculate an edit distance between proteins by use of dynamic programming algorithm. This transitive comparison is usually used as ad hoc comparison for two proteins in question. However there have not been studies on what kind of relationships will emerge by applying transitive comparison on a set of all proteins with known structure.
Similar to described transitive comparison is PSI-BLAST program, which is a heuristic algorithm. PIS-BLAST is sensitive on detecting distant evolutionary relatives [1]. This work to some extent explore advantages and limits of transitive comparison.
As part of this work author compared protein sequences from representative set with each other and created global graph based on acquired protein similarity data. By adjusting thresholds of sequence similarities required for proteins to be considered homologous, was analysed how the amount of transitive homologous protein sequence pairs changes and how reliable are the homology of these pairs. The created graph was also compared to CATH protein structure classification.