Show simple item record

dc.contributor.advisorVīksna, Juris
dc.contributor.authorStraupenieks-Brancis, Andris Kārlis
dc.contributor.otherLatvijas Universitāte. Datorikas fakultāte
dc.date.accessioned2021-07-02T01:05:48Z
dc.date.available2021-07-02T01:05:48Z
dc.date.issued2021
dc.identifier.other81896
dc.identifier.urihttps://dspace.lu.lv/dspace/handle/7/55811
dc.description.abstractDarba mērķis ir apskatīt datu saspiešanu genomisko datu datņu standartizācijas projektā MPEG-G, identificēt kādus uzlabojumus tajā iespējams veikt, un tos realizēt. Veikts literatūras apskats par MPEG-G standartu un bezzudumu datu saspiešanas algoritmiem. Identificēts, realizēts un profilēts iespējams uzlabojums. Viens no kandidātiem MPEG-G sekvenču līdzinājuma datņu saspiešanai – programma tsc izmanto datu saspiešanas bibliotēku zlib, kas savukārt izmanto DEFLATE datu saspiešanas algoritmu. Darbā apskatītas potenciālās alternatīvas zlib, viena no tām – zstd - ieviesta tsc, tās veikums profilēts un salīdzināts ar oriģinālās tsc versijas sniegumu. Izmainītā tsc versija iegūst vidēji 3% lielākas datnes ar 64% īsāku datu saspiešanas laiku un 4.6% īsāku datu dekodēšanas laiku.
dc.description.abstractThe goal of this work is to examine the genomic data compression techniques proposed in the upcoming MPEG-G standard and to identify and implement possible improvements. A brief introduction to the relevant parts of the MPEG-G standard and lossless data compression is given. A potential improvement is identified, implemented, and profiled. One of the candidate programs for sequence alignment file compression, called tsc, uses the data compression library zlib, which is based on the DEFLATE data compression algorithm. This work examines the alternatives and modifies tsc to use one of them – zstd. The performance of the modifications is profiled and compared to the original version. The new version produces 3% larger output files on average with a 64% improvement in compression speed and a 4.6% improvement in decoding speed.
dc.language.isolav
dc.publisherLatvijas Universitāte
dc.rightsinfo:eu-repo/semantics/openAccess
dc.subjectDatorzinātne
dc.subjectMPEG-G
dc.subjectBezzudumu datu saspiešana
dc.subjectSekvenču līdzinājumi
dc.subjectSAM datnes
dc.titleSekvenču līdzināšanas attēlojuma datņu saspiešanas rīka iespējamie uzlabojumi MPEG-G standartam
dc.title.alternativePossible improvements of Sequence Alignment Map file compression for the MPEG-G standard
dc.typeinfo:eu-repo/semantics/masterThesis


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record