Nestrukturētu datu integrēšana datu noliktavā
Author
Čerenkovs, Roberts
Co-author
Latvijas Universitāte. Datorikas fakultāte
Advisor
Niedrīte, Laila
Date
2011Metadata
Show full item recordAbstract
Strauja tīmekļa tehnoloģiju attīstība ievērojami veicinājusi nestrukturētu datu apjoma palielināšanu gandrīz visu industriju organizācijās. Nestrukturētu datu integrēšana datu noliktavā ir risinājums efektīvai nestrukturētu datu pārvaldībai, kuras īstenošanas rezultātā tiek veicināts jauno faktu veidošanas process, nepieciešams vadības lēmumu pieņemšanas atbalstam. Nestrukturētu datu integrēšana datu noliktavā ir sarežģīts, komplicēts un sastāvošs no vairākiem veikšanas posmiem uzdevums.
Šī bakalaura darba mērķis ir izpētīt teoriju, kā arī praktiski pielietot un novērtēt nestrukturētu datu iegūšanas, pārveidošanas un ielādēšanas procesu metodes un tehnoloģijas datu noliktavas sistēmas izstrādē. Darbā tiek analizēti un aprakstīti risinājumi, kādā veidā nestrukturēti dati no datu avotiem tiek integrēti datu noliktavas sistēmā. Iegūtas darba gaitā zināšanas tiek pielietotas praktiski, izveidojot nestrukturētu datu noliktavas sistēmu.
Atslēgvārdi: nestrukturēti dati, datu noliktava, ETL.
Darba apjoms: 60 lpp.
Darba struktūra: Titullapa, anotācijas (latviešu un angļu valodās), satura rādītājs, ievads, 5 nodaļas, nobeigums, izmantoto avotu un literatūras saraksts, pielikumi.
Darbā ir iekļauti 32 attēli, 7 tabulas un 6 pielikumi.
Darbā ir izmantoti 32 literatūras avoti. Rapid growth of internet technology greatly increased amounts of unstructured data laid in all industry organizations. Integration of unstructured data into the data warehouse is a solution for effective unstructured data management, which generates new facts, critical for decision support systems. Integration of unstructured data into the data warehouse is complex and multistage task.
The aim of bachelor thesis is to explore the theory, as well as to practice and evaluate unstructured data extraction, transformation and loading processes and techniques of data warehouse system development. The paper analyzes and describes the solutions of how unstructured data is taken from unstructured data sources and integrated into the data warehouse system. Acquired theoretical knowledge is applied in practice by creating unstructured data warehouse system.
Keywords: unstructured data, data warehouse, ETL.
Number of pages: 60
Structure of research: annotations in Latvian and English languages, contents, introduction, 5 chapters, summary, list of sources and literature, attachments.
The results of this paper have been illustrated in: 32 pictures, 7 tables, 6 attachments.
32 literature sources have been used.