Zināšanu grafu datu shēmu izgūšanas metodes
Autor
Fokina, Arina
Co-author
Latvijas Universitāte. Eksakto zinātņu un tehnoloģiju fakultāte
Advisor
Bojārs, Uldis
Datum
2024Metadata
Zur LanganzeigeZusammenfassung
Bakalaura darba "Zināšanu grafu datu shēmu izgūšanas metodes" mērķis ir izpētīt zināšanu grafu datu shēmu izgūšanas metodes, koncentrējoties uz SHACL (Shapes Constraint Language) standartu un tā ģenerēšanas rīkiem no RDF (Resource Description Framework) datiem. Zināšanu grafu datu shēmu iegūšana ietver sistemātisku pieeju, lai identificētu un strukturētu pamatā esošās attiecības un vienības datu kopā. Šis process ir būtisks, lai uzlabotu datu savietojamību un atvieglotu dažādu lietojumprogrammu darbību, piemēram, vaicājumu formulēšanu un datu analīzi. Darbā ir izklāstītas galvenās metodoloģijas un ietvari, kas tiek izmantoti shēmu izgūšanai. Tika analizēts SHACL ģenerēšanas rīks - QSE, kura darbība kalpo kā pamats SHACL shēmu pārveidošanai formātā, kas ir savietojams ar LU MII izstrādāto ViziQuer rīku. Darba aktualitāte ir saistīta ar pieaugošo semantisko datu un zināšanu grafu nozīmi mūsdienu informācijas tehnoloģijās. Bakalaura darba apjomu sastāda 61 lapaspuses, 23 attēli, 1 tabula un 2 pielikumi. The aim of the bachelor's thesis "Methods for extracting knowledge graph data schemas" is to study methods for extracting knowledge graph data schemas, focusing on the SHACL (Shapes Constraint Language) standard and its generation tools from RDF (Resource Description Framework) data. Knowledge graph data schema extraction involves a systematic approach to identify and structure the underlying relationships and entities in a data set. This process is essential for improving data interoperability and facilitating the operation of various applications, such as query formulation and data analysis. The thesis presents the main methodologies and frameworks used for schema extraction. The SHACL generation tool - QSE will be analyzed, the operation of which serves as the basis for converting SHACL schemas into a format compatible with the ViziQuer tool developed by the University of Latvia Institute of Information and Communication Technology. The relevance of the thesis is related to the increasing importance of semantic data and knowledge graphs in modern information technologies. The bachelor's thesis consists of 61 pages, 23 figures, 1 table and 2 annexes.