Show simple item record

dc.contributor.advisorKarnītis, Ģirtsen_US
dc.contributor.authorBlumbahs, Eduardsen_US
dc.contributor.otherLatvijas Universitāte. Datorikas fakultāteen_US
dc.date.accessioned2015-03-24T07:05:22Z
dc.date.available2015-03-24T07:05:22Z
dc.date.issued2011en_US
dc.identifier.other32241en_US
dc.identifier.urihttps://dspace.lu.lv/dspace/handle/7/17063
dc.description.abstractInternetā ļoti daudz informācijas ir pieejama daļēji strukturētu datu veidā – HTML kodējumā. Šis milzīgais informācijas apjoms ir un būs ļoti noderīgs gan parastajam interneta lietotājam, gan uzņēmumiem, sākot ar vienkāršu meklēšanu un beidzot ar rūpīgu analīzi. Lai to varētu izdarīt, šī informācija ir jāpārvērš strukturētos datos – tādos, kurus var apstrādāt datori. Lai to izdarītu tiek piedāvātas dažādas metodes un rīki, kuri tiek apskatīti šajā darbā. Ar līdzīgu rīku, ar kuru iegūst informāciju no interneta lapām, strādā arī darba autors, kurš vēlas paātrināt savu darba gaitu, apskatot iespējamos risinājumus, kā paātrināt manuālo lapas HTML analīzi, padarot to par daļēji automātisku.en_US
dc.description.abstractA great deal of information available on the Internet is in the form of semi-structured data – the HTML coding. This huge amount of information is and will be very useful as for standard Internet users and for companies, starting from a single search and ending with a throughout analysis. To achieve this, information has to be transformed to structural data which can be processed by computers. There are several methods and tools to perform this task, which are also discussed in this paper. Author also works with a similar tool, which extracts data from internet pages and he wants to speed up his work process by looking at possible solutions on how to speed up the manual HTML analysis by making it semi-automatic.en_US
dc.language.isoN/Aen_US
dc.publisherLatvijas Universitāteen_US
dc.rightsinfo:eu-repo/semantics/openAccessen_US
dc.subjectDatorzinātneen_US
dc.titleTīmekļa lapu struktūras daļēji automatizēta analīzeen_US
dc.title.alternativeSemi-automatic analysis of web page structureen_US
dc.typeinfo:eu-repo/semantics/bachelorThesisen_US


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record