Automatizēta uzņēmumu tīmekļa vietņu meklēšana
Author
Znotiņš, Kristaps
Co-author
Latvijas Universitāte. Datorikas fakultāte
Advisor
Arnicāns, Guntis
Date
2016Metadata
Show full item recordAbstract
Uzņēmumi savās tīmekļa vietnēs publicē informāciju, kas ir noderīga to klientiem, sadarbības partneriem un konkurentiem. Viens no pirmajiem soļiem šīs informācijas apguvei ir tīmekļa vietņu identificēšana, kurās uzņēmumi publicē ar tiem saistīto informāciju. Informāciju par savām tīmekļa vietnēm parasti ir ieinteresēti izplatīt arī paši uzņēmumu pārstāvji, un tā no dažādiem avotiem jau tiek apkopota vairākos publiski pieejamos repozitorijos, tomēr tās pievienošana, atjaunošana un kontrole var prasīt nozīmīgus cilvēkresursus. Autors apskata uzņēmumu tīmekļa vietņu meklēšanas automatizācijas iespējas, izmantojot tīmekļa saturu un citus resursus, un piedāvā risinājumu, kas Latvijā reģistrētiem uzņēmumiem sasniedz vairāk kā 90% precizitāti ar līdz 70% pārklājumu tīmekļa vietņu piederības noteikšanai. Companies utilize their websites to publish information that is valuable for their clients, partners and competitors. One of the first steps in processing this information is to discover websites where companies publish their information. Companies are usually interested in making their website information available themselves and it is already been collected in multiple publicly available repositories; however submission, maintenance and control of this information require significant human resources. Author describes methods for automated company website discovery by utilizing web content and other resources and proposes a website classification solution that exceeds 90% accuracy with up to 70% recall for companies of Latvia.