OCR pielāgošana vairāku alfabētu tekstiem

Loading...
Thumbnail Image

Date

Journal Title

Journal ISSN

Volume Title

Publisher

Latvijas Universitāte

Language

lav

Abstract

Bakalaura darba mērķis ir izpētīt metodes, kas palielina OCR tehnoloģijas precizitāti dažādu alfabētu tekstu attēliem. Kā arī, izstrādāt tādu OCR adapteri, kas sekmīgi implementē izpētītās metodes, un spēj apstrādāt dažādu alfabētu rakstzīmju saturošu tekstu. Šāds adapteris nepieciešams, lai sekmētu sarežģīta satura tekstu digitalizēšanas procesu, tādejādi sekmējot algoritmisku procesu pielietojamību digitalizētiem tekstiem. Darba pamatā tiek izmatots Konstantīna Karuļa “Latviešu etimoloģijas vārdnīca” (Avots, 2001) grāmatas LNB digitalizējums.
The aim of the bachelor's thesis is to study methods that increase the accuracy of OCR technology for text images of different alphabets. Also, develop an OCR adapter that successfully implements the studied methods and can process text containing characters of various alphabets. Such an adapter is necessary to facilitate the digitization process of texts with complex content, thereby facilitating the applicability of algorithmic processes to digitized texts. The work is based on the LNB digitization of the book "Latviešu etimoloģijas vārdnīca" (Avots, 2001) by Konstantins Karulis.

Citation

Relation

Endorsement

Review

Supplemented By

Referenced By