OCR pielāgošana vairāku alfabētu tekstiem
Автор
Brants, Roberts
Co-author
Latvijas Universitāte. Datorikas fakultāte
Advisor
Paikens, Pēteris
Дата
2023Metadata
Показать полную информациюАннотации
Bakalaura darba mērķis ir izpētīt metodes, kas palielina OCR tehnoloģijas precizitāti dažādu alfabētu tekstu attēliem. Kā arī, izstrādāt tādu OCR adapteri, kas sekmīgi implementē izpētītās metodes, un spēj apstrādāt dažādu alfabētu rakstzīmju saturošu tekstu. Šāds adapteris nepieciešams, lai sekmētu sarežģīta satura tekstu digitalizēšanas procesu, tādejādi sekmējot algoritmisku procesu pielietojamību digitalizētiem tekstiem. Darba pamatā tiek izmatots Konstantīna Karuļa “Latviešu etimoloģijas vārdnīca” (Avots, 2001) grāmatas LNB digitalizējums. The aim of the bachelor's thesis is to study methods that increase the accuracy of OCR technology for text images of different alphabets. Also, develop an OCR adapter that successfully implements the studied methods and can process text containing characters of various alphabets. Such an adapter is necessary to facilitate the digitization process of texts with complex content, thereby facilitating the applicability of algorithmic processes to digitized texts. The work is based on the LNB digitization of the book "Latviešu etimoloģijas vārdnīca" (Avots, 2001) by Konstantins Karulis.