Optiskas rakstzīmju pazīšanas (OCR) sistēmas prototipa izstrāde
Author
Lauris, Pēteris
Co-author
Latvijas Universitāte. Datorikas fakultāte
Advisor
Paikens, Pēteris
Date
2016Metadata
Show full item recordAbstract
Attēli mūsdienās bieži tiek izmantoti, lai attēlotu vai pārsūtītu tekstuālu informāciju, bet šo informāciju attēlos nav iespējams vienkārši izmantot, piemēram rediģēt vai meklēt tajā tekstu. Šim nolūkam ir nepieciešamas optisko rakstzīmju pazīšanas (OCR) sistēmas, kas tekstu no attēla pārveido par datorā rediģējamu tekstu. Bakalaura darbā tiek apskatītas OCR sistēmas prototipa izstrādei nepieciešamās metodes, kā arī aplūkota pašreizējā situācija attiecībā uz teksta atpazīšanu latviešu valodā. Darba rezultātā autors ir izstrādājis OCR sistēmas prototipu, kas spēj attēlā atpazīt latviešu valodas simbolus, kā arī izmanto latviešu valodas modeli, lai uzlabotu atpazīšanas rezultātu. Nowadays images are often used to display or send textual information. However, it is not easily possible to modify this information or search for something in it. For this purpose, optical character recognition (OCR) systems are used. They convert text from the image into an editable text. Bachelor's thesis describes methods required for developing an OCR system and analyses current situation regarding character recognition for Latvian. As a result, for this thesis author has developed a prototype of an OCR system that can recognize text written in Latvian and uses a language model to improve the result.