Stipri trokšņaina teksta atpazīšana
Author
Kočerovs, Antons
Co-author
Latvijas Universitāte. Fizikas un matemātikas fakultāte
Advisor
Freivalds, Kārlis
Date
2009Metadata
Show full item recordAbstract
Maģistra darbā tiek detalizēti izklāstīts teksta atpazīšanas problemātikas pētījums. Attīstot
darba tēmu, lielāka uzmanība pievērsta tieši tām metodikām un tehnikām, kuras spēj strādāt ar
trokšņainiem attēliem.
Darbā tiek aplūkoti gan teorētiskie, gan praktiskie jautājumi divām būtiski atšķirīgām
atpazīšanas metodēm, viena no kurām balstās uz noteicošās funkcijas konstruēšanas pazīmju
telpā atpazīstamiem tēliem, bet otra pamatojas uz sakrišanas mēra definēšanas un divu doto
datu kopumu (signāla un parauga) salīdzināšanu. Tiek piedāvāts un precīzi aprakstīts grafiskā
teksta segmentācijas algoritms. Atsevišķi tiek aplūkota attēlu telpiskā filtrācija kā
palīglīdzeklis trokšņa efekta samazināšanai. Darbā tiek precīzi paskaidrotas dažādas nianses,
saistītas ar atpazīšanas sistēmas praktisku realizāciju, iekļaujot labāka krāsu modeļa izvēli,
piemērotāka algoritma izvēli attēlu mērogošanai, resursapjomīga algoritma optimizācijas
iespējas.
Iegūtās teorētiskās zināšanas un praktiskās prasmes tiek izmantotas, realizējot paša
teksta atpazīšanas sistēmu. Maģistra darbā tiek izklāstīta precīza salīdzinājuma analīze
sistēmas darba rezultātiem pie dažādām konfigurācijām un izvēlētām atpazīšanas metodēm. Presented master thesis bears topic „Noisy text recognition”. Master thesis in detail
highlights research of the text recognition problems. The thesis emphasizes on methods and
techniques of working with noisy pictures.
This thesis regards both, theoretical and practical matters, to two substantially different
text recognition methods. One of those methods is based on construction of decision function
for recognizable objects in feature space; the other one is based on defining of the coincident
value and comparing of the two given data objects (signal and pattern). Also author
particularly outlines the algorithm of recognition of the graphic text and gives an overview on
dimensional filtration, which helps to lower the noise effects. Thesis underlines the some
aspects of practical implementation of recognition system, introducing the optimal choice of
best color model, most efficient algorithms for picture scaling and gives ideas for
optimization of resource-intensive algorithm.
Obtained theoretical and practical knowledge is used for development of own text
recognition system. Thesis practical part involves the comparative analysis of recognition
system work results, with different system configurations and recognition methods.