Automātiska pieturzīmju ievietošana tekstā
Author
Leduskrasts, Andris
Co-author
Latvijas Universitāte. Datorikas fakultāte
Advisor
Pretkalniņa, Lauma
Date
2015Metadata
Show full item recordAbstract
Bakalaura darba mērķis ir izveidot likumbāzētu rīku, kas realizē automātisku pieturzīmju ievietošanu tekstā, un izpētīt tā iespējas. Pilnvērtīga pieturzīmju ievietošana ir sarežģīts uzdevums, kam nepieciešams risināt valodas daudznozīmības problēmas visos valodas līmeņos. Darbā aprakstīta likumu kopa, kas balstīta uz viennozīmīgi konstatējamām, lokāla mēroga latviešu valodas parādībām, nevis visa teikuma analīzi. Tie var darboties bez konteksta analīzes un daudznozīmību atrisināšanas.
Bakalaura darba rezultāts ir programmēšanas valodā Python izstrādāts publiski pieejams rīks Pieturzīmju Palīgs, kas, balstoties uz darbā izstrādātajiem likumiem, spēj tekstā pēc iespējas nekļūdīgi ievietot pieturzīmes. Darba gaitā izstrādātais rīks tiek arī novērtēts, testēts, lai noteiktu tā un izveidotās metodes lietderīgumu un pielietojumu. The aim of this thesis is to create a rule-based tool for the automatic punctuation insertion in Latvian text and to estimate its possibilities. Complete insertion of punctuation is a difficult task that tackles language ambiguity problems on all language levels. The set of rules defined in this thesis are based on non-ambigious local-scope observations instead of the whole sentence analysis. These rules function without word sense disambiguation or context analysis.
The result of this thesis is a tool developed using Python programming language – “Pieturzīmju Palīgs” (Punctuation Helper). It can insert punctuation marks as accurately as possible by using only the predefined rules. Thesis also includes testing and evaluation of the developed tool to determine the usefulness and applications of the tool and the developed method.