Latviešu valodas tekstu gramatiskās marķēšanas rīka izstrāde
Autor
Borodkins, Imants
Co-author
Latvijas Universitāte. Fizikas un matemātikas fakultāte
Advisor
Bārzdiņš, Guntis
Datum
2008Metadata
Zur LanganzeigeZusammenfassung
Darbā tiek apskatīta sintaktiski marķēta latviešu valodas teksta korpusa nepieciešamība un tā iespējamie pielietojuma varianti. Darbā tiek analizētas iespējamās metodes latviešu valodas tekstu gramatiskās marķēšanas rīka izstrādei. Salīdzināti iespējamo risinājuma variantu plusi un mīnusi, kā arī sīkāk aprakstīts izvēlētais un praksē realizētais risinājuma variants. Darbā tiek piedāvāti iespējamie risinājumi realizētā latviešu valodas gramatiskās marķēšanas rīka attīstīšanai un pilnveidošanai. Darbā tiek apskatītas arī citas, ar teksta gramatikas marķēšanu netiešā veidā saistītas problēmas, ar kurām nākas saskarties, analizējot latviešu valodas tekstus. This paper describes possibilities for syntactic markup of text corpora in Latvian language, and the neccessity and possible uses for such corpora. Possible methods for corpus annotation tool development are analysed and compared. A solution which was chosen and implemented is described in detail. The paper also proposes possibilities for further development and improvent of corpus annotation tools. Also a variety of problems and solutions related to automatic analysis of natural language text are described here.