Latviešu valodas automatizēta morfoloģiskā un sintaktiskā analīze

Loading...
Thumbnail Image

Date

Journal Title

Journal ISSN

Volume Title

Publisher

Latvijas Universitāte

Language

N/A

Abstract

Darbā tiek apskatītas pasaulē izmantotās morfoloģiskās un sintaktiskās analīzes metodes, izvērtējot to pielietojuma iespējas brīvu latviešu valodas tekstu automatizētai analīzei. Tiek detalizēti aprakstīts praktiski realizēts risinājums uz leksikona bāzētai morfoloģijas analīzei, kas var nodro ināt kvalitatīvu atpazīšanu 97 % no brīva latviešu valodas teksta vārdiem. Pārējo vārdu atpazīšanai ir izstrādāta metode, kas piekārto iespējamos analīzes variantus, balstoties uz vārda izskaņu, tādējādi ļaujot to efektīvi izmantot citos valodniecības rīkos kā robustu vārdu analīzes slāni. Darbā ir izvērtētas problēmas latviešu valodas sintaktiskajā analīzē, apskatītas dažas praksē realizētas metodes sintakses parsēšanai, un piedāvāti risinājumi tālākai sintaktiskās analīzes uzlabošanai, pārveidojot esošās latviešu valodas formālās gramatikas uz Head-driven Phrase Structure Grammar bāzētu gramatikas un parsēšanas metodoloģiju.
This paper contains an overview of popular methods for morphological and syntactical analysis of natural language, evaluating their suitability for automated analysis of unrestricted texts of latvian language. A practical solution for lexicon-based morphological analysis is described in detail. The developed tool can provide full morphological detail for 97 % words of an unrestricted latvian language text, and provide a list of all likely possibilities for the remaining words, depending on their endings. Such wide coverage allows the solution to be used in other linguistic tools as a transparent and robust layer for analysing word properties. The paper also describes the problematics of natural language syntactic analysis, and reviews several implementations of syntactic parsing for latvian language. A proposal is shown for improving syntactic analysis by turning to Head-driven Phrase Structure Grammar based methodology of parsing and grammar development.

Citation

Relation

Endorsement

Review

Supplemented By

Referenced By