Latviešu valodas automatizēta morfoloģiskā un sintaktiskā analīze
Loading...
Date
Authors
Advisor
Journal Title
Journal ISSN
Volume Title
Publisher
Latvijas Universitāte
Language
N/A
Abstract
Darbā tiek apskatītas pasaulē izmantotās morfoloģiskās un sintaktiskās analīzes
metodes, izvērtējot to pielietojuma iespējas brīvu latviešu valodas tekstu automatizētai
analīzei. Tiek detalizēti aprakstīts praktiski realizēts risinājums uz leksikona bāzētai
morfoloģijas analīzei, kas var nodro ināt kvalitatīvu atpazīšanu 97 % no brīva latviešu
valodas teksta vārdiem. Pārējo vārdu atpazīšanai ir izstrādāta metode, kas piekārto iespējamos
analīzes variantus, balstoties uz vārda izskaņu, tādējādi ļaujot to efektīvi izmantot citos
valodniecības rīkos kā robustu vārdu analīzes slāni.
Darbā ir izvērtētas problēmas latviešu valodas sintaktiskajā analīzē, apskatītas dažas
praksē realizētas metodes sintakses parsēšanai, un piedāvāti risinājumi tālākai sintaktiskās
analīzes uzlabošanai, pārveidojot esošās latviešu valodas formālās gramatikas uz Head-driven
Phrase Structure Grammar bāzētu gramatikas un parsēšanas metodoloģiju.
This paper contains an overview of popular methods for morphological and syntactical analysis of natural language, evaluating their suitability for automated analysis of unrestricted texts of latvian language. A practical solution for lexicon-based morphological analysis is described in detail. The developed tool can provide full morphological detail for 97 % words of an unrestricted latvian language text, and provide a list of all likely possibilities for the remaining words, depending on their endings. Such wide coverage allows the solution to be used in other linguistic tools as a transparent and robust layer for analysing word properties. The paper also describes the problematics of natural language syntactic analysis, and reviews several implementations of syntactic parsing for latvian language. A proposal is shown for improving syntactic analysis by turning to Head-driven Phrase Structure Grammar based methodology of parsing and grammar development.
This paper contains an overview of popular methods for morphological and syntactical analysis of natural language, evaluating their suitability for automated analysis of unrestricted texts of latvian language. A practical solution for lexicon-based morphological analysis is described in detail. The developed tool can provide full morphological detail for 97 % words of an unrestricted latvian language text, and provide a list of all likely possibilities for the remaining words, depending on their endings. Such wide coverage allows the solution to be used in other linguistic tools as a transparent and robust layer for analysing word properties. The paper also describes the problematics of natural language syntactic analysis, and reviews several implementations of syntactic parsing for latvian language. A proposal is shown for improving syntactic analysis by turning to Head-driven Phrase Structure Grammar based methodology of parsing and grammar development.