Show simple item record

dc.contributor.advisorPaikens, Pēterisen_US
dc.contributor.authorZnotiņš, Artūrsen_US
dc.contributor.otherLatvijas Universitāte. Datorikas fakultāteen_US
dc.date.accessioned2015-03-24T07:05:27Z
dc.date.available2015-03-24T07:05:27Z
dc.date.issued2014en_US
dc.identifier.other43772en_US
dc.identifier.urihttps://dspace.lu.lv/dspace/handle/7/17101
dc.description.abstractKoreferenču noteikšana ir aktuāla problēma dabiskās valodas apstrādes (NLP) pētījumos. Pēdējos gados ir vērojams ievērojams progress ne tikai koreferenču noteikšanā angļu valodai, bet arī citām valodām, kurām nav tik daudz pieejamo lingvistisko resursu. Darba mērķis ir izveidot pamatu tālākiem pētījumiem koreferenču noteikšanai latviešu valodai. Darbs ietver anotēšanas vadlīniju un manuāli anotēta koreferenču korpusa izstrādi latviešu valodā. Teorētiskajā daļā ir apskatītas dažādas pieejas koreferenču noteikšanai. Darba galvenais rezultāts ir likumos bāzēta koreferenču sistēma latviešu valodai, kas sasniedz 58,0% F-mēru (76,5%, izmantojot manuāli anotētus pieminējumus). Darbs apraksta pašreizējos mašīnmācīšanās eksperimentus un centienus uzlabot nosaukto entītiju atpazīšanas veiktspēju. Atslēgvārdi: dabiskās valodas apstrāde, informācijas izgūšana, koreferenču noteikšana, nosaukto entītiju atpazīšanaen_US
dc.description.abstractCoreference resolution in Latvian Coreference resolution is a current problem in natural language processing (NLP) research. Over the last years considerable progress has been made not only in coreference resolution for English but also for other languages with much less linguistic resources available. The aim of this work is to create a baseline for further research in coreference resolution for Latvian. The work includes creation of annotation guidelines and manually annotated coreference corpus in Latvian. In theoretical part different approaches for coreference resolution are considered. The main result of this work is the rule based coreference system that currently reaches 58.0% F-score (76.5% using manually annotated mentions). This paper also describes current machine learning experiments and efforts to improve the performance of a named entity recognizer. Keywords: natural language processing, information extraction, coreference resolution, named entity recognitionen_US
dc.language.isoN/Aen_US
dc.publisherLatvijas Universitāteen_US
dc.rightsinfo:eu-repo/semantics/openAccessen_US
dc.subjectDatorzinātneen_US
dc.titleKoreferenču noteikšana latviešu valodāen_US
dc.title.alternativeCoreference resolution in Latvianen_US
dc.typeinfo:eu-repo/semantics/bachelorThesisen_US


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record