• English
    • Latviešu
    • Deutsch
    • русский
  • Help
  • English 
    • English
    • Latviešu
    • Deutsch
    • русский
  • Login
View Item 
  •   DSpace Home
  • B4 – LU fakultātes / Faculties of the UL
  • A -- Eksakto zinātņu un tehnoloģiju fakultāte / Faculty of Science and Technology
  • Bakalaura un maģistra darbi (EZTF) / Bachelor's and Master's theses
  • View Item
  •   DSpace Home
  • B4 – LU fakultātes / Faculties of the UL
  • A -- Eksakto zinātņu un tehnoloģiju fakultāte / Faculty of Science and Technology
  • Bakalaura un maģistra darbi (EZTF) / Bachelor's and Master's theses
  • View Item
JavaScript is disabled for your browser. Some features of this site may not work without it.

Vārdu nozīmju piekārtošana starp leksiskajiem tīkliem

Thumbnail
View/Open
302-83289-Strankale_Laine_ls17138.pdf (878.0Kb)
Author
Strankale, Laine
Co-author
Latvijas Universitāte. Datorikas fakultāte
Advisor
Paikens, Pēteris
Date
2021
Metadata
Show full item record
Abstract
Latvian WordNet ir latviešu valodas leksiskais tīkls – resurss, kurā vārdu nozīmes ir savienotas, balstoties uz to semantiskajām attieksmēm. Pašlaik tiek manuāli veidots pamattīkls, sasaistot ierobežotu skaitu vārdu nozīmju, taču teksta analīzei ir nepieciešams plašs pārklājums. Šī darba mērķis ir papildināt eksistējošo leksisko tīklu, automātiski piesaistot jaunas vārdu nozīmes un piekārtojot tās angļu valodas leksiskajam tīklam Princeton WordNet. Izvēlētā metode identificē angļu un latviešu valodām kopīgo informāciju, izmantojot latviešu skaidrojošās vārdnīcas Tēzaurs.lv un Princeton WordNet datus un salīdzinot ar vārdlietojuma kartējuma (angliski word embeddings) palīdzību nozīmju definīcijas, piemērus un sinonīmus. Rezultātā tika atrastas 54 924 nozīmes, ko var potenciāli pievienot Latvian WordNet, ar precizitāti 69% lietvārdiem, 40% darbības vārdiem, 70% īpašības vārdiem un 64% apstākļa vārdiem.
 
Latvian WordNet is a resource where the senses of words are connected based on their semantic relationships. The core network is currently being manually built, linking the senses of a limited number of words, however, text processing tasks require broad coverage. This work aims to extend the existing Latvian WordNet by automatically linking new word senses and aligning them to the English-language Princeton WordNet. The method chosen identifies common information for English and Latvian languages, using the data from the Latvian online dictionary Tēzaurs.lv and Princeton WordNet, and compares the word sense definitions, examples and synonyms using word embeddings. As a result, 54 924 meanings were found that can potentially be added to Latvian WordNet, with an accuracy of 69% for nouns, 40% for verbs, 70% for adjectives and 64% for adverbs.
 
URI
https://dspace.lu.lv/dspace/handle/7/55879
Collections
  • Bakalaura un maģistra darbi (EZTF) / Bachelor's and Master's theses [5688]

University of Latvia
Contact Us | Send Feedback
Theme by 
@mire NV
 

 

Browse

All of DSpaceCommunities & CollectionsBy Issue DateAuthorsTitlesSubjectsThis CollectionBy Issue DateAuthorsTitlesSubjects

My Account

Login

Statistics

View Usage Statistics

University of Latvia
Contact Us | Send Feedback
Theme by 
@mire NV