• English
    • Latviešu
    • Deutsch
    • русский
  • Help
  • русский 
    • English
    • Latviešu
    • Deutsch
    • русский
  • Войти
Просмотр элемента 
  •   Главная
  • B4 – LU fakultātes / Faculties of the UL
  • A -- Eksakto zinātņu un tehnoloģiju fakultāte / Faculty of Science and Technology
  • Bakalaura un maģistra darbi (EZTF) / Bachelor's and Master's theses
  • Просмотр элемента
  •   Главная
  • B4 – LU fakultātes / Faculties of the UL
  • A -- Eksakto zinātņu un tehnoloģiju fakultāte / Faculty of Science and Technology
  • Bakalaura un maģistra darbi (EZTF) / Bachelor's and Master's theses
  • Просмотр элемента
JavaScript is disabled for your browser. Some features of this site may not work without it.

Latviešu valodas morfoloģijas definēšana meklēšanas sistēmai Sphinx

Thumbnail
Открыть
302-34174-Mikelevics_Vitalijs_vm09025.pdf (997.3Kb)
Автор
Mikeļevičs, Vitālijs
Co-author
Latvijas Universitāte. Datorikas fakultāte
Advisor
Nahimovs, Nikolajs
Дата
2013
Metadata
Показать полную информацию
Аннотации
Viens no pilnteksta meklēšanas pamatiem ir vārdu apstrādes algoritmi, kas atpazīst vārdu formas ar dažādām galotnēm, sufiksiem un prefiksiem, un indeksācijas laikā reducē tos līdz vienai formai, kura tiks izmantota indeksācijas un meklēšanas laikā. Tādi algoritmi tiek saukti par saknes atdalīšanas algoritmiem. Darba ietvaros tika izpētīti vairāki saknes atdalīšanas algoritmu paveidi, izpētīts Portera algoritms, tā realizācija SNOWBALL programmēšanas valodā; izpētīts Kārļa Krēsliņa latviešu valodas sakņu atdalīšanas algoritms, realizēts SNOWBALL programmēšanas valodā, veiksmīgi pārbaudīts uz testu un reālu datu kopām, modificēts labākai darbībai priekš Sphinx meklēšanas sistēmas.
 
Word processing algorithms are one of the fundamentals of full text search. They detect prefixes, suffixes and endings in different word forms and can be used to reduce a word form to its base one, which will be later used for indexing and searching. Such algorithms are called stemmers. This paper discusses a number of stemming algorithms; one of them, the Porter algorithm, is studied in depth along with its implementation in the SNOWBALL programming language. Karlis Kreslins’ algorithm and its implementation in SNOWBALL are also discussed; the resulting algorithm was tested and modified for better operation with the Sphinx search engine.
 
URI
https://dspace.lu.lv/dspace/handle/7/19083
Collections
  • Bakalaura un maģistra darbi (EZTF) / Bachelor's and Master's theses [6025]

University of Latvia
Контакты | Отправить отзыв
Theme by 
@mire NV
 

 

Просмотр

Весь DSpaceСообщества и коллекцииДата публикацииАвторыНазванияТематикаЭта коллекцияДата публикацииАвторыНазванияТематика

Моя учетная запись

Войти

Статистика

Просмотр статистики использования

University of Latvia
Контакты | Отправить отзыв
Theme by 
@mire NV