dc.contributor.advisor | Ivanovs, Maksims | |
dc.contributor.author | Griņevičs, Andrejs | |
dc.contributor.other | Latvijas Universitāte. Eksakto zinātņu un tehnoloģiju fakultāte | |
dc.date.accessioned | 2025-07-02T01:01:39Z | |
dc.date.available | 2025-07-02T01:01:39Z | |
dc.date.issued | 2025 | |
dc.identifier.other | 109356 | |
dc.identifier.uri | https://dspace.lu.lv/dspace/handle/7/71483 | |
dc.description.abstract | Tā kā digitālā komunikācija virzās uz neformālākiem un nestrukturētākiem saziņas līdzekļiem, piemēram, tērzēšanas ziņojumiem, e-pastiem vai piezīmēm, lietotāji arvien vairāk ir spiesti izvilkt uzdevumus no teksta un manuāli pārsūtīt tos uz kalendāriem, uzdevumu sarakstiem vai atgādinājumiem. Šajā rakstā ir aprakstītas mākslīgā intelekta metodes strukturētu uzdevumu datu identificēšanai no dabiskās valodas teksta. Šajā rakstā tiek pētītas divas modelēšanas stratēģijas: modulārs cauruļvads ar klasifikācijas un nosaukto vienību atpazīšanas (NER) modeļiem un pilnīga stratēģija ar T5 balstītu secības-secības modeli. Visi modeļi tika apmācīti ar anotētu MultiWOZ 2.2 dialoga korpusa apakškopu, kas papildināta ar uzdevumam specifiskām anotācijām (darbība, kategorija, prioritāte, datums un laiks, atrašanās vieta vai persona). Empīriskā novērtējuma rezultāti liecina, ka abos virzienos var sasniegt augstu precizitāti, kur klasifikācijas un NER modeļi ir precīzi, ātri un interpretējami, un mūsu T5 stila modelis ziņo par līdzīgu vai labāku veiktspēju visos uzdevumos vienotā, ģeneratīvā veidā. Rakstā ir identificēti kompromisi attiecībā uz precizitāti, elastību un sistēmas sarežģītību, kā arī sniegti ieteikumi arhitektūras izvēlei, pamatojoties uz izvietošanas prasībām, piemēram, latentumu, izskaidrojamību un integrācijas ierobežojumiem. | |
dc.description.abstract | With digital communication moving towards more casual and non-structured mediums like chat messages, emails or notes, users are increasingly compelled to extract tasks from text and transfer them to calendars, to-do lists, or reminders manually. This paper presents AI techniques for identifying structured task data from natural language text. In the paper, two modeling strategies are studied: a modular pipeline with classification plus named entity recognition (NER) models, and an end-to-end strategy with a T5-based sequence-to-sequence model. All models were trained on an annotated subset of the MultiWOZ 2.2 dialogue corpus, augmented with task-specific annotations (action, category, priority, datetime, location, or person). The empirical evaluation results demonstrate that both directions can achieve high accuracy, where the classification and NER models are accurate, fast, and interpretable, and our T5-style model reports similar or better performance across all tasks in a unified, generative manner. The paper points out the trade-offs in terms of accuracy, flexibility, and system complexity, and offers guidelines for choosing an architecture based on deployment requirements, such as latency, explainability, and integration constraints. | |
dc.language.iso | lav | |
dc.publisher | Latvijas Universitāte | |
dc.rights | info:eu-repo/semantics/openAccess | |
dc.subject | Datorzinātne un informātika | |
dc.subject | Task extraction | |
dc.subject | Natural language processing | |
dc.subject | Structured generation | |
dc.subject | Named entity recognition | |
dc.title | Mākslīgajā intelektā balstīts palīgs automatizētai uzdevumu izgūšanai un organizēšanai no tekstuāliem datiem | |
dc.title.alternative | Artificial intelligence-based assistant for automatic task extraction and 0rganization from textual data | |
dc.type | info:eu-repo/semantics/bachelorThesis | |