Mākslīgajā intelektā balstīts palīgs automatizētai uzdevumu izgūšanai un organizēšanai no tekstuāliem datiem

Griņevičs, Andrejs

dc.contributor.advisor	Ivanovs, Maksims
dc.contributor.author	Griņevičs, Andrejs
dc.contributor.other	Latvijas Universitāte. Eksakto zinātņu un tehnoloģiju fakultāte
dc.date.accessioned	2025-07-02T01:01:39Z
dc.date.available	2025-07-02T01:01:39Z
dc.date.issued	2025
dc.identifier.other	109356
dc.identifier.uri	https://dspace.lu.lv/dspace/handle/7/71483
dc.description.abstract	Tā kā digitālā komunikācija virzās uz neformālākiem un nestrukturētākiem saziņas līdzekļiem, piemēram, tērzēšanas ziņojumiem, e-pastiem vai piezīmēm, lietotāji arvien vairāk ir spiesti izvilkt uzdevumus no teksta un manuāli pārsūtīt tos uz kalendāriem, uzdevumu sarakstiem vai atgādinājumiem. Šajā rakstā ir aprakstītas mākslīgā intelekta metodes strukturētu uzdevumu datu identificēšanai no dabiskās valodas teksta. Šajā rakstā tiek pētītas divas modelēšanas stratēģijas: modulārs cauruļvads ar klasifikācijas un nosaukto vienību atpazīšanas (NER) modeļiem un pilnīga stratēģija ar T5 balstītu secības-secības modeli. Visi modeļi tika apmācīti ar anotētu MultiWOZ 2.2 dialoga korpusa apakškopu, kas papildināta ar uzdevumam specifiskām anotācijām (darbība, kategorija, prioritāte, datums un laiks, atrašanās vieta vai persona). Empīriskā novērtējuma rezultāti liecina, ka abos virzienos var sasniegt augstu precizitāti, kur klasifikācijas un NER modeļi ir precīzi, ātri un interpretējami, un mūsu T5 stila modelis ziņo par līdzīgu vai labāku veiktspēju visos uzdevumos vienotā, ģeneratīvā veidā. Rakstā ir identificēti kompromisi attiecībā uz precizitāti, elastību un sistēmas sarežģītību, kā arī sniegti ieteikumi arhitektūras izvēlei, pamatojoties uz izvietošanas prasībām, piemēram, latentumu, izskaidrojamību un integrācijas ierobežojumiem.
dc.description.abstract	With digital communication moving towards more casual and non-structured mediums like chat messages, emails or notes, users are increasingly compelled to extract tasks from text and transfer them to calendars, to-do lists, or reminders manually. This paper presents AI techniques for identifying structured task data from natural language text. In the paper, two modeling strategies are studied: a modular pipeline with classification plus named entity recognition (NER) models, and an end-to-end strategy with a T5-based sequence-to-sequence model. All models were trained on an annotated subset of the MultiWOZ 2.2 dialogue corpus, augmented with task-specific annotations (action, category, priority, datetime, location, or person). The empirical evaluation results demonstrate that both directions can achieve high accuracy, where the classification and NER models are accurate, fast, and interpretable, and our T5-style model reports similar or better performance across all tasks in a unified, generative manner. The paper points out the trade-offs in terms of accuracy, flexibility, and system complexity, and offers guidelines for choosing an architecture based on deployment requirements, such as latency, explainability, and integration constraints.
dc.language.iso	lav
dc.publisher	Latvijas Universitāte
dc.rights	info:eu-repo/semantics/openAccess
dc.subject	Datorzinātne un informātika
dc.subject	Task extraction
dc.subject	Natural language processing
dc.subject	Structured generation
dc.subject	Named entity recognition
dc.title	Mākslīgajā intelektā balstīts palīgs automatizētai uzdevumu izgūšanai un organizēšanai no tekstuāliem datiem
dc.title.alternative	Artificial intelligence-based assistant for automatic task extraction and 0rganization from textual data
dc.type	info:eu-repo/semantics/bachelorThesis

Files in this item

Name:: 302-109356-Grinevics_Andrejs_a ...
Size:: 1.421Mb
Format:: PDF

View/Open

This item appears in the following Collection(s)

Bakalaura un maģistra darbi (EZTF) / Bachelor's and Master's theses [6168]

Show simple item record