Show simple item record

dc.contributor.advisorIvanovs, Maksims
dc.contributor.authorGriņevičs, Andrejs
dc.contributor.otherLatvijas Universitāte. Eksakto zinātņu un tehnoloģiju fakultāte
dc.date.accessioned2025-07-02T01:01:39Z
dc.date.available2025-07-02T01:01:39Z
dc.date.issued2025
dc.identifier.other109356
dc.identifier.urihttps://dspace.lu.lv/dspace/handle/7/71483
dc.description.abstractTā kā digitālā komunikācija virzās uz neformālākiem un nestrukturētākiem saziņas līdzekļiem, piemēram, tērzēšanas ziņojumiem, e-pastiem vai piezīmēm, lietotāji arvien vairāk ir spiesti izvilkt uzdevumus no teksta un manuāli pārsūtīt tos uz kalendāriem, uzdevumu sarakstiem vai atgādinājumiem. Šajā rakstā ir aprakstītas mākslīgā intelekta metodes strukturētu uzdevumu datu identificēšanai no dabiskās valodas teksta. Šajā rakstā tiek pētītas divas modelēšanas stratēģijas: modulārs cauruļvads ar klasifikācijas un nosaukto vienību atpazīšanas (NER) modeļiem un pilnīga stratēģija ar T5 balstītu secības-secības modeli. Visi modeļi tika apmācīti ar anotētu MultiWOZ 2.2 dialoga korpusa apakškopu, kas papildināta ar uzdevumam specifiskām anotācijām (darbība, kategorija, prioritāte, datums un laiks, atrašanās vieta vai persona). Empīriskā novērtējuma rezultāti liecina, ka abos virzienos var sasniegt augstu precizitāti, kur klasifikācijas un NER modeļi ir precīzi, ātri un interpretējami, un mūsu T5 stila modelis ziņo par līdzīgu vai labāku veiktspēju visos uzdevumos vienotā, ģeneratīvā veidā. Rakstā ir identificēti kompromisi attiecībā uz precizitāti, elastību un sistēmas sarežģītību, kā arī sniegti ieteikumi arhitektūras izvēlei, pamatojoties uz izvietošanas prasībām, piemēram, latentumu, izskaidrojamību un integrācijas ierobežojumiem.
dc.description.abstractWith digital communication moving towards more casual and non-structured mediums like chat messages, emails or notes, users are increasingly compelled to extract tasks from text and transfer them to calendars, to-do lists, or reminders manually. This paper presents AI techniques for identifying structured task data from natural language text. In the paper, two modeling strategies are studied: a modular pipeline with classification plus named entity recognition (NER) models, and an end-to-end strategy with a T5-based sequence-to-sequence model. All models were trained on an annotated subset of the MultiWOZ 2.2 dialogue corpus, augmented with task-specific annotations (action, category, priority, datetime, location, or person). The empirical evaluation results demonstrate that both directions can achieve high accuracy, where the classification and NER models are accurate, fast, and interpretable, and our T5-style model reports similar or better performance across all tasks in a unified, generative manner. The paper points out the trade-offs in terms of accuracy, flexibility, and system complexity, and offers guidelines for choosing an architecture based on deployment requirements, such as latency, explainability, and integration constraints.
dc.language.isolav
dc.publisherLatvijas Universitāte
dc.rightsinfo:eu-repo/semantics/openAccess
dc.subjectDatorzinātne un informātika
dc.subjectTask extraction
dc.subjectNatural language processing
dc.subjectStructured generation
dc.subjectNamed entity recognition
dc.titleMākslīgajā intelektā balstīts palīgs automatizētai uzdevumu izgūšanai un organizēšanai no tekstuāliem datiem
dc.title.alternativeArtificial intelligence-based assistant for automatic task extraction and 0rganization from textual data
dc.typeinfo:eu-repo/semantics/bachelorThesis


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record