Leksiskās daudzveidības analīze mākslīgā intelekta 4o modeļa ģenerēto un cilvēku rakstītos valodniecības pētījumu korpusos.
Author
Kolontaja, Laura
Co-author
Latvijas Universitāte. Humanitāro zinātņu fakultāte
Advisor
Vinčela, Zigrīda
Date
2025Metadata
Show full item recordAbstract
Daudzās jomās, tostarp valodniecībā, mākslīgā intelekta (MI) veidotie teksti rada būtiskus izaicinājumus, gan attiecībā uz to, kā šādus tekstus vajadzētu vērtēt, gan uz to, cik ticami tos atšķirt no cilvēka rakstītajiem. Dotais pētījums sniedz devumu šo problēmu risināšanā, pētot leksisko sarežģītību, izmantojot korpusa analīzes metodes, lai noskaidrotu, vai leksikas līmenī pastāv izmērāmas atšķirības starp cilvēka un mākslīgā intelekta radītiem akadēmiskiem rakstiem, un, ja pastāv, tad kādas ir šīs atšķirības. Pētījuma rezultāti liecina, ka MI radītajiem tekstiem ir tendence uz lielāku leksisko sarežģītību nekā cilvēka rakstītajiem. Šie secinājumi sniedz ieguldījumu MI ģenerēta satura identificēšanas metožu pilnveidei dažādos tekstuālos kontekstos. Across numerous fields, including linguistics, the emergence of artificial intelligence (AI) generated texts presents significant challenges, particularly in determining how such texts should be addressed, and even in reliably distinguishing them from human-authored content. The present study seeks to aid in addressing these challenges by examining lexical complexity using corpus-based methods with the aim of identifying whether measurable differences exist between human and AI generated academic writing on a lexical level, and if so, what those differences entail. The findings of the paper, that AI generated texts appear to exhibit slightly greater lexical complexity than human-written counterparts, may serve to inform evaluation practices aimed at identifying machine generated content across different textual contexts.