Datorģenerētu pētniecisko darbu anotāciju atpazīšana ar dziļo mašīnmācīšanos
Autor
Cinis, Māris
Co-author
Latvijas Universitāte. Datorikas fakultāte
Advisor
Skadiņa, Inguna
Datum
2023Metadata
Zur LanganzeigeZusammenfassung
Mākslīgā intelekta popularitāte strauji aug, un paliek arvien grūtāk atšķirt cilvēka rakstītu un datorģenerētu tekstu pētnieciskajos darbos, ziņu rakstos un citos dokumentos. Šī bakalaura darba mērķis ir izveidot mākslīgā intelekta modeli, kas spēj atpazīt, vai zinātniski pētnieciskā darba anotācija ir ģenerēta ar vienu no populārākajiem teksta ģenerēšanas modeļiem – gpt-3.5-turbo (ChatGPT). Lai sasniegtu izvirzīto mērķi, ir veikta avotu izpēte vispiemērotākajam risinājumam, apkopoti publiski pieejamo pētniecisko darbu nosaukumi un anotācijas, izmantojot ChatGPT no darbu nosaukumiem uzģenerētas anotācijas un ar dziļo mašīnmācīšanos un šiem datiem ir apmācīts modelis, kas nosaka, vai anotācija ir cilvēka rakstīta vai datora ģenerēta. The popularity of artificial intelligence is growing rapidly, and it is becoming increasingly difficult to distinguish between human-written and computer-generated text in research papers, newspapers, and other documents. The aim of this bachelor's thesis is to create an artificial intelligence model capable of recognizing whether the abstract of a scientific research paper has been generated with one of the most popular text generation models gpt-3.5-turbo (ChatGPT). To achieve the set goal, sources have been analysed for the most suitable solution, titles and abstracts of publicly available research papers have been collected, artificial abstracts have been generated with ChatGPT using the titles of the papers, and with deep machine learning techniques using this data, a model is trained to determine whether an abstract is human-written or computer-generated.