Rakstu automātiska ģenerēšana, balstoties uz objektu aprakstošiem datiem
Author
Ieviņš, Kārlis
Co-author
Latvijas Universitāte. Datorikas fakultāte
Advisor
Arnicāns, Guntis
Date
2013Metadata
Show full item recordAbstract
Datus, kas nav pasniegti ērtā formātā – grafiski vai tekstuāli, cilvēki uztver ar lielākām grūtībām. Loģisks risinājums šai problēmai ir no datiem veidot kopsavilkumus par svarīgāko, kas cilvēkiem būtu intuitīvi uztverami.
Šajā maģistra darbā tiek apkopota teorētiskā informācija par dabiskās valodas ģenerēšanas sistēmām, kā arī izstrādāta sistēma, kas spēj no ievaddatiem izveidot saistītu tekstu jeb rakstu, kas aprakstītu konkrētu datu objektu.
Kā prototips tiek izstrādāta sistēma, kas “raksta” apskatus par Kontinentālās Hokeja Līgas (KHL) spēlēm angļu valodā. Sistēma kā ievaddatus izmanto internetā pieejamos spēļu protokolus un sfēru definējošu ontoloģiju, bet kā izvadu atgriež to tekstuālu apkopojumu. Humans in general are not capable of understanding raw data that is not presented to them in a convenient format – text or image. A logical solution to this problem is generating summaries of data sets that would be easy to understand.
In this paper the author gives summary of theoretical information about natural language generation and creates a simple natural language generation system that summarises a specific data set.
The prototype system that was built for this paper, “writes” English summaries about games of Continental Hockey League. System uses game protocols and field defining ontology file as input data, and after processing the information, system outputs a textual summary about main events of the game.