Latviešu–angļu mašīntulkošanas optimizācija
Author
Immers, Kārlis
Co-author
Latvijas Universitāte. Datorikas fakultāte
Advisor
Zuters, Jānis
Date
2018Metadata
Show full item recordAbstract
Pēdējo gadu laikā notikusī straujā dziļās mašīnmācīšanās attīstība ir ļāvusi attīstīties arī mašīntulkošanas nozarei. Lai palīdzētu uzņēmējiem apgūt starptautiskos tirgus un ļautu datortehnikas lietotājiem izmantot tehnoloģijas dzimtajā valodā, ir svarīgi attīstīt latviešu valodas mašīntulkošanas tehnoloģijas. Šajā darbā aprakstīti neirontulkošanas darbības principi un latviešu valodas morfoloģiskās īpatnības. Identificētas metodes, kas pašlaik sniedz labākos rezultātus latviešu valodas tulkošanā. Papildus tam ir veikti eksperimenti ar neirontulkošanas sistēmu trenēšanu un optimizāciju latviešu valodas tulkošanai. Darbā tiek aprakstīts jauns latviešu valodas vārdu segmentācijas algoritms, kas varētu uzlabot latviešu valodas tulkojumu kvalitāti. Optimization of Latvian–English machine translation Recent developments in deep learning have enabled advances in the field of machine translation. To enable companies to reach international markets and to help computer users to access technologies in their native language, it is important to develop methods for neural machine translation of Latvian language. This Master’s thesis describes underlying principles of neural machine translation and morphological properties of Latvian language. Current systems providing best results of Latvian translation are identified. Additionally, practical experiments have been performed to train English–Latvian neural translation systems. A new algorithm for segmentation of Latvian words into sub–word units has been proposed.