Daudzvārdu izteicienu likumu kompilators mašīntulkošanas sistēmai
Автор
Šics, Valters
Co-author
Latvijas Universitāte. Fizikas un matemātikas fakultāte
Advisor
Skadiņš, Raivis
Дата
2008Metadata
Показать полную информациюАннотации
Bakalaura darbā tiek apskatītas esošas mašīntulkošanas sistēmas problēmas, kas saistītas ar daudzvārdu izteicienu likumu pielietošanu tekstu tulkošanā. Daudzvārdu izteicienu tulkošanas likumi apraksta, kā tulkot izteicienus, kurus nevar tulkot ar vārdnīcu vārdu pa vārdam, jo šo izteicienu nozīme nav saistīta ar ietverto vārdu nozīmi.
Šajā darbā tiek piedāvāts likumu grupēšanas algoritms, kas ļauj efektīvāk pielietot šos likumus frāžu tulkošanā.
Eksistē mašīntulkošanas sistēma, kurā daudzvārdu izteicienu likumi darbojas, bet esošajam risinājumam ir vairāki būtiski trūkumi, piemēram, ātrdarbība, jo esošajā sistēmā konkrētas frāzes tulkošanā viens pēc otra tiek pielietoti visi potenciāli pielietojamie likumi, kas noved pie daudzu līdzīgu operāciju apstrādes.
Atslēgvārdi: mašīntulkošana, daudzvārdu izteicieni, datu struktūras, kompilators. This bachelor’s work describes problems of existing machine translation system bearing on applying multi-word expression rules to text translation. The multi-word expression rules describe how to translate phrases when word by word translation using dictionary is not possible, because the multi-word expression has meaning which is unrelated to the meanings of its constituents (words).
In this paper the rule grouping algorithm is provided what makes rule processing much more effective during translation process.
The machine translation system exist where multi-word expressions are implemented but existing solution has relevant problems, for example, performance because existing system applies all potentially possible multi-word expression rules each by one. This kind of rule execution reduces to processing much similar operation.
Keywords: machine translation, multi-word expressions, data structure, compiler.