Institutional Repository

Skoner en kleiner vertaalgeheues

Show simple item record

dc.contributor.advisor Pretorius, Laurette
dc.contributor.advisor Buitelaar, Paul
dc.contributor.author Wolff, Friedel
dc.date.accessioned 2018-10-24T12:15:20Z
dc.date.available 2018-10-24T12:15:20Z
dc.date.issued 2018-01
dc.date.submitted 2018-10
dc.identifier.citation Wolff, Friedel (2018) Skoner en kleiner vertaalgeheues, University of South Africa, Pretoria, <http://hdl.handle.net/10500/24961>
dc.identifier.uri http://hdl.handle.net/10500/24961
dc.description.abstract Rekenaars kan ’n nuttige rol speel in vertaling. Twee benaderings is vertaalgeheuestelsels en masjienvertaalstelsels. By hierdie twee tegnologieë word ’n vertaalgeheue gebruik—’n tweetalige versameling vorige vertalings. Hierdie proefskrif bied metodes aan om die kwaliteit van ’n vertaalgeheue te verbeter. ’n Masjienleerbenadering word gevolg om foutiewe inskrywings in ’n vertaalgeheue te identifiseer. ’n Verskeidenheid leerkenmerke in drie kategorieë word aangebied: kenmerke wat verband hou met tekslengte, kenmerke wat deur kwaliteittoetsers soos vertaaltoetsers, ’n speltoetser en ’n grammatikatoetser bereken word, asook statistiese kenmerke wat met behulp van eksterne data bereken word. Die evaluasie van vertaalgeheuestelsels is nog nie gestandaardiseer nie. In hierdie proefskrif word ’n verskeidenheid probleme met bestaande evaluasiemetodes uitgewys, en ’n verbeterde evaluasiemetode word ontwikkel. Deur die foutiewe inskrywings uit ’n vertaalgeheue te verwyder, is ’n kleiner, skoner vertaalgeheue beskikbaar vir toepassings. Eksperimente dui aan dat so ’n vertaalgeheue beter prestasie behaal in ’n vertaalgeheuestelsel. As ondersteunende bewys vir die waarde van ’n skoner vertaalgeheue word ’n verbetering ook aangedui by die opleiding van ’n masjienvertaalstelsel. af
dc.description.abstract Computers can play a useful role in translation. Two approaches are translation memory systems and machine translation systems. With these two technologies a translation memory is used— a bilingual collection of previous translations. This thesis presents methods to improve the quality of a translation memory. A machine learning approach is followed to identify incorrect entries in a translation memory. A variety of learning features in three categories are presented: features associated with text length, features calculated by quality checkers such as translation checkers, a spell checker and a grammar checker, as well as statistical features computed with the help of external data. The evaluation of translation memory systems is not yet standardised. This thesis points out a number of problems with existing evaluation methods, and an improved evaluation method is developed. By removing the incorrect entries in a translation memory, a smaller, cleaner translation memory is available to applications. Experiments demonstrate that such a translation memory results in better performance in a translation memory system. As supporting evidence for the value of a cleaner translation memory, an improvement is also achieved in training a machine translation system. en
dc.format.extent 1 online resource (xiv, 155 leaves) : color illustrations, color graphs
dc.language.iso Afrikaans en
dc.subject Taaltegnologie en
dc.subject Natuuurliketaalverwerking en
dc.subject Vertaalgeheue en
dc.subject Rekenaargesteunde vertaling en
dc.subject Parallelle korpus en
dc.subject Datakwaliteit en
dc.subject Masjienleer en
dc.subject Masjienvertaling en
dc.subject Regressie en
dc.subject Klassifikasie en
dc.subject Language technology en
dc.subject Natural language processing en
dc.subject Translation memory en
dc.subject Computer-assisted translation en
dc.subject Parallel corpus en
dc.subject Data quality en
dc.subject Machine learning en
dc.subject Machine translation en
dc.subject Regression en
dc.subject Classification en
dc.subject.ddc 006.35
dc.subject.lcsh Natural language processing (Computer science) en
dc.subject.lcsh Machine learning en
dc.subject.lcsh Machine translating en
dc.title Skoner en kleiner vertaalgeheues en
dc.type Thesis en
dc.description.department School of Computing en
dc.description.degree Ph. D. (Rekenaarwetenskap)


Files in this item

This item appears in the following Collection(s)

Show simple item record

Search UnisaIR


Browse

My Account

Statistics