Semi-automatic Term Extraction for an isiZulu Linguistic Terms Dictionary

  • Langa Khumalo Linguistics Program, School of Arts, University of KwaZulu-Natal, South Africa
Trefwoorden: term-onttrekking, TAD-korpus, TSD-korpus, Wordsmith Tools, frekwensie, woordelys, kongruensie, sleutelstatus, leksikografie, korpusleksikografie, trefwoordseleksie, TSD-woordeboek

Samenvatting

Semi-outomatiese term-onttrekking vir 'n isiZulu taalkundige termwoordeboek. Die Universiteit van KwaZulu-Natal (UKZN) is besig met die samestelling van 'n reeks Taal vir Spesiale Doeleindes (TSD)-woordeboeke vir verskeie gespesialiseerde vakgebiede wat strook met hul taalbeleid en -plan. Die fokus van hierdie artikel is die termontrekking vir woorde in die vakgebied taalkunde. Die gebruik van frekwensieanalise en sleutelwoordanalise as strategieë in die samestelling van die isiZulu taalkundige termwoordeboek word bevorder. Die studie gebruik die isiZulu National Corpus (INC) van ongeveer 1,2 miljoen items as 'n verwysingskorpus asook 'n TSD-korpus van ongeveer 100,000 items as 'n studiekorpus. Die studie is ontleed met behulp van 'n sagteware nutsprogam, WordSmith Tools (weergawe 6). WordSmith Tools (voortaan WS Tools) is 'n geïntegreerde programsuite bestaande uit drie hoofprogramme, wat WordList, Concord en Keywords insluit, en wat gebruik word in die analise van woorde en woordpatrone in enige gegewe teks. Met behulp van die WS Tools-sagteware kan baie kwalitatiewe en kwantitatiewe navorsing in die taal gedoen word. Sentraal in hierdie studie is 'n rekenaarmatige bepaling van watter woorde verteenwoordigend is van die isiZulu-taalkundige domein en daarom voorkeur geniet by trefwoordseleksie. Sodoende word die korpuslinguistiekmetode as basis vir teoretiese analise gebruik. Die voordeel verbonde aan so 'n teoretiese benadering is dat 'n korpus gestoor en geraadpleeg word deur middel van 'n rekenaar en rekenaarsagteware, wat dit maklik maak om items te vind, te sorteer en te tel, óf as basis vir taalkundige beskrywing óf om taalkundig verwante kwessies en probleme aan te spreek. Deur gebruik te maak van WS Tools-sagteware, toon die studie dat term-ontrekking vir die isiZulu taalkundige termwoordeboek gedoen word deur betroubare rekenaarmatige tegnieke in korpusleksikografie te volg.
Gepubliceerd
2015-11-20
Citeerhulp
Khumalo, L. (2015). Semi-automatic Term Extraction for an isiZulu Linguistic Terms Dictionary. Lexikos, 25(1). https://doi.org/10.5788/25-1-1309
Sectie
Projekte/Projects