Corpus-based Lexicography for Lesser-resourced Languages — Maximizing the Limited Corpus
Trefwoorden:
korpusgebaseerde leksikografie, hulpbronbeperkte tale, beperkte korpusse, korpusgereedskap, leksikografiese hulpmiddels
Samenvatting
Korpusgebaseerde leksikografie vir hulpbronbeperkte tale — die maksimalisering van die beperkte korpus. Die fokus in hierdie artikel is op hulpbronbeperkte tale waarvoor slegs baie beperkte korpusse beskikbaar is en hoe sodanige relatief klein en dikwels ongebalanseerde, rou korpusse maksimaal benut kan word vir leksikografiese doeleindes om soortgelyke resultate as van groter korpusse te verkry. Sepedi en Afrikaans, word in hierdie verband bestudeer. Die doel is om te bepaal tot watter mate die vergroting van 'n korpus van byvoorbeeld een na 10 miljoen, en van 10 miljoen na 100 miljoen woorde die potensiaal sal verhoog vir (a) makrostruktuur samestelling, (b) die inwin van inligting omtrent die belangrikste mikrostrukturele aspekte en (c) die ontwerp van leksikografiese hulpmiddels. Daar sal aangevoer word dat waardevolle en selfs voldoende data vir die samestelling van 'n spesifieke woordeboek onttrek kan word uit 'n relatief klein korpus van ongeveer een miljoen woorde maar dat "groter" wel in sekere omstandighede "beter" is.
Gepubliceerd
2015-11-20
Citeerhulp
Prinsloo, D. (2015). Corpus-based Lexicography for Lesser-resourced Languages — Maximizing the Limited Corpus. Lexikos, 25(1). https://doi.org/10.5788/25-1-1300
Nummer
Sectie
Artikels/Articles
Outeursreg op alle materiaal wat in Lexikos gepubliseer is, berus by die Direksie van die Woordeboek van die Afrikaanse Taal. Dit staan skrywers egter vry om hulle materiaal elders te gebruik mits Lexikos (AFRILEX-reeks) erken word as die oorspronklike publikasiebron.