Moroccorp: tien miljoen woorden uit twee Marokkaans-Nederlandse chatkanalen
Trefwoorden:
nederlands, marokkaans nederlands, corpus, chat, stable lexical marker analysis, etnisch nederlands, representativiteit
Samenvatting
In dit artikel stellen we een nieuw corpus voor van computer-gemedieerde communicatie in het Nederlands door Marokkaans-Nederlandse taalgebruikers, dat bestaat uit tien miljoen woorden chat-materiaal. We behandelen de achtergrond, de compilatiemethode en de interne structuur van het corpus, en we leggen het verband tussen ons eigen werk en eerdere pogingen om een corpus van Nederlandse chattaal te bouwen. We hebben ook een Stable Lexical Marker analyse uitgevoerd en een gevalstudie over een welbekende morfosyntactische eigenschap van het Marokkaans Nederlands om op die manier de representativiteit van het corpus te beoordelen.
Gepubliceerd
2013-12-20
Citeerhulp
Ruette, T., & Van de Velde, F. (2013). Moroccorp: tien miljoen woorden uit twee Marokkaans-Nederlandse chatkanalen. Lexikos, 23(1). https://doi.org/10.5788/23-1-1225
Nummer
Sectie
Korpusse / Corpora
Outeursreg op alle materiaal wat in Lexikos gepubliseer is, berus by die Direksie van die Woordeboek van die Afrikaanse Taal. Dit staan skrywers egter vry om hulle materiaal elders te gebruik mits Lexikos (AFRILEX-reeks) erken word as die oorspronklike publikasiebron.