Moroccorp: tien miljoen woorden uit twee Marokkaans-Nederlandse chatkanalen

  • Tom Ruette KU Leuven, Leuven, België en Humboldt-Universität zu Berlin, Berlijn, Duitsland
  • Freek Van de Velde KU Leuven, Leuven, België en FWO-Vlaanderen, België
Trefwoorden: nederlands, marokkaans nederlands, corpus, chat, stable lexical marker analysis, etnisch nederlands, representativiteit

Samenvatting

In dit artikel stellen we een nieuw corpus voor van computer-gemedieerde com­municatie in het Nederlands door Marokkaans-Nederlandse taalgebruikers, dat bestaat uit tien mil­joen woorden chat-materiaal. We behandelen de achtergrond, de compilatiemethode en de interne structuur van het corpus, en we leggen het verband tussen ons eigen werk en eerdere pogingen om een corpus van Nederlandse chattaal te bouwen. We hebben ook een Stable Lexical Marker analyse uitgevoerd en een gevalstudie over een welbekende morfosyntactische eigenschap van het Marokkaans Nederlands om op die manier de representativiteit van het corpus te beoor­delen.
Gepubliceerd
2013-12-20
Citeerhulp
Ruette, T., & Van de Velde, F. (2013). Moroccorp: tien miljoen woorden uit twee Marokkaans-Nederlandse chatkanalen. Lexikos, 23(1). https://doi.org/10.5788/23-1-1225
Sectie
Korpusse / Corpora