Zur Darstellung eines mehrstufigen Prototypbegriffs in der multilingualen automatischen Sprachgenerierung: vom Korpus über <i>word embeddings</i> bis hin zum automatischen Wörterbuch
Samenvatting
Das multilinguale Wörterbuch zur Substantivvalenz Portlex gilt als Ausgangpunkt für die Entstehung der automatischen Sprachgeneratoren Xera und Combinatoria, deren Entwicklung und Handhabung hier präsentiert wird. Beide Prototypen dienen zur automatischen Generierung von Nominalphrasen mit ihren mono- und biargumentalen Valenzstellen, die u.a. als Wörterbuchbeispiele oder als integrierte Bestandteile künftiger autonomer E-Learning-Tools eine Anwendung finden könnten. Als Modelle für neuartige automatische Valenzwörterbücher mit Benutzerinteraktion fassen wir die Sprachgeneratoren in ihrem heutigen Zustand auf.Bei dem spezifischen methodologischen Verfahren zur Entwicklung der Sprachgeneratoren stellt sich die syntaktisch-semantische Beschreibung der vom Valenzträger eröffneten Leerstellen aus syntagmatischer und paradigmatischer Sicht als Schwerpunkt heraus. Zusammen mit Faktoren wie der Repräsentativität, der grammatischen Korrektheit, der semantischen Kohärenz, der Frequenz und der Vielfältigkeit der lexikalischen Kandidaten sowie der semantischen Klassen und der Argumentstrukturen, die feste Bestandteile beider Ressourcen sind, sticht ein mehrschichtiger Prototypsbegriff hervor. Die kombinierte Anwendung dieses Prototypbegriffs sowie von word embeddings zeigt zusammen mit Techniken aus dem Gebiet der maschinellen Verarbeitung und Generation natürlicher Sprache (NLP und NLG) einen neuen Weg zur künftigen Entwicklung von automatisch generierten plurilingualen Valenzwörterbüchern.Insgesamt stellt der Beitrag die Sprachgeneratoren sowohl aus der Perspektive ihrer Entwicklung als auch aus Nutzersicht dar. Der Fokuss wird auf die Rolle des Prototypbegriffs bei der Entwicklung der Ressourcen gelegt.
Gepubliceerd
2021-05-03
Citeerhulp
Domínguez Vázquez, M. J. (2021). Zur Darstellung eines mehrstufigen Prototypbegriffs in der multilingualen automatischen Sprachgenerierung: vom Korpus über <i>word embeddings</i> bis hin zum automatischen Wörterbuch. Lexikos, 31(1), 20-50. https://doi.org/10.5788/31-1-1623
Nummer
Sectie
Artikels/Articles
Outeursreg op alle materiaal wat in Lexikos gepubliseer is, berus by die Direksie van die Woordeboek van die Afrikaanse Taal. Dit staan skrywers egter vry om hulle materiaal elders te gebruik mits Lexikos (AFRILEX-reeks) erken word as die oorspronklike publikasiebron.