Towards German Word Embeddings: A Use Case with Predictive Sentiment Analysis

Autor: Christian Bauckhage, Eduardo Brito, Rafet Sifa, Kostadin Cvejoski, César Ojeda
Rok vydání: 2017
Předmět:
Zdroj: Data Science – Analytics and Applications ISBN: 9783658192860
DOI: 10.1007/978-3-658-19287-7_8
Popis: Trotz des Forschungsbooms im Bereich Worteinbettungen und ihrer Textmininganwendungen der letzten Jahre, konzentriert sich der Grosteil der Publikationen ausschlieslich auf die englische Sprache. Auserdem ist die Hyperparameterabstimmung ein Prozess, der selten gut dokumentiert (speziell fur nicht-englische Texte), jedoch sehr wichtig ist, um hochqualitative Wortwiedergaben zu erhalten. In dieser Arbeit zeigen wir, wie verschiedene Hyperparameterkombinationen Einfluss auf die resultierenden deutschen Wortvektoren haben und wie diese Wortwiedergaben Teil eines komplexeren Modells sein konnen. Im Einzelnen fuhren wir als erstes eine intrinsische Bewertung unserer deutschen Worteinbettungen durch, die spater in einem vorausschauenden Stimmungsanalysemodell verwendet werden. Letzteres dient nicht nur einer intrinsischen Bewertung der deutschen Worteinbettungen, sondern zeigt auserdem, ob Kundenwunsche nur durch das Einbetten von Dokumenten vorhergesagt werden konnen.
Databáze: OpenAIRE