Developing a twitter bot that can join a discussion using state-of-the-art architectures

Autor: Çetinkaya, Yusuf Mücahit
Přispěvatelé: Toroslu, İsmail Hakkı, Bilgisayar Mühendisliği Anabilim Dalı
Jazyk: angličtina
Rok vydání: 2019
Předmět:
Popis: Twitter bugün çoğunlukla haberleri paylaşmak ve yorum yapmak için kullanılmaktadır. Bu minvalde, Twitter kullanıcıları arasındaki etkileşim kaçınılmazdır. Bu etkileşim bazen insanların günlük tartışmaları bu sosyal platforma taşımasına neden olmaktadır. Bu tartışmalarda baskın olmak çok önemli olduğundan, bu sürecin otomasyonu oldukça popüler hale gelmektedir. Bu çalışmada, gönderilen tweet'leri anlamına göre sınıflandıran ve popüler bir tartışma hakkında, Birleşik Devletler silah tartışması, mantıklı tweet'ler üreten bir bot geliştirmeyi hedefliyoruz. Botlar, tartışmanın destekledikleri tarafında bağımsız bir şekilde tweet atmak ve aynı zamanda bir tweet'e karşıt bakış açısıyla cevap vermek için eğitildiler. Daha başarılı sınıflandırma sonuçları elde etmek için modern mimariler kullanılmıştır. Tweet'leri temsil etmek için GloVe kelime vektörleri modelini uyguladık. El yapımı özellikleri kullanmak yerine, daha çok bilgi içeren ve eşit boyutta özellik vektörleri elde etmek amacıyla uzun kısa vadeli hafıza sinir ağları bu kelime vektörleri ile beslenmiştir. Bu model, kelime vektörlerini bir dizi şeklinde girdi alarak tweet'in anlamını vektörlerin içine kodlanması için eğitilmiştir. Kodlama hem sınıflandırma hem de üretim işlemleri için kullanılmıştır. Dizi-dizi UKVH sinir ağları, tweet üretmek ve tweet'lere cevap vermek için kullanılmıştır. Daha ilgili tweet'leri üretmek için cevaplama modeline dikkat mekanizması eklenmiştir. Yanıtın hedef tweet'e olan ilişkisini ölçmek için yeni bir metrik tanımlanmıştır. Ek olarak, insan değerlendiricileri, üretilen tweet'lerin kalitesini konuya ve hedef tweet'e olan alakasına göre ölçmüşlerdir. Twitter is today mostly used for sharing and commenting about news. In this manner, the interaction between Twitter users is inevitable. This interaction sometimes causes people to move daily debates to this social platform. Since being dominant in these debates is crucial, automation of this process becomes highly popular. In this work, we aim to train a bot that classifies posted tweets according to their semantic and generates logical tweets about a popular discussion, namely gun debate of the U.S. for this study. Bots are trained to tweet independently on their side of the debate and also reply to a tweet from opposite view. State-of-art architectures are tested to get more accurate classification. We have applied GloVe embedding model for representing tweets. Instead of using handcrafted features, long-short-term memory neural network is applied to these embeddings to get more informative and equal size feature vectors. This model is trained to encode the tweet by fed as a sequence of embeddings. Encoding is used for both classification and generation tasks. LSTM sequence to sequence model is used to generate tweets and replies to tweets. The attention mechanism is added to the reply model to produce more related tweets. We propose a new metric for measuring the relatedness of the reply to the target tweet. Additionally, human evaluators measure the quality of generated tweets according to relatedness to the topic and target tweet, which is replied. 138
Databáze: OpenAIRE