Part of speech tagging with deep learning for Turkish

Autor: Şevket, Şevket Can
Přispěvatelé: Karaoğlan, Bahar, Ege Üniversitesi, Fen Bilimleri Enstitüsü, Uluslararası Bilgisayar Ana Bilim Dalı
Jazyk: turečtina
Rok vydání: 2021
Předmět:
Popis: Sözcük türü işaretleme, dil üretimi, otomatik çeviri, metin benzerlik, konuşma anlama, bilgi geri getirimi gibi doğal dil işleme ve anlama çalışmalarında temel işlemlerden birisidir ve dolayısıyla bir dilin yorumlanmasında başarımın artımında etkindir. Günümüze kadar büyük bir çoğunlukla Türkçe için sözcük türü işaretleme probleminde kural tabanlı ve istatistiksel yöntemler kullanılmıştır. Son yıllarda bilgisayarların işlem gücünün artması ile DÖ yöntemleri popülerlik kazanmış ve birçok alana uygulanmıştır. Bu alanlardan bir tanesi de Doğal Dil İşlemedir. Doğal dil işleme üzerinde gerçeklenen bu DÖ yöntemleri yukarıda belirtilen kural tabanlı ve istatistiksel yöntemlerle yarışır durumda sonuçlar vermiştir. Bu uygulamaların birçoğu İngilizce üzerinde gerçekleştirilmiştir ve Türkçe için derin öğrenme yöntemleri halen istenilen seviyeye ulaşamamıştır. Bu bağlamda, bu tez çalışmasında Türkçe dilinde sözcük türü işaretleme problemi için uygun bir derin öğrenme modeli oluşturulup, bu modelin sonuçlarının en iyileştirilmesi ve böylelikle katkı sağlamayı amaçlamaktadır. Sözcük türü işaretlemede daha etkin yöntemlerin geliştirilmesi, Türkçe dilinin sayısal ortamlarda daha doğru ve daha hızlı işlenebilmesi ve yorumlanabilmesini sağlayacaktır.
Part of speech tagging is one of the basic operations in natural language processing and comprehension studies such as language generation, automatic translation, text similarity, speech understanding, and information retrieval, and thus it is effective in increasing the performance of a language interpretation. Rule-based and statistical methods have been used mostly in the problem of word type marking for Turkish. With the increase in the processing power of computers in recent years, deep learning methods have gained popularity and have been applied to many areas. One of these areas is Natural Language Processing. These deep learning methods implemented on natural language processing yielded results that compete with the rule-based and statistical methods mentioned above. Many of these applications have been carried out in English and deep learning methods for Turkish have still not reached the desired level. In this context, this thesis aims to create a suitable deep learning model for the problem of part of speech tagging in Turkish language and to optimize the results of this model and thus contribute. Developing more effective methods in determining word type will enable Turkish language to be processed and interpreted more accurately and faster in digital environments.
Databáze: OpenAIRE