Modelling the machines’ language with natural language processing and machine learning algorithms

Autor: DAYAN, Ali, YILMAZ, Atınç
Rok vydání: 2022
Předmět:
Zdroj: Volume: 13, Issue: 3 467-475
Dicle Üniversitesi Mühendislik Fakültesi Mühendislik Dergisi
ISSN: 1309-8640
2146-4391
Popis: Language is one of the most important elements of communication for people and all living things. A large number of studies have been conducted in the literature on the formation of languages and natural language processing processes. It has been observed that these studies contain differences in terms of analysis, approach and method. In the study, a model has been proposed for machines to create their own language as a contribution to the literature. With this point of view, it has been contributed to the idea that the efficiency of all processes will increase by communicating with each other in their own language like humans. With the aim of developing an approach for machines to produce their own languages, it is aimed to distinguish the sounds of living things by classifying them and to generate new sounds by using convolutional deep neural network method. In the study, the applied alphabet was decided by the system. In next step, Regenerative Artificial Neural Networks were used together with Mel Frequency Cepstral Coefficient and Dynamic Time Warp methodologies to create similar sounds and the living things were named with their respective sounds. Unlike similar studies, a visual data was applied which was converted from the audio files that was obtained from Kaggle open data repository "Audio Cats and Dogs" dataset. In addition, the model was supported with CNN networks to achieve effective performance.
İnsanlar ve tüm canlılar için dil, iletişim konusunda en önemli unsurlardandır. Literatürde dillerin oluşumu ve doğal dil işleme süreçleri ile ilgili oldukça fazla sayıda çalışmalar yapılmış; bu çalışmalarda analiz, yaklaşım ve yöntem açısından farklılıklar içerdiği görülmüştür. Çalışmada literatüre katkı olarak makinelerin kendi dilini oluşturabilmesi için bir model önerilmiştir. Bu bakış açısı ile makinelerin kendi aralarında insanlar gibi kendi dilleri ile iletişim kurarak tüm süreçlerin verimliliğinde artış olacağı düşüncesine katkıda bulunulmuştur. Makinelerin kendi dillerini üretebilmesi adına bir yaklaşım geliştirilmesi amacı ile çalışmada evrişimli derin sinir ağları yöntemi ile canlıların seslerini sınıflandırarak ayırt etmesi ve yeni sesler türetebilmesi hedeflenmiştir. Çalışmada, kullanılacak olan alfabenin ne olacağı sistem tarafından karar verilmesi sağlanmış; daha sonrasında Yinelemeli Yapay Sinir Ağları, Mel Frekans Cepstral Katsayısı ve Dinamik Zaman Çözgü metodolojileri ile birlikte kullanılarak benzer sesler oluşturulmuş ve canlılar ilgili sesler ile isimlendirilmiştir. Benzer çalışmalardan farklı olarak Kaggle açık veri deposundan “Audio Cats and Dogs” verisetindeki ses dosyaları üzerinden elde edilen MFCC görsel bir veri olarak kullanılmıştır. Bunun yanında CNN ağları ile model desteklenerek daha iyi performans elde edilmesi sağlanmıştır.
Databáze: OpenAIRE