Hayvan seslerini ayrıştırmak için modifiye edilmiş bir otokodlayıcı mimarisi yaklaşımı

Autor: Özbaygin, Ahmet Sinan
Přispěvatelé: Altun, Hüseyin Oktay, Elektrik ve Bilgisayar Mühendisliği Ana Bilim Dalı
Jazyk: turečtina
Rok vydání: 2019
Předmět:
Popis: Hayvan davranış bilimi, hayvanların davranışlarını anlamak suretiyle, onları kontrollü ortamlarda tutmak ve evcilleştirmek gibi konularda bize yardımcı olurken, aynı zamanda hayvan türlerini ve canlılığı daha iyi anlamamızı da sağlar. Bu alanlarda yapılan araştırmalarda veriler doğa ortamından toplanabilirken, bazen de kontrollü ortamlarda tutulan hayvanlardan faydalanılmaktadır. Bu alandaki araştırmalarda veri toplama sırasında hayvan sesleri karışık şekilde kaydedildiğinde, bunları ayırarak analiz etmek gerekmektedir. Hayvan sesleriyle oluşan kokteyl partisi problemi için derin sinir ağlarından ve derin öğrenme metodolojisinden faydalanarak yeni bir çözüm önerisi sunmaktayız. Bu tezde derin öğrenmede sıkça kullanılan otokodlayıcı mimarisini değiştirerek yeni bir derin öğrenme mimarisi oluşturduk. Bu mimariyi kullanarak hayvan seslerini birbirinden ayırdık. Getirdiğimiz yakaşımın performansını değerlendirdik. Animal behavioural science aids us to understand animal species and their life styles, while helping us in tasks like keeping them in controlled environments or taming them. While data can be collected from natural environment on researches at these fields, sometimes animals that are being held at controlled environments can be benefited from. For researches at these fields related to animal behavioural science, on many occasions, animal sounds are being recorded as mixture of animal and environmental sounds while collecting data. These sounds need to be first separated and then analyzed. For this cocktail party problem consisting animal sounds, we present a new solution proposal that benefits from deep neural networks and deep learning methodology. In this paper, we created a new deep learning architecture by modifying auto-encoder architecture, being widely used in deep learning research. Using this architecture we separated animal sounds from each other. We evaluated performance of the approach we developed. 137
Databáze: OpenAIRE