Kaplama katsayısı tabanlı küme oluşturma metodolojisi kullanarak anında yeni olay belirleme ve küme oluşturma

Autor: Vural, Ahmet
Přispěvatelé: Can, Fazlı, Diğer
Jazyk: angličtina
Rok vydání: 2002
Předmět:
Popis: ÖZET KAPLAMA KATSAYISI TABANLI KÜME OLUŞTURMA METODOLOJİSİ KULLANARAK ANINDA YENİ OLAY BELİRLEME VE KÜME OLUŞTURMA Ahmet Vural Bilgisayar Mühendisliği, Yüksek Lisans Tez Yöneticisi: Prof. Ör. Fazlı Can Ağustos, 2002 Bu çalışmada, anında yeni olay belirlemek ve olay kümeleri oluşturmak amacıyla, kaplama katsayısı tabanlı küme oluşturma metodolojisi (C^M) kavramları kullanıldı. Çahşmanın ana teması, yeni olay belirlemek için Ç?M algoritmasının tohum seçme işlemini kullanmaktır. C3M'in çalışma prensibi arımda kümelemeye uygun olmadığından, algoritmada değişiklikler yapıldı. Ayrıca, çok büyük olay kümelerinin oluşumunu önlemek ve bütün dokümanlara, tohum olabilmeleri için eşit şans tanımak amacıyla, pencere yöntemi kullanıldı. Tohum dokümanlarının miktarını kontrol etmek maksadıyla, olay kümeleme işi için bir eşik kavramı ortaya çıkarıldı. Bu kavramı, çok küçük değişikliklerle, yeni olay belirlemede de kullanıldı. Deneyler esnasında, orjinal konu belirleme ve takip çalışmasında da kullanıldı. TDT1 yığınından yararlanılmıştır. Yeni olay belirleme ve olay kümeleme işlemlerinde TDT1 yığınının ağırlıklı ve düz uyarlamaları kullanıldı. Düz uygulamalar için daha iyi sonuçlar elde edildi. Aranda olay belirleme alanındaki sonuçlar DMASS yaklaşımınınkilerle karşılaştırıldığında yanlış alarm oranlan açısaldan daha iyi performans elde edilmiştir. Anahtar Sözcükler. Kümeleme, anında olay kümelemesi, anında olay belirleme. ABSTRACT ONLINE NEW EVENT DETECTION AND CLUSTERING USING THE CONCEPTS OF THE COVER COEFFICIENT-BASED CLUSTERING METHODOLOGY Ahmet Vural M.S. in Computer Engineering Supervisor: Prof. Dr. Fazlı Can August, 2002 In this study, we use the concepts of the cover coefficient-based clustering methodology (C3M) for on-line new event detection and event clustering. The main idea of the study is to use the seed selection process of the C M algorithm for the purpose of detecting new events. Since C3M works in a retrospective manner, we modify the algorithm to work in an on-line environment. Furthermore, in order to prevent producing oversized event clusters, and to give equal chance to all documents to be the seed of a new event, we employ the window size concept. Since we desire to control the number of seed documents, we introduce a threshold concept to the event clustering algorithm. We also use the threshold concept, with a little modification, in the on-line event detection. In the experiments we use TDT1 corpus, which is also used in the original topic detection and tracking study. In event clustering and event detection, we use both binary and weighted versions of TDT1 corpus. With the binary implementation, we obtain better results. When we compare our on-line event detection results to the results of UMASS approach, we obtain better performance in terms of false alarm rates. Keywords: Clustering, on-line event clustering, on-line event detection. Ill 68
Databáze: OpenAIRE