Diagnosis of gastric carcinoma tumours by multi class voting

Autor: Emeksiz, Narin
Přispěvatelé: Çiçekli, Nihan, Güvenir, Halil Altay, Diğer
Jazyk: angličtina
Rok vydání: 2001
Předmět:
Popis: oz ÇOKLU SINIF OYLAMASI İLE MİDE TÜMÖRÜ TEŞHİSİ Emeksiz, Narin Yüksek Lisans, Bilgisayar Mühendisliği Bölümü Tez Yöneticisi: Doç. Dr. Nihan Kesim Çiçekli Ortak Tez Yöneticisi : Prof. Dr. Halil Altay Güvenir Temmuz 2001, 86 sayfa Bu tezde gastroskopi sırasında görüntülenen mide tümörlerine ait özellikler mide tümörlerinin makina öğreniminde kullanılabilmesi için uygun veri kümesi haline getirilmiştir. Bu veri kümesi üzerinde mide tümörü teşhislerinde kullanılmak üzere Öznitelik İzdüşümü ile Çoklu Sınıflandırma (CFI-M) algoritması uygulanmıştır. CFI-M zaman ve doğru teşhis kriterleri açısından, K Yakın Komşu Sınıflandırması (KNN) ve Yalın Bayesian Sınıflandırması (NBC) algoritmalarıyla kıyaslanmıştır. Mide kanseri veri kümesinde bir hastanın birden fazla tümörü olabilmektedir, ve bu tümörler önem sırasına göre kaydedilmektedir. Buna bağlı olarak CFI-M, KNNve NBC algortimalan çoklu ve sıralı sınıflandırma yapabilecek kapasiteye ulaştırılmışlardır. Algoritmaların doğruluğu her yeni örnek için tahmin edilen sınıfın kar-zarar analizi yapılarak hesaplanmıştır. Bu. yolla her sınıflandırma doğruluk ve tahmin edilen önem derecesine göre puan kazanmış, aksi durumda da puan kaybetmişlerdir. CFI-M de daha önceden sınıflandırılmış olan örneklerden sınıflandırma bilgisini çıkarmak için öznitelik izdüşümüne dayalı bilgi gösterim yöntemi kullanılmıştır. Bu yöntemde her bir öznitelik değeri görülen örneklerdeki ilgili sınıfa ait sayı bilgisini tutar. Yeni bir örneğin sınıflandırılması her bir aralığın verdiği oyların toplamı ile belirlenir. Ayrıca sınıflandırma doğruluğunu daha çok arttırmak için optimum öznitelik alt kümesini seçen genetik algoritmalar uygulanmıştır. Anahtar Sözcükler: öğrenme, tümevarımsal öğrenme, oylama, çoklu sınıf sınıflandırması, kar maksimizasyonu, öznitelik seçimi, mide tumoru vı ABSTRACT DIAGNOSIS OF GASTRIC TUMORS BY MÜLTI CLASS VOTING Emeksiz, Narin M.S., Department of Computer Engineering Supervisor: Assoc. Prof. Dr. Nihan Kesim Çiçekli Co-Supervisor: Prof. Dr. Halil Altay Güvenir July 2001, 86 pages This thesis presents a medical dataset constructed from the results of gastroscopy done by the gastroenterologists. The use of a machme-learning algorithm called CFI-M (for Classification on Feature Intervals, Multi-class version), to help the gastroenterologists in the diagnosis of the gastric tumors is examined. The CFI-M is evaluated in terms of time and correct diagnosis and compared with other algorithms KNN (K Nearest Neighbor), and NBC (Naive Bayesian Classifier). In a gastric tumour dataset, a patient can have more than one lesion and the placement of the diseases also resembles the importance of tumour. So the algorithms CFI-M, KNN and NBC are revised in a way that enables them to iiipredict multi-class scheme. A new benefit calculation methodology is proposed in which each predicted class gains points for the correct diagnosis and placement but loses some points for the wrong prediction and the misplacement. In CFI-M the training data is stored as feature intervals for each feature value. The classification of an unseen instance is based on the total votes given by each feature interval, resembling the votes of each feature. A genetic algorithm with different cross-over techniques is applied to the domain for the feature selection process in order to filter out irrelevant features and increase the benefit. Keywords: machine learning, inductive learning, voting, multi-class classification, benefit maximization, feature selection, gastric tumours IV 86
Databáze: OpenAIRE